Фа'кторный ана'лиз, раздел статистического анализа многомерного ,. объединяющий методы оценки размерности множества наблюдаемых переменных посредством исследования структуры ковариационных или корреляционных матриц. Основное предположение Ф. а. заключается в том, что корреляционные связи между большим числом наблюдаемых переменных определяются существованием меньшего числа гипотетических ненаблюдаемых переменных или факторов. В терминах случайных величин – результатов наблюдений X 1 ,..., X n общей моделью Ф. а. служит следующая линейная модель:

   (*),

,

  где случайные величины f j суть общие факторы, случайные величины U i суть факторы, специфические для величин X i и не коррелированные с f j , а ei ; суть случайные ошибки. Предполагается, что k < n задано, случайные величины ei независимы между собой и с величинами f j и U i и имеют Е ei = 0, D ei = s2 i . Постоянные коэффициенты a ij называются факторными нагрузками (нагрузка i -й переменной на j -й фактор). Значения a ij , b i , и s2 i считаются неизвестными параметрами, подлежащими оценке. В указанной форме модель Ф. а. отличается некоторой неопределённостью, т.к. n переменных выражаются здесь через n + k других переменных. Однако уравнения (*) заключают в себе гипотезу о ковариационной матрице, которую можно проверить. Например, если факторы f j некоррелированы и c ij – элементы матрицы ковариаций между величинами Xi , то из уравнений (*) следует выражение для c ij через факторные нагрузки и дисперсии ошибок:

  , .

  Т. о., общая модель Ф. а. равносильна гипотезе о ковариационной матрице, а именно о том, что ковариационная матрица представляется в виде суммы матрицы А = {a ij } и диагональной матрицы L с 2 элементами s2 i .

  Процедура оценивания в Ф. а. состоит из двух этапов: оценки факторной структуры – числа факторов, необходимого для объяснения корреляционной связи между величинами X i , и факторной нагрузки, а затем оценки самих факторов по результатам наблюдения. Принципиальные трудности при интерпретации набора факторов состоят в том, что при k > 1 ни факторные нагрузки, ни сами факторы не определяются однозначно, т.к. в уравнении (*) факторы f j могут быть заменены любым ортогональным преобразованием. Это свойство модели используется в целях преобразования (вращения) факторов, которое выбирается так, чтобы наблюдаемые величины имели бы максимально возможные нагрузки на один фактор и минимальные нагрузки на остальные факторы. Существуют различные практические способы оценки факторных нагрузок, имеющие смысл в предположении, что X i ,..., Xn подчиняются многомерному нормальному распределению с ковариационной матрицей С = {с ij }. Выделяется максимального правдоподобия метод , который приводит к единственным оценкам для c ij , но для оценок a ij даёт уравнения, которым удовлетворяет бесчисленное множество решений, одинаково хороших по статистическим свойствам.

  Ф. а. возник и первоначально разрабатывался в задачах психологии (1904). Область его приложения значительно шире – Ф. а. находит применение при решении различных практических задач в медицине, экономике, химии и т.д. Однако многие результаты и методы Ф. а. пока ещё не обоснованы, хотя практики ими широко пользуются. Математическое строгое описание современного Ф. а. – задача весьма трудная и до сих пор в полной мере не решенная.

  Лит.: Лоул и Д., Максвелл А., Факторный анализ как статистический метод, пер. с англ., М., 1967; Харман Г., Современный факторный анализ, пер. с англ., М., 1972.

  А. В. Прохоров.