Е.Е. Фомина
2
Гуманитарный вестник
# 10·2017
•
графическая обработка информации.
Наряду с вышеуказанными, важную роль также играют методы и
алгоритмы интерпретации, позволяющие придать содержательный
смысл результатам анкетирования. К ним относятся
факторный ана-
лиз
(ФА) и
категориальный метод главных
компонент
(CatPCA
—
Categorical Principal Component Analysis), которые направлены на
решение следующих задач:
•
поиск скрытых закономерностей во множестве исследуемых
переменных, которые возникают вследствие воздействия на них не-
которых факторов;
•
изучение статистической взаимосвязи между признаками и вы-
деленными факторами;
•
описание предметной области с помощью общих факторов, ко-
личество которых намного меньше, чем исходное число переменных
[2, 3].
Несмотря на то, что методы направлены на решение одинаковых
задач, каждый из них имеет свои особенности реализации, поэтому
встает актуальная проблема выбора. Цель настоящей статьи — про-
вести сравнение ФА и CatPCA, а также рассмотреть особенности их
реализации для решения задачи обработки данных, полученных в ре-
зультате анкетирования.
Факторный анализ.
ФА — класс процедур многомерного стати-
стического анализа, направленный на выявление латентных перемен-
ных (факторов), отвечающих за наличие линейных статистических
связей (корреляций) между наблюдаемыми переменными [4].
ФА основывается на предположении, что исследуемое явление,
определяемое некоторой системой признаков, изменяющихся согла-
сованно, может быть описано с помощью меньшего числа других ла-
тентных переменных, называемых
факторами,
объясняющими при-
чины этих изменений. Число факторов намного меньше числа исход-
ных переменных.
Факторы — это группы определенных переменных, коррелиру-
ющих между собой больше, чем с переменными, входящими в дру-
гой фактор. Таким образом, содержательный смысл факторов может
быть выявлен путем исследования корреляционной матрицы исход-
ных данных.
Например, при изучении ценностных предпочтений какой-либо
социальной группы необходимо установить наличие взаимосвязей
среди большого числа параметров (пола, возраста, образования, раз-
личных групп ценностных ориентаций и т. д.). Для исследования
всех возможных зависимостей между этими переменными потребо-
валось бы рассчитать и проанализировать большой набор коэффици-
ентов корреляций. Вместо этого можно заменить исходный набор