Е.Е. Фомина
6
Гуманитарный вестник
# 10·2017
самостоятельная категория или как отдельное для каждого объекта
значение.
Обработка данных методом CatPCA включает в себя два этапа.
На первом этапе происходит процедура оцифровки переменных, ко-
торая опирается на принципы оптимального шкалирования; на вто-
ром этапе выполняется редукция размерности данных.
Математическая формализация метода имеет следующий вид.
Рассмотрим матрицу исходных переменных
1 2
( , , ...,
)
p
X x x x
=
раз-
мерности
,
n p
×
где переменная
n
j
x R
∈
и может принимать
j
L
различных значений. Для нее требуется определить матрицу инте-
гральных характеристик
Z
таким образом, чтобы функция σ( , )
Z W
принимала минимальное значение [8]:
1
σ( , )
(
) (
) min
p
T
j j
j j
j
Z W tr Z G W Z G W
=
=
−
−
→
∑
(1)
при ограничениях
1 0
T
n r
Z
=
; (2)
,
T
r
Z Z nI
=
(3)
т. е. интегральные характеристики должны удовлетворять условиям
центрированности и ортонормированности.
Здесь
Z —
матрица интегральных характеристик размерности
;
n r
×
G
j
—
матрица индикаторов размерности
j
n L
×
для исходной пере-
менной
j
x
;
1, если объект относится к категории ,
( , )
0 в противном случае;
=
j
j
j
i
l
G i l
W
j
—
матрица размерности
j
L p
×
переменной
j
x
, содержащая коор-
динаты всех ее категорий в
r
-м пространстве; 1
n
—
единичный вектор
размерности
1
n
×
; 0
r
—
единичный вектор размерности
1
r
×
;
I
r
—
единичная матрица размером
r r
×
.
Оптимизация функции (1) при ограничениях (2), (3) осуществля-
ется с помощью итерационного алгоритма
Princals
[8].
Оцифровка переменных в алгоритме CatPCA происходит таким об-
разом, что собственные значения компонент, рассчитанные по матрице
корреляций оптимизированных переменных, максимизируются.
Показателем, позволяющим оценить качество проведенного ана-
лиза, является альфа Кронбаха
(α)
— коэффициент, показывающий
внутреннюю согласованность характеристик, описывающих один
объект. Альфа Кронбаха лежит в интервале от
−∞
до 1. Если
α 0,7
,