Статистический анализ: Подход с использованием ЭВМ - Афифи А.
Скачать (прямая ссылка):
Замечания 5.7.2. 1. При определении числа т общих факто ров пользователь может руководствоваться, например, следующими критериями.
a) Число существенных факторов можно оценить из содержательных соображений.
b) При использовании обычной корреляционной матрицы реко мендуется в качестве т брать число собственных значений, боль ших либо равных единице.
c) Как и в анализе главных компонент, можно выбрать числе факторов, объясняющих определенную часть общей дисперсии или суммарной общности.
2. Статистические исследования показывают, что диагональ ные элементы исходной матрицы менять не рекомендуется. Однакс если требуется оставить суммарную общность неизменной, ка* правило, в качестве оценок диагональных элементов матрицы ис пользуются квадраты множественных коэффициентов корреляции а для ковариационной матрицы — дисперсии, полученные в ре зультате регрессии.
3. Следует помнить, что в зависимости от выбора исходное матрицы могут получаться различные факторы.
4. Заметим, что, если переменные Х1 стандартизованы (т. е используется матрица Я), выборочными корреляциями между X и /=у будут
согг(Х„ 1=1,...,р, 1=1,...,т.
Следовательно, для интерпретации каждого фактора имеет смысл пользоваться переменными с относительно большими по абсолют
Корреляционная матрица для примера 5.7.1
Таблица 5.7.1
БР МАР НЯ ОР МУР І,(С1) Ь(АТ) Ь(МСТ) 1Ю ІДРУІ) Ь(ЯСІ) ЩЬ ч Не*
Переменная 1 2 3 4 5 6 7 8-9 10 11 .12 13
Систолическое давление 1.00
Среднее артериальное давление 0.90 1.00
Частота сердечных сокращений -0.10 -0.07 1.00
Диастолическое давление 0.81 0.95 0.00 1.00
Среднее венозное давление -0.03 -0.07 0.05 -0.13
Логарифм сердечного индекса 0.12 003 -0.05 -0.07
Логарифм времени появления -0.13 -0.11 -0.15 -0.04
Логарифм среднего времени циркуляции -0.17 -0.11 0.02 -0.00
Диурез 0.13 0.15 -0.12 0.12
Логарифм индекса оозема плазмы -0.08 -0.17 -0.13 -0.27
Логарифм эритроцитарноео индекса 0.09 0.11 -0.02 0.14
Гемоглобин 0.09 0.21 0.09 0.33
Гематокрит 0.09 0.21 0.06 0.32
1.00 -0.05 1.00
-0.01 -0.49 1.00
0.14 -0.68 0.84 1.00
-0.23 0.09 -0.21 -0.18 1.00
0.13 0.54 -0.16 -0.28 0.04 1.00
-0.06 -0.11 0.20 0.21 -0.05 0.04 1.00
-0.09 -0.48 0.39 0.47 -0.07 -0.49 0.38 1.00
-0.08 -0.48 0.40 0.49 -0.09 -0.50 0.39 0.97
368
Гл. 5. Методы многомерного статистического анализа
ной величине нагрузками, так как они больше всего коррелированы с этим фактором.
Пример 5.7.1. Были собраны данные о р = 13 показателях для 113 больных при их поступлении в отделение интенсивной терапии, находящихся в критическом состоянии. В число показателей входили первоначальные измерения артериального и венозного давлений,'кровотока, частоты сердечных сокращений и объемов составляющих крови (табл. 5.7.1). Для определения главных факторов программа факторного анализа применялась к выборочной корреляционной матрице. Были рассмотрены следующие случаи.
Пример 5.7.1а. Диагональные элементы корреляционной матрицы были оставлены без изменений, а допустимое число итераций задавалось равным единице. Соответственно главным компонентам были получены следующие собственные значения:
Компонента 1 2 3 4 5 6 7
Собственное значение 3.875 2.980 1.269 1.233 1.095 0.766 0.711
Компонента 8 9 10 11 12 13
Собственное значение 0.507 0.290 0.150 0.084 0.023 0.019
Накопленные доли суммарной дисперсии по соответствующим компонентам имеют вид
Компонента 1 2 3 4 5 6 7
Накопленная доля 0.30 0.53 0.62 0.72 0.80 0.86 0.92
Компонента 8 9 10 11 12 13
Накопленная доля 0.96 0.98 0.99 0.99 1.00 1.00
Предполагалось, что факторы должны соответствовать давлениям, объемам и составляющим крови. Поэтому число т было взято равным 3. Полученные оценки факторных нагрузок приводятся в табл. А.
Так, нагрузка 1п = 0.21 есть коэффициент корреляции между систолическим давлением и первым фактором, 1и = 0.88 есть коэффициент корреляции той же переменной со вторым фактором и т. д. Для интерпретации факторов рассмотрим нагрузки, большие некоторого порогового значения, например г = 0.4. В табл. А эти нагрузки помечены цифрами в кружочках. Первый фактор зависит главным образом от восьми из 13 переменных; второй фактор зависит существенным образом от артериальных давлений и кровотока; третий фактор включает в себя частоту сердечных сокращений, время появления и индекс количества плазмы. Эти факторы не поддаются простой интерпретации. Как будет видно из следующего раздела, здесь может помочь метод вращения факторов.
5.7. Факторный анализ
369
Таблица А
Нагрузки для факторов 1—3
Переменная 1 3
1 вР 0.21 0.88© -0.22
2 МАР 0.33 0.90© -0.13
3 НК, 0.05 -0.08 0.59©
4 ЭР 0.45® 0.83® -0.04
5 МУР -0.07 -0.18 -0.35
6 Ь(С1) -0.70© 0.33 -0.10
7 ЦАТ) 0.61 ® -0.44® -0.42®
8 Ь(МСТ) 0.71 ® -0.48® -0.26 .
9 иО -0.13 0.31 0.18
10 ЦРУ1) -0.61 ® -0.03 -0.52©
и цк,<л) 0.40® 0.03 -0.32
12 Hgb 0.87© -0.00 0.15
13 на 0.88 ф -0.01 0.13