Научная литература
booksshare.net -> Добавить материал -> Биология -> Тутубалин В.Н. -> "Теория вероятностей и случайных процессов" -> 133

Теория вероятностей и случайных процессов - Тутубалин В.Н.

Тутубалин В.Н. Теория вероятностей и случайных процессов — М.: МГУ, 1992. — 400 c.
ISBN 5-211-02264-5
Скачать (прямая ссылка): teoriyaveroyatnosteyisluchaynihprocessov1992.djvu
Предыдущая << 1 .. 127 128 129 130 131 132 < 133 > 134 135 136 137 138 139 .. 161 >> Следующая

327
Но при увеличении числа факторов подобный подход губит любые усилия по сбору фактического материала. Например, при 7 факторах получим 37=2187 групп, т. е. примерно по одному наблюдению на группу и по 1/10 случая ИБС на группу. Ни о какой оценке вероятности заболевания речи быть не может.
Поэтому при значительном числе факторов требуется принципиально иной подход. В наиболее общей форме его можно сформулировать следующим способом. Допустим, что вероятность заболевания есть функция <р(^) от линейной комбинации факторов у—Ъщхи где функция <р (у) монотонно меняется от 0 до 1, когда у меняется от (—оо) до оо. Коэффициенты ai предстоит иайтн по фактическим данным так, чтобы зависимость вероятности заболевания от линейной комбинации 2а,*; была возможно более выраженной.
Последним словам нужно придать точный смысл, заодно и указать способ нахождения а,-. Обе эти задачи авторы работы [55] решают, привлекая для описания наблюдений модель многомерного нормального распределения, которая, конечно, не может выполняться точно хотя бы потому, что некоторые факторы вообще принимают лишь целочисленные значения. Точнее говоря, предполагается, что имеются два многомерных нормальных распределения с одной и той же матрицей ковариаций, но с различными векторами средних: одно соответствует совокупности «случаев», т. е. тех лнц, которые в последующие 12 лет заболеют ИБС; другое — совокупности «не-случаев» (т. е. тех лиц, которые не заболеют ИБС). При этом векторы средних оцениваются, естественно, как средине арифметические по группам «случаев» и «не-случаев», а общая матрица ковариаций — как средневзвешенная выборочная матрица ковариаций по группам «случаев» н «не-случаев» (с весами, пропорциональными числу наблюдений).
Посмотрим, к какой математике ведет эта модель. Пусть вероятность «случая» есть р; тогда вероятность «не-случая» есть 1—р, пусть при этом плотность распределения вероятностей вектора факторов есть h(x\,...,xk) для «случаев» и fo(xi,...,Xk) для «не-случаев». Тогда по формуле Байеса вероятность того, что лицо с вектором факторов x={xlt...,xb) есть «случай», дается формулой
= 1 /\ 1 | *—рМх..........**)
/ [ р Ы*1, •••.**)
328
Пусть теперь f0 и fi — нормальные плотности
и =--------!------- ехр (-
(2к)п1'-УШс 1 2 }
(С-Ч*—fli), х—а,)
f 1=...... ехр | '
(2х)*Ру det С I
с одной и той же матрицей ковариаций С.
Тогда, очевидно,
ьг ц»,........................».). „ ехр (- U + У ?, а!
р ................*к) \ ^ д /J
где а и р,- понятный образом выражаются через р, а0, а\, С~К
Таким образом,
P(xv . . . , хк) = 1 +ехр^— (О
Выражение (1) как функция от переменных х\,...,хк называется многомерной логистической функцией. Практически приходится вместо р, а3, аи С-1 пользоваться их выборочными' оценками, т. е. в (1) войдут оцененные значения a, j};.
Теперь рассмотрим некоторые результаты работы [55]. Если вставить в (1) оцененные значения а и р, то для
каждого обследованного можно получить значение рис-ft
ка: у = * + 2 УП0РЯД0ЧИМ полученные значения у по ве-
личине и разобьем их на 10 равных по численности групп, называемых децилями: в первую группу войдет 10% лиц, имеющих наименьшее значение риска, во вторую группу 10% лиц, имеющих несколько большие значения риска, и т. д. Для каждой группы можно подсчитать ожидаемое значение числа «случаев» (суммируя для этой группы значения lf(l+erv)) и сравнить его с фактическим. Результаты приведены в следующей табл. 1.
Несмотря на очевидное невыполнение предположения многомерной нормальности, согласие между ожидаемыми и фактическими численностями «случаев» неплохое. Это объясняется тем, что при группировке на основании риска (значения
329
Таблица 1
Ожидаемые и фактические численности случаев ИБС по децилям риска
2187 мужчин 2669 женщин
Деаиль Ожидае Фактическое Ожидаемое Фактическое
число % ваболе- число % заболе
случаев ваемости случаев ваемости
10 90.5 82 37.5 70.4 54 20.2
9 47,1 44 20.1 24,7 23 8.6
8 32,6 31 14.2 15.0 21 7.9
7 25,0 33 15.1 9.8 14 5.2
6 19,7 22 10.1 6.5 5 1.9
5 15,0 20 9.1 4.4 6 2.2
4 11,5 13 5.9 3.2 2 0.7
3 8,6 10 4.6 2.3 0 0
2 6,0 3 1.4 1.7 3 1.1
1 3,4 0 0 1.1 1 0.4
Предыдущая << 1 .. 127 128 129 130 131 132 < 133 > 134 135 136 137 138 139 .. 161 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed