Научная литература
booksshare.net -> Добавить материал -> Физика -> Варден Б.Л. -> "Математическая статистика" -> 14

Математическая статистика - Варден Б.Л.

Варден Б.Л. Математическая статистика — М.: Ил, 1960. — 435 c.
Скачать (прямая ссылка): matematstatistika1960.pdf
Предыдущая << 1 .. 8 9 10 11 12 13 < 14 > 15 16 17 18 19 20 .. 178 >> Следующая

§ 6. Отклонение частоты h от вероятности р

41

Таким образом, устанавливается, что эта вероятность приближенно равна интегралу

С ростом д функция Ф(д) столь быстро стремится к единице, что при д = 2,58 вероятность 2Ф (д) — 1 = 0,99, а при д = 3 равна даже 0,9973. Это свойство словами выражается так: значения к — пр, превышающие по абсолютной величине утроенное квадратичное отклонение, столь маловероятны, что при расчетах их едва ли следует принимать во внимание.

Этот результат справедлив1 не только для очень больших, но, как показывают численные подсчеты, и для не очень больших значений п. Вообще в математической статистике часто оказывается, что 4 уже является большим числом. Если пр и nq (или 1с и I) оба больше четырех, можно уверенно пользоваться сформулированным выше правилом Зет.

Трудность применения правила Зет заключается в том, что, хотя практически k, I и п (и, следовательно, частота А) бывают известны, однако р и q (а следовательно, и квадратичное отклонение сг) обычно остаются неизвестными. Для выхода из этого затруднения имеются различные пути.

Наиболее надежный из них заключается в замене pq наибольшим возможным значением этого произведения 1/4. При этом cr = \npq заменяется величиной \п/2. Этот прием особенно хорош тогда, когда наблюденная частота h близка к У2.

Второй возможный путь заключается в замене р и q величинами Л и 1 — А. При этом сг = 'fnpq заменяется величиной

Для больших п это вполне допустимо, так как по закону больших чисел р близко к А; здесь нужна лишь осторожность, когда к или I малы (скажем, меньше 4). А именно, если h близко к нулю, то результаты употребления р( 1 —р) или А(1 —А) могут оказаться существенно различными. Иначе говоря, при малых к или I существует опасность, что определенное таким образом s

я

1

о

Б. ОЦЕНКА КВАДРАТИЧНОГО ОТКЛОНЕНИЯ

(5)

1 Более точные приближения к биномиальному распределению были получены С. Н. Бернштейном [Изв. АН СССР, серия ыатем., Т (1943), 3—16] н Феллероы [Annales of Math. Statistic, 16 (1945), 319—329].— Прим. ред.
42

Г л. II. Вероятности и частоты

окажется значительно меньше сг, поэтому, заменяя сг на s, мы получим заниженную оценку для квадратичного отклонения.

Особенно резко это заметно в крайнем случае при к = 0. Предположим, что некоторый хирург оперировал 90 пациентов и при этом не наблюдалось ни одного смертельного исхода. Статистика наблюдений здесь столь обширна, что о действительной смертности р можно высказать утверждение: величина р заведомо мала. Однако нет оснований полагать, что р— h меньше утроенной оценки s = J/ (kl)/n квадратичного отклонения сг: ведь в нашем случае s = 0, а вряд ли кто-нибудь решится утверждать, что смертность в точности равна нулю.

Один всегда возможный выход из этого затруднения будет указан в следующих параграфах1. Здесь же мы ограничимся указанием небольшой поправки, которую при не слишком малых к и I целесообразно применить при вычислении s2 для того, чтобы компенсировать возможное уменьшение значения ксадратичного отклонения. Именно если сравнить в2 = (Ы)/п с а-2 = npq, то окажется, что среднее значение в2 равно не сг2, а сг2 (п— 1 )/п. Путь вычислений таков:

б

~ к(п — к) &,кп — б k2

0 . _ ---------------------

Так как & к = пр и

б к2 = (б к)2 + сг2 = (пр)2 -f npq,

то

рп- — (р2эт2 + pqn) „

б — —---------------—1 —- - = пр — пр2 — pq =

= npq — pq = (ti 1) pq = cr2.

Следовательно, оценкой, среднее значение которой точно равняется сг2, будет не в2, а

_/2 - W п к1/ /?У\

,Л’2 ^ ¦ (6)

71----------- 1 ' 71--------1

Для того чтобы теперь получить исправленную оценку дисперсии частоты h, нужно s'2 разделить на п2, так как h — к/п и <rl = = сг2/п2. Таким образом, оценка erf, имеет вид

о __ ^ _ ^(1 — h) С7\

' 11 п2(п -- ~ п -- 1 ' '

1 Другой прием связан с отысканием такой функции от h, дисперсия

которой почти не зависит от р. Подробнее об этом см. Еао С, К., Advanced Statistical Methods in Biometric Research, Wilev, New York, 1952, p. 207—214.
6. Отклонение частоты h от вероятности р 43

Среднее значение равно

С о2 __ ,,_______

О ft h wz п

Если воспользоваться оценками h для р и sj; для сг\, то можно всегда быть уверенным, что в среднем будут получаться правильные результаты: эти оценки не имеют смещений, т. е. лишены систематических ошибок.
Предыдущая << 1 .. 8 9 10 11 12 13 < 14 > 15 16 17 18 19 20 .. 178 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed