booksshare.net -> Добавить материал -> Физика -> Варден Б.Л. -> "Математическая статистика" -> 54

Математическая статистика - Варден Б.Л.

Варден Б.Л. Математическая статистика — М.: Ил, 1960. — 435 c.
Скачать (прямая ссылка): matematstatistika1960.pdf

Предыдущая << 1 .. 48 49 50 51 52 53 < 54 > 55 56 57 58 59 60 .. 178 >> Следующая

*<‘) = Й=(1+7Г^!- ,14)

График функции (14) имеет колоколообразную форму и похож на гауссову кривую ошибок. При / —» оо функция (14) стремится, очевидно, к плотности нормального распределения

1 — - с

/т = те ¦ .

Если Н(а) вычислена в явном виде как функция а, то можно найти, при каком а вероятность Н(а) принимает заданное значение

1 — ft, причем f3 можно выбрать, например, равным 0,025 или 0,005. Тогда вероятность того, что / превзойдет границу а = tfl, будет равна /3. Так как — t имеет то же самое распределение, что и t, то — t сможет превзойти границу также лишь с вероятностью^.

10*
148

Г л. VI. Г ауссова теория ошибок и критерий Стьюдента

Абсолютная величина |<| может превзойти границу с вероятностью 2/в.

Указанная выше постановка вопроса и ответ на этот вопрос в виде формулы (12) исходят от английского статистика Госсета, который под скромным псевдонимом «Стьюдеит» опубликовал работу1, совершившую переворот в статистике. Поэтому распределение случайной величины t называют распределением Стьюдента. В свою очередь правило, согласно которому гипотетическую величину среднего значения х отвергают тогда, когда модуль отношения t превосходит границу Ц, называют критерием Стьюдента.

Граница ^ зависит от уровня значимости /б и от числа степеней свободы f — n—1. Границы ^табулированы в табл. 7 в конце книги.

При использовании одностороннего критерия предполагаемое среднее значение а; отвергают лишь тогда, когда t положительно и превосходит t^, или лишь тогда, когда t отрицательно и не превосходит — tp. При двустороннем критерии на знак t не обращают внимания, а лишь учитывают абсолютную величину |i]. Вероятность того, что правильнее значение х по критерию Стьюдента будет отвергнуто, в случае одностороннего критерия равна /в, а в случае двустороннего критерия равна 2/8. При этом предполагается, что все xt — независимые одинаково нормально распределенные случайные величины. Если это не так, то /б и 2/6 будут лишь приближенными значениями для уровней значимости соответствующих критериев.

§ 29. Сравнение двух средних значений

Во всех экспериментальных естественных науках большое значение имеет следующая постановка вопроса:

Пусть имеется g случайно выбранных значений xv . . ., xg некоторой случайной величины х и /^значений ух,. . ., yh другой случайной величины у. Обозначим хну выборочные средние в первой и второй выборке соответственно. Предположим, что у оказалось несколько меньше (или несколько больше), чем х. Означает ли это, что истинное среднее значение у, в силу тех или иных условий, также меньше (соответственно больше) другого истинного среднего значения х, или различие выборочных средних носит чисто случайный характер? Иными словами: как велика должна быть разность D = х — у, чтобы ее можно было считать значимой, т. е. чтобы можно было утверждать, что хфу>

1 Student, The probable error of a mean, Biometrika, в (1908), 1.
§ 29. Сравнение двух средних значений

14»

На этот вопрос гауссова теория ошибок дает следующий ответ: так как при больших g и h выборочные средние хиу имеют приближенно нормальные распределения с дисперсиями

н приближенные значения этих дисперсий задаются формулами

„2 _ 1 л _ 2?(а> —»)*• m

в’-дв*- д{д-1) '

S2- - - 6‘2 - 2(У-И)г (2>

sv—hsy— h(h — l) ’

то разность _

D = x — y

имеет также приближенно нормальное распределение с дисперсией

<Пз = °i + >

приближенным значением которой является

2 Л2 , 2 /04

S]} — -р Sy .

Если истинная разность х— у = 0, то отношение <? = Д/о-/>

распределено приближенно нормально с нулевым средним значением и единичной дисперсией. Следовательно, с вероятностью, близкой к 1 —2/3, \q\ не превосходит границы qкоторую можно найти по таблицам нормального распределения: например, при

2р = 0,01 граница qP = 2,58. Однако так как знаменатель a-D

неизвестен, то crD заменяют величиной sD. Вследствие такой замены ненадежность границы усиливается, поэтому обычно q$ несколько завышают; например, r качестве границы для отношения D/sd часто выбирают 3 или, если желают достичь еще большей надежности, 4. Если нормированная выборочная разность \D\jsD превышает эту границу, то гипотезу х = у следует отвергнуть и считать, что х > у или х < у, смотря по тому, положительна или отрицательна выборочная разность D.

Как видно, это грубое правило лишено вполне удовлетворительного обоснования. Что же в конце концов нужно выбирать в качестве границы для D/sd\ 2,58; 3 или 4, и каков уровень значимости этого критерия? Для очень больших д и h все ясно, так как в этом случае crD можно заменить на sD без риска совершить сколько-нибудь значительную ошибку, но для малых или умеренно больши хд и h хотелось бы уже знать точнее, сколь большой должна быть выбрана граница дР для D/sd, чтобы в случае х = у вероятность события |D\/sd> qfi равнялась бы, скажем, 0,01?

Предыдущая << 1 .. 48 49 50 51 52 53 < 54 > 55 56 57 58 59 60 .. 178 >> Следующая