Математическая статистика - Варден Б.Л.
Скачать (прямая ссылка):
*<‘) = Й=(1+7Г^!- ,14)
График функции (14) имеет колоколообразную форму и похож на гауссову кривую ошибок. При / —» оо функция (14) стремится, очевидно, к плотности нормального распределения
1 — - с
/т = те ¦ .
Если Н(а) вычислена в явном виде как функция а, то можно найти, при каком а вероятность Н(а) принимает заданное значение
1 — ft, причем f3 можно выбрать, например, равным 0,025 или 0,005. Тогда вероятность того, что / превзойдет границу а = tfl, будет равна /3. Так как — t имеет то же самое распределение, что и t, то — t сможет превзойти границу также лишь с вероятностью^.
10*
148
Г л. VI. Г ауссова теория ошибок и критерий Стьюдента
Абсолютная величина |<| может превзойти границу с вероятностью 2/в.
Указанная выше постановка вопроса и ответ на этот вопрос в виде формулы (12) исходят от английского статистика Госсета, который под скромным псевдонимом «Стьюдеит» опубликовал работу1, совершившую переворот в статистике. Поэтому распределение случайной величины t называют распределением Стьюдента. В свою очередь правило, согласно которому гипотетическую величину среднего значения х отвергают тогда, когда модуль отношения t превосходит границу Ц, называют критерием Стьюдента.
Граница ^ зависит от уровня значимости /б и от числа степеней свободы f — n—1. Границы ^табулированы в табл. 7 в конце книги.
При использовании одностороннего критерия предполагаемое среднее значение а; отвергают лишь тогда, когда t положительно и превосходит t^, или лишь тогда, когда t отрицательно и не превосходит — tp. При двустороннем критерии на знак t не обращают внимания, а лишь учитывают абсолютную величину |i]. Вероятность того, что правильнее значение х по критерию Стьюдента будет отвергнуто, в случае одностороннего критерия равна /в, а в случае двустороннего критерия равна 2/8. При этом предполагается, что все xt — независимые одинаково нормально распределенные случайные величины. Если это не так, то /б и 2/6 будут лишь приближенными значениями для уровней значимости соответствующих критериев.
§ 29. Сравнение двух средних значений
Во всех экспериментальных естественных науках большое значение имеет следующая постановка вопроса:
Пусть имеется g случайно выбранных значений xv . . ., xg некоторой случайной величины х и /^значений ух,. . ., yh другой случайной величины у. Обозначим хну выборочные средние в первой и второй выборке соответственно. Предположим, что у оказалось несколько меньше (или несколько больше), чем х. Означает ли это, что истинное среднее значение у, в силу тех или иных условий, также меньше (соответственно больше) другого истинного среднего значения х, или различие выборочных средних носит чисто случайный характер? Иными словами: как велика должна быть разность D = х — у, чтобы ее можно было считать значимой, т. е. чтобы можно было утверждать, что хфу>
1 Student, The probable error of a mean, Biometrika, в (1908), 1.
§ 29. Сравнение двух средних значений
14»
На этот вопрос гауссова теория ошибок дает следующий ответ: так как при больших g и h выборочные средние хиу имеют приближенно нормальные распределения с дисперсиями
н приближенные значения этих дисперсий задаются формулами
„2 _ 1 л _ 2?(а> —»)*• m
в’-дв*- д{д-1) '
S2- - - 6‘2 - 2(У-И)г (2>
sv—hsy— h(h — l) ’
то разность _
D = x — y
имеет также приближенно нормальное распределение с дисперсией
<Пз = °i + >
приближенным значением которой является
2 Л2 , 2 /04
S]} — -р Sy .
Если истинная разность х— у = 0, то отношение <? = Д/о-/>
распределено приближенно нормально с нулевым средним значением и единичной дисперсией. Следовательно, с вероятностью, близкой к 1 —2/3, \q\ не превосходит границы qкоторую можно найти по таблицам нормального распределения: например, при
2р = 0,01 граница qP = 2,58. Однако так как знаменатель a-D
неизвестен, то crD заменяют величиной sD. Вследствие такой замены ненадежность границы усиливается, поэтому обычно q$ несколько завышают; например, r качестве границы для отношения D/sd часто выбирают 3 или, если желают достичь еще большей надежности, 4. Если нормированная выборочная разность \D\jsD превышает эту границу, то гипотезу х = у следует отвергнуть и считать, что х > у или х < у, смотря по тому, положительна или отрицательна выборочная разность D.
Как видно, это грубое правило лишено вполне удовлетворительного обоснования. Что же в конце концов нужно выбирать в качестве границы для D/sd\ 2,58; 3 или 4, и каков уровень значимости этого критерия? Для очень больших д и h все ясно, так как в этом случае crD можно заменить на sD без риска совершить сколько-нибудь значительную ошибку, но для малых или умеренно больши хд и h хотелось бы уже знать точнее, сколь большой должна быть выбрана граница дР для D/sd, чтобы в случае х = у вероятность события |D\/sd> qfi равнялась бы, скажем, 0,01?