Математическая статистика - Варден Б.Л.
Скачать (прямая ссылка):
38
Г л. II. Вероятности и частоты
каждое, практическое применение теории вероятностей. Поэтому те значения к — пр, с которыми практически приходится считаться, являются величинами порядка не выше У npq. Множитель д можно отбросить и говорить: к — пр практически является величиной порядка Упр. Преимущество последней формулировки особенно обнаруживается тогда, когда речь идет о редком событии
и, следовательно, р близка к 0, a q — к 1.
Частота положительных исходов или частота наступления события А определяется отношением числа к к числу п:
Если теперь мы построим случайную величину
значения которой равны h = к/п, то, согласно (3) и (4), математическое ожидание и квадратичное отклонение h будут даваться формулами
Постоянное подчеркивание различия между случайной величиной h и теми значениями h, которые эта величина может принимать, делает язык изложения излишне утомительным и поэтому в дальнейшем от него следует отказаться. Мы будем просто говорить о частоте h, молчаливо подразумевая при этом, что эта частота зависит от случая и, следовательно, обладает средним значением и квадратичным отклонением. Точно так же станем мы поступать и во всех подобных случаях. Буквы жирного шрифта будут встречаться в тексте все реже и реже и лишь там, где возникнет принципиальная необходимость вспомнить общие основы из гл. I.
Среднее значение h равно р. Следовательно, значения | Л — р\, с которыми приходится встречаться при практических расчетах, являются величинами порядка не ниже, чем
Так как 0 <pq*s1/4, то можно также сказать: практически 1Л — р\ является величиной порядка не ниже, чем
Смысл этого утверждения заключается и следующем: те значения | h — р\, которые велики сравнительно с я-1/., имеют все вместе лишь исчезающе малую вероятность.
Если количество опытов п возрастает, то та-’/* стремится к пулю. Таким образом, частота все более и более приближается к
§ 6. Отклонение частоты li от вероятности р 39
значению вероятности р. На этом законе больших чисел основана принципиальная возможность статистического истолкования теории вероятностей.
§ 6. Как велико может быть отклонение частоты h от вероятности р?
А. ПРИБЛИЖЕНИЕ БИНОМИАЛЬНОГО РАСПРЕДЕЛЕНИЯ НОРМАЛЬНЫМ РАСПРЕДЕЛЕНИЕМ
Муавр и Лаплас исследовали биномиальное распределение при больших значениях п и аппроксимировали его некоторым значительно более удобным непрерывным распределением. Эти результаты хорошо известны, и поэтому мы ограничимся здесь лишь их кратким изложением1. Сначала введем приближенное выражение вероятности Wk для больших пр и nq, а именно
1 -V-V
(1)
где z = к— пр. При выводе этой формулы предполагается, что z являются величинами порядка cr = Vnpq, Однако формулу (1) можно применять, не задумываясь, и тогда, когда г велики по сравнению с о-, так как в этом случае правая и левая части (1) исчезающе малы2. Рис. 3 показывает, насколько хорошим является приближение (1) даже при не очень больших п. Здесь для п — 8, p=q = 1/iS точные значения Wk изображены высотами прямоугольников, а приближенные значения — ординатами непрерывной кривой. Так как в этом случае р—q = 0, то непрерывная кривая является гауссовой кривой ошибок; если р—О, то влияние дополнительного множителя в (I) сделает соответствующую кривую асимметричной. В пределе при п —> оо эта асимметрия исчезает.
Из приближенной формулы (1) следует, что функция распределения случайной величины х может быть достаточно хорошо
1 Вывол этих результатов, основанный па формуле Стирлинга
(С" i
I Н—-- (0 < < 1),
12 п )
можно найти в учебниках по теории вероятностей, из которых особою предпочтения заслуживает учебник: Марков А. А., Исчисление вероятностей, 4-е изд., ГИЗ, 1924.
2 Можно показать, что (I) остается справедливой, если za/o-—> 0 при п —> оо. Нели это условие не соблюдается, формулу (1) можно видоизменить так, чтобы и относительная погрешность приближения по-прежнему была бы мала при больших п (см. Ф е л л е р, Введение в теорию вероятностей и ее приложения, ИЛ, М., 1952, гл. VII, стр. 147). — Прим-ред.
40 Гл. 11. Вероятности и частоты
аппроксимирована интегралом от гауссовой функции ошибок. Так как х может принимать лишь конечное число значений к = --0, то в действительности функция распределения х
является ступенчатой функцией1 (рис. 4).
случайной величины х при п = 8, р — 112.
Суммированием можно подсчитать общую вероятность тех значений к, для которых абсолютная величина разности к—пр не превышает произведения да- = д Y?ipq:
| k — np\*sg Vnpq, (2)
или, что то же самое,
|Л — pH ? У”- (3)
1 Имеются непрерывные кривые, которые даже при не очень больших п приближают биномиальное распределение еще лучше, чем гауссова кривая ошибок. См. Wise М. Е., Prop. Коп. Ned. Akad. Amsterdam (section of sciences), A 57, 513.