Научная литература
booksshare.net -> Добавить материал -> Физика -> Варден Б.Л. -> "Математическая статистика" -> 30

Математическая статистика - Варден Б.Л.

Варден Б.Л. Математическая статистика — М.: Ил, 1960. — 435 c.
Скачать (прямая ссылка): matematstatistika1960.pdf
Предыдущая << 1 .. 24 25 26 27 28 29 < 30 > 31 32 33 34 35 36 .. 178 >> Следующая


— (UW)

У (uu) (ww)

— (РЦ’)

У (VV) (ww)

+

T]

При четырех неравенствах пришлось бы вычислять объем сферического тетраэдра, что не так просто.

с
ГЛАВА IV

ОЦЕНКИ ФУНКЦИЙ РАСПРЕДЕЛЕНИЯ, СРЕДНИХ ЗНАЧЕНИЙ И ДИСПЕРСИЙ

Важнейшими разделами этой главы являются § 15 и § 18.

§ 15. Кривая Кетле

Я до сих пор живо помню, как однажды, когда я был еще ребенком, мой отец привел меня на край города, где на берегу стояли ивы, и велел мне сорвать наугад сотню ивовых листочков. После отбора листьев с поврежденными кончиками у пас осталось 89 целых листиков. Вернувшись дом.ой, мы расположили их в ряд но росту, как солдат. Затем мой отец через кончики листьев провел кривую и сказал: «Это и есть кривая Кетле. Глядя на нее, ты видишь, что посредственности всегда составляют подавляющее большинство и лишь немногие поднимаются выше или так и остаются внизу».

Если эту кривую расположить вертикально (рис. 11) и в качестве единицы масштаба на оси ординат выбрать отрезок, длина которого равна высоте всей фигуры, то ордината h, соответствующая абсциссе будет, очевидно, представлять собой частоту (или долю) тех ивовых листьев, длина которых меньше t. И так как частота h приближенно равна вероятности р, то паша кривая приближенно представляетp — F(t) ---^ функцию распределения длины листьев.

Рис. 11. Кривая Измеренные длины ивовых листьев а-!...

Кетле. хп образуют в совокупности то, что ныне на-

зывают выборкой. По выборке с помощью только что указанного приема можно эмпирически оценить функцию распределения F(t). Определив приближенно F(t), можно графическим дифференцированием оценить плотность вероятностей f(t), однако результаты, как правило, бывают мало надежными.

Другой часто употребляемый способ оценки f(t) и F(t) основан на группировке наблюденных значений х. Интервал (t0, tr), в котором заключены наблюденные значения х, произвольно вы-
§ 15. Кривая Кетле

85

бранными точками tlt ..1г_г разбивается на частичные интервалы. Бели, скажем, значения х измеряются в миллиметрах, то в качестве точек разбиения целесообразно выбрать точки \п + -*-) мм,

где п —• целые числа.

Длины частичных интервалов должны быть настолько малыми, чтобы внутри каждого из них плотность вероятностей f(t) не слишком сильно менялась; с другой стороны, количество наблюдении в каждом частичном интервале не должно быть слишком малым. Непосредственным подсчетом определяются частоты значений х, соответствующие каждому интервалу; графически эти частоты изображаются в виде прямоугольников, основаниями которых служат частичные интервалы; площади прямоугольников пропорциональны соответствующим частотам (рис. 12). Затем проводят плавную кривую у = f(x) таким образом, чтобы площадь, расположенная между кривой и ссыо абсцисс, как можно меньше отличалась от суммы площадей прямоугольников. Численным интегрированием f(t) получают сценку для функции распределения F(t).

Однако предыдущий способ определения F(t) лучше только что изложенного, так как в нем используется весь негруппировап-пый материал без произвольного разбиения па интервалы. Точность этого метода будет исследована в следующем разделе (§16).

Гальтон и Кетле установили, что распределения биологических случайных величин очень часто могут быть представлены гауссовой функцией ошибок

т _ I «у

т= (о

ст \ 2п

Поэтому такие распределения называют нормальными. Однако в природе существуют и другие распределения. К- Пирсон нашел целый ряд типов часто встречающихся функций распределения.

Пример 11. В. Юханнсен в своих известных опытах по селекции1 примерно из 16 ООО коричневых бобов отобрал 25 наибольших и с помощью самоопыления стал выращивать из них новое потомство. В первом поколении возникло следующее распределение по весу:

Границы

весовых интервалов 20 25 30 35 40 45 50 55 60 65 70 75 80

Кол ичество

бобов 5 18 46 144 127 70 70 63 28 15 8 4

На чертеже получилось заметно асимметричное распределение (рис. 12), которое нельзя приближенно представить нормальным распределением. Как показал анализ Юханнсена, отклонение от нормальной кривой

1J о h a n и s е n W., Uber Erblichkeit in Populationen und remen Linien, Jona, 1903, S. 19.
80 Гл. IV. Оценки функций распределения, средних значений и дисперсий

в этом случае обусловлено перемешиванием друг с другом различных «чистых линий»1. Каждая «чистая линия» — потомство одного боба — подчиняется приближенно нормальному распределению, в котором среднее значение при дальнейшей селекции либо совсем не меняется, либо меняется, по

Рис. 12. Распределение веса бобов первого поколения, по Юханнсену.

очень незначительно. Средний вес 11 чистых линий имеет следующее распределение:
Предыдущая << 1 .. 24 25 26 27 28 29 < 30 > 31 32 33 34 35 36 .. 178 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed