Биологическая статистика - Рокицкий П.Ф.
Скачать (прямая ссылка):
(a+b)3=a3+3a2b+3ab2+b3,
(а + Ь)* = а*+4а3Ь + 6а?Ь2+4аЬ3+Ь* и т. д.
Эти коэффициенты легко получить с помощью треугольника Паскаля, в котором
цифры каждого .последующего ряда получаются путем сложения двух цифр
ряда, расположенного над ним:
1
1 1 12 1 13 3 1
1 4 6 4 1
1 5 1" 10 5 1
1 6 15 20 15 6 1
61
Рис, 5, Аппарат Гальюна.
Распределение вариант в виде вариационного ряда, частоты в котором
следуют коэффициентам разложения бинома Ньютона, как следствие
совместного влияния многих независимых факторов может быть наглядно
показано с помощью доски, или аппарата, Гальтона (рис. 5).
Этот аппарат представляет собой коробку, в верхней части которой
расположен ящичек с выходным отверстием посредине. В средней части
коробки воткнуты булавки, причем булавки каждого последующего ряда
расположены против середин промежутков предыдущего ряда. В нижней части
коробка разделена перегородками на ряд отделений. Коробка ставится
наклонно, примерно под углом 30° к
поверхности пола или стола. В верхний ящичек насыпается
дробь. Отдельные дробинки, падая через отверстие ящичка, встречают на
своем пути булавки, при столкновении с ними отклоняются вправо или влево
и, наконец, падают в отделения нижней части аппарата.
Оказывается, что накопление дробинок в этих отделениях образует фигуру,
аналогичную гистограмме или полигону распределения вариационного ряда, с
характерной концентрацией большинства вариант в средней части и
рассеянием их вправо и влево. Расположение дробинок в отделениях аппарата
является результатом встреч дробинок со многими булавками, при которых
дробинки могли многократно отклоняться в сторону от прямого пути. Чаще
всего происходило взаимное погашение этих ' отклонений: дробинка, первый
раз отклонившись вправо, второй раз отклонялась влево и т. д. и в
конечном счете попадала в одно из средних отделений. В других, более
редких случаях отклонения в одном и том же направлении вправо или влево
совпадали, и дробинка попадала в одно из крайних правых или левых
отделений. Но максимальные отклонения являются самыми редкими, т. е.
обладают очень малой вероятностью.
Подобно этому положение вариант в вариационном ряду является результатом
суммирования многих случайных факторов, вызывающих отклонения вариант от
средней в разных направлениях, причем каждое сочетание факторов
осуществляется с определенной вероятностью.
62
Таким образом, вариационный ряд с характерным для него расположением
большинства вариант вблизи его центральной части и рассеиванием к краям
ряда является в то же время и распределением вероятностей. Это значит,
что в вариационном ряду случайная переменная х принимает разные значения:
^1" %2> *3, •••" ~~~
под влиянием большого количества самых разнообразных причин, независимых,
как правило, друг от друга. Поэтому вариацию величины х можно
рассматривать как случайную. Отдельным значениям х t можно придать
соответствующие вероятности Pi- Pi> Р2> Рз> •••> Рп• Совокупность
значений xt и соответствующих им вероятностей pt и называется
распределением.
Биномиальное распределение. Если вероятности появления отдельных значений
^выражаются величинами,.соответствующими коэффициентам разложения бинома
Ньютона, как это было показано выше, распределение называется
биномиальным.
Биномиальное распределение относится к признакам, варьирующим дискретно,
прерывисто. В табл. 4 был приведен эмпирический ряд распределения самок
серебристо-черных лисиц по числу щенков, в помете. Именно ряды такого
типа относятся к биномиальному распределению. Частоты отдельных классов
тогда пропорциональны коэффициентам разложения бинома Ньютона (p+q)h, где
р - вероятность появления данного события (или признака), q - вероятность
непоявления, a k - число классов, отличающихся по наступлению данного
события (или появлению признака).
При биномиальном распределении возможны различные значения р и q,
например: р=0,7 и <7 = 0,3 или р=0,9 и <7=0,1 и т. д. При этом меняется и
форма лолигона. По мере увеличения различий между р и <7 полигон
становится все более скошенным, асимметричным. Однако по мере увеличения
п даже при значительном различии между р и q степень симметрии полигона
.вновь усиливается.
Как и для других распределений, параметрами для биномиального
распределения являются средняя арифметическая и среднее квадратическое
отклонение, которые можно опредё5 лить с помощью приведенных выше формул
для любого конкретного эмпирического ряда.
Теоретически их значения определяются значениями вероятностей р и <7, а
также значением k; т. е. числа независимых событий, распределение которых
изучается.
Средняя арифметическая при биномиальном распределении
x = kp (21)
и среднее квадратическое отклонение
<т= Vkpq. (22)
63
Эти формулы дают возможность связать определенные хна, вычисленные на
основе данного конкретного материала, с вероятностями р и q.
Возьмем следующий пример, схематизированный для упрощения подсчетов. В 96