Научная литература
booksshare.net -> Добавить материал -> Математика -> Афифи А. -> "Статистический анализ: Подход с использованием ЭВМ" -> 4

Статистический анализ: Подход с использованием ЭВМ - Афифи А.

Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ. Под редакцией Башарина Г.П. — М.: Мир, 1982. — 488 c.
Скачать (прямая ссылка): stap1982.djvu
Предыдущая << 1 .. 2 3 < 4 > 5 6 7 8 9 10 .. 183 >> Следующая

Введение в анализ данных
Как уже сказано в предисловии, эта книга служит двум основным целям. Первая — описать практику применения основных метр-дов классического статистического анализа как в одномерном, так и в многомерном случаях. Вторая — проиллюстрировать наиболее эффективное использование пакетов статистических программ (ПСП), т. е. показать а) как выбрать наилучшую для целей проводимого анализа программу; Ь) как интерпретировать различные дополнительные возможности, предоставляемые программой пакета; с) как толковать выход типовой программы и <1) как использовать простые программы для сложного анализа.
В этой главе мы рассмотрим предварительные определения и понятия, которые обычно не приводятся в книгах или курсах по статистике. Так, в разд. 1.1 определим виды данных и типы измерений, которые возникают в приложениях, а также опишем элементарные средства для статистических измерений.
В разд. 1.2—1.3 мы изложим общую терминологию, относящуюся к применениям ЭВМ. Так, в разд. 1.2 опишем основные компоненты вычислительной аппаратуры, а в разд. 1.3 — основные компоненты программного обеспечения, необходимые для понимания принципов составления пакетов программ. В разд. 1.3 приведем также перечень наиболее часто используемых ПСП.
В разд. 1.4 мы опишем подготовку данных для программ из ПСП и обсудим бланки для программирования и операторы формата. В этом разделе приводятся также два набора данных, которые будут использоваться на протяжении всей книги в примерах и/или упражнениях. В разд. 1.5 обсуждаются требования к хорошему ПСП, а в разд. 1.6 описываются другие важные способы использования ЭВМ для нужд статистики. В разд. 1.7 описываются этапы проверки данных, предшествующие дальнейшему статистическому анализу.
1.1. Данные, измерения и вычислительные средства
15
1.1. Данные, измерения и вычислительные средства
Термин данные весьма популярен в научных исследованиях. В широком смысле он означает фактический материал, являющийся основой для обсуждения или принятия решений, а в статистике — это информация, пригодная для анализа и интерпретации. Действительно, некоторые статистики рассматривают статистический анализ как анализ данных (Tukey (1962)). В этой книге наблюдения служат реализацией некоторой случайной величины, и они поставляют данные для изучаемой проблемы. Следовательно, термины «данные», «наблюдения» и «реализации» являются синонимами и могут заменять друг друга.
В настоящем разделе мы обсудим типы данных, возникающих в научных исследованиях. Данные получаются в результате измерений индивидуумов или подопытных образцов из исследуемой популяции. Под измерением мы понимаем присвоение символов подопытным образцам в соответствии с некоторым правилом. Эти символы могут быть буквенными и представлять классы или категории в популяции или числовыми. Числовые символы также могут представлять категории в популяции или быть числами. В первом случае к ним нельзя применять правила арифметики, во втором — можно. Например, если 1 обозначает класс мужчин, а 2 — женщин, то в этом контексте 1 + 2 не имеет смысла. Однако если 1 — число долларов, заработанных за некоторый день, а 2 — за следующий день, то 1 + 2 = 3 имеет смысл и означает, что за два дня заработано 3 доллара.
Шкала и единицы измерений могут быть самыми разными. Например, для любого индивидуума из популяции взрослых в США мы можем измерить а) пол; Ь) социальное положение; с) температуру; d) рост. Очевидно, что шкалы этих четырех измерений совершенно различны по существу, так как в а) можно сказать, что пол одного индивидуума отличен от пола другого; в Ь) можно сказать, что положение одного отличается и выше, чем у другого; в с) можно сказать, что температура одного отлична, выше и на сколько выше, чем у другого; в d) можно сказать, что рост одного отличен, больше, на сколько больше и во сколько раз больше, чем у другого. Эти четыре примера представляют •четыре типа шкалы измерений, предложенные С. С. Стивенсом (Churchman, Ratoosh (1959), гл. 2) и получившие следующие названия: шкала наименований, порядковая шкала, интервальная шкала и шкала отношений. Обсудим теперь коротко каждую из шкал.
1. Шкала наименований. Эта шкала используется только для классификации индивидуумов в популяции. Каждому классу присваивается свое обозначение так, чтобы обозначения различных классов не совпадали. Например, если индивидуумы класси-
16
Гл. 1. Введение в анализ данных
фицируются по полу, то двум классам можно присваивать соответственно буквы М и F, слова MALE и FEMALE или цифры 1 и 2.
Структура шкалы наименований не изменяется, если произвести взаимно однозначную подстановку обозначений. Так, в приведенном выше примере можно подставить 1 вместо М и 2 вместо F, или 2 вместо М и 1 вместо F, или 100 вместо М и 1000 вместо F и т. д.
Повторим, что арифметические операции не имеют смысла для шкалы наименований. Поэтому ни медиана, ни среднее не имеют смысла. Подходящей статистикой положения центра (центральной тенденции) является мода, так как она не изменяется при взаимно однозначной подстановке обозначений. Например, если мужчин больше, чем женщин, то мода описывает класс «мужчины» независимо от того, будет ли он обозначен через М, 1, 2 или 1000.
Предыдущая << 1 .. 2 3 < 4 > 5 6 7 8 9 10 .. 183 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed