Научная литература
booksshare.net -> Добавить материал -> Математика -> Афифи А. -> "Статистический анализ: Подход с использованием ЭВМ" -> 18

Статистический анализ: Подход с использованием ЭВМ - Афифи А.

Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ. Под редакцией Башарина Г.П. — М.: Мир, 1982. — 488 c.
Скачать (прямая ссылка): stap1982.djvu
Предыдущая << 1 .. 12 13 14 15 16 17 < 18 > 19 20 21 22 23 24 .. 183 >> Следующая

F0RMAT (14, 2F4.0,13,11,14, 4F4.0, F4.1,2F4.2,2F4.1, F4.0,4F4.1, Т80,11,/)
означает считывание только первой карты и пропуск второй карты для каждого пациента. Например, данные для первого пациента (из табл. 1.4.2) будут считаны следующим образом: 517, 68., 165., 1, 1,2, 114., 88., 95., 73., 1.7, 1.41, 0.66, 11.5,22.5, 110,56.2, 20.6, 11.3, 34.0 и 1.Этот формат определяет переменные с фиксированной точкой (номер истории болезни, пол, исход, тип шока и вид карты), а остальные являются переменными с плавающей точкой. Заметим, что число колонок, выделенных для некоторых переменных, избыточно. Например, возраст и вес размещены в 4 столбцах каждый, в то время как нужно не более 3. Поэтому можно использовать (..., 1X,F3.0,1X,F3.0, ...) вместо (..., 2F4.0, ...). Этот формат можно записать как (..., 2 (IX, F3.0), ...), что служит примером применения вложенных скобок.
Следующий формат считывает все эти переменные как переменные с плавающей точкой:
F0RMAT (3F4.0,F3.0,F1.0,5F4.0, F4.1,2F4.2,2F4.1, F4.0,4F4.1, Т80, Fl.oy).
Здесь все числа считываются с десятичной точкой, например, 517., 68., 1. для первого пациента. Чтобы считать вторую карту и пропустить первую, формат должен быть такого вида: F0RMAT (/, 14,..., Т80, II).
1.5. Критерии оценки
пакетов статистических программ
В настоящем разделе мы приводим некоторые соображения относительно ПСП и критерии для их оценки. Это резюме основано на докладе Комитета по оценке ПСП, представленного ежегодному
46
Гл. 1.^ Введение в анализ данных
собранию Американской Статистической Ассоциации в 1974 г. (Francis etja.1., 1974). Важна каждая из описанных ниже характеристик, но ни одна из программ не является оптимальной с точки зрения всех характеристик. Более того, программа, оптимальная в одной проблеме, может не быть оптимальной в другой. Поэтому пользователь должен оценить каждую программу с позиций своих проблем, а затем произвести выбор в соответствии с этими критериями. Требования к пакетам можно разделить на три группы: понятность для пользователя, статистическая эффективность и удобство эксплуатации.
1.5.1. Понятность для пользователя
Ключевую роль при оценке пакета играет сопровождающая его документация. Ясное, короткое и хорошо организованное справочное руководство с алфавитным указателем (и по возможности с указаниями для начинающих) должно точно описывать все возможности пакета. Руководство должно не только описывать все синтаксические правила, но и указывать на наиболее вероятные ошибки потенциального пользователя. Процедуры должны быть описаны в общепринятых терминах, со ссылками на литературу, используемые численные методы, с указанием стандартных (по умолчанию) значений параметров. Кроме того, должны быть приведены простые и более сложные примеры.
Другим важным фактором является такой язык управления заданиями, в котором процедуры и режимы работы можно задать в терминах, описывающих их функции. Поясняющие метки нужны для упрощения ввода, разметки вывода и проверки управляющих операторов.
Дополнительными желательными свойствами являются:
a. Указания о том, как поступать с отсутствующими значениями.
b. Полный, компактный и неизбыточный вывод со средствами подавления части вывода и запроса дополнительного.
c. Графический вывод в виде гистограмм, вероятностных графиков, графиков остатков и т. д.
d. Надписи на графиках и возможность использовать различные шкалы (это обязательно).
e. Алгоритм для определения стоимости и времени выполнения задания.
f. Язык управления заданиями со словарным запасом из той предметной области, иа которую он ориентирован. Например, справочное руководство по BMDP больше подходит для статистиков, а по SPSS — для специалистов по общественным наукам.
1.6. Другие применения ЭВМ
47
1.5.2. Статистическая эффективность
Пакет должен быть универсальным, т. е. допускать динамичный и непрерывный процесс обработки. Для этого требуется удобная система файлов для подготовки данных, позволяющая выходу каждой процедуры служить в качестве входа последующих процедур. Например, остатки из программы регрессионного анализа должны подходить в качестве входных данных для программы построения графиков остатков.
Пакет должен основываться на правильных и подходящих формулах, на устойчивых в вычислительном смысле и правильно запрограммированных алгоритмах для вычислений по этим формулам, а также на критериях контроля точности используемых данных и процедур. Например, произведение исходной матрицы и^обратной ей служит хорошим контролем точности обращения.
1.5.3. Удобство эксплуатации
Для удобства эксплуатации на ВЦ необходимо иметь листинг программ на исходном языке как первичную документацию пакета. Пакет должен обладать способностью расширения за счет включения других программ в систему и допускать легкий перенос с одной ЭВМ на другую. Наконец, язык, на котором написан пакет, оказывает влияние на заложенные в нем возможности. Для научных целей подходящим языком часто оказывается Фортран.
? 1.6. Другие применения ЭВМ как средства статистического анализа
Предыдущая << 1 .. 12 13 14 15 16 17 < 18 > 19 20 21 22 23 24 .. 183 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed