Научная литература
booksshare.net -> Добавить материал -> Педагогика -> Челышкова М.Б. -> "Теория и практика конструирования педагогических тестов" -> 121

Теория и практика конструирования педагогических тестов - Челышкова М.Б.

Челышкова М.Б. Теория и практика конструирования педагогических тестов — M.: Логос, 2002. — 432 c.
ISBN 5-94010-143-7
Скачать (прямая ссылка): teoripraktika2002.djvu
Предыдущая << 1 .. 115 116 117 118 119 120 < 121 > 122 123 124 125 126 127 .. 154 >> Следующая

Таким образом, при конструировании гомогенного теста следует стремиться к повышению его надежности в разумных пределах, так чтобы не снизить существенным образом содержательную валидность теста. Поэтому при отборе заданий в тест необходимо
343
GUNPOWDER
иметь четкое представление об их содержании и о множестве других факторов, а не просто отдавать предпочтение тем, которые высоко коррелируют друг с другом и обеспечивают хорошую надежность теста. Правда, по рассматриваемой выше проблеме есть другая точка зрения, принадлежащая Гилфорду [44] и Ньюнелли [II]. Они полагают, что внутренняя согласованность теста является непременным условием его высокой содержательной валидности, и потому высокая надежность является предпосылкой оптимальной валидности теста.
К точке зрения Ф. Лорда присоединяются Кэттелл и Клайн [11]. По их мнению, максимум валидности может быть получен тогда, когда все задания слабо, но положительно коррелируют друг с другом, но каждое из них имеет высокую корреляцию с критерием по тесту. Поэтому повышению валидности способствует включение заданий, для которых характерны большие коэффициенты бисериальной корреляции с суммой баллов по тесту.
Помимо этого, повышению содержательной валидности обычно способствует независимая экспертиза, рекомендации по проведению которой представлены в гл. 3.
OuEHKA валианости теста
Для оценки валидности теста обычно используют корреляцию между показателями теста и некоторым внешним критерием. Основная трудность при такой валидизации носит не практический, а методологический характер, поскольку она состоит в выборе значимого внешнего критерия. Для педагогических тестов в качестве критерия обычно берутся оценки экспертов, выставленные ими при традиционной проверке знаний учеников без использования тестов. Процесс валидизации осложняется необходимостью установления меры согласованности оценок экспертов, которых обычно бывает не менее трех человек. Если мера согласованности достаточно высока [5], то для оценки валидности используется формула
L(X1-X)(X^-X3)
(5.79)
где X1-X — отклонение тестового балла /-го ученика от среднего балла по тесту; X -Хэ — отклонение балла/-го ученика у экспер-
344
GUNPOWDER
тов от X3 — среднего арифметического экспертных оценок; Sj —
дисперсия баллов учеников по тесту; S^x — дисперсия баллов экспертов; т — число экспертов.
Бывают случаи, когда педагог заинтересован в оценке прогностической валидности, указывающей меру вероятности прогноза успешности дальнейшего обучения по результатам выполнения теста. Высокой прогностической валидностью должны обладать тесты для приема абитуриентов в вузы. В этом случае результаты по тесту коррелируют с результатами поступивших абитуриентов, после окончания первого года обучения в вузе. Высокая корреляция означает, что разработанные тесты прогностичны для отбора абитуриентов в вуз.
источники повышения валидности теста
1. Подбор оптимальной трудности заданий для обеспечения нормального закона распределения баллов по тесту.
2. Экспертиза качества содержания теста.
3. Расчет оптимального времени выполнения теста.
4. Подбор валидных заданий с высокой дискриминативностью.
Выводы
1. Полная стандартизация процедуры предъявления теста способствует повышению точности и созданию качественных тестов.
2. Наибольшую трудность в процессе создания теста представляет не обработка данных, а интерпретация результатов обработки. Последнее требует от авторов тестов определенных навыков по анализу результатов и выработки решений для повышения качества тестов.
3. Современная теория тестов по сравнению с традиционной обладает существенными преимуществами, позволяющими значительно повысить точность измерений и качество педагогических тестов.
4. В отличие от традиционных средств контроля тесты проходят процесс научного обоснования качества, предполагающий оценку соответствия характеристик тестов двум важнейшим критериям: надежности и валидности.
345
GUNPOWDER
Приложение 5.1. Инструкция TIMSS
Пример инструкции, используемой сотрудниками Центра оценки качества образования Института общего среднего образования в рамках проводимых ими международных исследований.
1. Введение
1.1. Информация об исследовании
Третье международное исследование по оценке качества математического и естественнонаучного образования — TIMSS (Third International Mathematics and Science Study) — самый широкомасштабный проект XX в. в области образования по исследуемой проблематике и числу участвовавших в нем стран. Основная цель проекта — сравнить математическую и естественнонаучную подготовку школьников в различных странах мира и выявить факторы, влияющие на результаты обучения. Данный проект осуществляется в 45 странах.
Исследование организовано Международной ассоциацией по оценке учебных достижений IEA (International Association for the Evaluation of Educational Achievements). В России данное исследование проводится Центром оценки качества образования ИОСО РАО.
Первый этап исследования проводился в 1995 г. Для выявления тенденций изменения качества математического и естественнонаучного образования стран-участниц в 1999 г. в этих странах проводился второй этап тестирования. Для этого были созданы валидные и надежные тесты на основе экспериментально проверенных заданий, разработанных специалистами различных стран, участвовавших в исследовании.
Предыдущая << 1 .. 115 116 117 118 119 120 < 121 > 122 123 124 125 126 127 .. 154 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed