booksshare.net -> Добавить материал -> Педагогика -> Челышкова М.Б. -> "Теория и практика конструирования педагогических тестов" -> 117

Теория и практика конструирования педагогических тестов - Челышкова М.Б.

Челышкова М.Б. Теория и практика конструирования педагогических тестов — M.: Логос, 2002. — 432 c.
ISBN 5-94010-143-7
Скачать (прямая ссылка): teoripraktika2002.djvu

Предыдущая << 1 .. 111 112 113 114 115 116 < 117 > 118 119 120 121 122 123 .. 154 >> Следующая

Метол параллельных форм (двукратное тестирование)
Не может быть никакого сомнения в том, что метод параллельных форм (parallel-form reliability) наиболее подходящий для оценки надежности в рамках классической теории тестов, поскольку идея существования параллельных форм заложена в ней на уровне концепций и постулатов. Однако с практической точки зрения — это наименее эффективный метод. Пользуясь им, автору приходится создавать форму теста, параллельную исходной, затем долго с большими затратами сил и времени доказывать ее параллельность
332
GUNPOWDER
и только потом оценивать надежность исходного теста. К тому же параллельные формы — это скорее теория, чем реальность, поскольку на практике, несмотря на все усилия авторов, как правило, обнаруживаются статистически значимые отличия в характеристиках параллельных тестов.
Если автору все же удалось, преодолев все трудности, создать параллельные формы и проверка условий параллельности дает обнадеживающие результаты, то для оценки надежности используется формула (5.74). В ней X. (і = 1,2, ...,N) — индивидуальные баллы испытуемых в первой форме, a Y1(I= 1, 2,..., N) — во второй. А далее все вычисления с точностью повторяют подробно рассмотренный пример.
И ретестовый метод, и метод параллельных форм довольно неудобны, поскольку они предполагают двукратное тестирование школьников. Обычно их используют довольно редко и отдают предпочтение методам, требующим однократного тестирования учеников.
Метол расшепления теста (однократное тестирование)
Метод расщепления на две части (split-half method) наиболее распространен из-за своего удобства. Он позволяет вычислить коэффициент надежности при однократном выполнении учениками теста. Для оценки надежности результаты тестирования делят на две части: в одну включают данные испытуемых по четным, а в другую — по нечетным заданиям теста. Правда, деление на две части — не единственный способ, возможны и другие варианты, когда выделяют большее число частей при оценке надежности теста.
Результаты учеников заносят в табл. 5.31 и получают табл. 5.32.
Далее для таблицы данных используют формулу (5.74), в которой роль результатов в первом тестировании выполняют данные по четным заданиям, а во втором — по нечетным.
Таблица 5.31. Сводная таблица для оценки надежное ш (метод расщепления)
номер ученика і балл при первом тестировании X1 балл при втором тестировании Y1 X1Y1 №)2
1 X1 X1Y1 (X1)2 (Y1)2
2 X1 Y2 X2Y2 (X2)2 (У2)2

N Xn Yn (Xn)2 (Yn)2
N 1=1 N 1=1 N LXiY; i I N L(X,)2 I=I L(Y1)2 /=1
333
GUNPOWDER
Для матрицы табл. 5.28 результаты почетным и нечетным заданиям приводятся в табл. 5.32.
После подстановки чисел из табл. 5.32 в формулу (5.74) получается
(г) 10 75-24-26 _ 126 Q6]
Н ^ л/Ю-74-242л/Ю-88-262 >Дб4л/204
По сравнению с прежним значением 0,78 надежность получилась намного меньше, что можно было предвидеть, поскольку подсчет методом расщепления велся не по 10 заданиям, а только по 5. Для оценки надежности исходного теста из 10 заданий используется формула Спирмена—Брауна
2(/-н) (5?5)
*¦ /расщ
Таблица 5.32. Подсчет надежности (метод расщепления)
Номер ученика « і Балл при первом тестировании X1 Балл при втором тестировании Yi X1Y1 W2
1 3 3 9 9 9
2 1 1 1 1 1
3 1 0 0 1 0
4 5 4 20 25 16
5 1 3 3 1 9
6 2 2 4 4 4
7 3 2 6 9 4
8 2 2 4 4 4
9 4 5 20 16 15
10 2 4 8 4 16
I*/= 24 № = 75 Х№)2=74 XW)2 =88
334
GUNPOWDER
Тогда rH теста из 10 заданий будет
2-0,61 П7. " 1+061
После коррекции коэффициент надежности получился приблизительно такой же, как и в предыдущем случае подсчета ретесто-вым методом (гн =0,78). Применение формулы Спирмена—Брауна подтверждает высказанное ранее предположение: увеличение длины повышает надежность теста.
Рассмотренный выше метод расщепления основан на допущении параллельности двух половин теста, что не всегда и не в полной мере может оказаться верным. Корреляция двух половин возрастает по мере роста гомогенности теста. В этой связи метод расщепления нередко называют методом оценки внутренней состоятельности (согласованности) теста (Internal-Consistency Method).
Следующий подход к оценке надежности основан на вполне реальных данных и не зависит от упомянутых выше искусственных допущений о полной параллельности частей теста.
Однако и он имеет свою ограниченную сферу применения, поскольку годится исключительно для гомогенных тестов.
Метод Кьюдера—-Ричардсона (для дихотомических ouehok по заданиям теста)
Формула Кьюдера—Ричардсона (F. Kuder, М. Richardson 20, или KR-20) имеет вид [48]
/ \ - п
Vh JKR-20
/1-1
( п \
Ира
1-і=!_
S2
V J
(5.76)
где р. — доля правильных ответов на у-е задание; д. — доля непра-
вильных ответов, д.= 1 — p? S% — дисперсия по распределению наблюдаемых баллов; п — число заданий теста.
Применительно к рассматриваемой матрице S\ =6,89 (см.
разд. 5.2), a Pj(J= U 2,10) приводится в самой последней строчке табл. 5.27. Тогда
335
GUNPOWDER
0,9 • 0,1 + 0,8 • 0,2 + 0,7 • 0,3 + 0,6 • 0,4 + 0,5 • 0,5 + 0,5 • 0,5 + + 0,3•0,7 + 0,4•0,6 + 0,2•0,8 + 0,I * 0,9= 1,9;

Предыдущая << 1 .. 111 112 113 114 115 116 < 117 > 118 119 120 121 122 123 .. 154 >> Следующая