Научная литература
booksshare.net -> Добавить материал -> Педагогика -> Челышкова М.Б. -> "Теория и практика конструирования педагогических тестов" -> 98

Теория и практика конструирования педагогических тестов - Челышкова М.Б.

Челышкова М.Б. Теория и практика конструирования педагогических тестов — M.: Логос, 2002. — 432 c.
ISBN 5-94010-143-7
Скачать (прямая ссылка): teoripraktika2002.djvu
Предыдущая << 1 .. 92 93 94 95 96 97 < 98 > 99 100 101 102 103 104 .. 154 >> Следующая

Для рассматриваемого примера поданным табл. 5.12
V= ((0,4055)2 + (-1,3863)2 + (-2,1972)2 + (2,1972)2 + (-0,4055)2 + + (-0,4055)2+ О2 + (-0,4055)2+ (2,1972)2+ (0,4055)2- 10(0,0405)2)/9 = -1,9123.
273
GUNPOWDER
По данным табл. 5.13
U= ((-2,1972)2 + (-1,3863)2 + (-0,8473)2 + (-0,4055)2 + О2 + О2 + + (0,4055)2+ (0,8473)2+ (1,3863)2 + (2,1972)2- 100)/9 = 1,6959;
X =
1 + 1,6959/2,89
1-(1,6959-1,9123/8,35)
= 1,6108;
Y =
1 + 1,9123/2,89
= 1,6483.
1-(1,6959-1,9123)/8,35 Тогда для рассматриваемого примера
6, =0,000 + 1,61086? , /= 1, 2,N; =0,0405+1,6483$ ,у= 1,2, ...,и.
Логит уровня подготовки 1-го испытуемого в стандартной шкале будет B1 = 1,6108 • 0,4055 = 0,6531 логита.
Оценки уровня подготовки группы испытуемых для данных рассматриваемого примера матрицы (см. табл. 5.3) помещены в табл. 5.15.
Оценка трудности 1-го задания в стандартной шкале ?. = 0,0405 + 1,6483(-2,1972) = -3,5811 логита.
Таблица 5.15. Стандартные оценки уровня подготовки испытуемых
• I Вектор уровня подготовки испытуемых 6, (в логитах)
1 0,6531
2 -2,2329
3 -3,5392
4 3,5392
5 -0,6531
6 -0,6531
7 0
8 -0,6531
9 3,5392
10 0,6531
Стандартные оценки параметра трудности заданий для рассматриваемого примера матрицы приводятся в табл. 5.16.
Обращает на себя внимание тот факт, что рассматриваемый тест первоначально казался на редкость удачно сбалансированным по трудности, поскольку
п
7=1
Как раз к этому эффекту обычно и стремятся разработчики нор-
274
GUNPOWDER
мативно-ориентированных тестов. Однако после перехода в интервальную шкалу логитов это соотношение изменилось, и
Таблица 5.16. Стандартные оценки трудности заданий теста
п
? ?y =0,405*0.
Таким образом, в тесте наблюдается избыточное количество трудных заданий, так как
I?, >о-
у=1
* Вектор уровня трудности
J заданий ?y, логитов
1 -3,5811
2 -2,2445
3 -1,3561
4 -0,6279
5 0,0405
6 0,0405
7 0,7089
8 1,4371
9 2,3255
10 3,6621
Седьмой этап. На седьмом этапе оценивается стандартная
ошибка измерения Se(Qt), которая вычисляется для каждого значения 6.(/= 1,2,N):
X
X
X
Jp1(It-X1) JnP1(I-P1) ^пра '
(5.34)
Например, для 1-го испытуемого с уровнем подготовки 6,= = 0,6531
S, (6,) = . 1,6108 = 1,0398.
е 1 V0.600-6)
Результаты подсчета ошибок измерения 6,. (/= 1, 2,для рассматриваемого примера приведены в табл. 5.17.
Восьмой этап. На восьмом этапе оценивается стандартная ошибка измерения 5„(?,.), которая вычисляется для каждого значения ?.:
" J J
JPj(N-Rj) jNpj(l-pj) jNpjqj '
(5.35)
Для 1-го задания
1,6483
л/0,9(Ю-9)
= 1,7375
275
GUNPOWDER
Таблица 5.17. Ошибки измерения параметра O1-
• I Вектор уровня подготовки испытуемых 6,- (в логитах) Стандартная ошибка оценки уровня подготовки
3 -3,5392 1,6979
2 -2,2329 1,2734
5 -0,6531 1,0398
6 -0,6531 1,0398
8 -0,6531 1,0398
7 0 1,0188
1 0,6531 1,0398
10 0,6531 1,0398
9 3,5392 1,6979
4 3,5392 1,6979
Для 10 заданий рассматриваемого примера матрицы стандартные ошибки оценок трудности заданий приводятся в табл. 5.18.
Анализ значений ошибок в табл. 5.17 и 5.18 указывает на нарастание ошибочного компонента в оценках параметров 9 и ? к концам распределения.
Хотелось бы напомнить еще раз о важном преимуществе полученных оценок параметров 9 и ?. Благодаря особенностям математического аппарата IRT проведенные расчеты обеспечивают объективные оценки уровня подготовки каждого испытуемого, не зависящие от трудности заданий теста. Отмеченное свойство инвариантности позволяет провести корректное сравнение результатов испытуемых, выполнивших различные по трудности задания теста и даже разные тесты.
Аналогичное преимущество существует в IRT и для оценок трудности заданий теста. Получаемые по алгоритмам значения параметра ? инвариантны относительно уровня подготовки испытуемых в тестируемой группе.
Построение характеристических кривых заданий теста для одно-параметрической модели. После подсчета значений параметров 9 и ? в шкале логитов приступают к построению характеристических кривых заданий теста. Анализ их взаимного расположения позволяет наметить пути дальнейшего совершенствования теста и сформировать систему заданий, наиболее эффективных для оценки уровня подготовки каждого испытуемого выборки.
276
GUNPOWDER
Таблица 5.18. Стандартные ошибки оценок параметра трудности заданий
• J Вектор уровня трудности заданий ?, (в логитах) Стандартная ошибка оценки трудности заданий
1 -3,5811 1,7375
2 -2,2445 1,3031
3 -1,3561 1,1375
4 -0,6279 1,0640
5 0,0405 1,0425
6 0,0405 1,0425
8 0,7089 1,0640
7 1,4371 1,1375
9 2,3255 1,3031
10 3,6621 1,7375
Процесс совершенствования теста начинается с удаления лишних заданий, нарушающих нормальный характер распределения значений ?. Далее разработчику необходимо обратить внимание на случаи наложения характеристических кривых и избавиться от лишних заданий, которые ничего не дают для теста как совокупности работающих заданий возрастающей трудности.
Следующий важный шаг при коррекции теста связан с выделением «пустых» интервалов оси 8, где нет характеристических кривых. В тест необходимо добавить задания, соответствующие по трудности выделенным интервалам на оси латентной переменной Є. В идеале характеристические кривые должны заполнять более или менее равномерно практически весь интервал (—5; +5) шкалы логитов. Причем заданий средней трудности должно быть намного больше, чем на краях распределения. Заполнение всех «пустых» интервалов может привести к неоправданному увеличению длины теста, что в конечном счете сделает тестирование неэффективным и приведет к ухудшению, а не к улучшению теста. Поэтому решение о добавлении недостающих заданий, равно как и об устранении лишних, пока не является окончательным. Его можно рассматривать лишь как предварительный этап в создании теста, разумный после первоначального сбора эмпирических данных, когда число заданий в тесте намного превышает планируемое и рассчитано именно на такую предварительную работу.
Предыдущая << 1 .. 92 93 94 95 96 97 < 98 > 99 100 101 102 103 104 .. 154 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed