Научная литература
booksshare.net -> Добавить материал -> Педагогика -> Челышкова М.Б. -> "Теория и практика конструирования педагогических тестов" -> 147

Теория и практика конструирования педагогических тестов - Челышкова М.Б.

Челышкова М.Б. Теория и практика конструирования педагогических тестов — M.: Логос, 2002. — 432 c.
ISBN 5-94010-143-7
Скачать (прямая ссылка): teoripraktika2002.djvu
Предыдущая << 1 .. 141 142 143 144 145 146 < 147 > 148 149 150 151 152 153 .. 154 >> Следующая

Стандартные ошибки измерения преобразуются по формулам
SE(O1J = YSE(O); SE(P1J = YSE(P),
где SE(P1) и SE(O2) — новые стандартные ошибки измерения.
Для выполнения преобразования необходимо выбрать константы а и у, вернее, именно константу у, так как а может быть выбрана множеством способов. Процесс выбора приемлемых значений для Yоснован на анализе перехода наименьшей наблюдаемой разницы сырых баллов (LOD) в наименьшую разницу (LMD) оценок
414
GUNPOWDER
параметра в в шкале логитов. В рамках другого подхода оценка шкалирующего множителя у основана на анализе значений стандартной ошибки измерения 6.
Вне зависимости от подхода все исследователи связывают значение ус длиной теста. Как правило, у выбирают на основании одного из трех неравенств
п у[іг yfn
Y,>?,Y2>^ илиУз>-.
В качестве обобщения различных подходов к выбору шкалирующего множителя у предлагается табл. 7.8, где сообразно трем неравенствам, приведенным выше, даются возможные минимальные значения у,, у2 и у3.
Таблица 7.8. Минимальные значения множителя у
Длина теста п Уі У2 Уз
30 5 2 2
120 10 3 2
150 20 4 3
300 50 7 5
600 100 10 7
Анализ табл. 7.8 показывает, что выбор шкалирующего множителя целиком зависит от длины теста. В практике деятельности тестовых служб обычно останавливаются на значениях у=10, так как редко применяются тесты, включающие менее 30 заданий. При фиксированной длине теста значение множителя будет зависеть целиком от желания пользователя добиться определенного уровня дифференциации тестовых баллов испытуемых. При этом необходимо помнить о том, что уменьшение размаха шкалы огрубляет оценки, а увеличение — повышает ошибочный компонент. При у= 10 стандартная ошибка измерения увеличится в 10 раз, а при у = 100 — в 100. В целом же и то и другое ухудшает качество сырых оценок. Поэтому при выборе у недопустимо как неоправданное занижение, так и излишнее завышение у.
Конечно, оценки латентных параметров в логитах можно подвергать и нелинейным преобразованиям, однако линейное преобразование предпочтительнее, так как оно сохраняет интервальный характер шкалы. Среди линейных наиболее распространенным
415
GUNPOWDER
является преобразование при а = 50, у= 4,55, предложенное Чопи-ном (Chopin). В этом случае
6,=50 + 4,550; ?,=50 + 4,55?; SE(O1) = 4,55SE(6); SE(?,) = 4,55SE(?).
В результате линейного преобразования с а = 50 и у= 4,55 получают положительные значения 0 и ?, расположенные в интервале (30, 70), которые затем округляют до целых. Новые значения латентных параметров 6 и ? представлены в так называемой шкале W, или Wits [5]. Выбор значений а и у обусловлен соображениями удобства, поскольку при увеличении значения |6 — ?| на 5 единиц по сравнению со значением 0 — ? = 0 вероятность правильного выполнения задания возрастет или уменьшится в 3 раза.
Другое линейное преобразование связано с именем Вудкока (Woodcock). В определенной им шкале для Woodcock—Johnson Psycho-Educational Battery
O1 = 201 og9e0 + 500, т.е. a = 500, у = 20 log9e = 9,1.
Уровень трудности заданий пересчитывается по формуле
?1 = 9,l? + 500.
В шкале Вудкока значениям разности 0 — ?=20,10,0, —10,20 соответствуют вероятности правильных ответов 0,90; 0,75; 0,50; 0,25; 0,10.
К разряду линейных относится преобразование Райта (Wright) [59] при a = 100, у= 9,1, когда
0,=9,10 + 100; ?,=9,l?+ 100.
Подводя итог сказанному, можно отметить, что при переходе от сырых показателей к производным используются шкалирующие модели двух классов. В рамках первого строятся шкалы, основанные на оценке различий между сырыми баллами и нормативными показателями, определенными в процессе стандартизации теста. При этом предполагается, что есть некоторая связь между уровнем подготовки испытуемого и алгебраической суммой баллов, полученной им в ре-
416
GUNPO
зультате выполнения теста. Этот класс моделей применяется в рамках классической теории тестов и позволяет реализовать, как правило, порядковую, а в лучшем случае квазиинтервальную шкалу.
Второй класс моделей имеет дело с зависимостями между сырыми баллами и производными показателями, получаемыми как для заданий, так и для испытуемых в одной и той же шкале. Сопоставление таких, казалось бы, несравнимых величин проводится в шкале логитов переменной, обеспечивающей общую единицу измерения для уровня знаний испытуемых и трудности заданий теста. Шкала латентных переменных подвергается одному из линейных преобразований для сообщения результатов испытуемым, выполнявшим тест. Параметры преобразования выбираются из соображений удобства, однако так, чтобы не потерять никакой полезной информации, полученной в процессе применения теста.
Выводы
1. Шкалирование тестовых баллов предназначено для выявления истинных различий в уровне подготовки испытуемых при интерпретации результатов выполнения теста.
2. Адекватность интерпретации достигается путем сопоставления индивидуальных результатов с нормами выполнения теста.
3. Профессионально разработанные нормативно-ориентированные тесты проходят обязательный процесс стандартизации, суть которого заключается в определении норм теста.
Предыдущая << 1 .. 141 142 143 144 145 146 < 147 > 148 149 150 151 152 153 .. 154 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed