Научная литература
booksshare.net -> Добавить материал -> Педагогика -> Челышкова М.Б. -> "Теория и практика конструирования педагогических тестов" -> 108

Теория и практика конструирования педагогических тестов - Челышкова М.Б.

Челышкова М.Б. Теория и практика конструирования педагогических тестов — M.: Логос, 2002. — 432 c.
ISBN 5-94010-143-7
Скачать (прямая ссылка): teoripraktika2002.djvu
Предыдущая << 1 .. 102 103 104 105 106 107 < 108 > 109 110 111 112 113 114 .. 154 >> Следующая

Конечно, дискриминативность не единственный показатель качества тестовых заданий в нормативно-ориентированных тестах. В целом дифференцирующий эффект зависит от многих составляющих: корреляции между заданиями, числа заданий и от других характеристик, среди которых все же наиболее важное место отводится показателю дискриминативности каждого задания теста.
Для оценки дискриминативности задания применяются различные формулы. Наиболее простым является расчет по формуле
(rm:)j=(l\)j-(Po)j> (5.61)
где (гпиг). — индекс дискриминативности для у-го задания теста; {P[)j — доля учеников, правильно выполнившиху-е задание в подгруппе из 27% лучших учеников по результатам выполнения теста; (Pq)j — доля учеников, правильно выполнивших у-е задание в подгруппе из 27% худших учеников по результатам выполнения теста.
Значения индекса гдис для заданий теста обычно представляют собой десятичную дробь, принадлежащую интервалу [-1 ;11. Максимального значения 1,00 индекс г п достигнет в том случае, когда все ученики из подгруппы лучших верно выполняту-е задание теста, а из подгруппы худших это задание не выполнит верно ни один ученик. В этом случае задание будет обладать максимальным дифференцирующим эффектом.
Нулевого значения индекса а* достигнет в том случае, когда в
J-I Fl
обеих подгруппах будут равны доли учеников, правильно выполнивших у-е задание теста.
И наконец минимальное значение г = -1 будет в ситуации, когда данное задание теста все сильные ученики сделали неверно, а все слабые — верно. Естественно, что задания второго и третьего типа с г = 0 или г < 0 из теста следует удалить.
Значения гдис для 42 заданий теста, полученные на выборке из 100 испытуемых, приведены в табл. 5.25.
По результатам анализа данных правого столбца ясно, что задания 6,8,15,17,31,35 и 37 должны быть удалены из теста. Оценки г для заданий 4, 20 и 29 очень близки к критическому значению
308
GUNPOWDER
Таблица 5.25. Значения г1ИС для теста из 42 заданий
Номер задания Все Группа Индекс
слабая сильная
1 67,0 48,0 87,0 0,39
2 72,0 48,0 94,0 0,45
3 75,0 55,0 90,0 0,35
4 25,0 16,0 32,0 0,16
5 21,0 6,5 32,0 0,26
6 94,0 90,0 97,0 0,065
7 82,0 74,0 94,0 0,19
8 27,0 26,0 29,0 0,032
9 73,0 58,0 94,0 0,35
10 66,0 55,0 87,0 0,32
11 64,0 42,0 97,0 0,55
12 61,0 45,0 74,0 0,29
13 34,0 9,7 42,0 0,32
14 38,0 16,0 71,0 0,55
15 59,0 68,0 58,0 -0,097
16 85,0 65,0 97,0 0,32
17 61,0 71,0 61,0 -0,097
18 48,0 42,0 68,0 0,26
19 88,0 71,0 94,0 0,23
20 27,0 16,0 29,0 0,13
21 51,0 26,0 65,0 0,39
22 35,0 16,0 42,0 0,26
23 62,0 29,0 87,0 0,58
24 20,0 9,7 39,0 0,29
25 41,0 23,0 42,0 0,19
26 40,0 23,0 65,0 0,42
27 79,0 55,0 100,0 0,45
28 37,0 6,5 61,0 0,55
29 22,0 13,0 29,0 0,16
30 70,0 29,0 94,0 0,65
31 26,0 32,0 19,0 -0,13
32 42,0 19,0 71,0 0,52
309
gunpowder
Окончание табл. 5.25
Номер задания Все Группа Индекс
слабая сильная
33 65,0 26,0 90,0 0,65
34 30,0 13,0 42,0 0,29
35 11,0 16,0 0,0 -0,16
36 70,0 42,0 94,0 0,52
37 12,0 9,7 16,0 0,065
38 33,0 16,0 52,0 0,35
39 73,0 42,0 90,0 0,48
40 46,0 29,0 58,0 0,29
41 40,0 32,0 58,0 0,26
42 51,0 29,0 74,0 0,45
(близки к нулю). Поэтому для заданий последней группы необходим тщательный анализ содержания. Правда, возможно, что виновато не содержание, а полученные низкие значения отражают случайный характер ответов учащихся или появление при изучении проверяемого материала в тесте каких-либо проблем, наличествовавших ранее.
Более точное представление о дискриминативной способности задания можно составить, подсчитав коэффициент (rpbis) бисериальной корреляции, процесс вычисления значений которого подробно рассмотрен в разд. 5.2. Помимо приведенной в разд. 5.2 формулы для rpbisможно использовать другие, дающие близкие значения:
(Xx)j-X р.
=^V^^ (5-63)
(rpbis )j g
где (fpbis)y — коэффициент точечно-бисериальной корреляции для у-го задания; (X{)j —среднее значение индивидуальных баллов учеников, выполнивших верноу-е задание; (X0) j — среднее значение индивидуальных баллов учеников, выполнивших у-е задание не-
310
GUNPOWDER
верно; X — среднее значение баллов по всей выборке учеников; SY — стандартное отклонение по множеству индивидуальных бал-

лов.
Логика рассуждения при оценке результатов, полученных по формулам (5.62) или (5.63), остается та же, что раньше: чем выше корреляция, тем лучше задание теста. Задания с близкими к нулю и отрицательными значениями /*pbis должны быть удалены из теста. Однако в реальной ситуации создания теста встречаются случаи, когда задание кажется разработчику крайне удачным по содержанию, однако наряду с этим имеет близкую к нулю корреляцию с суммой баллов по тесту. В этой связи возникает вопрос о выборе критического числа, ниже которого не могут спускаться значения г.. при отборе заданий теста. По мнению многих специалистов
(L. Crocker, J. Algina, P. Kline и др.) [11,41 и др.], в качестве такого критического числа следует выбрать 0,2, и потому все задания со значением rpbis <0,2 должны быть удалены из теста.
Вместо rpbis можно использовать rbis, который труднее вычислять для тех желанных по заданиям теста. Правда, в силу того, что значения rbis несколько выше значений rpbls по одному и тому же заданию, критическим числом для rbis следует считать 0,3. Таким образом, все задания со значением rbis < 0,3 должны быть удалены из теста.
Предыдущая << 1 .. 102 103 104 105 106 107 < 108 > 109 110 111 112 113 114 .. 154 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed