7.1. Общие сведения о системе сертификации педагогических тестов
Источники повышения валидности теста:
• подбор оптимальной трудности заданий для обеспечения нормального закона распределения баллов по тесту;
• экспертиза качества содержания теста;
• расчет оптимального времени выполнения теста;
• подбор валидных заданий с высокой дискриминативностью.
Система добровольной сертификации (далее – Система) педагогических тестовых материалов (ПТМ) была создана на базе Исследовательского центра проблем качества подготовки специалистов Московского института стали и сплавов (технологического университета) приказом Министерства образования Российской Федерации от 17.04.2000 г. № 1122 «О сертификации качества педагогических тестовых материалов». Система получила регистрационный номер в реестре органов по сертификации Федерального агентства по техническому регулированию и метрологии (регистрационный № РОСС RU.B154.04TM00). Система сертификации функционирует с 2000 г.
Цель сертификации – повышение качества образования путем совершенствования ПТМ, применяемых для оценки знаний обучающихся методом тестирования в учебных заведениях Российской Федерации и других структурах системы образования. При этом решаются две задачи: первая – выявление и фиксация достигнутого уровня качества сертифицируемых ПТМ, вторая – разработка рекомендаций, определяющих методику совершенствования ПТМ.
Сертификация осуществляется специально созданным Центром сертификации качества педагогических тестовых материалов (далее – Центр сертификации), который также оказывает консультационные услуги по доведению характеристик ПТМ до уровня соответствия утвержденным требованиям к их качеству (Требования к качеству ПТМ). Требования к качеству ПТМ составляют нормативную базу Системы. Объективность и достоверность результатов сертификации обеспечивается участием в работах по сертификации ПТМ компетентных экспертов, рекомендованных учебно-методическими объединениями вузов, использованием научно обоснованных методик экспертизы качества ПТМ и профессиональных статистических пакетов для компьютерной обработки данных.
Система добровольной сертификации распространяется на все виды ПТМ, используемые для оценки знаний обучающихся во всех типах учебных заведений и других образовательных структурах Российской Федерации. Система добровольной сертификации распространяется на все виды ПТМ, используемые для оценки знаний обучающихся во всех типах учебных заведений и других образовательных структурах Российской Федерации. Согласно Правилам функционирования Системы объектами сертификации являются:
• совокупности тестовых заданий, объединенные в варианты тестов и используемые для оценки знаний обучающихся;
• компьютеризованные банки тестовых заданий;
• совокупности тестовых методик, объединенные в технологии;
• программно-инструментальные средства для генерации и предъявления традиционных и адаптивных тестов;
• программные средства для математико-статистической обработки данных тестирования;
• сопроводительные материалы, включающие спецификацию теста для бланковой или компьютерной формы представления, описание метода генерации варианта традиционного или адаптивного теста из банка данных, описание системы оценивания, включающее ключи правильных ответов, критерии или нормы оценивания, шкалы, описание процедур предъявления теста, проверки результатов тестирования и сообщения результатов испытуемым, а также другая продукция, относящаяся к категории педагогических тестовых материалов.
Центр сертификации вносит информацию в созданный в рамках Системы Федеральный реестр сертифицированных ПТМ с целью оказания посреднических услуг и предоставления заинтересованным лицам соответствующей информации о возможностях приобретения ПТМ у их авторов. Благодаря этому широкий круг заинтересованных учебных заведений имеет возможность приобрести сертифицированные ПТМ, обеспечивающие высокое качество результатов педагогических измерений.
Федеральный реестр сертифицированных ПТМ представляет собой специализированную базу данных, содержащую наиболее общую информацию о сертифицированных ПТМ (наименование дисциплины, специальность или направление подготовки, вид объекта сертификации, его предназначение и др.). Сведения о сертифицированных ПТМ вносятся в Федеральный реестр по желанию авторов ПТМ. Дополнительные сведения о сертифицированных ПТМ и контактная информацию об авторах ПТМ предоставляется Центром сертификации на платной основе по согласованию с авторами ПТМ. Соблюдение авторских прав является обязательным условием деятельности Центра сертификации.
7.2. Требования к качеству педагогических тестов
Требования к качеству ПТМ прошли длительный период обсуждения, в котором приняли участие представители различных учебных заведений и управленческих структур в сфере образования. Основное назначение требований к качеству ПТМ состоит в обеспечении информации о критериях качества тестовых материалов для разработчиков и пользователей ПТМ. Разработка требований к качеству ПТМ и их систематическое обновление является обязательной составляющей деятельности Системы.
По структуре требования к качеству ПТМ состоят из набора регламентированных характеристик, правил, методики критериев, которые ориентированы на различные виды ПТМ. Часть требований к качеству ПТМ носит описательный характер, другая выражается в виде количественных характеристик – критериев качества.
Выполнение всех требований к качеству ПТМ является обязательным, если ПТМ используются при аттестации выпускников и учебных заведений. При сертификации ПТМ для текущего контроля часть требований носит необязательный характер либо не выдвигается совсем. Таким образом, в зависимости от планируемой области применения определяется класс требований, на соответствие которым проверяются разработанные ПТМ. С повышением уровня ответственности при принятии управленческих решений на основе результатов использования ПТМ повышается жесткость требований к качеству, предъявляемых к представленным материалам, а также дополняется список информации, необходимой для проведения работ по сертификации.
При сертификации ПТМ используются требования к содержанию тестов, критерии качества содержания гомогенных тестов, критерии качества содержания гетерогенных тестов, требования к формам заданий тестов, требования к статистическим характеристикам заданий и тестов, требования к характеристикам заданий компьютеризованного банка ПТМ, требования к структуре банка и технологии компьютерной генерации вариантов ПТМ, требования к сопроводительным материалам ПТМ.
7.3. Требования к содержанию аттестационных тестов
1. Содержание теста должно полностью соответствовать цели создания. Выполнение требования предполагает ясную формулировку цели и подробное описание проверяемых содержательных элементов, знаний, умений и так далее в спецификации теста.
2. Отображение требований ФГОС в содержании теста должно быть по возможности полным. В содержании теста, предназначенного для целей аттестации, необходимо отобразить объем требований ФГОС, который условно можно принять за 100%.
3. Содержание теста должно обладать правильными пропорциями . Оно должно охватывать все важные аспекты предметной области в правильном соотношении, соответствующем используемым учебным программам или другим документам, определяющим структуру и пропорции содержания учебной дисциплины.
4. Содержание теста должно соответствовать спецификации. Не следует перенасыщать содержание теста теми разделами, по которым легче составить задания.
5. Содержание разделов гомогенного теста должно удовлетворять требованию однородности, что означает наличие только положительных значимых корреляций между результатами по заданиям внутри раздела. Содержание заданий каждого раздела теста должно обладать дисциплинарной общностью, которая устанавливается путем анализа корреляционной матрицы, полученной подсчетом интеркорреляций между результатами испытуемых по отдельным заданиям теста.
6. Содержание каждого задания теста должно удовлетворять требованию значимости. Необходимо включать в тест только те элементы содержания, которые являются наиболее важными, ключевыми элементами курса.
7. Содержание каждого задания теста должно быть логически корректным. Корректность означает, что при правильном выполнении задания испытуемые приводят или выбирают только запланированные разработчиком ответы.
8. Каждое задание тестов должно обладать высокой содержательной валидностью. Коэффициент точечной бисериальной корреляции между результатами репрезентативной выборки испытуемых по каждому заданию и суммой баллов по тесту должен быть не меньше 0,3.
9. В гетерогенном полидисциплинарном тесте содержание каждого гомогенного субтеста должно удовлетворять требованиям к качеству гомогенного теста.
10. Каждый субтест полидисциплинарного теста должен обладать содержательной независимостью от остальных субтестов гетерогенного теста. Результат по каждому гомогенному субтесту должен быть снабжен содержательно-независимой интерпретацией, которая в совокупности с другими соответствует общей цели создания полидисциплинарного теста.
11. Качество содержания и размерность пространства измерений междисциплинарного гетерогенного теста, состоящего из междисциплинарных заданий, необходимо обосновывать путем применения методов многофакторного анализа. Для этого из матрицы интеркорреляций между заданиями должны быть выделены независимые факторы, а в каждом факторе со значимыми нагрузками выделяются непересекающиеся подмножества заданий междисциплинарных тестов.
Общие требования к форме представления тестовых заданий во всех видах тестов представлены ранее (см. Основные подходы к разработке измерителей).
7.4. Требования к статистическим характеристикам теста
Итоговые тесты, используемые для целей аттестации, обязательно должны проходить процедуру статистического обоснования качества. При представлении результатов обоснования на сертификацию необходимо указать теоретическую базу (классическую теорию или IRT), использованную разработчиком для статистического обоснования качества теста.
1. Статистические данные о результатах выполнения задания должны включать: распределение ответов испытуемых (в процентах) по выделенным кодам и/или баллам; процент испытуемых, не приступавших к выполнению задания; значения точечно-бисериального коэффициента по каждому коду или баллу, включая группы не приступавших к выполнению задания, выполнивших задание неправильно, выполнивших задание частично и полностью выполнивших задание правильно.
2. Тестовое задание с выбором ответов должно сопровождаться оценками качества работы дистракторов, которые необходимо получать в долях испытуемых, выбравших каждый дистрактор, и в виде бисериального коэффициента корреляции. Дистрактор считается работающим, если доля испытуемых отлична от нуля, а бисериальный коэффициент принимает отрицательное значение и значимо отличается от нуля.
3. Тестовое задание должно иметь статистическую оценку трудности в долях правильных ответов испытуемых, в процентах правильных ответов или в шкале логитов, если использовалась современная теория конструирования тестов.
4. Тестовое задание должно иметь оценку валидности, полученную с помощью индекса дискриминативности, точечного бисериального коэффициента или параметра дифференцирующей способности.
5. Распределение статистик по каждому варианту теста должно удовлетворять критериям правдоподобности при проверке гипотезы о нормальном распределении эмпирических результатов (для нормативно-ориентированных тестов).
6. Распределение индивидуальных (сырых) баллов должно иметь правостороннюю асимметрию (для критериально-ориентированных тестов).
7. Для комплекта вариантов теста необходимы нормы, включающие среднее значение сырых баллов, дисперсию с указанием временного промежутка действия норм. Среднее значение должно быть в центре распределения индивидуальных баллов, дисперсия должна значимо отличаться от нуля без нарушения нормальности распределения.
8. Для комплекта вариантов теста необходимо указать надежность с указанием метода оценки; надежность не должна быть менее 0,8.
9. Для комплекта вариантов теста необходимо указать результаты экспертного оценивания содержательной валидности теста.
10. Для аттестационных тестов требуется обоснование параллельности вариантов с указанием необходимых для обоснования статистик. При использовании якорных тестов для компоновки вариантов приводится процедура выравнивания вариантов.
11. Для полидисциплинарных тестов, состоящих из отдельных гомогенных субтестов, необходимо выбрать и обосновать основания для определения относительных весов при суммировании баллов испытуемых по отдельным субтестам в процедуре подсчета итогового балла.
12. Для гетерогенных междисциплинарных тестов, состоящих из комплексных междисциплинарных заданий, необходимо определить и обосновать основания выбора шкал: описание использованных методов многомерного шкалирования и результаты факторного анализа.
13. Число заданий любого варианта теста не должно быть менее 25.
7.5. Требования к характеристикам тестовых заданий компьютеризованного банка
1. Каждое задание банка должно иметь индивидуальный номер и храниться в форме, позволяющей управляющей программе извлекать его из банка для компьютерной сборки теста или тематической распечатки.
2. Каждое задание банка должно иметь код тематической принадлежности и код контролируемого элемента содержания.
3. Каждое задание банка должно быть отнесено к определенному уровню сложности и иметь статистически полученную устойчивую оценку параметра трудности.
4. Для каждого задания банка указывается время его выполнения, полученное статистическим путем.
5. В качестве необходимой характеристики задания в банке должен присутствовать эталон правильного ответа и критерии оценивания выполнения задания.
6. В банке должен быть предусмотрен индикатор отнесенности задания к недействующим.
7. При наличии в банке заданий с идентичной логико-тематической структурой их необходимо маркировать так, чтобы при сборке варианта исключить попадание родственных заданий в один вариант.
8. При использовании заданий с числовыми или символьными переменными (фасетные задания) каждое значение из массива должно маркироваться как отдельное, так как подстановка разных значений изменяет трудность задания.
9. Тематическая структура банка должна соответствовать нормативным документам по каждой учебной дисциплине.
10. В банке для каждого задания должно быть выделено не менее двух уровней содержательной маркировки. Один из них указывает на тематическую принадлежность, а другой фиксирует проверяемые знания или умения (уровень деятельности).
11. Технология сборки теста должна предусматривать возможность генерации вариантов как в ручном, так и в автоматическом режиме по заданной спецификации теста. В технологии должна быть предусмотрена возможность корректировки теста после компьютерной сборки.
12. В технологии генерации вариантов теста необходимо учитывать содержательную принадлежность заданий и статистические оценки параметров заданий, позволяющие осуществить определенную композицию вариантов теста.
13. В рамках технологии генерации вариантов теста необходимо предусмотреть опцию варьирования – автоматической перестановки ответов (с обязательным перемещением правильного ответа) для заданий закрытого типа.
14. После сборки вариантов теста должен формироваться сопроводительный лист, в котором указываются технологические характеристики вариантов, последовательность расположения заданий в варианте и другие характеристики.
7.6. Порядок сертификации тестов
Процедура сертификации ПТМ состоит из трех этапов. На первом, подготовительном этапе, заказчик (разработчик ПТМ) и Центр сертификации согласовывают все условия, необходимые для проведения работ по сертификации. Данный этап начинается с заполнения и высылки в адрес Исследовательского центра заявки на сертификацию и информационной карты сертифицируемых ПТМ. В рамках предварительного этапа производится согласование объема и стоимости работ, а также дополнительных условий. Первый этап завершается подписанием договора на проведение работ по сертификации, предоставлением заказчиком необходимых материалов для сертификации и оплатой работ по сертификации.
Второй этап включает в себя работу экспертной комиссии и подготовку заключения по результатам экспертизы. По результатам экспертизы качества ПТМ Центр сертификации выносит решение о выдаче сертификата качества ПТМ либо о выдаче свидетельства о несоответствии ПТМ требованиям к качеству ПТМ. По согласованию с заказчиком в рамках дополнительного соглашения могут быть подготовлены содержательные рекомендации по доведению характеристик ПТМ на необходимый уровень.
Третий этап является заключительным, на котором Центр сертификации качества ПТМ выдает сертификат качества ПТМ или свидетельство о несоответствии ПТМ требованиям к качеству ПТМ. В случае положительного решения по согласованию с заказчиком информация о сертифицированных ПТМ вносится в Федеральный реестр сертифицированных ПТМ.
Формы документов:
• заявка на сертификацию;
• информационные карты сертифицируемых ПТМ;
• педагогические тесты;
• компьютеризованные банки тестовых заданий;
• типовая форма договора на проведение работ по сертификации.