Внутренняя согласованность (консистенция, консистентность) — характеристика теста, указывающая на степень однородности состава заданий с т.з. измеряемого качества.
Критерий В. с. является существенным элементом валидности конструктной теста, характеризуя, в какой мере задания направлены на измерения данного психологического явления, а также меру вклада каждого пункта (задания) в количественную оценку всей методики. Максимальная валидность теста достигается за счет отбора таких заданий, которые, обладая значительной корреляцией с результатом теста, в то же время минимально коррелируют между собой (при неоправданно высокой корреляции отдельных заданий тест будет перегружен лишними практически однозначными заданиями). Отбор заданий по критерию В. с. обеспечивает наибольшую прагматическую эффективность теста, допуская объединение в методике пунктов, максимально связанных с изучаемым показателем.
На практике В. с. определяется корреляцией между результатами каждого отдельного задания и теста в целом. Для этого используется метод корреляции бисериальной между исходами каждого задания («справился—не справился», ответ на пункт опросника в виде утверждения или отрицания и т.д.) с суммарной оценкой всех пунктов теста. Более сложной процедурой определения В. с. является анализ частных корреляций между общим результатом и отдельными заданиями, предусматривающий построение уравнения множественной регрессии. В таком уравнении каждый пункт получает весовой коэффициент, количественно выражающий его вклад в общий результат, несводимый к вкладу других пунктов. Достоинство метода в том, что весовой коэффициент впоследствии может использоваться как «ключ» для данного пункта. Это существенно повышает достоверность результатов, особенно при использовании опросников личностных. При такой дифференцированной оценке каждый ответ получает не +1 или 0 баллов, а вносит конкретный вклад в сумму тестовых оценок.
При анализе В. с. иногда применяется метод контрастных групп, сформированных из испытуемых, показавших самые высокие и самые низкие суммарные результаты. Выполнение каждого пункта группой лиц с высокими результатами по тесту в целом сравнивается с его выполнением группой с низкими результатами, и те задания, с которыми первая справляется незначительно лучше, чем вторая, признаются невалидными и либо отбрасываются, либо пересматриваются.
Критерий В. с. имеет также отношение к корреляционной связи между результатами отдельных субтестов комплексной тестовой методики и их интегративным результатом. Многие тесты интеллекта, напр., состоят из раздельно применяемых субтестов (таких, как словарный, арифметический, общей осведомленности и др.). При построении таких методик определяется степень связи субтестов с общим показателем, и плохо коррелирующие с тестом субтесты отбрасываются. Коэффициенты корреляции оставшихся субтестов свидетельствуют о В. с. тестовой батареи, мере вклада отдельных компонентов в обобщенный показатель.
Анализ В. с. элементов методики служит не только практическим целям повышения однородности заданий теста, но может в значительной мере способствовать углублению представлений о содержательно-теоретическом статусе измеряемого конструкта. На основании содержательного анализа пунктов, отобранных по этому критерию (напр., отдельных субтестов методики исследования общих способностей), появляется возможность уточнить понимание измеряемого комплексного свойства, в данном случае — область свойств интеллекта, измеряемых данным тестом.
Процедура определения критерия В. с. близка характеристике дискриминативности заданий теста, однако эти показатели различаются по своей направленности. Если критерий В. с. ориентирован на оценку теста в целом, своеобразную «внутреннюю» валидность заданий с т.з. отражения измеряемого свойства, то индексы дискриминативности отражают диагностическую силу (удельный вес в общем результате теста) лишь отдельных пунктов. Таким образом, определение дискриминативности отдельных заданий является подготовительной процедурой для анализа В. с. целого теста.
Похожие материалы в разделе Словари:
- Усвоение
- Психофизическая модель теории обнаружения сигнала
- Внушаемость тест
- Кризис
- Семейных отношений тест
- Валидность иллюзорная
- Плетизмография
- Тест Тьюринга
- Валидность дифференциальная
- Внимания нарушения