Психометрическая проверка.pptx
- Количество слайдов: 18
Психометрическая проверка Кружкова О. В.
Дискриминативность - способность отдельных заданий теста и теста в целом дифференцировать обследуемых относительно «максимального» и «минимального» результата теста. Основной показатель коэффициента дискриминативности σ Фергюсона – это отношение между показателем дискриминативности, полученным для некоторого теста, и максимальным значением дискриминативности, которое может обеспечить такой тест. где: N – количество испытуемых, n – количество заданий (число пунктов шкалы опросника * число градаций ответа), fі – частота встречаемости каждого показателя (балла по шкале). σ =0, когда все испытуемые получили одинаковые показатели (то есть когда нет дискриминативности), и равно 1 при равномерном (прямоугольном) распределении.
Надежность – характеристика методики, отражающая точность психодиагностических измерений, а также устойчивость результатов теста к действию посторонних случайных факторов; , т. е. это согласованность теста внутренняя и по прошествии времени. В самом широком смысле надежность теста показывает, в какой степени индивидуальные различия в тестовых результатах оказываются «истинными» , а в какой могут быть приписаны случайным ошибкам. Требования к выборке испытуемых для исследования надежности: репрезентативность выборки, объем - не менее 200 человек.
Виды надежности • • Надежность по внутренней согласованности Надежность эквивалентных (параллельных) форм Надежность частей теста (деление пополам) Ретестовая надежность
Надежность по внутренней согласованности В психометрии стремятся разрабатывать тесты, являющиеся в высокой степени внутренне согласованными, по той причине, что если некоторая переменная измеряется частью теста, то тогда в других частях, если они не согласованы с первой, эта же переменная измеряться не может. Для того, чтобы тест был валидным (то есть, измерял именно то, для измерения чего он предназначен), он должен быть согласованным, т. е. высокая надежность является предпосылкой валидности. Внутренняя согласованность теста измеряется по степени выраженности интеркорреляционных связей между заданиями теста.
Надежность по внутренней согласованности Способы вычисления надежности по общей согласованности: • формула Дж. Наннелли; • формула альфы Л. Кронбаха.
Надежность по внутренней согласованности Формула Дж. Наннелли – надежность по внутренней согласованности статистически равна стандартной ошибке средней взаимной корреляции заданий или тестов: где: σt – стандартная ошибка измерения, σr – стандартное отклонение корреляции заданий внутри теста k – количество заданий в тесте, rt – коэффициент надежности теста. Чем больше заданий в тесте, тем выше его надежность.
Надежность по внутренней согласованности Альфа Кронбаха - в этом методе сравнивается разброс каждого элемента с общим разбросом всей шкалы. Если разброс результатов теста меньше, чем разброс результатов для каждого отдельного вопроса, следовательно, каждый отдельный вопрос направлен на исследование одного и того же общего основания. Они вырабатывают значение, которое можно считать истинным. Если такое значение выработать нельзя, то есть получается случайный разброс при ответе на вопросы, тест не надежен и коэффициент альфа Кронбаха будет равен 0. Если же все вопросы измеряют один и тот же признак, то тест надежен и коэффициент альфа Кронбаха в этом случае будет равен 1.
Надежность по внутренней согласованности Альфа Кронбаха вычисляется по формуле: где N - число элементов в шкале, υ- средняя дисперсия для выборки, с - среднее значение для всех ковариаций между компонентами выборки. Альфа Кронбаха в целом будет возрастать по мере увеличения взаимных корреляций переменных, и, поэтому, считается маркёром внутренней согласованности оценки достоверности результатов тестов. Однако, следует заметить, что высокое значение коэффициента указывает на наличие общего основания у набора вопросов, но не говорит о том, что за ними стоит один единственный фактор - одномерность шкалы следует подтверждать дополнительными методами. Считается, что профессионально разработанные тесты должны иметь внутреннюю согласованность на уровне не менее 0, 90.
Надежность по внутренней согласованности Оценка альфы Кронбаха: По А. Д. Наследову: • больше 0, 9 – отличная; • больше 0, 8 – хорошая; • больше 0, 7 – приемлемая; • больше 0, 6 – сомнительная; • больше 0, 5 – малопригодная; • меньше 0, 5 – недопустимая. Зарубежные нормы предусматривают, что надежность должны быть не меньше 0, 8. Для отечественных норм характерно считать, что α=0, 7 это уже высокая надежность. Надежность должна превышать валидность методики и стремиться к 1.
Надежность параллельных форм – это характеристика надежности психодиагностической методики с помощью взаимозаменяемых форм теста. При этом одни и те же испытуемые в выборке определения надежности обследуются вначале с использованием основного набора заданий, а затем – с применением аналогичных дополнительных наборов. Второй способ определения надежности по типу параллельных форм: испытуемые делятся примерно на равные группы, затем одной из них предлагается форма А теста, а другой – форма Б. Через определенное время (обычно не более недели) проводится повторное тестирование, но в обратном порядке. Основным показателем надежности параллельных форм является коэффициент корреляции между результатами первичного и повторного обследований с помощью первой и второй форм теста.
Надежность параллельных форм Используется две системы классификации корреляционных связей по их силе для оценка надежности : общая и частная. • Общая классификация корреляционных связей: 1) сильная при коэффициенте корреляции r>0, 70; 2) средняя при 0, 50
Надежность частей теста – характеристика надежности психодиагностической методики, получаемая путем анализа устойчивости результатов отдельных совокупностей тестовых задач или единичных заданий теста. Наиболее простым и распространенным способом определения надежностей частей теста является метод расщепления (деления пополам), суть которого заключается в выполнении испытуемым заданий двух равноценных частей теста. Формула Спирмена-Брауна для расчета надежности при расщеплении теста пополам: где r 12 – корреляция между двумя половинами теста. Вышеприведенная формулы пригодны для случаев, когда задания оцениваются в дихотомической шкале, т. е. по принципу «да - нет» . Для случаев с более дифференцированной оценкой применима формула коэффициента альфа.
Ретестовая надежность – это характеристика надежности психодиагностической методики, получаемая путем повторного обследования испытуемых с помощью одного и того же теста. Она вычисляется по соответствию результатов первого и второго обследований или по сохранению ранговых мест испытуемых в выборке при ретесте. Коэффициент надежности соответствует коэффициенту корреляции между результатами таких обследований. Когда тест не может дать тот же самый результат для некоторого испытуемого (при условии, что этот испытуемый не изменился) в различных условиях – значит его надежность неудовлетворительна. Существенным фактором при определении ретестовой надежности является временной интервал между проведением первого и повторного обследований. При малом интервале испытуемый может запомнить тест и свои предыдущие ответы, что оказывает влияние на его ретестовые результаты. Слишком долгий промежуток времени между тестированиями нивелирует эффект запоминания, но может быть причиной того, что у испытуемого под влиянием возрастных изменений, жизненного опыта и т. п. могут измениться измеряемые личностные характеристики. Рекомендуется интервал между обследованиями от нескольких месяцев до половины года. В практике психологической диагностики считается, что тест надежен, если rt ≥ 0, 6.
Константность – это независимость результатов от личности диагноста. В большей степени фактор личности диагноста проявляется в проективных методиках. Если в присутствии нового экспериментатора сдвиг у всех испытуемых в одну сторону, то это не нарушает надежность методики. Но если сдвиги разнонаправленные – необходимо проверить константность методики. Показатель константности вычисляется как коэффициент корреляции результатов двух опытов, проведенных в относительно одинаковых условиях на одной и той же выборке испытуемых, но разными диагностами. Коэффициент корреляции должен быть не менее 0, 8.
Методы измерения надежности • В зависимости от количества сеансов тестирования и форм тестов Число сеансов тестирования Число форм теста Одна Две Один Расщепление Альфа Кронбаха Кьюдера-Ричардсона Метод взаимозаменяемых форм (непосредственный) Два Тест-ретест Метод взаимозаменяемых форм (отсроченный)
Методы измерения надежности • И связываемые с ними факторы ее нарушения Способы проверки надежности Устанавливаемый фактор нарушения Тест-ретест Время Метод взаимозаменяемых форм (непосредственный) Содержание Метод взаимозаменяемых форм (отсроченный) Время и содержание Расщепление Альфа Кронбаха Кьюдера-Ричардсона Содержание Смена диагностов Диагносты
Использованная литература Кондаков И. М. Создание психологических опросников с помощью статистического пакета SPSS for Windows 11. 5. 0. Учебнометодическое пособие // http: //www. matlab. mgppu. ru/work/0028. htm Лактионов А. Н. , Луценко Е. Л. Основы психодиагностики, психометрии и тестологии: учебно-методическое пособие. – Х. : ХНУ imeni В. Н. Каразiна, 2006. – 64 с. Митина О. В. Разработка и адаптация психологических опросников. М. : Смысл, 2010. 235 с.