Презентация на тему психометрические характеристики тестов: Психометрические основы психодиагностики — презентация онлайн

Психометрические свойства — IResearchNet

Оценка человеческих характеристик, таких как достижения, способности, мастерство, отношение, убеждения или другая конструкция, обычно осуществляется посредством проведения теста, который сам по себе часто тщательно разрабатывается и проводится по стандартизированным протоколам. Экзаменуемые и другие пользователи теста обычно интересуются только результатами, полученными администрацией теста; как правило, они не приспособлены к характеристикам или техническим характеристикам самого инструмента. Тем не менее, многие люди, использующие результаты тестов, осознают, что полезность и уместность интерпретации тестовых результатов являются прямым результатом внутренних характеристик теста. Внутренние атрибуты теста технически называются его психометрическими свойствами. Психометрические свойства — это характеристики тестов и других показателей человеческих характеристик, которые идентифицируют и описывают атрибуты инструмента, такие как его надежность или пригодность для использования в конкретных обстоятельствах.

Чаще всего психометрические свойства предоставляют информацию о пригодности, значимости и полезности теста, другими словами, о его достоверности. В качестве иллюстрации предположим, что тест рекламируется как мера, полезная для диагностики расстройства личности, такого как шизофрения. Психометрические свойства теста предоставляют создателям тестов и пользователям доказательства того, что инструмент работает так, как показано.

Хотя существует множество психометрических свойств для описания технических качеств тестов, они не включены в удобный окончательный список. Вместо этого всякий раз, когда конкретная характеристика теста описывается с точки зрения научных стандартов (т. Е. Не просто упоминается в непринужденной беседе), ее можно рассматривать как психометрическое свойство. Таким образом, в самом общем виде психометрическое свойство как научный термин относится к некоторому существенному атрибуту теста.

Психометрические свойства фокусируются на определенных характеристиках теста. Некоторые свойства свидетельствуют о качестве инструмента в целом, тогда как другие свидетельствуют о его составных частях, его частях или даже отдельных его элементах. Например, при просмотре всего теста психометрическое свойство может указать, измеряет ли инструмент один конструкт или несколько. Атрибут теста, измеряющий только одно измерение — или более одного измерения, если это так, — является психометрическим свойством всего инструмента. Еще одно психометрическое свойство всего теста может указывать на то, одинаково ли хорошо инструмент оценивает целевой конструкт для женщин и мужчин. Это психометрическое свойство полового (или гендерного) равенства. Другие психометрические свойства свидетельствуют о том, последовательно ли тест измеряет конструкт (т. е. надежность). Эти примеры иллюстрируют некоторые общие психометрические свойства всего теста: его размерность, равенство и надежность.

Психометрические свойства также существуют для отдельных тестовых вопросов (т. е. элементов). Показатели сложности конкретного тестового задания, его способность различать людей, имеющих различное количество измеряемого конструкта (т.

Еще одна особенность психометрических свойств заключается в том, что они обычно — но не исключительно — выражаются количественно. Часто для передачи свойства дается индекс, коэффициент или какая-либо другая числовая величина. Например, многие студенты и специалисты знакомы с коэффициентом надежности. Коэффициент надежности является числовым значением. «Надежность» является психометрической характеристикой теста, но выражается в виде количественного значения. Точно так же и большинство других психометрических свойств обозначаются цифрами. Однако количественное значение не всегда является лучшим средством передачи того или иного психометрического свойства. Валидность, например, представляет собой сложное явление, которое нельзя осмысленно свести к одному показателю или значению. Валидность является всеобъемлющим психометрическим свойством, но для описания валидности теста необходимо тщательное обсуждение, обобщающее обширный набор доказательств.

Важно изучить и изучить психометрические свойства теста по двум причинам. Во-первых, эта информация необходима для построения надежного теста. Специалисты по психометрии и другие специалисты, разрабатывающие тесты, должны оценить и описать, как работает тест, чтобы его можно было построить с заданным уровнем качества. Во-вторых, знание психометрических свойств теста свидетельствует о том, что информация, полученная с помощью инструмента, может служить надежной основой для принятия решений. Психологи, консультанты, педагоги, политический персонал и многие другие часто основывают свои решения, по крайней мере частично, на информации, полученной в ходе тестов. Доказательства, поддерживающие такие решения, обнаруживаются в психометрических свойствах теста. Без знания того, насколько хорошо работает тест, интерпретация сомнительна.

Отличие психометрических свойств от статистики

Психометрические свойства сами по себе не являются статистикой, но обычно представлены количественными значениями. Эти значения часто рассчитываются с использованием статистических процедур. Например, рассмотрите более внимательно понятие надежности, которое относится к согласованности измерений. Надежность показывает, можно ли получить непротиворечивую информацию, если применить процедуру тестирования к группе людей или групп несколько раз. Представление о том, насколько последовательно тест работает при нескольких администрациях, является психометрическим свойством теста. Статистическая процедура используется для расчета коэффициента надежности или индекса надежности.

Кроме того, многие психометрические свойства не могут быть выражены через одно значение, например коэффициент или индекс. Многие важные свойства тестов являются широкими понятиями, такими как их факторная структура. Раскопки информации о факторной структуре теста обычно требуют плана исследования (часто сложного плана), а информация о факторной структуре теста не может быть передана одним значением. Таким образом, статистика используется для расчета значений, позволяющих сделать краткое и последовательное утверждение о психометрическом свойстве, но статистика не представляет психометрического свойства. Вместо этого концепция (например, факторная структура теста) является психометрическим свойством.

Валидность теста и психометрические свойства

В самом общем смысле все психометрические свойства являются показателями валидности теста. Валидность относится к степени, в которой фактические данные и теория поддерживают интерпретацию тестовых результатов. Один из способов осмыслить валидность — представить, как результаты теста предоставляют информацию, полезную, уместную и значимую для конкретного решения. Решение, основанное на подтвержденных доказательствах, является действительным, и тест считается действительным для этого конкретного решения. Все психометрические свойства предоставляют информацию (прямо или косвенно), которая указывает на полезность теста для интерпретаций, и, следовательно, все психометрические свойства предоставляют информацию о достоверности теста.

Типы психометрических свойств

В таблице 1 перечислены некоторые распространенные психометрические свойства тестов. Обратите внимание, что в таблице представлены как статистические данные по предметам, так и статистические данные по тестам — две упомянутые выше категории психометрических свойств. В разделе «Статистика предмета» список включает несколько индикаторов психометрических свойств, включая сложность предмета, различение предмета и статистику соответствия предмета. Каждая из этих характеристик тестовых заданий является психометрическим свойством, и каждая из них может быть выражена несколькими способами. Сложность задания, например, может быть значением p, статистикой соответствия теории ответа на задание (IRT) или другим индексом, не показанным в таблице 1. Значение p представляет собой долю (процент) испытуемых, которые правильно ответили на задание на заданном уровне. повод. Статистика соответствия IRT указывает на уместность вопроса для экзаменуемого, когда экзаменатор желает провести только те вопросы, которые теоретически подходят для общих способностей каждого экзаменуемого в отношении оцениваемого навыка. Задания, которые слишком сложны или слишком просты для испытуемого, лучше опускать, потому что они, скорее всего, дают мало информации, кроме той, которую можно получить, представляя только те задания, которые соответствуют способностям испытуемого. Как показано в таблице 1, для большинства психометрических свойств доступны различные числовые значения, каждое из которых имеет уникальное значение.

В таблице 1 также указан ряд свойств (например, центральность, дисперсия, распределение и надежность), относящихся ко всем тестам (см. столбец «Статистика тестов»).

Опять же, каждое психометрическое свойство может иметь несколько выражений. Психометрическое свойство центральности предоставляет информацию об относительном статусе популяции испытуемых по измеряемому конструкту. Например, можно ожидать, что популяция одаренных старшеклассников будет иметь относительно высокие среднее значение, медиану, моду и сумму, а также относительно низкую стандартную ошибку среднего значения в тесте, предназначенном для измерения готовности к поступлению в колледж. Таким образом, применение этого теста к выборке одаренных старшеклассников дает возможность определить, дает ли тест разумные результаты.

Свойство дисперсии почти противоположно центральности в тестах. Дисперсия показывает, насколько изменчивы испытуемые по оцениваемому признаку. Неоднородная (т. е. сильно изменчивая) группа получит широкий набор баллов; однородная (т. е. очень похожая) группа испытуемых получит баллы, отличающиеся лишь на небольшую величину.

Психометрическое свойство распределения относится к распределению баллов относительно нормально распределенной совокупности. В нормальной популяции распределение баллов вокруг медианы симметрично. Это означает, что каждая половина распределения очков является зеркальным отражением другой половины распределения. На графике нормальное распределение дает колоколообразную кривую, свидетельствующую о нулевом перекосе. Когда оценки несимметричны, распределение будет либо смещено в положительную сторону (т. е. будет иметь слишком много низких оценок), либо в отрицательную асимметрию (т. е. будет иметь слишком много высоких оценок). Эксцесс указывает на остроконечный характер распределения. Когда популяция симметрична, количество высоких и низких оценок соответствует ожидаемому количеству, а пик (т. Е. Эксцесс) равен нулю. Распределения с высоким пиком имеют меньше высоких и низких оценок, чем ожидалось, а значение эксцесса больше нуля. Распределения с низким пиком имеют больше высоких и низких оценок, чем ожидалось, и отрицательное значение эксцесса. Надежность уже обсуждалась.

Психометрические свойства часто отображаются в графической форме, когда точные значения менее важны, чем передача смысла свойств. На рис. 1 показан пример графика Q-Q, иллюстрирующий психометрическое свойство нормальности в тесте по математике. Нормальность — это еще один тип выражения нормальных значений, поясняемый в таблице 1. В основе графика лежит диапазон баллов по тесту (т. е. от менее 200 до более 400 на рис. 1). Эти наблюдаемые значения нанесены на график относительно остаточного значения. Остаточное значение — это разница между наблюдаемым значением и значением, которое можно было бы ожидать, если бы популяция была совершенно нормальной. Таким образом, этот рисунок показывает, насколько наблюдаемые значения отклоняются от значений, которые имели бы место в нормальной популяции.

Чтобы интерпретировать нормальность на графике Q-Q, обратите внимание на то, как тестовые значения (обозначенные кружками) выравниваются с линией регрессии около 45 градусов, идущей из нижнего левого угла в верхний правый. На этом рисунке видно, что испытуемые с низкими способностями (в левом нижнем углу рядом с начальной точкой линии регрессии) не распределены нормально. У большинства испытуемых остальные уровни способностей близки к нормальным. Однако у очень способных испытуемых наблюдается еще одно небольшое отклонение от нормы, показанное кружками, отклоняющимися от линии в правом верхнем углу. В работе по разработке тестов изучение свойства нормальности для группы испытуемых является обычной и чрезвычайно полезной процедурой. Как видно на рисунке 1, графическое отображение информации о психометрических свойствах часто обеспечивает четкую интерпретацию существенного момента, устраняя сложности, возникающие при подробном сообщении статистических значений.

Рисунок 1 График, иллюстрирующий психометрическое свойство нормальности

Рисунок 2 иллюстрирует более сложный график, который передает множество технической информации о тесте. Кривая на рис. 2 представляет собой образец ответов группы испытуемых на одно тестовое задание. Нижняя ось, известная как ось x или абсцисса, помечена как «Способность», и ее шкала симметрична относительно нуля. Другими словами, ноль по этой шкале — это средний уровень способностей группы испытуемых. Медиана является центральным значением; половина испытуемых набрала выше медианы, а половина — ниже медианы. Числовые значения слева и справа представляют собой стандартные отклонения от медианы. Испытуемые с -3,0 набрали очень низкие баллы по измеряемой способности, а те, у кого +3,0, набрали довольно высокие баллы по измеряемой способности. Вертикальная шкала слева, известная как ось Y или ордината, находится в диапазоне от 0,0 до 1,0. Этот параметр показывает вероятность того, что испытуемый с таким уровнем способностей даст правильный ответ на задание. Как видно, вероятность правильного ответа колеблется от 0% (0,0) до 100% (1,0). Изогнутая кривая для задания показывает, что люди с низкими способностями имеют очень низкую вероятность правильно ответить на задание. Однако по мере увеличения способности (движение слева направо по оси x) вероятность правильного ответа на задание соответственно возрастает.

Рисунок 2

Кривая характеристик предмета, показывающая отношение сложности предмета к различению предметов во всем диапазоне уровней способностей.

Источник : Остерлинд, С. Дж. (2006). Современные измерения: теория, принципы и приложения ментальной оценки. Река Аппер-Сэдл, Нью-Джерси: Прентис-холл.

Рисунок 2 также показывает, что рост не является идеально линейным. Если бы рост был совершенно линейным, линия трассировки товара проходила бы под углом 45 градусов. Вместо этого ленивая S-образная линия показывает, что на очень низких и очень высоких уровнях способностей кривая начинает сглаживаться. Это показывает, что люди из этих групп с низкими и высокими способностями имеют примерно одинаковую вероятность или правильно реагируют на задание. Таким образом, кривая сообщает пользователям, что элемент хорош для различения людей с разными уровнями способностей при условии, что они не попадают в группу с очень высокими или очень низкими способностями (т. ). Предмет не очень полезен для различения людей с самым низким и самым высоким уровнем способностей. Тем не менее, общий рисунок дает полезную иллюстрацию отображения составных и уточненных психометрических свойств тестов и их элементов.

Хотя рисунок 2 содержит больше психометрической информации, чем может быть удобно объяснено здесь, из этого рисунка следует понять, что психометрические свойства часто сложны и представляют сложные понятия, но иногда их можно представить ясно и просто с помощью графических дисплеев.

Оценка

Психологи используют тесты в исследованиях и на практике для измерения конструктов, которые трудно наблюдать (например, доброжелательность, потребность в познании и эмпатия). Баллы, полученные в результате теста, часто служат основой для принятия решений психологами. Из-за важности тестовых данных важно оценить психометрические свойства инструментов, которые используют психологи. Внутренние свойства инструментов, которые используют психологи, известны как их психометрические свойства. Оценка психометрических свойств инструмента позволяет психологам использовать инструмент с уверенностью в том, что он предоставит надежную, достоверную и значимую информацию, которую можно использовать при принятии решений.

Ссылки:

  1. Американская ассоциация исследований в области образования, Американская психологическая ассоциация, Национальный совет по измерению в образовании. (1999). Стандарты педагогического и психологического тестирования. Вашингтон, округ Колумбия: Американская ассоциация исследований в области образования.
  2. Бреннан, Р.Л. (ред.). (2006). Образовательное измерение (4-е изд.). Вестпорт, Коннектикут: Прегер.
  3. Эмбретсон, С.Э., и Риз, С.П. (2000). Теория отклика предметов для психологов. Махва, Нью-Джерси: Лоуренс Эрлбаум.
  4. Хэмблтон, Р.К., Робин, Ф., и Син, Д. (2000). Модели ответов на вопросы для анализа данных образовательного и психологического теста. В HEA Tinsley & SD Brown (Eds.), Справочник по прикладной многомерной статистике и математическому моделированию (стр. 553-581). Сан-Диего, Калифорния: Academic Press.
  5. Маркулидес, Джорджия (2000). Теория обобщаемости. В HEA Tinsley & SD Brown (Eds.), Справочник по прикладной многомерной статистике и математическому моделированию (стр. 527-551). Сан-Диего, Калифорния: Academic Press.
  6. Остерлинд, С.Дж. (2006). Современные измерения: теория, принципы и приложения ментальной оценки. Река Аппер-Сэдл, Нью-Джерси: Прентис-холл.
  7. Рао, Ч.Р., и Синхарай, С. (ред.). (2007). Справочник по статистике, 26: Психометрия (Том 26). Оксфорд, Великобритания: Эльзевир.
  8. Торндайк, Р. М. (2005). Измерение и оценка в психологии и образовании (7-е изд.). Колумбус, Огайо: Меррилл.
  9. Тинсли, HEA (1992). Психометрическая теория и исследования психологии консультирования. В SD Brown & RW Lent (Eds.), Справочник по психологии консультирования (2-е изд., стр. 37-70). Нью-Йорк: Уайли.
  10. ван дер Линден, В.Дж., и Хэмблтон, Р.К. (ред.). (1997). Справочник по современной теории ответа на вопросы. Нью-Йорк: Спрингер.

См. также:

  • Консультативная психология
  • Оценка личности

Психометрические характеристики и клиническая польза тестов физической работоспособности у пациентов с болью в пояснице

. 1998 15 ноября; 23 (22): 2412-21.

doi: 10.1097/00007632-199811150-00011.

М. Дж. Симмондс 1 , С. Л. Олсон, С. Джонс, Т. Хуссейн, С. Э. Ли, Д. Нови, Х. Радван

принадлежность

  • 1 Школа физиотерапии Техасского женского университета, Хьюстон, США. [email protected]
  • PMID: 9836355
  • DOI: 10.1097/00007632-199811150-00011

М. Дж. Симмондс и соавт. Позвоночник (Фила Па, 1976). .

. 1998 15 ноября; 23 (22): 2412-21.

doi: 10.1097/00007632-199811150-00011.

Авторы

М. Дж. Симмондс 1 , С. Л. Олсон, С. Джонс, Т. Хусейн, С. Э. Ли, Д. Нови, Х. Радван

принадлежность

  • 1 Школа физиотерапии Техасского женского университета, Хьюстон, США. [email protected]
  • PMID: 9836355
  • DOI: 10.1097/00007632-199811150-00011

Абстрактный

Дизайн исследования: Психометрические свойства и клиническое использование набора показателей физической работоспособности были протестированы на 44 пациентах с болью в пояснице и на 48 здоровых контрольных субъектах без болей.

Цели: Были оценены надежность, валидность и клиническое использование девяти показателей физической работоспособности.

Сводка исходных данных: Хотя показатели физической работоспособности имеют потенциальное применение при оценке, планировании лечения и определении результатов лечения, систематических исследований их надежности, валидности и клинического применения мало.

Методы: В исследовании приняли участие 44 человека с болью в пояснице и 48 здоровых людей без болей. Были протестированы следующие показатели физической работоспособности: расстояние, пройденное за 5 минут; 50-футовая прогулка на максимальной скорости; 50-футовая прогулка с предпочтительной скоростью; 5 повторений задачи «приседание-стояние»; 10 повторений повторяющегося задания на сгибание туловища; срочная задача на время; выгруженная задача прямого вылета; загруженная задача прямого охвата; испытание на усталость Соренсена. Субъектов оценивали дважды в течение 2 дней.

Полученные результаты: Все показатели имели отличную межтестеровую надежность (коэффициент внутриклассовой корреляции [ICC]1,1 > 0,95). Надежность теста-ретеста (внутри сеанса) была адекватной для всех показателей (ICC1,1 > 0,83), за исключением повторного сгибания туловища (ICC1,1 > 0,45) в группе с болью в пояснице. Надежность повторных тестов (ежедневно) варьировала от 0,59 до 0,88 в группе с болью в пояснице и от 0,46 до 0,76 в контрольной группе. Ежедневная достоверность улучшилась, когда использовались средние значения двух попыток повторяющихся сгибаний туловища и приседаний (0,76–0,9).1 группа с болью в пояснице и 0,62-0,89 контрольная группа). Результаты многомерного дисперсионного анализа показали значительное влияние группы (F10,65 = 3,52, P = 0,001). Результаты однофакторного анализа показали значительные групповые различия по всем показателям, кроме ходьбы на 50 футов с предпочтительной скоростью и вытягивания вперед без нагрузки. Самоотчет об инвалидности умеренно коррелировал с выполнением задач (r = 0,400 до -0,603).

Выводы: Результаты поддерживают использование этих показателей физической работоспособности в качестве дополнения к самоотчетам пациентов.

Похожие статьи

  • Применимость шести задач физической активности в реабилитационной популяции с хронической болью в пояснице.

    Смитс Р.Дж., Хидждра Х.Дж., Кестер А.Д., Хиттерс М.В., Ноттнерус Дж.А. Смитс Р.Дж. и соавт. Клиника реабилитации. 2006 ноябрь; 20 (11): 989-97. дои: 10.1177/0269215506070698. Клиника реабилитации. 2006. PMID: 17065542

  • Физическая работоспособность: различия у мужчин и женщин с болью в пояснице и без нее.

    Новый Д.М., Симмондс М.Дж., Олсон С.Л., Ли К.Э., Джонс С.К. Новый Д.М. и др. Arch Phys Med Rehabil. 1999 г., февраль; 80(2):195-8. doi: 10.1016/s0003-9993(99)-1. Arch Phys Med Rehabil. 1999. PMID: 10025497

  • Шкала поведения при боли (PaBS): предварительное исследование надежности и конструктивной валидности у пациентов с хронической болью в пояснице.

    Аламам Д.М., Ливер А., Молони Н., Алсбайел Х.И., Алашайх Г., Макки М.Г. Аламам Д.М. и др. Боль Res Manag. 2019 3 февраля; 2019: 2508019. дои: 10.1155/2019/2508019. Электронная коллекция 2019. Боль Res Manag. 2019. PMID: 30863470 Бесплатная статья ЧВК.

  • Надежность тестов физического функционирования у пациентов с болью в пояснице: систематический обзор.

    Дентенир Л., Ван Даэле Ю., Труйен С., Де Хертог В., Меирте Дж., Стассинс Г. Дентенир Л. и соавт. Спайн Дж. 2018 Янв; 18 (1): 190-207. doi: 10.1016/j.spinee.2017.08.257. Epub 2017 4 сентября. Спайн Дж. 2018. PMID: 28882521 Обзор.

  • Измерительные свойства и осуществимость клинических тестов для оценки задач «сидеть-стоять»/«стоять-сидеть» у субъектов с неврологическими заболеваниями: систематический обзор.

    Сильва П.Ф., Квинтино Л.Ф., Франко Х., Фариа CD. Сильва П.Ф. и др. Braz J Phys Ther. 2014 март-апрель;18(2):99-110. doi: 10.1590/s1413-35552012005000155. Braz J Phys Ther. 2014. PMID: 24839043 Бесплатная статья ЧВК. Обзор.

Посмотреть все похожие статьи

Цитируется

  • Изучение проведения адаптированных китайских упражнений для разума и тела для пожилых латиноамериканцев с низким доходом, проживающих в общинах, для здорового старения: исследование осуществимости и приемлемости.

    Du Y, Patel N, Hernandez A, Zamudio-Samano M, Li S, Zhang T, Fernandez R, Choi BY, Land WM, Ullevig S, Estrada Coats V, Moussavou JMM, Parra-Medina D, Yin Z. Ду Ю и др. JMIR Форма Res. 2022 13 сентября; 6 (9): e40046. дои: 10.2196/40046.

    JMIR Форма Res. 2022. PMID: 35997685 Бесплатная статья ЧВК.

  • Биомаркеры воспалительной ноцицепции на основе жидкостной биопсии, выявленные у самцов крыс.

    Merritt CR, Cisneros IE, Covarrubias-Zambrano O, Stutz SJ, Motamedi M, Bossmann SH, Cunningham KA. Мерритт С.Р. и соавт. Фронт Фармакол. 2022 27 июня; 13:893828. doi: 10.3389/fphar.2022.893828. Электронная коллекция 2022. Фронт Фармакол. 2022. PMID: 35833018 Бесплатная статья ЧВК.

  • Смешанное технико-экономическое обоснование адаптированной к коморбидности программы упражнений при болях в пояснице у пожилых людей (ВОЗВРАЩЕНИЕ): протокол.

    де Лука К., Янц М., Дауни А., Кендалл Дж., Скоу С.Т., Хартвигсен Дж., Френч С.Д., Феррейра М. Л., Бирма-Зейнстра СМА. де Лука К. и др. Пилотное технико-экономическое обоснование. 2022 июль 2;8(1):133. doi: 10.1186/s40814-022-01097-x. Пилотное технико-экономическое обоснование. 2022. PMID: 35780222 Бесплатная статья ЧВК.

  • Тесты физических характеристик на основе видеоконференций: исследование надежности и осуществимости.

    Эспин А., Гарсия-Гарсия Х., Латорре Эрезума У., Айестаран М., Иразуста Х., Родригес-Ларрад А. Эспин А. и др. Общественное здравоохранение Int J Environ Res. 2022 9 июня; 19 (12): 7109. дои: 10.3390/ijerph29127109. Общественное здравоохранение Int J Environ Res. 2022. PMID: 35742358 Бесплатная статья ЧВК.

  • Вывод правил клинического прогнозирования для выявления пациентов с неострой болью в пояснице, которые лучше всего реагируют на программу упражнений для стабилизации поясничного отдела после лечения и через шесть месяцев наблюдения.