Тестовые нормы: Тестовые нормы. Большая российская энциклопедия

Опубликовано 08.07.202312.04.2023 автором alexxlab

Содержание

Тестовые нормы. Большая российская энциклопедия

Термины

Области знаний:: Методические понятия психодиагностики

Те́стовые но́рмы, стандарты для оценки результатов тестирования, позволяющие определить наличие и/или степень выраженности измеряемого психического свойства у конкретного испытуемого.

Анализ и интерпретация результатов тестирования конкретного испытуемого осуществляется на основе стандартизированных баллов, поэтому одним из важных условий практического использования психодиагностических методик является перевод сырых тестовых баллов в нормированные. Это позволяет сравнить результаты данного тестируемого по разным шкалам и методикам, а также с результатами других испытуемых.

Перевод сырых баллов в нормированные производится путём сравнения сырых баллов тестируемого с показателями выборки стандартизации. Тестовым результатам конкретного испытуемого присваивается заданный для определённой выборки стандартизации нормированный балл. Для определения стандартизированного балла необходимо выбрать ту нормативную группу, которая соответствует социально-демографическим характеристикам тестируемого и цели тестирования.

Тестовые нормы представляют собой пороговые значения, «точки отсечения» (cut score) или интервалы (уровни) с различной интерпретацией на стандартной шкале, которые разделяют статистически различающиеся группы тестируемых.

Согласно определению А. Г. Шмелева, тестовые нормы – это границы на шкале тестовых баллов, которые разделяют интервалы (области шкалы), связанные с определёнными диагностическими выводами или управленческими решениями (Шмелев. 2013. С. 66).

Нормированные шкалы. Архив БРЭ.Наиболее простые «точки отсечения» на тестовых шкалах могут быть определены границами интервала М ± \pm ± σ (среднее значение плюс / минус стандартное отклонение: М – σ, М + σ). Группа испытуемых, которые попадают в этот интервал, называется средней, выше интервала – высокой, ниже интервала – низкой. Правила определения «точек отсечения» могут исходить не только из закона нормального распределения, средних величин и отклонений в выборке стандартизации (при нормативно-статистическом подходе), но и из объективированных требований к уровню подготовленности или пригодности испытуемых к определённому виду деятельности (при критериально-ориентированном подходе).

Нормативно-ориентированное тестирование предполагает формирование тестовых норм на основе статистического распределения тестовых баллов в репрезентативной выборке стандартизации. Такие нормы называют относительными в связи с тем, что они демонстрируют статус испытуемого относительно группы, рассматриваемой в качестве нормативной. В таких случаях используются нормированные шкалы, прежде всего Z-шкала и её производные (шкала стэнов, Т-шкала, IQ-шкала и др.) (см. рис. Нормированные шкалы).

Критериально-ориентированное тестирование предполагает формирование тестовых норм на основе экспертных критериев (некоторых внешних по отношению к тесту явлений или признаков). Наборы признаков для критериальных тестовых норм могут быть упорядочены в номинативные или порядковые шкалы. Экспертно задаются абсолютные пороговые значения отбора по количеству успешно выполненных критериальных показателей.

Критериальные нормы отражают вероятность того, что испытуемые, получившие некоторый балл по тесту, достигнут критериального показателя. Критериальные нормы устанавливают посредством эмпирического соотнесения тестовых баллов с оценками по критерию и обычно представляют в виде «таблиц ожидания». В таблицах ожидания приводятся вероятности различных критериальных исходов для лиц, получивших тот или иной тестовый балл. Таблицы ожиданий могут дополняться указанием критериального балла – тестового показателя, относительно которого прогнозируется успешность деятельности не ниже заданной вероятности (например, на уровне «выше среднего» с вероятностью 95 %). Основная сфера применения таких норм связана с практическими задачами отбора и прогнозирования.

Для реализации практических целей используются и предметно-ориентированные нормы (domain-referenced), призванные оценить уровень выполнения теста с точки зрения его содержания (количество знаний, качество освоения конкретных навыков и т. д.). Во многих областях практики для задач готовности или безопасности требуется не определение статуса тестируемого относительно общей выборки, а установление критических точек, отражающих минимальный уровень освоения деятельности (например, тест на вождение автомобиля). Для установления таких норм необходим «стандарт выполнения», который выражается либо в проценте выполненных заданий, либо через «точку отсечения», которая разделяет протестированных претендентов на группы по принципу «зачёт / незачёт». При использовании нескольких «точек отсечения» могут определяться несколько категорий (например, начальный уровень, базовый, продвинутый). К установлению предметно-ориентированных норм также привлекаются эксперты. Предметно-ориентированные нормы широко используются в системе образования, а также для целей лицензирования и сертификации, когда в качестве интерпретационной схемы используется чётко определённая содержательная область.

В отечественных исследованиях при интерпретации диагностических данных применялся особый критерий – социально-психологический норматив; критерий предложил К. М. Гуревич как психологический информационно-действенный комплекс знаний, умений и навыков (Гуревич. 2008. С. 280). Социально-психологический норматив – система требований, которые предъявляет общество и которым необходимо соответствовать, чтобы получить санкционированную обществом квалификацию. Оценка результатов тестирования в этом случае основывается на степени их близости к социально-психологическому нормативу для определённой образовательно-возрастной группы.

Также существует классификация тестовых норм в зависимости от широты охвата контингента. Выделяются:

Универсальные нормы определяются для широкого контингента лиц. Они мало зависят от таких социально-демографических признаков, как пол, возраст, уровень образования и т. п., различия в соответствии с этими признаками считаются статистически незначимыми (например, тестовые нормы для лиц обоих полов в возрасте от 16 до 60 лет).

Однако большинство психодиагностических методик по своему содержанию и назначению не претендуют на универсальность и не используют нормы, полученные на масштабных выборках. Во многих случаях более полезными бывают групповые нормы, соответствующие области практического применения методики.

Групповые нормы разрабатываются для групп людей, объединённых по какому-либо групповому статусу (полу, возрасту, уровню образования, профессиональной направленности и т. п.). К их числу относятся прежде всего:

возрастные нормы;
профессиональные;
национальные.

Самым распространённым вариантом групповых норм являются возрастные нормы, устанавливаемые для различных возрастных групп. Деление на группы по возрасту зависит от специфики возрастной динамики измеряемого психического свойства. Такие нормы рассчитываются отдельно для каждой возрастной группы тестируемых, что является фактически обязательным условием для тестов интеллекта – закономерное изменение нормативных показателей с возрастом служит одним из критериев валидности этих тестов.

Профессиональные нормы разрабатываются для представителей различных профессий и видов деятельности. Например, узкопрофильный тест может быть стандартизирован специально для таких групп, как «студенты медицинских вузов» или «руководители среднего звена». Минимальная выборка стандартизации для малочисленных профессиональных групп должна составлять около 100 человек. Использование нормативных групп менее 100 человек нежелательно из-за невозможности обеспечить статистически достоверные результаты и выводы.

Необходимость определения национальных норм более актуальна для многонациональных стран и связана с теми социальными (этническими, языковыми, религиозными и др.) традициями, под влиянием которых происходит развитие и формирование личности представителя конкретной народности, нации или культуры.

Для методик, применяющихся в клинической психодиагностике, иногда разрабатываются групповые нормы для отдельных контингентов больных (например, для детей с отклонениями в умственном развитии, депрессивных, неврастеничных пациентов).

Локальные нормы устанавливаются и применяются для узких категорий лиц в соответствии с конкретными целями тестирования. Например, нормы для отбора претендентов на конкретную работу в конкретной организации могут включать минимальное пороговое значение IQ или максимально допустимый уровень профессионального выгорания.

В практике тестирования персонала в крупных организациях могут использоваться корпоративные тесты и корпоративные нормативные группы. Корпоративную нормативную выборку формируют из числа протестированных работников или кандидатов и рассчитывают локальные тестовые нормы. Корпоративная нормативная группа должна включать не менее 100 сотрудников. Преимуществом использования корпоративной нормативной группы является бо́льшая простота и зачастую точность принятия решений по итогам тестирования (кандидат на должность сравнивается с результатами сотрудников, работающих на этой должности в данной организации). Основным недостатком использования корпоративных норм является риск неверной интерпретации абсолютного уровня результатов. Например, сотрудник, получивший высокий балл по шкале «конформность» относительно корпоративной нормативной выборки, может быть не столь конформным по сравнению с нормой для генеральной выборки, и его стандартизированный балл оказывается завышен из-за заниженности базы сравнения. Поэтому переход на корпоративные и иные локальные нормы рекомендуется производить путём сравнения с нормами, полученными разработчиком теста.

Помимо сравнения показателей с выборкой стандартизации тестовые баллы испытуемого могут сопоставляться с индивидуальной нормой. Такие ипсативные оценки нацелены на определение внутрииндивидуальных соотношений и не затрагивают различия межиндивидуальные. Ипсативные нормы предполагают сравнение выраженности тех или иных свойств относительно самого испытуемого. Например, в качестве меры мотивации к какому-либо виду деятельности могут рассматриваться временны́е и финансовые затраты. С точки зрения нормативного подхода приобретение дорогостоящего музыкального инструмента двумя индивидами означает равенство их мотивации, что может быть не так, поскольку при этом не учтён уровень их способностей и доходов. Одинаковые финансовые затраты состоятельного человека и студента музыкального учебного заведения могут трактоваться как свидетельство бо́льшей степени мотивации последнего. Во избежание такого рода ошибок показатель ипсатируется и мерой мотивации считается отклонение от среднего значения финансовых затрат данного индивида в различных видах деятельности.

Перечисленные виды норм не противоречат друг другу, а наоборот, взаимодополняют и обогащают интерпретацию результатов. Если методика сопровождается разными видами норм, это повышает её практическую ценность. Например, при использовании теста знаний можно установить позицию конкретного студента относительно других студентов (групповые нормы), уровень усвоения им знаний по данному предмету (предметно-ориентированные нормы), а также вероятность того, что он будет успешен в определённых видах профессиональной деятельности (критериальные нормы).

Алгоритм построения тестовых норм независимо от их вида включает следующие этапы: 1) формирование выборки стандартизации; 2) эмпирические процедуры установления стандартов; 3) фиксацию способов перехода (формулы или таблицы) к нормам. Формирование выборки стандартизации осуществляется из той популяции, на которой предполагается применение теста. Согласно существующим стандартам, нормативная выборка для любых тестов должна быть не менее 200 человек. При одинаковых объёмах стратифицированная (схожая по основным признакам с генеральной совокупностью) выборка более эффективна, чем рандомизированная. Переход к нормированным показателям основан на преобразовании сырых баллов в стандартную шкалу, ориентированную на эмпирически полученное при массовом тестировании распределение баллов в репрезентативной выборке стандартизации.

Тестовые нормы необходимы прежде всего для практического использования теста в диагностических целях, т. к. они определяют правила принятия практических решений. При применении теста для исследовательских целей корректнее использовать сырые показатели, не подвергнутые никаким преобразованиям.

При сравнении тестовых баллов с нормами следует учитывать относительность нормативных показателей. В различных выборках стандартизации человек может занимать разные позиции. Например, высокий балл испытуемого по показателю эмпатийности в возрастной нормативной выборке может быть эквивалентен среднему баллу при сравнении его с профессиональными психологами.

Нормативные данные могут варьироваться вследствие социальных, экономических и других факторов. Рестандартизация и построение тестовых норм для новой социокультурной или этнической популяции является одним из обязательных этапов адаптации теста.

Тестовые нормы должны периодически проверяться и в случае существенных изменений корректироваться. Рекомендуется обновлять нормы для тестовых методик каждые 5–7 лет, а для тестов интеллекта – каждые 3–5 лет.

Трухан Елена Антоновна

Дата публикации: 20 октября 2022 г. в 17:27 (GMT+3)

Нормы тестовые | Psylist.net

Словари ↓

А Б В Г Д Е Ж З И К Л М Н О П Р С Т У Ф Х Ц Ч Ш Э Ю Я

Нормы тестовые – количественные и (или) качественные критерии оценки результатов теста, позволяющие определить уровень достижений или степень выраженности психологических свойств, которые являются объектами измерения. В качестве таких критериев выступают статистические показатели выборки стандартизации, а также различные признаки-симптомы, свидетельствующие о том или ином уровне выраженности диагностируемых качеств.

В психологической диагностике наиболее распространены количественные Н. т., полученные на основании определения средних величин и дисперсии в выборке стандартизации. Рассчитанные для нормативной выборки х среднее и дисперсия являются основой для разработки оценок шкальных теста. Количественные Н. т., упорядоченные в шкалы на основе процедур z-преобразования, содержатся в специальных таблицах, прилагаемых к руководствам по проведению тестирования. В этом виде Н. т. позволяют установить относительное место каждого конкретного результата по сравнению с выборочными данными, выраженными в долях дисперсии. Такие количественные Н. т. наиболее типичны для тестов интеллекта, опросников личностных и др. В проективных техниках, в силу известных затруднений, возникающих при формализации оценок первичных, вследствие сложности учитываемых диагностических показателей, количественные Н. т. не столь распространены.

Своеобразной переходной формой между количественными и качественными Н. т. являются критерии оценки наиболее ранних тестов интеллекта. Так, в Бине–Симона умственного развития шкале Н. т. представлены в виде нормативных заданий, на выполнении или невыполнении которых базируется установление умственного возраста и интеллекта коэффициента.

В виде качественных Н. т. могут выступить стандартизированные наборы квалификационных требований к испытуемому, аналогичные шкалам умственного развития, либо специально разработанные для данного теста комплексы диагностических признаков. Примером последних может служить условная шкала определения уровня алкоголизации:

0 уровень – полное воздержание от алкоголя; отсутствие опыта приема.

1 уровень – эпизодический прием; неприятные воспоминания о приеме алкоголя.

2 уровень – систематический прием; удовольствие от употребления; включение небольших доз в общий рацион питания.

3 уровень – эпизоды передозировки; возникновение похмелья.

4 уровень – возникновение психической зависимости; случаи употребления алкоголя с утра для поднятия настроения.

5 уровень – частые случаи похмелья; активный поиск алкоголя; формирование физической зависимости.

6 уровень – эпизодические запои; признаки социальной (главным образом семейной и трудовой) дезадаптации; изменения в эмоциональной и мотивационной сферах личности.

7 уровень – продолжительные запои; стойкая зависимость от алкоголя; выраженные изменения личности по алкогольному типу; глубокая социальная дезадаптация.

Приведенные качественные критерии выступают как нормативы, позволяющие отнести индивида к той или иной диагностической группе. Комплексы критериев Н. т. могут быть упорядочены в нормативные или порядковые шкалы.

Одна и та же психодиагностическая методика может иметь количественные и качественные Н. т., взаимодополняющие и обогащающие интерпретацию результатов. Н. т. обычно рассчитываются раздельно для каждой возрастной группы испытуемых, что является практически обязательным условием для тестов общих способностей. Закономерное изменение нормативных показателей здесь служит своеобразным критерием валидности теста. В методиках, применяющихся в клинической психодиагностике, иногда разрабатываются разные Н.

т. для отдельных контингентов больных (например, для детей с отклонениями в умственном развитии и нормальных). Реже встречается дифференциация норм в зависимости от пола, профессиональных особенностей, уровня образования и т.д.

Рестандартизация и определение норм для новой социоэтнической популяции является одним из основных и обязательных элементов адаптации теста.

Наиболее сложным аспектом определения Н. т. является отбор и комплектация выборки нормирования. Выборка должна соответствовать по своему объему назначению методики. Чем более генерализованной по области применения теста является методика, тем большим должно быть число испытуемых в нормативной выборке. Большое внимание должно при этом уделяться обеспечению репрезентативности выборки по отношению к обследуемой тестом популяции. При одинаковых объемах стратифицированная (т.е. уравновешенная по основным критериям с совокупностью генеральной) выборка более эффективна, чем случайная (рандомизированная). Наиболее частыми критериями стратификации являются: социальное положение, регион проживания, возраст, пол, материальный и образовательный уровень.

Ряд психодиагностических методик требует периодического (один раз в 5-7 лет) пересмотра норм в связи с их «старением».

Психологическое тестирование | Определение, типы, примеры, важность и факты

Тест Роршаха

Посмотреть все СМИ

Ключевые люди:: Сэр Сирил Берт Л. Л. Терстон Джеймс Маккин Кеттелл Роберт М. Йеркс Джой Пол Гилфорд

Похожие темы:: оценка личности экологическая обоснованность тест интеллекта ипсативное измерение тест на выявление способностей

Просмотреть весь соответствующий контент →

психологическое тестирование , также называемое психометрией , систематическое использование тестов для количественной оценки психофизического поведения, способностей и проблем, а также для прогнозирования психологической эффективности.

Слово «тест» относится к любым средствам (часто формально придуманным), используемым для получения ответов, с которыми может быть связано поведение человека в других контекстах. Когда предполагается предсказать относительно отдаленное поведение в будущем (

например, успехи в школе), такое устройство называется тестом способностей. При использовании для оценки текущих академических или профессиональных навыков человека его можно назвать тестом достижений. В таких учреждениях, как консультационные кабинеты, психиатрические клиники и психиатрические больницы, тесты способностей и личности могут быть полезны для диагностики и выявления проблемного поведения. И промышленность, и правительство активно использовали тесты для отбора работников. Исследователи часто полагаются на тесты для перевода теоретических концепций (9).0027 например, интеллект) в экспериментально полезные меры.

Общие проблемы измерения в психологии

Физические вещи воспринимаются через их свойства или признаки.

Мать может непосредственно ощутить свойство, называемое температурой, ощупывая лоб своего младенца. Тем не менее, она не может непосредственно наблюдать коликообразные ощущения или разделять личное переживание младенцем чувства голода. Она должна догадываться о таких ненаблюдаемых личных ощущениях, слыша плач или бульканье своего ребенка; видя, как он машет руками, хмурится или улыбается. Точно так же многое из того, что называется измерением, должно быть сделано путем умозаключений. Таким образом, мать, подозревающая, что у ее ребенка высокая температура, может использовать термометр, и в этом случае она определяет его температуру, глядя на термометр, а не непосредственно касаясь его головы.

Действительно, измерение выводом особенно характерно для психологии. Такие абстрактные свойства или атрибуты, как интеллект или интроверсия, никогда не измеряются напрямую, а должны выводиться из наблюдаемого поведения. Вывод может быть как прямым, так и косвенным. Если люди разумно отвечают (

, например, , рассуждая правильно) на тесте способностей, можно с уверенностью сделать вывод, что они в какой-то степени обладают интеллектом.

Напротив, способность людей устанавливать ассоциации или связи, особенно необычные, между вещами или идеями, представленными в тесте, может быть использована в качестве основы для вывода о творчестве, хотя создание творческого продукта требует других атрибутов, включая мотивацию, возможности и технические навыки. .

Викторина «Британника»

Забавные факты измерения и математики

Типы шкал измерения

Для измерения любого свойства или деятельности необходимо присвоить ему уникальную позицию на числовой шкале. Когда числа используются просто для идентификации людей или классов (как на спинах спортсменов в футбольной команде), они составляют номинальную шкалу. Когда набор чисел отражает только относительный порядок вещей (

например, приятность-неприятность запахов), он составляет порядковую шкалу. Интервальная шкала имеет равные единицы и произвольно назначенную нулевую точку; например, одной из таких шкал является температурная шкала Фаренгейта.

Шкалы отношений не только обеспечивают равные единицы, но также имеют абсолютные нулевые точки; примеры включают меры веса и расстояния.

Хотя были изобретательные попытки установить психологические шкалы с абсолютным нулем, психологи обычно довольствуются приближениями к интервальным шкалам; также часто используются порядковые шкалы.

Оформите подписку Britannica Premium и получите доступ к эксклюзивному контенту. Подпишитесь сейчас

Стандартизация и нормы: процесс и примеры

Если вы сейчас посещаете курс психологии AP, вы, вероятно, сдадите комплексный экзамен в конце курса. Этот тест даст вашему учителю представление о том, как много вы узнали на уроке AP, но это еще не все. Стандартные тесты , такие как экзамен по психологии AP, имеют средние баллы, которые можно сравнить с баллами вашего класса. Ваш учитель сможет сравнить ваши оценки в классе с оценками других студентов-психологов!

Что такое стандартизация и нормы в психологии?
Что такое нормы психологического тестирования?
Что представляет собой процесс стандартизации психологических тестов?
Каковы некоторые примеры стандартизации и норм в психологическом тестировании?
Почему важна стандартизация психологических тестов?

Стандартизация и нормы в психологии

Знаете ли вы, что многие психологические исследования включают тесты или оценки? Они измеряют личность, психические расстройства, интеллект, способности и интересы. Когда психолог использует тест в научном исследовании, тест должен быть надежным и достоверным. Результаты испытаний должны быть последовательными и точными.

Есть еще одна вещь, которой должен быть тест, чтобы психолог мог использовать его в исследованиях: тест должен быть стандартизированный .

Стандартизированный тест включает в себя надежные методы, точное содержание, инструкции по применению и средние баллы популяции для сравнения с баллами выборки.

Стандартные тесты включают в себя все, что нужно психологу. Если тест или лечение стандартизированы, к ним прилагается подробная инструкция по применению. Это также означает, что он прошел множество исследований и изменений, прежде чем был стандартизирован.

Стандартизация — это процесс опробования нового теста или лечения, получения отзывов и внесения изменений для его улучшения.

Некоторые психологи специализируются на разработке, испытании и пересмотре тестов. Их называют психометристами . Они изучают область психометрии , которая посвящена тому, как измерять такие вещи, как интеллект, личность или индивидуальные способности. Эти вещи могут быть сложнее оценить, чем вы думаете!

Фг. 1 Стандартизированные тесты, pixabay.com

Вы капитан своей спортивной команды. Вы несете ответственность за наблюдение за пробами и выбор новых членов для вашей команды. Вам нужно знать, какие игроки лучше всего подходят для команды и какие позиции лучше всего подходят для каждого игрока. Вы придумываете серию упражнений и ходов, чтобы оценить способности каждого человека, который пытается это сделать. В конце проб вы сравниваете выступления каждого человека и выбираете тех, кто лучше всех выступил, чтобы они стали частью команды.

Процесс стандартизации психологического теста

Стандартизация теста или лечения может занять много времени. Есть две большие цели стандартизации: сбор средних баллов населения и принятие решения по административным деталям теста . Популяция — это все люди, которым вы хотите пройти тест или пройти курс лечения. Как вы понимаете, это может быть большая группа людей.

Некоторыми примерами групп населения являются все третьеклассники в Америке, все пациенты психиатрических больниц, все клиенты, проходящие индивидуальную терапию депрессии, все люди старше 80 лет, находящиеся в определенном состоянии, или все студенты, изучающие психологию высшей школы.

Администрирование теста просто означает инструкции, которые сопровождают тест. Они сообщают учителю, терапевту или психологу, как проводить тест, сколько времени дать испытуемому, как оценивать ответы, какие оценки ожидать и что может означать каждая оценка. Предоставление информации о ожидаемых результатах требует знания оценок других людей, сдавших тот же тест. Психометристы выясняют это, заставляя сотни или тысячи людей попробовать новый тест.

Фг. 2 Администрирование онлайн-тестов, pixabay.com

Этапы процесса стандартизации тестов
Шаг 1	Выберите, что измерять и как это определять.
Шаг 2	Решите, кто будет проходить тест (население).
Шаг 3	Выберите, какие вопросы задать, как их сформулировать и сколько включить.
Шаг 4	Выберите формат ответа для каждого вопроса.
Шаг 5	Попросите как можно больше людей пройти новый тест и получить от них отзывы.
Шаг 6	Внесите изменения в тест на основе отзывов.
Шаг 7	При необходимости повторите шаги 5 и 6.
Шаг 8	Сравните тест с другими тестами, которые измеряют аналогичные или противоположные понятия.
Шаг 9	Выполняйте статистический анализ в течение всего процесса, чтобы убедиться в надежности и достоверности теста.
Этап 10	Соберите инструкции по применению.

Шаги 1 и 2 являются наиболее важными во всем процессе. Стандартизация теста очень похожа на любое другое исследование. Вы должны знать цель или цель теста, прежде чем вы сможете начать. Вам также нужен хороший рабочее определение для всего, что вы хотите измерить.

Тест, который вы найдете в Интернете, должен сказать вам, счастливы вы или нет. Результаты теста зависят от того, как испытуемые определяют счастье. Возможно, они считают, что счастье заключается в том, чтобы иметь много друзей, поэтому задают вопросы о ваших отношениях. Может быть, они определяют счастье как удовлетворение всех ваших потребностей и чувство расслабления, поэтому вместо этого они задают вопросы об этих вещах. Рабочее определение определяет содержание теста.

Шаг 4 посвящен тому, как испытуемые могут отвечать на каждый вопрос. Заполняют ли они пропуск, выбирают один из нескольких вариантов ответа, оценивают свой ответ по шкале, указывают «да» или «нет» (правда или ложь) или предоставляют целый абзац? Лучший формат ответа для теста зависит от того, какие данные собирают исследователи и какие вопросы они задают.

Вопрос в тесте звучит так: «По шкале от 1 до 10, насколько вам сегодня понравилось?» Под вопросом есть 10 точек, со словами «совсем нет» рядом с первой точкой и «очень сильно» рядом с последней точкой. Вы ставите галочку на 8-й точке, потому что хорошо провели время, но чувствуете, что организация могла бы улучшить часть тура.

Представьте, что вы проходите тест, и первый вопрос спрашивает: «Что ты ел сегодня на обед?» Варианты ответов «верно» или «ложно». Что-то здесь не так!

Шаги 5 и 6 могут занять очень много времени. Создатели теста могут повторять эти шаги много раз. Опробование теста на популяции может показать, что все вопросы теста слишком сложны или слишком просты. Это может указывать на то, что вопросы слишком похожи или сформулированы странно. Это может даже сказать исследователям, что они разработали хороший тест, но он не измеряет то, что они хотят измерить!

Вся эта обратная связь от людей, желающих попробовать тест, помогает специалистам по психометрии пересматривать и редактировать тест. Иногда исследователи отбрасывают тест и начинают с нуля. Шаги 8 и 9 происходят на протяжении всего процесса. Шаг 8 помогает разработчикам определить, какие вопросы задавать, а шаг 9 помогает решить, нужно ли им больше, меньше или другие вопросы.

Тест, предназначенный для измерения тревожности, сравнивают с другим тестом на тревожность и с тестом, измеряющим расслабление. Результаты двух тестов на тревогу должны быть одинаковыми, но результаты тестов на тревогу и релаксацию должны быть противоположны друг другу. Если кто-то набирает высокие баллы по тревожности, он также должен набирать низкие баллы по релаксации. Если они набрали высокие баллы по релаксации, они должны получить низкие баллы по тревожности.

Шаг 10 может показаться незначительным, но он очень важен. Руководства по администрированию тестов сообщают исследователям, где проводить тест, как его проводить (на бумаге или в Интернете), сколько времени он должен занимать, как оценивать его и как понимать результаты. Вы проходите онлайн-тест и получаете 35 баллов. Что это значит? Это хороший или плохой результат? Каков он по сравнению с другими людьми, сдавшими тот же тест?

Примеры стандартизации и нормы в психологическом тестировании

Тест, предназначенный для определения самого популярного вкуса мороженого в Америке, прошел процесс стандартизации. Вариант, который чаще всего выбирали те, кто попробовал тест, был шоколадным. Если люди, опробовавшие тест, точно представляют население (все американцы), мы можем сказать, что популяционная норма для лучшего вкуса мороженого – шоколадное.

Вы и ваш лучший друг решаете пройти тест. Ваш лучший друг выбирает ваниль. Вы ищете в списке вариантов свой любимый вкус, но его нет в тесте. Вы понимаете, что в тесте всего 3 варианта ответа: клубничный, ванильный и шоколадный. Подождите минутку: существует гораздо больше, чем 3 вкуса мороженого! Является ли этот тест точным?

Что, если в одном и том же тесте перечисляются все существующие вкусы мороженого. Что бы означал ваш ответ? Если вы выбираете шоколад, вы знаете, что ваш любимый вкус такой же, как у большинства людей в Америке. Если вы выберете что-то другое, вы знаете, что ваш любимый вкус менее популярен. Это простой пример, но он иллюстрирует, как популяционная норма помогает исследователям понять результат теста.

Популяционная норма – это расчетный средний балл члена определенной популяции. Он включает в себя то, какие оценки считаются чрезвычайно высокими или низкими среди этой группы населения.

Нормы в психологическом тестировании

В целом в психологии существует 4 типа популяционных норм. Это нормы возраста, нормы оценок, нормы процентилей и нормы стандартных баллов . Возрастные нормы используются при тестировании интеллекта и измерении роста и веса у детей. Нормы оценок в основном используются в образовательных учреждениях. Экзамены на уровне класса, такие как SAT, сравнивают результаты учащихся с результатами других учеников того же класса и других классов.

Процентильные оценки более детализированы. Они сообщают вам, где находится ваша оценка в большом наборе оценок. Если вы наберете 50-й процентиль, половина людей, сдавших экзамен, набрали те же , что и вы. Если вы наберете 75-й процентиль, 75% людей, сдавших экзамен, набрали на меньше вашего балла. Если вы наберете 25-й процентиль, 25% людей, сдавших экзамен, набрали баллов ниже вашего балла на . Вы также можете выяснить, какой процент испытуемых набрал 9 баллов.0021 выше на основе вашего процентиля.

Стандартные оценки содержат еще больше нюансов, чем процентные оценки. Они говорят вам, насколько близко вы набрали среднее значение всех результатов. Если ваш стандартный балл выше 0, это означает, что вы набрали больше среднего. Если это отрицательное число (ниже 0), это означает, что вы набрали меньше среднего. В психологии их обычно называют z-показателями.

В StudySmarter есть полное объяснение z-показателей!

Важность стандартизации в психологическом тестировании

Каждый день мы принимаем решения на основе тестов. Учителя планируют, какой материал преподавать, врачи решают, правильно ли растет ребенок, а терапевты пытаются определить, работает ли метод лечения. Колледжи решают, каких новых студентов принимать. Все эти решения частично основаны на результатах испытаний. Если решение основано на стандартизированном тесте, психологи назвали бы это решением, основанным на фактических данных .

Стандартизированные тесты и методы лечения являются важными научными инструментами. Длительный и сложный процесс стандартизации помогает исследователям гарантировать точность используемых тестов и стабильные результаты. Этот процесс также сообщает разработчикам тестов, какие изменения нужно внести в тест. Как только тест стандартизирован, он продолжает проходить процесс стандартизации для каждого нового населения, языка, формата и культуры.

Фг. 3 Вступительные экзамены в колледж, pixabay.com

Стандартизация и нормы — основные выводы

Стандартизированный тест включает в себя надежные методы, точное содержание, административные инструкции и средние баллы популяции для сравнения с баллами выборки.