Интерпретация теста: BioPredictive · Интерпретация тестов
Интерпретация результатов теста — Pro-Psixology.ru
В данном виде тестовая ситуация (жизненная ситуация в миниатюре) может рассматриваться как предъявляющая почти непомерные требования к способности личности к взаимодействию. На короткий период (время тестирования) психологическое пространство ребенка переполняется множеством эмоциональных «событий», которые обычно распределены в более длительном периоде его жизни. Однако понятно, что ребенок не переживает тестовый опыт так, как он переживал бы реальный жизненный опыт, и его чувства, таким образом, менее пылкие. Тем не менее такая ситуация не делает чувства ребенка менее подлинными или менее отражающими его межличностное взаимодействие, так как оба вида реакций — «пылкие» (в жизни) и «рассудочные» (в тестовой ситуации) — происходят из одного источника. К тому же ребенок мало способен делать четкое различие между «как если бы» и действительным, и чем младше ребенок, тем меньше он это различает. Тестовая и жизненная ситуации имеют для него тенденцию сливаться. Распределение чувств в тесте может быть также выражено в терминах «пережитых» чувств, исходящих от ребенка, и «воображаемых» чувств, направленных к ребенку. Даже такое различие не совсем определенно для ребенка, так как его психологические границы более гибки и неустойчивы, чем психологические границы взрослого.
1. Относительная психологическая значимость различных членов семьи. Из общих соображений распределение ответов могло бы походить на гипотетическое распределение (рис. 9).
Рис. 9. Диаграмма ожидаемого распределения ответов ребенка
Сумма всех высказываний, адресованных одному человеку, показывает степень вовлеченности в отношения с этим человеком. Сравнивая реальное распределение и гипотетическое ожидаемое, можно увидеть, не смещено ли распределение чувств от родителей к другим членам семьи. Также должно быть замечено, нет ли преувеличенной реакции — положительной или отрицательной — на одного из родителей.
2. Эгоцентрические ответы. Эгоцентрические ответы содержат два элемента: любовь к себе и ненависть к себе. Оба они, однако, указывают на чрезмерную занятость собой. Основываясь на клиническом опыте, можно ожидать высокого уровня любви к себе у привилегированных детей или детей, чрезмерно идущих на поводу своих желаний, и высокого уровня ненависти к себе у отвергаемых и ненавидимых детей или детей с чувством неполноценности, вины и стыда.
3. Амбивалентность. Отношения между положительными и отрицательными исходящими чувствами и положительными и отрицательными получаемыми чувствами, высказанными ребенком, могут составить амбивалентную пропорцию. Амбивалентность фиксируется, если положительных пунктов было направлено члену семьи не более чем в два раза больше, чем отрицательных, или если количество отрицательных пунктов, направленных члену семьи, не превышает количество положительных более чем в два раза. Те вопросы, которые выражают получаемые ребенком чувства, и те, которые выражают исходящие чувства, рассматриваются независимо друг от друга.
4. Чувства, исходящие от ребенка и получаемые им. Исходящие чувства — это те чувства, источником которых является ребенок и которые делают его любящим, амбивалентным или ненавидящим. В случае обычного ребенка мы можем ожидать, что эти чувства будут связаны с его поведением. Сдержанный ребенок, который не способен выразить свои чувства в реальной жизненной ситуации, может оказаться способным сделать это в тестовой ситуации, но может быть сдержанным и в обеих ситуациях. Выраженные ребенком полученные чувства зависят от его жизненного опыта и от его системы защиты.
Данные о полученных чувствах ставят нас перед двумя «реальностями» ребенка — реальностью «действительных» эмоций, направленных на ребенка, и его «психической» реальностью воспринятых эмоций, соответствующих его потребностям или нуждам. Эмоции, которые дети направляют другим, тесно соотносятся с чувствами, которые, как они полагают, направляются им самим. Данные показывают, что в большинстве случаев получаемые чувства Удивительно соответствуют исходящим от ребенка чувствам, как если бы у ребенка была внутренняя обсчитывающая система, которая давала бы на выходе ровно столько, сколько получает.
5. Защиты. Тестовая ситуация имеет тенденцию создавать систему защиты от чувств, вызывающих у ребенка ощущение вины. Эти защиты — обычные способы защиты, видоизмененные ограничениями, накладываемыми тестовым материалом. Результаты теста могут обнаружить следующие защитные механизмы.
Отказ: ребенок отдает большинство положительных и отрицательных высказываний «Никому».
Идеализация: ребенок отдает большинство вопросов положительного характера членам семьи, в то время как большинство отрицательных отдает «Никому».
Смещение: ребенок отдает большинство высказываний периферическим членам семьи.
Осуществление желаний, регрессия: эти защиты могут быть выявлены, если ребенок направляет на себя большинство вопросов, выражающих сверхпокровительственные, сверхпотакающие чувства.
Результаты, полученные при проведении теста в клинике, помогли обнаружить дополнительные виды защит:
— проекция, когда ребенок преувеличенно и нереально приписывает другим положительные и отрицательные чувства и в то же время отрицает их у себя;
— реакция формирования, когда ребенок подменяет свои ответы противоположными, стараясь скрыть слишком яркие положительные или отрицательные чувства.
Отсутствие нормальной защищенности. Если протокол показывает чрезмерное проявление сильных положительных или отрицательных чувств, мы можем говорить о недостатке защищенности.
Более подробно следующие этапы интерпретационной работы с результатами теста описаны в руководстве к тесту.
Раздел IX. ИНТЕРПРЕТАЦИЯ ТЕСТОВ И ОПРОСНИКОВ. Деловая психология
Раздел IX. ИНТЕРПРЕТАЦИЯ ТЕСТОВ И ОПРОСНИКОВ. Деловая психологияВикиЧтение
Деловая психология
Морозов Александр Владимирович
Содержание
Раздел IX. ИНТЕРПРЕТАЦИЯ ТЕСТОВ И ОПРОСНИКОВ
Тест № 1
КАКОГО ПОЛА ВАШЕ МЫШЛЕНИЕ?
Для того чтобы подсчитать баллы, воспользуйтесь следующей формулой:
для мужчин для женщин
а) + 10 баллов; а) + 12 баллов;
б) + 5 баллов; б) + 5 баллов;
в) – 5 баллов, в) – 5 баллов.
За каждый вопрос, оставленный без ответа, – 5 баллов.
Большинство мужчин набирают от 0 до 60 баллов.
Большинство женщин – от 50 до 100 баллов.
Пограничный случай – от 50 до 60 баллов – показывает, что для вашего мышления равно характерны мужские и женские черты.
Мужчины, набравшие меньше 0, и женщины, набравшие больше 100 баллов, имеют склад мышления, резко отличный от противоположного пола.
У мужчин, набравших 60 баллов, может проявляться склонность к женскому типу мышления; у женщин, набравших меньше 50 баллов, может проявляться склонность к мужскому варианту мыслительных процессов.
Данный текст является ознакомительным фрагментом.
16. Достоинства метода тестов
16. Достоинства метода тестов Метод тестов является одним из основных в современной психодиагностике. Под тестами следует понимать методики, которые состоят из серии заданий с выбором из готовых вариантов ответа. При подсчете баллов по тесту выбранные ответы получают
17. Недостатки метода тестов
17. Недостатки метода тестов Метод тестов обладает некоторыми весьма серьезными недостатками, не позволяющими свести всю диагностику способностей и знаний исключительно к тестированию.1. Опасность «слепых» (автоматических) ошибок. Пользователь не должен подходить к
Варианты опросников Р-Д-В
Варианты опросников Р-Д-В Нами разработано три варианта опросника. Вариант А — для взрослых, вариант Б — для подростков, вариант В — для детей.Приведем тексты
Раздел 1 Основные требования к конструированию и проверке психологических тестов
Раздел 1 Основные требования к конструированию и проверке психологических тестов 1. 1. Надежность психологических тестов (опыт психологической интерпретации)По мере того как расширилось практическое применение тестов и увеличилось их изготовление, все настоятельнее
Приложение 1. НЕСКОЛЬКО ПСИХОЛОГИЧЕСКИХ ТЕСТОВ ДЛЯ БРАЧНЫХ ПАРТНЕРОВ
Приложение 1. НЕСКОЛЬКО ПСИХОЛОГИЧЕСКИХ ТЕСТОВ ДЛЯ БРАЧНЫХ ПАРТНЕРОВ Насколько ты ревнива? Интересное чувство – ревность. В небольших дозах она, как оригинальный соус, способна вызвать интерес к любому (даже надоевшему) блюду. Но каждая хозяйка знает, как важно не
Приложение 3 Стимульный материал графических тестов Сильвер
Приложение 3 Стимульный материал графических тестов Сильвер Стимульные изображения задания на воображения Рисуночного теста Сильвер Стимульные изображения теста «Нарисуй
Техника проведения психологических рисуночных и цветовых тестов
Техника проведения психологических рисуночных и цветовых тестов Интерпретация рисунка широко используется в психодиагностической практике.
Основные рекомендации по технике проведения психологических рисуночных тестов следующие.Тестируемому необходимо дать чистыйПОЗНАЕМ СЕБЯ С ПОМОЩЬЮ ТЕСТОВ
ПОЗНАЕМ СЕБЯ С ПОМОЩЬЮ ТЕСТОВ Управление другими начинается с управления собой. Но, чтобы управлять, надо иметь представление об объекте управления, его особенностях, сильных и слабых сторонах.Такому самоуправлению способствует тестирование. Тесты выполняют двойную
Примеры тестов
Примеры тестов Многие тесты, как предполагается, измеряют интеллект; они отличаются по нескольким параметрам. Некоторые тесты дают один итоговый показатель как индекс глобального, или общего интеллекта. Наверное, наиболее известный тест общего интеллекта — это тест
Проведение рисуночных тестов
Проведение рисуночных тестов Как уже указывалось, существует много разнообразных рекомендаций по проведению рисуночных тестов. Подчас они противоречат друг другу. Обычно можно найти как свои достоинства, так и недостатки в каждом из предлагаемых вариантов. Например,
Зависимость от тестов: как мы становимся «тестоманами»
Зависимость от тестов: как мы становимся «тестоманами» Как известно, люди с постепенно усиливающейся зависимостью от наркотиков рано или поздно достигают точки, когда уже не могут представить себе жизни без наркотиков. И продолжают принимать их, причем не потому, что
Краткая история тестов для определения коэффициента интеллектуальности
Краткая история тестов для определения коэффициента интеллектуальности Как уже упоминалось, в начале XX века психологи подметили, что существует определенная корреляция или, проще говоря, взаимосвязь между величиной и степенью прочности словарного запаса,
4.
Интерпретация теста | Руководство по психологическому тестированию: основные понятия психологического тестированияОпределение: размещение данных измерений в контексте или осмысление результатов тестов.
Описание. Интерпретация результатов теста зависит от всех предшествующих шагов. То есть процесс построения теста должен привести к достоверному тесту, если интерпретация должна быть достоверной; тест должен быть проведен и оценен с минимальной ошибкой во время этих процессов. Поскольку тесты никогда не бывают абсолютно достоверными, интерпретация должна включать утверждения о пределах теста, на которые влияют продемонстрированные и вероятные источники ошибок. Без таких заявлений об ограничениях вы можете неправильно интерпретировать оценки используемых вами методов измерения.
Интерпретация тестов, особенно в образовательных учреждениях, традиционно ориентировалась на нормы. В нормативных тестах результат теста интерпретируется путем сравнения его с группой результатов. Я могу сказать, например, что учащийся 3-го класса по результатам теста достижений ставит его или ее на 90-й процентиль успеваемости. Интерпретации, основанные на нормах, обычно противопоставляются интерпретациям тестов, основанным на критериях (т. Е. Сравнение со стандартом, а не с другими людьми). Тот же самый учащийся 3-го класса мог правильно ответить на 35 из 40 тестовых заданий, оценивающих ранее пройденный материал; учитель может установить критерий из 30 правильных ответов для студентов, чтобы пройти курс.
Другие типы интерпретаций также полезны. С помощью формирующих тестов интерпретация фокусируется на успеваемости человека по компонентам курса. Например, на уроке математики формирующий тест может предоставить информацию о конкретных типах задач на сложение или вычитание, на которые конкретный учащийся ответил правильно и неправильно. Во время курса формирующие тесты предоставляют учителю и ученику обратную связь, которая показывает прогресс и помогает корректировать обучение. В сфере образования Кросс и Анджело (1988) описал этот процесс как петлю «от техники обучения к обратной связи об обучении учащихся и пересмотру техники» (стр. 2).
Суммарные тесты обеспечивают общую оценку успеваемости человека по курсу (например, оценку за курс). Суммарные тесты предоставляют данные, удобные для принятия управленческих решений. Суммарные тесты могут предложить исходные гипотезы, относящиеся к обучению: например, стандартизированный тест успеваемости может описать сильные и слабые стороны учащегося (по сравнению с другими учащимися) по предметным областям. Эта информация может иметь отношение к включению или исключению из образовательной программы (например, коррекционного курса или повторного обучения). Однако для разработки и проверки этих гипотез потребуются более чувствительные меры, и именно здесь могут быть полезны формирующие тесты (Bloom, Hastings, & Madaus, 19).71; Кросс и Анджело, 1988). Интерпретация итоговых тестов сосредоточена на совокупной оценке (элементов и компонентов), в то время как администраторы формативных тестов обычно исследуют шаблоны ответов на вопросы (Bloom et al. , 1971).
В литературе гораздо больше внимания уделяется тому, как администратор теста или исследователь интерпретирует результаты теста, чем тому, как их понимают испытуемые. Единственным исключением из этого является исследование эффекта Барнума . Оценка достоверности конкретной интерпретации теста зависит от сравнения с другими типами интерпретации теста. Эффект Барнума возникает, когда люди проходят тест и получают его интерпретации, основанные не на данных их тестов, а на простых общих утверждениях, которые могут быть применимы к любому, например, утверждениях, которые фигурируют в гороскопах («Упорно работайте сегодня, и ваши усилия окупятся» ). Тестируемые обычно находят такие фиктивные отзывы такими же точными, как и настоящие интерпретации тестов. Гуастелло и Рике (1990) оценили точность реальных интерпретаций компьютерных тестов (CBTI) на основе баллов 16PF (индивидуальный опросник) с поддельными отчетами. Выборка из 54 студентов колледжа оценила настоящие отчеты как точные на 76%, а поддельные отчеты — как точные на 71%. Компьютерные отчеты, вероятно, усиливают эффект Барнума, потому что многие люди приписывают повышенное доверие компьютерным операциям.
4.1 Нормы
Определение: Данные о распределении баллов по конкретному тесту.
Описание. Как описано ранее, в интерпретациях, основанных на нормах, цель тестирования состоит в том, чтобы сравнить баллы между людьми. Таким образом, тест предназначен для выявления индивидуальных различий в интересующей конструкции. Gronlund (1988) указал, что разработчики стандартных тестов ищут элементы с максимально возможной изменчивостью. С тестами достижений эти элементы выполняются в процессе отбора, в котором сохраняются элементы средней сложности; простые и трудные предметы, которые все сдают или терпят неудачу, скорее всего, будут отброшены. Агрегация таких элементов увеличивает возможность проведения достоверных различий между людьми.
Тестирование по нормам было преобладающим подходом в отборочном тестировании (Murphy & Davidshofer, 1994). Помимо более низкой стоимости, тесты, основанные на нормах, также кажутся более применимыми, когда администратор тестирования хочет выбрать некоторую часть группы (например, 10% лучших кандидатов) по сравнению со всеми кандидатами, которые могут успешно выполнять определенную функцию. Таким образом, тесты, основанные на нормах, полезны в ситуациях отбора, когда люди отбираются частично на основе ограниченных ресурсов. Предположим, вы проводите исследование и обнаруживаете, что 95% всех аспирантов, набравших 600 или более баллов по вербальной шкале GRE, могут пройти все необходимые курсы последипломной школы. С точки зрения критериального тестирования, все, кто набрал 600 баллов и выше, должны быть допущены. Однако на многих аспирантских факультетах это означало бы прием большего количества студентов, чем доступных курсов, инструкторов или финансовой поддержки. Такая ситуация, безусловно, имеет место в других образовательных, профессиональных и клинических условиях с фиксированными квотами. Таким образом, тестирование, основанное на нормах, предлагает решение: определить число, набравшее наибольшее количество баллов, которое соответствует имеющимся ресурсам.
Если тест предназначен для использования в качестве средства отбора, его элементы должны разрабатываться на выборке, репрезентативной для населения, для которого предназначен тест. Таким образом, выбор группы нормы для разработки теста может иметь серьезные последствия для интерпретации будущих результатов по сравнению с этой группой. Много споров возникло, например, по поводу широкого использования тестов интеллекта или опросников профессиональных интересов, которые были разработаны и нормированы преимущественно для белых людей из среднего класса.
4.2 Статистика, связанная с измерениями
Определение: Статистика, используемая для облегчения интерпретации результатов тестов.
Описание. Понимание результатов тестов часто зависит, по крайней мере частично, от понимания ряда статистических показателей, обычно рассчитываемых с помощью тестов. Например, разработчики тестов обычно изучают (и предоставляют информацию о) частотном распределении всех результатов тестов, чтобы определить, является ли оно нормальным. Точно так же разработчики могут предоставить информацию о диапазоне и стандартном отклонении оценок, чтобы проверить, существуют ли достаточные индивидуальные различия. Ниже я описываю статистику, обычно используемую в процессе интерпретации теста. Учащиеся, желающие ознакомиться со статистикой или узнать о ней, могут посетить этот веб-сайт или посмотреть это видео.
среднее или среднее значение является мерой центральной тенденции; то есть в группе оценок, где находится среднее или наиболее репрезентативное значение? Среднее значение находится путем суммирования баллов в группе и деления количества баллов. Другими показателями центральной тенденции являются медиана и мода . Эти показатели обеспечивают типичную оценку, характеризующую эффективность всей выборки. Среднее, наряду с другими мерами центральной тенденции, особенно полезно для сравнения различных групп (например, детей разного возраста), которые проходят один и тот же тест, а также для описания отдельных лиц по отношению к набору баллов группы (где один индивидуум оценка за контрольную по курсу по отношению ко всему классу).
Помимо знания центральной тенденции в группе оценок, часто бывает полезно знать, насколько рассеяны оценки. Один из таких показателей дисперсии, стандартное отклонение , относится к среднему отклонению баллов от среднего. Чем больше стандартное отклонение, тем шире разброс оценок.
Корреляция относится к степени ковариации двух переменных. Коэффициент корреляции выражает степень взаимосвязи между двумя наборами показателей. Например, если человек, набравший наибольшее количество баллов в Тесте 1, также получил наивысший балл в Тесте 2, а человек, занявший второе место в Тесте 1, также является вторым лучшим в Тесте 2, и так далее до человека, набравшего наименьшее количество баллов в каждом тесте. теста, будет существовать идеальная положительная корреляция (+1,00). Если имеет место полная инверсия оценок, так что человек, набравший наивысший балл по переменной 1, получает самый низкий балл по переменной 2 и т. д., будет идеальная отрицательная корреляция (-1,00). Нулевая корреляция указывает на отсутствие взаимосвязи между двумя переменными, которая может возникнуть случайно. Таким образом, коэффициенты корреляции попадают в диапазон от -1,00 до +1,00.
Данные, составляющие основу коэффициента корреляции, также могут быть представлены в виде графика. На приведенном ниже графике показано соотношение между количеством вопросов викторины, на которые учащиеся ответили неправильно, и порядком, в котором они сдали экзамен:
Рисунок 12 как показывает диаграмма рассеяния ( Рисунок 3-4 ), учащиеся, которые завершили тест раньше, обычно давали меньше неправильных ответов. Однако отношения не идеальны; например, второй учащийся, сдавший викторину, дал 3 неправильных ответа. Корреляция, рассчитанная для этих данных, составляет 0,51 со средним значением 1,66 и стандартным отклонением 2,29.. Хотя причина представления этих (фактических) данных состоит в том, чтобы объяснить идею корреляции, есть ли у вас какое-либо существенное представление о том, почему эта связь должна существовать? Другими словами, как бы вы объяснили, почему ученики, которые справились с тестом быстрее, обычно получали более высокие оценки?
Стандартная оценка или z оценка представляет собой преобразование необработанной оценки, чтобы показать, сколько отклонений от среднего составляет эта оценка. Формула:
z = (Исходный балл – среднее значение) / Стандартное отклонение)
Таким образом, z равно необработанной оценке человека минус среднее значение группы оценок, деленное на стандартное отклонение группы оценок. Часто наилучшей информацией, которую может дать нам тестовая оценка, является степень, в которой человек набирает высокие или низкие баллы в распределении баллов. Показатель z представляет собой краткий обзор положения человека: положительные значения z указывают, что человек был выше среднего, а отрицательные баллы указывают на то, что человек получил оценку ниже среднего.
Также были разработаны другие типы стандартных оценок, в том числе stanines, IQ отклонений, sten-баллы и T-баллы. T-баллы , например, позволяют нам преобразовать баллы по тесту в распределение баллов по нашему выбору. T-показатели используют произвольно фиксированные средние значения и стандартные отклонения и исключают десятичные точки и знаки. Формула:
T = (SD * z) + M
, где SD — выбранное стандартное отклонение, M — выбранное среднее значение, а z — стандартный балл для оценки человека по тесту. Например, мне может показаться проще давать обратную связь, используя распределение баллов, среднее значение которого равно 50, а стандартное отклонение равно 10. Если у человека есть балл по тесту, z которого равен -0,5, Т-показатель будет следующим:
(10 -.5) + 50 = 45
Тесты, такие как Анализ потенциала обучения , используют фиксированное среднее значение 50 и стандартное отклонение 20, в то время как Тест на школьные способности (SAT) и Экзамен на выпускной экзамен ( GRE) исторически использовали 500 в качестве среднего значения и 100 в качестве стандартного отклонения. Опять же, Т-оценка обеспечивает удобный перевод оценок, чтобы они могли быть более понятными при интерпретации теста.
Признавая, что ошибка влияет на любой конкретный случай тестирования, стандартная ошибка измерения (SEM) представляет собой стандартное отклонение, которое было бы получено для серии измерений одного и того же человека, если бы этот человек не изменился в измеряемом конструкте за этот период времени. Например, предположим, что я провожу тест, измеряющий устойчивую черту 10 раз для конкретного человека. Если бы этот человек получал одинаковую оценку в каждом тестовом случае, ошибки измерения не было бы. В действительности, однако, результаты теста будут различаться для каждого теста, а SEM — это статистика, предназначенная для суммирования количества вариаций. Если у вас есть оценка надежности теста, SEM можно рассчитать следующим образом:
SEM = стандартное отклонение * SqRt (1 – r)
Таким образом, SEM равняется стандартному отклонению группы баллов, умноженному на квадратный корень из 1 минус оценка надежности. SEM помогают нам узнать, в какой степени можно доверять конкретному результату теста человека как показателю истинного результата теста.
Наконец, стандартная ошибка оценки (SEE) помогает нам узнать достоверность способности результатов теста предсказать какой-либо критерий. Точно так же, как ни один тест не дает одинаковую оценку при повторном проведении человеку, ни одна оценка не будет связана с одинаковой оценкой по критерию. Таким образом, SEE относится к разбросу баллов по критерию или, точнее, к стандартному отклонению баллов критерия для людей, которые все имеют одинаковый балл в тесте на предикторы. Формула SEE:
SEE = стандартное отклонение * SqRt (1 – v 2 )
SEE равно стандартному отклонению для группы показателей критерия, умноженному на квадратный корень из 1 минус квадратный коэффициент достоверности (v). Коэффициент достоверности — это просто корреляция между тестом предиктора и критерием, который пытаются предсказать. Например, аспирантура часто отбирает кандидатов на основе их баллов GRE, поскольку было показано, что баллы GRE (предикторный тест) имеют умеренную корреляцию со средним баллом первого года обучения (критерий). SEE помогает нам получить представление о том, насколько велика может быть вариация вокруг критерия, учитывая конкретный результат теста человека.
Давайте пройдемся по простым расчетам стандартной оценки, SEM и SEE. Начните с z или стандартной оценки. Предположим, что следующее представляет собой группу тестовых результатов. Чтобы вычислить z-оценку, мне нужно среднее значение (равное 87,95) и стандартное отклонение (6,82) для этой группы оценок. Рисунок 13 вы набрали немного больше среднего в этой группе баллов.
С другой стороны, если ваш результат равен 70, ваш показатель z будет следующим:
(70 – 87,95) / 6,82 = -2,63
Этот z означает, что ваш результат был значительно ниже среднего.
SEM зависит от стандартного отклонения и надежности конкретного теста. Если у меня есть тест с оценкой надежности 0,90 (высокий) и стандартным отклонением 15, то SEM равно:
15 * SqRt (1-0,9) = 4,7
Таким образом, 4,7 представляет 1 единицу стандартного отклонения для распределение баллов вокруг истинного балла человека. Однако, если оценка надежности теста была 0,7, SEM увеличивается:
15 * SqRT (1-0,7) = 8,21
Таким образом, чем ниже надежность теста, тем меньше у меня уверенности в том, что истинная оценка человека близка к фактической полученной оценке.
Наконец, с SEE мне нужна корреляция между тестом и критерием, а также стандартное отклонение для группы оценок критерия. Если бы корреляция между тестом и критерием равнялась 0,61, а стандартное отклонение для оценок критерия равнялось 100, тогда SEE был бы:
100 * SqRt (1-[0,61*0,61]) = 79
Таким образом, 79 представляет собой 1 единицу стандартного отклонения от оценки критерия. Однако, если бы корреляция между предиктором и критерием упала до 0,30, SEE увеличилась бы:
100 * SqRT (1-[0,30*0,30]) = 95
Таким образом, чем ниже корреляция, тем меньше достоверность I Имейте в виду, что прогнозируемая оценка критерия — это истинная оценка, которую человек действительно получит.
4.3 Интерпретации, основанные на критериях
Определение: Интерпретация результатов теста по отношению к критерию или заранее установленному уровню вместо других лиц.
Описание. Предположим, что человек получил 95% баллов за школьный тест. Что это значит? В интерпретации, основанной на норме, это будет означать, что учащийся набрал более 94% баллов по сравнению с остальным классом. Критериальное утверждение будет «правильно заполнено 95 из 100 вопросов». Интерпретации, основанные на критериях, просто описывают работу по отношению к стандарту, отличному от других людей.
В тестах со ссылкой на критерий элементы сохраняются во время разработки теста из-за их отношения к критерию, независимо от частоты правильных или неправильных ответов. Однако тесты, основанные на критериях, стоят дороже, чем тесты, основанные на нормах, потому что они (а) требуют значительных усилий при анализе и определении измеряемых критериев эффективности и (б) могут потребовать специальных средств и оборудования помимо материалов для самоотчетов. Если кто-то заинтересован в прогнозировании производительности по критерию — основной цели выборочного тестирования — тогда подходы, основанные на критериях, кажутся логичным выбором. Если кого-то интересует, может ли человек бросить мяч в баскетбол, обычно имеет больше смысла дать ему или ему 20 бросков, чем тест на зрительно-моторную координацию.
При разработке тестов, основанных на критериях, Swezey (1981) подчеркивал важность точного определения целей теста. Критерии могут быть описаны в терминах переменных, таких как продукт или процесс, качество, количество, время выполнения, количество ошибок, точность и скорость (Gronlund, 1988). Критерием может быть такой продукт, как «учащийся правильно решает 10 задач по математике»; критерием процесса может быть «ученик решает задачи на деление в правильной последовательности». Измерение процесса полезно, когда требуется диагностическая информация, когда продукт всегда следует из процесса и когда трудно получить данные о продукте.
Тесты, основанные на критериях, должны быть надежными и валидными в той мере, в какой характеристики, условия тестирования и стандарты точно указаны в отношении критериев. Swezey (1981) предпочел «в течение 5 минут» «в нормальных условиях времени» в качестве точного стандарта тестирования. В некоторых отношениях подход, основанный на критериях, представляет собой переход от поиска общих закономерностей к уточнению значения результатов тестов с точки зрения важных аспектов измерения. Обсуждая валидность теста, Уайли (1991) затронул аналогичную тему, когда написал, что маркировка теста должна быть «достаточно точной, чтобы можно было отделить компоненты невалидности от достоверных вариаций результатов» (стр. 86). Заявления Суизи и Уайли указывают на то, что в этой области все больше внимания уделяется экспликации конструкций.
Джентиле и Мурняк (1989) описали набор критериев для оценки учащихся, выполняющих искусствоведческие задания. Они отметили, что художественная критика — это сложный аналитический навык, требующий от учащихся оценки и интерпретации своих и чужих художественных работ. Джентиле и Мурняк предложили 50-балльную систему оценивания заданий учащихся:
1. Применяет критерии критического мышления (0-10).
2. Использует техническую лексику (0-10).
3. Предоставляет обратную связь по критериям (0-10).
4. Представляет критику (0-10).
Джентиле и Мурняк (1989) предложили возможный проходной балл в 35 баллов. Студенты, набравшие более низкие баллы, должны были пересмотреть и повторно отправить свою работу на основе отзывов преподавателя по этим критериям.
Интерпретация тестов — IResearchNet
Одним из самых важных и устойчивых вкладов психологии в цивилизацию является разработка психологических тестов. Психологи изобрели и усовершенствовали психометрические процедуры (то есть тесты) для оценки невероятно широкого набора конструктов. Среди тем, рассматриваемых в этом томе «Энциклопедии консультирования», например, есть оценка академических достижений, адаптивное поведение, аффект, процесс консультирования, результат консультирования, депрессия, интеллект, язык, память, психический статус, нейропсихологическое функционирование, личность, решение проблем, психопатология и самооценка. Также рассматриваются процедуры оценки, такие как использование клинических интервью и проективных методов. Психологи в настоящее время разрабатывают передовые технологии, такие как компьютерная оценка, компьютерная интерпретация тестов и теория ответов на задания.
Большинство психологов-консультантов считают психологическую оценку важной деятельностью, независимо от условий их работы или типа клиентуры. Национальный опрос членов Американской психологической ассоциации показал, что рабочая деятельность психологов-консультантов включает сбор информации о своих клиентах (80,3%), а также выявление и диагностику проблем своих клиентов (76,6%). Более 20% их общего профессионального времени посвящено оценке и диагностике. Психологические тесты настолько важны для работы психологов, что Рене В. Дэвис и Дэвид Любински описали их как выполняющих ту же функцию, что микроскоп для микробиологов и телескоп для астрономов.
Оценка не является самоцелью; критическая цель состоит в том, чтобы получить информацию, которая будет полезна при решении практических проблем, стоящих перед личностью и обществом. Тем не менее, дополнительная полезность оценки не установлена, и вера в ценность оценки основывается больше на предположениях о полезности, чем на эмпирически доказанных преимуществах. Хотя в исследованиях изучалась эффективность и результативность различных терапевтических подходов, процессу оценки уделялось мало эмпирического внимания.
Интерпретация тестов, в частности, является одной из процедур оценки, которая получила относительно небольшое научное исследование. В этой статье описываются подходы к оценке и интерпретации, объясняется, как опытный психолог готовит и проводит интерпретацию, а также обобщаются данные, касающиеся эффективности интерпретации тестов.
Подходы к оценке
Клиническое интервью
Методом оценки, наиболее широко используемым психологами-консультантами, является клиническое интервью. Однако процедуры психометрической оценки имеют многочисленные преимущества перед интервью. Например, терапевты получают опыт от одного клиента за раз, но тесты предоставляют информацию, основанную на большом количестве людей в форме групп норм. Учитывая ошибочность человеческой памяти, терапевты, вероятно, забывают некоторые случаи и придают слишком большое значение памятным, но нетипичным случаям. На группы норм, обеспечиваемые тестами, не слишком влияют необычные или графические случаи.
Проведение теста для человека можно рассматривать как аналог стандартного собеседования. По завершении процедуры тест сообщает описательную информацию (баллы), имеющую приблизительно известный уровень надежности. Напротив, психологи проводят полустандартные интервью и получают описательную информацию, достоверность которой неизвестна. Результаты тестов предполагают выводы, имеющие приблизительно известную достоверность. Напротив, психологи делают выводы, которые менее достоверны, чем выводы, сделанные на основе тестов. Кроме того, сторонники и критики неоднократно проверяют надежность и валидность тестов, в то время как надежность и валидность интервью как средства оценки практически никогда не проверяются.
Клинический прогноз против статистического
Конечная цель оценки — получить информацию, которая может быть использована для принятия важных решений, которые должны принимать психологи и испытуемые. Это означает, что информация, полученная в ходе испытаний, должна быть полезна для прогнозирования важных явлений реального мира. Вопросы, с которыми сталкиваются люди и которые требуют предсказаний, столь же разнообразны, как и сама жизнь: следует ли жениться или развестись, какой курс обучения или какую работу выбрать, следует ли разрешить заключенному воссоединиться с обществом и какой подход будет наиболее эффективным. симптомы, которые мешают способности человека функционировать в обществе. Короче говоря, полезность результатов тестов заключается в реальных критериях, которые они могут предсказать.
В 1954 году Пол Миль продемонстрировал, что выводы (т. е. прогнозы), которые подготовленные терапевты делают на основе психологических тестов, не так точны, как выводы, сделанные с помощью статистических алгоритмов. Опубликовано более 100 исследований, демонстрирующих, что статистические алгоритмы обычно более точны, чем обученные терапевты, в предсказании поведения людей в будущем.
Более высокая точность статистических алгоритмов объясняется несколькими факторами, описанными выше (т. е. группами норм, надежностью и валидностью). Дополнительная проблема возникает при объединении нескольких фрагментов информации. Терапевты имеют ограниченную способность определять надлежащий вес каждого фактора, и они, вероятно, будут зависеть от не относящихся к делу соображений. Статистические алгоритмы рассчитывают веса для каждого фактора, что приводит к максимально точным прогнозам.
Несмотря на неопровержимые доказательства того, что актуарные прогнозы более точны, использование тестовой информации в клинической практике практически не изменилось за полвека, прошедшие с момента публикации книги Мила. Задача психологии состоит в том, чтобы разработать процедуры для лучшей интеграции результатов процедур оценки в клиническую практику. Тщательное изучение этого вопроса давно назрело.
Компьютерная интерпретация тестов
Разработка компьютерных программ, способных подготавливать интерпретацию тестов, была начата в области измерения профессионального интереса три десятилетия назад. С тех пор практика расширилась и теперь включает личностные тесты и тесты, используемые для постановки психологических диагнозов. По сути, компьютерная программа сравнивает результаты теста с нормативными данными, доступными для теста, и определяет диапазон, в который попадает оценка (например, очень низкая, средняя, слегка повышенная). Затем он выбирает соответствующие описательные фразы, предложения и абзацы из библиотеки интерпретирующих материалов и организует их в описательное резюме. По завершении эту сводку можно отобразить на мониторе компьютера и распечатать по желанию.
Некоторые интерпретации состоят из не более чем нормативных утверждений, которые указывают, можно ли считать оценку низкой, средней или высокой. Например, такое утверждение, как «Ваша оценка по шкале интроверсии находится в пределах нормы по сравнению с оценками других первокурсников средней школы», дает нормативную интерпретацию.
Более сложные интерпретации объясняют значение партитуры. Например, значение интроверсии можно объяснить с помощью следующих утверждений:
Интроверсия относится к предрасположенности к тому, чтобы заниматься своими мыслями и чувствами. Вопреки тому, что многие думают, интроверсия — это не то же самое, что застенчивость. Застенчивость включает в себя элемент опасения или беспокойства, который не обязательно присутствует у интровертов. Хотя интроверты могут быть менее склонны искать компанию, для некоторых это происходит просто потому, что они заряжаются энергией от одиночества.
Некоторые программы интерпретации тестов продвигают процесс еще дальше и предлагают последствия оценок для будущего поведения:
Люди с одинаковыми показателями интроверсии склонны избегать конфликтов и неприятностей. Они могут получать удовольствие от социальных взаимодействий, но также находят их истощающими и, как правило, испытывают потребность во времени, чтобы перезарядить свои батареи после социальных взаимодействий. Им может быть особенно некомфортно в социальных взаимодействиях с противоположным полом. Они формируют социальные отношения медленно и обдуманно, но однажды сформированные эти отношения, как правило, очень стабильны.
Хотя компьютерные интерпретации звучат авторитетно, их надежность и достоверность требуют тщательного изучения. Однако стоимость оценки этих алгоритмов высока, и у большинства психологов нет ресурсов, необходимых для проведения такой оценки.
Самоинтерпретирующие тесты
Еще одним важным нововведением последних пятидесяти лет является самоуправляемый, самооценивающий и самоинтерпретирующий тест. Первыми в этом подходе были личностные опросники, такие как исследование ценностей Олпорта-Вернона-Линдзи, и опросники профессиональных интересов, такие как самоуправляемый поиск Джона Холланда. Эта практика в настоящее время широко используется для оценки конструктов, представляющих интерес в профессиональной психологии, она была включена в компьютерные программы обучения, такие как SIGI, и все чаще используется в личностных тестах, таких как невротизм, экстраверсия, открытость. (НЕО ПИ-Р).
Психологи изначально были обеспокоены возможностью того, что испытуемые допустят ошибки при подсчете баллов, что приведет к получению неточной информации. Ранние исследования показали, что некоторые проблемы с подсчетом очков действительно существовали, но модификации тестов уменьшили эти проблемы до приемлемого уровня. Также высказывались многочисленные опасения, что испытуемые совершат серьезные ошибки, пытаясь интерпретировать эти тесты для себя. Несмотря на это, обзор литературы выявил только семь исследований, в которых рассматривалась точность и эффективность самоинтерпретации. Эти исследования, как правило, не выявили различий между способами интерпретации тестов, но отсутствие тщательного изучения этого важного нововведения в интерпретации тестов является причиной для осторожности и беспокойства.
Подготовка и предоставление интерпретации теста
Подготовка интерпретации
Экспертная интерпретация теста требует интеграции технической информации о тесте с глубоким пониманием человека, который прошел тест. Это требует подготовки. Несмотря на большой опыт работы с тестами, которые необходимо интерпретировать, добросовестные психологи просматривают справочные источники, чтобы освежить в памяти нюансы, которые имеют решающее значение для проницательной интерпретации тестов. Кроме того, они понимают, что результаты тестов должны интерпретироваться в контексте личности и истории жизни человека. Например, комментарий, отражающий сомнение или пессимизм в отношении перспектив счастливой жизни, приобретает разный смысл, когда его высказывает молодой человек, родители которого только что погибли в автокатастрофе, и человек, проходящий курс лечения от лейкемии. Психологи избегают изолированной интерпретации результатов тестов, если это возможно.
Понимание результатов оценки
Первый вопрос психолога при подготовке интерпретации теста: «Что означают эти результаты теста?» Цель состоит в том, чтобы разработать гипотезы, которые можно проверить при обсуждении результатов с клиентом. Результаты теста представляют собой статистические сводки утверждений, сделанных клиентом при ответах на вопросы теста, или оценок выполнения клиентом задач, требуемых тестом. Таким образом, психологи могут попросить клиентов объяснить некоторые из их ответов на тест во время последующего интервью.
Консультанты уделяют особое внимание значению информации, которая кажется противоречивой. Разрешение очевидных противоречий важно и часто требует обсуждения с испытуемым, чтобы прийти к ясному пониманию. Низкие или социально нежелательные баллы могут угрожать или смущать клиентов и требуют тщательного рассмотрения. Психологи тщательно продумывают, как обсудить эту информацию с клиентом.
Психологи могут использовать номотетический (основанный на норме) или идиографический (индивидуально-ориентированный) подход к пониманию значения результатов теста. Номотетические интерпретации, как правило, количественные. Они сравнивают результаты индивидуума с соответствующей группой сравнения, например, когда успеваемость девятиклассника на контрольной по математике сравнивается с результатами других девятиклассников. Размещение результатов в соответствующем контексте позволяет психологу отличать средние или типичные оценки от различных типов исключительных оценок. Психометрическое тестирование и другие количественные методы согласуются с номотетическим подходом к интерпретации тестов.
Психологи, работающие с людьми, также заинтересованы в понимании испытуемого как уникальной личности без привязки к другим. Идиографический подход к интерпретации тестов предполагает исключительное внимание к индивидууму. Тематические исследования, неформальные интервью, неструктурированное наблюдение и другие качественные методы больше соответствуют идиографическим подходам. Оценка профессиональных интересов является одной из областей, в которой распространены идиографические подходы. Профессиональные психологи обычно хотят знать, как интересы и способности человека сравниваются с интересами референтной группы, а также как каждый интерес и способность сравниваются с другими интересами и способностями человека. Например, хотя полезно знать, что интерес человека к музыке силен по сравнению с интересами других людей, может быть еще важнее знать, что у человека есть еще более сильные интересы в бизнесе, преподавании и военной службе.
Интеграция результатов
Психологи должны интегрировать свое понимание результатов теста с другой доступной информацией. Эта информация может включать в себя комментарии других, показатели успеваемости на работе или в школе, дополнительные результаты оценки, а также информацию о семье или истории работы. Как минимум, большинство психологов будут иметь информацию, полученную в ходе интервью, проведенных до того, как будут выбраны оценки для человека.
Первым шагом является оценка согласованности информации. Психологи выявляют любые несоответствия и пытаются определить, почему они произошли. Ошибки при проведении теста могут возникать из-за таких ошибок, как использование неправильной формы теста, неправильного листа ответов или несоблюдения правильных указаний. Ошибки при подсчете баллов могут быть результатом простой ошибки при оценке ответов теста, использования неправильной процедуры подсчета баллов, использования неправильной группы норм для преобразования исходных баллов в стандартные баллы или математической ошибки при расчете стандартных баллов. Квалифицированные психологи не считают результат теста правильным, когда он противоречит другой доступной информации, и не игнорируют автоматически результаты теста, не подтверждающие их ожидания. Они исследуют несоответствие и пытаются разрешить парадокс. Часто это включает обсуждение кажущегося несоответствия с испытуемым.
Порядок презентации
Как только психологи получат четкое представление о результатах теста, они обдумывают порядок представления информации. Это включает в себя принятие системы отсчета клиента. Психологи разрабатывают предварительный план, который подлежит доработке во время тестового интерпретационного интервью. Например, испытуемый может спросить об определенном наборе результатов, представляющих особый интерес, или выразить заинтересованность в обсуждении чего-либо, отличного от результатов теста.
Психологи часто начинают интерпретацию с более конкретной информации (например, результатов тестов достижений), а затем переходят к более абстрактной информации (например, результатам личностных тестов). Когда психолог не уверен в наилучшем порядке или считает, что порядок не имеет значения для данного конкретного клиента, он или она может просмотреть тесты, которые следует интерпретировать вместе с клиентом, и спросить клиента о его предпочтениях.
Психологи понимают, что интерпретация теста должна частично руководствоваться эмоциональными потребностями клиента. Они рассматривают, готов ли клиент психологически эффективно обдумывать результаты теста, способен ли он конструктивно обрабатывать угрожающую информацию и является ли это наиболее важным использованием времени интервью на данном этапе.
Подготовка клиента
Несмотря на то, что терапевт и клиент совместно согласовали тесты для проведения и время интерпретации теста, психологи осознают важность подготовки клиента к интерпретации.
Терапевты дают клиентам возможность поднять любые вопросы, которые они считают важными, прежде чем обсуждать результаты теста. Психотерапевт начинает интерпретацию теста только после определения наиболее эффективного использования времени интервью.
Психологи переходят к обсуждению результатов теста, когда становится ясно, что клиент готов. Часто они кратко описывают тест, чтобы клиент мог связать результаты с пройденным им тестом. Это более важно, когда клиент прошел более одного теста или промежуток времени между завершением теста и интерпретацией результатов увеличился.
Психологи также обсуждают с клиентом типы информации, которую дает тест, и типы возможных интерпретаций. Например, оценка, указывающая на интерес к определенной профессии, не означает, что человек может добиться успеха в этой профессии. Психологи объясняют группу норм, используемую для интерпретации теста; они могут интерпретировать результаты по отношению к нескольким группам норм. Прежде чем приступить к интерпретации теста, психологи также стараются убедиться, что клиент понимает неточный характер результатов теста и пределы точности, с которой могут быть сделаны выводы. Часто они периодически повторяют этот момент в процессе интерпретации.
Интерпретация теста
Цели клиента
У данного результата теста может быть несколько возможных интерпретаций. Наиболее полезная интерпретация касается проблем, с которыми сталкиваются клиент и терапевт. Например, данный балл в тесте на академические способности может указывать на то, что интеллектуальные способности клиента, вероятно, достаточны для получения степени бакалавра. по истории, или что получить степень магистра в области международных отношений будет довольно сложно. Психологи делают интерпретацию теста личностно значимой, связывая результаты с проблемами и решениями, с которыми сталкивается клиент.
Test Precision
Многие люди считают, что тесты могут дать точные ответы на их вопросы. Они часто сообщают о результатах тестов — особенно лестных или социально желательных — используя точные оценки или безоговорочные заявления (например, «Мой IQ равен 130» или «Я экстраверт-альтруист»). Психологи избегают использования технических терминов, таких как стандартная ошибка измерения, но они объясняют, что результат теста (например, IQ 130) на самом деле указывает на приблизительный уровень (например, IQ где-то между 124 и 136). Точно так же, связывая результат теста с внешним критерием, психологи объясняют, что результат теста на самом деле предсказывает ряд возможных результатов. Не всегда необходимо или желательно давать испытуемым точные оценки или подробную техническую информацию. Психологи видят цель интерпретации теста в передаче значимой информации.
Защитные реакции
Интерпретация низких или потенциально нежелательных результатов может быть затруднена. Психологи не ругают, не осуждают, не морализируют и не используют уничижительные ярлыки при интерпретации таких оценок, но они чувствительны к возможности того, что испытуемые будут навязывать себе такие реакции. Психологи не избегают этих оценок и не преуменьшают их значения, но напоминают клиентам об ограниченной точности этих оценок. Они указывают на последствия оценок и связывают их с решением, которое должен принять клиент. Цель состоит в том, чтобы побудить клиентов обсудить, что эта информация значит для них.
Экзаменуемым нужна точная информация об их слабостях и областях, нуждающихся в улучшении, а также информация об их сильных сторонах. Низкие или отрицательные баллы могут быть полезны при поднятии вопросов, которые необходимо решить клиенту. Разговор об этих оценках позволяет испытуемому признать эти области и разработать реалистичные планы. В то же время психологи остаются чувствительными к чувствам клиента по поводу этих оценок и работают с этими чувствами деликатно и конструктивно.
Простой язык
Психологи избегают технических терминов и объясняют результаты тестов на языке, понятном обычному человеку. Они также избегают использования таких слов, как невротический, неприспособленный, мужественность или женственность и интеллект, которые могут вызвать неблагоприятные коннотации. После установления отношений консультирования психологи также выявляют и избегают использования лично угрожающих терминов.
Поощрение обратной связи
Психологи интерпретируют результаты тестов таким образом, который позволяет и поощряет участие клиента. Они достигают этой цели, используя такие утверждения, как «Как это соотносится с тем, что вы ожидали (или думаете о себе)?» — Вам это кажется правильным? или «Вы, кажется, разочарованы этой оценкой».
Получение обратной связи от клиента позволяет психологу определить, понимает ли клиент представляемую информацию, а также дает информацию об отношении и чувствах клиентов к информации. Вместо того, чтобы задавать прямой вопрос, психолог периодически может просить клиента резюмировать представленную информацию. Это помогает создать дискуссию между терапевтом и клиентом, а не монолог психолога, и позволяет психологу определить, понимает ли клиент информацию. Кроме того, это дает клиенту возможность организовать и интегрировать информацию и выразить свои чувства по поводу информации.
Психологи также могут попросить клиента порассуждать о значении результатов теста. Это требует, чтобы клиент систематизировал представленную информацию, объединил ее со своими существующими знаниями и сделал выводы о последствиях информации для решений, которые он или она должны принять.
Как отмечалось ранее, опытные психологи стараются расспросить клиентов о любых необычных реакциях, которые они заметили при просмотре тестовых ответов. Например, психолог может сказать: «Я заметил по одному из вопросов, на которые вы ответили, что вы иногда думаете о том, чтобы причинить себе вред. Не могли бы вы рассказать мне об этом подробнее?» Это приводит к обсуждению вопроса, непосредственно волнующего клиента и психолога.
Профили тестов
Многие тесты предоставляют графическое представление результатов тестов. Использование этих наглядных пособий помогает клиентам лучше понять интерпретацию теста. Наглядные пособия помогают клиентам уточнить, упростить и упорядочить результаты теста. Клиенты обычно ценят графическое изображение результатов своих тестов, которое они могут забрать домой. Многие психологи также поощряют клиентов делать заметки во время интерпретации теста.
Одна из эффективных стратегий интерпретации тестов включает в себя то, что клиенты оценивают себя по чертам, по которым они должны быть проверены, прежде чем они будут проходить тесты. Психолог наносит эти самооценки на пустой профиль теста, а затем во время интерпретации теста наносит на тот же профиль фактические результаты теста. Это показывает взаимосвязь между самооценкой клиента и фактическими результатами тестов и приводит к полезному обсуждению любых расхождений. Клиенты считают полезным взять этот профиль домой для дальнейшего изучения.
Продолжение
Усвоение клиентом тестовой информации продолжается после интерпретационного интервью теста. Психологи продолжают ссылаться на информацию в последующих интервью, а также проверять и укреплять понимание клиентами этой информации, когда это необходимо.
Исследование результатов интерпретации тестов
Цель оценки
Невозможно оценить практическую полезность оценки без указания цели процедуры оценки; однако психологи уделяли этому вопросу мало внимания. Похоже, что большинство практикующих психологов используют процедуры оценки для одной из трех целей. Один из них — получение информации для прогнозирования. Например, терапевты проводят оценки, чтобы получить информацию для использования при принятии решения о том, как эффективно работать со своими клиентами, или для использования при консультировании своих клиентов о будущих действиях. Психологи также проводят оценки, чтобы получить описательную информацию, которая поможет им лучше понять своих клиентов. Прогнозирование присуще этой цели как второстепенная цель. Наконец, в качестве вмешательства используются процедуры оценки. Например, психологи иногда интерпретируют результаты тестов, чтобы повысить чувствительность своих клиентов к важным проблемам развития. Оценка практической полезности оценки требует уточнения цели оценки в каждом конкретном случае, но эта информация практически никогда не доступна.
В дополнение к трем основным целям, указанным выше, психологи могут рассчитывать на множество конкретных преимуществ. Возможны несколько целей, в том числе следующие: изучение фактической информации, изменение отношения или поведения и влияние на будущие решения. К сожалению, критерии, обычно использовавшиеся в прошлых исследованиях полезности оценивания, — это припоминание конкретных баллов и изменение точности самооценки. Эти критерии неадекватно отражают многие потенциальные преимущества тестирования.
Влияние интерпретации тестов
Ховард Э. А. Тинсли и Серена Чу проанализировали 65 исследований, в которых изучались результаты интерпретации тестов. Большая часть исследований была сосредоточена на интерпретации тестов способностей и способностей. Практически ни в одном исследовании не изучалась интерпретация тестов профессионального интереса или использование тестов в индивидуальной психотерапии, консультировании пар, семейном консультировании, консультировании по вопросам злоупотребления психоактивными веществами или в любой из многих других областей специализации, в которых психологи предоставляют услуги. Они обнаружили, что лишь немногие исследования были проведены компетентно или надлежащим образом описаны, и что исследование чревато методологическими недостатками (например, ошибочные критерии, использование немедленного наблюдения, отсутствие случайного распределения и отсутствие контрольной группы). Они пришли к выводу, что не существует согласованной совокупности доказательств, демонстрирующих эффективность интерпретации тестов как вмешательства.
Они сообщили о слабой поддержке только трех выводов. Во-первых, использование наглядных пособий повышает эффективность интерпретации теста. Во-вторых, интерпретация группового теста столь же эффективна, как и интерпретация индивидуального теста. В-третьих, испытуемые предпочитают индивидуальные интерпретации тестов интерпретациям групповых тестов. Однако, поскольку индивидуальные интерпретации в шесть раз дороже, чем групповые интерпретации, предоставление индивидуальных интерпретаций, когда осуществимы групповые тестовые интерпретации, не представляется оправданным.
Заключение
Грамотная интерпретация тестов требует, чтобы психологи извлекали точную информацию из своих оценочных процедур, делали точные выводы из этой информации и точно передавали результаты своим клиентам в понятной им форме. Существует мало свидетельств, документально подтверждающих способность психологов-консультантов удовлетворять этим требованиям. Кроме того, еще не было приведено убедительных доказательств практической полезности тестирования, даже если эти требования соблюдены. Несмотря на это, психологи, добросовестно подготавливающие интерпретацию теста, заботящиеся о подготовке клиента к интерпретации и умеющие проводить интерпретацию, считают, что интерпретация теста является ценным дополнением к терапии.
Ссылки:
- Goldman, L. (1971). Использование тестов в консультировании (2-е изд.). Санта-Моника, Калифорния: Appleton-Century-Crofts.
- Гольдман, Л. (1972). Тесты и консультации: Неудачный брак. Измерение и оценка в руководстве, 4, 213-220.
- Хэмблтон, Р.К., Робин, Ф., и Син, Д. (2000). Модели ответов на вопросы для анализа данных образовательных и психологических тестов. В HEA Tinsley & SD Brown (Eds.), Справочник по прикладной многомерной статистике и математическому моделированию (стр. 553-581). Сан-Диего, Калифорния: Academic Press.
- Мил, ЧП (1954). Клинический прогноз против статистического: теоретический анализ и обзор доказательств. Нортвейл, Нью-Джерси: Джейсон Аронсон.
- Мил, ЧП (1956).