Корректурная проба интерпретация результатов: 404 Страница не найдена
Как правильно провести тест Бурдона (корректурную пробу) для диагностики внимания младших школьников
Усидчивость и внимательность — важные качества для успешного усвоения знаний. Особое значение они имеют для младших школьников, только начинающих получать образование. Задача учителей и родителей — помочь малышу научиться сосредотачивать внимание, для чего взрослым необходимо знать, насколько сформирована у ребёнка способность к концентрации. Определить это поможет корректурная проба (тест Бурдона).
Суть методики диагностики
Английский литературный деятель XVIII века Сэмюэл Джонсон говорил: «Запоминать умеет тот, кто умеет быть внимательным».
Удобный способ исследования концентрации внимания был предложен французским психологом Бенжаменом Бурдоном в конце XIX века. Корректурная проба очень удобна для тестирования школьников, так как позволяет проводить диагностику внимания одновременно нескольких учащихся. Испытуемым предлагается за определённое время вычеркнуть заданные элементы на специальных бланках с изображёнными на них буквами, цифрами или фигурами, при этом учитель каждые 60 секунд даёт команду «Черта!», по которой дети проводят вертикальную линию в том месте, где они остановились. Время для работы с бланком — 10 минут. За этот период у педагога появляется возможность проанализировать, как меняется концентрация и насколько быстро ребёнок утомляется.
По итогам теста также можно сделать вывод о:
- способности школьника долго концентрироваться на выполнении одного задания;
- устойчивости внимания испытуемого;
- умении переключаться с одной задачи на другую.
Проведение корректурной пробы среди младших школьников
Инструкция:
- Учитель (или психолог) раздаёт бланки с рисунками и объясняет правила выполнения теста: взрослый называет предметы, а ребята вычёркивают соответствующие элементы в каждой строке, двигаясь слева направо, по команде «Черта!» испытуемые проводят прямую линию, отделяющую пройденный блок от ещё не рассмотренных.
- Дети берут в руки карандаши (ручки лучше не использовать, так как неожиданно закончившиеся чернила собьют малыша с толку и отвлекут от теста) и по сигналу педагога начинают работать.
- Через 10 минут ученики откладывают пишущие предметы, а учитель собирает бланки ответов.
Для младших школьников диагностику Бурдона рекомендуется проводить на бланках с изображёнными человечками (ребёнку потребуется вычеркнуть всех девочек (мальчиков), рожицы с тёмными волосами или с грустными лицами) или геометрическими фигурами. Дети могут запутаться в буквах алфавита или цифрах, поэтому результаты окажутся не вполне объективными.
Если стимульный материал состоит из букв, то для усложнения задания можно вычёркивать целые сочетания (например, «ко», «ла» и так далее).
Для совсем маленьких ребят, не умеющих читать, тест может быть также представлен в виде расположенных в ряд домиков или листиков. Усложнить работу можно, сформулировав задание так: «Нарисуй в каждом домике окошко, а к листику добавь веточку».
Фотогалерея: Образцы стимульного материала (бланки с буквами, геометрическими фигурами и так далее)
Обработка и интерпретация результатов теста Бурдона
Оценка работы школьников производится по количеству пропущенных элементов за единицу времени и общему числу проанализированных знаков. Также учитель может сделать выводы о качестве и темпе выполнения задания по сумме отработанных строк и количеству допущенных в них ошибок за 60 секунд.
Для оценки концентрации внимания используется следующая формула:
К = 2С/О (К — концентрация, С — просмотренные строки, О — ошибки, к которым относятся пропуски и неверно зачёркнутые элементы).
Чем больше получившаяся цифра, тем выше концентрация. Этот показатель не имеет установленных числовых значений, так как зависит от конкретного стимульного материала. Но в любом случае К не должно быть больше половины показателя С (такой результат означает, что испытуемый обладает очень низкой концентрацией и нуждается в специальной помощи психолога).
При определении устойчивости внимания используется формула:
А = S/t х 10 (S — общее число просмотренных элементов, t — период времени (60 секунд)).
Расшифровка показателей:
Результат | Значение |
0–2 | Очень высокая устойчивость |
3–4 | Высокая |
5–6 | Средняя |
7–8 | Низкая |
9–10 | Очень низкая |
Для анализа переключаемости внимания используется такая формула:
С = (So/S) х 100 (Sо — число строк с ошибками, S — общее количество отработанных строчек).
Обратите внимание, что для исследования переключаемости задания даются в немного усложнённом виде: детям нужно зачёркивать заданные элементы в разных строчках — чётных или нечётных.
Результат в % | Расшифровка |
0–20 | Очень высокая переключаемость |
21–40 | Высокая |
41–60 | Средняя |
61–80 | Низкая |
81–100 | Очень низкая |
Если корректурная проба показала, что у ребёнка качество внимания находится на среднем или очень высоком уровне, то эти достижения школьнику следует поддерживать (много читать, складывать пазлы, заучивать стихотворения наизусть). А вот для тех, кто продемонстрировал очень низкий или низкий уровень, не обойтись без специальных заданий, которые должен индивидуально разработать психолог с учётом личностных особенностей конкретного малыша. Чаще всего в таком случае предлагаются упражнения по восстановлению порядка счёта, сюжета картинок, заучиванию стихотворений наизусть.
По результатам корректурной пробы учителю или психологу легче выстроить стратегию работы с каждым учеником, а также определить оптимальный характер учебных заданий для развития всех аспектов внимания, чтобы дать малышу возможность эффективного усвоения знаний и полноценного личностного роста.
Источник: paidagogos.com
Бланк тест бурдона корректурная проба
г. Санкт-Петербург
8 (812) 346 68 86
8 (812) 346 68 85
Развитие внимания. Корректурная проба Бурдона.
Развитие человека предполагает развитие всех его качеств, в частности, таких, как внимание, память. Развитие внимания — это, прежде всего, развитие способности к концентрации и устойчивости. Данная методика позволяет оценить способность удерживать внимание, однако, применяя ее для взрослых, необходимо провести предварительную беседу с испытуемым — многие заболевания сердечно-сосудистой, дыхательной систем и т.д., снижают возможность концентрации. Корректурная проба — методика, предназначенная для исследования устойчивости и продуктивности внимания, расчета утомляемости. Применять методику можно для взрослых и для детей. Однако, в случае работы с детьми, более подходящей является разновидность методики «Кольца Ландольта», посокльку, дошкольникам легче работать с рисунком, чем с буквами.
Оборудование: стандартный бланк теста «Корректурная проба», секундомер.
На бланке в случайном порядке напечатаны некоторые буквы русского алфавита, в том числе буквы «к» и «р»; всего 2000 знаков, по 50 букв в каждой строчке.
Инструкция. «Последовательно рассматривая строки, вычеркивайте буквы «к» и «р». Когда я скажу:»Черта!», Вы должны провести вертикальную черту в том месте бланка, где в этот момент находитесь.
При обработке полученных данных психолог сверяет результаты в корректурных бланках испытуемого с ключом к тесту и заполняет соответствующие графы в протоколе..
Расчет продуктивности внимания: количество просмотренных букв за 10 мин., и точность, вычисленная по формуле:
К = m:n x 100 % , где К точность, n количество букв, которые необходимо было вычеркнуть, m количество правильно вычеркнутых во время работы букв.
ПРОТОКОЛ ИССЛЕДОВАНИЯ ОЦЕНКИ УСТОЙЧИВОСТИ ВНИМАНИЯ
Возраст ______________ Пол __________ Дата __________________
Показатели Результаты
Источник: www.psycademy.ru
Усидчивость и внимательность — важные качества для успешного усвоения знаний. Особое значение они имеют для младших школьников, только начинающих получать образование. Задача учителей и родителей — помочь малышу научиться сосредотачивать внимание, для чего взрослым необходимо знать, насколько сформирована у ребёнка способность к концентрации. Определить это поможет корректурная проба (тест Бурдона).
Суть методики диагностики
Английский литературный деятель XVIII века Сэмюэл Джонсон говорил: «Запоминать умеет тот, кто умеет быть внимательным».
Удобный способ исследования концентрации внимания был предложен французским психологом Бенжаменом Бурдоном в конце XIX века. Корректурная проба очень удобна для тестирования школьников, так как позволяет проводить диагностику внимания одновременно нескольких учащихся.
Испытуемым предлагается за определённое время вычеркнуть заданные элементы на специальных бланках с изображёнными на них буквами, цифрами или фигурами, при этом учитель каждые 60 секунд даёт команду «Черта!», по которой дети проводят вертикальную линию в том месте, где они остановились. Время для работы с бланком — 10 минут. За этот период у педагога появляется возможность проанализировать, как меняется концентрация и насколько быстро ребёнок утомляется.По итогам теста также можно сделать вывод о:
- способности школьника долго концентрироваться на выполнении одного задания;
- устойчивости внимания испытуемого;
- умении переключаться с одной задачи на другую.
Проведение корректурной пробы среди младших школьников
Инструкция:
- Учитель (или психолог) раздаёт бланки с рисунками и объясняет правила выполнения теста: взрослый называет предметы, а ребята вычёркивают соответствующие элементы в каждой строке, двигаясь слева направо, по команде «Черта!» испытуемые проводят прямую линию, отделяющую пройденный блок от ещё не рассмотренных.
- Дети берут в руки карандаши (ручки лучше не использовать, так как неожиданно закончившиеся чернила собьют малыша с толку и отвлекут от теста) и по сигналу педагога начинают работать.
- Через 10 минут ученики откладывают пишущие предметы, а учитель собирает бланки ответов.
Для младших школьников диагностику Бурдона рекомендуется проводить на бланках с изображёнными человечками (ребёнку потребуется вычеркнуть всех девочек (мальчиков), рожицы с тёмными волосами или с грустными лицами) или геометрическими фигурами. Дети могут запутаться в буквах алфавита или цифрах, поэтому результаты окажутся не вполне объективными.
Если стимульный материал состоит из букв, то для усложнения задания можно вычёркивать целые сочетания (например, «ко», «ла» и так далее).
Для совсем маленьких ребят, не умеющих читать, тест может быть также представлен в виде расположенных в ряд домиков или листиков. Усложнить работу можно, сформулировав задание так: «Нарисуй в каждом домике окошко, а к листику добавь веточку».
Фотогалерея: Образцы стимульного материала (бланки с буквами, геометрическими фигурами и так далее)
Обработка и интерпретация результатов теста Бурдона
Оценка работы школьников производится по количеству пропущенных элементов за единицу времени и общему числу проанализированных знаков. Также учитель может сделать выводы о качестве и темпе выполнения задания по сумме отработанных строк и количеству допущенных в них ошибок за 60 секунд.
Для оценки концентрации внимания используется следующая формула:
К = 2С/О (К — концентрация, С — просмотренные строки, О — ошибки, к которым относятся пропуски и неверно зачёркнутые элементы).
Чем больше получившаяся цифра, тем выше концентрация. Этот показатель не имеет установленных числовых значений, так как зависит от конкретного стимульного материала. Но в любом случае К не должно быть больше половины показателя С (такой результат означает, что испытуемый обладает очень низкой концентрацией и нуждается в специальной помощи психолога).
При определении устойчивости внимания используется формула:
А = S/t х 10 (S — общее число просмотренных элементов, t — период времени (60 секунд)).
Расшифровка показателей:
Результат | Значение |
0–2 | Очень высокая устойчивость |
3–4 | Высокая |
5–6 | Средняя |
7–8 | Низкая |
9–10 | Очень низкая |
Для анализа переключаемости внимания используется такая формула:
С = (So/S) х 100 (Sо — число строк с ошибками, S — общее количество отработанных строчек).
Обратите внимание, что для исследования переключаемости задания даются в немного усложнённом виде: детям нужно зачёркивать заданные элементы в разных строчках — чётных или нечётных.
Результат в % | Расшифровка |
0–20 | Очень высокая переключаемость |
21–40 | Высокая |
41–60 | Средняя |
61–80 | Низкая |
81–100 | Очень низкая |
Если корректурная проба показала, что у ребёнка качество внимания находится на среднем или очень высоком уровне, то эти достижения школьнику следует поддерживать (много читать, складывать пазлы, заучивать стихотворения наизусть). А вот для тех, кто продемонстрировал очень низкий или низкий уровень, не обойтись без специальных заданий, которые должен индивидуально разработать психолог с учётом личностных особенностей конкретного малыша. Чаще всего в таком случае предлагаются упражнения по восстановлению порядка счёта, сюжета картинок, заучиванию стихотворений наизусть.
По результатам корректурной пробы учителю или психологу легче выстроить стратегию работы с каждым учеником, а также определить оптимальный характер учебных заданий для развития всех аспектов внимания, чтобы дать малышу возможность эффективного усвоения знаний и полноценного личностного роста.
Источник: paidagogos.com
Бланк тест бурдона корректурная проба
г. Санкт-Петербург
8 (812) 346 68 86
8 (812) 346 68 85
Развитие внимания. Корректурная проба Бурдона.
Развитие человека предполагает развитие всех его качеств, в частности, таких, как внимание, память. Развитие внимания — это, прежде всего, развитие способности к концентрации и устойчивости. Данная методика позволяет оценить способность удерживать внимание, однако, применяя ее для взрослых, необходимо провести предварительную беседу с испытуемым — многие заболевания сердечно-сосудистой, дыхательной систем и т.д., снижают возможность концентрации. Корректурная проба — методика, предназначенная для исследования устойчивости и продуктивности внимания, расчета утомляемости. Применять методику можно для взрослых и для детей. Однако, в случае работы с детьми, более подходящей является разновидность методики «Кольца Ландольта», посокльку, дошкольникам легче работать с рисунком, чем с буквами.
Корректурная проба, предложенная Бурдоном состоит из нескольких тестов различного характера. Мы предлагаем здесь только один вариант. На бланке напечатаны буквы русского алфавита. Последовательно рассматривая каждую строчку, испытуемый должен отыскать буквы «к» и «р» и зачеркнуть их. Задание нужно выполнять быстро и точно. Испытуемый начинает работать по команде экспериментатора. Когда через некоторое время экспериментатор произнесет: «Черта!»- он должен поставить вертикальную черту в том месте строки, где его застала команда. Последней считается буква, зачеркнутая перед (или с) последними словами «Черта». Проведение методики занимает 10 минут. Как правило, за это время, в норме, обычный человек делает 10-15 ошибок.
Оборудование: стандартный бланк теста «Корректурная проба», секундомер.
На бланке в случайном порядке напечатаны некоторые буквы русского алфавита, в том числе буквы «к» и «р»; всего 2000 знаков, по 50 букв в каждой строчке.
Порядок работы. Исследование необходимо проводить индивидуально. Начинать нужно, лишь убедившись, в готовности испытуемого начать исследование. Атмосфера исследования должна быть доброжелательной и комфортной, чтобы у испытуемого не создалось впечатления, что его экзаменуют.
Инструкция. «Последовательно рассматривая строки, вычеркивайте буквы «к» и «р». Когда я скажу:»Черта!», Вы должны провести вертикальную черту в том месте бланка, где в этот момент находитесь.
При обработке полученных данных психолог сверяет результаты в корректурных бланках испытуемого с ключом к тесту и заполняет соответствующие графы в протоколе..
Расчет продуктивности внимания: количество просмотренных букв за 10 мин., и точность, вычисленная по формуле:
К = m:n x 100 % , где К точность, n количество букв, которые необходимо было вычеркнуть, m количество правильно вычеркнутых во время работы букв.
ПРОТОКОЛ ИССЛЕДОВАНИЯ ОЦЕНКИ УСТОЙЧИВОСТИ ВНИМАНИЯ
Возраст ______________ Пол __________ Дата __________________
Показатели Результаты
Источник: www.psycademy.ru
Усидчивость и внимательность — важные качества для успешного усвоения знаний. Особое значение они имеют для младших школьников, только начинающих получать образование. Задача учителей и родителей — помочь малышу научиться сосредотачивать внимание, для чего взрослым необходимо знать, насколько сформирована у ребёнка способность к концентрации. Определить это поможет корректурная проба (тест Бурдона).
Суть методики диагностики
Английский литературный деятель XVIII века Сэмюэл Джонсон говорил: «Запоминать умеет тот, кто умеет быть внимательным».
Удобный способ исследования концентрации внимания был предложен французским психологом Бенжаменом Бурдоном в конце XIX века. Корректурная проба очень удобна для тестирования школьников, так как позволяет проводить диагностику внимания одновременно нескольких учащихся. Испытуемым предлагается за определённое время вычеркнуть заданные элементы на специальных бланках с изображёнными на них буквами, цифрами или фигурами, при этом учитель каждые 60 секунд даёт команду «Черта!», по которой дети проводят вертикальную линию в том месте, где они остановились. Время для работы с бланком — 10 минут. За этот период у педагога появляется возможность проанализировать, как меняется концентрация и насколько быстро ребёнок утомляется.
По итогам теста также можно сделать вывод о:
- способности школьника долго концентрироваться на выполнении одного задания;
- устойчивости внимания испытуемого;
- умении переключаться с одной задачи на другую.
Проведение корректурной пробы среди младших школьников
Инструкция:
- Учитель (или психолог) раздаёт бланки с рисунками и объясняет правила выполнения теста: взрослый называет предметы, а ребята вычёркивают соответствующие элементы в каждой строке, двигаясь слева направо, по команде «Черта!» испытуемые проводят прямую линию, отделяющую пройденный блок от ещё не рассмотренных.
- Дети берут в руки карандаши (ручки лучше не использовать, так как неожиданно закончившиеся чернила собьют малыша с толку и отвлекут от теста) и по сигналу педагога начинают работать.
- Через 10 минут ученики откладывают пишущие предметы, а учитель собирает бланки ответов.
Для младших школьников диагностику Бурдона рекомендуется проводить на бланках с изображёнными человечками (ребёнку потребуется вычеркнуть всех девочек (мальчиков), рожицы с тёмными волосами или с грустными лицами) или геометрическими фигурами. Дети могут запутаться в буквах алфавита или цифрах, поэтому результаты окажутся не вполне объективными.
Если стимульный материал состоит из букв, то для усложнения задания можно вычёркивать целые сочетания (например, «ко», «ла» и так далее).
Для совсем маленьких ребят, не умеющих читать, тест может быть также представлен в виде расположенных в ряд домиков или листиков. Усложнить работу можно, сформулировав задание так: «Нарисуй в каждом домике окошко, а к листику добавь веточку».
Фотогалерея: Образцы стимульного материала (бланки с буквами, геометрическими фигурами и так далее)
Обработка и интерпретация результатов теста Бурдона
Оценка работы школьников производится по количеству пропущенных элементов за единицу времени и общему числу проанализированных знаков. Также учитель может сделать выводы о качестве и темпе выполнения задания по сумме отработанных строк и количеству допущенных в них ошибок за 60 секунд.
Для оценки концентрации внимания используется следующая формула:
К = 2С/О (К — концентрация, С — просмотренные строки, О — ошибки, к которым относятся пропуски и неверно зачёркнутые элементы).
Чем больше получившаяся цифра, тем выше концентрация. Этот показатель не имеет установленных числовых значений, так как зависит от конкретного стимульного материала. Но в любом случае К не должно быть больше половины показателя С (такой результат означает, что испытуемый обладает очень низкой концентрацией и нуждается в специальной помощи психолога).
При определении устойчивости внимания используется формула:
А = S/t х 10 (S — общее число просмотренных элементов, t — период времени (60 секунд)).
Расшифровка показателей:
Результат | Значение |
0–2 | Очень высокая устойчивость |
3–4 | Высокая |
5–6 | Средняя |
7–8 | Низкая |
9–10 | Очень низкая |
Для анализа переключаемости внимания используется такая формула:
С = (So/S) х 100 (Sо — число строк с ошибками, S — общее количество отработанных строчек).
Обратите внимание, что для исследования переключаемости задания даются в немного усложнённом виде: детям нужно зачёркивать заданные элементы в разных строчках — чётных или нечётных.
Результат в % | Расшифровка |
0–20 | Очень высокая переключаемость |
21–40 | Высокая |
41–60 | Средняя |
61–80 | Низкая |
81–100 | Очень низкая |
Если корректурная проба показала, что у ребёнка качество внимания находится на среднем или очень высоком уровне, то эти достижения школьнику следует поддерживать (много читать, складывать пазлы, заучивать стихотворения наизусть). А вот для тех, кто продемонстрировал очень низкий или низкий уровень, не обойтись без специальных заданий, которые должен индивидуально разработать психолог с учётом личностных особенностей конкретного малыша. Чаще всего в таком случае предлагаются упражнения по восстановлению порядка счёта, сюжета картинок, заучиванию стихотворений наизусть.
По результатам корректурной пробы учителю или психологу легче выстроить стратегию работы с каждым учеником, а также определить оптимальный характер учебных заданий для развития всех аспектов внимания, чтобы дать малышу возможность эффективного усвоения знаний и полноценного личностного роста.
Источник: paidagogos.com
Бланк тест бурдона корректурная проба
г. Санкт-Петербург
8 (812) 346 68 86
8 (812) 346 68 85
Развитие внимания. Корректурная проба Бурдона.
Развитие человека предполагает развитие всех его качеств, в частности, таких, как внимание, память. Развитие внимания — это, прежде всего, развитие способности к концентрации и устойчивости. Данная методика позволяет оценить способность удерживать внимание, однако, применяя ее для взрослых, необходимо провести предварительную беседу с испытуемым — многие заболевания сердечно-сосудистой, дыхательной систем и т.д., снижают возможность концентрации. Корректурная проба — методика, предназначенная для исследования устойчивости и продуктивности внимания, расчета утомляемости. Применять методику можно для взрослых и для детей. Однако, в случае работы с детьми, более подходящей является разновидность методики «Кольца Ландольта», посокльку, дошкольникам легче работать с рисунком, чем с буквами.
Корректурная проба, предложенная Бурдоном состоит из нескольких тестов различного характера. Мы предлагаем здесь только один вариант. На бланке напечатаны буквы русского алфавита. Последовательно рассматривая каждую строчку, испытуемый должен отыскать буквы «к» и «р» и зачеркнуть их. Задание нужно выполнять быстро и точно. Испытуемый начинает работать по команде экспериментатора. Когда через некоторое время экспериментатор произнесет: «Черта!»- он должен поставить вертикальную черту в том месте строки, где его застала команда. Последней считается буква, зачеркнутая перед (или с) последними словами «Черта». Проведение методики занимает 10 минут. Как правило, за это время, в норме, обычный человек делает 10-15 ошибок.
Оборудование: стандартный бланк теста «Корректурная проба», секундомер.
На бланке в случайном порядке напечатаны некоторые буквы русского алфавита, в том числе буквы «к» и «р»; всего 2000 знаков, по 50 букв в каждой строчке.
Порядок работы. Исследование необходимо проводить индивидуально. Начинать нужно, лишь убедившись, в готовности испытуемого начать исследование. Атмосфера исследования должна быть доброжелательной и комфортной, чтобы у испытуемого не создалось впечатления, что его экзаменуют.
Инструкция. «Последовательно рассматривая строки, вычеркивайте буквы «к» и «р». Когда я скажу:»Черта!», Вы должны провести вертикальную черту в том месте бланка, где в этот момент находитесь.
При обработке полученных данных психолог сверяет результаты в корректурных бланках испытуемого с ключом к тесту и заполняет соответствующие графы в протоколе..
Расчет продуктивности внимания: количество просмотренных букв за 10 мин., и точность, вычисленная по формуле:
К = m:n x 100 % , где К точность, n количество букв, которые необходимо было вычеркнуть, m количество правильно вычеркнутых во время работы букв.
ПРОТОКОЛ ИССЛЕДОВАНИЯ ОЦЕНКИ УСТОЙЧИВОСТИ ВНИМАНИЯ
Возраст ______________ Пол __________ Дата __________________
Показатели Результаты
Источник: www.psycademy.ru
Поделиться новостью в соцсетях
Об авторе: Светлана Игоревна « Предыдущая запись Следующая запись »
Отсканированное изображение
%PDF-1.4 % 1 0 obj /Title >> endobj 2 0 obj > endobj 3 0 obj > stream
с какого возраста, показания. Методика «Корректурная проба» (Проба Бурдона, Кольца Ландольта)
Корректурная проба, или тест Бурдона – это группа бланковых тестов, с помощью которых вы можете оценить свой уровень внимания, утомляемости, работоспособности, устойчивости к монотонной деятельности, в которой необходимо поддерживать высокий уровень внимания. Методика была предложена Б. Бурдоном еще в 1895 году, и с тех пор широко применяется в психологии. Существуют различные модификации методики, к примеру, таблицы Иванова – Смоленского, и таблицы Бурдона – Анфимова, а также кольца Ландольта. Многие из вас, возможно, проходили или имели дело с пробой Бурдона в виде буквенного и цифрового варианта, которые, кстати, представлены в этом разделе, а также в виде таблицы корректурной пробы для детей.
С помощью методик «Корректурная проба», представленных на этом сайте, вы можете проверить два показателя своего внимания, а именно: норму объема внимания и концентрацию. Здесь вы можете пройти тест Бурдона онлайн совершенно бесплатно. Примечание: подготовка таблицы сервером, а также подсчет результата займет 2 секунды, еще около 3 секунд может занять создание таблицы в вашем браузере, это время добавляется ко времени вашего тестирования. Внимание: таблица может некорректно отображаться на устройствах с низким разрешением экрана!
Буквенный вариант пробы Бурдона:
Суть методики состоит в том, чтобы в таблице, состоящей из 40 рядов букв по 40 букв в каждом ряду вычеркивать буквы, которые стоят в ряду первыми. Допустим, первая буква в ряду — «А», тогда вам следует зачеркнуть все буквы «А» в буквенном ряду. Длительность выполнения — 5 минут, по истечению которых вы перейдете на страницу с результатами. Сама по себе методика потребует от вас полного сосредоточения на процессе.
Цифровой вариант корректурной пробы
Корректурная проба цифровой вариант так же как и буквенный вариант позволяет проверить норму объема внимания и концентрацию. Ваша задача состоит в том, чтобы вычеркнуть из таблицы цифры проверочную цифру, которую вы найдете в условиях задачи непосредственно после перехода по ссылке. Время на выполнение 3 минуты.
Тест «Кольца Ландольта»
Вариант теста «Кольца ландольта» так же как и два предыдущих варианта теста Бурдона позволяет проверить норму объема внимания и концентрацию. Здесь вам необходимо выделить в таблице колец кольца с конкретным направлением, которое будет задано в начале теста. Время на выполнение теста «Кольца Ландольта» — 5 минут.
Корректурная проба теория:
Для проведения теста необходим специальный бланк с расположенными в нем в случайном порядке буквами, цифрами или фигурами. В случае отсутствия бланка вы можете использовать обыкновенную газету или книгу, хотя, в данном случае будет сложнее рассчитать результат. Задача испытуемого состоит в последовательном поиске и вычеркивании определенных символов в просматриваемой таблице корректурной пробы, начиная с верхнего ряда с лева на право, за отведенное время, обычно это 5 – 10 минут. Желательно, чтобы у испытуемого было хорошее зрение и достаточный уровень грамотности, хотя, и для малограмотной группы населения можно подобрать подходящую пробу Бурдона, не требующую высокого уровня интеллектуального развития. Кстати, пройти специальный тест Бурдона могут и дети, начиная со старших групп детских садов и школьников всех возрастов (чем старше ребенок, тем сложнее требуется использовать вид теста).
При проверке результатов, помимо бланков желательно иметь бланк-ключ, с выделенными буквами или цифрами, которые должен был найти человек, проходящий тест Бурдона. Это поможет не сбиться при подсчете результатов. Кроме того, для более быстрой проверки результатов теста вы можете использовать специальный шаблон с отверстиями, которые при должны совпасть с выделенными испытуемым буквы или цифры. Однако, в случае с шаблоном вы не сможете сосчитать количество ошибочно выделенных букв. Прохождение теста Бурдона онлайн поможет вам избежать необходимости подсчета результата, хотя, в настоящий момент здесь возможно прохождение ограниченного количества вариантов теста.
Кстати сказать, считается, что даже частое и регулярное прохождение теста Бурдона или корректурной пробы не требует усложнения теста для получения объективных результатов, поскольку всякий раз, проходя тест, вы будете проходить его практически на том же уровне, что и прежде. То есть, влияние упражняемости здесь минимально. Лучшие результаты вы будете показывать, только если улучшите свои навыки концентрации. Также следует учесть, что результаты испытуемых могут сильно зависеть от их эмоционального состояния, а также психического и физического здоровья.
Исследование степени концентрации и устойчивости внимания .
Описание теста
Обследование проводится с помощью специальных бланков с рядами расположенных в случайном порядке букв (цифр, фигур, может быть использован газетный текст вместо бланков). Исследуемый просматривает текст или бланк ряд за рядом и вычеркивает определенные указанные в инструкции буквы или знаки.
Инструкция к тесту
«На бланке с буквами вычеркните, просматривая ряд за рядом, все буквы «Е». Через каждые 60 секунд по моей команде отметьте вертикальной чертой, сколько знаков Вы уже просмотрели (успели просмотреть)».
Примечание : возможны другие варианты проведения методики: вычеркивать буквосочетания (например, «НО») или вычеркивать одну букву, а другую подчеркивать.
Тестовый материал
Примечание : инструкция к детскому бланку (там где листики и домики) Корректурной пробы (Тесту Бурдона) – “Нарисуй окошко у каждого домика и веточку у каждого листика”.
Обработка результатов теста
Результаты пробы оцениваются по количеству пропущенных незачеркнутых знаков, по времени выполнения или по количеству просмотренных знаков. Важным по казателем является характеристика качества и темпа выполнения (выражается числом проработанных строк и количеством допущенных ошибок за каждый 60-секундный интервал работы).
Концентрация внимания оценивается по формуле:
К = С 2 / П , где
- С – число строк таблицы, просмотренных испытуемым,
- П – количество ошибок (пропусков или ошибочных зачеркиваний лишних знаков).
Ошибкой считается пропуск тех букв, которые должны быть зачеркнуты, а также неправильное зачеркивание.
Устойчивость внимания оценивается по изменению скорости просмотра на протяжении всего задания.
Результаты подсчитываются для каждых 60 секунд по формуле:
A = S / t , где
- А – темп выполнения,
- S – количество букв в просмотренной части корректурной таблицы,
- t – время выполнения.
По результатам выполнения методики за каждый интервал может быть построена «кривая истощаемости», отражающая, устойчивость внимания и работоспособность в динамике.
Показатель переключаемости внимания вычисляется по формуле:
С = (S o / S) * 100 , где
- S o – количество ошибочно проработанных строк,
- S – общее количество строк в проработанной испытуемым части таблицы.
При оценке переключаемости внимания испытуемый получает инструкцию зачеркивать разные буквы в четных и нечетных строках корректурной таблицы.
Источники
- Корректурная проба (Тест Бурдона) / Альманах психологических тестов. М., 1995, С.107-111.
Метод «Корректурная проба» для исследования внимания впервые был предложен Б. Бурдоном в 1895 году. Корректурная проба, предложенная Бурдоном состоит из нескольких тестов различного характера. Здесь вашему вниманию предложен только один вариант. Методика предназначена для оценки объема, концентрации и устойчивости внимания. П рименяя тест для взрослых, необходимо провести предварительную беседу с испытуемым – многие заболевания сердечно-сосудистой, дыхательной систем и т.д., снижают возможность концентрации.
Разработанный Бурдоном бланк представлял собой ряды букв русского алфавита. Испытуемый, просматривая бланк, ряд за рядом, отыскивает буквы «к» и «р» и должен вычёркивать их. Задание нужно выполнять быстро и точно.
Применять методику можно для взрослых и для детей.
Однако, в случае работы с детьми, более подходящей является разновидность методики “Кольца Ландольта”, поскольку, дошкольникам легче работать с рисунком, чем с буквами.
Оборудование:
- стандартный бланк теста “Корректурная проба”;
На бланке в случайном порядке напечатаны некоторые буквы русского алфавита, в том числе буквы «к» и «р». Всего 2000 знаков, по 50 букв в каждой строчке.
Процедура проведения:
Исследование необходимо проводить индивидуально. Начинать нужно, лишь убедившись, в готовности испытуемого начать исследование. Атмосфера исследования должна быть доброжелательной и комфортной, чтобы у испытуемого не создалось впечатления, что его экзаменуют. Испытуемый начинает работать по команде экспериментатора. Когда через некоторое время экспериментатор произнесет: «Черта!» – он должен поставить вертикальную черту в том месте строки, где его застала команда. Последней считается буква, зачеркнутая перед (или с) последними словами “Черта”. Проведение методики занимает 10 минут.
Как правило, за это время, в норме, обычный человек делает 10-15 ошибок.
Инструкция: “Последовательно рассматривая строки, вычеркивайте буквы “к” и “р”. Когда я скажу:”Черта!”, Вы должны провести вертикальную черту в том месте бланка, где в этот момент находитесь.
Обработка и интерпретация результатов теста корректурная проба:
При обработке полученных данных психолог сверяет результаты в корректурных бланках испытуемого с ключом к тесту и заполняет соответствующие графы в протоколе.
Обработка:
Расчет продуктивности внимания: количество просмотренных букв за 10 мин., и точность, вычисленная по формуле: К = m:n x 100 % , где К – точность, n – количество букв, которые необходимо было вычеркнуть, m – количество правильно вычеркнутых во время работы букв.
ПРОТОКОЛ ИССЛЕДОВАНИЯ ОЦЕНКИ УСТОЙЧИВОСТИ ВНИМАНИЯ
Возраст ______________ Пол __________ Дата __________________
Показатели Результаты
Продуктивность | Точность | Продуктивность | Точность | ||||
знаки | баллы | % | баллы | знаки | баллы | % | баллы |
менее 1010 | 1 | менее 70 | 1 | 2660-2825 | 16 | 84-85 | 12 |
1010-1175 | 3 | 70-72 | 2 | 2825-2990 | 17 | 85-87 | 13 |
1175-1340 | 5 | 72-73 | 3 | 2990-3155 | 18 | 87-88 | 14 |
1340-1505 | 7 | 73-74 | 4 | 3155-3320 | 19 | 88-90 | 15 |
1505-1670 | 9 | 74-76 | 5 | 3320-3485 | 20 | 90-91 | 16 |
1670-1835 | 10 | 76-77 | 6 | 3485-3650 | 21 | 91-92 | 17 |
1835-2000 | 11 | 77-79 | 7 | 3650-3815 | 22 | 92-94 | 18 |
2000-2165 | 12 | 79-80 | 8 | 3815-3980 | 23 | 94-95 | 20 |
2165-2330 | 13 | 80-81 | 9 | 3980-4145 | 24 | 95-96 | 22 |
2330-2495 | 14 | 81-83 | 10 | 4145-4310 | 25 | 96-98 | 24 |
2495-2660 | 15 | 83-84 | 11 | более 4310 | 26 | более 98 | 26 |
Для сопоставления данных по устойчивости внимания с другими свойствами аттенционной функции необходимо вновь осуществить перевод интегрального показателя устойчивости внимания шкальные оценки по следующей таблице.
Таблица перевода показателей свойств внимания в сопоставимые шкальные оценки
Шкальныеоценки | Устойчивостьвнимания | Переключениевнимания | Объемвнимания | Шкальныеоценки | Устойчивостьвнимания | Переключениевнимания | Объемвнимания |
19 | более 50 | более 217 | менее 115 | 9 | 25-27 | 172-181 | 216-235 |
18 | 8 | 23-24 | 158-171 | 236-265 | |||
17 | 48-49 | 214-216 | 116-125 | 7 | 20-22 | 149-157 | 266-295 |
16 | 46-47 | 211-213 | 126-135 | 6 | 16-19 | 142-148 | 296-335 |
15 | 44-45 | 208-210 | 136-145 | 5 | 14-15 | 132-141 | 336-375 |
14 | 39-43 | 205-209 | 146-155 | 4 | 12-13 | 122-131 | 376-405 |
13 | 36-38 | 201-204 | 156-165 | 3 | 9-11 | 114-121 | 406-455 |
12 | 34-35 | 195-200 | 166-175 | 2 | – | 110-113 | – |
11 | 31-33 | 189-194 | 176-185 | 1 | – | – | – |
10 | 28-30 | 182-188 | 186-195 | 0 | менее 9 | менее 109 | более 456 |
Шкальная оценка (ШО) интерпретируется следующим образом:
ШО Характеристика уровня устойчивости внимания
0-3 Низкая устойчивость внимания
4-7 Ниже среднего устойчивость внимания
8-11 Средняя устойчивость внимания
12-15 Выше среднего устойчивость внимания
16-19 Высокая устойчивость внимания
Коротко обобщим алгоритм:
1. По формуле К = (М/Н) x 100 % оцениваем точность выполненной работы.
В формуле М – количество правильно вычеркнутых за время работы букв;
Н – количество букв, которые необходимо было вычеркнуть.
2. По таблице показатель К переводим в балльную оценку точности – критерий С.
3. Вычисляем интегральный показатель устойчивости внимания (А) по формуле А=В+С.
По таблице переводим показатель А в шкальную оценку.
Усидчивость и внимательность — важные качества для успешного усвоения знаний. Особое значение они имеют для младших школьников, только начинающих получать образование. Задача учителей и родителей — помочь малышу научиться сосредотачивать внимание, для чего взрослым необходимо знать, насколько сформирована у ребёнка способность к концентрации. Определить это поможет корректурная проба (тест Бурдона).
Суть методики диагностики
Внимательность — основа успешной учёбы в начальных классах
Английский литературный деятель XVIII века Сэмюэл Джонсон говорил: «Запоминать умеет тот, кто умеет быть внимательным».
Удобный способ исследования концентрации внимания был предложен французским психологом Бенжаменом Бурдоном в конце XIX века. Корректурная проба очень удобна для тестирования школьников, так как позволяет проводить диагностику внимания одновременно нескольких учащихся. Испытуемым предлагается за определённое время вычеркнуть заданные элементы на специальных бланках с изображёнными на них буквами, цифрами или фигурами, при этом учитель каждые 60 секунд даёт команду «Черта!», по которой дети проводят вертикальную линию в том месте, где они остановились. Время для работы с бланком — 10 минут. За этот период у педагога появляется возможность проанализировать, как меняется концентрация и насколько быстро ребёнок утомляется.
По итогам теста также можно сделать вывод о:
- способности школьника долго концентрироваться на выполнении одного задания;
- устойчивости внимания испытуемого;
- умении переключаться с одной задачи на другую.
Проведение корректурной пробы среди младших школьников
В процессе проведения теста нужно следить за тем, чтобы дети не отвлекались от работы с бланком
Инструкция:
- Учитель (или психолог) раздаёт бланки с рисунками и объясняет правила выполнения теста: взрослый называет предметы, а ребята вычёркивают соответствующие элементы в каждой строке, двигаясь слева направо, по команде «Черта!» испытуемые проводят прямую линию, отделяющую пройденный блок от ещё не рассмотренных.
- Дети берут в руки карандаши (ручки лучше не использовать, так как неожиданно закончившиеся чернила собьют малыша с толку и отвлекут от теста) и по сигналу педагога начинают работать.
- Через 10 минут ученики откладывают пишущие предметы, а учитель собирает бланки ответов.
Для младших школьников диагностику Бурдона рекомендуется проводить на бланках с изображёнными человечками (ребёнку потребуется вычеркнуть всех девочек (мальчиков), рожицы с тёмными волосами или с грустными лицами) или геометрическими фигурами. Дети могут запутаться в буквах алфавита или цифрах, поэтому результаты окажутся не вполне объективными.
Если стимульный материал состоит из букв, то для усложнения задания можно вычёркивать целые сочетания (например, «ко», «ла» и так далее).
Фотогалерея: Образцы стимульного материала (бланки с буквами, геометрическими фигурами и так далее)
Изначально тест имел только буквенное оформление Для совсем маленьких разработан бланк с простейшими фигурами Листики и домики — самый понятный стимульный материал для младших школьников Дети с удовольствием работают с бланком, на котором изображены девочки
Обработка и интерпретация результатов теста Бурдона
Оценка работы школьников производится по количеству пропущенных элементов за единицу времени и общему числу проанализированных знаков. Также учитель может сделать выводы о качестве и темпе выполнения задания по сумме отработанных строк и количеству допущенных в них ошибок за 60 секунд.
Для оценки концентрации внимания используется следующая формула:
К = 2С/О (К — концентрация, С — просмотренные строки, О — ошибки, к которым относятся пропуски и неверно зачёркнутые элементы).
Чем больше получившаяся цифра, тем выше концентрация. Этот показатель не имеет установленных числовых значений, так как зависит от конкретного стимульного материала. Но в любом случае К не должно быть больше половины показателя С (такой результат означает, что испытуемый обладает очень низкой концентрацией и нуждается в специальной помощи психолога).
При определении устойчивости внимания используется формула:
А = S/t х 10 (S — общее число просмотренных элементов, t — период времени (60 секунд)).
Расшифровка показателей:
Для анализа переключаемости внимания используется такая формула:
С = (So/S) х 100 (Sо — число строк с ошибками, S — общее количество отработанных строчек).
Обратите внимание, что для исследования переключаемости задания даются в немного усложнённом виде: детям нужно зачёркивать заданные элементы в разных строчках — чётных или нечётных.
Существуют специальные программы для компьютера или мобильного устройства, позволяющие провести тест. Разработчики предлагают стимульные таблицы, элементы на которых нужно вычёркивать кликом мышки или движением пальца. После завершения работы приложение подсчитывает баллы, показывает ошибки и рекомендует подходящий уровень для тренировки.
ГАОУ СПО Тольяттинский социально – педагогический колледж
Диагностика изучения внимания
КОРРЕКТУРНАЯ ПРОБА
Выполнила студентка гр. НК – 35
Брускова Дарья
Проверила: Сухенко А. А.
____________________
(оценка)
____________________
(подпись)
Тольятти, 2013г.
Цель: оценить разные параметры внимания: устойчивость, концентрация, также распределение и переключение.
В эксперименте испытуемому предъявляется страница, заполненная какими-нибудь знаками, расположенными случайно. Это могут быть цифры, буквы, геометрические фигуры, рисунки-миниатюры. Задача испытуемого находить определенный знак и как-нибудь его выделить — подчеркнуть, вычеркнуть, отметить. Какой именно знак и что необходимо сделать задается в инструкции.
Существует целый ряд вариантов корректурной пробы: буквенный, цифровой, с кольцами, рисунки и пиктограммы для детей.
Диапазон применения корректурной пробы очень широк – с дошкольного возраста и до пенсионного. Т.е. для использования данного теста практически не существует возрастных ограничений – важно правильно подобрать стимульный материал. Тест может быть полезен в клинической практике, школьной диагностике, в процессе профориентации и профотбора.
Для проведения исследования необходим секундомер, ручка или карандаш и бланк. Если бланк отсутствует, можно использовать любой текст – газету, книгу – проведенный таким способом тест также может быть вполне информативен. Однако, для того, чтобы можно было бы сопоставлять полученные результаты и существующими нормами, целесообразно использовать стандартные бланки.
Бланк.
ФИО _______________________ Возраст _____ Дата __________
Инструкция:
1. «На бланке строчками напечатаны буквы русского алфавита. Вы
должны просматривать эти буквы строчка за строчкой, слева направо и
вычеркивать все буквы «к» и «р». Старайтесь работать как можно быстрее, но самое главное в этом задании — работать без ошибок, внимательно, ни одной буквы «к» и «р» не пропустить и, ни одной лишней не вычеркнуть. Кроме того, когда я скажу «Черта!» — поставьте вертикальную черту у той буквы, у которой Вас застал мой сигнал, и продолжайте работать дальше. Все понятно?
Обработка результатов:
Точность К = (М/Н) x 100 %, где:
М — количество правильно вычеркнутых за время работы букв;
Н — количество букв, которые необходимо было вычеркнуть.
Время работы 1 мин.
1 строчка – М2, Н4 К= (2/4)*100%
К= 0,5%
2 строчка – М4, Н5 К= (4/5)*100%
К= 0,8%
3 строчка – М5, Н7 К= (5/7)*100%
К= 0,7%
4 строчка – М2, Н2 К= (2/2)*100%
К=1%
5 строчка – М3 Н4 К= (3/4)*100%
К=0,75%
6 строчка – М10 Н10 К= (10/10)*100%
К= 1%
7 строчка – М4 Н4 К=(4/4)*100%
К = 1%
8 строчка – М2 Н2 К= (2*2)*100%
К= 4%
9 строчка – М3 Н3 К= (3/3)*100%
К= 1%
10 строчка – М3 Н3 К= (3/3)*100%
К= 1%
11 строчка – М7 Н7 К= (7/7)*100%
К = 1%
12 строчка – М3 Н3 К= (3/3)*100%
К = 1%
13 строчка – М6 Н6 К= (6/6)*100%
К = 1%
14 строчка – М4 Н4 К = (4/4)*100%
К = 1%
15 строчка – М5 Н5 К=(5/5)*100%
К=1%
16 строчка – М4 Н4 К = (4/4)*100%
К = 1%
17 строчка – М2 Н2 К=(2/2)*100%
К= 1%
Общий процент 19,75% это 3 балла низкая устойчивость внимания
Шкальная оценка интерпретируется следующим образом:
Баллы | Проценты | Характеристика уровня устойчивости внимания |
10-20% | Низкая устойчивость внимания | |
21-35% | Ниже среднего устойчивость внимания | |
8-11 | 36-50% | Средняя устойчивость внимания |
12-15 | 51-65% | Выше среднего устойчивость внимания |
16-20 | 65-100% | Высокая устойчивость внимания |
Заключение:
По результатам исследования видно, что внимание ребёнка развито не достаточно. Это означает, что продуктивность, устойчивость и концентрация внимания находятся на низком уровне, что видно в анализе. Помимо внимания можно сказать, что также плохо развита техника чтения и орфографическая зоркость. В ходе исследования испытуемая была эмоционально уравновешена, начинала работать по команде взрослого, старалась показать себя с лучшей стороны. Из – за волнения ребёнок совершил ошибки. Она допустила менее 35 ошибок. Ребенок вовремя ставил вертикальную черту по команде взрослого.
Проверка гипотез и значения p: как интерпретировать результаты и делать правильные выводы
Каждый раз, когда мы сталкиваемся с выводом исследования, основанным на интерпретации значения p из статистического теста, осознаем мы это или нет, мы обсуждаем результат формальной проверки гипотезы. Это верно независимо от того, включает ли тест сравнение средних значений, отношения шансов (OR), результаты регрессии или другие типы статистических тестов. Как читатели исследований, важно понимать основополагающие принципы проверки гипотез, чтобы, столкнувшись со статистическими результатами, мы могли прийти к правильным выводам и принять правильные решения о том, какие результаты достаточно надежны, чтобы их можно было применить в клинической практике.
Статья Yinon и др. 1, представленная в недавнем комментарии EBN, будет использована для иллюстрации четырех простых шагов, связанных с проверкой гипотез.2 Авторы этой статьи исследовали возможные преимущества антенатального приема стероидов в контексте поздних недоношенных детей. рождение (срок беременности> 34 недель). Один из ключевых результатов, представляющих интерес, включал частоту госпитализаций младенцев в специальные отделения (SCU). Была выдвинута гипотеза, что прием стероидов приведет к улучшению дыхательной функции и, следовательно, к сокращению госпитализаций в SCU.В выборке 14 из 83 новорожденных (почти 17%) в экспериментальной (стероидной) группе были госпитализированы в SCU по сравнению с 24 из 84 новорожденных (почти 29%) в контрольной (без стероидов) группе.1 На первый взгляд, мы увидеть разницу в двух группах, однако нам нужно посмотреть дальше и решить, отражают ли обнаруженные различия реальные различия в частоте госпитализаций из-за антенатального приема стероидов. Может показаться правдоподобным, что наблюдаемые различия вызваны случайными различиями в пределах исследуемой выборки.Давайте сделаем четыре простых шага, чтобы прийти к заключению об этих результатах.
Шаг 1
Определите как null , так и альтернативную гипотезу . Как следует из названия, нулевая гипотеза состоит в том, что между двумя группами нет различий. В этом случае частота госпитализаций в SCU будет одинаковой, независимо от того, вводили стероиды или нет. Альтернативная гипотеза заключалась бы в том, что существует разница в частоте приема SCU между двумя группами.
Шаг 2
Определите статистику теста , используемую для проверки гипотезы.В этом случае исследователи использовали статистику χ 2 (хи-квадрат) и рассчитали значение p, равное 0,07. В таблице 1 представлена информация, необходимая для его расчета. Существуют онлайн-калькуляторы χ 2 , чтобы проверить результат самостоятельно.3
Таблица 1Информация, используемая для расчета χ 2
На этом этапе важно сделать паузу и представить, что могло бы произойти, если бы мы могли провести это исследование тысячи раз, выбрав много разных выборок из 83 женщин, которым давали бы стероиды, и 84 женщин в качестве контрольной группы, наблюдая за поступлением в SCU. для каждой группы.Если нулевая гипотеза верна, то есть госпитализация в SCU одинаково вероятна для обеих групп и нет никакой пользы от приема стероидов, «истинное» значение χ 2 будет равно 1. Следовательно, в среднем значения χ 2 рассчитанный для тысяч выборок, будет равен 1. Иногда из-за случайной изменчивости выборки χ 2 будет несколько выше 1, а иногда ниже 1.
Шаг 3
Вычислите значение p и решите, подходит ли значение 3.25 достаточно выше, чем 1, чтобы убедить нас в том, что показатели приема в SCU действительно различаются между двумя группами. Авторы сообщили о значении p 0,07, которое указывает на то, что если мы проведем это исследование тысячи раз и если нулевая гипотеза действительно верна, мы ожидаем, что 0,07, или 7%, значений χ 2 будут не ниже крайний (больше 1) как значение 3,25. Следовательно, если бы мы отвергли нулевую гипотезу в пользу альтернативы и пришли к выводу, что употребление стероидов на самом деле снижает частоту госпитализаций SCU, вероятность того, что мы поступим неправильно, составила бы 7%.Когда мы устанавливаем наш критический уровень значения p (α) равным 0,05, мы заявляем, что готовы рискнуть лишь 5% вероятностью ошибки, когда мы отвергаем нулевую гипотезу4.
Шаг 4
Принять или отклонить нулевую гипотезу. В этом случае принимаем (p = 0,07 больше 0,05). На этом этапе очень важно понять, что мы не доказали правильность нулевой гипотезы. Мы не можем утверждать, что не было разницы в частоте госпитализаций в отделения особой помощи только потому, что значение p равно 0.07. В частности, мы не продемонстрировали, что нулевая гипотеза верна, но решили, что доказательства недостаточно надежны, чтобы ее опровергнуть. Если бы только 17% новорожденных были госпитализированы при применении стероидов, по сравнению с 29% в контрольной группе, было бы явно неправильно утверждать, что мы в каком-либо смысле «доказали», что нулевая гипотеза верна. Правильный вывод состоит в том, что мы должны по умолчанию придерживаться того, что наш старый профессор статистики называл «нашим изначальным состоянием невежества», то есть мы все еще не знаем, влияет ли прием стероидов на показатели приема в SCU, и требуются дальнейшие исследования.
Интерпретация несущественных результатов Автор (ы) Дэвид М. ЛейнПредварительные требования Вступление к проверке гипотез, значимость Тестирование, Тип Ошибки I и IIЦели обучения
Когда проверка значимости дает высокую вероятность значение, это означает, что данные предоставляют мало доказательств того, что нулевая гипотеза неверна.Однако значение высокой вероятности не является доказательством того, что нулевая гипотеза верна. Эта проблема в том, что невозможно отличить нулевой эффект от очень небольшой эффект. Например, в Джеймсе Пример из практики Бонда, предположим, что г. На самом деле Бонд едва ли лучше, чем шанс судить о том, мартини встряхивали или перемешивали. Предположим, что у него вероятность 0,51 быть правильным в данном испытании (π = 0.51). Скажем, экспериментатор Джонс (который не знал π = 0.51) проверил г-на Бонда и обнаружил, что он был прав 49 раз из 100 попыток. Каким будет тест на значимость? Экспериментатора Тест значимости будет основан на предположении, что г-н Бонд имеет вероятность 0,50 быть правильным в каждом испытании (π = 0,50). Учитывая это предположение, вероятность его правоты 49 или более раз из 100 — 0.62. Это означает, что вероятность значение составляет 0,62, что намного превышает общепринятую значимость. уровень 0,05. Таким образом, этот результат не дает даже намека. что нулевая гипотеза неверна. Однако мы знаем (но экспериментатор Джонс не делает), что π = 0,51, а не 0,50, и, следовательно, нулевая гипотеза неверна. Итак, если бы экспериментатор Джонс пришел к выводу, что нулевая гипотеза верно на основе статистического анализа, он или она ошиблись.Заключение о том, что нулевая гипотеза верна, является называется принятие нулевая гипотеза. Это серьезная ошибка. Биномиальный
Калькулятор Не принимайте нулевую гипотезу, когда вы делаете не отвергайте это. Итак, как следует интерпретировать несущественный результат? Экспериментатор должен сообщить об отсутствии достоверных доказательств. Мистер.Бонд может сказать, встряхивали ли мартини или перемешивали, но что нет никаких доказательств того, что он не может. Это вообще невозможно чтобы доказать отрицательный результат. Что, если бы я утверждал, что был Сократом в более ранняя жизнь? Поскольку у меня нет доказательств этого утверждения, я бы очень трудно убедить кого-либо в том, что это правда. Тем не мение, никто не сможет окончательно доказать, что я не был. Часто незначительное открытие увеличивает уверенность в том, что нулевая гипотеза неверна.Рассмотрим следующие гипотетический пример. Исследователь разрабатывает лекарство от беспокойства что, по его мнению, лучше, чем традиционное лечение. Исследование проводится для проверки относительной эффективности две процедуры: 20 субъектов случайным образом разделены на две группы из 10. Одна группа получает новое лечение, а другая — традиционное лечение. Средний уровень тревожности ниже для тем, кто получает новое лечение, чем тем, кто получает традиционное лечение.Однако разница несущественная. Статистический анализ показывает, что разница как большая, так и большая чем полученный в эксперименте, произойдет 11% время, даже если не было истинной разницы между методами лечения. Другими словами, значение вероятности равно 0,11. Наивный исследователь интерпретирует это открытие как доказательство того, что новое лечение не более эффективен, чем традиционное лечение.Тем не мение, искушенного исследователя, хотя и разочарован тем, что эффект не было значительным, можно было бы приветствовать то, что новое лечение привело к меньшему беспокойству, чем традиционное лечение. Поддержка данных тезис о том, что новое лечение лучше традиционного один, хотя эффект не является статистически значимым. Этот исследователь должен иметь больше уверенности в том, что новое лечение лучше, чем он был до проведения эксперимента.Однако поддержка слабая, и данные неубедительны. Какие должен делать исследователь? Разумный образ действий быть, чтобы провести эксперимент снова. Допустим, исследователь повторил эксперимент и снова обнаружил, что новое лечение было лучше, чем традиционное лечение. Однако снова эффект был не значимо, и на этот раз значение вероятности было 0,07. Наивный исследователь может подумать, что два эксперимента из двух не нашли значения, и поэтому новое лечение вряд ли будет лучше, чем традиционное лечение.Утонченный исследователь отметил бы, что два раза из двух новое лечение было лучше, чем традиционное лечение. Более того, два эксперимента каждый из них слабо поддерживает то, что новое лечение лучше, вместе взятые, могут оказать сильную поддержку. Используя метод для объединения вероятностей можно определить, что объединение значения вероятности 0,11 и 0,07 приводят к вероятности значение 0.045. Таким образом, эти два несущественных вывода вместе взятые, приводят к значительному открытию. Хотя статистической базы для заключив, что эффект точно равен нулю, статистический анализ может продемонстрировать, что эффект, скорее всего, невелик. Этот делается путем вычисления уверенности интервал. Если все размеры эффекта в интервале малы, то его можно пришел к выводу, что эффект небольшой.Например, предположим, что эксперимент проверили эффективность лечения бессонницы. Предположим, что среднее время засыпания было на 2 минуты короче для тех, кто получал лечения, чем для тех, кто в контрольной группе, и что это разница не была значительной. Если 95% доверительный интервал колебалась от -4 до 8 минут, тогда исследователь будет оправдан в заключении, что польза составляет восемь минут или меньше.Тем не мение, исследователь не будет вправе сделать вывод о нулевой гипотезе правда, или даже что его поддержали. Пожалуйста, ответьте на вопросы: |
Что такое контрольный тест? — Кросби | Прямая точка
В своей простейшей форме испытание под нагрузкой включает приложение нагрузки к конструкции или части оборудования.Контрольное испытание — это испытание под нагрузкой, которое демонстрирует пригодность несущей конструкции. Такие испытания могут потребоваться как часть тщательной проверки в соответствии с Положениями о подъемных операциях и подъемном оборудовании 1998 года (LOLER), которые возлагают обязанности на людей и компании, которые владеют подъемным оборудованием, эксплуатируют его или контролируют его.
LOLER делает упор на опыте компетентного человека, который принимает осознанное решение относительно того, что является подходящим, на основе его обучения. Они определяют, необходимы или полезны контрольные испытания для оценки подъемного оборудования.
Контрольное испытание обычно выражается в процентах от предельной рабочей нагрузки (WLL), на которую рассчитано оборудование.
Точные требования к контрольным испытаниям и объем каждого испытания могут варьироваться в зависимости от стандартов, оборудования или задействованных отраслей, а также от индивидуальных требований клиентов или в рамках собственного контроля качества производителей.
Европейские стандарты
Производители подъемного оборудования могут проводить контрольные испытания в плановом порядке или в качестве серийных испытаний в соответствии со своими собственными процедурами обеспечения / контроля качества, но для товаров, предназначенных для продажи в ЕС, минимальные требования соответствуют требованиям Директивы по машинному оборудованию.
В разделе 4.1.2.3 Директивы по машинному оборудованию 2006/42 / EC рассматриваются статические и динамические испытания, которые должны проводиться на всех подъемных механизмах, готовых к вводу в эксплуатацию. Эти испытания помогают удовлетворить требование «годности по назначению» к подъемным машинам или подъемным приспособлениям, рассмотренным в разделе 4.1.3.
В Директиве также говорится (строка 20), что для определенных типов машин, имеющих более высокий фактор риска, желательна более строгая процедура сертификации. Несколько примеров дополнительных сертификационных стандартов, которые могут потребовать испытания под нагрузкой, включают:
• BS EN 14439: справочное доказательство прочности и устойчивости кранов, в том числе нерабочей устойчивости с учетом ветровой нагрузки.
• Стандарты EN12079 и DNV2.7-1 устанавливают минимальные критерии для проектирования, материалов, производства и испытаний контейнеров, используемых в морских условиях, с конкретным руководством по контрольным испытаниям.
• Морская промышленность — Проверочные испытания под нагрузкой требуются почти для всех подъемных устройств и незакрепленных подъемных механизмов для получения сертификата регистра Ллойда. Другие проверочные органы, такие как Det Norske Veritas (DNV) и Bureau Veritas, предъявляют аналогичные требования к подъемному оборудованию.
Стандарты для Северной Америки
Испытания контрольной нагрузкой проводятся в соответствии с рядом стандартов, преимущественно установленных следующими органами: • OSHA — Управление по безопасности и гигиене труда
• ASME — Американское общество инженеров-механиков
• ANSI — Американский национальный институт стандартов
Несколько примеров стандартов, которые могут требовать проведения испытаний под нагрузкой подъемного оборудования и принадлежностей, включают:
• ASME B30.9: на подъемных стропах
• ASME B30.10-1.7: на крюках
• ASME B30.16: на подвесных подъемниках (нижняя подвеска)
• ASME B30.17: на мостовых и портальных кранах и тележках
• ASME B30.20: различные подъемные устройства под крюком
• ASME B30.20: для ручных рычажных подъемников
• ASME B30.26: для различных подъемных приспособлений: скобы, рым-болты, талрепы, звенья, кольца, вертлюги и компрессионное оборудование.
• Раздел 1926.251 (a) (4) OSHA распространяется на подъемные приспособления специальной конструкции, которые должны пройти контрольные испытания перед использованием до 125% WLL.
• ANSI N14.6: специальное приложение для специальных подъемных устройств для транспортных контейнеров для ядерных материалов весом> 4500 кг.
Опять же, в критически важных отраслях могут потребоваться дополнительные тесты. НАСА, например, в своем техническом стандарте NASA-STD-8719.9 по подъему определяет случаи и частоту проверочных нагрузочных испытаний и периодических нагрузочных испытаний, которые должны проводиться на подъемных устройствах и оборудовании (LDE).
Как провести контрольный тест?
Многочисленные приложения для испытаний под нагрузкой по всему миру требуют наличия датчика нагрузки для проверки приложенной нагрузки, от испытаний крана с использованием водяных мешков и линии связи нагрузки на растяжение до испытаний цилиндров с использованием гидравлического испытательного стенда и датчика нагрузки на сжатие.
Весоизмерительный датчик позволяет точно измерить и записать результаты теста. В отраслях, где важна безопасность, требование документировать процедуры и результаты испытаний никогда не было таким большим, поскольку пользователи подъемного оборудования требуют большей прослеживаемости и контрольных журналов.
Контрольно-испытательное оборудование
Straightpoint производит различное оборудование, которое можно использовать для контрольных испытаний. Как упоминалось в начале, его программное обеспечение Proof Test plus (или SW-PTP) записывает данные, собранные весоизмерительным датчиком Radiolink plus, грузовой скобой или датчиком нагрузки сжатия.Затем он создает сертификат прохождения или неудачи, который включает данные теста и графики, отображающие данные о зависимости нагрузки от времени на протяжении всего теста.
Информацию можно распечатать прямо в виде отчета в формате PDF, передать в электронном виде или отправить в информационный центр в облаке. Важно, чтобы имелась возможность отслеживания сертификации контрольных испытаний и чтобы весоизмерительный датчик, проводивший испытание, был точным и откалиброванным. Если нагрузочный тест считается полезным, цель Proof Test plus — сделать этот процесс более эффективным.
Подробнее читайте в нашем техническом документе о контрольных испытаниях
Интерпретация значений P — статистика Джима
Значения P определяют, являются ли результаты проверки гипотез статистически значимыми. Статистика использует их повсюду. Вы найдете значения P в t-тестах, тестах распределения, ANOVA и регрессионном анализе. Ценности P стали настолько важными, что начали жить собственной жизнью. Они могут определить, какие исследования будут опубликованы, какие проекты получат финансирование и какие преподаватели университета станут постоянными сотрудниками!
По иронии судьбы, несмотря на такое влияние, значения P очень часто интерпретируются неверно.Какое значение равно — правильная интерпретация значений P? Что на самом деле означает значение P ? Это тема этого поста!
ЗначенияP — понятие скользкое. Не волнуйся. Я объясню p-значения, используя интуитивно понятный концептуальный подход, чтобы вы могли избежать широко распространенного неправильного толкования, которое может вызвать серьезные проблемы.
Что такое нулевая гипотеза?
значений P напрямую связаны с нулевой гипотезой. Итак, нам нужно сначала рассказать об этом!
Во всех проверках гипотез исследователи проверяют какой-то эффект.Эффектом может быть эффективность новой вакцинации, долговечность нового продукта и так далее. Исследователи надеются выявить некоторую выгоду или разницу.
Однако возможно, что на самом деле нет никакого эффекта или разницы между экспериментальными группами. В статистике мы называем это отсутствие эффекта нулевой гипотезой. Когда вы оцениваете результаты проверки гипотез, вы можете думать о нулевой гипотезе как о позиции защитника дьявола или как о позиции, которую вы принимаете ради аргументации.Чтобы понять эту идею, представьте себе гипотетическое исследование лекарства, которое, как мы знаем, совершенно бесполезно. Другими словами, нулевая гипотеза верна. На популяционном уровне нет разницы между субъектами, принимающими лекарство, и субъектами, которые его не принимают.
Несмотря на то, что нуль является точным, вы, вероятно, заметите эффект в выборочных данных из-за случайной ошибки выборки. Маловероятно, что выборки когда-либо будут в точности равны значению нулевой гипотезы. Следовательно, позиция, которую вы занимаете ради аргумента (защитник дьявола), заключается в том, что случайная ошибка выборки производит наблюдаемый эффект выборки, а не является фактическим эффектом.
Что такое значения P?
P-значения указывают на правдоподобность довода адвоката дьявола о том, что нулевая гипотеза верна с учетом выборочных данных. Они измеряют, насколько статистика вашей выборки согласуется с нулевой гипотезой. В частности, если нулевая гипотеза верна, какова вероятность получения эффекта, по крайней мере, такого же большого, как в вашей выборке?
- Высокие значения P: результаты вашей выборки соответствуют истинной нулевой гипотезе.
- Низкие значения P: результаты вашей выборки не соответствуют нулевой гипотезе.
Если ваше значение P достаточно мало, вы можете сделать вывод, что ваша выборка настолько несовместима с нулевой гипотезой, что вы можете отклонить нулевое значение для всей генеральной совокупности. P-значения являются неотъемлемой частью выводимой статистики, потому что они помогают вам использовать вашу выборку, чтобы делать выводы о генеральной совокупности.
Общая информация : Разница между описательной и выводимой статистикой и совокупностями, параметрами и выборками в выводимой статистике
Как вы интерпретируете значения P?
Вот техническое определение значений P:
значений P — это вероятность наблюдения выборочной статистики, которая, по крайней мере, столь же экстремальна, как и ваша выборочная статистика, когда вы предполагаете, что нулевая гипотеза верна.
Вернемся к нашему гипотетическому исследованию лекарств. Предположим, что проверка гипотезы дает значение P, равное 0,03. Вы бы интерпретировали это значение P следующим образом:
Если лекарство не оказывает никакого эффекта на популяцию в целом, в 3% исследований будет получен эффект, наблюдаемый в вашей выборке или больший, из-за случайной ошибки выборки.
Насколько вероятны данные вашей выборки, если нулевая гипотеза верна? Это единственный вопрос, на который ценит ответ P. Это ограничение приводит к очень стойкому и проблематичному неверному толкованию.
Связанные сообщения : Понимание P-значений может быть проще с использованием графического подхода: Как работают проверки гипотез: Уровни значимости и P-значения и узнать об уровнях значимости с концептуальной точки зрения.
P значения
НЕ являются частотой ошибокК сожалению, значения P часто неверно интерпретируются. Распространенная ошибка состоит в том, что они представляют собой вероятность отклонения нулевой гипотезы, которая на самом деле истинна (ошибка типа I). Представление о том, что значения P представляют собой вероятность ошибки, НЕПРАВИЛЬНО! Вы можете прочитать сообщение в блоге, которое я написал, чтобы узнать , почему значения P так часто интерпретируются неверно.
Вы не можете использовать значения P для прямого расчета коэффициента ошибок по нескольким причинам.
Во-первых, при расчетах значения P предполагается, что нулевая гипотеза верна. Таким образом, с точки зрения значения P нулевая гипотеза верна на 100%. Помните, что значения P предполагают, что значение NULL истинно, и ошибка выборки вызвала наблюдаемый эффект выборки.
Во-вторых, значения P говорят вам, насколько данные вашей выборки соответствуют истинной нулевой гипотезе. Однако, когда ваши данные очень несовместимы с нулевой гипотезой, значения P не могут определить, какая из следующих двух возможностей более вероятна:
- Нулевая гипотеза верна, но ваша выборка необычна из-за случайной ошибки выборки.
- Нулевая гипотеза неверна.
Чтобы понять, какой вариант подходит, необходимо применить экспертные знания изучаемой области и, что очень важно, оценить результаты аналогичных исследований.
Возвращаясь к нашему исследованию лекарств, давайте выделим правильный и неправильный способ интерпретации значения P 0,03:
.- Правильно: Предполагая, что лекарство не оказывает нулевого эффекта в популяции, вы получите эффект выборки или больше в 3% исследований из-за случайной ошибки выборки.
- Неправильно: Вероятность ошибки при отклонении нулевой гипотезы составляет 3%.
Да, я понимаю, что неправильное определение кажется более простым, и поэтому оно так часто встречается. К сожалению, использование этого определения дает вам ложное чувство безопасности, как я вам покажу дальше.
Связанные сообщения : См. Графическую иллюстрацию того, как t-тесты и F-тест в ANOVA производят P-значения.
Узнайте, почему вы «не можете отвергнуть нулевую гипотезу», а не принять ее.
Каков истинный коэффициент ошибок?
Разница между правильной и неправильной интерпретацией заключается не только в формулировках. Существует фундаментальная разница в количестве доказательств против нулевой гипотезы, которые подразумевает каждое определение.Значение P для нашего исследования лекарств составляет 0,03. Если вы интерпретируете это значение P как 3% -ную вероятность ошибки, отвергнув нулевую гипотезу, вы почувствуете, что находитесь на довольно надежной почве. Однако, прочитав этот пост, вы должны понять, что значения P не являются показателем ошибок, и вы не можете интерпретировать их таким образом.
Если значение P не является показателем ошибок в нашем исследовании, каков уровень ошибок? Подсказка: выше!
Как я объяснил ранее, вы не можете напрямую рассчитать частоту ошибок на основе значения P, по крайней мере, не используя частотный подход, который дает значения P. Однако вы можете оценить частоту ошибок, связанную со значениями P, с помощью байесовского подхода и моделирования.
Sellke et al. * Сделали это. Хотя точная частота ошибок варьируется в зависимости от различных предположений, приведенные ниже значения основаны на обычных предположениях.
Значение P | Вероятность отклонения истинной нулевой гипотезы |
0,05 | Не менее 23% (и обычно около 50%) |
0,01 | Не менее 7% (и обычно около 15%) |
Эти более высокие показатели ошибок, вероятно, вас удивят! К сожалению, распространенное заблуждение о том, что значения P представляют собой частоту ошибок, создает ложное впечатление о значительно большем количестве доказательств против нулевой гипотезы, чем это оправдано.Одно исследование со значением P около 0,05 не дает существенных доказательств того, что эффект выборки существует в популяции. Для получения дополнительной информации о том, как рассчитываются эти ложные срабатывания, прочтите мой пост о P-значениях, частоте ошибок и ложных срабатываниях.
Эти оценочные коэффициенты ошибок подчеркивают необходимость иметь более низкие значения P и повторные исследования, подтверждающие первоначальные результаты, прежде чем вы сможете с уверенностью заключить, что эффект существует на уровне популяции. Кроме того, исследования с меньшими значениями P имеют более высокую воспроизводимость в последующих исследованиях.Узнайте о типах ошибок при проверке гипотез.
Теперь, когда вы знаете, как правильно интерпретировать значения P, ознакомьтесь с моими пятью советами по значению P, чтобы не быть обманутыми ложными срабатываниями и другими вводящими в заблуждение результатами!
Обычно вы надеетесь на низкие значения p, но даже высокие значения p имеют преимущества!
Номер ссылки
* Томас СЕЛЛКЕ, М. Дж. БАЯРРИ и Джеймс О. БЕРГЕР, Калибровка p-значений для проверки точных нулевых гипотез, The American Statistician, февраль 2001 г., Vol.55, № 1
СвязанныеStatistics IV: Интерпретация результатов статистических тестов | BJA Education
Это четвертая из серии статей журнала, посвященных использованию статистики в медицине. В предыдущем выпуске мы описали, как выбрать подходящий статистический тест. В этой статье мы рассмотрим это подробнее и обсудим, как интерпретировать результаты.
Подробнее о выборе подходящего статистического теста
Решение, какой статистический тест использовать для анализа набора данных, зависит от типа анализируемых данных (интервальные или категориальные, парные против непарных), а также от того, нормально ли распределены данные.Интерпретация результатов статистического анализа основана на оценке и рассмотрении нулевой гипотезы, значений P , концепции статистической клинической значимости и , мощности исследования, статистических ошибок типов I и II, ловушек множественных сравнений, и один двусторонний тест против перед проведением исследования.
Оценка того, следует ли набор данных нормальному распределению
Из построения гистограммы или кривой частот может быть очевидно, что данные следуют нормальному распределению.Однако при небольших размерах выборки ( n <20) из графика может быть не очевидно, что данные взяты из нормально распределенной генеральной совокупности. Данные могут быть подвергнуты формальному статистическому анализу для подтверждения нормальности с использованием одного или нескольких специальных тестов, обычно включенных в пакеты компьютерного программного обеспечения, таких как тест Шапиро-Уилкса. Такие тесты довольно надежны при больших размерах выборки ( n > 100). Однако выбор между параметрическим и непараметрическим статистическим анализом менее важен для выборок такого размера, поскольку оба анализа почти одинаково эффективны и дают схожие результаты.При меньшем размере выборки ( n <20) тесты на нормальность могут вводить в заблуждение. К сожалению, непараметрическому анализу небольших выборок недостает статистической мощности, и может быть почти невозможно получить значение P <0,05, независимо от различий между группами выборочных данных.
В случае сомнений относительно типа распределения, которому следуют данные выборки, особенно при небольшом размере выборки, следует провести непараметрический анализ, учитывая, что анализу может не хватать мощности.Лучшее решение, позволяющее избежать ошибок при выборе подходящего статистического теста для анализа данных, — это разработать исследование с достаточно большим количеством субъектов в каждой группе.
Непарные
против парных данныхПри сравнении эффектов вмешательства на выборочные группы в клиническом исследовании важно, чтобы группы были как можно более похожими, отличаясь только в отношении интересующего вмешательства. Один из распространенных методов достижения этого — набор субъектов в исследовательские группы путем случайного распределения.Все набранные предметы должны иметь равные шансы быть распределенными в любую из исследовательских групп. Если размеры выборки достаточно велики, процесс рандомизации должен гарантировать, что групповые различия в переменных, которые могут повлиять на результат интересующего вмешательства (например, вес, возраст, соотношение полов и привычка к курению), уравновешивают друг друга. Эти переменные сами могут быть подвергнуты статистическому анализу и нулевой гипотезе об отсутствии разницы между тестируемыми исследовательскими группами.Такое исследование содержит независимые группы, и уместны непарные статистические тесты. Примером может служить сравнение эффективности двух разных препаратов для лечения гипертонии.
Другим методом проведения этого типа исследования является перекрестный дизайн исследования, в котором все набранные субъекты получают либо лечение A, либо лечение B (порядок определяется случайным распределением для каждого пациента), за которым следует другое лечение после подходящего «вымывания». период, в течение которого эффекты первой обработки проходят.Данные, полученные в этом исследовании, будут парными и подлежат парному статистическому анализу. Эффективность объединения в пары может быть определена путем вычисления коэффициента корреляции и соответствующего P -значения взаимосвязи между парами данных.
Третий метод включает определение всех тех характеристик, которые, по мнению исследователя, могут влиять на эффект интересующего вмешательства, и сопоставление набранных субъектов по этим характеристикам. Этот метод потенциально ненадежен, поскольку он зависит от того, чтобы ключевые характеристики не были случайно упущены из виду и, следовательно, не контролировались.
Основное преимущество парного исследования перед непарным состоит в том, что парные статистические тесты более эффективны, и для подтверждения данной разницы между исследуемыми группами необходимо набирать меньше испытуемых. Против этого есть прагматические трудности и дополнительное время, необходимое для перекрестных исследований, а также опасность того, что, несмотря на период вымывания, первое лечение все еще может оказывать влияние на второе. Также необходимо учитывать подводные камни подбора пациентов по всем важным характеристикам.
Нулевая гипотеза и
P -значенияПеред тем, как приступить к статистическому анализу данных, предлагается нулевая гипотеза, т. Е. Нет никакой разницы между исследуемыми группами в отношении интересующей (ых) переменной (ов) (т. Е. Средние или медианные значения выборки одинаковы). Как только нулевая гипотеза определена, используются статистические методы для вычисления вероятности наблюдения полученных данных (или данных, более экстремальных от предсказания нулевой гипотезы), если нулевая гипотеза верна.
Например, мы можем получить два набора выборочных данных, которые, по всей видимости, принадлежат разным популяциям, когда мы исследуем данные. Предположим, что применен соответствующий статистический тест и полученное значение P равно 0,02. Обычно значение P для статистической значимости определяется как P <0,05. В приведенном выше примере порог нарушен, и нулевая гипотеза отклоняется. Что именно означает значение P , равное 0,02? Представим себе, что исследование повторяется много раз.Если нулевая гипотеза верна и средние значения выборки не отличаются, разница между средними значениями выборки, по крайней мере, такая же большая, как наблюдаемая в первом исследовании, будет наблюдаться только в 2% случаев.
Многие опубликованные статистические анализы приводят значения P как ≥0,05 (незначительно), <0,05 (значимо), <0,01 (очень значимо) и т. Д. анализ, когда значения P нужно было искать в справочных таблицах.Такой подход уже не является удовлетворительным, и всегда следует указывать полученные точные значения P . Важность этого подхода иллюстрируется следующим примером. В исследовании, сравнивающем два гипотензивных средства, было обнаружено, что препарат A более эффективен, чем препарат B, и указано P <0,05. Мы убеждены и немедленно переключаем всех наших пациентов с гипертонией на препарат А. Другая группа исследователей проводит аналогичное исследование и не обнаруживает значительной разницы между двумя препаратами ( P ≥ 0.05). Мы немедленно переключаем всех наших пациентов с гипертонией обратно на препарат B, поскольку он дешевле и кажется столь же эффективным. Мы также можем быть несколько сбиты с толку явно противоречивыми выводами двух исследований.
Фактически, если фактическое значение P в первом исследовании было 0,048, а во втором исследовании — 0,052, эти два исследования полностью согласуются друг с другом. Обычное значение статистической значимости ( P <0,05) всегда следует рассматривать в контексте, а значение P , близкое к этой произвольной точке отсечения, возможно, должно привести к выводу, что перед принятием или отклонением может потребоваться дополнительная работа. нулевая гипотеза.
Можно рассмотреть еще один пример произвольного характера общепринятого порога статистической значимости. Предположим, что разработан новый противораковый препарат и проводится клиническое исследование для оценки его эффективности по сравнению со стандартным лечением. Замечено, что смертность после лечения новым препаратом имеет тенденцию к снижению, но это снижение не является статистически значимым ( P = 0,06). Поскольку новый препарат дороже и не более эффективен, чем стандартное лечение, следует ли от него отказаться? Если нулевая гипотеза верна (оба препарата одинаково эффективны) и мы должны были повторить исследование несколько раз, мы получили бы наблюдаемую разницу (или что-то большее) между двумя исследуемыми группами только в 6% случаев.По крайней мере, необходимо провести дальнейшее более масштабное исследование, прежде чем с уверенностью сделать вывод о том, что новый препарат не более эффективен — как мы увидим позже, исходное исследование вполне могло быть недостаточно эффективным.
Статистическая
против Клиническая значимостьНе следует путать статистическую значимость с клинической значимостью. Предположим, что сравниваются два гипотензивных агента, и среднее артериальное давление после лечения препаратом А на 2 мм рт.ст. ниже, чем после лечения препаратом В.Если размеры выборки исследования достаточно велики, даже такая небольшая разница между двумя группами может быть статистически значимой со значением P <0,05. Однако клиническое преимущество дополнительного снижения среднего артериального давления на 2 мм рт. Ст. Невелико и клинически не значимо.
Доверительные интервалы
Доверительный интервал — это диапазон данных выборки, который включает неизвестный параметр совокупности, например среднее значение. Чаще всего сообщается о 95% доверительном интервале (ДИ 95%), хотя можно рассчитать любой другой доверительный интервал.Если исследование повторяется много раз, полученный 95% доверительный интервал будет содержать среднее значение генеральной совокупности в 95% случаев.
Доверительные интервалы важны при анализе результатов статистического анализа и помогают интерпретировать полученное значение P . Они всегда должны указываться со значением P . Рассмотрим исследование, сравнивающее эффективность нового гипотензивного средства со стандартным лечением. Исследователь считает, что минимальная клинически значимая разница в среднего артериального давления после лечения двумя препаратами составляет 10 мм рт.Если P <0,05, можно рассмотреть три возможных диапазона для 95% доверительного интервала (рис. 1). Если P ≥ 0,05, можно рассмотреть четыре возможных диапазона для 95% доверительного интервала (рис. 2). Эти диапазоны для 95% ДИ приведены в Таблице 1.
Рис. 1
Статистическая значимость 95% доверительного интервала, когда P <0,05 (таблица 1).
Рис.1
Статистическая значимость 95% доверительного интервала, когда P <0.05 (таблица 1).
Рис. 2
Статистическая значимость 95% доверительного интервала, когда P ≥ 0,05 (таблица 1).
Рис. 2
Статистическая значимость 95% доверительного интервала при P ≥ 0,05 (таблица 1).
Таблица 1Интерпретация доверительных интервалов
P -значение <0,05 . | Является ли разница между средними значениями выборки клинически значимой? . | Устный перевод . | |
---|---|---|---|
. | В нижней части диапазона CI . | В верхней части диапазона CI . | . |
Да | Да | Да | A: Между исследуемыми группами существует клинически важное различие |
Да | Нет | Да | B: Невозможно прийти к окончательному выводу — больше данных требуется |
Да | Нет | Нет | C: Существует клинически несущественная разница между группами образцов |
Нет | Нет | Нет | D: Нет клинически значимой разницы между двумя группы |
Нет | Да | Нет | E: Невозможно прийти к окончательному выводу — требуются дополнительные данные |
Нет | Нет | Да | F: Невозможно прийти к окончательному выводу — требуется больше данных |
Нет | Да | Да | G: бессмысленный диапазон CI — требуется больше данных |
P -значение <0.05 . | Является ли разница между средними значениями выборки клинически значимой? . | Устный перевод . | |
---|---|---|---|
. | В нижней части диапазона CI . | В верхней части диапазона CI . | . |
Да | Да | Да | A: Между исследуемыми группами существует клинически важное различие |
Да | Нет | Да | B: Невозможно прийти к окончательному выводу — больше данных требуется |
Да | Нет | Нет | C: Существует клинически несущественная разница между группами образцов |
Нет | Нет | Нет | D: Нет клинически значимой разницы между двумя группы |
Нет | Да | Нет | E: Невозможно прийти к окончательному выводу — требуются дополнительные данные |
Нет | Нет | Да | F: Невозможно прийти к окончательному выводу — требуется больше данных |
Нет | Да | Да | G: бессмысленный диапазон CI — требуется больше данных |
Интерпретация доверительных интервалов
P -значение <0.05 . | Является ли разница между средними значениями выборки клинически значимой? . | Устный перевод . | |
---|---|---|---|
. | В нижней части диапазона CI . | В верхней части диапазона CI . | . |
Да | Да | Да | A: Между исследуемыми группами существует клинически важное различие |
Да | Нет | Да | B: Невозможно прийти к окончательному выводу — больше данных требуется |
Да | Нет | Нет | C: Существует клинически несущественная разница между группами образцов |
Нет | Нет | Нет | D: Нет клинически значимой разницы между двумя группы |
Нет | Да | Нет | E: Невозможно прийти к окончательному выводу — требуются дополнительные данные |
Нет | Нет | Да | F: Невозможно прийти к окончательному выводу — требуется больше данных |
Нет | Да | Да | G: бессмысленный диапазон CI — требуется больше данных |
P -значение <0.05 . | Является ли разница между средними значениями выборки клинически значимой? . | Устный перевод . | |
---|---|---|---|
. | В нижней части диапазона CI . | В верхней части диапазона CI . | . |
Да | Да | Да | A: Между исследуемыми группами существует клинически важное различие |
Да | Нет | Да | B: Невозможно прийти к окончательному выводу — больше данных требуется |
Да | Нет | Нет | C: Существует клинически несущественная разница между группами образцов |
Нет | Нет | Нет | D: Нет клинически значимой разницы между двумя группы |
Нет | Да | Нет | E: Невозможно прийти к окончательному выводу — требуются дополнительные данные |
Нет | Нет | Да | F: Невозможно прийти к окончательному выводу — требуется больше данных |
Нет | Да | Да | G: бессмысленный диапазон CI — требуется больше данных |
Мощность исследования и статистические ошибки типов I и II
После статистического анализа данных нулевая гипотеза либо принимается, либо отклоняется на основе значения P .Поскольку нулевая гипотеза может быть верной или ложной в действительности, а полученное значение P может быть статистически значимым ( P <0,05) или нет, необходимо рассмотреть четыре возможных исхода, как показано в таблице 2.
P -значение значимо (<0,05)? . | Нулевая гипотеза верна или ложна в действительности . | |
---|---|---|
. | Верно . | Ложь . |
Да | Ошибка типа I (α) | Анализ правильный |
Нет | Анализ правильный | Ошибка типа II (β) |
9 —0005 P P P значимое значение (<0,05)? . | Нулевая гипотеза верна или ложна в действительности . | |
---|---|---|
. | Верно . | Ложь . |
Да | Ошибка типа I (α) | Анализ правильный |
Нет | Анализ правильный | Ошибка типа II (β) |
9 —0005 P P P значимое значение (<0,05)? . | Нулевая гипотеза верна или ложна в действительности . | |
---|---|---|
. | Верно . | Ложь . |
Да | Ошибка типа I (α) | Анализ правильный |
Нет | Анализ правильный | Ошибка типа II (β) |
9 —0005 P P P значимое значение (<0,05)? . | Нулевая гипотеза верна или ложна в действительности . | |
---|---|---|
. | Верно . | Ложь . |
Да | Ошибка типа I (α) | Анализ верен |
Нет | Анализ верен | Ошибка типа II (β) |
Если нулевая гипотеза действительно верна (т.е. в действительности между группами нет никакой разницы) и полученное значение P составляет ≥0,05, заключение, основанное на статистическом анализе, соответствует действительности. Точно так же, если нулевая гипотеза действительно неверна (т.е. в действительности между группами существует разница) и полученное значение P <0,05, вывод, основанный на статистическом анализе, снова соответствует действительности.
Однако, если нулевая гипотеза верна и получено значение P <0,05, делается неверный вывод о том, что выборочные группы данных различаются. Это называется статистической ошибкой типа I. Статистически обнаруживается разница там, где ее нет в действительности. Разница между группами выборочных данных не связана с каким-либо вмешательством, а скорее случайно.Статистический факт заключается в том, что независимо от значения P всегда будет случайный шанс сделать ошибку типа I, хотя чем ниже значение P , тем меньше оно становится.
Последняя возможность рассмотрения состоит в том, что нулевая гипотеза в действительности неверна, но полученное значение P ≥0,05. Мы ошибочно пришли к выводу, что группы выборки похожи — мы упустили реальную разницу. Это статистическая ошибка типа II. Основная причина ошибок типа II — недостаточный размер выборки — исследования не хватает мощности.Мощность теста определяется как (1 — β ) × 100%, где β — вероятность ошибки типа II. Чтобы быть приемлемым для публикации, большинство редакторов научных журналов требуют, чтобы мощность исследования составляла не менее 80%. Взаимосвязь между размером выборки и мощностью исследования показана на Рисунке 3.
Рис. 3
Взаимосвязь между мощностью и размером выборки.
Рис. 3
Взаимосвязь между мощностью и размером выборки.
Хорошей практикой является выполнение расчета мощности перед началом собственно клинического исследования, чтобы минимизировать риск получения ошибки типа II, и большинство журналов и комитетов по этике требуют, чтобы это было четко определено в разделе методологии. Например, при планировании исследования влияния нового инотропа на сердечный выброс исследователь должен определить минимальную разницу между сердечным выбросом контрольной группы и активного лечения, которая будет считаться клинически значимой .Как только это различие будет определено, исследователю потребуется доступ к данным, полученным из ранее опубликованной работы или первоначального пилотного исследования, детализирующего среднее значение и стандартное отклонение контрольных данных.
Опасности множественных сравнений
Рассмотрим исследование, в котором изучается влияние 20 различных лечебных трав на продолжительность сна людей с бессонницей. Также существует группа плацебо, с которой сравнивается каждая из 20 групп активного лечения.Множественные тесты t выполняются для каждого из лекарственных средств на травах, и было замечено, что одно из них действительно способствует увеличению сна по сравнению с плацебо, со значением P <0,05. Насколько справедлив этот вывод?
Фактически, вероятность того, что любое из 20 лекарственных средств на травах даст статистически значимый результат на уровне P <0,05, составляет 1 к 20. Поэтому не будет удивительным, если статистический анализ одного из 20 лекарственных средств ниже расследование показало P <0.05 просто случайно. Правильный подход при проведении нескольких сравнений, таких как это, - использовать поправочный коэффициент. Наиболее известна поправка Бонферрони, в которой значение P для значимости корректируется с P <0,05 до P <0,05 / n , где n — количество производимых сравнений. В качестве альтернативы следует провести дисперсионный анализ (anova) между всеми 21 исследуемой группой с последующими post hoc индивидуальных сравнений, рассчитанных только в том случае, если значение P для anova <0.05.
Один
против двусторонних тестовВсе статистические тесты начинаются с предпосылки нулевой гипотезы. Затем это проверяется путем вычисления вероятности того, что различия, наблюдаемые между группами выборки, вызваны случайностью (значение P ). Давайте рассмотрим исследование, сравнивающее два выборочных значения (например, среднее артериальное давление после лечения гипертонии двумя разными препаратами). Анализируя такие данные, мы, очевидно, не знаем, одинаково ли эффективны препараты, эффективнее ли препарат А, чем препарат Б, или наоборот.Соответственно, при вычислении значения P ключевой вопрос заключается в следующем: какова вероятность получения разницы, наблюдаемой между двумя выборочными средними значениями (или чем-то более экстремальным) случайным образом, учитывая, что любая группа может иметь более высокое среднее значение. ? На этот вопрос отвечает двусторонний непарный t -тест.
Практически всегда целесообразно проводить статистический анализ данных с использованием двусторонних тестов, и это должно быть указано в протоколе исследования до сбора данных.Односторонний тест обычно не подходит. Он отвечает на аналогичный вопрос двустороннего теста, но, что очень важно, заранее указывает, что нас интересует только то, что выборочное среднее для одной группы больше, чем для другой. Если анализ данных показывает результат, противоположный ожидаемому, разницу между средними значениями выборки следует отнести к случайности, даже если эта разница велика.
Например, организатор курса статистики подвергает кандидатов тесту MCQ как до, так и после курса.Затем оценки за курс анализируются с использованием парного теста t (поскольку данные представляют собой сопоставленные пары оценок до и после курса для каждого кандидата). Организатор решает использовать односторонний тест, так как он уверен, что знания кандидатов должны улучшиться после курса, и не учитывает возможность того, что кандидаты наберут меньше очков после него. Несколько удивительно, что после анализа данных средние оценки MCQ после курса хуже, чем до курса, с P -значение 0,01. Правильная статистическая интерпретация этого результата состоит в том, чтобы отнести наблюдаемое различие к случайному совпадению.Тем не менее, действительно может быть правдой, что кандидаты показывают худшие результаты после курса. Возможно, курс сбивает с толку или содержит множество фактических ошибок. Организатор курса ошибся, использовав односторонний тест в этой ситуации — двусторонний тест был бы уместен.
Односторонние тесты всегда следует рассматривать с некоторым подозрением. На самом деле довольно сложно вспомнить примеры в клинических исследованиях, где уместен односторонний тест. Одним из примеров может быть исследование нервно-мышечного блокирующего препарата, в котором пациентам вводятся две разные интубационные дозы и время, необходимое для восстановления отношения последовательности четырех до ≥0.8 записано. Вероятно, оправданно не принимать во внимание возможность того, что более низкая доза препарата приводит к более длительному времени выздоровления.
Благодарности
Авторы благодарны профессору Роуз Бейкер, факультет статистики, Салфордский университет, за ее ценный вклад в предоставление полезных комментариев и советов по этой рукописи.
Библиография
1,.Статистика I: данные и корреляции
,Contin Educ Anaesth Crit Care Pain
,2007
, vol.7
(стр.95
—9
) 2,.Статистика II: Центральная тенденция и распространение данных
,Contin Educ Anaesth Crit Care Pain
,2007
, vol.7
(стр.127
—30
) 3,.Статистика III: Вероятностные и статистические тесты
,Contin Educ Anaesth Crit Care Pain
,2007
, vol.7
(стр.167
—70
) 4. ,Введение в медицинскую статистику
,2000
3-е изд.Oxford
Oxford University Press
5.,Практическая статистика для медицинских исследований
,1991
Лондон
Chapman & Hall / CRC
6.,Статистика для чайников
,2003
Нью-Джерси
Wiley Publishing Inc
cow TD 7Статистика на первом месте
(по состоянию на 21 октября 2007 г.) 8.Онлайн-учебник по статистике Hyperstat
,2006
(доступ 21 октября) 9SurfStat Australia
,2006
(доступ 21 октября) 10.,Как читать статью
,1997
Лондон
BMJ Publishing
11.,Критическая оценка эпидемиологических исследований и клинических испытаний
,1998
2-е изд.Oxford
Oxford University Press 9180003
См. вопросы с несколькими вариантами ответов 26–28
© Правление и попечители Британского журнала анестезии [2007]. Все права защищены. Для получения разрешений, пожалуйста, напишите: журналы[email protected]
Краткое введение в статистическую проверку гипотез
Последнее обновление 10 апреля 2020 г.
Данные должны интерпретироваться для придания смысла.
Мы можем интерпретировать данные, предполагая определенную структуру нашего результата и используя статистические методы, чтобы подтвердить или опровергнуть это предположение. Предположение называется гипотезой, а статистические тесты, используемые для этой цели, называются тестами статистической гипотезы.
Каждый раз, когда мы хотим заявить о распределении данных или о том, отличается ли один набор результатов от другого набора результатов в прикладном машинном обучении, мы должны полагаться на статистические проверки гипотез.
В этом руководстве вы познакомитесь с проверкой статистических гипотез и узнаете, как интерпретировать и тщательно формулировать результаты статистических тестов.
После прохождения этого руководства вы будете знать:
- Статистические проверки гипотез важны для количественной оценки ответов на вопросы о выборках данных.
- Интерпретация теста статистической гипотезы требует правильного понимания p-значений и критических значений.
- Независимо от уровня значимости результаты проверки гипотез могут содержать ошибки.
Начните свой проект с моей новой книги «Статистика для машинного обучения», включающей пошаговых руководств и файлов исходного кода Python для всех примеров.
Приступим.
- Обновление май / 2018 : добавлено примечание о «отклонении» и «отказе при отклонении», улучшены формулировки по этой проблеме.
- Обновление июнь / 2018 : исправлена опечатка в объяснении ошибок типа I и типа II.
- Обновление июнь / 2019 : добавлены примеры тестов и ссылки на руководства по Python.
Мягкое введение в проверку статистических гипотез
Фотография Кевина Вербима, некоторые права защищены.
Обзор учебного пособия
Это руководство разделено на пять частей; их:
- Статистическая проверка гипотез
- Интерпретация статистических тестов
- Ошибки в статистических тестах
- Примеры проверки гипотез
- Учебники Python
Нужна помощь со статистикой для машинного обучения?
Пройдите мой бесплатный 7-дневный ускоренный курс электронной почты (с образцом кода).
Нажмите, чтобы зарегистрироваться, а также получите бесплатную электронную версию курса в формате PDF.
Загрузите БЕСПЛАТНЫЙ мини-курс
Статистическая проверка гипотез
Данные сами по себе не интересны. Нас действительно интересует интерпретация данных.
В статистике, когда мы хотим начать задавать вопросы о данных и интерпретировать результаты, мы используем статистические методы, которые обеспечивают уверенность или вероятность ответов.В общем, этот класс методов называется статистической проверкой гипотез или проверкой значимости.
Термин « гипотеза » может заставить вас задуматься о науке, где мы исследуем гипотезу. Это по правильному пути.
В статистике проверка гипотез вычисляет некоторую величину при заданном предположении. Результат теста позволяет нам интерпретировать, выполняется ли предположение или оно было нарушено.
Два конкретных примера, которые мы будем часто использовать в машинном обучении:
- Тест, предполагающий, что данные имеют нормальное распределение.
- Тест, который предполагает, что две выборки были взяты из одного и того же основного распределения населения.
Предположение статистического теста называется нулевой гипотезой или гипотезой 0 (сокращенно H0). Это часто называют предположением по умолчанию или предположением, что ничего не изменилось.
Нарушение предположения теста часто называют первой гипотезой, гипотезой 1 или для краткости h2. h2 на самом деле является сокращением от «, какая-то другая гипотеза », поскольку все, что мы знаем, это то, что данные свидетельствуют о том, что H0 можно отклонить.
- Гипотеза 0 (H0) : Предположение теста выполняется и не может быть отклонено на некотором уровне значимости.
- Гипотеза 1 (h2) : Предположение теста не выполняется и отклоняется на некотором уровне значимости.
Прежде чем мы сможем отвергнуть или не отвергнуть нулевую гипотезу, мы должны интерпретировать результат теста.
Интерпретация статистических тестов
Результаты проверки статистических гипотез должны быть интерпретированы, чтобы мы начали делать заявления.
Это момент, который может вызвать путаницу как у начинающих, так и у опытных практиков.
Есть две общие формы, которые может принимать результат проверки статистической гипотезы, и они должны интерпретироваться по-разному. Это р-значение и критические значения.
Интерпретировать значение p
Мы описываем результат как статистически значимый, интерпретируя значение p.
Например, мы можем выполнить тест на нормальность для выборки данных и обнаружить, что маловероятно, что выборка данных отклоняется от распределения Гаусса, не отклоняя нулевую гипотезу.
Проверка статистической гипотезы может возвращать значение, называемое p или p-значением. Это количество, которое мы можем использовать для интерпретации или количественной оценки результата теста и либо отклонить, либо не отклонить нулевую гипотезу. Это делается путем сравнения p-значения с заранее выбранным пороговым значением, называемым уровнем значимости.
Уровень значимости часто обозначается строчной греческой буквой альфа.
Обычно для альфа используется 5% или 0,05. Меньшее значение альфа предполагает более надежную интерпретацию нулевой гипотезы, например 1% или 0.1%.
Значение p сравнивается с предварительно выбранным значением альфа. Результат является статистически значимым, если значение p меньше альфа. Это означает, что было обнаружено изменение: гипотеза по умолчанию может быть отклонена.
- Если p-значение> альфа : Невозможно отклонить нулевую гипотезу (т.е. несущественный результат).
- Если p-значение <= alpha : отклонить нулевую гипотезу (т. Е. Значимый результат).
Например, если бы мы выполняли проверку, является ли выборка данных нормальной, и вычислили p-значение.07, мы могли бы указать что-то вроде:
Тест показал, что выборка данных была нормальной и не отклонила нулевую гипотезу на уровне значимости 5%.
Уровень значимости можно инвертировать, вычитая его из 1, чтобы получить уровень достоверности гипотезы с учетом данных наблюдаемой выборки.
уровень достоверности = 1 — уровень значимости
уровень достоверности = 1 — уровень значимости |
Следовательно, также могут быть сделаны следующие утверждения:
Тест показал, что данные были нормальными, не отклонив нулевую гипотезу с уровнем достоверности 95%.
«Отклонить» против «Невозможность отклонить»
Значение p является вероятностным.
Это означает, что когда мы интерпретируем результат статистического теста, мы не знаем, что истинно, а что ложно, только то, что вероятно.
Отказ от нулевой гипотезы означает, что существует достаточное статистическое свидетельство того, что нулевая гипотеза маловероятна. В противном случае это означает, что статистических данных для отклонения нулевой гипотезы недостаточно.
Мы можем рассматривать статистический тест с точки зрения дихотомии отклонения и принятия нулевой гипотезы.Опасность состоит в том, что если мы говорим, что « принимаем » нулевую гипотезу, язык предполагает, что нулевая гипотеза верна. Вместо этого будет безопаснее сказать, что мы « не смогли отвергнуть » нулевую гипотезу, так как статистических данных для ее отклонения недостаточно.
При первом чтении « отклонить » и « не отклонить » это сбивает с толку новичков. Вы можете думать об этом как о « отклонить » против « принять » в уме, если вы напоминаете себе, что результат является вероятностным и что даже нулевая гипотеза « приняла » все еще имеет небольшую вероятность того, что неправильный.
Распространенные неверные интерпретации p-значения
В этом разделе освещаются некоторые распространенные неправильные интерпретации p-значения в результатах статистических тестов.
Верная или ложная нулевая гипотеза
Интерпретация p-значения не означает, что нулевая гипотеза верна или ложна.
Это действительно означает, что мы решили отклонить или не отвергнуть нулевую гипотезу на определенном уровне статистической значимости на основе эмпирических данных и выбранного статистического теста.
Вы можете делать вероятностные утверждения, а не четкие двоичные или истинные / ложные утверждения о результате.
p-значение как вероятность
Распространенное заблуждение состоит в том, что p-значение — это вероятность того, что нулевая гипотеза верна или ложна с учетом данных.
Вероятно, это будет записано так:
Это неверно.
Вместо этого p-значение можно рассматривать как вероятность данных с учетом заранее заданного допущения, встроенного в статистический тест.
Опять же, используя обозначение вероятности, это будет записано как:
Это позволяет нам рассуждать о том, соответствуют ли данные гипотезе. А не наоборот.
Значение p — это мера того, насколько вероятно, что образец данных будет наблюдаться, если нулевая гипотеза верна.
Пост-хок тюнинг
Это не означает, что вы можете повторно выполнить выборку своего домена или настроить выборку данных и повторно запустить статистический тест, пока не достигнете желаемого результата.
Это также не означает, что вы можете выбрать значение p после запуска теста.
Это называется р-хакингом или восхождением на холм и будет означать, что результат, который вы представите, будет хрупким и не репрезентативным. В науке это в лучшем случае неэтично, а в худшем — мошенничество.
Интерпретация критических значений
Некоторые тесты не возвращают p-значение.
Вместо этого они могут вернуть список критических значений и связанных с ними уровней значимости, а также статистику теста.
Это обычно непараметрические или нераспределенные статистические проверки гипотез.
Выбор возврата p-значения или списка критических значений — это действительно выбор реализации.
Результаты интерпретируются аналогичным образом. Вместо сравнения одиночного p-значения с заранее заданным уровнем значимости, тестовая статистика сравнивается с критическим значением на выбранном уровне значимости.
- Если тестовая статистика <критического значения : Невозможно отклонить нулевую гипотезу.
- Если статистика теста> = критическое значение : отклонить нулевую гипотезу.
Опять же, значение результата схоже в том, что выбранный уровень значимости является вероятностным решением об отклонении или неспособности отклонить базовое предположение теста с учетом данных.
Результаты представлены так же, как и с p-значением, либо в виде уровня значимости, либо уровня достоверности. Например, если был рассчитан тест на нормальность и статистика теста сравнивалась с критическим значением на уровне значимости 5%, результаты могут быть представлены как:
Тест показал, что выборка данных была нормальной и не отклонила нулевую гипотезу на уровне значимости 5%.
или:
Тест показал, что данные были нормальными, не отклонив нулевую гипотезу с уровнем достоверности 95%.
Ошибки в статистических тестах
Интерпретация проверки статистической гипотезы является вероятностной.
Это означает, что данные теста могут указывать на результат и быть ошибочными.
Например, если альфа составляла 5%, это предполагает, что (максимум) 1 раз из 20 нулевая гипотеза будет ошибочно отклонена или не будет отклонена из-за статистического шума в выборке данных.
Учитывая малое p-значение (отклонить нулевую гипотезу), либо это означает, что нулевая гипотеза ложна (мы все правильно поняли), либо она верна и наблюдалось какое-то редкое и маловероятное событие (мы допустили ошибку). Если возникает ошибка этого типа, она называется ложным срабатыванием . Мы ошибочно верим в отклонение нулевой гипотезы.
В качестве альтернативы, учитывая большое p-значение (неспособность отклонить нулевую гипотезу), это может означать, что нулевая гипотеза верна (мы все правильно поняли) или что нулевая гипотеза неверна и произошло какое-то маловероятное событие (мы допустили ошибку ).Если возникает ошибка этого типа, она называется ложноотрицательным . Мы ошибочно верим в нулевую гипотезу или предположение статистического теста.
У каждого из этих двух типов ошибок есть свое имя.
- Ошибка типа I : неверное отклонение истинной нулевой гипотезы или ложного срабатывания.
- Тип II Ошибка : Неправильный отказ отклонения ложной нулевой гипотезы или ложноотрицательного результата.
Все проверки статистических гипотез могут допускать любой из этих типов ошибок.-7 или 0,0000003, часто называемое 5-сигмой. Это означает, что открытие произошло случайно с вероятностью 1 из 3,5 миллионов независимых повторений экспериментов. Для использования такого порога может потребоваться очень большая выборка данных.
Тем не менее, эти типы ошибок всегда присутствуют, и их необходимо учитывать при представлении и интерпретации результатов статистических тестов. Это также причина того, почему важно иметь независимую проверку результатов.
Примеры проверки гипотез
Существует много типов проверки статистических гипотез.2 Тест
Тесты взаимосвязи переменных (корреляция)
- Коэффициент корреляции Пирсона
- Корреляция рангов Спирмена
- Корреляция рангов Кендалла
- Тест хи-квадрат
Средство сравнения выборок (параметрическое)
- Тест Стьюдента
- Парный t-критерий Стьюдента
- Тест дисперсионного анализа (ANOVA)
- Тест ANOVA с повторными измерениями
Средние значения сравнительной выборки (непараметрические)
- Тест Манна-Уитни
- Тест Wilcoxon Signed-Rank
- Тест Крускала-Уоллиса H
- Тест Фридмана
Например, код Python о том, как использовать каждый из этих тестов, см. В следующем разделе.
Учебники Python
В этом разделе содержатся ссылки на руководства Python по статистической проверке гипотез:
Примеры многих тестов:
Тесты переменного распределения:
Оценка взаимосвязей переменных:
Средство сравнения выборки:
Расширения
В этом разделе перечислены некоторые идеи по расширению учебника, которые вы, возможно, захотите изучить.
- Найдите пример исследовательской работы, в которой результаты не представлены с использованием p-значений.
- Найдите пример исследовательской работы, в которой представлены результаты со статистической значимостью, но при этом часто неверно интерпретируются p-значения.
- Найдите пример исследовательской работы, которая представляет результаты со статистической значимостью и правильно интерпретирует и представляет p-значение и результаты.
Если вы изучите какое-либо из этих расширений, я хотел бы знать.
Дополнительная литература
Этот раздел предоставляет дополнительные ресурсы по теме, если вы хотите углубиться.
Статьи
Сводка
В этом руководстве вы узнали о проверке статистических гипотез и о том, как интерпретировать и тщательно формулировать результаты статистических тестов.
В частности, вы выучили:
- Статистические проверки гипотез важны для количественной оценки ответов на вопросы о выборках данных.
- Интерпретация теста статистической гипотезы требует правильного понимания p-значений.
- Независимо от уровня значимости результаты проверки гипотез могут содержать ошибки.
Есть вопросы?
Задайте свои вопросы в комментариях ниже, и я постараюсь ответить.
Получите информацию о статистике для машинного обучения!
Развить рабочее понимание статистики
… путем написания строк кода на Python
Узнайте, как это сделать, в моей новой электронной книге:
Статистические методы машинного обучения
Он предоставляет учебных пособий для самостоятельного изучения по таким темам, как:
Проверка гипотез, корреляция, непараметрическая статистика, повторная выборка и многое другое…
Узнайте, как преобразовать данные в знания
Пропустить академики. Только результаты.
Посмотрите, что внутри Разъяснение статистической значимости| by Will Koehrsen
Второй важный элемент статистической значимости — это нормальное распределение, также называемое гауссовой или колоколообразной кривой. Нормальное распределение используется для представления того, как распределяются данные из процесса, и определяется средним значением, заданным греческой буквой μ (мю), и стандартным отклонением, заданным буквой σ (сигма).Среднее значение показывает расположение центра данных, а стандартное отклонение — это разброс данных.
Нормальное распределение со средним μ и стандартным отклонением σНормальное распределение применяется при оценке точек данных с точки зрения стандартного отклонения. Мы можем определить, насколько аномальна точка данных, исходя из того, на сколько стандартных отклонений она находится от среднего значения. Нормальное распределение имеет следующие полезные свойства:
- 68% данных находятся в пределах ± 1 стандартного отклонения от среднего
- 95% данных находятся в пределах ± 2 стандартных отклонения от среднего значения
- 99.7% данных находятся в пределах ± 3 стандартных отклонения от среднего значения
Если у нас есть нормальное распределение для статистики, мы можем охарактеризовать любую точку с помощью стандартных отклонений от среднего. Например, средний рост женщины в США составляет 65 дюймов (5 футов 5 дюймов) со стандартным отклонением в 4 дюйма. Если мы встретим новую знакомую, рост которой составляет 73 дюйма, мы можем сказать, что она на два стандартных отклонения выше среднего и — среди самых высоких 2,5% женщин (2,5% женщин будут ниже μ — 2σ (57 дюймов) и 2.5% будет выше μ + 2σ).
В статистике, вместо того чтобы говорить, что наши данные представляют собой два стандартных отклонения от среднего, мы оцениваем их с помощью z-показателя, который просто представляет количество стандартных отклонений, на которые точка от среднего. Преобразование в z-оценку выполняется путем вычитания среднего значения распределения из точки данных и деления на стандартное отклонение. В примере с высотой вы можете проверить, что у нашего друга будет z-оценка 2. Если мы сделаем это для всех точек данных, новое распределение будет называться стандартным нормальным со средним значением 0 и стандартным отклонением 1, как показано. ниже.
Преобразование от нормального (справа) к стандартному нормальному распределению (слева). (Источник)Каждый раз, когда мы проводим проверку гипотезы, нам нужно принять распределение для статистики теста, которое в нашем случае представляет собой средние (средние) часы сна для наших учеников. Для z-критерия нормальная кривая используется в качестве приближения для распределения статистики теста. Как правило, согласно центральной предельной теореме, когда мы берем больше средних значений из распределения данных, они будут стремиться к нормальному распределению.Однако это всегда будет оценка, потому что реальные данные никогда не подчиняются нормальному распределению в полной мере. Предположение о нормальном распределении позволяет нам определить, насколько значимым является результат, который мы наблюдаем в исследовании. Чем выше или ниже z-оценка, тем меньше вероятность того, что результат будет случайным, и тем более вероятно, что результат будет значимым. Чтобы количественно оценить, насколько значимы результаты, мы используем еще одну концепцию.