Характеристика на неуравновешенного ученика: Психолого-педагогическая характеристика ученика — Свободная школа
Характеристика на ученика для ПМПК
ХАРАКТЕРИСТИКА
ученика _ класса
название школы
ФИО ребенка
Дата рождения
(Имя ребенка) поступил в 1 класс «название школы» 1.09.2015 г. из МБДОУ №___ по решению ЦПМПК от 06.07.2015 г. с заключением «Вариант искаженного развития с нарушением коммуникации и когнитивной сферы».
Мальчик воспитывается в полной семье. Воспитанием сына в основном занимается мать.
Ребенок от 1 беременности, протекавшей на фоне анемии, хронического пиелониефрита. Роды на 39 неделе. Масса при рождении 3614 г., рост 53 см., по шкале Апгар 7-8 баллов. Сидеть стал с 6,4 месяцев, ходить – с 9 месяцев. Первые слова в 12 месяцев. Фразовая речь с 7 лет. Заключение невролога – резидуальная энцифалопатия, поведенческие нарушения, ЗНПР, синдром навязчивых движений. Заключение психиатра – F 84.12. Слух и зрение в норме.
(Имя ребенка) отличается неуравновешенным поведением. Не умеет устанавливать отношения с детьми и взрослыми.
Низкая познавательная активность. Значительное снижение мотивационно-волевого усилия. Отмечается эмоциональная неустойчивость, импульсивность. Внимание непроизвольное, непродуктивное. Объем памяти не соответствует условно-принятым возрастным нормам. Низкий уровень вербально-логического и наглядно-образного мышления. Испытывает трудности при установлении логических связей, обобщении, сравнении.
Характерно двигательное беспокойство. Артикуляционные движения замедленные. Отмечаются трудности в удержании артикуляционных поз. В контакт вступает тяжело. Малоразговорчив. Для речи характерна эхолалия. Говорит односложно. Понимание речи затруднено, инструкции требуют повторного объяснения. Пассивный и активный словарь характеризуется бедностью. Активной речью не пользуется. Допускает аграмматизмы при образовании прилагательных от существительных. Испытывает затруднения при воспроизведении малознакомых слов сложной слоговой структуры. Звукопроизношение не нарушено. При воспроизведении серии слогов с фонетически близкими звуками допускает ошибки. Затруднено определения наличие или отсутствие звука в слове, последовательность и количество звуков в слове, его место в слове. Испытывает затруднения при фонематическом анализе и синтезе. Связная речь сформирована недостаточно. В основном использует однословные и двухсловные предложения. Испытывает затруднения при построении связного высказывания (при составлении рассказа, пересказе, выражающиеся в нарушении последовательности передачи сюжета, в его упрощении, в наличии смысловой неточности, в поиске подходящих слов).
В школу обучающийся пришел читающим, умеющим решать примеры, но по результатам диагностики в начале года обучающийся набрал 0 баллов, поскольку он не приступил к заданиям. Затем ему дали повторный шанс написать работу индивидуально у психолога, но работу тоже не выполнил. Результаты диагностики «Беседа-знакомство» из 25 вопросов смог ответить только на 4.
Каллиграфия неустойчива. Контрольный диктант в конце года не дописал. Не обозначает границы предложений, все слова пишет со строчной буквы, встречаются замены букв, орфограммы не усвоены.
Владеет прямым и обратным счетом в пределах 20. Решает примеры в пределах 10, при решении примеров в пределах 20 часто допускает ошибки. Справляется с решением простых арифметических задач. К стартовым контрольным работам по математике и русскому языку не приступил.
Чтение слоговое с переходом на чтение целыми словами, в основном безошибочное. Проверить технику чтения полноценно не представляет возможности. За 30 секунд прочитал 15 слов. Далее задание выполнять отказался. Испытывает трудности при пересказе и заучивании наизусть.
Знания об окружающем мире не соответствуют возрасту.
Общая и мелкая моторика развиты слабо.
14.10.2016
Директор (__________.)
Педагог-психолог (__________.)
Учитель-логопед (__________)
Учитель (___________)
Методы исследования психологических свойств и состояний личности
Значительными возможностями в исследовании индивидуальности личности обладают проекционные методики.
Царь Иван IV (Грозный) в современной отечественной научной и учебной литературе
%PDF-1.4 % 1 0 obj > endobj 4 0 obj /Title >> endobj 2 0 obj > endobj 3 0 obj > stream
i9z1″{vo1|~th5)hɔ»Ė6Y NrNWxRVio !!0 tgN&)L*9ln>3+’ѡf|Г1u.Q0t_10@»r
Предотвращение скулшутинга в Московской области
В июньском выпуске журнала «Мир Безопасности» Первый заместитель руководителя Главного управления региональной безопасности Московской области Владимир Герасименко рассказал о накопленном опыте по снижению рисков вооруженного насилия в образовательной среде.
По итогам совещания с членами Правительства Российской Федерации, состоявшегося 13 мая 2021 года , Президент поручил : «обеспечить внедрение единого подхода к обеспечению безопасности и антитеррористической защищённости в общеобразовательных организациях, в том числе исходя из численности обучающихся в этих организациях и типов населённых пунктов, в которых они располагаются. Доклад – до 1 августа 2021 г., далее – один раз в полгода. Ответственные: Мишустин М.В., высшие должностные лица (руководители высших исполнительных органов государственной власти) субъектов Российской Федерации».
Владимир ГЕРАСИМЕНКО,
Первый заместитель руководителя Главного управления
региональной безопасности Московской области
Проблемы скулшутинга не обошли стороной Московскую область
В сентябре 2017 года в Ивантеевском образовательном центре девятиклассник Михаил Пивнев открыл стрельбу из пневматического ружья, ударил учительницу по голове кухонным топориком и взорвал несколько самодельных взрывных устройств небольшой мощности. Обошлось без жертв, но 4 человека получили травмы разной степени тяжести. Неуравновешенного подростка суд приговорил к 7 годам воспитательной колонии.
В 2019 году силовикам удалось предотвратить расстрел студентов Луховицкого аграрно-промышленного колледжа. Борис Банин планировал расстрелять своих однокурсников и преподавателей из-за неоднократных конфликтов с ними. У него изъяли пистолет Макарова с боевыми патронами и список будущих жертв. По приговору суда Банин проведёт 6 лет в колонии строгого режима.
В начале 2021 года сотрудниками ФСБ в городе Люберцы были задержаны двое 16-летних подростков, готовивших вооружённое нападение на одну их школ в посёлке Красково. Явно недетские намерения подростков подтверждались изъятыми у них двумя самострелами, самодельными взрывными устройствами и различной атрибутикой «колумбайна».
Кроме того сотрудниками Центра противодействия экстремизму ГУ МВД России по Московской области ежегодно выявляется не мене десятка пользователей соц.сетей, подверженных культу «колумбайна», и в той иной мере серьёзности обсуждающих возможные сценарии расправ над одноклассниками.
Данные факты в совокупности с событиями, произошедшими в Керчи и Благовещенске, обратили на себя внимание Антитеррористической комиссии Московской области и побудили активизировать профилактические мероприятия по предотвращению скулшутинга в образовательных организациях региона.
Организация данной работы была поручена Главному управлению региональной безопасности и областному Министерству образования.
В этом материале хотелось бы поделиться накопленным опытом и рассказать о проблемах, которые нам ещё предстоит решить совместно с федералами.
ПОВЫШЕНИЕ УРОВНЯ АТЗ
Обеспечение надлежащего уровня антитеррористической защищённости объектов образования, относящихся к сфере ведения региональных и муниципальных властей, в Московской области осуществляется в рамках государственной программы «Безопасность Подмосковья» и муниципальных программ по профилактике правонарушений.
Правообладатели (областные ЦИОГВ или муниципалитеты) ежегодно проводят проверку состояния и наличия инженерно-технических средств в детских садах, школах, колледжах и ВУЗах на предмет выполнения требований постановлений Правительства РФ №1006 и №1421. Перед началом бюджетного года проводится корректировка ежегодно выделяемых из бюджета средств, формируются перечни необходимых для закупки оборудования, работ, услуг и затем в соответствии с утверждёнными дорожными картами выполняются намеченные мероприятия.
С учётом выбывания из строя изношенного и морально устаревшего оборудования планировалось, что к 2024 году все учебные заведения региона на 100 % будут соответствовать требованиям антитеррористической защищённости.
Однако события в Казани потребовали ускорения решение этой проблемы.
По поручению Губернатора Московской области А.Ю. Воробьева буквально на следующий день после трагедии начались внеплановые проверки состояния АТЗ школ и колледжей. Сейчас мы подводим итоги этих проверок и до конца текущего месяца в муниципальные программы будут внесены необходимые коррективы.
Стоит отметить, что на сегодняшний день почти во всех школах и детских садах Подмосковья уже установлены видеокамеры системы «Безопасный регион», кнопки тревожной сигнализации, все имеют профессиональную физическую охрану и до начала нового учебного года все объекты образования 1-й и 2-й категории будут дооборудованы системами контроля и управления доступом.
Теперь перед нами стоит задача максимально повысить эффективность использования средств видеонаблюдения, так как в ходе проверок выяснилось, что не везде обеспечена сохранность архива видеозаписей, не в каждой школе имеются специалисты, обученные работе с современной видеотехникой, а самое главное –выявлено множество фактов формального подхода к базовому требованию – «обеспечить видеоконтроль входных групп». Камеры на входах в учебные заведения установлены практических везде, но, к сожалению, картинка с них оставляет желать лучшего — из-за неправильного расположения возникают трудности применения системы распознавания лиц и других возможностей видеоаналитики, не всегда камеры захватывают сами посты охраны, которые также необходимо контролировать (проблемы качества физической охраны объектов образования это наша постоянная «головная боль» и отдельная тема для обсуждения).
Постановления ПРФ 1006 и 1421 приводят довольно объёмный перечень технических средств, которые должны иметься на объектах дошкольного, среднего и высшего образования — это кнопки тревожной сигнализации (КТС), системы оповещения и управления эвакуацией, наружное освещение (как средство АТЗ), системы видеонаблюдения и охранной сигнализации, контрольно-пропускные пункты на входах в здания и на территорию, стационарные и ручные металлоискатели, системы контроля и управления доступом (СКУД) и пр.
Однако, по нашему мнению наиболее эффективным способом пресечения проникновения на территорию нежелательных посетителей является наличие двух рубежей охраны – первый при входе на территорию и второй на входе в здание (естественно при наличии нормального периметрового ограждения).
Вместе с тем требование об установке контрольно-пропускные пунктов относится только к объектам 1-й категории (вместимость более 1100 человек). При этом почти все наши детсады и школы независимо от категории имеют свою огороженную территорию, но вход на эту территорию практически свободный – калитка (ворота) закрываются только на ночь.
Как правило в образовательном объекте выставляется один пост (суточный илии 12-ти часовой) и размещается на входе в здание, где организован учебный процесс.
Несомненно, что все случившиеся факты скулшутинга, возможно было бы пресечь ещё на подходе. В случае нападения или попытки пронести оружие на территорию объекта у второго поста (в здании) всегда есть время на вызов ГБР, можно успеть блокировать входные двери и даже забаррикадироваться.
Полагаем необходимым установить это требование в указанных постановлениях Правительства РФ.
Также необходимо указать минимальные требования к конструкции периметрового ограждения образовательного объекта. Кто-то может возразить, что это не уровень постановления федерального правительства – однако-же в п. 26 ПРФ 1006 указано, что въезды на объект должны быть оснащены не просто воротами, а детализировано: воротами «обеспечивающими жёсткую фиксацию их створок в закрытом положении». Так почему бы в этом документе не задать и минимальную высоту ограждения территории объекта образования?
В образовательных учреждениях 4-й категории (до 100 чел) возможно устанавливать домофон с функцией видеоконтроля, кстати, частные детсады и школы как правило на это денег не жалеют и почти все оборудованы подобными средствами. Но, чтобы решить эту проблему в бюджетных учреждениях необходимо чёткое указание нормативного акта — иначе денег на это не выделяется.
Наряду с неуклонным повышением уровня антитеррористической защищённости объектов образования профилактическая работа в Московской области по предотвращению скулшутинга идёт ещё по нескольким направлениям, два из которых на наш взгляд заслуживают внимания и рекомендуются для применения в других регионах.
СТУДЕНТЫ С ОРУЖИЕМ НА КОНТРОЛЕ
Проведённый ранее анализ событий в Керчи и Благовещенске (а теперь ещё и в Казани) позволил сделать однозначный вывод – все студенты, получающие в законном порядке разрешения на оружие должны быть на особом контроле.
Казалось бы, чего проще – сделать из базы владельцев оружия ЦЛРР выгрузку списка всех кто учится в колледжах и ВУЗах и организовать их контроль.
Но, как оказалось, такая информация в ЦЛЛР отсутствовала – указание места работы или учёбы при получении разрешения на оружие не требовалось, более того такие поля для заполнения вообще отсутствовали в базе данных.
Пришлось договариваться с заинтересованными органами. В итоге мы разработали и утвердили некий алгоритм совместных действий ГУРБ, Минобразования, ЦЛЛР и службы участковых.
Сначала по нашей рекомендации были внесены изменения в типовую форму Акта проверки условий обеспечения сохранности оружия и патронов. Теперь информация о том, что желающий получить оружие, является студентом, выясняется участковым ещё при проверке у кандидата условий хранения, затем передаётся в ЦЛЛР и вносится в базу.
Чтобы восполнить ранее образовавшийся пробел в учётах, участковыми уполномоченными в короткое время с выходом на адреса проживания был отработан весь массив владельцев оружия в Московской области в возрасте до 25 лет – 1597 чел.
Оказалось, что всего в регионе имеют зарегистрированное огнестрельное оружие 237 студента, обучающихся в средне-специальных и высших учебных заведениях, причём с обширной географией – от Воронежа до Санкт-Петербурга, но в основном, конечно-же в ближайшем центре вузовского образования – в городе Москве, 44 владельца оружия учатся в областных образовательных организациях.
Поделившись информацией с другими регионами, мы совместно со специалистами областного Минобразования организовали адресную индивидуально-профилактическую работу с «нашими» студентами — любителями оружия.
В рамках этих мероприятий все они прошли психологическое тестирование. Интересный факт — при опросе всего один из тестируемых указал, что приобрёл огнестрельное оружие в спортивных целях, трое — для охоты, а остальные затруднились ответить, указав официально заявленную цель — «для самообороны». Соответственно у педагогов возникли вопросы – чего опасаются их студенты, если для своей безопасности вынуждены приобретать оружие?
В ходе данной работы за полтора года было выявлено 6 владельцев, имеющих признаки возможного девиантного поведения. С ними организованы дополнительные адресные профилактические мероприятия: один владелец из указанной группы риска добровольно отказался от владения оружием, трое закончили обучение, двое остаются на особом контроле руководства образовательных организаций и участковых инспекторов.
В настоящее время при подаче в ЦЛРР ГУ Росгвардии по Московской области заявления о получении разрешения на оружие кандидат сразу указывает место учёбы (если есть). Затем направляется запрос в образовательное учреждение, где с ним проводится тестирование и собеседование с психологом.
Далее с обладателями «стволов» до окончания обучения, руководством учебного заведения продолжается индивидуальная профилактика с привлечением штатных психологов.
К сожалению, настораживающий социально-психологический портрет и даже отрицательная характеристика с места учёбы не являются законными основаниями для отказа в выдаче разрешения на оружие.
Организованная нами работа позволяет только чуть пристальнее контролировать этих студентов, по крайней мере, руководство колледжа и местный участковый знает — у каких студентов имеется официально зарегистрированное оружие.
В этом году мы пошли ещё дальше – получили в образовательных организациях списки так называемых «трудных» подростков, т.е. более 6 тыс. детей состоящих на внутришкольном учёте, и попросили ЦЛЛР проверить — нет ли у их родителей огнестрельного оружия. Оказалось, что у 108 учеников из этой категории родители дома хранят оружие. Информация об этом была незамедлительно доведена до руководства образовательных организаций, УПДН и службы участковых. С ними также организованы дополнительные адресно-профилактические мероприятия по установленным алгоритмам.
Кроме прочего, мы с помощью областного Министерства здравоохранения выяснили — где и как наши студенты проходили медицинские осмотры перед получением разрешения на оружие.
Все они получили медицинские заключения формы 002-О/у в установленном порядке, как в государственных так и в частных клиниках, имеющих соответствующие лицензии.
Но из них всего 47 чел. посетили по месту жительства врача-нарколога и 105 чел. врача-психиатра. Остальные умудрились получить мед.заключения, просто предъявив справки из регистратур местных наркологических и психоневрологических диспансеров о том, что не состоят там на учёте.
Стоит ли говорить, что такое халатное отношение к выдаче медицинских заключений отмечается исключительно в частных клиниках.
Однако какой- либо действенный механизм по отзыву уже выданных разрешений на оружие на основании этой информации пока отсутствует.
ИНДИВИДУАЛЬНАЯ ПРОФИЛАКТИКА
Министерством образования Московской области за эти годы также наработана достаточно солидная практика по предотвращению скулшутинга.
Мы уже давно отошли от общепринятого заблуждения, что основной группой риска являются конфликтные и явно неуравновешенные подростки. Все задержанные за вооружённые нападения ранее характеризовались исключительно с положительной стороны и, как правило, воспитывались в благополучных семьях.
Поэтому нашим коллегам-педагогам пришлось внедрить в практику немного нестандартные решения и подходы.
В первую очередь следует отметить масштабную работу по проведению массового социально-психологического тестирования практически всех школьников Подмосковья от 14 лет и старше. В 2020 году участие в тестировании приняло более 322 тыс школьников. Из них почти 7% педагоги определили для себя как входящих в зону риска и соответственно требующих повышенного внимания.
Около 27 % учащихся отнесены к группе повышенной вероятности вхождения в группу риска.
Следует отметить, что тестирование является абсолютно добровольным, но сам факт отказа от тестирования – это уже характеризующий фактор. Показатели по всем образовательным организациями разнятся – где-то эти проценты выше, где-то ниже. В школы где эти результаты хуже чем в среднем по области направляются специалисты для оказания помощи местным педагогам.
Естественно результаты всех этих мероприятий являются строго конфиденциальными, персональные данные школьников закодированы.
Во-вторых, внедрена система наблюдения за социальными сетями. В Академии социального управления Московской области создан Центр практической психологии образования с группой мониторинга. В 2020-21 гг специалистами Центра было проанализировано более 2 тыс. аккаунтов обучающихся, выявлено 24 школьника, подвергаемых буллингу, и 7 подростков, имеющих признаки суицидального поведения. Информация направлена руководству школ, эти дети взяты на контроль психологов и социальных педагогов.
На основе практического опыта специалистами Центра разработан пакет методических материалов – Алгоритм мониторинга аккаунтов в социальных сетях, Стандарт наблюдения за поведением ребёнка, Тренинг-программа развития культуры потребления информации, Типовые сценарии родительских собраний, посвящённых этим проблемам.
В общем, не вдаваясь в подробности, алгоритм индивидуально профилактической работы по недопущению насилия в образовательном учреждении выгладит следующим образом:
— все обучающиеся проходят социально-психологическое тестирование;
— постоянно мониторятся открытые аккаунты учащихся «группы риска»;
— директор знает каждого ученика /студента «группы риска»;
-на каждого подростка, по тем или иным причинам попавшего на внутришкольный учёт заводится карта наблюдения за поведением;
— по каждому «проблемному подростку/ребёнку составляется план индивидуальной работы;
— исполнение этого плана на еженедельном контроле директора;
— родители информируются о проводимой работе;
— родителям рекомендуется посетить специалиста-психиатра;
— на родительские собрания и классные часы приглашаются сотрудники подразделений УПДН и специалисты по профилактике деструктивного поведения;
— с помощью электронного учёта посещаемости на школьном портале сразу выявляются проблемные подростки по неизвестным причинам, начинающие прогуливать уроки.
НОРМОТВОРЧЕСТВО
Несмотря на вышеперечисленные наработки и накопленный опыт в сфере противодействия скулшутингу, следует констатировать, что нормативно-правовая база в этой сфере отстаёт от практических реалий.
В связи с этим многие наши проекты ещё не могут получить окончательную «путёвку в жизнь», многое мы видим и понимаем, но принцип правового регулирования деятельности органов государственной власти гласит «запрещено все, что не разрешено законом» — без должного правового регулирования в этой тонкой сфере общественных отношений, мы со своими коллегами рискуем оказаться на грани «превышения полномочий».
Поэтому Главное управление региональной безопасности Московской области совместно с профильными ведомствами с учетом данного Президентом поручения сконцентрировало своё внимание на подготовке предложений по внесению изменений в федеральные нормы.
Полагаем необходимым внести ряд изменений и дополнений в постановления Правительства РФ № 1006 и 1421 в части уточнения требований к охране и технической оснащённости объектов образования, более чёткой регламентации действий должностных лиц, ответственных за антитеррористическую защищённость и уточнению алгоритмов их действий.
Также готовим пакет законодательных инициатив о внесении изменений в федеральное законодательство, предусматривающий дополнительные основания для отказа в выдаче разрешений на приобретение оружия и совершенствование порядка медицинского освидетельствования для лиц моложе 25-лет или обучающихся в учебных заведениях.
Заслуживает внимание то, что в поручении Президента требование об обеспечении единого подхода к антитеррористической защищенности сделано с оговоркой «исходя из типов населённых пунктов».
Для Московской области это существенное замечание – сейчас ППРФ 1006 устанавливает единые требования по АТЗ для школы с одинаковым количеством учащихся, что в крупных городах, что в отдалённых сельских районах.
Анализ «пробелов в выполнении домашних заданий» среди старшеклассников
Исследователи десятилетиями пытались определить причинную или даже корреляционную связь между временем, проведенным в школе, и улучшенными результатами обучения учащихся. Некоторые исследования были сосредоточены на продолжительности учебного года, другие — на часах в день, а третьи — на часах в неделю.
В этом сообщении блога мы рассмотрим время, проведенное вне школы, в частности время, потраченное на выполнение домашних заданий, среди различных расовых и социально-экономических групп.Мы будем использовать данные Американского исследования использования времени (ATUS), чтобы пролить свет на эти различия, а затем попытаемся объяснить эти пробелы, используя данные ATUS и другие доказательства.
Что мы знаем о внеклассном времени
Измерение взаимосвязи между временем, проведенным вне школы, и такими результатами, как результаты тестов, может быть трудным. Исследователи в первую очередь сбиты с толку неспособностью определить, что заставляет учащихся выбирать домашнее задание в свободное от других занятий время. Неужели те, кто тратит больше времени на домашнюю работу, просто дополнительно мотивированы? Или они учащиеся, испытывающие трудности, и которым нужно усерднее работать, чтобы не отставать? Какую роль играют социальные ожидания от родителей или сверстников?
Предыдущие исследования изучали влияние использования времени вне дома на результаты обучения учащихся.Исследование 2007 года с использованием данных из Berea College в Кентукки выявило причинно-следственную связь между часами, потраченными на учебу, и успеваемостью студента с помощью интересной меры. Исследователи воспользовались случайно назначенными соседями по комнате в колледже, обратив внимание на тех, кто пришел в кампус с игровой приставкой на буксире. Они предположили, что студенты, случайно назначенные соседу по комнате без игровой приставки, будут изучать больше, поскольку все остальные факторы оставались равными. Эта гипотеза подтвердилась, и эта группа также получила значительно более высокие оценки, демонстрируя причинно-следственную связь.
Другое исследование основывалось на данных, собранных в рамках Американского исследования использования времени, исследования того, как американцы проводят свое время, и показало наличие гендерного разрыва и пробела в образовании родителей в отношении времени выполнения домашних заданий. В других исследованиях изучалась взаимосвязь между сохранением работы и использованием времени студентом в дискреционных действиях, таких как сон, просмотр медиа и время, затрачиваемое на домашнее задание. Нам интересно узнать о различиях в продолжительности выполнения домашних заданий вне школы в зависимости от расы и дохода.
Описательная статистика использования времени
Мы начали с общей выборки из 2575 учащихся очной средней школы в возрасте от 15 до 18 лет из ATUS, ограничив выборку их ответами о времени, затрачиваемом на выполнение домашних заданий в будние дни и учебные месяцы (с сентября по май).Среди всех опрошенных старшеклассников (тех, кто сообщил, что они выполнили домашнее задание, и тех, кто этого не сделал), время, отведенное на выполнение домашнего задания, составляло менее часа в день, несмотря на то, что учителя старших классов сообщают, что они отводят в среднем 3,5 часа. домашних заданий в день.
Для изучения расовых различий или различий по доходам на рис. 1 мы наносим на график количество минут, в течение которых учащиеся сообщают о затратах на домашнее задание, отдельно по своей расовой / этнической группе и семейному доходу. Мы наблюдали временной разрыв между расовыми группами, при этом азиатские студенты тратят больше всего времени на домашнее задание (почти два часа в день).Точно так же мы наблюдаем временной разрыв в доходах семей учащихся.
Мы также можем использовать данные ATUS, чтобы выделить, когда учащиеся выполняют домашнее задание, по расе и доходу. На рисунке 2 мы отображаем процентную долю учащихся старших классов в каждой расовой и доходной группе, выполняющих домашнее задание, по времени суток. Процентные показатели остаются низкими в течение школьного дня, а затем ожидаемо увеличиваются, когда ученики возвращаются домой, при этом больше азиатских учеников делают больше домашних заданий и работают поздно ночью, чем другие расовые группы.Студенты с низким доходом сообщили, что они выполняют меньше домашних заданий в час, чем их сверстники из других семей.
(Щелкните, чтобы увидеть полноразмерное изображение.)Первые попытки объяснить пробелы в домашнем задании
Мы выдвинули гипотезу, что эти расхождения во времени, основанные на расе и доходе, потенциально могут быть объяснены другими факторами, такими как работа, время, потраченное на уход за другими, и образование родителей. Мы проверили эти гипотезы, разделив группы на основе конкретных характеристик и сравнив среднее количество минут в день, затрачиваемых на домашнее задание, среди групп сравнения.
Учащиеся, которые работают, как и ожидалось, сообщили, что тратят меньше времени на образовательную деятельность, поэтому, если работа непропорционально влияет на определенные расовые или доходные группы, то работа может помочь объяснить временной разрыв. Учащиеся, которые работали, выделяли на домашнее задание в среднем на 20 минут меньше, чем их сверстники, которые не работали. Хотя учащиеся с низким доходом работали больше часов, чем их сверстники, они в основном сохраняли аналогичный уровень домашнего времени за счет сокращения своего досуга или внеклассных занятий.Таким образом, временной промежуток, необходимый для выполнения домашних заданий, изменился лишь незначительно с учетом работы в качестве одного из факторов.
Мы также включили время, потраченное на заботу о других в семье. Хотя больший процент студентов с низким доходом заботится о других членах домохозяйства, мы обнаружили, что это не оказывает статистически значимого влияния на домашнюю работу, потому что студенты сокращают досуг, а не домашнюю работу, пытаясь помочь своим семьям. Следовательно, эта переменная снова не объясняет временные промежутки.
Наконец, мы рассмотрели образование родителей, поскольку было показано, что более образованные родители побуждают своих детей больше ценить школу и иметь ресурсы, позволяющие облегчить выполнение домашних заданий. Наш анализ показал, что студенты, у которых хотя бы один из родителей имеет какое-либо высшее образование (младшее или выше), сообщают, что они тратят больше времени на выполнение домашних заданий, чем их сверстники, родители которых не имеют ученой степени; однако различия по признаку расы все еще существуют, даже если уровень образования родителей остается неизменным.Обращаясь к уровням доходов, мы обнаружили, что образование родителей больше связано с временем выполнения домашних заданий среди учащихся с низким доходом, что сокращает временной разрыв между группами доходов до восьми минут.
Социальные объяснения
Наш анализ ATUS не может полностью объяснить этот разрыв во времени, затрачиваемом на выполнение домашних заданий, особенно среди расовых групп. Напротив, мы считаем, что рассмотрение домашнего задания как результата культуры школы и ожиданий учителей, а не как результат усилий ученика, может дать некоторые причины для его настойчивости.
Многие исследования, в том числе недавние, показали, что учителя воспринимают цветных учеников хуже своих белых сверстников в учебе. Исследование Сета Гершенсона и др., Проведенное в 2016 году. показали, что этот разрыв в ожиданиях может также зависеть от расы учителя. В стране, где учащиеся из числа меньшинств составляют почти половину всех учащихся государственных школ, а учителя из числа меньшинств составляют всего 18 процентов преподавательского состава, эти различия в ожиданиях имеют значение.
Цветные учащиеся также с меньшей вероятностью будут посещать средние школы, которые предлагают продвинутые курсы (включая курсы Advanced Placement), которые, вероятно, будут давать больше домашних заданий, и, таким образом, доступ к строгим курсам также может частично объяснить пробелы.
Исследование показывает аналогичный, хотя и менее хорошо задокументированный, разрыв по доходам, когда учителя сообщают о более низких ожиданиях и более туманном будущем для своих учеников с низкими доходами. Студентам с низким доходом и цветным студентам может быть назначено меньше домашних заданий из-за более низких ожиданий от их успеха, что мешает им выучить столько же и создает самоисполняющееся пророчество.
В заключение, этот анализ использования времени выявил существенный разрыв в выполнении домашних заданий по расе и по доходной группе, который нельзя полностью объяснить работой, заботой о других или образованием родителей.Кроме того, различия в успеваемости, особенно измеренные на стандартных тестах, были хорошо задокументированы в зависимости от расы и дохода. Эти пробелы заслуживают нашего внимания, но мы должны с осторожностью винить обездоленные группы. Использование времени — это результат, отражающий множество факторов, а не просто мотивацию, и более глубокое понимание этого должно помочь повысить ожидания — и, следовательно, образовательные достижения — повсюду.
Сара Новиков внесла свой вклад в эту публикацию.
Работа с несбалансированными наборами данных.Обнаружение мошенничества с кредитными картами | Камил Мирза
За последние пару недель я пытался воссоздать и понять различные алгоритмы машинного обучения, чтобы расширить свои знания в области машинного обучения.
Я наткнулся на этот набор данных на Kaggle под названием «Обнаружение мошенничества с кредитными картами», , и я расскажу вам, как мы можем создать двоичный классификатор для мошенничества и транзакций, не связанных с мошенничеством.
Этот набор данных также представляет реальные данные. Это сильно несбалансированный код , так как транзакций, не связанных с мошенничеством, больше, чем транзакций мошенничества.Основная причина такого дисбаланса данных связана с предвзятостью.
Это смещение может повлиять на наш алгоритм машинного обучения, заставляя его полностью игнорировать класс меньшинства . Это проблематично, потому что зачастую мы хотим точно предсказать меньшинство.
Без лишних слов, давайте сразу перейдем к делу.
П.С. На протяжении всего исследования и обучения я имел в виду записную книжку Янио Бахманна и его взгляд на проблему. Вы найдете его записную книжку внизу статьи!
Прежде чем переходить к коду и изучению этих данных, есть краткое описание нашего набора данных, которое мы должны пройти, чтобы лучше понять, что это за набор данных.
Набор данных включает 284 807 транзакций, совершенных европейскими держателями карт в сентябре 2013 года. Это реальные данные, и, как и следовало ожидать, в них есть некоторые недостатки.
- Дела о мошенничестве составляют всего 492 из 284 807 транзакций. (0,172% случаев)
- Функции V1-V28 подверглись преобразованию анализа основных компонентов (PCA).
- Когда функция «Класс» = 1, это мошенничество.
- Когда функция «Класс» = 0, значит, это не мошенничество.
Это дает нам некоторую ценную информацию. Во-первых, наши данные сильно несбалансированы из-за соотношения мошеннических операций и операций, не связанных с мошенничеством. В целях конфиденциальности некоторые из наших столбцов характеристик подверглись преобразованию PCA.
Краткий обзор преобразования PCA
Он берет трехмерную плоскость и превращает ее в двухмерную.Анализ основных компонентов (PCA) — это метод уменьшения размерности до , чтобы уменьшить размерность больших наборов данных . Когда мы говорим о размерности, вы можете рассматривать это так:
, если у нас есть 2 входные переменные, такие как x и y , мы говорим, что это 2-мерное.Размерность — это, по сути, количество входных переменных в наборе данных.
В нашем наборе данных по обнаружению мошенничества с кредитными картами у нас есть 30 входных переменных или 30 столбцов с различными входными данными. Можно сказать, что данные, с которыми мы работаем, представляют собой 30-мерный набор данных.
В PCA уменьшение размерности выполняется путем преобразования большого набора переменных в меньшую переменную . Эта новая переменная будет содержать большую часть информации из исходного набора данных.
Также важно отметить, что данные масштабируются (нормализуются) перед PCA .Посмотрите это видео от Statquest, чтобы пошагово понять, как выполняется PCA:
Джош Стармер из StatQuest объясняет, как PCA преобразует данные в этом видео!Вот сводка того, что происходит с данными после PCA:
- Значения в нашем наборе данных становятся меньше. (См. От V1 до V28)
- Легче исследовать, анализировать и визуализировать
- В нашем наборе данных меньше «шума» (меньше нерелевантных данных)
Короче говоря, преобразование PCA позволяет нам брать многомерные данные, преобразовывать их в 2D-значения и проецировать исходные многомерные данные на основные компоненты.
Вы можете думать о основных компонентах как о строках, которые собирают наибольший объем информации в наборе данных .
Хорошо, давайте подробнее рассмотрим наши данные. Есть несколько вещей, на которые мы хотим обратить внимание.
- Есть ли в наборе данных «нулевые» (отсутствующие) значения?
- Насколько несбалансирован набор данных?
- Насколько искажены наши данные?
«Нулевые» значения
Давайте сначала проверим наличие «нулевых» значений в наборе данных:
# Загрузить в набор данных
df = pd.read_csv (.... / creditcard.csv) # Проверить нулевые значения
df.isnull (). sum (). max () # Результат будет 0
Отлично! У нас нет нулевых значений в этом наборе данных, поэтому для нас на одну проблему меньше. «Нулевые» или отсутствующие значения — это плохо, главным образом потому, что они усложняют разработку нашей модели машинного обучения и делают ее подверженной ошибкам.
Визуализация распределения «классов»
Давайте также визуализируем, насколько несбалансирован наш набор данных для функции «Класс».
# Установка цветов для графикаКак видите, данные сильно несбалансированы. Есть просто ползунок красного цвета ха-ха
colors = ["# 0101DF", "# DF0101"] # Используйте счетную диаграмму Сиборна для построения графика
sns.countplot ('Class', data = df, palette = colors)
plt.title ('Class Distributions \ n (0: No Fraud || 1: Fraud)', fontsize = 14)
Skewed Data
Наконец, давайте также посмотрим, насколько искажены данные, с которыми мы работаем, для функций «Time» и «Amount».
fig, ax = plt.subplots (1, 2, figsize = (18,4)) amount_val = df ['Amount']. Values Асимметрия этих данных очень плохая, поэтому это будет проблемой для нас
time_val = df ['Time']. Values # Постройте график распределения
sns.distplot (amount_val, ax = ax [0], color = 'r')
ax [0] .set_title ('Распределение суммы транзакции', fontsize = 14)
ax [0] .set_xlim ([min (amount_val ), max (amount_val)])sns.distplot (time_val, ax = ax [1], color = 'b')
ax [1] .set_title ('Распределение времени транзакции', fontsize = 14)
ax [ 1] .set_xlim ([min (time_val), max (time_val)])plt.show ()
Основная проблема с искаженными данными заключается в том, что они часто приводят к искаженным остаткам . Остатки похожи на диагностические меры для модели машинного обучения.
Это помогает нам оценить качество модели машинного обучения. Как вы, наверное, догадались, , если этот остаток искажен, мы не получим точного представления о том, насколько хороша наша модель на самом деле.
Хорошо, теперь, когда мы разобрались с нашими данными, перейдем к этапу предварительной обработки!
Мы собираемся использовать два метода для решения проблемы дисбаланса данных.Первый — это случайная недостаточная выборка , а второй — S синтетический M inority O по сравнению с Te chnique (SMOTE) .
Мы сравним эти 2 метода и посмотрим, какой из них работает лучше всего, но сначала давайте:
- Масштабируем наш набор данных
- Создаем подвыборку из нашего исходного фрейма данных
Масштабирование функций (стандартизация)
Масштабирование функций важно для алгоритмов машинного обучения, использующих евклидово расстояниеПомните, как функции с V1 по V28 подвергались преобразованию PCA? Получается, , чтобы провести преобразование PCA, необходимо заранее масштабировать данные .
Это необходимо для нормализации данных в определенном диапазоне, чтобы различные алгоритмы машинного обучения, которые мы будем использовать, могли правильно выполнять вычисления. Вот список некоторых алгоритмов машинного обучения, которые требуют масштабирования предварительных функций:
- K-ближайших соседей
- Логистическая регрессия
- Линейная регрессия
- K означает
Эти алгоритмы используют евклидово расстояние для решения задач классификации , поэтому это необходимо чтобы уменьшить величину этого расстояния между двумя характерными точками на графике.
Помните формулу расстояния? Это для 2D-самолетов. Евклидовы расстояния аналогичны, но для многомерных данных.Кроме того, поскольку столбцы с V1 по V28 масштабируются, нам также необходимо масштабировать столбцы «Время» и «Сумма» для единообразия.
# FEATURE SCALING из sklearn.preprocessing import StandardScaler, RobustScaler# RobustScaler менее подвержен выбросам.
std_scaler = StandardScaler ()
rob_scaler = RobustScaler ()df ['scaled_amount'] = rob_scaler.fit_transform (df ['Amount']. values.reshape (-1,1))
df ['scaled_time'] = rob_scaler.fit_transform (df ['Time']. values.reshape (-1,1))df.drop (['Time', 'Amount'], axis = 1, inplace = True)
Здесь мы используем надежный масштабатор из scikit-learn для масштабирования наших функций ‘Amount’ и ‘Time’. Он удаляет медиану из наших данных и масштабирует ее в соответствии с межквартильным размахом (IQR).
# SCALED DATA
scaled_amount = df ['scaled_amount']
scaled_time = df ['scaled_time'] # ВСТАВИТЬ НОВЫЕ ЗНАЧЕНИЯ df.drop (['scaled_amount', 'scaled_time'], axis = 1, inplace = True)
df.insert (0, 'scaled_amount', scaled_amount)
df.insert (1, 'scaled_time', scaled_time) # СМОТРЕТЬ ЭФФЕКТЫ МАСШТАБИРОВАНИЯ
df.head ()
Вы заметите, что все значения в функциях «Время» и «Сумма» теперь намного меньше из-за масштабирования.
Одним из подходов к решению этой проблемы является случайная повторная выборка обучающего набора данных. Это можно сделать двумя способами:
- Мы могли бы просто удалить данные из класса большинства (без мошенничества), чтобы они совпадали с классом меньшинства (мошенничество).
- Мы могли бы создать новые данные о меньшинствах на основе существующих данных о меньшинствах.
Конечно, у каждого метода есть свои недостатки. Например, удаление данных уменьшит количество ценной информации. Создание новых данных может внести больше «шума» в наш набор данных и может привести к переобучению нашей модели.
Мы посмотрим, как оба работают и как они сравниваются друг с другом, чтобы увидеть, какой из них лучше всего подходит для этого конкретного набора данных.
Но, прежде чем мы сможем реализовать любую технику, мы должны сначала создать подвыборку нашего исходного набора данных.
Подвыборка исходного набора данных
Причина, по которой мы должны создать эту подвыборку, в значительной степени связана с целями тестирования . Нам нужно будет протестировать наши модели на исходном наборе тестов, а не на тестировании, которое будет создано двумя методами выборки.
Общая цель здесь — использовать выборочные данные (меньше или больше), чтобы наша модель могла изучить закономерности, которые сильно влияют на функцию «Класс».
Затем мы бы протестировали эту модель на исходном наборе данных , чтобы получить более точную метрику того, насколько точно модель классифицируется в более «репрезентативном» наборе данных (несбалансированная версия).
# Импорт
из sklearn.model_selection import train_test_split
from sklearn.model_selection import StratifiedShuffleSplitprint ('No Frauds', round (df ['Class']. Value_counts () [0] / len (df) *) , 2), '% или для набора данных')
# Создание подвыборки
print ('Мошенничество', round (df ['Class']. Value_counts () [1] / len (df) * 100,2), '% o для набора данных ')
X = df.drop (' Class ', axis = 1)
y = df [' Class ']sss = StratifiedKFold (n_splits = 5, random_state = None, shuffle = False)
для train_index, test_index в sss.split (X, y):
print ("Поезд:", train_index, "Test:", test_index)
original_Xtrain, original_Xtest = X.iloc [train_index], X.iloc [test_index]
original_ytrain, original_ytest = y.iloc [train_index], y.iloc [test_index]
Запуск этого сценария сначала скажет вам, сколько строк данных является мошенническим и не мошенническим (с помощью value_counts ()). Затем он делит каждое число на общую частоту и преобразует ее в процент.
Затем идет фактическое разделение данных. Мы также преобразуем исходные данные в массивы NumPy, чтобы мы могли использовать их для ввода в нашу модель немного позже.Вы можете сделать это, просто используя значения:
original_Xtrain = original_Xtrain.values
original_Xtest = original_Xtest.values
original_ytrain = original_ytrain.values
original_ytest = original_ytest.values
Первый метод известен как метод случайной недостаточной выборки назовем его RUST). RUST случайным образом удаляет примеры из класса большинства в наборе обучающих данных.
В нашем случае мы удаляем случайным образом, пока не получим равное соотношение 50:50 | мошенничество: отсутствие мошенничества делает наш фрейм данных сбалансированным.Вот основные шаги, которые мы должны выполнить, чтобы уменьшить выборку данных:
- Узнайте, насколько несбалансирован наш набор данных, используя value_counts () в функции «Класс» для каждой метки (1 или 0).
- Приведите класс большинства (не мошенничество) к классу меньшинства (мошенничество)
- Затем мы перемешиваем данные, чтобы проверить, может ли наша модель поддерживать постоянную точность при каждом запуске скрипта.
# перемешивает данные перед подвыборкой
df = df.sample (frac = 1) # Принимает 492 строки, не связанные с мошенничеством
fraud_df = df.loc [df ['Class'] == 1]
non_fraud_df = df.loc [df ['Class'] == 0] [: 492] # Создание нового фрейма данных с соотношением мошенничества и отсутствия мошенничества 50:50
normal_distributed_df = pd.concat ([fraud_df, non_fraud_df]) # Перемешать новый фрейм данных
new_df = normal_distributed_df.sample (frac = 1, random_state = 42)
Готово! У вас есть набор данных с соотношением мошеннических и не мошеннических транзакций 50:50. Мы даже можем визуализировать это, чтобы проверить распределение этого нового фрейма данных.
Гистограмма, показывающая количество ярлыков мошенничества и отсутствия мошенничества в новом dfПеред тем, как мы рассмотрим другой метод, мы можем фактически повысить точность нашей модели, сделав еще один шаг вперед по данным неполной выборки с некоторой предварительной обработкой данных.
Верхняя цель этого этапа — удалить экстремальные выбросы из функций, которые сильно влияют на то, является ли транзакция мошенничеством. . Чтобы выяснить, какие функции имеют такую сильную корреляцию, мы воспользуемся корреляционной матрицей.
Матрица корреляции
Матрица корреляции — ключ к пониманию наших данных. Фактически, позвольте мне показать вам, как несбалансированный набор данных отображается в корреляционной матрице по сравнению со сбалансированным.
Заметили разницу? Это связано с дисбалансом данных. Как вы можете видеть выше, модели гораздо сложнее понять закономерности, которые влияют на результат метки, когда вы скармливаете ей несбалансированный набор данных.
С другой стороны, вы можете видеть, что модель более эффективно улавливает закономерности в наборе данных с неполной выборкой , который мы создали ранее.Разберем корреляционную матрицу. Обратите внимание:
- -1 указывает на абсолютно отрицательную линейную корреляцию между двумя переменными
- 0 указывает на отсутствие линейной корреляции между двумя переменными
- 1 указывает на абсолютно положительную линейную корреляцию между двумя переменными
Вы обнаружите, что V17, V14, V12 и V10 имеют отрицательную корреляцию . Это означает, что чем ниже эти значения, тем выше вероятность того, что этикетка является подделкой.
Кроме того, V2, V4, V11 и V19 положительно коррелированы с .Чем выше становятся эти значения, тем выше вероятность того, что этикетка является подделкой.
Теперь, когда мы знаем, что эти функции имеют некоторую корреляцию с нашей функцией «Класс», мы проанализируем их дальше, чтобы лучше понять их распределение с помощью коробчатых диаграмм.
Коробчатые диаграммы и обнаружение аномалий
На следующем этапе мы собираемся обнаруживать экстремальные выбросы для каждой из этих функций и избавляться от них . Мы собираемся сосредоточиться только на тех, которые имеют отрицательную корреляцию.
P.S. Вы можете использовать ту же процедуру и для положительных корреляций.
Итак, что такое коробчатые диаграммы? — Что ж, это своего рода диаграмма, которая позволяет визуализировать распределение числовых данных и асимметрию, показывая нам квартили данных.
Это вся информация, которую вы можете получить из коробчатой диаграммы — Кредиты на простую психологиюВ нашем случае коробчатые диаграммы будут очень полезны для визуализации всех выбросов в этих конкретных функциях. Вот как это выглядит!
Обратите внимание на все серые точки вне рамочной диаграммы? Это выбросы в наших данных !!Мы не собираемся избавляться от всех выбросов, поскольку это еще одна огромная потеря данных, которую мы не можем себе позволить, поскольку мы уже так много потеряли из-за недостаточной выборки.Мы будем использовать только для обнаружения и удаления экстремальных выбросов .
Для этого воспользуемся методом IQR.
Метод IQR
IQR известен как межквартильный размах. Чтобы рассчитать межквартильный размах, вам просто нужно взять 3-й квартиль (75%) — 1-й квартиль (25%) .
Наша цель — создать порог, превышающий 75-й процентиль и 25-й процентиль . Идея состоит в том, что любая точка, выходящая за пределы этих определенных пороговых значений, будет удалена.
Вот как мы это сделаем:
Во-первых, нам нужно визуализировать распределение функций, которые мы будем использовать для устранения выбросов.
Темный контур показывает нормальное распределение функции (AKA Gaussian Distribution)Если мы внимательно рассмотрим, кажется, что функция ‘V14’ — единственная функция, которая имеет более нормальное распределение, если сравнить ее с V12 и V10. . Вы можете увидеть нормальное распределение для каждой функции по более темным контурам .
Далее мы определим порог.
# Получает все строки данных V14, которые являются мошенничеством (1)
v14_fraud = new_df ['V14']. Loc [new_df ['Class'] == 1] .values # Определить 1-й и 3-й квартили
q25, q75 = np.percentile (v14_fraud, 25), np.percentile (v14_fraud, 75)
print ('Quartile 25: {} | Quartile 75: {}'. Format (q25, q75)) # Найти Межквартильный диапазон (IQR)
v14_iqr = q75 - q25
print ('iqr: {}'. Format (v14_iqr))
Чтобы определить порог, нам просто нужно взять IQR и умножить его на константу.Мы будем использовать постоянную 1,5, но ее можно настроить для повышения точности.
Обратите внимание, что чем выше ваша константа, тем меньше выбросов вы обнаружите для каждой функции и наоборот. Затем мы берем произведение IQR x 1,5, добавляем его к третьему квартилю и вычитаем его из первого квартиля как такового:
# Определить точку отсечения
v14_cut_off = v14_iqr * 1,5 # Определить порог
v14_lower, v14_upper = q25 - v14_cut_off, q75 + v14_cut_offprint ('Cut Off: {} '.format (v14_cut_off))
print ('V14 Lower: {} ' .format (v14_lower))
print ('V14 Upper: {} ' .format (v14_upper))
Отлично! Мы определили наш порог и можем приступить к удалению выбросов, превышающих пороговое значение. Для этого мы напишем заявление об условном удалении.
Удалите все точки в V14, которые ниже или выше определенного порога.
# Определить все выбросы
выбросы = [x для x в v14_fraud if xили x> v14_upper] print ('Feature V14 Outliers for Fraud Cases: {} '.format (len (выбросы)))
print ('V14 выбросы: {} ' .format (выбросы)) # Удаление выброса
new_df = new_df.drop (new_df [(new_df ['V14']> v14_upper) | (new_df ['V14']Затем мы повторяем этот процесс для других функций V12 и V10. Это можно сделать для положительно коррелированных функций, определенных выше, но обратите внимание, что это может привести к потере большего количества информации.
При желании вы также можете визуализировать удаление выбросов с помощью коробчатых диаграмм, и вы обнаружите, что в функциях меньше экстремальных выбросов.
Вы можете ясно видеть, что в каждой функции меньше резких выбросов!Теперь, когда это сделано, мы собираемся понять, насколько хорошо будущие модели прогнозирования будут подходить для разделения случаев мошенничества и отсутствия мошенничества.
Уменьшение размерности и кластеризация
Как объясняется в разделе анализа преобразования PCA, уменьшение размерности, по сути, является методом уменьшения количества входных переменных для набора данных большой размерности.
Это даст нам какое-то представление о том, будут ли будущие модели прогнозирования хорошо подходить для классификации случаев мошенничества и отсутствия мошенничества .Мы рассмотрим 3 основных метода уменьшения размерности, а именно:
T-SNE и другие алгоритмы
Из трех алгоритмов t-SNE довольно хорошо справляется классификация случаев мошенничества и случаев отсутствия мошенничества, поэтому мы Рассмотрим, в частности, этот алгоритм подробнее. Видео
Statquest о t-SNE феноменально, и я настоятельно рекомендую вам посмотреть его, чтобы понять, как оно работает.Как и преобразование PCA, t-SNE снижает размерность нашего набора данных. Он находит способ проецировать наши точки данных в пространство низкой размерности, чтобы сохранить кластеризацию из исходного набора данных (высокая размерность).
В нашем случае мы берем 30-мерный набор данных и проецируем его на 2-мерный график.
Вот двухмерный график разброса прогнозируемых данных после прохождения каждого алгоритма уменьшения размерности.На основе графиков разброса выше мы можем получить хорошее указание на то, что модели прогнозирования, которые мы будем обучать, будут хорошо работать при классификации мошеннических и не мошеннических транзакций. .
Чтобы выяснить, какие классификаторы лучше всего подходят для нашей задачи, мы собираемся взглянуть на четыре общих классификатора, а именно:
- Логистическая регрессия
- K ближайших соседей
- Классификатор опорных векторов
- Классификатор дерева решений
# Подвыборка перед перекрестной проверкой
X = new_df.drop ('Class', axis = 1)
y = new_df ['Class'] # Разделить данные
X_train, X_test, y_train, y_test = train_test_split (X, y, test_size = 0.2, random_state = 4 # Значения поворота в массив для подачи в алгоритм классификации
X_train = X_train.values
X_test = X_test.values
y_train = y_train.values
y_test = y_test.values # Реализация 4 классификаторов
classifiers = {
"LogisiticRegression" LogisiticRegression " ),
«KNearest»: KNeighborsClassifier (),
«Классификатор опорных векторов»: SVC (),
«DecisionTreeClassifier»: DecisionTreeClassifier ()} # Подбор моделей и перекрестная проверка
для ключа, классификатор в классификаторах .items ():
classifier.fit (X_train, y_train)
training_score = cross_val_score (classifier, X_train, y_train, cv = 5)
print ("Классификаторы:", classifier .__ class __.__ name__, "Имеет оценку обучения", round (training_score.mean (), 2) * 100, «% оценка точности »)После подбора модели и применения алгоритма перекрестной проверки для определения оценки обучения нашей модели вы обнаружите, что Классификатор логистической регрессии имеет лучший результат обучения из 4 .
Настройка гиперпараметров с помощью GridSearchCV
Поскольку мы обучаем 4 классификатора одновременно, будет очень сложно вручную настраивать гиперпараметры каждого классификатора и каждый раз подгонять их под данные тренировки.
Нашим решением этой проблемы является функция библиотеки GridSearchCV, которую вы можете импортировать из пакета scikit-learn model_selection.
По сути, проходит по предопределенным гиперпараметрам и соответствует вашему классификатору .В конце концов, вернет лучшие параметры для каждой модели , которая дает наивысший прогнозный балл.
Вот как это может выглядеть:
# Импортировать GridSearchCV
из sklearn.model_selection import GridSearchCV # Определить параметры классификатора в словарной форме
log_reg_params = {"штраф": ['l1', ' l2 '],' C ': [0,001, 0,01, 0,1, 1, 10, 100, 1000]} # Цикл для поиска лучших параметров
grid_log_reg = GridSearchCV (LogisticRegression (), log_reg_params)
grid_log_reg.fit (X_train, y_train) # Лучшие параметры для классификатора
log_reg = grid_log_reg.best_estimator_ # Необязательно: используйте print (log_reg), чтобы увидеть лучшие параметры.Чтобы разбить это, мы импортируем GridSearchCV. Затем мы создаем словарь для гиперпараметров (ключ) и всех опций, которые хотим опробовать для каждого параметра (итерация).
Затем мы создаем объект GridSearchCV, определяя классификатор и параметры (словарь), чтобы затем сопоставить его с нашими обучающими данными.
Используя best_estimator_, , мы можем получить лучшие параметры для модели. Важно отметить, что параметры, которые вы должны определить в словарной форме, различаются в зависимости от используемых вами классификаторов.
В нашем случае мы проделаем тот же процесс для трех других классификаторов, чтобы получить лучшую версию каждого из них.
Чтобы понять, насколько хорошо работает наша модель, мы визуализируем эту производительность с помощью двух разных кривых:
- Кривая обучения
- Кривая характеристики оператора приемника (ROC)
Кривая обучения
Кривая обучения модели показывает - результативность обучения модели в зависимости от опыта или времени .Короче говоря, мы пытаемся определить динамику нашей модели, которая может быть такой:
- Недостаточно
- Переоборудовано
- Просто замечательно!
Мы построим кривую обучения для оценки (обучение и тестирование) в сравнении с размером обучения , чтобы увидеть, какая модель лучше. Вот пример того, как будет выглядеть график обучения для классификатора логистической регрессии:
# Import learning_curveЦветные заливки показывают отклонения от каждого графика.Чем шире разрыв, тем выше дисперсия.
из sklearn.model_selection import learning_curve
# ax2 - ax4 будет использоваться для других моделей
# Мы сосредоточимся на ax1 для логистической регрессии
f, ((ax1, ax2), (ax3, ax4)) = plt.subplots (2,2, figsize = (20,14), sharey = True) # Определение кривой обучения для трех переменных (слева)
train_sizes, train_scores, test_scores = learning_curve (
log_reg, X_train, y_train, cv = cv, n_jobs = 4, train_sizes = train_sizes) # Вычислить среднее и стандартное отклонение для результатов обучения и тестов
train_scores_mean = np.mean (train_scores, axis = 1)
train_scores_std = np.std (train_scores, axis = 1)
test_scores_mean = np.mean (test_scores, axis = 1)
test_scores_std = np.std (test_scores, axis = 1) # Создание заполнения отклонения
# среднее - стандартное отклонение = заполнение отклонения внизу графика
# среднее + стандартное отклонение = заполнение отклонения вверху графика
ax1.fill_between (train_sizes, train_scores_mean - train_scores_std ,
train_scores_mean + train_scores_std, alpha = 0.1,
color = "# ff9124") ax1.fill_between (train_sizes, test_scores_mean - test_scores_std,
test_scores_mean + test_scores_std, alpha = 0.1ff, color = "# 2455 Это проще, если вы определить функцию, которая строит 4 кривыеЕсть несколько вещей, на которые мы хотим обратить внимание. Во-первых, мы хотим проверить созданное нами заполнение дисперсии. Обратите внимание, что чем шире зазор, тем больше отклонение . Чем больше отклонение, , тем больше вероятность, что модель переоснащается .
Например, взгляните на заполнение дисперсии на кривой обучения классификатора дерева решений. С другой стороны, если оценка на кривых обучения и перекрестной проверки низка, это говорит нам о том, что модель не соответствует требованиям.
Принимая во внимание баллы каждого классификатора, вы сможете определить, что классификатор логистической регрессии на самом деле имеет лучшие оценки поездов и оценки перекрестной проверки.
Кривая характеристик оператора приемника
Кривая ROC очень полезна для определения лучшего классификатора и лучшего порога для каждого классификатора. Однако, прежде чем я смогу перейти к объяснению ROC, нам нужно понять еще пару концепций.
Первое, что нам нужно понять, - это матрица неточностей.
Профилирующих студентов, посещающих онлайн-курсы, использующие методы интеллектуального анализа данных
Чонг Хо Ю
Институт прикладных технологий обучения
Государственный университет Аризоны
[email protected] Самуэль Диганги
Институт прикладных технологий обучения
Государственный университет Аризоны
[email protected] Энджел Кей Яннаш-Пеннелл
Институт прикладных технологий обучения
Государственный университет Аризоны
angel @ asu.edu Чарльз Капроле
Институт прикладных технологий обучения
Государственный университет Аризоны
[email protected] АннотацияЭффективность программ онлайн-обучения зависит от соответствия программы целевой аудитории. Основываясь на наборе данных, который предоставляет информацию о зачислении студентов, академической успеваемости и демографических данных, извлеченных из хранилища данных крупного вуза на Юго-Западе, в этом исследовании изучались факторы, которые могут отличить студентов, которые, как правило, посещают онлайн-курсы, от тех, кто этого не делает.Для решения этой проблемы использовались методы интеллектуального анализа данных, включая деревья классификации и многомерные адаптивные регрессивные сплайны (MARS). В отличие от параметрических методов, которые, как правило, возвращают длинный список предикторов, методы интеллектуального анализа данных в этом исследовании предполагают, что релевантными являются только несколько переменных, а именно возраст и дисциплина. Предыдущие исследования показывают, что старшие студенты предпочитают онлайн-курсы, и поэтому консервативный подход к внедрению новых технологий больше подходит для этой аудитории. Однако это исследование показало, что младшие школьники имеют более сильную тенденцию посещать онлайн-уроки, чем старшие.Кроме того, среди этих младших школьников более вероятно, что студенты изобразительного искусства и образования будут проходить онлайн-курсы. Эти результаты могут помочь разработчикам политики определить приоритеты ресурсов для разработки онлайн-курсов, а также помочь институциональным исследователям, преподавателям и разработчикам учебных материалов настроить стратегии разработки учебных курсов для конкретной аудитории.
ВведениеС развитием Интернет-технологий университеты предлагают все большее количество онлайн-классов.С помощью этого средства обучения студенты, которые не могут посещать обычные классы, получают большую гибкость в своем обучении. Однако, поскольку системы онлайн-обучения имеют несколько предполагаемых недостатков, таких как изоляция, разобщенность, ограниченное взаимодействие и технологические проблемы, по сравнению с очным обучением, эти проблемы могут оставить учащихся пассивными и немотивированными, потенциально повышая их вероятность бросить учебу. из курсов в колледже (Willging & Johnson, 2004).Подобно исследованию Уиллинга и Джонсона (2004), Аллен и Симан (2006) также нарисовали мрачную картину онлайн-классов, утверждая, что онлайн-курсы потенциально отдаляют студентов от академической интеграции, социальной интеграции и общего опыта на территории кампуса. Но Шрам и Хонг (2002) определили необходимые факторы для обеспечения высоких показателей удержания среди онлайн-студентов и смогли указать уровень удержания более 80% для своих онлайн-программ.
Эффективность онлайн-программ, независимо от того, измеряется ли она с точки зрения академической интеграции или уровня удержания, зависит от соответствия программы целевой аудитории.Не зная профиля типичных онлайн-студентов, администраторам сложно расставить приоритеты для ресурсов для разработки курса, определить соответствие курсов методу доставки и разработать эффективные стратегии, помогающие этим студентам добиться успеха. Например, по оценке Университета штата Мичиган (MSU), разработка одного онлайн-курса стоит примерно 70 000 долларов. Поскольку стоимость разработки и внедрения онлайн-курсов очень высока, важно убедиться, что деньги расходуются не зря.Таким образом, MSU обнаружил, что разработка и поддержка онлайн-курсов требует добавления специалистов и персонала для их прохождения (WinklerPrins, Weisenborn, Groop, & Arbogast, 2007). Корпорации также не просто производят товары или предоставляют услуги, а затем ожидают, что потребители купят все, что они предлагают. Скорее, корпорации очень часто изучают профили клиентов, чтобы настроить товары и услуги для конкретных целевых сегментов (Ayres, 2007). Точно так же этот анализ полезен администраторам дистанционного обучения, потому что знание характеристик онлайн-студентов является ключом к постоянному совершенствованию.Следовательно, цель этой статьи - изучить факторы, которые могут отличить студентов, которые склонны проходить онлайн-курсы, от тех, кто этого не делает, за счет использования методов интеллектуального анализа данных, включая деревья классификации и многомерные адаптивные регрессивные сплайны (MARS). Эти данные будут полезны администраторам дистанционного обучения, потому что они предоставят им более конкретную информацию о своих пользователях и могут предоставить рекомендации по разработке этих курсов, чтобы удовлетворить этих пользователей.
Обзор литературыДжонс и его коллеги (2004) определили восемь основных причин отчисления студентов, которые включают академический профиль студентов, их семейное положение, время учебы и т. Д.Виллинг и Джонсон (2004) специально исследовали причины, по которым студенты решают бросить онлайн-курсы. Используя логистический регрессионный анализ, их исследование показало, что пол, раса, место жительства, предыдущий статус занятости и средний балл в основном влияют на удержание онлайн-студентов, и определили средний балл как единственный значимый фактор.
Помимо традиционного моделирования логистической регрессии, некоторые исследователи обратились к вопросам профилирования студентов с помощью инновационных методологий. Например, чтобы повысить эффективность обучения сетевых образовательных систем, Сюй и Ван (2006) показали, что персонализированные виртуальные учебные среды могут улучшить мотивацию обучения и эффективность функций в системах онлайн-обучения, таких как персонализированное управление контентом и адаптивное мгновенное взаимодействие.Сюй, Ван и Су (2002) изучали профилирование учеников с помощью нечеткой логики для создания модели содержания, модели ученика и плана обучения. Система может предоставлять студентам персонализированные учебные материалы, викторины и советы на основе профиля каждого студента, такого как учебная деятельность и история взаимодействия. Это также включает время, потраченное на каждую главу и тесты, а также многие другие функции. Нокелайнен, Тирри, Миеттинен, Силандер и Курхила (2002) использовали байесовское вероятностное моделирование для создания профилей респондентов, построив на их основе адаптивную онлайн-анкетную систему.Скьяффино и Аманди (2000) объединили рассуждения на основе случаев и байесовские сети для постепенного и непрерывного построения профилей пользователей.
Далее, Kwok, et al. (2000) разработали систему профилирования учащихся, которая обеспечивает хранение истории обучения и истории взаимодействия для каждого учащегося, который использовал систему обучения на базе Интернета, которая помогла проанализировать деятельность и успеваемость учащегося. Блохер и др. (2002) попытались разработать профиль оптимального онлайн-учащегося, изучив профиль успешного учащегося, который мог бы предоставить им руководящие принципы или правила.Помимо приложений профилирования в колледжах и университетах (Gay, 1992), профилирование студентов также может применяться в более разнообразных условиях, таких как непрерывная оценка курсов медсестер (Sweeney, 1988) и оценка потенциально агрессивных студентов (Lumsden, 2000). .
Короче говоря, профилирование - не новая идея, но из-за относительной новизны онлайн-образования приложения профилирования были редкими в этой области. В этом исследовании мы пытаемся определить ключевые факторы для профилирования онлайн-студентов в надежде, что результаты могут иметь практическое значение как для администраторов, так и для исследователей в области образования.
Источник данныхВ этом исследовании набор данных был составлен путем получения демографических профилей 9944 студентов, которые достигли старшего статуса в весеннем семестре 2007 года, и путем отслеживания их записи в онлайн-классы за предыдущие четыре года в юго-западном университете (см. Таблицы 1 и 2). . Зависимая переменная - это дихотомическая переменная, относящаяся к тому, посещал ли студент онлайн-классы или нет. Первоначально процент онлайн-класса рассчитывался путем деления количества кредитных часов онлайн, взятых за последние четыре года, на общее количество часов, заработанных в учреждении (без учета переведенных часов).
Таблица. 1 Резюме набора студентов
Женский
Мужской
Итого
Пол
(в процентах)5009
50,14935
49,99944
100Средний возраст
(стандартное отклонение)24.4
6,5424,5
5,2724,47
5,94Средний GPA
(std dev)3,21
0,563,07
0,563,14
3,14Резидентство
(в процентах)4102
81,83982
80.69944
100Таблица 2. Сводка по расам
Гонка N
(в процентах)
Азиат
Черный
Латиноамериканец
Родной
Белый
Всего611
330
1266
261
6937
94050.1
3,5
13,5
2,8
73,8
100Однако только один ученик прошел 12 процентов уроков онлайн, а 75 процентов учеников прошли 1 процент или меньше (см. Рисунок 1). На левой панели рисунка 1 гистограмма показывает асимметричное распределение, тогда как на правой панели точечный график показывает ту же асимметрию. Это разные представления данных, но гистограмма группирует наблюдения в интервалы, а точечный график отображает все точки данных.
Рисунок 1. Распределение процентной доли онлайн-классов
Поскольку вариабельность процента посещенных онлайн-классов была очень низкой, вместо этого использовалась двоичная переменная. Короче говоря, студенты были разделены на две группы: те, кто прошел хотя бы один онлайн-класс в течение четырех лет, и те, кто никогда не проходил никаких онлайн-курсов. Онлайн-классы были определены как классы, в которых все обучение проводилось через Интернет, поэтому гибридные классы были исключены. Пенсионеры были выбраны в качестве выборки, чтобы более точно определить студентов, которые посещали онлайн-курсы на любом этапе их академической карьеры на уровне бакалавриата.Хотя совершенно очевидно, что студенты, которые никогда не посещали какие-либо онлайн-курсы, считаются не-онлайн-студентами, может быть несправедливо называть онлайн-студентом того, кто прошел только один онлайн-курс за четыре года. Таким образом, в этом исследовании первая группа называется «студенты, прошедшие онлайн-курсы», а не онлайн-студенты.
Независимыми переменными для этого исследования были: возраст, пол, этническая принадлежность, место жительства (в штате / за пределами штата), место проживания (в кампусе / за пределами кампуса), средний балл, количественные баллы SAT, вербальные баллы SAT, переведенные часы, университетская математика. результаты тестов по размещению и колледж / подразделение.Многие программы имеют ограниченное количество онлайн-классов, и поэтому были включены только пять основных колледжей, а именно: гуманитарные и естественные науки (LA), изящные искусства (FA), инженерия (ES), бизнес (BA) и образование (ED).
МетодВ этом исследовании для создания профилей учащихся использовались деревья классификации и сплайны многомерной адаптивной регрессии (MARS). Анализ дискриминантной функции лучше всего подходит для моделирования с непрерывно масштабируемыми переменными в качестве предикторов. Поскольку этот набор данных состоит как из категориальных, так и из числовых переменных, анализ дискриминантной функции не может справиться с такой сложностью типов данных в одном единственном анализе, если не используется огромное преобразование данных, такое как преобразование категориальных переменных в фиктивные коды (Streifer & Schumann, 2005).В качестве альтернативы использовались методы интеллектуального анализа данных, такие как деревья классификации и MARS. В следующем разделе будет дано краткое введение в эти методологии.
Деревья классификации
Деревья классификации, разработанные Брейманом и др. (1984), стремятся найти, какая независимая переменная (и) может последовательно вносить решающий вклад в данные путем разделения исходной группы данных на пары подгрупп в зависимой переменной. Поскольку деревья классификации могут служить руководством для принятия решений, они также известны как деревья решений.Важно отметить, что интеллектуальный анализ данных фокусируется на распознавании образов, поэтому не используются вероятностные выводы и ошибки типа I. Кроме того, в отличие от регрессии, которая возвращает подмножество переменных, деревья классификации могут упорядочивать факторы, влияющие на уровень удержания.
Существует три типа критериев разделения в деревьях классификации: энтропия, GINI и хи-квадрат. Энтропия, критерий по умолчанию в JMP, способствует сбалансированному или аналогичному разделению. Индекс GINI имеет тенденцию отдавать предпочтение самому большому разбиению или ветви дерева (Han & Kamber, 2006), тогда как мера хи-квадрат, по сути, является критерием согласия (Agresti, 1990).В этом исследовании JMP (SAS Institute, 2007) использовался для построения деревьев классификации на основе энтропии (Quinlan, 1993) в качестве критерия разделения дерева, который способствует сбалансированному или аналогичному разделению.
В процессах интеллектуального анализа данных, включая моделирование с помощью классификационных деревьев и MARS, модель следует намеренно переобучать, а затем масштабировать до оптимального значения. Если модель построена на основе шага вперед и правила остановки, исследователь упустит возможность увидеть, что может быть возможно и лучше впереди.Таким образом, модель необходимо переоборудовать, а затем удалить лишние элементы (Salford Systems, 2002). Поскольку в этом исследовании участвуют 11 независимых переменных, дерево классификации потенциально может содержать 11 уровней. Если все предикторы важны для удержания, каждый из них должен занимать позицию на разных уровнях дерева. Однако некоторые переменные могут никогда не быть выбраны, а некоторые переменные будут повторяться несколько раз. Когда это произойдет, дерево будет обрезано, чтобы сохранить его оптимальность.
Для ретроспективного изучения точности прогноза используется кривая рабочей характеристики приемника (ROC). ROC - это графический график зависимости чувствительности (истинно положительный результат) от специфичности 1 (ложноположительный показатель) для системы бинарных классификаторов, такой как деревья решений. Идеальные результаты прогнозов имеют 100-процентную чувствительность (обнаруживаются все истинные положительные результаты) и 100-процентную специфичность (не обнаруживаются ложные положительные результаты). На самом деле, конечно, этого не происходит. С практической точки зрения, хорошее классификационное дерево должно изображать кривую ROC, наклоненную к левому верхнему углу графика, что подразумевает приближение к идеалу.
Кроме того, для сравнения с деревом JMP использовался исчерпывающий CHAID SPSS (SPSS Inc, 2007). В SPSS доступны четыре метода классификации: (а) автоматическое обнаружение взаимодействия хи-квадрат (CHAID), (b) исчерпывающий CHAID, (c) быстрое, беспристрастное, эффективное статистическое дерево (QUEST) и (d) дерево классификации и регрессия ( ЭЛТ). Все первые три подхода основаны на статистике хи-квадрат (Thomas & Galambos, 2004), в то время как GINI является правилом по умолчанию в CRT.Подобно дереву JMP, CRT разбивает данные на сегменты, которые являются максимально однородными по отношению к зависимой переменной, чтобы генерировать «чистые» узлы. Во многих случаях, включая этот набор данных, CRT в SPSS и дереве JMP дают практически одинаковые результаты.
Согласно Ши (2004), когда в качестве критерия разделения используется статистика хи-квадрат Пирсона, в которой обычно выбираются разбиения с наибольшим значением для направления наблюдений в соответствующие подузлы, это может привести к смещению выбора переменных.Эта проблема особенно серьезна, когда количество доступных точек разделения для каждой переменной различно. Таким образом, такие результаты могут препятствовать интуитивно привлекательной природе деревьев классификации. Тем не менее, по-прежнему стоит провести анализ хи-квадрат, потому что, хотя методы, ориентированные на энтропию, могут производить только дихотомическое разливание (каждый узел имеет два подузла), метод выращивания дерева с использованием меры хи-квадрат способен разделить родительский элемент. на более чем два подузла.
Поскольку CHAID, исчерпывающий CHAID и QUEST основаны на статистике хи-квадрат, а исчерпывающий CHAID считается улучшением по сравнению с CHAID, нет необходимости повторять эти анализы на основе хи-квадрат три раза в этом исследовании.Интересно, что Grabmeier & Lambe (2007) обнаружили, что для переменных бинарной классификации критерии хи-квадрат GINI и Пирсона дают одно и то же дерево, при условии, что все другие параметры алгоритмов идентичны. Следовательно, критерий GINI не был выбран для анализа. Для сравнения сохранены только энтропийно-центрический метод JMP и исчерпывающий CHAID в SPSS, но читатели должны помнить, что результат JMP имеет больший вес, чем его аналоги по хи-квадрат.
Сплайны с многомерной адаптивной регрессией (MARS)
MARS - это метод интеллектуального анализа данных (Friedman, 1991; Hastie, Tishirani, & Friedman, 2001) для решения задач регрессионного типа. Первоначально это было сделано для прогнозирования значений непрерывной зависимой переменной из набора независимых или предиктивных переменных. Позже он был адаптирован для моделирования с двоичной переменной в качестве переменной результата. Подобно исследовательскому анализу данных, MARS является непараметрической процедурой, поэтому перед анализом не предполагается никакой функциональной связи между зависимыми и независимыми переменными.В отличие от обычных статистических процедур, которые либо пропускают пропущенные значения, либо используют вменение данных, MARS генерирует новые переменные при обнаружении переменных с пропущенными значениями. Индикаторы недостающего значения используются для разработки суррогатных подмоделей, когда отсутствуют некоторые необходимые данные. Для ясности интерпретации в разделе результатов будут обсуждаться прямые переменные, а не новые переменные, порожденные пропущенными значениями. Наконец, в этом анализе использовался программный модуль MARS (Salford Systems, 2002) с пятикратной перекрестной проверкой.
Методологическая триангуляция
Иногда результаты исследований могут быть артефактами выбранных методологий исследования. В качестве лекарства для качественных исследователей и исследователей смешанных методов обычной практикой является использование триангуляции, чтобы гарантировать, что наблюдаемые результаты не являются просто продуктом этих методов (Annells, 2006; Creswell & Plano Clark, 2007). Нет причин, по которым те же рассуждения нельзя применить к количественной методологии.Согласно Уильямсону (2005), существует четыре основных типа триангуляции: (а) триангуляция данных, в которой используются несколько источников данных, (б) триангуляция исследователя, в которой несколько исследователей независимо собирают и анализируют данные, (в) теоретическая триангуляция , в которой проблема рассматривается через призму различных теорий, и (d) методологическая триангуляция, в которой данные тщательно исследуются с помощью различных методологий, основанных на различных наборах допущений. Таким образом, в данном исследовании использовалась методологическая триангуляция, включающая два метода классификации и MARS.
Хотя использование одного метода может быть проблематичным, возникает проблема другого типа, когда в исследовании задействовано слишком много методов. Как объяснялось ранее, в модулях SPSS доступны четыре типа деревьев классификации. Некоторые исследователи просто все запускают в надежде, что в конечном итоге один из методов даст благоприятный результат. Этот сомнительный подход осуществляется под названием «исследовательский анализ данных» (EDA), но на самом деле сама суть EDA состоит в том, чтобы избежать преждевременного моделирования до того, как будут поняты структура данных и природа проблемы.
Многочисленные исследования были посвящены тому, чтобы выяснить, какой метод интеллектуального анализа данных подходит для какого типа данных и проблем. Как и ожидалось, было обнаружено, что метод с наилучшей производительностью классификации может отличаться от одной структуры данных к другой. Экологи Моисен и Фрескино (2002) обнаружили, что MARS превосходит CRT для прогнозирования характеристик леса. Stark и Pfeiffer (1999) сообщили, что деревья классификации считаются лучшими для EDA в сложных наборах данных в ветеринарной эпидемиологии.В контексте прогнозирования артериальной гипертензии у пациентов Ture, Kurt, Turhan и Ozdamar (2005) обнаружили, что QUEST имеет худшую производительность, чем другие методы дерева классификации и интеллектуального анализа данных. Salford Systems (2004) рекомендовал CRT, но прямо предупредил пользователей, что их рекомендации основаны на исследованиях в области телекоммуникаций, банковского дела и исследования рынка и не могут применяться буквально к другим предметам или даже другим наборам данных. В настоящее время соответствие методов и данных в образовательных исследованиях все еще недостаточно изучено.Тем не менее, авторы убеждены, что должен быть баланс между использованием одного метода и слишком большого количества методов.
РезультатыДерево классификации
На рис. 2 показаны ключевые переменные для профилирования онлайн-студентов, предложенные классификационным деревом JMP. Верхний уровень, также известный как корень дерева, обозначает все данные. Второй уровень - это первое разделение данных в соответствии с наиболее важным фактором разделения, предлагаемым алгоритмами.Чем ниже уровень, тем менее важен фактор. После третьего уровня переменная «колледж» продолжала повторяться, и, таким образом, дерево было обрезано до четырех уровней (включая корень). Как указано в дереве классификации, наиболее важным фактором, способствующим решающему разделению студентов, которые посещают онлайн-курсы, и студентов, не являющихся онлайн-студентами, является возраст, тогда как вторым фактором является колледж. Средний балл как фактор применим только к студентам инженерных школ, поэтому полезность этой информации ограничена.
Рисунок 2. Дерево классификации.
На рис. 3 показано, как вычисляется условная вероятность быть студентом, который посещает онлайн-классы, или не-онлайн-студентом. Верхняя часть показывает вероятность в процентах, а нижняя часть показывает частоту. Вероятностная интерпретация основана на верхнем разделе. Например, верхняя строка верхнего раздела указывает на то, что если студентам меньше 23 лет и они учатся в колледжах бизнеса и изящных искусств, их вероятность посещать онлайн-классы в университете равна.8541. Для студентов гуманитарных, образовательных и технических специальностей в той же возрастной группе вероятность составляет 0,7261.
Рисунок 3. Листовой отчет.
На рис. 4 показаны кривые ROC. Синяя линия показывает, что учащиеся находятся в сети, а красная линия - в том, что они классифицируются как не подключенные к Интернету. Поскольку обе кривые склоняются к высокой чувствительности (истинные положительные результаты) и низкой 1-специфичности (ложные срабатывания), дерево классификации считается удовлетворительным. Кроме того, степень точности прогнозов онлайн и не онлайн идентична.
Рисунок 4. Кривые ROC.
Интересно, что исчерпывающий CHAID не только генерирует несколько иное подмножество важных переменных (колледж, возраст и этническая принадлежность), но и порядок ранжирования этих переменных в этом дереве отличается от такового в JMP (рис. 5a). Чтобы текст был разборчивым, четвертый уровень дерева скрыт. Как показано на Рисунке 5, «колледж» рассматривается исчерпывающим CHAID как наиболее важный фактор для разделения студентов, которые посещают онлайн-уроки, и студентов, не являющихся онлайн-студентами.Как и ожидалось, кластеризация колледжа в этом дереве также отличается от кластеризации JMP, поскольку исчерпывающий CHAID допускает наличие нескольких дочерних элементов одного родителя. На первом уровне дерева можно увидеть, что студенты, принадлежащие к бизнес-школе, как правило, посещают онлайн-классы, студенты инженерных специальностей делают это с меньшей вероятностью, тогда как студенты гуманитарных и естественных наук, изящных искусств и образования находятся в середина.
Рисунок 5а. Классификационное дерево Исчерпывающего ЧЭЙДА (1)
На рисунке 5b показаны подузлы несовершеннолетних.Классификация по возрасту в этом дереве опять же отличается от классификации в дереве JMP. Учащиеся младше 21 года чаще посещают онлайн-классы. Эта тенденция уменьшается с возрастом. Среди самых молодых и старших учеников пол является наиболее решающим фактором при посещении онлайн-уроков. В обеих возрастных группах женщины чаще принимают участие в дистанционном обучении. Среди студентов в возрасте от 21 до 22 лет более вероятно, что белые студенты поступят на онлайн-курсы.
Рисунок 5б. Дерево классификации исчерпывающего CHAID (2).
Таблица 3 показывает точность классификации по исчерпывающему CHAID. В отличие от подхода JMP, SPSS гораздо более успешен в прогнозировании студентов, которые посещают онлайн-курсы (95,9%), чем в прогнозировании студентов, которые никогда не посещают онлайн-курсы (14,7%).
Таблица 3. Точность классификации по исчерпывающему CHAID.
Соблюдается
Прогноз
№
Y
В процентах верно
№
472
2743
14.7%
Y
278
6451
95,9%
Общий процент
7,5%
92,5%
69,6%
MARS
Последняя лучшая модель, полученная с помощью MARS, даже проще, чем модель из дерева классификации.Только возраст считается решающим фактором при составлении профиля онлайн-студентов (см. Таблицу 4). Таблица 5 показывает успешность предсказания модели MARS, которая эквивалентна кривым ROC, встроенным в подход дерева классификации. Вероятность успеха для прогнозирования отсутствия удержания составляет 70,04%, а для прогнозирования удержания - 49,02% и. Другими словами, значение чувствительности (истинно положительное) составляет 0,7, а специфичность (истинно отрицательное) - 0,5.
Таблица 4. Важность переменной
Переменная
Стоимость пропуска
Важность
ВОЗРАСТ
0.219
100,000
GPA
0,215
0,000
SAT_QUAN
0,215
0,000
SAT_VERB
0,215
0,000
ASU_MATH
0.215
0,000
ПЕРЕДАЧА
0,215
0,000
ГОНКА
0,215
0,000
СЕКС
0,215
0,000
РЕЗИДЕНТ
0.215
0,000
COL
0,215
0,000
Таблица 5. Успешный прогноз
Фактический класс
Прогнозируемый 0
Прогноз 1
Всего случаев
В процентах верно
0
11,576
2,0161,639
4,7133215
672949.02
70,04Прогнозирующая мощность
Таблица 6 суммирует точность трех подходов. В то время как сила классификации в JMP равномерно распределена в обоих направлениях, MARS лучше справился с прогнозированием в режиме онлайн и продемонстрировал удовлетворительную производительность в прогнозировании не в режиме онлайн. Но исчерпывающий CHAID крайне неуравновешен. Тем не менее, используя несколько методов, мы смогли определить подход, который лучше всего предсказывал учеников, посещающих онлайн-классы, и другой подход, который лучше всего предсказывал учеников не онлайн.
Таблица 6. Точность классификации по энтропии, исчерпывающий CHAID и MARS
Подход
Онлайн-прогноз правильно
Правильно спрогнозировано не в сети
Энтропия (SAS JMP)
63,77%
63,77%
Исчерпывающий CHAID (SPSS)
95.90%
14,70%
MARS
70,04%
49,02%
Согласно Шмуэли, Патель и Брюс (2007), существуют обстоятельства, при которых ошибка неправильной классификации случая, принадлежащего к одному классу, более серьезна, чем для другого класса. На первый взгляд, поскольку основное внимание уделяется студентам, которые посещают онлайн-классы, низкая прогностическая способность не-онлайн-студентов в исчерпывающем CHAID может быть приемлемой.Однако высокая предсказательная сила другого класса связана со сложностью дерева. Хотя в некоторых случаях возможность разделения родительского элемента на несколько подузлов считается достоинством подхода хи-квадрат, для этого набора данных разделение возраста является чрезмерным (21 <, 21 и 22, 22 и 23,> 23) и может не привести к Практические последствия.
ОбсуждениеНа основании предварительной оценки эффективности методов интеллектуального анализа данных, описанных в этой статье, дерево классификации на основе энтропии и MARS стали нашим основным фокусом, в то время как метод на основе хи-квадрат сыграл вспомогательную роль.Поскольку и дерево JMP, и результаты MARS согласуются друг с другом, это подтверждает исходное мнение авторов о том, что следует придавать больший вес свидетельствам, полученным из дерева на основе энтропии и выходных данных MARS.
В отличие от общепринятого мнения о том, что старшие ученики будут отдавать предпочтение онлайн-курсам, было обнаружено, что младшие ученики имеют более сильную тенденцию посещать онлайн-уроки. Кроме того, среди этих младших школьников более вероятно, что студенты изобразительного искусства и образования будут посещать онлайн-курсы.Интуитивно было выдвинуто предположение, что старшие ученики предпочтут посещать онлайн-уроки, потому что многие другие обязательства (например, работа, брак и дети) могут помешать им посещать обычные уроки. Однако в этом исследовании все было наоборот. Правдоподобное объяснение состоит в том, что младшие школьники могут быть более технически подкованными и, следовательно, с большей вероятностью будут посещать онлайн-классы. Исследования, проведенные в других учебных заведениях, показывают, что первоначально студенты, посещавшие онлайн-курсы, как правило, были старше и самодисциплинированными (Россман, 1993).Позже другое исследование, проведенное в Канаде, показало, что онлайн-студенчество сместилось в сторону студентов младшего возраста и местных жителей (Wallace, 1996). Данное исследование подтверждает эту тенденцию. Хотя прямо не указано, что в нашем учебном заведении текущий дизайн онлайн-курса специально нацелен на студентов старшего возраста, многие из наших онлайн-курсов очень сжатые и асинхронные, поэтому занятые студенты могут воспользоваться преимуществами дистанционного обучения. Директивным органам и разработчикам учебных материалов следует подумать о пересмотре учебных стратегий для онлайн-курсов, чтобы они соответствовали стилю обучения младших школьников, которые технически подкованы и подготовлены.Еще одно удивительное явление заключается в том, что среди младших школьников изящных искусств чаще посещают онлайн-уроки. Хотя 90,15% онлайн-курсов для студентов-искусствоведов являются факультативными, все еще существует значительная часть (9,05%) уроков по искусству, посещаемых онлайн. С другой стороны, 99,79% онлайн-курсов, посещаемых специалистами в области образования, не связаны с образованием. В отличие от других дисциплин, которые позволяют приобретать знания посредством чтения в удаленном месте, изобразительное искусство обычно требует практического опыта и очного обучения (например,грамм. живопись, танцы, игра на фортепиано). Кейси, Фрейзер и Мерфи (2007) обнаружили, что типичные онлайн-студенты не испытывают особой потребности во взаимодействии с преподавательским составом или другими студентами. В то время как ожидается, что студенты, связанные с Педагогическим колледжем, который является активным сторонником дистанционного обучения, увидят ценность онлайн-курсов, общепринятая мудрость подсказывает политикам, что представители художественных специальностей предпочитают человеческое взаимодействие «машинному» обучению и, таким образом, прилагают все усилия. для продвижения онлайн-классов для художественных специальностей были минимальными.Кроме того, широко распространено мнение, что студенты, изучающие инженерные науки и естественные науки, любят посещать онлайн-курсы, потому что многие задания по программированию и вычислениям можно выполнять через Интернет; их научное и инженерное образование может также побудить их полностью принять технологически ориентированные онлайн-курсы. Оказывается, это мнение необоснованно. Этот вывод заставляет пересмотреть существующую политику в отношении приоритезации ресурсов для разработки онлайн-курсов. Кроме того, институциональным исследователям, преподавателям и разработчикам учебных материалов рекомендуется настраивать стратегии дизайна для студентов изобразительного искусства и образования, которые могут быть новаторскими и экспериментальными.Следующим курсом действий может быть проведение дополнительного исследования, в котором используются качественные методы, чтобы выяснить, почему молодые студенты и представители художественных специальностей любят посещать онлайн-уроки.
В отличие от других профилирующих исследований, дающих длинный список характеристик учащихся в режиме онлайн, это исследование с использованием методов интеллектуального анализа данных предполагает, что релевантными являются только одна-две переменные (возраст и дисциплина). Исследовательская группа убеждена, что простая модель лучше, чем сложная, с точки зрения применения к предметам практического действия.Благодаря простоте результатов и выводов, нет необходимости ждать нисходящей трансформации всего университетского городка, за которую выступают политики. Действительно, онлайн-курсы обычно разрабатываются преподавателями или аспирантами, которые будут преподавать эти курсы (Johnson-Curiskis; 2006; Knapczyk & Hew, 2007). Хотя существует несколько различных моделей разработки онлайн-курсов, обзор исследований показывает, что университеты обычно не принимают политики или стандартизированные процедуры для разработки курсов.Разработанные курсы могут относиться к разным моделям онлайн-классов, но нет исследований об эффективности этих моделей или о том, для каких программ получения степени они могут лучше всего подходить. Хотя это может не относиться и к очным курсам, этим курсам потребовалось гораздо больше времени, чтобы проработать эти детали. Тем не менее, принимая во внимание профиль студента, преподаватели, аспиранты и разработчики учебных материалов могут разрабатывать и проводить онлайн-курсы максимально эффективно и результативно, чтобы предоставить студентам наилучший возможный опыт обучения.
Набор данных для этого исследования был извлечен из хранилища данных в одном учреждении, и поэтому результаты не могут быть обобщены в более широком общенациональном контексте до тех пор, пока не будут проведены дальнейшие исследования репликации. Во-первых, подходам к интеллектуальному анализу данных не хватает подтверждающего характера, который подтверждает основанную на моделях статистику, основанную на гипотезах, и поэтому результаты следует рассматривать как исследовательские. Другими словами, они служат основой для дальнейшего обсуждения и развития гипотез, но не являются научно обоснованной основой для обобщений (Thomas & Galambos, 2004).Тем не менее, результаты могут быть полезны лицам, принимающим решения в местном университете, при распределении ресурсов. Более того, этот исследовательский подход может быть более подходящим для анализа профиля студентов, посещающих онлайн-курсы, чем его подтверждающий аналог. Неявная предпосылка подтверждающих параметрических тестов состоит в том, чтобы сделать вывод от статистики выборки к фиксированному параметру совокупности. Однако демографические данные дистанционных учащихся могут меняться время от времени и от места к месту (Antosz, Morton, Qureshi, 2002), и поэтому сомнительно, что когда-либо будет выходить из постоянного параметра численности населения.Рекомендуется, чтобы институциональные исследователи внимательно следили за составом онлайн-учащихся и онлайн-курсов для достижения желаемой рентабельности. Поскольку подходы к интеллектуальному анализу данных, как правило, возвращают более короткий список соответствующих переменных, можно использовать эти инструменты для создания быстрой обратной связи между проектированием и исследованием онлайн-классов.
Наконец, результаты этого исследования ограничены из-за небольшого количества курсов, которые студенты изучали онлайн.Как упоминалось ранее, несправедливо относить студента к онлайн-студенту из-за того, что он посещает только один онлайн-курс, потому что это не дает достаточно данных о том, почему это был единственный онлайн-курс. Если студентам не понравился онлайн-курс и, таким образом, они воздерживались от дополнительных онлайн-занятий, они на самом деле не являются онлайн-студентами. И наоборот, студенты могут быть ограничены в количестве онлайн-курсов, которые им разрешено проходить, а учащиеся с небольшим количеством онлайн-курсов могут действительно захотеть пройти как можно больше онлайн-курсов.Необходимо провести дополнительные качественные исследования, чтобы попытаться определить, почему некоторые студенты посещают или не посещают онлайн-классы. Более того, это апостериорное исследование, работающее в ретроспективном режиме. Так много раз исследовательская группа говорила, что мы хотим, чтобы были собраны определенные данные. Раньше онлайн-курсы разрабатывались без встроенных исследовательских компонентов. Настоятельно рекомендуется, чтобы каждый онлайн-класс собирал данные, относящиеся к этому типу обучения, такие как компьютерные навыки и опыт учащихся, независимо от того, работают ли они неполный или полный рабочий день, получают ли они финансовую помощь или нет и т. Д.С такой настройкой проспективное когортное исследование еще больше осветит онлайн-профили студентов.
СсылкиАллен Э. и Симан Дж. (2006). Как добиться успеха: онлайн-образование в США, 2006 г. Sloan-C . Получено 19 марта 2008 г. с http://www.sloan-c.org.
Аннеллс, М. (2006). Триангуляция качественных подходов: герменевтическая феноменология и обоснованная теория. Журнал усовершенствованного сестринского дела, 56 , 55–61.
Антош, Э., Мортон, Л., Куреши, Э. (2002). Интересный профиль - студенты университета, проходящие дистанционное обучение, демонстрируют более слабую мотивацию, чем студенты на территории кампуса. Интернет Журнал администрирования дистанционного обучения, 5 (4). Получено 30 марта 2008 г. с сайта https://www.westga.edu/~distance/ojdla/
Ayres, I. (2007). Супер кранчеры: почему мышление числами - это новый способ быть умным . Нью-Йорк: Bantam Books.
Blocher, J. M., Sujo de Montes, L., Уиллис, Э. М., и Такер, Г. (2002). Онлайн-обучение: изучение профиля успешного ученика. Журнал интерактивного онлайн-обучения, 1 (2). Получено 19 марта 2008 г. с сайта http://www.ncolr.org/jiol/issues/PDF/1.2.2.pdf
Брейман, Л., Фридман, Дж. Х., Ольшен, Р. А., и Стоун, К. Дж. (1984). Деревья классификации и регрессии . Монтерей, Калифорния: Международная группа Wadsworth.
Кейси, Д., Фрейзер, Дж., Мерфи, Д. (2007). Профилирование онлайн-учащихся: выводы, полученные на основе показателей обучения, поведения учащихся и восприятия учащихся. Труды шестой конференции IASTED International Conference Web-Based Education , 305-311.
Кресвелл, Дж., И Плано Кларк, В. Л. (2007). Разработка и проведение смешанных исследований . Таузенд-Оукс, Калифорния: Сейдж.
Фридман Дж. (1991). Многомерные сплайны адаптивной регрессии. Анналы статистики, 19 , 1-67.
Гей В. (1992). Профилирование: механизм профессионального развития студентов? Кембриджский журнал образования , 22 , 163-175.
Грабмайер Дж. И Ламбе Л. (2007). Деревья решений для переменных двоичной классификации растут одинаково с мерой примеси Джини и критерием хи-квадрат Пирсона. Международный журнал бизнес-аналитики и интеллектуального анализа данных, 2 , 213 - 226.
Хан, Дж. И Камбер, М. (2006). Интеллектуальный анализ данных: концепции и методы (2-е изд.). Бостон, Массачусетс: Эльзевир.
Хасти Т., Тиширани Р. и Фридман Дж. (2001). Элементы статистического обучения: интеллектуальный анализ данных, вывод и прогнозирование .Нью-Йорк, штат Нью-Йорк: Спрингер.
Джонсон-Курискис, Н. (2006). Планирование онлайн-курсов. Журнал онлайн-обучения и преподавания, 2 , 42-48.
Джонс, П., Пакхэм, Г., Миллер, К., и Джонс, А. (2004). Первоначальная оценка выбытия студентов в среде электронного обучения: пример электронного колледжа Уэльса, Электронный журнал электронного обучения , 2 , 113-120.
Knapczyk, D., & Hew, K. (2007). Анализ и оценка учебной онлайн-деятельности. Педагогическое и специальное образование , 30 , 167-182.
Квок, Дж., Ван, Х., Ляо, С., Юэн, Дж., И Леунг, Ф. (2000). Система профилирования студентов для агентной образовательной системы, Труды ежегодной конференции по информационным системам Америки , Лос-Анджелес, США.
Ламсден, Л. (2000). Профилирование учащихся на предмет насилия . (Номер услуги репродукции документов ERIC ED446 344).
Мойзен, Г., & Фресчино, Т.(2002). Сравнение пяти методов моделирования для прогнозирования характеристик лесов, Экологическое моделирование 157, 209–225.
Нокелайнен П., Тирри Х., Миеттинен М., Силандер Т. и Курхила Дж. (2002). Оптимизация и профилирование пользователей онлайн с помощью байесовского вероятностного моделирования, Proceedings of the NL 2002 Conference , Berlin, Germany.
Куинлан, Дж. Р. (1993). C4.5 программы для машинного обучения . Сан-Франциско, Калифорния: Морган Кауфманн.
Россман П. (1993). Формирующийся всемирный электронный университет: глобальное высшее образование информационного века . Вестпорт, Коннектикут: Praeger.
Salford Systems. (2002). МАРС. [Компьютерное программное обеспечение и руководство]. Сан-Диего, Калифорния: Автор.
Salford Systems. (2004). Действительно ли важны правила разделения? Получено 19 марта 2008 г. с http://www.salford-systems.com/423.php
SAS Institute. (2007). JMP 7 [Компьютерное программное обеспечение и руководство].Кэри, Северная Каролина: Автор.
Шрам Л. и Хонг Х. (2002). Измерения и стратегии успеха в Интернете: голоса опытных преподавателей. Журнал асинхронных обучающих сетей, 6, 57-67.
Ши Ю.С. (2004). Замечание о смещении раздельного отбора в деревьях классификации. Вычислительная статистика и анализ данных, 45 , 457-466.
Шмуэли, Г., Патель, Н. Р., и Брюс, П. (2007). Интеллектуальный анализ данных для бизнес-аналитики: концепции, методы и приложения в Microsoft Office Excel с XLMiner .Нью-Джерси: Wiley-Interscience.
Скьяффино, С. Н. и Аманди, А. (2000). Профилирование пользователей с использованием рассуждений на основе прецедентов и байесовских сетей . Документ представлен на Иберо-американской конференции по искусственному интеллекту, Атибая, Бразилия.
SPSS Inc. (2007). SPSS 16 . [Компьютерное программное обеспечение и руководство]. Чикаго, Иллинойс: Автор.
Старк, К., и Пфайфер, Д. (1999). Применение непараметрических методов для решения проблем классификации в сложных наборах данных в ветеринарной эпидемиологии - например, Intelligent Data Analysis, 3, 23–35.
Штрайфер, П. А., и Шуман, Дж. А. (2005). Использование интеллектуального анализа данных для выявления полезной информации: открытие новых возможностей в принятии решений на основе данных. Журнал образования для студентов из группы риска, 10 , 281-293.
Суини Дж. Ф. (1988), Профилирование студентов как основа для непрерывной оценки клинического прогресса во время курса дипломированной психиатрической медсестры, Обучение медсестер сегодня, , 9 , 254-63.
Томас, Э. Х., и Галамбос, Н.(2004). Что удовлетворяет студентов? Анализ данных мнения студентов с помощью регрессии и анализа дерева решений. Исследования в области высшего образования, 45 , 251-269.
Туре, М., Курт, И., Турхан, К. А., Оздамар, К. (2005). Сравнение методов классификации для прогнозирования гипертонической болезни. Экспертные системы с приложениями , 29 , 583-588.
Уоллес, Л. (1996). Изменения в демографии и мотивации студентов дистанционного обучения. Журнал дистанционного образования , 11 , 1-31.
Уиллинг, П. А., и Джонсон, С. Д. (2004). Факторы, влияющие на решение студентов бросить онлайн-курсы. Журнал асинхронных обучающих сетей, 8 , 105-118.
Уильямсон, Г. Р. (2005). Иллюстрация триангуляции в исследованиях медсестер смешанными методами. Медсестра
Исследователь, 12, 7-18.ВинклерПринс, М., Вайзенборн, Б., Груп, Р., и Арбогас, А. (2007). Разработка онлайн-курсов по географии: опыт Университета штата Мичиган. Географический журнал, 106 , 163-170.
Сюй Д. и Ван Х. (2006 г.), Интеллектуальный агент поддерживает персонализацию для виртуальных учебных сред , Системы поддержки принятия решений , 42 , 825-843.
Сюй Д., Ван Х. и Су К. (2002). Интеллектуальное профилирование студентов с помощью нечетких моделей. Труды 35-й Гавайской международной конференции по системным наукам, Гавайи, США.
Интернет-журнал Администрация дистанционного обучения, Том XI, номер II, лето 2008 г.
Университет Западной Грузии, Центр дистанционного обучения
Назад в онлайн-журнал дистанционного обучения Administration ContentsНекоторые ученики преуспевают в онлайн-обучении и закрытых школах
Эти надоедливые опухоли под глазами восьмиклассницы Натали Альварес начали исчезать, за ними последовала 10 а.м. приступы голода и полуденная зевота - к большому удовольствию и удивлению девушки Карсон.
Сначала 14-летняя Натали сопротивлялась навязанному ей дистанционному обучению, когда школы закрылись из-за чрезвычайной ситуации с коронавирусом.
«Я беспокоилась о том, что меня отвлекают, когда я дома с мамой и сестрой и выполняю дополнительные работы по дому», - сказала Натали . «Но потом все изменилось».
Ситуация изменилась и для Маркоса Адаме, оценки которого повысились, потому что он мог уделять больше времени проблемным предметам.Они изменились на 15-летнего Себастьяна Эрнандеса, у которого больше энергии, и на 10-летнего Якоба Лалина, который обнаружил, что может совмещать учебу с Lego.
В то время, когда многие из их сверстников борются с изоляцией, неравномерным онлайн-обучением или отсутствием доступа к компьютерам, часть студентов обнаружила, что дистанционное обучение может предложить уникальное облегчение, и они преуспели.
Педагоги и школьные психологи подчеркивают, что закрытие кампусов и приостановка обучения в классе нанесли вред детям, особенно тем, кому не посчастливилось иметь тихое и удобное место для учебы или чьи семьи переживают тяжелые невзгоды и болезни. на пандемию.
Натали, Маркос и другие хорошо адаптировались отчасти потому, что в их школах был опыт онлайн-обучения, и у них была помощь на дому.
Джозефин Ким, преподаватель Гарвардского университета и имеющий лицензию консультант по психическому здоровью, сказала, что дети могут быть удивительно адаптивными и выносливыми.
«Существуют внутренние характеристики, которые могут позволить ребенку лучше развиваться в текущих обстоятельствах», - сказала она. Дети-интроверты или дети, «которые обрабатывают информацию внутренне и черпают энергию из времени и пространства для самоанализа», скорее всего, преуспеют.
«Если вы не осваиваете технологии, вы не помогаете своим ученикам».
Натали Альварес, 14
Объединенный школьный округ Лос-Анджелеса Supt. Остин Бойтнер согласился с тем, что некоторые ученики, особенно подростки, посещающие среднюю школу, преуспели дома, вдали от школьного давления и строгого распорядка. Он похвалил школу Натали, школу Harry Bridges Span в Уилмингтоне, как пример того, как школа выполняет «выдающуюся работу» с онлайн-обучением.
«На самом деле, мы получили известия от учеников средней школы; Некоторые ученики, которые чувствовали, что над ними издеваются или у них были социальные проблемы в плавильном котле средней школы, на самом деле нравится немного места и больше нравится учиться, - сказал Бейтнер. «Итак, есть некоторые, для кого пребывание в этой среде действительно пошло на пользу. Мы слышали разные анекдоты ».
Натали сказала, что чувствовала себя более расслабленной, несмотря на то, что она считала повышенной нагрузкой. Ела здоровее, дольше спала, меньше бегала.Она больше времени уделяла проектам и оставалась на связи с друзьями посредством текстовых сообщений.
Стив Скрамбис, директор Harry Bridges, сказал, что в его школе был онлайн-компонент обучения до распространения COVID-19, что дало его сотрудникам и ученикам фору, когда школы закрылись в середине марта.
Первая колонка
Витрина для захватывающих историй от Los Angeles Times.
Раньше утро Натали состояло из будильников в 6:30, наполовину употребленных коктейлей для завтрака, бегства из дома в 7:55 и напряженной поездки в школу, опасаясь, что она опоздает на первый урок в 8. : 15.
«Я едва успела сделать это несколько раз», - сказала она. «Иногда эти первые занятия были самыми трудными, потому что вы просто пытались проснуться и сосредоточиться».
Благодаря онлайн-обучению Натали могла вставать с постели в 9 часов утра, что давало ей достаточно времени, чтобы приготовить тарелку греческого йогурта и фруктов Чобани перед первым уроком онлайн в 9:30.
Этот дополнительный сон, одобренный Американской академией педиатрии, принес Натали и другим дивиденды разными способами.
Большинство из их онлайн-классов были асинхронными, то есть учителя заранее оставляли задания, планы уроков и видео для учеников через школьные платформы, такие как Schoology и Google Classroom.
Преподаватели не требовали от учеников включать камеры компьютеров, то есть Натали и другие могли делать заметки, слушать и задавать вопросы во время еды - даже в удобной пижаме.
Бенджамин и Себастьян Эрнандес дома с родителями Маргарет и Алексом. Многие дети чувствовали стресс, скуку или изоляцию во время пандемии, но братья Эрнандес наслаждались возможностью сбавить обороты.
(Джейсон Армонд / Los Angeles Times)
«У всех были выключены камеры, - сказала Натали, - и это было здорово для меня.Мне не нужно было беспокоиться о том, как я выгляжу. Я мог бы просто сосредоточиться на классе ».
А ее оценки? «Четверки», - сказала она.
Маркос, который будет посещать среднюю школу Banning в августе, часто был учеником C, но в прошлом семестре он получил все четверки и пятерки. Он сказал, что получил возможность отправлять учителям восьмого класса по электронной почте столько вопросов, сколько он хотел, не опасаясь запугивания.
«Сначала я не знал, что и думать, но, похоже, это сработало», - сказал Маркос, который подумывает о карьере в архитектуре.«Может быть, это потому, что я прирожденный интроверт».
Натали, считающая себя экстравертом, сказала, что хочет вернуться, когда кампусы снова откроются. Она будет поступать в Калифорнийскую академию математики и наук в Карсоне и понимает, как трудно заводить новых друзей, «когда ты не в школе».
Однако девушка, мечтающая стать судебным экспертом ФБР, также сказала, что последние три месяца учебного года должны послужить тревожным сигналом для школ.
«Если вы не осваиваете технологии, - сказала она, - вы не помогаете своим ученикам.
На другом конце округа Лос-Анджелес Себастьян, второкурсник средней школы Лойола из Восточного Лос-Анджелеса, сказал, что он чувствует себя так, как будто он пришел в себя - пока один.
По словам Себастьяна, он раньше очень беспокоился - беспокоился о том, что опоздал в школу, о том, что на него будут язвительные взгляды, когда он снова и снова поднимает руку в классе.
Его классы, которые включали с отличием английский, испанский и химию, а также всемирную историю с углубленным изучением знаний, по его словам, по-прежнему были сложными, но «пригодными для дыхания».Себастьян также посещает музыкальную школу по соседству в Бойл-Хайтс и говорит, что он не только «привык» к урокам игры на фортепиано дома, но и наслаждается спокойной обстановкой в своей гостиной.
«Честно говоря, приятно быть дома», - сказал подросток, стремящийся стать инженером. «Это намного менее напряженно и легче справляться с работой. Кроме того, благодаря двум дополнительным часам сна я получаю гораздо больше энергии ».
Его 12-летний брат Бенджамин тоже преуспевал дома. Он и одноклассники объединились, чтобы проверять работу друг друга и вовремя выполнять задания, оставляя больше времени для видеоигр.
«Это хороший способ поддерживать мотивацию ваших друзей, потому что все хотят играть», - сказал он.
Удивительные достижения были облегчением для родителей, но теперь они беспокоятся, что эти достижения могут быть потеряны, когда университетские городки снова откроются.
Маргарет Эрнандес, мать Себастьяна, сказала, что вернуться к прежним привычкам будет сложно.
«Моим сыновьям очень не хватает гулять со своими друзьями, но я не знаю, смогут ли они вернуться к нормальной жизни», - сказала она. «Они изменились за это время.
Ее муж Алекс Эрнандес беспокоится о том, что дети упускают возможность общения. «Это здорово, что мои сыновья и другие преуспевают в Интернете, но это поколение испытывает трудности с общением за пределами гаджетов и Интернета», - сказал он.
Тем не менее, для некоторых детей, даже младших, учеба дома работает.
Джейкоб Лалин, 10-летний четвероклассник из Сан-Габриэля, сказал, что он «намного счастливее» дома. Джейкоб, который учится в начальной школе Вашингтона и музыкальной школе по соседству, обнаружил, что может проводить больше времени с любимыми предметами: математикой и естественными науками.
А если ему стало скучно? Решение было тем, чего он никогда не мог сделать в школе.
«Когда я устану от школы, я собирался строить с помощью своих Lego или выходить на улицу и играть», - сказал Джейкоб. «У меня много перерывов, а потом я возвращаюсь и иду в школу».
Характеристики вопросов для упражнений «Верно-Ложь», сопоставления и интерпретации - видео и стенограмма урока
вопросов "верно-неверно"
"верно-неверно" тестовых задания, также называемых вопросами с альтернативными ответами, используются для оценки способности учащегося определить правильность утверждения.Например, «Джордж Вашингтон был первым президентом Соединенных Штатов». Студенты ответят «Верно», потому что это фактическое утверждение. Вопросы «правда-ложь» популярны из-за своей универсальности. Эти типы вопросов можно использовать в любой области контента.
Их легко преобразовать в проверки понимания, используя сигнальные ответы для быстрой формирующей оценки. Сигнальные ответы - это физические движения, которые используются для ответа на вопросы, например большие пальцы руки вверх или вниз. Формирующие экзамены - это проверки понимания, которые проводятся на протяжении всего учебного сегмента, чтобы отслеживать успеваемость учащихся, чтобы учителя могли быстро корректировать свои действия в соответствии с потребностями учащихся.
Вопросы типа «правда-ложь» легко писать и легко оценивать объективно, что делает их идеальными для ситуаций, в которых требуется охватить большой объем содержания при оценке. Однако шанс угадать правильный ответ на любой вопрос составляет 50-50.Скорее всего, оценки искажены из-за способности учащегося правильно угадать правильный выбор. Обратная связь ограничена, поскольку в ответах не указывается, почему учащийся выбрал тот или иной ответ.
Сопоставление вопросов
Сопоставление состоит из двух списков элементов. Для каждого элемента в списке A есть связанный элемент в списке B. Студенты несут ответственность за поиск связанных пар. Другой тип тестового задания на соответствие строится аналогично вопросу с множественным выбором, за исключением того, что может быть выбрано более одного ответа.
Например, учитель может написать тест на соответствие, в котором учащиеся сопоставляют термины образного языка с определениями.
Список A:
- Метафора
- Звукоподражание
- Аллитерация
Список B:
- Слово, которое используется как звуковой эффект
- Повторение первых согласных звуков
- Несходные вещи, которые сравниваются, чтобы выделить похожую черту
Как и вопросы «верно-неверно», вопросы на соответствие универсальны и легко оцениваются.Вопросы на соответствие хорошо подходят для оценки словарного запаса и выявления взаимосвязей, например причинно-следственных связей. Однако вопросы на сопоставление не дают много информации о том, почему учащиеся получили неправильные ответы, и вполне вероятно, что учащиеся угадают хотя бы некоторые ответы в процессе исключения к концу теста.
Вопросы к упражнению по толкованию
Вопросы к упражнению по толкованию начинаются с вводного рассказа, графика или карты, за которыми следует один или несколько вопросов с несколькими вариантами ответов.Вопросы с толковательными упражнениями могут потребовать более высокой степени критического мышления, чем вопросы двух других типов, потому что вопросы представляют собой низкоуровневое содержание для учащихся во вводном материале. Успех студентов зависит от их способности рассуждать о проблеме. При написании вопросов для пояснительных упражнений варианты ответов должны быть одинаковыми по длине и правдоподобными, с одним четким вариантом ответа.
Вопросы устного упражнения могут охватывать широкий диапазон содержания и легко оцениваются.Они также предоставляют ценную обратную связь, поскольку учителя обычно могут определить, почему учащиеся выбрали неправильные ответы. Однако сложно написать хорошие вопросы с несколькими вариантами ответов.
Краткое содержание урока
Верно-неверно вопросов используются для оценки способности учащегося определить, является ли утверждение правильным, их легко оценивать, легко писать и легко поддаются сигнальным ответам , физический движения, которые используются для ответа на вопросы, например, большой палец вверх или большой палец вниз. Формирующие экзамены - это проверки понимания, которые проводятся на протяжении всего учебного сегмента, чтобы отслеживать успеваемость учащихся, чтобы учителя могли быстро корректировать свои действия в соответствии с потребностями учащихся. Однако из-за 50% вероятности получить правильный ответ вопросы «верно-неверно» не так эффективны для диагностики, почему учащиеся отвечают на вопросы так, как они это делают.
Сопоставление элементов теста объединяет элемент из списка A со связанным элементом из списка B.Сравнительные тесты также легко писать и оценивать, но они создают аналогичные трудности с анализом заданий, поскольку учащиеся склонны угадывать окончательные ответы. Вопросы к упражнению по толкованию начинаются с рассказа, графика или карты, чтобы дать контекст для следующих вопросов с несколькими вариантами ответов. Их легко оценить, но сложно написать хорошо.
Программное обеспечение CYME Power Engineering
Анализ распределения
(CYMDIST)Для выполнения нескольких типов анализа сбалансированных или несбалансированных трехфазных, двухфазных и однофазных систем, работающих в радиальной, петлевой или сетчатой конфигурациях.CYMDIST включает в себя полный редактор сети, а также
- Несбалансированный поток нагрузки
- Комплексный анализ потока отказов
- Балансировка нагрузки
- Распределение / оценка нагрузки
- Оптимальное размещение конденсаторовПродвинутый менеджер проектов Поддерживает совместную и детальную подготовку проекта, состоящего в модификации сети с соответствующими симуляциями. Автоматизированный анализ сетевых прогнозов Для создания, просмотра и изменения зависящих от времени проектов (с использованием CYME Advanced Project Manager), состоящих в модификациях сети, таких как добавление любой нагрузки в заданную дату, изменение / замена силовых трансформаторов на подстанции, перефазирование / проект реконструкции, переключение или реконфигурация сети и т. д. Анализ установившегося состояния с профилями нагрузки Для выполнения точного анализа временного диапазона на основе комбинации данных AMR и исторических моделей потребления. Оценщик состояния распределения Для анализа несбалансированного потока мощности и напряжений на каждом уровне распределительной энергосистемы. Оценка надежности Предоставляет структуру, в которой запускаются сценарии прогнозной и исторической оценки надежности, а также можно оценить и понять влияние связанных инвестиций, таких как DA (автоматизация распределения). Технико-экономический анализ Облегчает оценку осуществимости и прибыльности проекта на основе фактической системной модели. Переходная стабильность Для моделирования динамического поведения распределительных систем с распределенной генерацией при различных переходных событиях (включение / отключение неисправности, запуск большого двигателя, отключение когенерационных блоков, разделение и т. Д.) Гармоники Выполняет анализ проникновения гармоник в электроэнергетических системах. Он имеет возможности однофазного и полного трехфазного моделирования и включает большую библиотеку предварительно определенных моделей для сетевого оборудования и источников гармонического тока. Возможность сканирования частоты, включенная в этот модуль, также доступна как независимый модуль. Этот анализ обеспечивает полные результаты сканирования импеданса и позволяет пользователю увидеть проблемные области еще до установки устройств для измерения гармоник.
Анализ долгосрочной динамики Моделирование временного ряда для изучения влияния изменений освещенности, колебаний ветра и колебаний нагрузки на элементы управления сетью, такие как регуляторы, переключатели ответвлений нагрузки и переключаемые конденсаторы, а также на поведение устройств аккумулирования энергии аккумуляторных батарей. Анализ возможностей интеграции Решает проблемы DER и соединения нагрузки, определяя максимально допустимую пропускную способность, которая может быть добавлена в любой точке сети без нарушения набора ограничений.Позволяет быстро оценить пропускную способность сети и отфильтровать несоответствующие запросы на соединение. ПРИВОД EPRI Метод расчета предоставляет агрегированные и детализированные результаты емкости хостинга для каждого распределительного фидера и учитывает многочисленные атрибуты, зависящие от канала. Оценка воздействия DER Помогает инженерам в исследованиях воздействия на системы межсоединений их генераторов.Этот анализ автоматизирует серию длительных, повторяющихся и подверженных ошибкам проверок и возвращает информативные результаты, четко идентифицирующие нарушения. Оценка нарушений в сети D-A-CH-CZ Для определения приемлемости нового соединения нагрузки или генератора путем оценки его влияния на ряд критериев качества электроэнергии. Анализ дистанционной защиты Помогает инженерам проектировать и проверять схемы защиты, а также решать различные проблемы координации в любой энергосистеме. Оптимизация напряжения / ВАР Модуль, который помогает найти оптимальные настройки для устройств управления Volt / VAR для оптимизации распределительных сетей. Оптимальное размещение стабилизатора напряжения Позволяет устанавливать регуляторы напряжения в оптимальных местах распределительного фидера. Оптимальное размещение реклоузера Разработан, чтобы помочь инженерам решить сложную проблему повышения надежности системы. Опасность дугового разряда Для анализа и обеспечения электробезопасности сотрудников, работающих с электрическим оборудованием или рядом с ним. Он вычисляет необходимые параметры, необходимые для оценки уровня риска и принятия соответствующих процедур безопасности. Для решения конкретных задач доступны два модуля. Один для распределительных сетей с расчетами опасности вспышки дуги на основе стандарта NESC 2007, а второй на основе стандартов NFPA-70E © и IEEE-1584 ™ для анализа опасности вспышки дуги в промышленных сетях электроснабжения.
Запуск двигателя Для динамического анализа заблокированного ротора и максимального пускового размера, предназначенного для моделирования эффектов запуска асинхронного и синхронного двигателя в трехфазных электроэнергетических системах. Непредвиденный расход нагрузки (N-p) Для помощи в статическом анализе непредвиденных обстоятельств, связанных с перетоком мощности. Для создания нештатных событий и сценариев однократного или многократного отключения и сравнения с базовым случаем. Координация защитного устройства Модуль предоставляет инженерам широкий набор инструментов для эффективного и точного проектирования и проверки схемы координации их энергосистемы. Оптимизация конфигурации сети Помогает определить оптимальную конфигурацию фидера, которая минимизирует потери, улучшит профиль напряжения и сбалансирует нагрузку между фидерами. Оценка непредвиденных обстоятельств и восстановление Изучить влияние принудительных или плановых отключений на систему распределения электроэнергии и найти оптимальный план переключения для восстановления подачи электроэнергии приоритетным потребителям и восстановления максимально возможной нагрузки в пострадавших районах. Расширенное моделирование подстанции Для моделирования всех основных компонентов распределительной подстанции и любой подсети, например, для детального моделирования промышленного объекта. Анализ вторичной сети Позволяет проводить анализ перетока мощности и короткого замыкания в распределительных системах вторичной сети с большой степенью зацепления для любого уровня напряжения. Моделирование вторичного распределения низкого напряжения Функциональность для детального моделирования низковольтных распределительных систем на однолинейной схеме. Географическое наложение Для отображения растровых или векторных изображений карты (географическая база, такая как DWG, DXF, SHP и т. Д.) В виде слоев непосредственно под электрической моделью. Служба онлайн-карт Предоставляет возможность отображать карты Google и MapQuest Open в виде слоев под географическим представлением модели вашей электрической сети. Завершить домашнее задание сейчас - ASCD
Родители говорят, что это требуется учителям.Учителя говорят, что родители требуют большего. Политики призывают ставить родителям оценку их способности помочь с этим. Граждане баллотируются на места в школьных советах, не выполняя домашних заданий. Национальная ассоциация родителей и учителей и Национальная ассоциация образования устанавливают руководящие принципы. Некоторые считают, что нынешние протесты против выполнения домашних заданий - это всего лишь последний поворот маятника общественного мнения. Школьные советы и политики диктуют правила выполнения домашних заданий по политическим, а не педагогическим причинам. Учителя говорят, что им все больше неловко передавать родителям обучение, за которое учителя несут ответственность.Добро пожаловать в домашние войны.
Когда школьный совет в Пискатауэе, штат Нью-Джерси, проголосовал ранее этой осенью за ограничение домашних заданий в начальных классах до получаса каждый вечер, а домашних заданий в средней школе до двух часов в сутки, газета New York Times вышла на первой полосе. статья о школе (Zernike, 2000) и национальные телеканалы последовали его примеру. Домашнее задание вызывает споры не только из-за законных вопросов о его эффективности. Беспокойство по поводу домашних заданий также является частью растущего опасения в Соединенных Штатах по поводу нехватки времени, с которой сейчас сталкиваются как взрослые, так и дети.Неструктурированное семейное время сокращается в связи с увеличением продолжительности рабочих недель и большего количества часов домашней работы, чем когда-либо ранее (Hofferth & amp; Sandberg, в печати).
В начале 1990-х годов мы обнаружили влияние домашних заданий на жизнь учащихся, когда помогли Департаменту образования штата Мэн провести исследование альтернативных школ, чтобы выяснить, почему эти школы были так успешны в оказании помощи бывшим бросившим школу выпускникам. из средней школы (Antonnuci & amp; Mooser, 1993). Мы поговорили с родителями, школьным персоналом и членами школьного совета и провели углубленные интервью с более чем 45 учащимися из групп риска, зачисленных в эти школы, с просьбой указать, когда они узнали, что собираются бросить школу.Студенты рассказали нам о хаотичной семейной жизни, тесноте в жилых помещениях и родителях, которые работают по ночам. Они также постоянно упоминали свою неспособность выполнять домашнее задание как фактор, повлиявший на решение бросить школу.
Удивленные тем, что домашние задания так сильно повлияли на отсев учеников из школы, мы проанализировали отчеты об исследованиях и поговорили с сотнями учителей, родителей, бросивших школу и учеников старшей школы. Вместо того, чтобы сосредоточиться только на влиянии домашнего задания на успеваемость или предполагаемой роли домашнего задания в развитии самодисциплины и хороших рабочих привычек, мы изучили домашнее задание в контексте жизни учащихся, семей и сообществ.С этой точки зрения мы обнаружили, что домашнее задание часто нарушает семейную жизнь, мешает тому, чему родители хотят научить своих детей, и наказывает учащихся в бедности за то, что они бедны. Возможно, более значительным для педагогов являются серьезные ограничения педагогического мастерства домашних заданий (Kralovec & amp; Buell, 2000).
За последние 20 лет семейная жизнь в США претерпела драматические демографические и экономические изменения. Больше матерей работают, больше одиноких родителей ведут домашнее хозяйство, а больше родителей работают дольше - все это способствует сокращению неструктурированного семейного времени (Hofferth & Sandberg, в печати).Белые родители из среднего класса за последнее десятилетие увеличили свое рабочее время почти на шесть недель полного рабочего дня в году. Афроамериканские семьи со средним доходом работают в среднем 4278 часов в год, что почти на 500 часов в год больше, чем белые семьи (Mishel, Bernstein, & amp; Schmitt, 2001).
Домашнее задание сжимает семейную жизнь. У всех родителей есть образовательные программы для своих детей. Они хотят передать свое культурное наследие, религиозные убеждения и важные жизненные навыки. Они хотят научить своих детей быть хорошими гражданами и разделять обязанности по ведению домашнего хозяйства.Больше домашних заданий заставляет родителей откладывать свои собственные планы, даже если они часто изо всех сил пытаются помочь своим детям справиться с домашними заданиями. Кроме того, семьям нужно время, чтобы стать семьями. Согласно опросу 1998 года, проведенному Public Agenda, почти 50 процентов родителей заявили, что у них были серьезные споры со своими детьми из-за домашней работы, а 34 процента заявили, что домашняя работа является источником стресса и борьбы. Родители часто испытывают противоречивые чувства по поводу домашнего задания, рассматривая его как способ добиться успеха для своих детей, но также как налагающий серьезные ограничения на время, проведенное в семье.
Домашнее задание усиливает социальное неравенство, связанное с неравномерным распределением образовательных ресурсов в Соединенных Штатах. Некоторые ученики идут домой к хорошо образованным родителям и имеют легкий доступ к компьютерам с обширными базами данных. У других учеников есть семейные обязанности, родители работают по ночам, а дома у них нет образовательных ресурсов. Директор школы однажды сказал нам, что он решил проблему домашних заданий для бедняков, просто не давая им домашнее задание. Это любопытное решение вызывает тревожные вопросы: либо домашнее задание не имеет образовательной ценности - и в таком случае, почему кто-то его выполняет, - либо мы совершаем наихудшую форму образовательной дискриминации, дифференцируя академические программы на основе экономического класса.
Версия символической футбольной мамы для бедных - это мама-гамбургер - мать, которая ночами работает в ресторане быстрого питания, а ее дети сидят в будке и ждут, когда она поможет им с домашним заданием. Около 20 процентов детей в Соединенных Штатах живут в бедности, а выполнение домашних заданий еще больше усугубляет их академические проблемы. Благонамеренные родители не могут преодолеть нехватку ресурсов, в том числе времени, необходимого для того, чтобы их дети выполнили школьные задания.
Домашнее задание: Черная дыра
Призыв к большей ответственности в образовании с повышенным вниманием к оценкам и результатам тестов ставит домашнее задание на кон.Когда мы оставляем значительную часть обучения родителям, как мы можем заставить школы и учителей отвечать за соблюдение более высоких стандартов? Учить в соответствии со стандартами - значит учить в более жестко контролируемой системе, не оставляя места для неизвестной переменной - черной дыры домашнего задания - в образовательном процессе. Более того, как учителя могут узнать уровень обучения своих учеников, если они не знают, как ученики выполняют свои домашние задания?
Ученые-когнитивисты внесли свой вклад в революцию в теории обучения, опираясь на фундамент, заложенный Жаном Пиаже и Львом Выготским.Педагоги признают, что учащиеся обладают уникальными когнитивными структурами, которые определяют их способности решать задачи на разных этапах их развития. Мы знаем, что должны строить новое обучение на существующих ментальных рамках, чтобы создавать новые знания. Понимание ошибок учеников - важная часть учебного процесса. Когда работа уходит домой, учителя плохо понимают ошибки, которые ученики сделали с материалом, и плохо контролируют, кто выполняет работу. Учителя задаются вопросом: а ученики ли делали свою работу? Обменивались ли они ответами с друзьями по телефону или перед школой? Отправляли ли они домашнее задание по электронной почте своим бабушкам и дедушкам, которые выполняли работу и возвращали их рано утром на следующий день? Они загрузили бумагу, которую сдают? Домашнее задание - это черная дыра в процессе обучения, из-за которой учителя не знают об истинном образовательном уровне или прогрессе каждого учащегося и не могут дать учащимся новые знания.
Мифы о домашних заданиях
Три мифа о домашних заданиях сохранились в течение последнего столетия, из-за чего мы не желаем запрашивать веские доказательства преимуществ домашнего задания и соглашаемся с утверждениями о его эффективности.
Миф: Домашнее задание повышает успеваемость. Даже сторонники домашнего задания признают проблемы исследования домашнего задания. Сторонник домашних заданий Харрис Купер признает, что «выводы прошлых рецензентов исследований домашних заданий показывают необычайную вариативность.. . . обзоры часто прямо противоречат друг другу »(1989, с. 28). Большинство исследователей теперь признают, что домашнее задание не улучшает успеваемость учащихся начальной школы (Купер, 1994). Предполагаемая важность достижения домашнего задания в развитии таких качеств, как самодисциплина и тайм-менеджмент. Согласно этим взглядам, раннее развитие домашних привычек означает, что ученик будет более дисциплинированно выполнять домашнее задание в старшей школе и за ее пределами.
Однако, по мнению Пиаже, просьба к детям выполнять задания до того, как они будут готовы к развитию, оказывается контрпродуктивной для развития. Нам нужно спросить себя, попадает ли домашнее задание в эту категорию. Не имея веских доказательств, сторонники домашнего задания просят нас поверить в то, что домашнее задание может привить желаемые черты характера.
Миф: Если наши ученики не будут выполнять много домашних заданий, их результаты тестов никогда не будут конкурентоспособными на международном уровне. При сравнении результатов тестов студентов U.С. Студенты против студентов из других стран. По иронии судьбы, третье международное исследование математики и естествознания (TIMSS) 1995 г. показало, что ученикам 8-х классов в Японии и Германии назначается меньше домашних заданий, но они все же опережают студентов из США по тестам (Национальный центр образовательной статистики, 2001 г.). Японские школы тратят большую часть своих бюджетов на профессиональное развитие и организуют школьные дни так, чтобы учителя могли работать вместе. Учителя в Японии проводят в школе восемь-девять часов в день, но преподают только четыре часа в день.Кроме того, в японском школьном календаре более продолжительные учебные дни, более продолжительные школьные годы, более продолжительные обеды и более продолжительные перемены. Классная комната японского языка - это священное пространство, которое не допускает прерываний. Мы можем извлечь много уроков из японской системы (Rohlen & LeTendre, 1995).
Миф: Те, кто ставит под сомнение домашнее задание, хотят разбавить учебную программу и поклониться лени, присущей ученикам. Подвергая сомнению домашнее задание, мы ставим под сомнение не домашнее задание, а, скорее, ценность того, чтобы учащиеся выполняли его дома.Студентам необходимо выполнять долгосрочные независимые проекты в рамках строгой академической программы. Им нужно научиться многим навыкам с помощью упражнений и практики. Им нужно время, чтобы научиться чему-то новому. Профессиональным педагогам необходимо разработать строгую академическую работу, сформировать новые знания и выработать новые учебные привычки. Место для такой работы есть в школе.
В центре внимания подлинные реформы
После почти 20 лет школьной реформы у нас теперь есть несколько проверенных методов повышения успеваемости.Недавнее исследование академической успеваемости RAND сравнило результаты государственных тестов 1993–1996 годов и обнаружило, что штаты с более высокими результатами тестов имеют три важные характеристики: меньший размер класса, большее количество дошкольных образовательных программ и больше ресурсов для учителей (Гриссмер, Фланаган, Кавата, и Уильямсон, 2000). Призыв к увеличению финансирования школ должен быть мантрой нашей профессии.
Спешка с финансированием и созданием внешкольных программ в настоящее время является важной политической инициативой, способной решить некоторые проблемы с домашним заданием, с которыми мы сталкиваемся (Miller, 2000).Руководители системы образования должны стремиться к тому, чтобы программы внеклассного обучения были строгими с академической точки зрения и работали в тесном сотрудничестве с общественными организациями, которые предоставляют внеклассные услуги.
Исследования обучения показывают важность физических движений в процессе обучения (Jensen, 2000). Помимо проблем со спиной, связанных с тяжелыми рюкзаками, студенты, которые весь день сидят в классе, а затем часами выполняют домашнее задание по ночам, сталкиваются с потенциальной угрозой для здоровья. Повышение давления для достижения результатов, введение программ тестирования с высокими ставками, сокращение физических нагрузок и выполнение домашних заданий - вот рецепты катастрофы.Педагоги должны помочь родителям и политикам понять, как чрезмерное внимание к тестированию приведет к одномерному обучению.
Накопление домашних заданий и отстаивание их ценности - более дешевые и менее политически рискованные стратегии, но преподаватели должны информировать общественность о реальных рычагах улучшения школы. Есть ли у нас смелость требовать адекватного финансирования школы? Готовы ли мы объявить восьмичасовой рабочий день как для студентов, так и для учителей? Готовы ли мы посвятить себя профессиональному развитию, которое необходимо учителям для эффективного преподавания в своих классах? Готовы ли мы укомплектовать наши внешкольные программы профессионалами, которые могут поддержать обучение студентов? Педагогам необходимо обдумать эти вопросы, прежде чем отвечать на звонки родителей и местных СМИ о домашнем задании.