Педагогическое тестирование в России и США

Педагогическое тестирование в России
Современное состояние педагогического контроля в российской системе образования представляет собой контрастное соеди­нение старого с новым, субъективного с объективным, устного опроса по пятибал­льной системе оценок с попытками вне­дрения контролирующих технологий. Од­ним из самых перспективных методов нам представляется тестовый — быстро развивающееся направление на стыке пе­дагогики, теории измерений, математиче­ского моделирования, математической ста­тистики и автоматизации. Внедрение и развитие такого тестирования внесет суще­ственный вклад в процесс реформирова­ния отечественной системы образования и ее интеграцию в мировую образовательную практику.
История проверки знаний и способно­стей с помощью различных заданий на­считывает около 4 тыс. лет. Однако ре­альное использование педагогических тес­тов началось век назад, когда в педагоги­ке и психологии была сформулирована проблема исследования индивидуальных различий. Научно разработанный тест представляет собой совокупность взаимо­связанных заданий возрастающей сложно­сти, позволяющих надежно и валидно оценить знания и другие интересующие педагога характеристики личности. В зависимости от длительности контролируе­мого периода обучения контроль можно разделить на текущий, тематический, ру­бежный, итоговый и заключительный. Его проведение связано с выполнением основ­ных педагогических функций — диагно-стической, обучающей, организующей, вос­питывающей и развивающей; базируется на принципах гласности (открытость всех этапов контроля), объективности (использо­вание стандартных тестовых программ и технических средств), научности (надеж­ность и валидность), систематичности и эффективности (минимальные затраты вре­мени и средств контроля). В дополнение к педагогическому контролю целесообразно использовать методы психологической диа­гностики, например оценку внимательности, памяти, интеллектуальных и творче­ских способностей.
Появившиеся на рубеже XX в. педагоги­ческие тесты довольно быстро завоевали популярность во всех развитых странах. Однако в СССР к 30-м гг. развернулась их встречная критика, а затем и полный запрет, продолжавшийся вплоть до начала 70-х гг. Советская педагогика этого пери­ода фактически отказалась от математи­ческих моделей обучения, статистических методов обработки педагогических данных и даже анкет, которые в то трудное вре­мя были названы вредными». С конца 80-х гг. педагогическое тестирование в нашей стране переживает второе рожде­ние.
Инициатором этого процесса стало Гос­образование СССР, а основным исполните­лем — кафедра педагогических измерений его Исследовательского центра под руко­водством В.С.Аванесова. Здесь были со­браны и проанализированы основные тео­ретические и практические результаты в данной области, полученные междуна­родным сообществом. Однако, как оказа­лось, главная трудность заключалась в том, что научно обоснованные междуна­родные педагогические тесты не поддава­лись однозначной адаптации к отечествен­ной системе образования в силу ее специ­фики. На эту работу потребовалось целое десятилетие.
В середине 90-х гг. организован Центр тестирования Минобразования России, на который возложена роль основного коорди­натора теоретических исследований, посвя­щенных педагогическому тестированию, и их внедрения в образовательную систему страны. С I998 г. Центром осуществляет­ся широкомасштабный эксперимент по проведению централизованного абитуриент­ского тестирования в вузы России, кото­рый дал неоценимый опыт создания и внедрения итоговых педагогических тестов по отдельным дисциплинам в общеобразо­вательную среднюю школу. По результатам эксперимента создается единый банк те­стовых заданий; сформированы обобщенные умения по географии, физике, исто­рии, химии; создана стандартизованная спецификация тестов; осуществляется раз­работка классификации тестовых заданий и сервисных программ для автоматизации их проектирования, экспертизы и исполь­зования. Уже можно сделать вывод о том, что централизованное тестирование способно объективно оценить уровень школьных знаний и отобрать лучших сту­дентов из числа прошедших тестирование абитуриентов, т.е. оно может служить кон­курентоспособной альтернативой традици­онной форме приемных экзаменов в вуз. Среди организационно-педагогических и теоретических проблем развития тестирова­ния в России организаторы и участники эксперимента выделили следующие
— создание единой системы мониторинга качества образования по схеме учебное – учреждение — регион — федеральный центр
— организация подсистем бланочного и компьютерного тестирования и их интегра­ция для оптимизации функционирования федеральной системы
подготовка учащихся, учителей, экзаменаторов, административного и технического персонала к участию в централизован­ном тестировании;
адекватный перевод результатов тестиро­вания в традиционную 5-балльную шкалу
корректный выбор формы заданий и их числа, обеспечение репрезентативности выборки, надежности и валидности тестов;
создание тестов разного уровня сложно­сти, применяемых в зависимости от рейтинга высшего учебного заведения и показателей конкурсного отбора.
Их решение принесло конкретные пози­тивные результаты. Например, для всех желающих (учащихся, их родителей, пре­подавателей, руководителей образователь­ных учреждений и т.п.) в любом регионе России ознакомиться с правилами и про­цедурой тестирования, получить представ­ление о форме и содержании тестов, объективно оценить свой уровень знаний по разным предметам перед ежегодной официальной кампанией Центр с 1999 г. проводит бесплатное репетиционное тести­рование через Интернет. Это расширяет возможности дополнительной широкой апробации тестовых материалов, развития системы компьютерного тестирования, совершенствование элементов единой системы мониторинга качества образования [3-с. 30—32].
В педагогической литературе появилось большое количество публикаций, отражающих варианты решения выявленных проблем. В частности, приводятся результаты создания институциональных форм реализации централизованного тестирования и анализ решенных с их помощью органи­зационно-педагогических задач в отдельных вузах и регионах страны. Среди» них — разработка и создание
программно-инструментальных систем автоматизированного тестирования, работающих в локальной сети и в режиме реального времени при удаленном доступе;
региональных консультационных центров по проблемам педагогического тестирования
научно обоснованных характеристик перевода результатов централизованного тестирования в шкалу оценок вступительных экзаменов в зависимости от показателей конкурсного отбора абитуриентов
единых трехуровневых итоговых тестов, ориентированных на вариативную систему образования и обеспечивающих в результате самоопределения учащихся их дифференциацию по уровню подготовленности (базовый, повышенный или углубленный уровень)
различных программно-методических комплексов для автоматизации проектиро­вания тестов, экспертизы и использования тестовых заданий по дисциплине, а также обеспечения прогностической валидности тестов достижений, обоснования формы тестовых заданий в зависимости от предметной направленности и уровня усвоения материала, разработки технологи формирования дистракторов.
Опыт централизованного абитуриентского и репетиционного тестирования послужил основой для перехода к следующему этапу — единому государственному тестовому экзамену выпускников средних школ, кото­рый в порядке эксперимента проводится с 2001 г. в ряде субъектов Российской Федерации. После этого отечественная система образования планирует отказаться от вступительных экзаменов в вузы и перейти к существующей в большинстве стран мира практике конкурсного отбора в высшие учебные заведения на основании аттестационных тестов на выходе из средней школы. Однако в связи с этим по­явились новые проблемы. Во-первых, тестирование выпускников школ и абитуриентов вузов — это разные задачи педагогического измерения, поэтому возникли трудности отбора содержания тестов для единого экзамена. Тест должен, с одной стороны, охватить минимум знаний и умений, который следует освоить каждому выпускнику средней школы в соответствии с государственными образовательными стандартами, а с другой — отразить специфику требований к отдельным разделам дисциплин, необходимым для обучения в том или ином учебном заведении по различным специально­стям или направлениям. Во-вторых, выпускники школ и абитуриенты — это различный контингент для тестирования, имеющий в целом разные уровень подготовки и образовательные цели, что предопределяет отличие в требованиях как к содержанию тестов, так и к уровню усвоения материала. И, в-третьих, при абитуриентском тестировании интерес представляет не только уровень знаний и умений претендентов, но и профессионально значимые качества личности, такие, как творческие и логические способности, объем памяти, профессиональная направленность, широта интересов, уровень технического, вербального или социального интеллекта. Последний эксперимент единого государ­ственного экзамена только начался, а ис­следователи уже публикуют различные предложения по разрешению поставленных проблем. В частности, для аттестации выпускников общеобразовательных учреж­дений нужно иметь такие тестовые задания, которые позволяют судить о мини­мально допустимой компетентности вы­пускников. За рубежом такие тесты называют Minimum Competency Test. Рекомен­дуется использование критериально-ориентированных тестов, посредством которых определяется то, что испытуемый знает и чего он не знает из заданного стандарта. Централизованное абитуриентское тестирование предназначено в первую очередь для ранжирования абитуриентов, поэтому здесь требуются иные подходы. Предлагается конструирование комби­нированного теста по математике, где на­чальные задания первого и второго уров­ней сложности предназначаются для выяв­ления соответствия критерию минималь­ных знаний предмета, определяемому учебным стандартом, а последующие — третьего уровня — служат для определе­ния рейтинга тестируемого. При абитури­ентском тестировании необходимо разраба­тывать нормативно-ориентированные тесты, так как их основная цель — ранжирова­ние учащихся по степени владения знани­ями по определенной дисциплине. Здесь задания должны контро­лировать знания на содержательно-лич­ностном уровне качеств, поэтому число репродуктивных заданий, преобладающих в критериально-ориентированных тестах, следует уменьшить за счет заданий, нося­щих творческий характер.
Единый государственный экзамен по каждой дисциплине должен состоять из двух частей. Первая часть (А) — это ат­тестационный экзамен по курсу X—XI классов, обязательный для всех учащихся. Имеются два варианта аттестации А1 — контроль обязательного уровня подготовки выпускников и А2 — повышенного уровня. Результат тестирования переводится в 5-балльную шкалу для отметки в аттеста­те. Вторая часть (В) — по желанию вы­пускников для поступления в вузы, состо­ящая также из вариантов В1 (базовый уровень) и В2 (повышенный уровень). По совокупным ответам на задания частей А (А1 или А2) и В (В1 или В2) выдается сертификат единого государственного экза­мена с оценкой по 100-балльной шкале для поступления в вузы.
При проведении аттестационного тести­рования необходимо определить минималь­ный набор совокупности учебных элемен­тов содержания образования. Это можно сделать с помощью структурно-логических схем и матриц логической связи, которые решают задачу формирования минимально полного набора базовых учебных единиц, удовлетворяющих свойствам полноты и минимальности. На основе подобных идей реализуется основной принцип формирования единого банка те­стовых заданий — возможно полное и подробное отражение содержания предмета его логической структурой. В связи с этим решается задача создания перечня обобщенных видов умений по каждой дисциплине, обладающих свойства­ми полноты и минимальности. В соответ­ствии с этим принципом в Центре тести­рования Минобразования РФ сформирова­ны обобщенные умения по географии, физике, истории и химии.
Возможен «тезаурусный подход» к опре­делению содержания обучения, основанный на разработке базовых понятий соответ­ствующих учебных дисциплин и специаль­ностей. В педагогических исследованиях чаще встречаются два типа тезаурусов — «информационно-поисковый» (Л.Т.Турбович. 1970) и «логико-категориальный» (Л.В.Ма­карова. 1992). Первый тип делит множе­ство учебных понятий на отдельные обла­сти, а второй устанавливает между ними логические и функциональные взаимные связи. Предлагается методика составления информационно-поискового тезауруса на основе классификатора знаний и способно­стей Б.Блума — Р.Гегна. дополненного В.С.Аванесовым [9]. В частности, разрабо­таны два классификатора знаний по био­логии, содержащие знания «дифференци­ального» и «интегрального» типов. Первый из них. основываясь на типологии мысли­тельных операций, содержит группы фактуальных. сравнительных, ассоциативных, причинных, алгоритмических, классифика­ционных, системных, метрологических и методических знаний. Второй на основе деятельностного подхода содержит «житей­ские», мировоззренческие, технологические, математические, кибернетические, квалита­тивные и акмеологическне знания. Анализ репетиционных тестов по биологии позво­лил авторам диагностировать в них 30% фактуальных знаний (термины, определе­ния, исторические факты и достижения ученых, законы и закономерности). 20% классификационных знаний (основные при­знаки растений и животных, их система­тическое положение и морфологическое описание) и 16% причинных знаний (при­чинно-следственные отношения). Мало внимания уделяется диагностике алгорит­мических (10%), ассоциативных (5%) и сравнительных (3%) знании. Таким обра­зом, педагогическое тестирование, основан­ное на таксономической модели уровней обученное™ [10] и классификаторе знани! и способностей, наиболее полно удовлетво ряет требованиям государственных образовательных стандартов.
Что касается проблемы психологической диагностики абитуриентов на предполагае­мом втором туре абитуриентского тестирования в конкретном учебном заведении, тс здесь вдобавок к сертификату выпускника средней школы предлагается психофизио­логическое обследование абитуриентов е вузе по факторам, связанным со свойства­ми нервной системы и когнитивными пси­хическими функциями — памятью, внима­нием, особенностями восприятия и мышления [11. с. 51—52]. Например, в техни­ческих вузах целесообразно оценивать психологические предпосылки к обучению и профессиональному становлению студен­тов на основании теста технического интеллекта в экономических — теста соци­ального интеллекта Дж. Гилфорда, в гума­нитарных — теста вербального интеллек­та Дж.Айзенка. Для диагностики развития приемов мыслительной деятельности ис­пользуются специфические тестовые зада­ния с помощью применения аналогий, исключения лишнего и т.п. Кроме того, полезно разрабатывать методы оценки конкретных профессионально значимых качеств личности абитуриента в соответ­ствии с его будущей профессиональной деятельностью.
Отечественная система образования весьма специфична, поэтому научные и при­кладные наработки мировых лидеров по педагогическому тестированию в нашей! стране однозначно не адаптируются, что служит основанием для развития не только прикладных разработок, но и теоретических исследований в данной области; педагогики. Последнее дополнительно сти­мулируется наличием у нас большого ко­личества научных работников с хорошей математической подготовкой, способных заняться данной актуальной педагогической проблемой. Отдельную группу здесь со­ставляют работы, выполняемые в рамках теории моделирования и параметризации педагогических тестов. Моделирование педагогических тестов I может осуществляться с пр1шенением двух f теоретических подходов — классической ■ теории и современной теории 1RT (Item
Научные сообщения
Response Theory). Первая с помощью оп­ределения показателей надежности и ва-пнпности позволяет сделать оценку каче­ства разработанного теста. Для определе­ния взаимосвязанности заданий в тесте в ней используются методы корреляционного „ факторного анализа. Второй подход ос­нован на методологии латентно-структурно­го анализа XLSAI_c его мощным матема­тическим аппаратом и имеет больше воз­можностей по созданию эффективных те­стов Так, с помощью модели Г.Раша [12] посредством использования характеристи­ческих кривых можно оценивать латент­ные (скрытые) параметры уровня подго­товленности испытуемых и трудности за­даний. Разумно составленные варианты теста и статистическая обработка результа­тов тестирования в рамках данной модели позволяют получать оценки латентных па­раметров на метрической шкале, однако шкалы, соответствующие различным вари­антам теста, отличаются друг от друга. Для их преобразования в единую шкалу необходимо иметь дополнительную инфор­мацию, получаемую перекрытием вариан­тов теста для различных групп участников или перекрытием групп испытуемых, ис­следуемых различными вариантами теста. Такая дополнительная информация устра­няет неопределенность начала отсчета каждой шкалы, соответствующей различ­ным вариантам теста.
Использование двухпараметрнческой мо­дели, предложенной А.Бирнбаумом [13], позволяет определять дифференцирующую способность тестовых заданий. Для обес­печения нормализации их распределения по уровню трудности рассматриваются вопросы аппроксимации логистического распределения тестовых заданий [14. с. 59—61]. При работе с этой моделью неопределенными оказываются не только начала отсчета каждой шкалы, соответ­ствующей различным вариантам теста, но и масштабы таких шкал. Для устранения указанных неопределенностей рекомендует­ся обеспечивать определенное перекрытие вариантов теста. Обсуждаются структура перекрытия, количество общих заданий — узлов и основные требования к ним. Трехпараметрическая модель А.Бирнбаума позволяет при моделировании тестов учи­тывать вероятность угадывания ответа на каждое задание. Это повышает эффектив­ность проектирования тестов и ждет сво­его применения.
Следует отметить, что современная тео­рия измерений различает шкалы номи­нальные (наименований), порядковые (ран­говые), интервалов, отношений (пропор­ций) и разностей. При измерениях в пе­дагогике чаще всего ограничиваются при­менением порядковых шкал. Однако в работах Б.П.Битинаса, В.И.Михеева, Л.Т.Турбовича, Л.М.Фридмана, К.Инген-камна и других авторов делаются попыт­ки перехода к интервальным шкалам. Для этого все чаще используются стандартные нормы (z-шкала, с-шкала, т-шкала, р-шка-ла и др.), являющиеся нормированными шкалами на уровне шкал интервалов. В этой связи заметим, что педагогические измерения с помощью традиционной 5-балльной шкалы и тестовых оценок так­же основаны на порядковых шкалах. Од­нако перевод латентных параметров в единую метрическую шкалу позволяет пе­рейти от качественных порядковых к ко­личественным квазиннтервальным шкалам и проводить адекватную обработку резуль­татов более мощным математическим ап­паратом. Наиболее удобным для оценива­ния результатов тестирования является 100-балльная т-шкала. в которой в насто­ящее время стал выставляться сертифика­ционный балл выпускников средних школ при проведении единого государственного экзамена.
Отечественная школа при развитии те­стовых измерений показала высокую го­товность к использованию информацион­ных технологий на всех этапах разработ­ки и внедрения педагогических тестов. Здесь следует отметить значительные до­стижения Центра тестирования Минобразо­вания РФ в организации централизованно­го, абитуриентского и репетиционного те­стирования, а также единого государствен­ного тестового экзамена, результатом обоб­щения которых явилась монографическая публикация [15]. Компьютерные техноло­гии автоматической генерации тестов, про­ведения и обработки результатов тестиро­вания, региональные и федеральные систе­мы тестирования с использованием все­мирной информационно-образовательной среды Интернет возводят педагогическое тестирование в России в разряд современ­ных педагогических технологий и позволя­ют ему быстрыми шагами приближаться к мировому эталонному уровню.
Основное внимание федеральной власти, регионов и учебных учреждений уделяется итоговым аттестационным экзаменам в средней школе и абитуриентским экзаме­нам в высшей. Это та отправная точка, от которого педагогическое тестирование будет развиваться вниз (в среднюю обще­образовательную и специальную школу) и вверх (в высшую школу и послевузовское образование). Пока нормативная база оте­чественной системы образования (за ис­ключением рассмотренного выше перехода школа — вуз) не разрешает проводить тестовые экзамены итогового и заключи­тельного уровней, однако во всех компо­нентах этой системы ведется большая подготовительная работа. Наиболее акту­альным становится разработка текущих, тематических и рубежных тестов, исполь­зуемых в учебном процессе всех образо­вательных структл-р. Это большое профес­сиональное иоле, полностью заполнить которое не удастся на ближайшую обозри­мую перепекших. Для сравнения можно указать, что к США ежегодно знания и способности учашмхея проверяются с по­мощью 47 млн. тестовых бланков, выпус­каемых 400 тестовыми компаниями. По­давляющее большинство из них представ­ляют бланки текущего, тематического и рубежного уровнен
Всевозрастающее число разработчиков педагогических тестов выдвигают перед отечественной системой образования ряд важных задач.
Первая из них связана с сертификацией качества педагогических тестовых материалов, используемых для оценки знаний и других педагогических характеристик обучающихся в образовательных учреждениях РФ. С целью повы­шения качества образования и дальнейше­го совершенствования аттестационных те­стовых технологий создан Координацион­ный совет Минобразования России (при­каз Минобразования РФ № 1122 от 17.04.2000), призванный осуществлять контроль за соблюдением требований к качеству педагогических тестовых материалов, вырабатывать рекомендации по совершенствованию процесса их сертификации, определять порядок оформления и выдач сертификатов. Наличие сертифицированных педагогических тестов позволит организовать их распределение и будет способствовать формированию рынка тестовых услуг.
Вторая актуальная задача связана с подготовкой квалифицированных тестологов. С недавнего времени эта задача ста­ла государственной, и ее решение предла­гается введением в системе дополнитель­ного профессионального образования до­полнительной квалификации «тестолог».
Таким образом, можно констатировать, что педагогическое тестирование в России в настоящий исторический момент возрож­дено и переходит в стадию интенсивного развития. Специфика российских образова­тельных систем придает ему индивидуаль­ные черты, формирование которых позво­лит решить ряд важнейших педагогиче­ских проблем их интеграции в междуна­родные системы образования, реформиро­вания отечественной средней и высшей школы, а также развития научных основ педагогического тестирования.

Тесты в американской системе образования
Интерес к тестам впервые возник в отечественной педагогике в 20-е гг., в период становления советской школы. Тогда активно обсуждался вопрос об отношении к стандартизованным видам учета – тестам успешности. Педагоги хотели найти наиболее объективный и точный способ оценки знаний учащихся. Тесты привлекали их возможностью массовой проверки знаний школьников. Советские педагоги того времени опирались главным образом на исследования этой проблемы в американской школе.
Однако в советской педагогической литературе тех лет указывалось и на ограниченные возможности тестовой методики. Подчеркивалось, что тесты нужны лишь для проверки элементарных школьных навыков и непригодны для выявления глубины и осознанности знаний.
В сер. 30-х гг. работа с тестами была свернута в известным постановлением ЦК ВКП(б) «О педологических извращениях в системе Наркомпросов» (1936), в котором их использование подверглось резкой критике. Вообще-то в постановлении речь шла не о проверки знаний, а о тестировании умственных способностей школьников, которое, хотя и гораздо позднее, было категорически от­вергнуто и западной педагогикой. Однако в атмосфере 30-х гг. сам термин «тест» стал символом «педологических извраще­ний». Идея использования тестов в учеб­ном процессе была вычеркнута из арсена­ла педагогических средств.
Интерес к тестам вновь возродился лишь с начала 60-х гг. Статьи о них по­явились на страницах педагогических из­даний. Исследователи видели достоинства этого метода прежде всего в возможности объективной оценки знаний. Однако, как и в 20-е гг. отмечались ограниченные возможности тестов. Подчеркивалось, что они не выявляют способность ученика логически рассуждать и связно излагать свои мысли и их нецелесообразно приме­нять для проверки сформированности умения обобщать, сравнивать, делать выводы, объяснять явления и факты на основе изученных законов и теорий. В связи с намечаемой реформой образо­вания в России представляется уместным познакомиться с опытом, накопленным американской школой, так как разработка и применение тестов для проверки подго­товленности учеников являются се не­отъемлемой составной частью. Тестовая методика в США — универ­сальное средство проверки знаний, уме­ний, профессиональной подготовки во всех областях человеческой деятельности. Для допуска к практически любому роду дея­тельности, требующей каких-то навыков и знаний, необходимо получение сертификата. Например, десятки тысяч нештатных счетчиков для проведения переписи 2000 г. отбирались среди добровольцев с помощью специальных тестов, направлен­ных на проверку элементарных канцеляр­ских навыков, умения писать и считать. Тесты для профессиональной деятельности, разумеется, намного сложнее.
В области образования тесты разрабаты­ваются силами специализированных ком­мерческих компаний, располагающих весь­ма компетентными специалистами. Отбор материала и степень сложности предлага­емых вопросов зависят от ступени обуче­ния. Естественно, в начальной и средней школе они различны, но во всех случаях включают математику и так называемый вербальный тест (объяснительное чтение способность понимать текст, проводить аналогии, дополнять незаконченные утвер­ждения, проводить критический анализ текста). Особое значение имеют тесты, предлагаемые в выпускных XI и XII классах. Это прежде всего SAT-1 (Scholastic Aptitude Test) — по существу школьный выпускной экзамен. Он не очень сложен, соответствуя примерно уров­ню VI—VII классов российской школы. SAT-I принят большинством штатов. Практически он стал общегосударствен­ным, хотя закон, делающий его обязатель­ным для всех, до сих пор остается пред­метом дискуссий. Есть еше много других аналогичных тестов, например ACT (American College Test) — оценка подго­товленности к поступлению в колледж.
Результатами этих тестов, наряду с дру­гими показателями (средние баллы за последние годы обучения, личная характе­ристика и пр.), колледжи и университеты руководствуются при отборе абитуриентов. Разумеется, требования сильно отличаются н зависимости от ранга учебного заведе­ния. Поступающему в очень престижные и дорогие, например Принстонский или Стенфордский. университеты необходимо иметь оценки, близкие к максимальным, и благоприятные дополнительные характе­ристики. Для муниципального колледжа достаточно, чтобы оценки по SAT-1 были не ниже уровня среднеамериканского выпускника. В университетах некоторых штатов, например Флориды и Техаса, прием вообще производится не по результатам тестов, а по итоговым школьным оценкам, но эти университеты занимают в общеамериканской табели о рангах соответ­ственно 60-е и 82-е места в списке из 228 американских университетов (147 об­щественных и 81 частный). Есть заведе­ния, в особенности частные колледжи, ко­торые вообще ничего не требуют плати деньги и приступай к учебе, а чему на­учишься и какова будет цена полученного диплома в глазах будущего работодате­ля — проблема самих студентов.
Обычно время проведения теста строго ограничено сверх положенного не дадут ни одной лишней секунды, на размышле­ния и колебания времени нет. Например, на SAT-I отводится пять получасовых и два пятнадцатиминутных периода с корот­кими перерывами между ними. Общее число вопросов — 60 по математике и 78 вербальных. Один из получасовых пе­риодов является «экспериментальным» — его результаты не входят в зачет, однако испытуемый не знает, какой именно. Если он чувствует, что не справился с задани­ем, то может в течение суток отменить свою работу и пересдать тест в другой раз. Если полученные результаты неудо-влетворительны, то можно пройти испыта­ние повторно, снова внеся небольшую плату. Разумеется, при неизменности со­держания, вопросы тестов каждый раз новые. Теоретически тестирование можно проходить сколько угодно раз, однако каж­дый результат фиксируется в компьютерах системы образования. Поэтому любой се­рьезный университет всегда имеет возмож­ность поинтересоваться не только очками абитуриента, то и тем, с какой попытки они получены.
Престижные университеты крайне доро­жат своей репутацией и очень строго от­бирают лишь самых способных и подго­товленных слабый абитуриент не попадет туда ни за какие деньги. Напротив, очень талантливые студенты, с наиболее высоки­ми показателями, вполне реально могут рассчитывать не только на прием, но и на всякие льготы, вплоть до бесплатного образования в самых дорогих университе­тах.
Особое место в американской системе тестирования занимает SAT-II, предлагае­мый ученикам выпускного класса. Этот общеамериканский комплекс был введен в практику в 1994 г. Он включает все дис­циплины естественно-математического и гуманитарного циклов, в том числе ино­странные — европейские и азиатские — языки. Как правило, прохождение SAT-II добровольное, хотя ряд колледжей и уни­верситетов требует его выполнения. Но в любом случае он дает абитуриентам до­полнительные шансы на поступление. Само собой разумеется, что выпускники школ выбирают из комплекса разделы, соответствующие направлению их дальней­шего образования.
Нам представляется, что для иллюстра­ции того, как построены тесты в амери­канской системе образования, SAT-II под­ходит больше всего. С одной стороны, он основан на тех же принципах, что и все остальные тесты, с другой — достаточно сложен, чтобы показать, как при надлежа­щем построении тесты могут служить для выявления способности учеников логически мыслить, формулировать выводы и обоб­щения на материале полученных знаний. Более простые испытания, такие, как SAT-I. обладают теми же свойствами, но демонстрируют их не столь наглядно.
В качестве примера мы возьмем тест по всемирной истории, поскольку из всего набора тем эта наиболее знакома широко­му кругу читателей. Тест включает 95 вопросов, на которые надо ответить в течение часа.
В соответствии с технологией, повсе­местно применяемой в американской си­стеме образования, для каждого из вопро­сов предлагается несколько вариантов от­ветов, имеющих буквенное обозначение — А. В. С. D, Е. На отдельном листе напе­чатаны номера вопросов и против них — перечисленные буквы. Испытуемый должен отметить ту из них, которая, по его мне­нию, соответствует правильному ответу. Если он не отмстит ни одного ответа, то теряет очко. Если ответит неправильно, то теряет I/4 очка. Очевидно, что подобная система подсчета позволяет учесть даже неполное знание вопроса.
Окончательной оценкой являются не очки, а баллы, рассчитываемые по специ­альной таблице. Последняя построена так. что максимальное число баллов (800) абитуриент получает, даже набрав лишь 85 очков. Другими словами, он имеет право вообще не отвечать на 10 вопро­сов.
Получается, что испытуемый имеет неко­торую свободу выбора в пределах задан­ной тематики теста. Такая свобода в ка­кой-то мере создает психологическую раз­рядку для испытуемого. Он чувствует себя более комфортно, зная, что от него не ждут полного совершенства. При этом тест остается весьма суровым, и далеко не все его успешно проходят с первого раза. Известно, например, что в 1999 г из 1,3 млн. американских школьников проходивших SAT-1, лишь 730 получили полный балл. В среднем, неплохим ре­зультатом считается, если по каждому те­сту дано примерно 75% правильных отве­тов. Катастрофическим называют 40-про­центный уровень верных ответов.
Обратимся непосредственно к содержа­нию теста SAT-11 по всемирной истории Более половины из его 95 вопросов по­священы истории Африки. Азии, Северной и Южной Америки. История США сюда не входит — ей отводится отдельный тест. Вторая половина вопросов касается европейской истории. Содержание теста включает материалы социального, эконо­мического, культурологического характера. Абитуриенты должны уметь проанализиро­вать отрывки из выступлений политиче­ских деятелей, различные документы, предполагается знакомство с основными направлениями искусства и материальной культуры. Ответы требуют знания и пони­мания как фактов прошлого, так и собы­тий современности, причинно-следственных связей, основных тенденции развития все­мирной истории.
Значительная часть вопросов проверяет знание фактического материала. На пер­вый взгляд они кажутся достаточно эле­ментарными, но жесткие временные рамки требуют от испытуемого свободной ориен­тации в материале, обеспечивающей быст­рый ответ. Вопросы такого рода — про­стейший способ определить уровет его подготовки. Приведем некоторые примеры. Вопрос «Какие продукты позаимствовали европейцы только после их контактов с американскими индейцами в XVI веке?» Предлагаемые ответы
A. Чай.
B. Рис.
C. Корица.
D. Сахар.
E. Картофель.
Из любого учебника истории школьники должны знать, что в ходе контактов с индейцами европейцы узнали такие культуры, как картофель, маис (кукуруза), табак. Но даже если упоминание картофеля в учебнике выпало из памяти, можно воспользоваться другими фактами и другими источниками, чтобы дать верный ответ. Как правило, всем известно, что чай и рис выращивают в Китае, а корица входила в число пряностей, которые из­давна привозились с Востока, в частности из Индии. Выбор сужается до D и Е, что уже неплохо. Если же ученик еще откуда-то, хотя бы из детских сказок, зна­ет, что сахар был знаком европейцам еще в средние века (в домике у доброй вол­шебницы окошки были из леденцов), то он получает желанное очко.
Другой пример. Вопрос «Какие из коло­ний европейских стран получили незави­симость до 1900 года?» Набор предлагае­мых ответов
A. Алжир.
B. Бразилия.
C. Индия.
D. Индокитай.
E. Берег Слоновой Кости.
Хотя содержание вопроса строится на качественно ином материале, но по свое­му характеру он тоже нацелен на выявле­ние фактических знаний. В данном случае кроме знания учебника важна общеистори­ческая ориентация выпускника, понимание в самых общих чертах истории общества после Второй мировой войны. Это вклю­чает и обретение независимости Индией, и деятельность де Голля в решении ал­жирской проблемы, и ситуацию вокруг Вьетнама, и процессы, связанные с про­буждением «черного континента». Ориента­ция на этом общеисторическом фоне поз­воляет дать правильный ответ — Брази­лия, даже не зная подробностей истории Южной Америки.
Оба эти примера свидетельствуют о том, что нахождение правильного ответа даже на сравнительно простые вопросы требует не столько запоминания, сколько общеисторической подготовки
К числу более сложных вопросов можно отнести те, которые требуют понимания причинно-следственных связей. Эти вопро­сы отличаются по степени сложности, по характеру материала, на основе которого должны быть сформулированы требуемые выводы. Приведем несколько примеров.
Вопрос «Какие из перечисленных факторов обусловили стремительное развитие Французской революции?’ Предлагается выбрать один из ответов,
A. Национальное банкротство.
B. Наступление на права третьего сосло­вия.
С Желание знати получить конститу­цию.
D. Страдания крестьянства.
E. Попытка короля вернуться к феодаль­ным порядкам.
Чтобы сделать правильный выбор, необходимо обладать историческим мышлением, рассмативать крупное историческое явление как целостный процесс, который определяется Совокупностью ряда факторов. Соотношение этих факторов находит отражение в причинно-следственных свя­зях. В рассмотренном выше вопросе каж­дое положение из предлагаемого круга ответов выступало в качестве причины, приближающей страну к революции. Но только совокупность всех этих причин, их переплетение и взаимодополнение вызвали общенациональное банкротство, кризис власти которые и обусловили стремительное развитие французской революции.
Наконец, есть тесты, направленные на выяснение обшекультурного кругозора, степени знакомства с памятниками искусства разных эпох, умения ориентироваться в разнообразных художественных стилях. В качестве примера приведем три задания, объединенные в единый тест. Даны ре­продукции, изображающие памятники ис­кусства мозаика «Император Юстиниан с семьей», скульптура Микеланджело «Мои­сей» и интерьер церкви. Предлагается оп­ределить, к какому направлению в искус­стве относится каждое из произведений
A. Баухауз.
B. Ренессанс.
C. Прерафаэлиты.
D. Византийский стиль.
E. Рококо.
В данном случае интересны не столько вопросы, сколько набор предлагаемых от­ветов. Можно надеяться, что определение византийского стиля применительно к мо­заике, изображающей императора Юстини­ана, не вызовет особых затруднений. Точ­но так же вполне очевидна принадлеж­ность к направлению Ренессанса широко известной скульптуры Микеланджело. Но баухауз (направление в немецкой архитек­туре и прикладном искусстве первой чет­верти XX в.) или прерафаэлиты (группа английских художников середины XIX в.) вряд ли знакомы абитуриенту, не занимав­шемуся специально историей искусства. Выполнение предложенного теста предпо­лагает не только знание различных стилей в искусстве, но и умение применить эти знания в конкретной ситуации. Это еше раз напоминает о том, что поступление в серьезный колледж или университет требу­ет основательной подготовки по избранно­му профилю.
Примеры можно продолжить, но и при­веденные выше показывают, что для про­хождения теста недостаточно просто за­помнить какой-то набор фактов. SAT-1I нацелен в первую очередь на то. чтобы выявить кругозор абитуриента, его умение анализировать и обобщать материал. Этот вывод существенно отличается от прежних представлений о тестовых методиках. Гиб­кость и насыщенность тестов наряду со строгими рамками при их выполнении — характерные черты современных тестовых методов, используемых в Америке. Разуме­ется, уровень и направление заданий мо­гут коренным образом изменяться в зависимости от их тематики и назначения. Но общие черты, о которых говорилось, присущи всем бесчисленным испытаниям, проводимым в стране.

«