Нейросети-расисты, евгеника и IQ: почему измерение интеллекта ведет к неравенству
Мы часто слышим о тестах IQ, показывающих уровень интеллекта, но мало кто задается вопросом, откуда появились эта и другие метрики умственного развития и каковы их культурные и политические предпосылки. Что такое количественная модель интеллекта и какое отношение она имеет к расизму, ИИ и машинному обучению?
В конце XIX века, на заре экспериментальной психологии, активно говорили о создании научной модели человеческого разума. Классик американской психологической науки Джеймс Кеттел выдвинул идею стандартизированных психометрических тестов. Если использовать их на достаточно большом количестве испытуемых, то можно получить данные, на основе которых удастся открыть универсальные принципы работы человеческой психики. Он предложил измерять время реакции, ресурсы визуальной и слуховой памяти, моторику, и первым провел испытания своих тестов в лаборатории.
С этого полузабытого эпизода началась долгая история превращения интеллекта из практической способности человека в формализованную активность абстрактного мышления. Это ограниченное понимание разума смогло пережить другие отмершие науки позапрошлого века (например, френологию), и даже мигрировало в искусственный интеллект (ИИ).
Несмотря на неутихающий хайп вокруг машинного обучения и сверхскоростных компьютеров, проблемы, которые ставят перед нами эти технологии, те же, что и в XIX столетии. Как измерить умственные способности человека? Можно ли классифицировать людей по уровню интеллекта? Удастся ли нам на основе такой модели разума построить общество, где каждому отведено место согласно его способностям? А в последние годы к этим вопросам добавились новые: сможем ли мы на основе такой картины интеллекта воссоздать его в искусственных условиях, и создать синтетический «мегамозг», наделенный «суперинтеллектом»? И имеется ли связь между идеей измеримости интеллекта и перспективой создания его искусственного аналога? Но прежде, чем рассмотреть эти вопросы, заглянем в историю науки.
Тесты, шкалы и метрики: сверхкраткая история IQ
В 1904 году Министерство общественного образования Франции назначило психолога Альфреда Бине главой комиссии по реализации закона об общеобязательном школьном образовании. Бине был директором лаборатории физиологической психологии в парижской Практической школе высших исследований и исследовал высшие психические функции. Он был привлечен правительством для разработки метода определения, какие дети не успевают за школьной программой из-за врожденных дефектов умственного развития и нуждаются в особом подходе.
Бине заметил, что некоторые дети опережают своим интеллектом других детей, развиты «не по годам». Другие, наоборот, отстают от своих сверстников. Он объяснял это при помощи понятия «умственного возраста», который не всегда соответствует хронологическому возрасту.
Слишком сильное опережение или отставание от среднестатистического «умственного возраста» было свидетельством одаренности или отсталости ребенка.
В 1908 году Бине вместе с другим психологом Теодором Симоном создал психометрический метод оценки умственных способностей детей разных возрастов. По сути, это был прототип современного теста IQ. Через семь лет, в 1915-м, он был усовершенствован американским психологом Льюисом Терманом на базе выборки американских испытуемых, и известен ныне под названием «шкала Стэнфорд — Бине»: его и сейчас используют для оценки готовности детей к обучению в школе и для распределения в школы и классы разного уровня.
Количественные шкалы интеллекта были очень востребованы в первые десятилетия прошлого века. Например, в военной отрасли США использовались так называемые Альфа- и Бета-тесты. Их использовали для проверки интеллекта новобранцев в армию, чтобы определить, для какой должности подходит уровень их умственного развития. Таким образом было проверено несколько миллионов человек.
После Второй мировой различные модификации тестов умственного развития получили еще более широкое распространение. К примеру, вариации Бета-теста использовались для проверки иммигрантов, прибывших в Америку, и применялись к тем, кто плохо владел английским.
Итог повсеместного использования этой шкалы был печальным: в правительстве США всерьез заговорили об ограничениях для иммигрантов с «недостаточным» уровнем интеллекта. Отдельные социальные группы и народы стали жертвами стигматизации и предрассудков.
Еще в 20-х американские поборники евгеники разработали законопроект о принудительной стерилизации «умственно отсталых». Один из главных тогдашних пропагандистов евгеники Гарри Лафлин — создатель закона о стерилизации «дефективных» — предлагал ограничить въезд в страну «генетически неблагонадежным», то есть выходцам не из стран Северной Европы. В те годы правительство США было всерьез взволновано угрозой, которую якобы несут для американского развития иммигранты с «недостаточным» уровнем умственного развития. Нобелевский лауреат Роберт Шокли начиная с середины 60-х пропагандировал идею интеллектуального превосходства белых американцев над иммигрантами — представителями расовых меньшинств. Одержимость идеей вырождения человеческой породы заставила его сделать предложение правительству США премировать людей с низким IQ, которые добровольно прошли стерилизацию. Он предлагал платить по 1000 долларов за каждый балл, который они «не добирают» до «оптимального» уровня.
Повсеместное применение тестов на уровень интеллекта — сугубо американский случай. Создатель ранней версии этой шкалы Бине призывал не классифицировать и уж тем более дискриминировать людей по умственным характеристикам. Ведь в конечном счете психометрия не может использоваться для однозначного и объективного измерения врожденных способностей. Она лишь позволяла разграничить детей, потенциально способных к обучению в школе, и детей с врожденными дефектами. Согласно Бине, интеллект — биологически заданная единица, но она сильно варьируется в зависимости от социальных условий.
Знакомые нам современные версии тестов IQ разработал американский психиатр Дэвид Векслер в 1955 году. Он дополнил их компонентами и этим интернационализировал свою шкалу. Ее «взрослая» версия получила название WAIS-IV (Wechsler Adult Intelligence Scale) и используется по сегодняшний день. Этот тест включает в себя несколько субтестов на понятливость, установление сходств, шифровку, нахождения недостающих деталей и т. д. Сегодня вариации этого теста используются для определения способностей людей к обучению, чтобы определить возможные направления их профессионального образования. Векслер исходил из более «гуманного» понимания интеллекта. Он определял его как потенциал человека целенаправленно действовать, рационально мыслить и эффективно взаимодействовать со средой.
Уровнем интеллекта нынешние психологи называют число, выражающее отношение количества верных ответов субъекта на вопросы со средним числом правильных ответов группы субъектов того же возраста. Или же, другими словами, это уровень индивидуального интеллекта относительно среднестатистического уровня субъектов того же возраста.
Интеллект определяется через взаимосвязанные показатели вербального узнавания, оперативной памяти, абстрагирования, нахождения аналогий и паттернов, внимательности.
Понятно, что такое понимание разума достаточно ограниченное: оно не учитывает индивидуальный жизненный опыт, практические навыки и умения, и эрудицию.
При этом психодиагносты различают два типа интеллекта: подвижный (флюидный) и кристаллизовавшийся.
Подвижный интеллект затрагивает то, что сейчас называют гибкими навыками (soft skills) и критическим мышлением. «Подвижность» связана с логическим мышлением, аналитическим «складом ума», распознаванием связей, и позволяет человеку быть высокообучаемым. Кристаллизовавшийся интеллект не такой формальный, как подвижный, и образуется из накопленного опыта и знаний. Он обладает объемом и глубиной, поскольку отражает индивидуальную жизнь человека и измеряется через оценку вербальных способностей.
Как превратить алгоритм в сверхскоростную пифию
В середине XX века количественная модель интеллекта нашла свое ответвление в идее нейронных сетей. Нейрофизиология рассматривает мозг как последовательность нейронов, связанных друг с другом синапсами и разветвленных в густую ретикулярную сеть. Нейроны передают друг другу информацию в виде биоэлектрических импульсов. А значит, в определенном важном смысле мозг — это компьютер, а принципы его работы в принципе такие же, как у ЭВМ.
Искусственные нейронные сети были придуманы кибернетиками. Связи между нейронами уподоблялись формальным связям в математической логике, а целый мозг — вычислительному устройству, компьютеру с распределенной архитектурой.
Нейрон — это базовая вычислительная единица, которая производит простейшие вычислительные операции над полученной информацией и передает ее далее своим «соседям». Многослойная нейронная сеть получает вводную информацию, производит над ней требуемые манипуляции и выводит полученный результат.
Сегодня нейросети используются для автоматического выполнения таких задач, как классификация (распределение данных по параметрам), предсказание (прогноз следующего шага на основе предыдущих), распознавание («считывания» определенных черт или паттернов). Согласитесь, эти задачи довольно похожи на то, что проверяется в психометрических тестах! «Умственные» способности нейросетей во многом аналогичны тем способностям, которые измеряются в тестах IQ, ведь оба явления основаны на общей интуиции: разумность может быть измерена и просчитана.
К примеру, в нейропсихологии иногда используется задача «n-назад» для оценки подвижного интеллекта. В ней испытуемому показывают ряд элементов — символов, изображений или звуков. Ему нужно определить, встречается ли определенный элемент в ряду n позиций назад. Задачу используют для «тренировки» определенных участков мозга, улучшения рабочей памяти и логического мышления. В то же время понятно, что с такой задачей неплохо справится нейросеть, если «накормить» ее достаточным объемом релевантных данных, на которых она научится выполнять эту задачу лучше, чем человек. Ее «кратковременная память» способна удержать в себе куда больше информации, чем скромные 5–7 ± 2 смысловых элементов у человека.
Можно провести аналогию между «слабым» ИИ и подвижным человеческим интеллектом — с одной стороны, и «сильным» ИИ и кристаллизовавшимся интеллектом — с другой.
Как считают философы, «слабый» ИИ способен имитировать отдельные когнитивные способности людей, решать познавательные задачи определенного узкого спектра лучше и эффективнее. Но в остальном он бессилен. Проще говоря, «слабый» ИИ — это синтетическая версия отдельных способностей подвижного интеллекта, он умеет строить логические гипотезы, умозаключать или видеть связи.
Это «аутичный» ИИ, ведь известно, что подвижный интеллект гипертрофирован у людей с расстройствами аутистического спектра. «Сильный» ИИ, напротив, во всей полноте воспроизводит человеческий опыт, способен к многопрофильному обучению, и этим аналогичен кристаллизовавшемуся интеллекту в психодиагностике. Чем дольше он живет и развивается, тем более сложным и разветвленным становится его опыт (а может быть, ему даже потребуется психоаналитик). Как видим, именно «сильный» ИИ, синтетическое сознание, может развить в себе такой интеллект.
Работа нейросетей подчинена алгоритмам — правилам рассуждения или действия. Многим алгоритмы знакомы по блок-схемам или графам на уроках информатики в школе. Порядок действий в них представлен наглядно и интерпретирует их так, чтобы их понимал человек.
Говоря более строго, алгоритм — это ограниченный набор инструкций по решению определенного рода задач. Ему следует определенная система, выполняющая поставленную задачу. Таким образом, следуя определенному набору правил, можно гарантированно достичь результата. Если что-то пошло не так, то проблема не в алгоритме, а его исполнителе — человеке или машине.
Если какую-то задачу можно разбить на простые пошаговые действия, то говорят, что она алгоритмизируема, то есть имеется пошаговая процедура ее разрешения. А раз алгоритмизированную задачу можно «загнать» в машину и обучить ее выполнять эту задачу быстрее и эффективнее, чем человек, то эта задача может быть автоматизирована.
Как говорил классик философии ИИ Джон Хогленд, если система действует, строго соблюдая алгоритм задачи, то ее действия могут быть автоматизированы. И речь идет не об узкоспециальных научно-технологических задачах, а об огромном поле возможностей. Например, ученые разработали нейронную сеть по имени Пифия, которая дешифрует надписи на античных артефактах и угадывает пропущенные слова или утраченные фрагменты текстов. Делает она это в целом куда успешнее и быстрее, чем эксперты-люди.
А такие масштабные инициативы, как Human Brain Project (Евросоюз) и Blue Brain Project (Швейцария и IBM), занимаются разработкой суперкомпьютерной инфраструктуры для точного виртуального моделирования человеческого мозга, проектированием нейроморфных вычислительных систем и их внедрением в управлении и автоматизируемой медицине. Это уже не что иное, как торжество количественного понимания интеллекта. Достаточно дополнить это тенденцией скачкообразного, энтропийного роста количества данных, обрабатываемых машинами на сверхвысоких скоростях, чтобы в самом деле задаться вопросом: неужели все эти машины уже мыслят, да еще и быстрее и лучше нас? Сейчас мы увидим, что на деле всё не так просто.
Неоднозначные метрики: в чем связь уровня IQ и расизма
Нейросеть, как и любая обучаемая машина, учится тому, что мы в нее заложили. Уже известны прецеденты, когда чат-бот научился у своих собеседников обсценной лексике и расизму, искусственный HR-специалист дискриминировал потенциальных сотрудников по гендерному признаку, а автоматическая система распознавания лиц «реагирует» только на белый цвет кожи.
Можно подумать, что это всего лишь курьезы и побочные эффекты новых технологий. Но сомнительный политический шлейф следует за психометрией и количественными моделями интеллекта уже достаточно давно.
Фрэнсис Гальтон, английский ученый и эрудит, вдохновлялся книгой «Происхождение видов» своего кузена Чарлза Дарвина. Его настолько впечатлили идеи наследственной изменчивости видов и выживания наиболее приспособленных, что он решил исследовать эти процессы в человеческой популяции.
В фокус внимания попал вопрос «наследственного гения» — одаренности и таланта. Он пытался создать научно выверенную количественную модель интеллекта, применимую к статистически большому количеству людей. Гальтон предположил, что умственные характеристики наследуются точно так же, как физические. А это значит, что у талантливого человека больше шансов родить и воспитать одаренного ребенка, чем у человека «обычного». Свои догадки он подкрепил статистическими выкладками и тщательным анализом биографий и генеалогий выдающихся личностей.
Он предложил целенаправленно использовать отбор в общественной организации. Так были бы созданы благоприятные условия для появления большего числа людей с высоким уровнем интеллекта и врожденными талантами и снижения числа «бесталанных» и «умственно отстающих». Свой метод улучшения человеческой породы он назвал евгеникой и активно внедрял ее в тогдашнее британское общество — например, сочетая свои идеи о наследственности интеллекта с антропометрией и краниометрией в криминалистике.
И этот эпизод далеко не единственный в перипетиях истории научного моделирования интеллекта. Уже совсем недавно, в середине 1990-х, американцы Ричард Херрнстайн и Чарльз Мюррей опубликовали монументальный труд «Колоколообразная кривая» (The Bell Curve) о зависимости между интеллектом, наследственностью и социальной средой. Они считали, что уровень интеллекта является определяющей характеристикой в социальном положении индивида.
Скандал вызвала глава книги, в которой они указывали на значимость расовых и этнических различий для статистического распределения уровня интеллекта в американском обществе. Авторы утверждали, что чернокожие люди в среднем обладают более низким интеллектом, чем белые, и говорили, что следует распределять ресурсы между более «одаренными» и «умными» людьми, чтобы создать «когнитивную элиту».
Критики были возмущены тем, с какой легкостью Херрнстайн и Мюррей перенесли искусственный конструкт измеряемого интеллекта на тех, кому в силу классовой, расовой или гендерной принадлежности было отказано в получении образования. Ведь в конечном счете показатель IQ отображает не уровень интеллекта «вообще», а уровень осведомленности в тех дисциплинах и мыслительных навыках, которые считает важными современный западный человек.
Критики этого исследования справедливо указывали на то, что в «узловых» моментах своей аргументации в пользу зависимости интеллекта, расы и класса Херрнстайн и Мюррей оказываются солидарны с оголтелыми расистами. Предлагаемые же ими политические рекомендации, в сущности, воспроизводили требования ограничить или квотировать представленность людей из различных социальных групп в политической иерархии.
С точки зрения методологии исследования здесь возникает еще и проблема курицы и яйца: считать ли низкий уровень IQ причиной или следствием низкого положения людей в социальной иерархии?
Очевидно, что это вопрос не биологических задатков и наследственной «одаренности», а экономического неравенства и дискриминации. К тому же в большинстве случаев зависимость между генами и IQ оказалась ложноположительной. А дискуссия вокруг этого исследования стала уроком о неоднозначности и опасности одностороннего некритического переноса естественнонаучных представлений о «природе человека» на острые социальные проблемы.
Когда Кеттел, Гальтон или Бине создавали свои версии метрик умственного развития, они ведь исследовали те модели интеллекта, которые усвоили сами, восприняв представления своего времени. Создав свои шкалы, они, по сути, спроецировали на подопытных эти штампы, наделив их статусом объективных истин о человеке.
А значит, нам следует задуматься над вопросом: нет ли зависимости между тем, как мы понимаем интеллект, и непредсказуемыми и странными последствиями в виде нейросетей-расистов или коллаборационистов с полицейским государством? Может быть, интеллект — это не только количественно определимая способность, но и что-то еще?
Философ Катрин Малабу обыгрывает смысловые оттенки английского слова “intelligence”. Одно из значений этого слова — разведка, которая объединяет стратегии и тактики слежки и шпионажа, техники и процедуры дознания, и насильственные методы получения признательных показаний. Стало быть, искусственные интеллектуальные системы — это, буквально, сообщники спецслужб, секретных и не очень, техническая инфраструктура общества слежения (surveillance society).
Можно представить себе мрачные картины в духе сериала «Черное зеркало», помноженные на расизм, сексизм и дискриминацию, чтобы задуматься над тем, не требует ли машинное обучение такой же этической осознанности, как и остальные разделы педагогики? Ведь машины учатся навыкам у нас, людей, накапливая и обрабатывая информацию о нас, выслеживая наши действия, подражая нам (а точнее — нашим представлениям об интеллекте). Тогда в самом деле автоматизированный количественный интеллект очень далек от подлинно человеческого интеллекта, он лишь моделирует западные представления о рациональности.
Как воспитывать новорожденный ИИ
Философски можно сказать, что количественная модель интеллекта пока «не дотягивает» до тех концепций разума, которые развивались в истории мысли. Конечно, искусственные нейронные сети и ИИ рано или поздно станут способны к сверхскоростному мышлению. Но это еще совсем не значит, что машина будет мыслить, думать в строгом смысле этого слова.
Мышление — это не столько формальное оперирование символами или функциями, сколько содержательная работа, волевое усилие.
Можно говорить о разных философиях — восточных или западных, древних или современных. Многим из них свойственен акцент на социальном контексте, культуре и обучении как важных входных параметрах умственного развития. Интеллект для философов — это скорее результирующая личного опыта и социальной жизни, величина историческая и зависящая от социокультурной среды.
Некоторые историки и философы говорят, что кибернетика как мировоззрение родилась из интуиции, что человек — это и есть наиболее совершенная машина. То есть они не считали, что машины должны стать такими же умными, как человек. Наоборот, сам человек должен быть описан как мыслящий механизм. Еще в середине 1950-х советские кибернетики писали, что человек — это кибернетическая машина, которая способна создать другую машину — живую, чувствующую эмоции и более совершенную, чем ее создатели. Выдающийся советский математик Андрей Колмогоров призывал своих коллег разработать точное определение воли, мышления и эмоций на основе цифровых механизмов обработки и передачи информации. Значит, надежды они возлагали именно на количественное понимание интеллекта наподобие того, что измеряют психометрические тесты.
Но даже для евангелистов кибернетики и ИИ проблема мыслящих машин кроется в определении мышления, в том, как мы понимаем способность думать — как универсальные гибкие навыки абстрагирования, анализа и классификации, или как индивидуальные знания и опыт. Сегодня ясно, что истина находится где-то посередине.
Интеллект — это умение вычленять паттерны и оперировать ими, но также и сенсомоторные навыки, умение применять свое тело в разных контекстах. Этому нужно научиться, и это требует времени. А значит, для машин тоже нужна педагогика, которая научила бы их распознавать смысл в мире.
Экзистенциальная тупость и чистые доски
Человек — не просто машина, он еще и организм. Внутренние принципы его функционирования не могут быть аналитически вычленены и изложены в виде формальной системы абстрактных правил или инструкций.
Организм тем и отличается от механизма, что он есть нечто большее, чем сумма составляющих его частей. Это наделяет его автономией действия, не зависимого от контроля извне.
Значит, интеллект возникает как часть жизнедеятельности организма. Он не может быть измерен количественно, точно так же, как не может быть оценена адаптированность организма к среде.
Развитие умственных способностей человека всегда помещено в экосистему взаимоотношений с другими людьми, социальными институтами и культурными практиками. Более того, еще в 1980-х психолог Говард Гарднер выдвинул теорию множественного интеллекта, в котором подвижный и кристаллизовавшийся интеллект составляют лишь малую часть. Человеческий разум многомерен и включает в себя телесную, межличностную, эстетическую, экзистенциальную компоненты. Такое комплексное видение не позволяет сводить его к чисто биологическим задаткам: интеллект «созревает» и биологически, и социально, его развитие в равной степени зависит от «внутренних» и «внешних» детерминант.
Известно, что познавательный опыт ребенка с самых первый дней раскрывает перед ним богатый социальный мир. Новорожденные 2–3 дней от рождения способны к имитации выражения лица взрослых. Еще не видев собственного лица, младенец может повторять улыбку или нахмуривать брови, распознавать сложные конфигурации мускульных лицевых движений других. В ходе экспериментов было установлено, что ребенок способен отличать одушевленное от неодушевленного, подвижные черты лица от абстрактных геометрических форм, голос родителя от чужих голосов.
А это значит, что когнитивные способности человека не нужно «закладывать», они есть у него с самого рождения.
Новорожденный человек — не «чистая доска», tabula rasa философов, а «новорожденная» нейросеть — да. Для машины обучение начинается как бы «с нуля», изначально она «ничего не умеет». Человек же умеет очень многое с самого рождения, и эти врожденные навыки — распознавание лиц, начатки абстрагирования и предсказания поведения других, эмпатия — совсем не поддаются алгоритмизации и автоматизации.
Строго говоря, хотя машина и способна к высокоуровневому интеллектуальному поведению, тем не менее, в важном смысле этого слова она не понимает, что она делает. Она слепа и не осознанна, ее действия определены извне задумкой разработчика. Как сказал бы знаменитый критик ИИ Хьюберт Дрейфус, машина «экзистенциально тупа», ведь она не видит смысла в собственных действиях. И поскольку она лишена тела, эмоций и включенности в общество, ей отказано в доступе к важнейшим составляющим множественного интеллекта.
Всё, на что оказывается способен «слабый» машинный интеллект в социальной среде — автоматизмы и клише, нечувствительность к остроумию и отсутствие эмпатии. А то, что нас ждет при усилении чисто количественного понимания интеллекта — это не пришествие сверхразумных машин, а появление неполноценно мыслящих человеческих существ (если использовать афоризм того же Дрейфуса). Не потребуется даже знаменитый тест Войта-Кампфа, чтобы понять, что перед тобой — машина, когда-то бывшая живым человеком.