Откуда берется язык и почему ИИ — не волшебная палочка: объясняет научный журналист Яна Хлюстова

Чем человеческий язык отличается от других коммуникативных систем, каких переводчиков пока не могут заменить нейросети и чем ИИ может помочь изучающим мертвые языки? Об этом на паблик-токе, организованном издательством «Альпина нон-фикшн» и Музеем криптографии, рассказала Яна Хлюстова, автор книги «Поймать вавилонскую рыбку» и научный журналист.

Язык как ДНК человека

Язык — это система коммуникации. Языки бывают очень разными. Они есть и у животных, причем очень развитые: у приматов, птиц, пчел, морских львов. Тем не менее человеческий язык отличается от самых сложных коммуникативных систем животных: у нас есть грамматика и словарь, наши языки продуктивны (то есть мы можем образовывать новые слова и их формы). Человеческая речь служит не только для передачи информации или каких-то сигналов, но и для мышления и познания мира. Наш язык самодескриптивен (то есть с помощью него мы можем говорить о нем же). Лингвисты выделяют еще ряд его отличий от других систем коммуникации, но для непрофессионалов эти, пожалуй, самые важные.

До сих пор ведутся споры, является ли язык врожденным или приобретаемым навыком. Так, Стивен Пинкер, профессор психологии Гарвардского университета и автор бестселлеров «Язык как инстинкт» и «Лучшее в нас», считает его врожденным. Он основывается на идее универсальной грамматики, согласно которой у детей есть «запрограммированная» способность к изучению языка. Благодаря этому они быстро и эффективно осваивают грамматику и синтаксис родного языка. Это подтверждается тем, что все языки имеют общие структурные элементы, такие как существительные, глаголы, прилагательные и т. д., а также правила их сочетания. Пинкер также отмечает, что дети способны усваивать язык без явного обучения или сознательных усилий. Они просто слушают речь окружающих и начинают говорить сами, используя при этом сложные грамматические конструкции и выражения.

Искусственный интеллект: с чем он справляется и с чем нет?

Сейчас специалисты используют ИИ в разных сферах: не только для перевода и научной работы в лингвистике, но и, например, для обучения иностранным языкам. Некоторые преподаватели используют ИИ для генерации упражнений на отработку базовой лексики или грамматики. Интересно, что нейросети хорошо справляются с заданиями на французском и испанском языках, а вот упражнения для уроков русского как иностранного даются им не очень легко — ИИ справляется с задачей настолько плохо, что проще все написать самостоятельно. Еще нейросети хороши в редактуре текстов на иностранном языке: допустим, если нужно переписать его в определенной стилистике, найти и исправить ошибки. Само собой, результаты профессионалам зачастую приходится перечитывать, но даже с учетом этого нейросети значительно ускоряют работу. Однако ИИ помогает не только в преподавании, но и в изучении иностранного языка — и речь не о списывании домашних заданий. Так, некоторые студенты говорят, что сами генерируют в ChatGPT разные упражнения на отработку. Перед нейросетью не так стыдно за глупые ошибки, как перед преподавателем.

Восстание машин отменяется: где незаменим переводчик?

Сфера, в которой ИИ пока совсем не заменяет людей, — это устный, особенно синхронный, перевод. Есть устройства — наушники и мобильные приложения, — которые в целом позволяют синхронно переводить устную речь, но у них много ограничений: время работы без подзарядки не слишком большое, количество рабочих языковых пар ограничено, часто требуется доступ к интернету.

Синхронные же переводчики работают на заводах и за полярным кругом (где нет доступа к интернету), на заключении крупных сделок и на государственных переговорах (такую информацию нельзя отправлять в «облако» для обработки и перевода), с носителями самых разных языков и диалектов (которым нейросеть обучить попросту невозможно из-за недостатка данных для обучения), с очень специализированной информацией (с которой нейросети также не справляются из-за нехватки данных).

Пока ни сами синхронисты, ни заказчики перевода, ни разработчики нейросетей не представляют ситуации, в которой бизнесмены и политики будут готовы доверить эту работу ИИ. Потому что синхронист — это не просто человек, который «перекладывает» информацию с одного языка на другой. Он обеспечивает взаимодействие представителей разных культур, сглаживает острые углы, учитывает особенности восприятия информации людьми из разных стран. А еще — подписывает соглашение о неразглашении услышанной на переговорах информации.

Если же смотреть более широко, то ИИ определенно меняет переводческую профессию — сегодня нейросети очень хорошо умеют переводить стандартизированные тексты (например, юридической или экономической тематики). В этом случае от человека требуется постредактура — вычитка текста, исправление неточностей и устранение следов машинного перевода. Однако в переводе художественной литературы ИИ пока не может заменить человека: все-таки передача эмоций, игры слов, настроения текста — работа и основная ценность профессиональных переводчиков.

Нейросети на древнеегипетском

Иногда возникают вопросы: может ли ИИ помочь в работе с малоизученными диалектами языка или малыми языками? Да, может! На том этапе, когда тексты на этих малых языках начинают оцифровывать. Это очень помогает людям, изучающим их: работа с бумажным словарем отнимает намного больше времени, чем работа с электронным. Например, в Google Translate недавно добавили 110 новых языков, в их числе — языки России (башкирский, бурятский, крымско-татарский, коми, осетинский, удмуртский, чеченский, чувашский, чукотский, якутский).

Таких прецедентов, чтобы ИИ помог расшифровать иероглифы или восстановить звучание древней речи, пока не было. Но если исходить из того, что человеческий язык — это система, подчиняющаяся определенным лингвистическим законам (которые можно формализовать и записать в понятной для ИИ форме), можно предположить, что нейросети в теории способны помочь в расшифровке текстов на таких языках.

Вот что говорит об этом филолог Валерий Шульгинов, научный редактор книг Стивена Пинкера:

«Плюс нейросетевого подхода в том, что искусственный интеллект может увидеть закономерности там, где их не видит человек. Он знает множество дисциплин и способен соединить вещи, которые в сознании человека не соединяются. Поэтому все зависит от объема данных, который есть у нейросети.

Простой пример — эволюция языков. Например, есть губно-губные и губно-зубные согласные. Звук [п] — губно-губной. Звук [ф] — губно-зубной, ведь мы используем не только губы, но и зубы при его артикуляции. И ученые предполагают, что развитие последних звуков связано с переходом от собирательства к сельскому хозяйству. Пища стала мягче, изменился прикус — и появился новый тип звука.

И эта группа согласных стала расширяться. Что это доказывает? То, что язык тесно связан с географией и образом жизни людей. Все это влияет на артикуляцию. Так, на развитие тоновых языков мог повлиять климат: при повышенной влажности возникают интонации. В сухом климате интонировать же, наоборот, трудно.

Иными словами — чем больше объем оригинальных источников, тем проще найти закономерности. Но не стоит воспринимать ИИ как волшебную палочку».

🤔 Ранее «Нож» рассказывал, понимает ли ИИ человеческий язык и как ученые пытаются ответить на этот вопрос.