Что такое языковая сложность и как она связана с изучением языков

Русский язык очень простой, а китайский гораздо сложнее? Или наоборот? А может быть, они одинаково сложны? Что значит «сложный» язык и чем сложность языка как системы отличается от сложности его изучения взрослым человеком, рассказывает лингвист Иван Неткачев.

Люди часто говорят: «Этот язык простой, а этот — сложный», «Я никогда не смогу выучить этот язык», «Не понимаю, как можно всё это запомнить». Или же: «Это простой язык, там всё — как в русском, только слова другие». По факту речь идет не о простых или сложных языках, но о сложности языков для выучивания — причем для выучивания взрослым человеком. Ведь для маленьких детей, по сути, все языки одинаково простые: если ребенок здоров и постоянно находится в том или ином языковом сообществе, он в любом случае становится «идеальным» носителем.

Тем не менее сложность языка как системы и сложность выучивания языка тесно связаны. Если вы вдруг захотите выучить турецкий, вам придется, например, учить все турецкие падежные показатели, которые совсем не такие, как в русском. С другой стороны, если вы захотите выучить индонезийский язык, то такой проблемы не возникнет, потому что в индонезийском падежей нет. Имена там совсем не изменяются.

Поэтому для начала давайте разберемся, что значит именно сложность языка как системы, или языковая сложность.

Языковая сложность

Интуитивно понятно, что системы могут быть более или менее сложными. В 2019 году компьютеры устроены сложнее, чем в 1999-м. Но как измерить сложность того или иного объекта?

Типолог Эстен Даль предлагает использовать понятие колмогоровской сложности: сложность объекта определяется длиной кратчайшего описания этого объекта, или, иначе говоря, кратчайшего алгоритма, который этот объект генерирует. В качестве примера рассмотрим две строки:

(1) 185185185

(2) 185718571857

Очевидно, что в первой строке трижды повторяется число 185, а во второй — 1857. Мы можем заменить каждую строку более компактным описанием — просто указать, какой объект и сколько раз повторяется:

(1) (185, 3)

(2) (1857, 3)

Но описание второй строки в любом случае длиннее, чем описание первой, потому что повторяющийся объект сам по себе длиннее и его нельзя дополнительно сократить. Это значит, согласно данному выше определению, что вторая строка сложнее первой.

Читайте также

Привет, земляне: кто изучает «инопланетные» языки и зачем это нужно

Примерно так же можно измерить сложность отдельных языковых объектов. Чтобы привести самый простой пример, вернемся к падежам. В русском языке, согласно русской корпусной грамматике, шесть основных падежей:

  1. Именительный
  2. Родительный
  3. Дательный
  4. Винительный
  5. Творительный
  6. Предложный

(Мы намеренно не рассматриваем особые случаи вроде второго родительного падежа, так как «каждая из этих форм свойственна ограниченному кругу слов и встречается в особых контекстных условиях».)

Индонезийский язык, в отличие от русского, падежей не имеет вообще, у него в целом бедная морфология. Существительные не могут изменяться — достаточно сравнить следующие примеры с их русскими переводами:

(1) Ivan melihat ayam
Иван видеть курица
«Иван видит курицу».

(2) ayam melihat Ivan
курица видеть Иван
«Курица видит Ивана».

(3) ayam Ivan
курица Иван
«Курица Ивана (то есть курица, принадлежащая Ивану)».

Из примеров (1) и (2) видно, что в индонезийском языке нет аналогов винительному или именительному падежу, а из примера (3) — что в нем нет аналога родительному. Во всех трех случаях существительные не изменяются.

С другой стороны, есть языки, в которых гораздо больше падежей, чем в русском. Например, в нахско-дагестанских языках, на которых говорят в Дагестане.

В мегебском языке 8 грамматических падежей и 30 пространственных.

Пространственные падежи выражают положение объектов в пространстве (в русском языке для этого используются предлоги и наречия).

(1) nuša ustuj-šu-b kabiʔira
мы стол-рядом-3 сидим
«Мы сидим рядом со столом».

(2) ustuj-če-b ʁadara leb
стол-на-3 поднос есть
«Поднос на столе».

(Для простоты деление на морфемы дается только для существительных в пространственных падежах; «3» значит третий именной класс, что-то в духе русского среднего рода.)

В данном случае мы проделали очень простую процедуру: посчитали падежи и сравнили их количество. Но нужно понимать, что это только один из многих аспектов языковой сложности, даже среди явлений, связанных с падежной системой.

Недостаточно просто иметь список падежей, чтобы правильно их употреблять. К примеру, чтобы правильно описать грамматику русского языка, нам нужно будет еще добавить правила, по которым падежи сочетаются с разными предлогами.

Скажем, предлог под требует предложного падежа: под дом-ом. Предлог у требует родительного: у дом-а. А предлог к и вовсе требует дательного: к дом-у. Всю эту информацию тоже нужно как-то задать в грамматике, а значит, ее общая сложность возрастет.

Эволюция языковой сложности

Сложность отдельных аспектов грамматики может меняться со временем. Грамматические паттерны могут становиться более сложными — и в связи с этим Эстен Даль вводит понятие созревания (maturation).

Читайте также

7 мифов о языках и их научное разоблачение

Как понять, что один паттерн более зрелый, чем другой? Даль предлагает начать с простой системы — игры в шахматы. У этой системы есть конечное количество состояний: каждое из них можно описать, определив позицию каждой фигуры на игровой доске размером 8×8. При этом каждая игра начинается с одного и того же состояния: белые и черные фигуры занимают по два ряда в строго определенной последовательности. За каждым неначальным состоянием игры стоит определенная история или даже несколько возможных историй: к одному и тому же состоянию часто можно прийти разными путями. Тогда эволюционная сложность определенного состояния в игре — это минимальное время (в данном случае — число ходов), которое необходимо, чтобы достичь этого состояния.

Можно попробовать перенести эту логику на язык: представить, что грамматика — это тоже система с конечным числом состояний. В таком случае зрелый языковой паттерн — это такой паттерн, который приходит на замену другому паттерну, существовавшему в предыдущем состоянии языка, то есть в языке-предке.

С понятием созревания тесно связано понятие грамматикализации. Грамматикализация — это создание грамматических значений из лексических. То есть, грубо говоря, грамматика появляется из «обычных» слов, как они задаются в словаре. При грамматикализации слова меняют свое лексическое значение, а также могут употребляться в новых контекстах. При этом часто (но не обязательно) происходит изменение в форме слова: постепенно исходная лексическая единица «затирается», сокращается и становится неузнаваемой. Она и вовсе может потерять возможность употребляться независимо, то есть стать аффиксом при другом слове. (Аффикс — это, например, суффикс или приставка.) Но, как пишет типолог Берндт Хайне, определяющими для грамматикализации являются изменения в значении — изменений в форме может и не быть.

Приведем простой пример, с которым все знакомы. Одно из английских будущих времен образуется с помощью вспомогательного глагола will. Можно вспомнить строчки из известной песни Джона Леннона: And the world will be as one («И мир станет единым целым»). Но при этом глагол will имеет и собственное значение, которое сейчас, может быть, несколько устарело, — в других контекстах он может значить «хотеть, желать». Есть, например, знаменитая цитата из Шопенгауэра: «Человек может делать то, что он желает, но не может желать, что ему желать». Один из возможных ее переводов на английский язык: Man can do what he wills but he cannot will what he wills.

То есть мы видим, что в некоторых конструкциях — как в строчке And the world will be as one — глагол will потерял исходное значение: ведь здесь речь не о том, что мир чего-то хочет, а о том, что он чем-то станет. Это значит, что глагол «хотеть» грамматикализовался в показатель будущего времени. У него поменялось значение, и он получил возможность употребляться в новых синтаксических конструкциях (то есть у него поменялась дистрибуция). К тому же не стоит забывать, что очень часто вспомогательный глагол полностью не произносится. В той же песне Леннона есть место, где глагол will произносится в усеченной форме: I hope some day you’ll join us («Я надеюсь, когда-нибудь ты присоединишься к нам»). То есть, в принципе, можно говорить об усечении, затирании формы этого глагола, что тоже признак грамматикализации.

Может быть интересно

«Литература — это не просто тексты, а тексты во взаимодействии со средой». Роман Лейбов — о Тартуской школе и точных методах в литературоведении

Возвращаясь к языковой сложности, можно сказать, что английское будущее время с will — зрелый феномен согласно данному выше определению. В более старом состоянии английского языка глагол will имел другие свойства и не был грамматикализован — то есть за английским будущим временем уже стоит некоторая история.

Эстен Даль предлагает следующую шкалу, отражающую зрелость языковых паттернов:

(i) свободное употребление -> (ii) употребление в аналитических конструкциях -> (iii) аффикс -> (iv) фузия

Эта шкала требует пояснения. Ее начало — свободное употребление — соответствует тому состоянию, когда слово употребляется просто как лексическая единица. То есть как глагол will со значением «хотеть». Этапу (ii) хорошо соответствует английское будущее время: слово «аналитический» значит, что грамматическое значение выражается отдельным словом, а не, например, суффиксом. На этапе (iii) исходная единица теряет самостоятельность и становится аффиксом в другом слове. На этапе (iv) происходит «склеивание» нескольких аффиксов в один — в итоге один и тот же аффикс имеет несколько грамматических значений. Например, в русском языке окончания глаголов обозначают одновременно и лицо, и число: я дела-ю, мы дела-ем, вы дела-ете и т. д. На этом этапе языковой паттерн достигает максимальной зрелости.

Языковая сложность и сложность для изучения

Как пишет Даль, зрелые языковые паттерны часто оказываются самыми сложными для выучивания — если речь идет о выучивании взрослым человеком. На финальном этапе созревания возрастает число нерегулярных явлений, для которых лингвисту нужно заводить отдельные правила — а тому, кто учит язык, приходится запоминать гораздо больше закономерностей. Пример такой сложной системы — русское именное словоизменение, то есть то, как разные имена изменяются по падежам и числам. К сожалению, оно не вполне работает по схеме «основа слова + показатель падежа». В основах могут возникать различные чередования, к тому же нетривиальна постановка ударения. Чтобы как-то описать эту сложную систему, русскому лингвисту А. А. Зализняку пришлось написать целую книгу.

То есть сложность паттерна определяется тем, сколько информации нужно для его минимального описания.

Соответственно, чем больше информации нужно для его описания, тем больше памяти и когнитивных усилий нужно для его заучивания.

Все языки одинаково сложные?

На протяжении большей части XX века лингвисты в целом считали, что все языки одинаково сложные. Это было почти аксиомой, чем-то само собой разумеющимся, не требующим доказательства. Вот что, к примеру, можно было прочесть в учебнике Чарльза Хоккета, известного и влиятельного лингвиста:

«…судя по всему, общая сложность всех языков — если считать и морфологию, и синтаксис — одна и та же. Это неудивительно, потому что перед всеми языками стоят задачи одинаковой сложности, и то, что не получается выразить морфологией, выражается синтаксисом. Язык сок-фокс имеет более сложную морфологию, чем английский язык, — но тогда он должен иметь более простой синтаксис; и это действительно так».

Чарльз Хоккет. Курс современной лингвистики. Перевод Ивана Неткачева. Источник

То есть существовало представление о некоем балансе: у всех языков одинаковая «общая» сложность, но она может различаться на разных уровнях, и если на одном уровне сложность низкая, то на другом уже должна быть высокая.

На самом деле у этого представления есть скорее идеологические мотивы — так это объяснил лингвист Дэвид Гил. В головах у лингвистов существовала такая связка: сказать, что один язык сложнее другого, — значит сказать, что первый язык в каком-то смысле превосходит второй. А это примерно то же самое, что сказать, будто одни этнические группы в чем-то превосходят другие, то есть сделать расистское утверждение. Все звенья в этой цепи рассуждений следовало бы подвергнуть сомнению: почему мы считаем, что если язык сложнее, то он лучше? И почему язык должен отражать какие-то биологические свойства его носителей?

Но были и исключения — например, американский лингвист и антрополог Эдвард Сепир. Он, как пишет Джеффри Сэмпсон, утверждал, что языки могут быть и простыми, и сложными. При этом простые и сложные языки встречаются во всех обществах вне зависимости от уровня их культурного и социального развития. Это значит, что английский язык вполне может оказаться проще, чем язык австралийских аборигенов.

К началу XXI века представление об одинаковой языковой сложности для всех языков всё чаще ставится под сомнение. В частности, типолог Джоханна Николс измерила языковую сложность для 68 языков. На этих языках говорят в разных частях Земли, то есть ее выборка охватывает не только Европу; к тому же это языки из разных языковых семей.

Измерить сложность языка «целиком», согласно Николс, значит измерить сложность множества разных паттернов на разных уровнях языка.

Ее работа — только первый шаг на пути к достижению этой цели. Она взяла по нескольку явлений для каждого уровня: фонологии, морфологии, синтаксиса, лексики. Каждый паттерн получил некоторый рейтинг: например, если оценивалось количество гласных фонем, то больший рейтинг получает тот язык, в котором гласных фонем больше. Потом из отдельных оценок составлялся общий рейтинг: каждому языку было приписано некоторое числовое значение.

Как и ожидалось, оценки Николс показывают, что языки имеют различную сложность. Самую высокую сложность среди языков ее выборки имеет ингушский (нахско-дагестанская семья), самую низкую — баскский (изолят). Русский язык имеет сложность чуть ниже среднего, рядом с ним можно найти хинди (индоевропейская семья) и венгерский (уральская семья).

Что влияет на языковую сложность?

Языковая сложность вовсе не обязана всё время расти. Языковые паттерны могут сохранять одну и ту же сложность на протяжении длительного времени или могут вовсе исчезнуть.

В частности, на языковую сложность сильно влияют языковые контакты. К примеру, языки Юго-Восточной Азии часто имеют очень бедную морфологию — или вовсе ее не имеют. Такие языки называются изолирующими. Можно считать, что их изолирующий профиль поддерживается их соседством и взаимодействием.

Читайте также

Как и зачем возрождают мертвые языки сегодня

С другой стороны, есть обратный пример. Малайский язык очень похож на индонезийский (можно сказать, что это диалекты одного языка). По примерам выше мы уже видели, что в индонезийском/малайском языке морфологии очень мало. Но есть особая разновидность индонезийского/малайского — шри-ланкийский малайский. Он попал под сильное влияние тамильского и сингальского языков: британцы выселили некоторое число малайцев на территорию нынешней Шри-Ланки.

Тамильский и сингальский имеют сравнительно развитую морфологию, и под их влиянием шри-ланкийский малайский в считаные столетия развил падежную систему буквально из ничего.

В обычном малайском никаких падежей нет; в шри-ланкийском малайском они грамматикализовались из бывших предлогов.

В итоге за языками, которые мы учим, обычно стоит долгая история изменений. Эти изменения могут происходить по причинам исключительно внутренним («так нужно языку»), а могут — по внешним (языковые контакты). И вся эта сложная история будет играть значительную роль в том, сколько времени и сил вы потратите на занятия, — а также в том, насколько хорошо вы в итоге овладеете языком.