Ученые создали переводчик с дореволюционного русского языка

Исследователи из новосибирского Института вычислительных технологий разработали алгоритм, который переводит дореволюционные тексты в современную орфографию. Об этом пишет «Наука в Сибири».

Система будет выполнять работу редакторов и даст ученым дополнительные инструменты для анализа текстов. За основу программы взяли «Справочник по старой орфографии русского языка» Павла Давыдова, проанализировавшего учебники, словари и справочники, изданные в старой орфографии до 1917 года.

В дореволюционном правописании можно выделить несколько групп слов: они характеризуются устаревшими морфемами и морфологическими признаками. Исследователи сопоставили устаревшее и современное написание для каждой из групп, нашли закономерности и описали правила перевода.

Иллюстрация: sbras.info

Сложность заключалась в том, что  до середины XX века орфография русского языка не была официально утверждена.

«До революции появлялись орфографические справочники, на их основании писались гимназические грамматики, но нормы не были кодифицированы. Декрет Совета народных комиссаров от 10 октября 1918 года „О введении новой орфографии“ был весьма краток. Например, вышло так, что ижица вообще не была упомянута», — говорит один из авторов проекта Владимир Барахнин.

Пока что программа не может переводить случаи, которых нет в справочниках, но ученые продолжат работу по выявлению таких незафиксированных правил, чтобы решить эту задачу.