ИИ научился находить новые знания в миллионах научных статей

Ученые из Национальной лаборатории имени Лоуренса в Беркли заявляют, что искусственный интеллект совсем скоро сможет сам совершать научные открытия. Они создали алгоритм, который умеет извлекать новые знания из научных статей.

Исследователи собрали 3,3 млн публикаций по материаловедению, которые были опубликованы в 1000 журналах с 1922 по 2018 годы, и скормили их ИИ под названием Word2vec. Алгоритм выявил 500 000 разных слов, а затем превратил каждое в массив из 200 чисел, или в 200-мерный вектор — так он установил взаимосвязи между ними.

При этом ученые отмечают, что изначально у ИИ не было никаких базовых представлений о материаловедении, но анализ отдельных терминов и понятий позволил ему понять смысл текстов. Алгоритм самостоятельно узнал, что такое кристаллическая решетка и таблица Менделеева.

ИИ использовал статьи, чтобы устранить пробелы в научных знаниях, а затем предложил несколько вариантов новых термоэлектрических материалов. Исследователи выбрали 10 самых перспективных — оказалось, что все они превышают средние значения по отрасли.

Затем ученые решили проверить, может ли алгоритм делать научные прогнозы. Они ограничили ему выборку статей, загрузив тексты до определенного года. ИИ смог предсказать появление новых материалов — большая часть результатов подтвердилась в более поздних публикациях.

Исследователи уверены, что Word2vec и похожие на него алгоритмы облегчат ученым работу с массивами данных и помогут людям делать научные открытия. Если бы такой ИИ существовал 50 лет назад, очень многие важные материалы можно было бы создать раньше.