Физики из лаборатории методов анализа больших данных в НИУ ВШЭ и IT-специалисты из «Яндекса» разрабатывают модели машинного обучения для поиска аномалий в данных Большого адронного коллайдера (БАК). Речь идет о пока еще неизвестных процессах и частицах. В частности — темной материи.
Об этом в интервью «Хайтек» заявил заведующий лабораторией Андрей Устюжанин.
По его словам, аномалии в БАК — это открытия, которые не укладываются в стандартные представления о том, как распадаются частицы после столкновения протонов.
У ученых есть проблема — в ходе сбора и обработки информации измерения могут быть искажены. Тогда появляются аномалии, не связанные с физическими процессами.
Чтобы отсечь их, ученые создают специальные системы контроля качества данных на основе искусственного интеллекта. Они бывают двух типов.
Он вместе с коллегами разработал методы, которые объединяют особенности сразу двух подходов. Для этого ученые построили генеративные модели аномальных примеров.
Такие состязательные сети помогут восстанавливать примеры аномалий, помеченных как отрицательные, и формировать дополнительную выборку. Благодаря этому повысится эффективность классификатора.