09/04/2025 13:23
Полгода работы за минуту: российские ученые научили ИИ расшифровывать спектры
Рентгеновская спектроскопия поглощения — родина из самых мощных инструментов изучения вещества. Однако до сих пор расшифровка спектров напоминала детектив с открытым финалом: ученые тратили месяцы на интерпретацию данных, полагаясь на опыт, интуицию и сложные расчеты. Теперь этот процесс занимает всего несколько минут благодаря разработке исследователей.
Если Россия — родина слонов, то Ростов-на-Дону по праву может называться родиной рентгеновской спектроскопии. Чтобы изучать мельчайшие детали строения вещества, ученые используют мощнейшие источники рентгеновского излучения. Как правило, «чем меньше объект, тем больше микроскоп» — потому по всему миру люди строят монструозные синхротроны и лазеры на свободных электронах чтобы узнать мельчайшие детали строения и функционирования вещества. Эти установки, яркость которых сравнима с "миллионом Солнц", позволяют "просветить" материал и по его отклику, «тени», определить расположение атомов, их химическое состояние и другие ключевые параметры — это и зовется рентгеновской спектроскопией поглощения.
«Так устанавливаются важнейшие детали строения и функционирования самых разных материалов и веществ, от активных центров энзимов и ферментов, лежащих в основе всего живого, до особенностей структуры материальной базы микроэлектроники или механизмах работы и деградации катализаторов, веществ на порядок ускоряющих химические реакции и потому лежащих в основе практически всей промышленной химии», – рассказал лаборант-исследователь фронтирной лаборатории рентгеноспектральной нанометрологии МИИ ИМ ЮФУ Богдан Проценко.
Однако, есть нюансы: даже имея рабочую установку и успешно измерив на ней данные для своих объектов, ученые часто не знают наверняка, что с этим делать дальше, поскольку на данный момент не существует (и вряд ли будет, по крайней мере в привычном для нас понимании) такой формулы, по которой можно однозначно расшифровать спектр рентгеновского поглощения. Исследование превращается в детектив, причем с открытым концом. Действительно, расшифровка таких данных — это искусство, часто требующее помимо специфичных знаний в этой области прибегать еще и к помощи квантовой химии, кристаллографии, смежных методик и другим сферам научных знаний для получения наилучших результатов. Но так было до текущего момента!
В недавнем исследовании ученые Международного исследовательского института интеллектуальных материалов ЮФУ совместно с зарубежными коллегами, сделали первые шаги к тому, чтобы автоматизировать и стандартизировать анализ данных рентгеновской спектроскопии поглощения, сделав их анализ быстрым, точным и доступным каждому.
Так, новый подход ускоряет полгода ручной работы до пары минут благодаря машинному обучению, а также превращает привычные выводы из разряда «ну скорее всего степень окисления активного центра катализатора больше +3 но меньше +5, но это не точно» в «степень окисления +4.5 с ошибкой такой-то». Примечательно, что разработанный код открыт и реализован в виде наглядных «ноутбуков», и чтобы применять машинное обучение в этой обалсти, теперь не нужно даже уметь программировать.
«Используя машинное обучение на основе фреймворка PyFitIt (который уже много лет разрабатывается в нашем Институте), а также исчерпывающие базы данных (пока только для хрома и ванадия, но даже это существенно — например, соединения хрома лежат в основе катализатора Филлипса, с помощью которого производится половина всего полиэтилена в мире), мы добились высококачественных и воспроизводимых результатов», – отметил Богдан Проценко.
В машинном обучении и науке о данных, разделах пресловутого искусственного интеллекта, данные и их качество порой значат больше самих алгоритмов ИИ, и потому для получения надёжных и воспроизводимых результатов была проделана кропотливая работа по сбору качественных данных: специально для этого были собраны качественные коммерческие и специально синтезированы новые соединения-эталоны, покрывающие все возможные комбинации и локального окружения, и степеней окисления, и межатомных расстояний. Для каждого образца на одном и том же синхротроне единообразно измерен спектр, причем структура подтверждена целым набором методов: дифракцией, ядерным магнитным резонансом, инфракрасной спектроскопией – словом, проделан большой объем аккуратной рутинной работы с привлечением множества различных методик.
Все эти данные собраны в единую базу данных, на которой обучены алгоритмы ИИ. Для них реализовано все необходимое, по последнему писку моды в машинном обучении: отбор, аугментация и фильтрация данных, необходимая для спектров предобработка, выбор признаков, перекрёстная валидация и сравнение алгоритмов, оценка ошибок и проверка возможности экстраполяции найденных зависимостей – и все это полностью автоматизировано. Кроме того, в работе впервые предложена процедура совместного анализа соседних краев поглощения для разных элементов ("два в одном"), увеличивающая точность анализа.
Все это упаковано в удобную user-friendly оболочку, готовую к анализу неизвестны спектров. Практическая ценность подхода продемонстрирована на примере интересного нанесённого ванадиевого катализатора для окислительного дегидрирования, где ученые смогли установить механизм его деградации, что иллюстрирует простоту и эффективность нового подхода.
Результаты исследования изложены в журнале первого квартиля «The Journal of Physical Chemistry C» Американского химического сообщества (ACS).
Постоянный адрес новости:
http://news.rufox.ru/texts/2025/04/09/382333.htm
Источник:
Чтобы оставить комментарий, вам необходимо авторизоваться! Если у Вас еще нет аккаунта, то Вы можете получить его прямо сейчас!