Ведущий научный сотрудник лаборатории теории и оптимизации химических и технологических процессов ТюмГУ Максим Молокеев известен как ученый-кристаллограф. Он занимается поиском новых структур монокристаллов и порошков, анализирует взаимосвязи их строения, физические, химические и другие свойства.
«В ТюмГУ есть сильная группа химиков, которые синтезируют уникальные соединения. Мой опыт структурной характеризации кристаллов очень полезен коллегам, — рассказал исследователь. — Однако в 2023 году я начал работать в лаборатории, где в большей степени пригодились накопленные знания в области машинного обучения».
Подразделение возглавляет Андрей Елышев, руководитель стратегического проекта «Природовдохновленный инжиниринг» программы «Приоритет 2030». Одно из научных направлений — повышение эффективности протекания различных процессов, в том числе с помощью катализаторов. Исследователи разрабатывают новые подходы переработки неклассического углеводородного сырья: например, попутного нефтяного и природного газа.
Ученый Максим Молокеев уверен, в масштабировании исследований и проверке выводов могут помочь именно цифровые инструменты.
Модели машинного обучения для переработки углеводородов
«В цифру переводятся экспериментальные параметры, например, давление, скорость потока, температура, химический состав и т. д., а также истинное, измеренное свойство. — объяснил ученый. — После этого система (методы машинного обучения с учителем) обучается по собранным данным. Анализируется, какие есть взаимосвязи, а затем создаются специальные модели — с их помощью можно улучшать процесс прохождения реакций или даже прогнозировать свойства эксперимента, который еще не проводили».
Правильность цифровой модели проверяется от обратного — на реальном кейсе. Если смоделированные и действительные результаты сходятся, то и правила (взаимосвязи), которые были выведены с помощью машинного обучения, адекватны, их можно и нужно учитывать.
Цифровизация в перспективе несет экономическую выгоду, но на первоначальных этапах сопровождается трудоемкой работой по сбору данных, которую важно максимально автоматизировать.
«Мы построили три модели на основе информации, собранной полностью в лаборатории. Это очень вдохновило коллег, показало, что можем соревноваться с передовыми зарубежными группами. Часть полученных результатов опубликована в высокорейтинговых научных журналах», — отметил Максим.
«В ТюмГУ есть сильная группа химиков, которые синтезируют уникальные соединения. Мой опыт структурной характеризации кристаллов очень полезен коллегам, — рассказал исследователь. — Однако в 2023 году я начал работать в лаборатории, где в большей степени пригодились накопленные знания в области машинного обучения».
Подразделение возглавляет Андрей Елышев, руководитель стратегического проекта «Природовдохновленный инжиниринг» программы «Приоритет 2030». Одно из научных направлений — повышение эффективности протекания различных процессов, в том числе с помощью катализаторов. Исследователи разрабатывают новые подходы переработки неклассического углеводородного сырья: например, попутного нефтяного и природного газа.
Ученый Максим Молокеев уверен, в масштабировании исследований и проверке выводов могут помочь именно цифровые инструменты.
Модели машинного обучения для переработки углеводородов
«В цифру переводятся экспериментальные параметры, например, давление, скорость потока, температура, химический состав и т. д., а также истинное, измеренное свойство. — объяснил ученый. — После этого система (методы машинного обучения с учителем) обучается по собранным данным. Анализируется, какие есть взаимосвязи, а затем создаются специальные модели — с их помощью можно улучшать процесс прохождения реакций или даже прогнозировать свойства эксперимента, который еще не проводили».
Правильность цифровой модели проверяется от обратного — на реальном кейсе. Если смоделированные и действительные результаты сходятся, то и правила (взаимосвязи), которые были выведены с помощью машинного обучения, адекватны, их можно и нужно учитывать.
Цифровизация в перспективе несет экономическую выгоду, но на первоначальных этапах сопровождается трудоемкой работой по сбору данных, которую важно максимально автоматизировать.
«Мы построили три модели на основе информации, собранной полностью в лаборатории. Это очень вдохновило коллег, показало, что можем соревноваться с передовыми зарубежными группами. Часть полученных результатов опубликована в высокорейтинговых научных журналах», — отметил Максим.
Цифровой двойник
Цифровые инструменты могут использоваться для создания прообразов каких-то действительных объектов, их свойств и происходящих реакций. Одно из направлений деятельности Научного центра мирового уровня в Тюменском государственном университете — разработка цифровых двойников пластовых пород. Исследователи занимаются моделированием процессов, которые происходят в нефтеносных пластах на микро- и наноуровне.
Сейчас Молокеев работает над моделью машинного обучения, которая строит прогноз графиков относительной фазовой проницаемости. Такие графики описывают способность породы пропускать различные жидкости как, например, нефть или вода в смеси. Данные обрабатываются и представляются так, чтобы перевести их в векторы малой размерности — цифровой материал для прогнозирования. С их помощью исследователи представят, насколько будет эффективна добычи нефти при разных условиях.
«Мы используем метод неотрицательного матричного разложения, который относится к методам машинного обучения без учителя. Они позволяют эффективно сжать размерность пространства параметров в латентное намного меньшей размерности пространство почти без потери информации. Иными словами, любой график или изображение (другой сложный объект) можно представить, например, тремя в случае графика или десятком чисел в случае изображения. Это помогает существенно снизить сложность модели дальнейшего обучения, выбросить несущественные признаки, повысить стабильность прогноза по новым данным и иногда даже точность», — объясняет Максим.
Модель тюменских ученых апробирована, она показала высокие возможности прогноза на небольшой группе кернов. Сейчас необходимо увеличить объем данных, чтобы построить рабочую модель и определить еще не учтенные погрешности.
«Ключевая идея работы заключается не в использовании каких-то особых инструментов машинного обучения — они самые обычные и известные — а в том, что мы предложили принципиально новую идею для сбора данных и построения модели», — заключил исследователь.
Цифровые инструменты могут использоваться для создания прообразов каких-то действительных объектов, их свойств и происходящих реакций. Одно из направлений деятельности Научного центра мирового уровня в Тюменском государственном университете — разработка цифровых двойников пластовых пород. Исследователи занимаются моделированием процессов, которые происходят в нефтеносных пластах на микро- и наноуровне.
Сейчас Молокеев работает над моделью машинного обучения, которая строит прогноз графиков относительной фазовой проницаемости. Такие графики описывают способность породы пропускать различные жидкости как, например, нефть или вода в смеси. Данные обрабатываются и представляются так, чтобы перевести их в векторы малой размерности — цифровой материал для прогнозирования. С их помощью исследователи представят, насколько будет эффективна добычи нефти при разных условиях.
«Мы используем метод неотрицательного матричного разложения, который относится к методам машинного обучения без учителя. Они позволяют эффективно сжать размерность пространства параметров в латентное намного меньшей размерности пространство почти без потери информации. Иными словами, любой график или изображение (другой сложный объект) можно представить, например, тремя в случае графика или десятком чисел в случае изображения. Это помогает существенно снизить сложность модели дальнейшего обучения, выбросить несущественные признаки, повысить стабильность прогноза по новым данным и иногда даже точность», — объясняет Максим.
Модель тюменских ученых апробирована, она показала высокие возможности прогноза на небольшой группе кернов. Сейчас необходимо увеличить объем данных, чтобы построить рабочую модель и определить еще не учтенные погрешности.
«Ключевая идея работы заключается не в использовании каких-то особых инструментов машинного обучения — они самые обычные и известные — а в том, что мы предложили принципиально новую идею для сбора данных и построения модели», — заключил исследователь.
Один из самых цитируемых в стране
Максим Молокеев входит в число самых высокоцитируемых ученых физиков России и в топ-10 химиков страны.
«Первое в полной мере отражает действительность, поскольку я физик, который опубликовал достаточно большое количество работ с высоким индексом цитируемости. К химии имею опосредованное отношение — занимаюсь структурной характеризацией химических веществ, но не синтезом, реакциями и т. п. Быть самым высокоцитируемым значит, что ваши работы активно читаются и на них ссылаются другие исследователи. В мире науки это то же самое, что поставить „лайк“ в соцсетях», — поделился исследователь.
Важная часть работы ученого в ТюмГУ — передача опыта коллегам по лаборатории, развитие их навыков и повышение квалификации в области машинного обучения.
Максим Молокеев входит в число самых высокоцитируемых ученых физиков России и в топ-10 химиков страны.
«Первое в полной мере отражает действительность, поскольку я физик, который опубликовал достаточно большое количество работ с высоким индексом цитируемости. К химии имею опосредованное отношение — занимаюсь структурной характеризацией химических веществ, но не синтезом, реакциями и т. п. Быть самым высокоцитируемым значит, что ваши работы активно читаются и на них ссылаются другие исследователи. В мире науки это то же самое, что поставить „лайк“ в соцсетях», — поделился исследователь.
Важная часть работы ученого в ТюмГУ — передача опыта коллегам по лаборатории, развитие их навыков и повышение квалификации в области машинного обучения.
Источник: Управление стратегических коммуникаций ТюмГУ