Скачать презентацию Научный сервис в сети Интернет 2017 18 — Скачать презентацию Научный сервис в сети Интернет 2017 18 —

43d36c046e196ba72922cc8a9b90fc18.ppt

  • Количество слайдов: 21

Научный сервис в сети Интернет 2017 18 - 23 сентября 2017 года ВЕБ-ПОРТАЛ ИНТЕЛЛЕКТУАЛЬНОЙ Научный сервис в сети Интернет 2017 18 - 23 сентября 2017 года ВЕБ-ПОРТАЛ ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЫ ПО ФИЗИЧЕСКОЙ ХИМИИ РАДИКАЛЬНЫХ РЕАКЦИЙ В ЖИДКОЙ ФАЗЕ А. И. Прохоров 1, В. Е. Туманов 3, Е. С. Амосова 1, Д. А. Варламов 1, 2, П. К. Берзигияров 1 1 Институт проблем химической физики РАН 2 Институт экспериментальной минералогии РАН 3 МБОУ СОШ № 21 г. Ногинск Московская область

ВЕБ-ПОРТАЛ СИСТЕМЫ НАУЧНОЙ ОСВЕДОМЛЕННОСТИ ПО ФИЗИЧЕСКОЙ ХИМИИ РАДИКАЛЬНЫХ РЕАКЦИЙ http: //lion. icp. ac. ru ВЕБ-ПОРТАЛ СИСТЕМЫ НАУЧНОЙ ОСВЕДОМЛЕННОСТИ ПО ФИЗИЧЕСКОЙ ХИМИИ РАДИКАЛЬНЫХ РЕАКЦИЙ http: //lion. icp. ac. ru

ЭЛЕКТРОННЫЕ РЕСУРСЫ СИСТЕМЫ, СОЗДАННЫЕ В ИПХФ РАН ПОД НАУЧНЫМ РУКОВОДСТВОМ ПРОФ. Е. Т. ДЕНИСОВА ЭЛЕКТРОННЫЕ РЕСУРСЫ СИСТЕМЫ, СОЗДАННЫЕ В ИПХФ РАН ПОД НАУЧНЫМ РУКОВОДСТВОМ ПРОФ. Е. Т. ДЕНИСОВА Основой для разработки Интеллектуальной системы научной осведомленности по физической химии радикальных реакций стали собранные вручную электронные коллекции: ►Банк кинетических констант скорости радикальных жидкофазных реакций [Туманов В. Е. , Денисова Т. Г. , Денисов Е. Т. , Покидова Т. С. , Дроздова Т. И. Свидетельство о государственной регистрации базы данных № 2011620118. Дата приоритета 22. 12. 2010]. Накоплено более 30000 значений. ►Киоск данных по энергиям диссоциации связи органических соединений [Туманов В. Е. , Денисова Т. Г. , Денисов Е. Т. Свидетельство о государственной регистрации базы данных № 2011620117. Дата приоритета 22. 12. 2010]. Включает более 1000 объектов. ►База данных по энтальпиям образования радикалов и органических соединений [Туманов В. Е. , Денисова Т. Г. , Денисов Е. Т. Свидетельство о государственной регистрации базы данных № 20116. Дата приоритета 22. 12. 2010]. Содержит экспериментальные данные около 980 радикалов и порядка 3000 органических соединений.

ПРОЕКТЫ РФФИ, КАК ЭТАПЫ РАЗВИТИЯ СИСТЕМЫ 07 -07 -00343 -а, «Разработка экспертной системы оценки ПРОЕКТЫ РФФИ, КАК ЭТАПЫ РАЗВИТИЯ СИСТЕМЫ 07 -07 -00343 -а, «Разработка экспертной системы оценки реакционной способности молекул в радикальных реакциях» , 2007 -2008 годы 09 -07 -00297 -а, «Разработка и создание объектноориентированной системы научной осведомленности по физической химии радикальных реакций» , 2009 -2010 годы 15 -07 -08645 -a, «Создание интеллектуальной вебориентированной системы по физической химии радикальных реакций в жидкой фазе» , 2015 -2017 годы

ЦЕЛИ ПРОЕКТА 15 -07 -08645 -a Развитие экспертных подсистем с использованием онтологий и искусственный ЦЕЛИ ПРОЕКТА 15 -07 -08645 -a Развитие экспертных подсистем с использованием онтологий и искусственный нейронных сетей, создание подсистемы сбора данных, развитие подсистемы извлечения и хранения системы данных научной для интеллектуальной осведомленности по физической химии радикальных реакций*. * Туманов В. Е. , Прохоров А. И. , Лазарев Д. Ю. , Соловьева М. Е. Система научной осведомленности по физической химии радикальных реакций. // Информационные ресурсы России. 2010. No 5. С. 16 -21.

ЦЕЛИ ВНЕДРЕНИЯ ОНТОЛОГИЙ Расширение подсистемы хранения данных и знаний: ►Интеграция данных в единое семантически ЦЕЛИ ВНЕДРЕНИЯ ОНТОЛОГИЙ Расширение подсистемы хранения данных и знаний: ►Интеграция данных в единое семантически структурированное и организованное хранилища химических данных ►Возможность наполнение хранилища химических данных посредством автоматизированного поиска химических данных в области исследований радикальных реакций из открытых источников Интернет с последующей их обработкой, извлечением и сохранением. Расширение подсистемы взаимодействия с пользователем: ►Использование различных химических номенклатур названий химических соединений, различных наименований одних и тех же реакций, использование различных единиц количественных измерений значений и т. п. ; ►Осуществление запросов в системе на языке близком к естественному с оказанием помощи в формулировке запросов.

ОНТОЛОГИИ СИСТЕМЫ Были разработаны и внедрены Онтологии по следующим разделам химических знаний: • КИНЕТИКА ОНТОЛОГИИ СИСТЕМЫ Были разработаны и внедрены Онтологии по следующим разделам химических знаний: • КИНЕТИКА • ТЕРМОХИМИЯ Амосова Е. С. , Туманов В. Е. Представление химических реакций, реагентов и их термохимических свойств в интеллектуальной системе по физической химии радикальных реакций в жидкой фазе с использованием онтологической модели предметной области // Бутлеровские сообщения. 2014. T. 39. No 7. C. 39 -46 Амосова Е. С. , Берзигияров П. К. Разработка представления онтологической модели по физической химии радикальных реакций отношениями реляционной базы данных и реализация его в предметноориентированной системе научной осведомленности. Бутлеровские сообщения. 2016. Т. 45. № 1. С. 152 -158.

ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ БАЗОВЫХ ПОДКЛАССОВ ОНТОЛОГИИ РАДИКАЛЬНЫЕ РЕАКЦИИ В ЖИДКОЙ ФАЗЕ Жидкофазные радикальные реакции протекают ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ БАЗОВЫХ ПОДКЛАССОВ ОНТОЛОГИИ РАДИКАЛЬНЫЕ РЕАКЦИИ В ЖИДКОЙ ФАЗЕ Жидкофазные радикальные реакции протекают по разным механизмам, с участием различных реагентов и растворителей. В классе «радикальные реакции в жидкой фазе» определены подклассы: «реакции» (Reactions), «молекулы» (Molecules), «радикалы» (Radicals) и «растворители» (Solvents).

ОНТОЛОГИИ «РАДИКАЛЬНЫЕ РЕАКЦИИ В ЖИДКОЙ ФАЗЕ» Онтологическая модель “Кинетика” включает в себя около 100 ОНТОЛОГИИ «РАДИКАЛЬНЫЕ РЕАКЦИИ В ЖИДКОЙ ФАЗЕ» Онтологическая модель “Кинетика” включает в себя около 100 подклассов радикальных реакций, более 50 классов органических соединений и около 45000 свойств объектов (физико-химических свойств молекул, радикалов и радикальных реакций). Онтологическая модель “Термохимия” включает в себя 165 классов органических соединений и около 30 свойств данных и около 30000 свойств объектов. Онтологии разработаны с использованием средства проектирования онтологий Protégé (http: //protege. stanford. edu). Основная цель собственной разработки онтологий – возможность их сохранения в требуемом для системы виде (RDF triples) непосредственно в реляционной СУБД для объединения химических блоков данных системы в единое информационное хранилище.

ВНЕДРЕНИЕ ОНТОЛОГИЙ В СИСТЕМУ Онтологические модели были интегрированы в существующее хранилище данных. Разработанные модели ВНЕДРЕНИЕ ОНТОЛОГИЙ В СИСТЕМУ Онтологические модели были интегрированы в существующее хранилище данных. Разработанные модели онтологий были выгружены и сохранены в виде отдельной реляционной таблицы данных и на имевшиеся в хранилище таблицы химических данных наложены связи с «таблицей RDF-троек» . Это также позволило создать подсистему автоматизированного сбора химической информации* с учетом терминологии предметных областей: кинетики и термодинамики радикальных реакций, номенклатур названий химических соединений и реализовать интерпретатор семантических запросов** через SQLзапросы к единому хранилищу данных. * Прохоров А. И. , Варламов Д. А. , Амосова Е. С. , Соловьева М. Е. , Туманов В. Е. , Берзигияров П. К. Инфраструктура веб-сервиса интеллектуальной проблемно-ориентированной системы научной аналитики по физической химии радикальных жидкофазных реакций в Интернет // Научный сервис в сети Интернет: труды XVII Всероссийской научной конференции (21 -26 сентября 2015 г. , г. Новороссийск). — М. : ИПМ им. М. В. Келдыша, 2015. — С. 298 -302. * * Прохоров А. И. , Варламов Д. А. , Амосова Е. С. , Берзигияров П. К. , Туманов В. Е. Внедрение предметных онтологий в систему научной аналитики по физической химии радикальных реакций // Научный сервис в сети Интернет: труды XVIII Всероссийской научной конференции (19 -24 сентября 2016 г. , г. Новороссийск). — М. : ИПМ им. М. В. Келдыша, 2016. — С. 298 -302

ПРОГРАММНО-ТЕХНОЛОГИЧЕСКАЯ АРХИТЕКТУРА СИСТЕМЫ НАУЧНОЙ ОСВЕДОМЛЕННОСТИ ПРОГРАММНО-ТЕХНОЛОГИЧЕСКАЯ АРХИТЕКТУРА СИСТЕМЫ НАУЧНОЙ ОСВЕДОМЛЕННОСТИ

ЭКСПЕРТНЫЕ СИСТЕМЫ, ИНТЕЛЛЕКТУАЛЬНЫЕ ПРОГРАММНЫЕ АГЕНТЫ СИСТЕМЫ, НЕЙРОННЫЕ СЕТИ Для эффективного извлечения новых знаний из ЭКСПЕРТНЫЕ СИСТЕМЫ, ИНТЕЛЛЕКТУАЛЬНЫЕ ПРОГРАММНЫЕ АГЕНТЫ СИСТЕМЫ, НЕЙРОННЫЕ СЕТИ Для эффективного извлечения новых знаний из собранных электронных коллекций химических данных радикальных реакций для каждой из них были созданы экспертные системы (ЭС) : ►ЭС для оценки энергии диссоциации связей органических молекул по кинетическим данным бимолекулярных радикальных реакций отрыва на основе синтеза методов прикладного искусственного интеллекта и компьютеризации алгоритмов модели пересекающихся парабол* Е. Т. Денисова ►ЭС для оценки реакционной способности органических молекул в бимолекулярных радикальных реакциях по термохимическим данным ►ЭС для оценки энтальпии образования свободных радикалов по кинетическим данным * Денисов Е. Т. Новые эмпирические модели радикальных реакций радикального отрыва // Успехи химии, 1997. — Т. 66. — С. 953 -971

ЭКСПЕРТНЫЕ СИСТЕМЫ, ИНТЕЛЛЕКТУАЛЬНЫЕ ПРОГРАММНЫЕ АГЕНТЫ СИСТЕМЫ, НЕЙРОННЫЕ СЕТИ (2) Экспертные системы (ЭС) системы сконструированы ЭКСПЕРТНЫЕ СИСТЕМЫ, ИНТЕЛЛЕКТУАЛЬНЫЕ ПРОГРАММНЫЕ АГЕНТЫ СИСТЕМЫ, НЕЙРОННЫЕ СЕТИ (2) Экспертные системы (ЭС) системы сконструированы в виде наборов интеллектуальных программных агентов (ИПА) – автономных программ (часто в виде веб-сервисов) с определенным поведением и специализированных для определенных классов химических реагентов: ►ИПА как реактивные агенты (обычно выполняющие различные оперативные химические расчеты) ►ИПА, реализующие алгоритмы кластерного анализа данных (k -means и c-means) ►ИПА, реализующие искусственные нейронные сети ►ИПА, идентифицирующие зависимости в данных нечеткими базами знаний

ИНТЕЛЛЕКТУАЛЬНЫЕ ПРОГРАММНЫЕ АГЕНТЫ СИСТЕМЫ БЗ БЗ БЗ Реактивные агенты ИНТЕЛЛЕКТУАЛЬНЫЕ ПРОГРАММНЫЕ АГЕНТЫ СИСТЕМЫ БЗ БЗ БЗ Реактивные агенты

ЭКСПЕРИМЕНТАЛЬНЫЕ ЗАВИСИМОСТИ В ФИЗИЧЕСКОЙ ХИМИИ В 1930 -х годах была установлена экспериментальная зависимость энергии ЭКСПЕРИМЕНТАЛЬНЫЕ ЗАВИСИМОСТИ В ФИЗИЧЕСКОЙ ХИМИИ В 1930 -х годах была установлена экспериментальная зависимость энергии активации E и теплоты химической реакции ∆H: E = Β + α · ∆H. При этом было установлено, что каждая специфическая серия химических реакций характеризуется своими параметрами Β и α в уравнении. Позже Денисовым Е. Т. (1990) была предложена параболическая аппроксимация этой (в большинстве случаев нелинейной) зависимости: модель пересекающихся парабол (МПП). Однако расчеты по МПП дают неудовлетворительную точность вычислений (10 -30 к. Дж/моль), если не применять подход сравнения вычислений с «опорной реакцией» , для которой известны все параметры реакции, если таковая имеется для данного класса реакций. С 2010 года мы начали применять для аппроксимации искусственные нейронные сети (ИНС) и алгоритмы нечеткого вывода (АНВ), которые позволяют повысить точность предсказанных значений химических реакций.

НЕЙРОННЫЕ СЕТИ И АЛГОРИТМЫ НЕЧЕТКОГО ВЫВОДА. Поскольку каждая специфическая серия химических реакций (в настоящее НЕЙРОННЫЕ СЕТИ И АЛГОРИТМЫ НЕЧЕТКОГО ВЫВОДА. Поскольку каждая специфическая серия химических реакций (в настоящее время в системе около 90 классов) характеризуется своими кинетическими и термохимическими параметрами, то необходимо практически для каждой группы реакций и вычисляемого химического параметра (энергия активации или классический барьер реакции, энергия диссоциации связей, энтальпии образования радикала) строить «специфические» аппроксиматоры. Сейчас мы проверяем ИНС и АНВ для отдельных серий химических реакций и групп реагентов, типов химических связей. Попытки создать единую ИНС пока не привели к приемлемому результату. Далее приведем несколько примеров.

НЕЙРОННЫЕ СЕТИ СИСТЕМЫ. НА ПРИМЕРЕ ЭНЕРГИИ АКТИВАЦИИ Для оценки классического барьера реакции Ee (и НЕЙРОННЫЕ СЕТИ СИСТЕМЫ. НА ПРИМЕРЕ ЭНЕРГИИ АКТИВАЦИИ Для оценки классического барьера реакции Ee (и соответственно, энергии активации E реакции при несложном пересчете) можно использовать функцию Ee = F (∆He, T, n. A 0, α) где ∆He – энтальпия реакции, n. A 0 – предэкспонентенциальный фактор для эквиреактивных связей умноженный на число таких связей, α – коэффициент, представляющий собой корень квадратный из отношения силовых постоянных разрываемой и образующейся связей. Для аппроксимации этой зависимости была построена ИНС прямого распространения. На первом слое использовалось 4 нейрона (входные данные), на 3 -х внутренних слоях – по 7 нейронов, на последнем – 1 нейрон (результат). В качестве активационной функции использовалась сигмоидальная с параметром нормализации 0. 5. Обучение проводилось до точности в 0. 00001 и потребовало 3 тыс. итераций. Для реакций типа R • + RH при использовании 295 реакций в качестве обучающей выборки и 20 реакций в качестве контрольной выборки получена ошибка 3. 34 ± 2. 0 к. Дж/моль, которая сравнима с инструментальными ошибками измерений в ± 4. 0 к. Дж/моль и существенно меньше ошибки 9. 5 ± 7. 0 к. Дж/моль на той же контрольной выборке для расчетов МПП. Т. е. нейросеть дает лучший результат аппроксимации в сравнении с МПП.

НЕЙРОННЫЕ СЕТИ СИСТЕМЫ. НА ПРИМЕРЕ ЭНЕРГИИ ДИССОЦИАЦИИ РАЗРЫВАЕМОЙ СВЯЗИ Энергия диссоциации разрываемой связи зависит НЕЙРОННЫЕ СЕТИ СИСТЕМЫ. НА ПРИМЕРЕ ЭНЕРГИИ ДИССОЦИАЦИИ РАЗРЫВАЕМОЙ СВЯЗИ Энергия диссоциации разрываемой связи зависит от параметров радикальной реакции и может быть представлена в виде Dei = F (Def, Ee, vi, vf) где Def – энергия образующейся связи, Ee – классический потенциальны барьер, vi и vf – частоты валентных колебаний разрываемой и образующейся связей соответственно. Для аппроксимации этой зависимости была построена многослойная ИНС обратного распространения Хопфилда. На первом слое использовалось 4 нейрона (входные данные), на втором – 10 нейронов, на третьем – 1 нейрон (результат). В качестве активационной функции использовалась сигмоидальная с параметром нормализации 0. 5. Обучение проводилось до точности в 0. 00001 и потребовало 900 тыс. итераций на контрольной выборке в 667 примеров. Контрольная выборка была получена из данных радикальных реакций типа R • + RH. В итоге получена ошибка, которая превышает к. Дж/моль, не 10 которая сравнима с инструментальными ошибками подобных измерений в ± 12. 5 к. Дж/моль. Т. е. данная нейронная сеть дает удовлетворительный результат аппроксимации.

АЛГОРИТМ НЕЧЕТКОГО ВЫВОДА МАМДАНИ. НА ПРИМЕРЕ КЛАССИЧЕСКОГО ПОТЕНЦИАЛЬНОГО БАРЬЕРА РЕАКЦИИ Алгоритм нечеткого вывода Мамдани АЛГОРИТМ НЕЧЕТКОГО ВЫВОДА МАМДАНИ. НА ПРИМЕРЕ КЛАССИЧЕСКОГО ПОТЕНЦИАЛЬНОГО БАРЬЕРА РЕАКЦИИ Алгоритм нечеткого вывода Мамдани построен на использовании базы знаний, формируемую специалистами предметной области в виде совокупности нечетких предикатных правил. В случае оценки классического потенциального барьера Ee для реакций H + RH (атома водорода с углеводородами) как функции: Ee = F (Dei, brind) где Dei – энергия разрываемой связи, brind. – эмпирический индекс реакционного центра, рассчитываемый статистическими методами, 85 нечетких правил базы знаний были заданы в следующем виде (пример): R 1 : IF Dei about 430. 7257 AND brind about 15. 81 THEN Ee about 55. 57 В качестве набора исходных данных взяты данные из 51 реакции H + RH, в качестве контрольного набора оставлены данные 8 реакций этого же класса. Далее согласно алгоритму нечеткого вывода Мамдани последовательно выполняются несколько этапов, которые позволяют на основе массива исходных данных и нечетких правил базы знаний построить аппроксиматор. Использование аппроксиматора на контрольном наборе показало хорошее соответствие с экспериментом (ошибка ± 4. 0 к. Дж/моль = экспериментальной)

БУДУЩЕЕ ПОРТАЛА - РАЗВИТИЕ ЭКСПЕРНЫХ СИСТЕМ Построенные и обученные искусственные нейронные сети для оценки БУДУЩЕЕ ПОРТАЛА - РАЗВИТИЕ ЭКСПЕРНЫХ СИСТЕМ Построенные и обученные искусственные нейронные сети для оценки реакционной способности для небольшого ряда радикальных бимолекулярных жидкофазных реакций были использованы в экспертных системах, которые встроены в портал. Однако для охвата всего массива химических данных необходим более универсальный подход к использованию ИНС. По результатам исследований была выдвинута гипотеза о том, что использование свёрточной нейронной сети (convolutional neural network, CNN) позволит интегрировать разработанные нами сети прямого распространения в одну нейронную сеть, охватывающую большее количество классов химических реакций. Основной проблемой, с которой нам придется столкнуться на этом пути, будет исследование и выбор методов обучения такой сети. Таким образом, в ИПХФ РАН созданы предпосылки для дальнейшего развития портала интеллектуальной проблемно-ориентированной системы научной аналитики в области жидкофазной радикальной кинетики и термохимии, основанной на использовании онтологических моделей, искусственных нейронных сетей и алгоритмов нечеткого вывода.

ВЕБ-ПОРТАЛ ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЫ ПО ФИЗИЧЕСКОЙ ХИМИИ РАДИКАЛЬНЫХ РЕАКЦИЙ В ЖИДКОЙ ФАЗЕ Спасибо за внимание ВЕБ-ПОРТАЛ ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЫ ПО ФИЗИЧЕСКОЙ ХИМИИ РАДИКАЛЬНЫХ РЕАКЦИЙ В ЖИДКОЙ ФАЗЕ Спасибо за внимание Владимир Туманов – идеолог и создатель системы, tve@icp. ac. ru Андрей Прохоров – проектировщик и разработчик, aipro@icp. ac. ru