07080b9304b0b4ea882ec43f1fd0f6be.ppt
- Количество слайдов: 27
ВНЕДРЕНИЕ ПРЕДМЕТНЫХ ОНТОЛОГИЙ В СИСТЕМУ НАУЧНОЙ АНАЛИТИКИ ПО ФИЗИЧЕСКОЙ ХИМИИ РАДИКАЛЬНЫХ РЕАКЦИЙ А. И. Прохоров 1, Д. А. Варламов 1, 2, Е. С. Амосова 1, В. Е. Туманов 1 , П. К. Берзигияров 1 1 Институт проблем химической физики РАН 2 Институт экспериментальной минералогии РАН Проект поддержан грантом РФФИ 15 -07 -08645 «Создание интеллектуальной веб-ориентированной системы по физической химии радикальных реакций в жидкой фазе» (рук. Прохоров Андрей Иванович) XVIII конференция "Научный сервис в сети Интернет", Моряк-2016
ЦЕЛИ Представление онтологий по физической химии радикальных реакций, разработанных в лаборатории информационного обеспечения научных исследований ИПХФ РАН, и их внедрение в Систему научной осведомленности по физической химии радикальных реакций*. * Туманов В. Е. , Прохоров А. И. , Лазарев Д. Ю. , Соловьева М. Е. Система научной осведомленности по физической химии радикальных реакций. // Информационные ресурсы России. 2010. No 5. С. 16 -21. XVIII конференция "Научный сервис в сети Интернет", Моряк-2016
САЙТ СИСТЕМЫ НАУЧНОЙ ОСВЕДОМЛЕННОСТИ ПО ФИЗИЧЕСКОЙ ХИМИИ РАДИКАЛЬНЫХ РЕАКЦИЙ http: //lion. icp. ac. ru XVIII конференция "Научный сервис в сети Интернет", Моряк-2016
ПРОГРАММНО-ТЕХНОЛОГИЧЕСКАЯ АРХИТЕКТУРА СИСТЕМЫ НАУЧНОЙ ОСВЕДОМЛЕННОСТИ XVIII конференция "Научный сервис в сети Интернет", Моряк-2016
ЭЛЕКТРОННЫЕ РЕСУРСЫ СИСТЕМЫ, СОЗДАННЫЕ В ИПХФ РАН ПОД НАУЧНЫМ РУКОВОДСТВОМ ПРОФ. Е. Т. ДЕНИСОВА Базой для разработки Системы научной осведомленности по физической химии радикальных реакций стали электронные коллекции: ►Банк кинетических констант скорости радикальных жидкофазных реакций [Туманов В. Е. , Денисова Т. Г. , Денисов Е. Т. , Покидова Т. С. , Дроздова Т. И. Свидетельство о государственной регистрации базы данных № 2011620118. Дата приоритета 22. 12. 2010]. Накоплено более 30000 значений. ►Киоск данных по энергиям диссоциации связи органических соединений [Туманов В. Е. , Денисова Т. Г. , Денисов Е. Т. Свидетельство о государственной регистрации базы данных № 2011620117. Дата приоритета 22. 12. 2010]. Включает более 1000 объектов. ►База данных по энтальпиям образования радикалов и органических соединений [Туманов В. Е. , Денисова Т. Г. , Денисов Е. Т. Свидетельство о государственной регистрации базы данных № 20116. Дата приоритета 22. 12. 2010]. Содержит экспериментальные данные около 980 радикалов и порядка 3000 органических соединений. XVIII конференция "Научный сервис в сети Интернет", Моряк-2016
ЭКСПЕРТНЫЕ СИСТЕМЫ И ИНТЕЛЛЕКТУАЛЬНЫЕ ПРОГРАММНЫЕ АГЕНТЫ СИСТЕМЫ Для эффективного использования разработанных электронных коллекций были созданы несколько экспертных систем (ЭС) для извлечения новых знаний с использованием технологий интеллектуальных программных агентов (ИПА), вебсервисов с элементами искусственного интеллекта: ►ЭС для оценки энергии диссоциации связей органических молекул по кинетическим данным бимолекулярных радикальных реакций отрыва на основе синтеза методов прикладного искусственного интеллекта и компьютеризации алгоритмов модели пересекающихся парабол Е. Т. Денисова ►ЭС для оценки реакционной способности органических молекул в бимолекулярных радикальных реакциях по термохимическим данным ►ЭС для оценки энтальпии образования свободных радикалов по кинетическим данным
ЭКСПЕРТНЫЕ СИСТЕМЫ И ИНТЕЛЛЕКТУАЛЬНЫЕ ПРОГРАММНЫЕ АГЕНТЫ СИСТЕМЫ (ПРОДОЛЖЕНИЕ) ЭС сконструированы в виде набора интеллектуальных программных агентов – автономных программ с определенным поведением. ►ИПА, реализующие искусственные нейронные сети для предсказания реакционной способности молекул в радикальных реакциях ►ИПА, реализующие искусственные нейронные сети для предсказания энергии диссоциации связей органических молекул ►ИПА, идентифицирующие зависимости в данных нечеткими базами знаний ►ИПА, реализующие алгоритмы кластерного анализа данных XVIII конференция "Научный сервис в сети Интернет", Моряк-2016
ИНТЕЛЛЕКТУАЛЬНЫЕ ПРОГРАММНЫЕ АГЕНТЫ СИСТЕМЫ БЗ БЗ БЗ Реактивные агенты XVIII конференция "Научный сервис в сети Интернет", Моряк-2016
ЦЕЛИ РАЗРАБОТКИ, СОЗДАНИЯ И ВНЕДРЕНИЯ ОНТОЛОГИЙ Расширение возможностей системы: ►Интеграция баз данных в единое семантически структурированное и организованное хранилище химических данных ►Наполнение хранилища химических данных посредством автоматического поиска, обработки, извлечения и сохранения химических данных из открытых Интернет-источников, связанных с радикальными реакциями. Расширение возможностей системы по взаимодействию с пользователем: ►Использование различных химических номенклатур названий химических соединений, различных наименований одних и тех же реакций, использование различных единиц количественных измерений значений и т. п. ; ►Осуществление запросов в системе на языке, близком к естественному, с оказанием помощи в формулировке запросов. XVIII конференция "Научный сервис в сети Интернет", Моряк-2016
ОНТОЛОГИИ СИСТЕМЫ НАУЧНОЙ ОСВЕДОМЛЕННОСТИ ПО ФИЗИЧЕСКОЙ ХИМИИ РАДИКАЛЬНЫХ РЕАКЦИЙ РАЗДЕЛЫ ХИМИЧЕСКИХ ЗНАНИЙ : §КИНЕТИКА §ТЕРМОХИМИЯ Амосова Е. С. , Туманов В. Е. Представление химических реакций, реагентов и их термохимических свойств в интеллектуальной системе по физической химии радикальных реакций в жидкой фазе с использованием онтологической модели предметной области // Бутлеровские сообщения. 2014. T. 39. No 7. C. 39 -46 Амосова Е. С. , Берзигияров П. К. Разработка представления онтологической модели по физической химии радикальных реакций отношениями реляционной базы данных и реализация его в предметноориентированной системе научной осведомленности. Бутлеровские сообщения. 2016. Т. 45. № 1. С. 152 -158. XVIII конференция "Научный сервис в сети Интернет", Моряк-2016
ОНТОЛОГИИ «РАДИКАЛЬНЫЕ РЕАКЦИИ В ЖИДКОЙ ФАЗЕ» Разработана онтологическая модель, представляющая собой иерархию классов предметной области физическая химия радикальных реакций в жидкой фазе. Модель “Кинетика” включает в себя около 100 подклассов радикальных реакций, более 50 классов органических соединений и около 45000 свойств объектов (физико-химических свойств молекул, радикалов и радикальных реакций). Модель “Термохимия” включает в себя 165 классов органических соединений и около 30 свойств данных и около 30000 свойств объектов. Онтологии разработаны с использованием средства проектирования онтологий Protégé (http: //protege. stanford. edu). XVIII конференция "Научный сервис в сети Интернет", Моряк-2016
ФРАГМЕНТ ОНТОЛОГИИ (ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ) «РАДИКАЛЬНЫЕ РЕАКЦИИ В ЖИДКОЙ ФАЗЕ» [КИНЕТИКА] XVIII конференция "Научный сервис в сети Интернет", Моряк-2016
ФРАГМЕНТ ОНТОЛОГИИ (ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ) «РАДИКАЛЬНЫЕ РЕАКЦИИ В ЖИДКОЙ ФАЗЕ» [ТЕРМОХИМИЯ] XVIII конференция "Научный сервис в сети Интернет", Моряк-2016
ОНТОЛОГИИ «РАДИКАЛЬНЫЕ РЕАКЦИИ В ЖИДКОЙ ФАЗЕ» В предлагаемых нами онтологиях на самом верхнем уровне расположен класс «химия» (Chemistry) с подклассом «физическая химия» (Physical_chemistry). В классе «физическая химия» , в свою очередь, для онтологии по химической кинетике выделен подкласс «химическая кинетика» (Chemical_kinetics), а в случае онтологии по термохимии – соответственно, «термохимия» . По основной структуре обе онтологии достаточно близки: основными подклассами являются «реакции» (Reactions), «молекулы» (Molecules), «радикалы» (Radicals) и «растворители» (Solvents). XVIII конференция "Научный сервис в сети Интернет", Моряк-2016
ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ БАЗОВЫХ ПОДКЛАССОВ ОНТОЛОГИИ РАДИКАЛЬНЫЕ РЕАКЦИИ В ЖИДКОЙ ФАЗЕ Жидкофазные радикальные реакции протекают по разным механизмам, с участием различных реагентов и растворителей. В классе «радикальные реакции в жидкой фазе» определены подклассы: «реакции» (Reactions), «молекулы» (Molecules), «радикалы» (Radicals) и «растворители» (Solvents). XVIII конференция "Научный сервис в сети Интернет", Моряк-2016
ИЕРАРХИЧЕСКОЕ И ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ОНТОЛОГИИ ПО КИНЕТИКЕ ПРЕДМЕТНОЙ ОБЛАСТИ В ПРОГРАММЕ PROTÉGÉ Радикальные реакции могут проходить в твёрдой, жидкой или газовой фазе, поэтому в классе «радикальные реакции» выделены подклассы «радикальные реакции в твёрдой фазе» (Solid_phase_radical_reaction), «радикальные реакции в жидкой фазе» (Liquid_phase_radical_re- action) и «радикальные реакции в газовой фазе» (Gas_phase_radical_reaction) XVIII конференция "Научный сервис в сети Интернет", Моряк-2016
ИЕРАРХИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ КЛАССИФИКАЦИИ РЕАКЦИЙ ПО МЕХАНИЗМУ ПРОТЕКАНИЯ По механизму протекания радикальные реакции можно разделить на следующие типы: • отрыв атома водорода (Abstraction_H), • отрыв атома галогена (Abstraction_X), присоединение (Addition), • соединение (Combination), декомпозиция (Decomposition), дециклизация (Decyclization), • перенос электрона (Electron_transfer), изомеризация (Isomerisation), • перенос атома кислорода (Oxygen_transfer), • генерирование радикалов (Radical_generation), • реакции с карбенами (Reactions_of_carbenes), • замещение (Substitution) XVIII конференция "Научный сервис в сети Интернет", Моряк-2016
ИЕРАРХИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ КЛАССИФИКАЦИИ РЕАКЦИЙ ТИПА «ОТЩЕПЛЕНИЕ ВОДОРОДА» Для каждого типа реакции задаются подклассы: схемы реакций, например: в классе «отрыв водорода» определен 51 подкласс по типам реакции XVIII конференция "Научный сервис в сети Интернет", Моряк-2016
ИЕРАРХИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ КЛАССИФИКАЦИИ МОЛЕКУЛ ПО ВИДАМ СОЕДИНЕНИЙ Молекулы по составу делятся на разные группы соединений, каждая из которых представляет отдельный класс XVIII конференция "Научный сервис в сети Интернет", Моряк-2016
ИЕРАРХИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ КЛАССИФИКАЦИИ РАДИКАЛОВ ПО СТРУКТУРЕ РЕАКЦИОННОГО ЦЕНТРА Радикалы разделяются на подклассы в зависимости от структуры: • линейные, • разветвлённые, • с алифатическими циклами и гетеро циклами, • с ароматическими циклами и гетеро циклами, • макрорадикалы, • ненасыщенные радикалы XVIII конференция "Научный сервис в сети Интернет", Моряк-2016
ПРЕДСТАВЛЕНИЕ СВОЙСТВ ДАННЫХ ОНТОЛОГИИ Для классов «молекулы» и «радикалы» задаются следующие свойства данных: has_brutto – имеет брутто формулу; has_CASN – имеет номер CAS; has_name – имеет название; has_structure – имеет структуру XVIII конференция "Научный сервис в сети Интернет", Моряк-2016
ВНЕДРЕНИЕ ОНТОЛОГИЙ Существует два общих подхода к использованию онтологий в хранилищах данных: ►проектирование хранилищ данных на основе онтологий; ►внедрение онтологических моделей в существующие хранилища данных. Мы следуем второму подходу, когда разработанные онтологические модели интегрируются в существующее хранилище данных. Достижение поставленной цели состоит из двух основных шагов: ►Представление разработанных онтологий в виде реляционной таблицы данных (RDF-тройки) ►Разработка интерпретатора семантического запроса в SQL-запрос к хранилищу данных с последующим возвращение результата. XVIII конференция "Научный сервис в сети Интернет", Моряк-2016
ПРЕДСТАВЛЕНИЕ РАЗРАБОТАННЫХ ОНТОЛОГИЙ В ВИДЕ РЕЛЯЦИОННОЙ ТАБЛИЦЫ Для того, чтобы интегрировать в систему разработанные онтологии, было решено сохранить их в той же реляционной базе данных (РБД), где содержаться данные по физической химии радикальных реакций. Выделяют два базовых подхода к организации хранения онтологий в РБД: 1) использование единственной таблицы для хранения всех RDF -триплетов (подход «вертикальная таблица» ); 2) отображение иерархии онтологических сущностей (классов, свойств, экземпляров) в схему РБД. В нашем случае мы используем первый подход, когда все RDFтриплеты хранятся в унифицированной таблице БД, содержащей в общем случае четыре колонки: «граф» , «субъект» , «объект» и «предикат» . Данный подход реализован, в частности, в Jena SDB и 3 store. Он характеризуется достаточно высокой временной сложностью выборки RDF-триплетов, однако, мы полагаем, в нашем случае этот подход вполне пригоден. XVIII конференция "Научный сервис в сети Интернет", Моряк-2016
ФРАГМЕНТ ТАБЛИЦЫ TRIPLES Рекомендации W 3 Консорциума по отображения онтологий в RDF граф: OWL 2 Web Ontology Language Mapping to RDF Graphs (Second Edition) W 3 C Recommendation 11 December 2012 https: //www. w 3. org/TR/2012/REC-owl 2 mapping-to-rdf-20121211/
РАЗРАБОТКА ИНТЕРПРЕТАТОРА СЕМАНТИЧЕСКОГО ЗАПРОСА (1) Поскольку онтология хранится в RDF хранилище и реализовано оно в виде «одной» таблицы в реляционной базе данных, то любой SPARQL запрос можно быть представлен в виде SQL запроса с self-join к этой таблице ☺. SPARQL SELECT ? bde_error WHERE { ? v rdf: type : Molecules; : has_BDE_Error ? bde_error. } SQL SELECT T 2. ”OBJECT” as BDE_ERROR FROM TRIPLES T 1, TRIPLES T 2 WHERE t 1. ”predicate”='rdf: type' AND t 1. ”object”='Molecules' AND t 2. ”predicate”='has_BDE_Error' AND t 1. ”subject”=t 2. ”subject” Базовый документ по разработке интерпретатора: Translation to the SPARQL Algebra. Section No. 18. 2 of SPARQL 1. 1 Query Language [ W 3 C Recommendation 21 March 2013 ] http: //www. w 3. org/TR/sparql 11 -query/#sparql. Query
РАЗМЕЩЕНИЕ ОНТОЛОГИЙ В RDF ХРАНИЛИЩЕ TRIPLE STORE, РАЗРАБОТКА ИНТЕРПРЕТАТОРА СЕМАНТИЧЕСКОГО ЗАПРОСА Поскольку в нашей системе и на стороне сервера, и на стороне клиента используется Java. Script, то ►из Protégé cохраняем онтологию в RDF в реляционной базе (Triple Store) через формат Turtle (Terse RDF Triple Language) посредством специального сервиса загрузки онтологий, который обслуживается сервисом на базе скриптов N 3. js [https: //github. com/Ruben. Verborgh/N 3. js] ►в качестве основы для разработки интерпретатора SPARQL-запросов был использован проект SPARQL. js [https: //github. com/Ruben. Verborgh/SPARQL. js] Автор Javascript-библиотек Ruben Verborgh [ http: //ruben. verborgh. org ]
ВНЕДРЕНИЕ ПРЕДМЕТНЫХ ОНТОЛОГИЙ В СИСТЕМУ НАУЧНОЙ АНАЛИТИКИ ПО ФИЗИЧЕСКОЙ ХИМИИ РАДИКАЛЬНЫХ РЕАКЦИЙ Спасибо за внимание