2c79226df9037d198583b3c44cd1d8ef.ppt
- Количество слайдов: 36
РАЗРАБОТКА, ВНЕДРЕНИЕ И СОПРОВОЖДЕНИЕ ИНТЕЛЛЕКТУАЛЬНЫХ ПРОГРАММНЫХ РЕШЕНИЙ НА ОСНОВЕ ТЕХНОЛОГИЙ SEMANTIC WEB, ОНТОЛОГИЙ, ОБРАБОТКИ И АНАЛИЗА БОЛЬШИХ ДАННЫХ (BIG DATA), СЕМАНТИЧЕСКОГО ПОИСКА
ТЕХНОЛОГИИ И КОМПЕТЕНЦИИ Онтологии и базы знаний Семантический поиск Представление описания предметной области (законодательства, регламентов и НПА, стандартов и методик и пр. ) в форме семантической сети, легко доступной для восприятия и использования каждым специалистом Получение необходимой информации в доступной форме в ответ на нечёткие или некорректно сформулированные запросы. Такая возможность позволяет пользователям реализовать интерактивную работу с базой знаний на естественном языке Обработка и анализ «больших данных» Интеллектуальные системы поддержки принятия решений (ИСППР) Применение современных подходов и методов анализа Big Data с целью выявления знаний в данных, поиска скрытых закономерностей и использования этих знаний в процессе деятельности 2 Выработка и ранжирование наиболее эффективных вариантов решения на основе знаний предметной области, опыта и исторических данных, а также с учётом специфики поставленных задач
УНИКАЛЬНАЯ КОМБИНАЦИЯ СВОЙСТВ РЕШЕНИЙ Самообучаемость 3 Безопасность Открытость Релевантность Адаптивность Простота эксплуатации Интегрируемость Проактивность Оптимальное соотношение «цена-качество» Независимость от иностранных технологий Масштабируемость
Открытая программная платформа для создания профессиональных сообществ научных работников «ИМПАКТ»
ОТКРЫТАЯ ПРОГРАММНАЯ ПЛАТФОРМА «ИМПАКТ» Открытая программная платформа «ИМПАКТ» позволяет строить на своей основе социальные сети действующих ученых, представляющих в научном сообществе свои публикации, диссертации, научные направления и научные школы Цель платформы: объективная оценка научного вклада и корректности заимствований в деятельности сообщества современных ученых 26
АКТУАЛЬНОСТЬ СОЗДАНИЯ ПЛАТФОРМЫ • Высокая публикационная активность • Максимальное распространение своих научных идей • Повышение качества публикаций и диссертаций • Неприятие плагиата • Нежелательность автоплагиата • Необходимость Международных публикаций на разных языках • Точное определение роли и вклада каждого ученого в исследование в условиях реализации сложных комплексных проектов большими коллективами Современный ученый должен заботиться о научной репутации, активно, но корректно представляя свои результаты в научном сообществе 29 Современные тенденции наукометрии Современному ученому тяжело найти баланс качества и количества публикаций, не повредить научную репутацию сомнительными работами Существующие системы нацелены на техническое сравнение текстов и не позволяют реализовать семантический анализ в полной мере
ОБЗОР СУЩЕСТВУЮЩИХ РЕШЕНИЙ Антиплагиат Система автоматической проверки текстов на наличие заимствований РИНЦ Библиографическая база данных научного цитирования Диссернет Социальная сеть для автоматизированного поиска заимствований силами энтузиастов Карта Российской науки Представление и анализ общих показателей деятельности Российских ученых Research. Gate Социальная сеть и средство сотрудничества: поиск, совместное использование файлов и дискуссии Academia. edu Социальная сеть для сотрудничества ученых: можно делиться статьями и отслеживать цитирование Mendeley Программа для управления библиографической информацией 28
НЕДОСТАТКИ СУЩЕСТВУЮЩИХ РЕШЕНИЙ Отсутствие специализации: одинаковые технологии используются для анализа текстов по историческим, юридическим, медицинским и техническим наукам Можно «обойти» путем заменой слов синонимами, изменения верстки и т. п. Не идентифицирует плагиат зарубежных источников на другом языке Не обрабатывает формулы и изображения Некорректно обрабатывает языковые формулы в математике и юриспруденции Не оценивает реальный научный вклад, который может занимать менее 10% статьи Ошибочно определяет плагиат в случае высокой популярности автора Не определяет бессмысленные тексты Не учитывает мнение ведущих ученых в конкретной предметной области 29
МЕХАНИЗМ РЕАЛИЗАЦИИ РЕШЕНИЯ Формируется тематически направленное научное сообщество по отдельным областям науки Ведущие ученые регистрируются и создают онтологию научных школ направления, подключая публикации, диссертации, полученные IP и патенты Авторы научных школ заинтересованы в последователях, но могут отторгнуть тех, кем гордиться нельзя При этом они «привязываются» к другим школам: на которых базируются и которым оппонируют 30 Школы, которые теряют базу и оппонентов, исчезают из сообщества Онтология модерируется
МЕХАНИЗМ ПРОТИВОДЕЙСТВИЯ ПЛАГИАТУ Попавшие в сеть работы проверяются на плагиат и научную состоятельность на трёх ступенях: • Проверка авторами базовых научных школ • Автоматическая проверка на некорректные заимствования • Проверка модераторами сообщества При выявлении плагиата, такие случаи отображаются в онтологии, и у автора есть возможность исправить ситуацию или снять свою работу Автор может выполнить проверку перед публикацией во внешнем научном журнале и заручиться поддержкой сетевого сообщества 31
ФУНКЦИОНАЛЬНАЯ АРХИТЕКТУРА РЕШЕНИЯ Портал научного сообщества Сеть научной школы Workflow развития научной школы Модуль перевода (иностранные языки) Модуль анализа заимствований и верификации источников Модуль семантического поиска Модуль интеграции Хранилище данных сообщества База знаний сообщества (Онтология) Уровень пользовательского интерфейса (Web UI) Уровень интеллектуальной обработки Уровень источников данных 31
ФУНКЦИОНАЛЬНЫЕ ВОЗМОЖНОСТИ 1. Актуальная в рамках области наук классификация (аналог УДК) 2. Актуальная классификация научных направлений (в рамках научных специальностей) 3. Унификация ключевых слов в статьях по разным направлениям 4. Возможность работы со статьями на разных языках (русский, английский, немецкий и т. д. ) 5. Возможность работы с формулами и изображениями 6. Интеллектуальный поиск, адаптированный к заданной предметной области 7. Организация и ведение онтологии как единой непротиворечивой системы знаний, закрепленной в статьях и диссертациях 8. Возможность скрупулезной трехступенчатой проверки научных результатов 32
КЛЮЧЕВЫЕ ПРЕИМУЩЕСТВА РЕШЕНИЯ 1. Возможность организации открытого профессионального сообщества, нацеленного на объективный анализ вклада своих членов 2. Явное определение места ученого и его работ в науке 3. Справедливая оценка научного вклада 4. Возможность указания единомышленников и оппонентов (в отличие от простого цитирования) 33 5. Дополнительная высококвалифицированная экспертиза научных работ 6. Поддержка научного взаимодействи 7. Учёт специфики конкретной научной отрасли 8. Эффективное противодействие плагиату и бессмыслице
КЛЮЧЕВЫЕ ПРЕИМУЩЕСТВА РЕШЕНИЯ v Ведение интеллектуальных рейтингов: общей цитируемости, оппонируемости, влиятельности (у последователей), отказности (сколько человек отказались признавать учёного своим последователем); v. Применение в основе решения открытых отечественных программных платформ, включённых в Реестр импортозамещающего ПО Минкомсвязи РФ; v Успешный опыт использования предлагаемых решений в рамках проекта развития Национальной Электронной Библиотеки (НЭБ); v Реализация предлагаемого проекта при экспертной поддержке Российского профессорского собрания (РПС). 34
Интеллектуальная программная платформа
ЯДРО ПЛАТФОРМЫ – ТЕХНОЛОГИЯ БАЗ ЗНАНИЙ ПРЕДЛАГАЕМЫЕ ИНТЕЛЛЕКТУАЛЬНЫЕ МОДУЛИ ЗАПРОСЫ РЕЛЕВАНТНАЯ ИНФОРМАЦИЯ БАЗЫ ЗНАНИЙ ИЗВЛЕЧЕНИЕ ЗНАНИЙ Производство лекарств Биология 5 Нозологии Медицина Территории Смежные науки База данных n Статистика и др.
ЯДРО ПЛАТФОРМЫ – СЕМАНТИЧЕСКИЙ ПОИСКОВЫЙ МЕХАНИЗМ Новая разработка на основе открытых технологий ТЕКСТА Повышение качества и точности РЕЛЕВАНТНОСТЬ РЕЗУЛЬТАТОВ Повышение уровня РАСПОЗНАВАНИЕ ОТОБРАЖЕНИЕ РЕЗУЛЬТАТОВ ИЗВЛЕЧЕНИЕ 6 ЗНАНИЙ Различные формы, удобные для восприятия Различные возможности
НОВЫЙ ПОИСКОВЫЙ МЕХАНИЗМ НА ОСНОВЕ ОТКРЫТЫХ ТЕХНОЛОГИЙ Поисковый запрос пользователя Fine. Reader Распознанный документ Улучшенный результат поискового запроса Модуль обработки поискового запроса Tesseract Запрос с подсказкой Модуль повышения точности распознавания Правильно сформированный запрос к Solr Словари Текст с улучшенной точностью распознавания Семантический анализатор Результаты поискового запроса Модуль обработки результата Поисковое решение «Открытого кода» Кластеризация результатов Нейросетевой анализатор 7 Apache Solr/Lucene Поисковый индекс Управление контентом (от создания до предоставления результата)
ЯДРО ПЛАТФОРМЫ – ОБРАБОТКА БОЛЬШИХ ДАННЫХ ИСТОЧНИКИ ДАННЫХ БОЛЬШИЕ ДАННЫЕ СХЕМАТИЗАЦИЯ ИНТЕРАКТИВНОЕ ВЗАИМОДЕЙСТВИЕ С ПОЛЬЗОВАТЕЛЕМ ОНТОЛОГИЯ ОБЕСПЕЧЕНИЕ БЕЗОПАСНОСТИ ОСНОВНЫЕ ПРИНЦИПЫ представления многомерных массивов больших данных в структурированном виде, понятном для человека: ФОРМАЛИЗАЦИЯ, ВИЗУАЛИЗАЦИЯ, ВОСПРИЯТИЕ 8
ВЗАИМОДЕЙСТВИЕ МОДУЛЕЙ ПЛАТФОРМЫ СХЕМАТИЗАЦИЯ ИНТЕРАКТИВНАЯ ВИЗУАЛИЗАЦИЯ - Объяснения СЕМАНТИЧЕСКИЙ АНАЛИЗ • • • обобщение случаев анализ эффективности выявление причин и поиск закономерностей БАЗА ЗНАНИЙ семантическая сеть предметной области - Объективные - Знания закономерности - Доказательная база - • • ПОДДЕРЖКА ПРИНЯТИЯ РЕШЕНИЙ корректировка методик выработка и выбор возможных вариантов и др. - Примеры/случаи Истории СТУКТУРНЫЕ ПОДРАЗДЕЛЕНИЯ ЗАКАЗЧИКА - базы данных, справочники и другие источники ДАННЫХ 9 Стратегические и оперативные организационны е решения
Реализованные решения
АИС «ИНТЕЛЛЕКТУАЛЬНЫЙ СЕМАНТИЧЕСКИЙ ПОИСК» ДЛЯ НЭБ Решаемая задача: Повышение актуальности и важности полученных результатов поиска 11
АИС «ИНТЕЛЛЕКТУАЛЬНЫЙ СЕМАНТИЧЕСКИЙ ПОИСК» ДЛЯ НЭБ Использование аналитических, статистических, нейросетевых и словарных методов для получения промежуточного результата Использование промежуточного результата в штатной инфраструктуре Solr (стоп-лист, словарь синонимов, стемминг, кастомные индексаторы) • использование нейронных сетей для получения словаря синонимов (также может исправить частые ошибки распознавания) • использование статистических методов для конструкции стоп листа (выявление слов, которые встречаются в большинстве документов) • устранение частых ошибок распознавания, выявленных словарным методом (например «и» вместо «й» , или « 11» вместо «и» ), при внесении в индекс или соответствующий стемминг 12
АИС «ИНТЕЛЛЕКТУАЛЬНЫЙ СЕМАНТИЧЕСКИЙ ПОИСК» ДЛЯ НЭБ ПОЛУЧЕННЫЕ РЕЗУЛЬТАТЫ: Качественный интеллектуальный поиск по библиотеке • • Повышение точности распознавания Извлечение знаний и структурирование информации (кластеризация) • • Ускорение процесса оцифровки документов Решение, построенное на открытых технологиях • Задействование имеющейся инфраструктуры НЭБ • Доступность квалифицированных кадров, умеющих работать с данными технологиями • 13
БАЗА ЗНАНИЙ ЗАКОНОДАТЕЛЬСТВА САМГД 14
БАЗА ЗНАНИЙ ЗАКОНОДАТЕЛЬСТВА САМГД 15
БАЗА ЗНАНИЙ ЗАКОНОДАТЕЛЬСТВА САМГД 16
БАЗА ЗНАНИЙ В СОЦИАЛЬНОЙ СФЕРЕ Доступная адресная информация для жителей о действующих законах и нормативных актах на федеральном, региональном и муниципальном уровнях; о регламентах предоставления государственных и муниципальных услуг населению: процедурах их назначения, правилах оформления, возможных причинах отказа и порядке обжалования в случае несогласия с принятыми решениями; об учреждениях, предоставляющих социальные услуги населению (об их адресах, телефонах, контактных лицах и часах работы). 17
БАЗА ЗНАНИЙ В СОЦИАЛЬНОЙ СФЕРЕ - Семантическая сеть позволяет в режиме интерактивного диалога с человеком определить положения НПА, касающиеся именно этого человека в конкретной жизненной ситуации Нормативно правовая база знаний в социальной сфере уже содержит 1 182 нормативных документов (397 федеральных, 618 региональных, 167 муниципальных) о порядке предоставления 606 социальных льгот по 485 социальной категории 18
ОНТОЛОГИЯ ФАРМАЦЕВТИЧЕСКОЙ ДЕЯТЕЛЬНОСТИ ФАРМАКОТЕРАПИЯ В МЕДИЦИНЕ ИНТЕЛЛЕКТУАЛЬНАЯ ПОДДЕРЖКА ПРИНЯТИЯ РЕШЕНИЙ (ПО) Диагноз Анализ Случай Лечение Орган Эффект ЛС Онтология Распространенность (частота) Моделирование Вероятность Продажи Наличие конкурентов 19 МАРКЕТИНГ
ОНТОЛОГИЯ ФАРМАЦЕВТИЧЕСКОЙ ДЕЯТЕЛЬНОСТИ Применение онтологий при управлении фармацевтической деятельностью позволяет объединить области знаний из различных отраслей: медицины, фармакологии, маркетинга, автоматизации Патогенез АНТИМИКРОБНАЯ АКТИВНОСТЬ Классификация Клинические симптомы ЛЕКАРСТВЕННОЕ СРЕДСТВО (ЛС) Клинические рекомендации Прогноз ЭФФЕКТИВНОСТЬ ЛЕЧЕНИЯ Место в терапии Резистентность Фармакологический эффект Переносимость Противопоказания Взаимодействия 20 Механизм действия Побочные эффекты
БАЗА ЗНАНИЙ СТАНДАРТОВ И МЕТОДИК ЛЕЧЕНИЯ ЗАБОЛЕВАНИЙ v Описание клинических рекомендаций и стандартов лечения заболеваний на основе онтологии, v Поддержка принятия врачебных решений на основе деперсонифицированного описания клинических ситуаций (анамнез, симптомы заболевания и др. ), v Широкий доступ к клиническим рекомендациям и стандартам лечения заболеваний за счёт использования публичного веб-сервиса, v Возможность доступа к сервису граждан с помощью мобильных устройств, v Интеграция с существующими региональными медицинскими информационными системами. 21
БАЗА ЗНАНИЙ КОНСУЛЬТИРОВАНИЯ ПО МЕДИЦИНСКИМ УСЛУГАМ Информирование граждан обо всех видах медицинских услуг, доступных на территории региона 22
СППР НА ОСНОВЕ БАЗЫ ЗНАНИЙ В СФЕРЕ ДИЕТОЛОГИИ Особенности Системы • Применение технологий Semantic Web и онтологий для построения интеллектуальных систем • Все медицинские данные представляются в виде онтологии (базы знаний) • Возможность внесения изменений в Систему без навыков программирования Функциональные возможности системы Индивидуаль ная оценка факторов риска развития заболеваний, осложнений, угрожаю щих жизни Аналитическая обработка данных пациентов (более 140 параметров анамнеза) Интеграция со внешними МИС 23 Индивидуальный подбор рациона питания и параметров двигательной активности Гибкая конфигурируемость и масштабируемость
ДРУГИЕ СФЕРЫ ПРИМЕНЕНИЯ ПЛАТФОРМЫ Единая информационная система социокультурных ресурсов региона Интеллектуальная система управления электронными архивами организации Системы мониторинга протяженных объектов для нефтегазовой сферы Программная платформа дистанционного обучения Интеллектуальная система популяционного скрининга онкологических заболеваний Другие применения 24
СПАСИБО за внимание
2c79226df9037d198583b3c44cd1d8ef.ppt