
0b0a20f943d4e626005317fda1ecc21b.ppt
- Количество слайдов: 60
Абрау-Дюрсо Сентябрь, 18 -23, 2017 Цифровая библиотека по обыкновенным дифференциальным уравнениям на основе Lib. Meta Атаева О. М, Серебряков В. А. , Тучкова Н. П. Вычислительный Центр им. А. А. Дородницына ФИЦ ИУ РАН 3/19/2018 1
План доклада 1. Семантические библиотеки – Определения и примеры – Libmeta семантическая библиотека • основные определения 2. Роль пользователя в Lib. Meta 3. Пример конструирования библиотеки в предметной области обыкновенных дифференциальных уравнений 4. Заключение и направления дальнейших исследований 3/19/2018 2
О семантических библиотеках • • Библиотеки: электронные, цифровые, семантические Semantic Web, Linked Open Data, онтологии Информационные системы в контексте цифровых библиотек Greenstone, как пример семантической библиотеки (Greenstone поддерживает следующие форматы: Microsoft Word, Excel, Rich Text Format, HTML, plain text, PDF, ZIP, MP 3. ) Что такое семантическая цифровая библиотека © В. А. Серебряков Вычислительный Центр РАН, Москва, serebr@ccas. ru //Труды 16 -й Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» — RCDL-2014, Дубна, Россия, 13– 16 октября 2014 г. Электронная Библиотека (ЭБ, АБИС) – средство автоматизации работы обычных, «книжных» библиотек, основанное как правило на технологиях MARC. Цифровая Библиотека (ЦБ) – информационная система, ориентированная на действия (поиск, доступ и т. д. ) с цифровым контентом (тексты, аудио, видео и т. д. ). В этом смысле ЦБ может быть, а может и не быть ЭБ. Семантическая Цифровая Библиотека (СЦБ) – ЦБ, ориентированная на интеграцию в 3/19/2018 3 Semantic Web.
Основные идеи Lib. Meta • Цифровая – поддержка использования медийных цифровых объектов (таких как текст, аудио, видео файлы или любой их комбинации) при описании своих объектов • Семантическая – поддержка различных типов ресурсов и связей между ними • Открытая – предоставляет возможность связывания своих данных с данными из разных источников (например, LOD) • Персональная – настройка информационной среды конкретного пользователя 3/19/2018 4
Для реализации основных идей необходимо сформулировать требования Lib. Meta • Универсальность – Возможность описания разных типов ресурсов • Структурированность – Поддержка связей между ресурсами • Адаптируемость – «Эволюция» ресурсов в процессе развития системы , настройка интерфейсов пользователя 3/19/2018 5
Основные понятия Lib. Meta • Информационный ресурс • Информационный объект • Атрибут – Типы • файловый, объектный, числовой, текстовый, строковый – Виды • поисковые, описательные, административные, идентифицирующие • Набор атрибутов 3/19/2018 6
Основные понятия и связи между ними 3/19/2018 7
Роль словарей в Lib. Meta • Терминологическое описание предметной области – словари (классификаторы , тезаурусы) • Создание коллекций информационных объектов на основе словарей – Коллекция может объединять информационные объекты различных типов ресурсов. 3/19/2018 8
Lib. Meta - конструктор • Lib. Meta состоит из набора компонентов, позволяющих создать электронную библиотеку для некоторой предметной области • Lib. Meta – это фактически конструктор для создания электронных библиотек с самым разнообразным наполнением с настраиваемым интерфейсом • Для создания и описания содержимого библиотеки с помощью Lib. Meta от пользователя не требуется специальных технических знаний 3/19/2018 10
Задача интеграции данных в Lib. Meta • Lib. Meta – позволяет интегрировать данные из различных источников, например: – «Классические» источники (OAI PMH или любой другой протокол ) – Открытые источники (Linked Open Data) – Из текстовых файлов (например, tex-файлы) Основные проблемы открытых источников отсутствие: • связанности • согласованности 3/19/2018 11
Состав семантической библиотеки • Описание предметной области – Тезаурусы, классификаторы, рубрикаторы – Задается терминами и связями между ними • Объекты различных типов, связанных с терминами из предметной области, например: – Персоны – События – Публикации – Медиа-объекты – Формулы 3/19/2018 12
Возможности пользователя (1) • Стандартный набор функциональности • поиск, навигация, просмотр • Создание персональной информационной среды с помощью дополнительных возможностей • Возможность «очертить» свою «узкую» область интересов • Получать обновления и рекомендации по ресурсам библиотеки в рамках своей области интересов • Возможность вести свои коллекции • Возможность детализации описаний своих объектов в коллекции 3/19/2018 13
Возможности пользователя (2) • Выбор терминов предметной области – Создание своего поддерева терминов главного тезауруса – Возможность «открытой работы» над терминами с другими пользователями – Расширение рекомендаций за счет терминов «смежных» предметных областей • Поддержка собственных коллекций ресурсов 3/19/2018 14
Иерархия пользователей • Из функциональности системы следует необходимость в иерархии пользователей – Администратор • Имеет доступ к редактированию структуры данных – Редактор предметной области • Имеет доступ к редактированию терминов предметной области – «Простой» пользователь • Может определять свою область интересов с помощью терминов предметной области и создавать свои коллекции объектов 3/19/2018 15
Пример конструирования библиотеки • Предметная область - ОДУ (Обыкновенные дифференциальные уравнения) • Ресурсы: персоны, публикации, математические формулы • Источники данных – Математические статьи – Math. Net – DBpedia 3/19/2018 16
Как конструируется библиотека (1) • Определяется список необходимых атрибутов, например: – Задается список атрибутов • Номер, Том, Год выпуска, Название, Автор – Эти атрибуты могут быть использованы как для описания журнала в одном случае, так и для описания публикации в другом – Из атрибутов создаются отдельные наборы, на основе которых задается описание объектов библиотеки. 3/19/2018 17
Список атрибутов 3/19/2018 18
Описание атрибута 3/19/2018 19
Набор атрибутов для публикации 3/19/2018 20
Как конструируется библиотека (2) • Ресурсы – С помощью наборов атрибутов определяются типы ресурсов библиотеки и их описание • Определяются связи между ресурсами • Тезаурус – для описания предметной области определяется ее тезаурус 3/19/2018 21
Описание информационного ресурса библиотеки 3/19/2018 22
Информационный объект, как экземпляр ресурса 3/19/2018 23
Как конструируется библиотека (4) • Определение тезауруса – Расширение описания термина тезауруса – Определение дополнительных связей между ними – Определение дополнительных связей между ресурсами системы и терминами тезауруса 3/19/2018 24
Тезаурус ОДУ 3/19/2018 25
Понятие из ОДУ (1) 3/19/2018 26
Понятие из ОДУ (2) 3/19/2018 27
Связи между объектами и терминами тезауруса • Реализована функция определения отношения между терминами тезауруса и объектами системы • Для определения связи задается коэффициент связанности, который определяет уровень информационной связанности терминов с объектами. – предварительно определяются атрибуты значения, которых используются для выделения терминов 3/19/2018 28
Связи тезаурус - публикации 3/19/2018 29
Связи публикации - тезаурус 3/19/2018 30
Информационные объекты и теги • Каждый ресурс может обладать набором тегов • В качестве тегов могут выступать ключевые слова • Каждый тег может быть связан с любым количеством объектов – Это позволяет выполнять навигацию по коллекции ресурсов не только по терминам тезауруса, но и по ключевым словам, выявляя связи между ключевыми словами и терминами тезауруса 3/19/2018 31
Связи теги - объекты 3/19/2018 32
Связи теги - термины 3/19/2018 33
Настраиваемый пользовательский интерфейс • По описаниям атрибутов, наборов атрибутов и ресурсов система формирует интерфейсы пользователя по отдельным типам ресурсов : – формы поиска, – создания, – редактирования, – просмотра объектов 3/19/2018 34
Поиск • Атрибутный – по определенному типу ресурса • По метаданным системы – по всем типам ресурсов • Полнотекстовый (используется дополнительный модуль stagirs) – по всем текстам – по отдельному • По внешним источникам (а именно, источникам из LOD) 3/19/2018 35
Атрибутный поиск 3/19/2018 36
Результаты атрибутного поиска 3/19/2018 37
Поиск по метаданным 3/19/2018 38
Полнотекстовый поиск 3/19/2018 39
Поиск в рамках одного текста 3/19/2018 40
Поиск по источникам данных • Открытые источники, информация из которых подготовлена для совместного использования с использованием URI и RDF. • Определение отображения между источником данных и Lib. Meta – Позволяет строить автоматический поисковые формы по источникам данных – Не требует от пользователя знания специфики доступа к точке доступа источника данных • Не требует от пользователя знания языка запросов • Возможность автоматического связывания информационных объектов библиотеки с данными из источника 3/19/2018 41
Math. Net как источник данных 3/19/2018 42
Отображение схемы источника на информационные ресурсы (2) 3/19/2018 43
Отображение схемы источника на информационные ресурсы (1) 3/19/2018 44
Связывание с данными источника 3/19/2018 45
Результат связывания 3/19/2018 46
Поиск по источникам данных 3/19/2018 47
Что можно сделать с результатами поиска (1) • Пользователь может сохранять результаты поиска как в виде отдельных ресурсов, так и в виде ссылок на внешние ресурсы – Сохранить новый объект (Same. As) • Структура строится по отображению – Сохранить связь с уже имеющимся объектом (See. Also) 3/19/2018 48
Что можно сделать с результатами поиска (2) Сохранить как связь с уже имеющимся объектом Сохранить как новый объект в системе 3/19/2018 49
Поддержка математики в Lib. Meta • Семантическое описание формул – – Различное представление (преобразование форматов) Связанные объекты Теги Термины тезауруса • Формулы (привлечен редактор математических формул Visual. Math. Editor) – La. Teх, Math. ML • Формулы и информационные объекты • Поиск по формулам (реализован пример для массива «Владикавказский математический журнал» ) 3/19/2018 50
Представление формулы 3/19/2018 51
Поиск по формулам • Предварительно загружена информация по формулам • Формируется индекс формул • Поиск с точностью до переменных – пример равных формул – пример входящих формул 3/19/2018 52
Форма поиска по формулам 3/19/2018 53
Результаты поиска 3/19/2018 54
Классификаторы • Поддержка классификаторов и связей между терминами • MSC и UDK – У каждой публикации добавлен атрибут «номер удк» , «номер msc» , тип значений которого элементы соответствующего классификатора. 3/19/2018 55
УДК 3/19/2018 56
Элемент УДК 3/19/2018 57
MSC 3/19/2018 58
Элемент MSC 3/19/2018 59
Заключение и планы Представлена открытая семантическая цифровая библиотека Lib. Meta для работы пользователей с цифровыми ресурсами и возможностью создавать описания собственных коллекций в предметной области на основе терминологического тезауруса. Разработана и внедрена система поддержки поиска по математическим формулам в Lib. Meta. В статьи тезауруса добавлено свойство formula. Для предметной области ОДУ обработано около 600 описаний математических публикаций, выявлено около 300 связей с терминами ОДУ и выделено около 600 формул. Дальнейшие исследования лежат в области - расширения и развития системы Lib. Meta с добавлением связей, формул и математических предметных областей за счет обработки новых массивов данных - развития функционала системы для привлечения профильных специалистов математических областей знаний с использованием элементов соцсетей. 3/19/2018 60
Спасибо за внимание 3/19/2018 61
0b0a20f943d4e626005317fda1ecc21b.ppt