presentation_Voronin.ppt
- Количество слайдов: 11
МГТУ МИРЭА Выпускная квалификационная работа Разработка программного обеспечения для извлечения, обработки и верификации полнотекстового содержания и метаданных библиотечных электронных единиц хранения. Выполнил Воронин А. А. КБ-86 -09 Научный руководитель к. т. н. , доцент Парфенов Д. В. Консультант к. т. н. , доцент Федоров В. Б.
Постановка задачи Рассмотрена задача извлечения полнотекстового содержания и метаданных из книг электронной библиотеки в форматах PDF, Post. Script (PS), DJVU, CHM и HTML; разработка системы автоматизированной пакетной обработки электронных единиц хранения библиотеки в этих форматах с целью выделения следующих элементов информации: 1. полный текст документа без управляющих и форматных символов; 2. название документа; 3. список авторов; 4. количество страниц; 5. год издания; 6. язык документа;
Пример метаданных электронной книги
Блок-схема системы извлечения метаданных
Блок-схема «Анализатора языка»
Блок-схема обработки иноязычных книг
Пример отклика сайта isbndb. com на запрос
Блок-схема «Выборки метаданных»
Элемент текста с метаданными в русскоязычной книге
Пример текстового вывода программы
Спасибо за внимание!
presentation_Voronin.ppt