Выпускная квалификационная работа Разработка программного обеспечения для извлечения,


Выпускная квалификационная работа Разработка программного обеспечения для извлечения, обработки и верификации полнотекстового содержания и метаданных библиотечных электронных единиц хранения. Выполнил Воронин А.А. КБ-86-09 Научный руководитель к.т.н., доцент Парфенов Д.В. Консультант к.т.н., доцент Федоров В.Б. МГТУ МИРЭА

Постановка задачи Рассмотрена задача извлечения полнотекстового содержания и метаданных из книг электронной библиотеки в форматах PDF, PostScript (PS), DJVU, CHM и HTML; разработка системы автоматизированной пакетной обработки электронных единиц хранения библиотеки в этих форматах с целью выделения следующих элементов информации: 1. полный текст документа без управляющих и форматных символов; 2. название документа; 3. список авторов; 4. количество страниц; 5. год издания; 6. язык документа;

Пример метаданных электронной книги

Блок-схема системы извлечения метаданных

Блок-схема «Анализатора языка»

Блок-схема обработки иноязычных книг

Пример отклика сайта isbndb.com на запрос

Блок-схема «Выборки метаданных»

Элемент текста с метаданными в русскоязычной книге

Пример текстового вывода программы

Спасибо за внимание!

presentation_voronin.ppt
- Количество слайдов: 11