Выпускная квалификационная работа Разработка программного обеспечения для извлечения,
Выпускная квалификационная работа Разработка программного обеспечения для извлечения, обработки и верификации полнотекстового содержания и метаданных библиотечных электронных единиц хранения. Выполнил Воронин А.А. КБ-86-09 Научный руководитель к.т.н., доцент Парфенов Д.В. Консультант к.т.н., доцент Федоров В.Б. МГТУ МИРЭА
Постановка задачи Рассмотрена задача извлечения полнотекстового содержания и метаданных из книг электронной библиотеки в форматах PDF, PostScript (PS), DJVU, CHM и HTML; разработка системы автоматизированной пакетной обработки электронных единиц хранения библиотеки в этих форматах с целью выделения следующих элементов информации: 1. полный текст документа без управляющих и форматных символов; 2. название документа; 3. список авторов; 4. количество страниц; 5. год издания; 6. язык документа;
Пример метаданных электронной книги
Блок-схема системы извлечения метаданных
Блок-схема «Анализатора языка»
Блок-схема обработки иноязычных книг
Пример отклика сайта isbndb.com на запрос
Блок-схема «Выборки метаданных»
Элемент текста с метаданными в русскоязычной книге
Пример текстового вывода программы
Спасибо за внимание!
presentation_voronin.ppt
- Количество слайдов: 11