cbdebffc6f2248bfd031af966a3432da.ppt
- Количество слайдов: 27
Специализированный центр "БАЛИ" (Киев, Украина) Система формирования и интеграции цифровых коллекций DC-Visu ОНЛАЙНОВАЯ РЕПРЕЗЕНТАЦИЯ ОЦИФРОВАННЫХ РЕДКИХ КНИГ ИНТЕРФЕЙСЫ ЦИФРОВЫХ КОЛЛЕКЦИЙ ОБОГАЩЕНИЕ ЦИФРОВОГО КОНТЕНТА БИБЛИОГРАФИЧЕСКИМИ И ВИЗУАЛЬНЫМИ СЕРВИСАМИ Баркова Ольга olgabarkova@gmail. com
"Весь мир увидеть в волшебном цифровом зеркале" Дриккер А. С.
Единство формы и содержания оцифрованного документа Подходы к многофункциональности • • качество воспроизведения документа в форме, которая передает все особенности внешнего вида оригинала; посимвольное представление текста для полнотекстового поиска; визуализация оригинала + поиск и сервисы по тексту в едином интерфейсе; в едином объекте сосредоточить несколько электронных форматов представления документа; разгрузить пользователя : интуитивно понятный интерфейс без локальных инсталляций; использование имеющихся информационных систем в организациях; обогащение информационного содержания и визуальных сервисов
Специализированный центр "БАЛИ" (Киев, Украина) Система репрезентации и интеграции оцированного контента и управления цифровіми коллекциями Решение для визуализации и поиска Задача – интеграция в единой системе цифрового контента, представленного в разнообразных форматах, и его функционирование с учетом : информационных стандартов и правил, тенденций развития цифровых коллекций и информационных сервисов в Интернет. Рассчитана на использование в Организациях Памяти. Может быть использована как инструментарий для просмотра внешних объектов в библиографических и полнотекстовых информационно-поисковых системах DС-Visu Интегрируется с ИС на уровне заимствования библиографических данных в действующих стандартах и форматах.
Специализированный центр "БАЛИ" (Киев, Украина) Business Activity & Libraries Informatisation Системні рішення: • модульний принцип побудови системи – дозволяє використовувати в різних завданнях як систему в цілому, так і її окремі модулі; • доступ до Інтернет за HTTP адресою – забезпечує роботу з системою через браузер Інтернет як на рівні використання ресурсів, так і на рівні керування; • системна інтеграція – забезпечується програмно-технологічна взаємодія з інформаційними і пошуковими системами, а також використання вбудованих функціональних рішень інших розробників; • ресурс на інтеграція – забезпечується внутрішньо системна інтеграція власних колекцій і зовнішніх ресурсів, а також інтегрування до національних і глобальних інформаційних систем; • незалежна ідентифікація ресурсів – кожний цифровий об'єкт, колекція і зібрання в цілому формуються і функціонують як самостійні мережеві інформаційні ресурси; • використання типових і унікальних функціональних рішень щодо керування і використання ресурсів, послідовне збільшення, розвиток і розширення функціонала; • мультимедійність та багатоформатність – підтримка усіх видів цифрового контенту і актуальних файлових форматів для його представлення; • підтримка багатомовності інтерфейсів і ресурсів; • підтримка повнотекстового і семантичного пошуку, навігація в графічних образах (маркування пошукових термінів у зображеннях).
Специализированный центр "БАЛИ" (Киев, Украина) Business Activity & Libraries Informatisation Технологии и системные требования «DCvisu v. 2. 0» Веб-сервер ü ü ü Операционная система (Windows, Linux) HTTP Веб-сервер Apache v. 1. 2 или выше PHP v. 5. 2. 8 или выше База данных My. SQL v. 4 или выше Объем дискового пространства: 500 МБ + размер оцифрованных ресурсов Система управления
Специализированный центр "БАЛИ" (Киев, Украина) Business Activity & Libraries Informatisation Возможности системы управления контентом «Croogo» Модульность Меню навигации Пользователи Цифровой контент http: //croogo. org Поиск по сайту Управление доступом Мультиязычность Темы сайта
Специализированный центр "БАЛИ" (Киев, Украина) Business Activity & Libraries Informatisation Структура системы управления электронными коллекциями «DCvisu v. 2. 0» Панель администрирования Ø Панель администрирования - Добавление и редактирование коллекций и их объектов Ø Навигатор коллекций - Просмотр коллекций и каталога объектов Ø Система визуализации электронных книг - Отображение электронных книг Навигатор коллекций Система визуализации
Специализированный центр "БАЛИ" (Киев, Украина) Business Activity & Libraries Informatisation Модули системы управления коллекциями «DCvisu v. 2. 0» Ø Модуль управления коллекциями § § § Сведения о коллекции Аннотация Детальное описание Содержание (тематические рубрики / подрубрики, мета-теги) Иконка коллекции Ø Модуль управления объектами коллекций § Описание (основные, библиографические данные) § Контент (аннотация, содержание, алфавитный указатель, заметки об оригинале) § Принадлежность к коллекции § Цифровой контент (обложка, страницы, развороты, представление в форматах doc, rtf, pdf, djvu, ppt, wav, mp 3, mpg, avi, ссылка на внешний ресурс) § Экспорт в XML (для интеграции в Europeana, Dublin Core) § Иконка документа (загрузка, выбор страницы книги)
Специализированный центр "БАЛИ" (Киев, Украина) Business Activity & Libraries Informatisation Модули системы управления коллекциями «DCvisu v. 2. 0» Ø Модуль визуализации оцифрованных книг и сшитых документов § Навигация - по страницам - по разворотам - по содержанию - по указателю § Масштабирование и поворот страниц § Печать страниц § Сохранение в закладки, скачать в zip-архиве Ø Модуль автоматического распознавания текста на базе системы “ABBY Fine. Reader Engine” § § Поддержка множества языков Качество распознавания (высокое, среднее, низкое) Возможность полнотекстового поиска в модуле визуализации Подсветка найденных слов
Специализированный центр "БАЛИ" (Киев, Украина) Business Activity & Libraries Informatisation Полнотекстовый поиск с маркерной подсветкой
Использование специализированного модуля DC-Visu для предоставления контент-сервисов и визуализации терминов в изображениях при взаимодействии c полнотекстовыми и библиографическими поисковыми системами Модуль маркировки текста в изображениях
Редактор-выделитель текста E-Colorer
Специализированный центр "БАЛИ" (Киев, Украина) Business Activity & Libraries Informatisation Модули системы управления коллекциями «DCvisu v. 2. 0» Ø Модуль авторизации § § Регистрация новых пользователей (логин, пароль, e-mail) Сквозная авторизация на сайте и панели администрирования Роли пользователей (администратор, модератор, гость) Разрешения для ролей пользователей на доступ к модулям и разделам Dc-visu Ø Модуль многоязычной поддержки § Возможность установить несколько языков § Назначение языка по умолчанию § Переключение между языками «на ходу» Ø Модуль поиска документов DС-Visu http: //lib. npu. edu. ua/new-collections/collections
Специализированный центр "БАЛИ" (Киев, Украина) Business Activity & Libraries Informatisation Организация краудсорсинга в «DCvisu v. 2. 0» Перспектива развития Система верификации Корректоры текстов Модератор База данных DCvisu
Специализированный центр "БАЛИ" (Киев, Украина) Business Activity & Libraries Informatisation Сотрудничество с компанией ABBYY® ABBYY Fine. Reader Engine ü Распознавание печатных текстов на 202 языках ABBYY Intelligent Search SDK ü Сужение поиска по значению слова ü Расширение поиска по смыслу ü Распознавание рукописных текстов на 135 языках ü Выбор оптимального распознавания скорость / качество ü Экспорт распознанного текста и оригинал - изображения в формат PDF ü Добавление метаданных документов в индекс ü Интеллектуальное ранжирование ü Полнотекстовый поиск
Варианты конфигурации системы Модуль визуализации цифровых изображений Модуль администрирования Модуль веб-представления коллекций Модуль маркировки текста в изображениях
Cистема керування електронними колекціями ВИМОГИ до вхідного масиву зображень і метаданих оцифрованих документів та структури файлового сховища 1. Склад вхідного масиву зображень оцифрованої книги: - зображення розворотів книг; - посторінкові зображення книг; - зображення обкладинки, титульного аркушу або будь-якого зображення, що візуально ідентифікує даний об’єкт, призначеного для створення іконки; Надається можливість підключення представлень оцифрованої книги в інших текстових, графічних і мультимедійних форматів (DOC, RTF, PDF, Dj. Vu, HTML, MP 3, WAV, AVI, MPG, PPT), а також гіперпосилань на Інтернет-ресурси, до кожного оцифрованого документу.
Cистема керування електронними колекціями ВИМОГИ до вхідного масиву зображень і метаданих оцифрованих документів та структури файлового сховища 2. Вимоги до параметрів і форматів файлів зображень - усі зображення надаються у форматі JPEG; - баланс між мінімальним обсягом файлу у Кб (орієнтовано до 500 Кб одна сторінка формату А 4) і якістю зображення, достатньої для перегляду на екрані (візуальний контроль); - максимальний лінійний розмір зображення – візуально не повинен бути менш ніж розмір оригінального документа, має бути оптимізований для перегляду на екрані не меньше 1024*768 px; - стиснення зображення не повинно змінювати пропорції та середній лінійний розмір зображень.
Cистема керування електронними колекціями ВИМОГИ до вхідного масиву зображень і метаданих оцифрованих документів та структури файлового сховища 3. Вимоги до якості зображень оцифрованих книг. - зображення мають бути оцифрованими у кольорі; - книги оцифровуються повністю, включаючи обкладинку, форзаци, початкові та прикінцеві чисті аркуші та усі аркуші, починаючі з першої сторони обкладинки або першої сторінці першого аркушу за відсутністю обкладинки; - документи оцифровуються, починаючі з першої сторони обкладинки або першої сторінки першого аркушу за відсутністю обкладинки, далі – розворотами; - зображення розворотів вирівнюються по середині розвороту (корінцю документа або стику аркушів); - зображення розворотів розрізаються посторінково по корінцю розвороту без утрат середніх частин зображень; - посторінкові зображення вирівнюються за текстом; - усі зображення обрізуються до краю обкладинки документа, при цьому краї документа мають бути повністю збережені у зображені, межа між краєм документа та краєм зображення визначається візуально і мусить бути не великою, але достатньою для візуального відтворення усього краю документа.
Cистема керування електронними колекціями ВИМОГИ до вхідного масиву зображень і метаданих оцифрованих документів та структури файлового сховища 4. Назви файлів зображень: - в імені файлу використовується наскрізна нумерація починаючі з одиниці для файлу першого зображення (перша сторона обкладинки або перша сторінка першого аркуша для документів без обкладинки); - в імені файлу використовуються 8 цифр, починаючі з “ 1” з початковими нулями, які надаються до порядкового номера кожного файлу, починаючі з першого оцифрованого зображення; - використовується трьохлітерне розширення маленькими літерами. jpg для JPEG зображень; - наприклад, перша сторінка: 00000001. jpg ; десята: 00000010. jpg 5. Назви файлів зображень іконок, а також представлень оцифрованого документу в інших файлових форматах надаються латинськими літерами, допускається використання цифр та символу підкреслювання. Службові символи і кириличні літери у назвах файлів заборонено!
Cистема керування електронними колекціями ВИМОГИ до вхідного масиву зображень і метаданих оцифрованих документів та структури файлового сховища 6. Структура файлового масиву Формується як множина директорій (папок), що створюються для кожного оцифрованого документа. Назва папки відповідає порядковому номеру книги у переліку бібліографічних описів, що надаються згідно п. 6. Для кожного документу загальна папка містить папки з файлами, що мають назви: broadside – зображення розворотів книг у форматі JPG; page – посторінкові зображення у форматі JPG; cover – зображення для іконки. Для представлень у інших файлових форматах створюються директорії з назвою відповідно до розширення файлу. Наприклад, PDF представлення ресурсу у pdf флрматі.
Cистема керування електронними колекціями ВИМОГИ до вхідного масиву зображень і метаданих оцифрованих документів та структури файлового сховища 7. Вимоги до метаданих оцифрованих книг В текстових форматах надаються наступні відомості про документ: - бібліографічний опис відповідно до ДСТУ ГОСТ 7. 1: 2006 – надається списком до кожної групи документів, що завантажуються до DC-Visu; -масиви текстів для подання змісту і забезпечення навігації у оцифрованої книжці: анотація, зміст, іменні, хронологічні, тематичні або предметні покажчики, глибина ієрархії котрих – до 5 рівнів, назви малюнків, відомості про фізичні дефекти оригіналів, відомості про штампи, маргіналії тощо. 8. Унікальна адреса ресурсу URL Формується за вимогами DC-Visu таким чином: ім'я_сайту/uploads/type/id/format/filename. ext DС-Visu
Cистема керування електронними колекціями
Cистема керування електронними колекціями РОЗРОБКИ НАПРАЦЮВАННЯ ВПРОВАДЖЕННЯ СУМІСНІСТЬ Unimark MARK-21 Dublin. Cor CIDOC/CRM LIDO Науково-уніфікований паспорт музейного об'єкту
Специализированный центр БАЛИ (Киев, Украина) Business Activity & Libraries Informatisation http: //www. demo. dcvisu. com/documents/view/12 http: //lib. npu. edu. ua/new-collections/collections http: //digital. warmuseum. kiev. ua
Специализированный центр БАЛІ (Киев, Украина) Директор Олейник Вадим Васильович Контактная инфомация: tel: +38 -044 -360 -30 -66 fax: +38 -044 -390 -01 -30 E-mail: olejnik@ukr. net, Адрес предприятия: Украина, г. Киев, ул. Боженко , 83 www. scbali. com Контактное лицо: Баркова Ольга Валентиновна tel: +38 -050 -643 -54 -21 E-mail: olgabarkova@gmail. com
cbdebffc6f2248bfd031af966a3432da.ppt