c2cb6ed8dc340b121dc8831a328ba3fe.ppt
- Количество слайдов: 89
Электронный архив в Научной библиотеке университета DSpace в Ур. ГУ Негуляев Е. А. Пятая международная конференция «Science Online» Турция, г. Кемер, 14 мая 2005 г.
План доклада 1. Работа Научной библиотеки Ур. ГУ над оцифровыванием фондов и сбором электронных ресурсов. 2. Попытки организации доступа к электронным ресурсам НБ Ур. ГУ. 3. DSpace в Ур. ГУ.
Хроника: январь 2001 г. z Начата самостоятельная оцифровка фондов библиотеки: y наиболее востребованные издания из фондов Отдела редких книг; y использование графического формата Dj. Vu; y первая оцифрованная книга: Иеринг, Рудольф фон. Борьба за право. — М. , 1874.
Технологический процесс z Представление оцифрованных изданий в виде изображений: y высокая производительность; y сохранение внешнего вида изданий; y нет проблем с дореформенной русской орфографией.
Хроника: июль 2001 г. z Начато формирование цифровой коллекции авторефератов и диссертаций: y договор между Уральским университетом и автором о передаче неисключительных авторских прав; y получение эл. копии от автора и перевод ее в PDF-формат (не сканирование!)
Хроника: конец 2002 г.
Способы доступа z Ссылка в библиографической MARCзаписи (856$u) — доступ через электронный каталог и любые внешние службы, использующие доступ к эл. каталогу по протоколу Z 39. 50: y невозможность объединения в коллекции; y эл. копии невидимы для поисковых машин ( «невидимый веб» ); y нет полнотекстового поиска.
Способы доступа z Раздел «Цифровые коллекции» на сайте регионального библиотечного консорциума «Consensus Omnium: Корпоративная сеть библиотек Урала» : y статичный html-сайт — сложность поддержания в актуальном состоянии, низкая оперативность, минимальная функциональность.
Способы доступа z Локальный доступ на рабочих местах в Научной библиотеке Ур. ГУ: y статичный html-сайт — сложность поддержания в актуальном состоянии, низкая оперативность, минимальная функциональность.
Способы доступа z Интерфейс доступа на сайте Научной библиотеки Ур. ГУ: y динамический сайт (ASP + My. SQL); y простота поддержания в актуальном состоянии; y два вида сортировки (фамилия автора и код специальности); y совместимость с Google, Yandex и т. п.
Хроника: 2003 год z 2 электронных коллекции учебных материалов ( «Введение в литературоведение» и «История отечественной журналистики» ): y около 16 тыс. страниц каждая; y PDF + распознанный текст в режиме «текст под изображением» — возможность полнотекстового поиска.
Хроника: 2004 год z Совместная работа над электронной коллекцией учебных изданий по философии и обмен цифровыми копиями с Научной библиотекой Удмуртского государственного университета (около 15 тыс. страниц).
Объемы: рубеж 2004/2005 гг.
Объемы: рубеж 2004/2005 гг. z Всего более 90 тыс. страниц. z 2/3 имеют текстовую составляющую (результат распознавания или изначально компьютерный текст), соответственно, пригодны для полнотекстового поиска. z Различные пути поступления (в том числе от авторов). z Это всего лишь ресурсы, созданные библиотекой! Ресурсы университета намного больше.
Выводы z Управление электронными ресурсами в таких объемах возможно только с помощью эффективного ПО, которое позволит организовывать и контролировать все основные этапы жизненного цикла электронных документов.
Хроника: февраль 2004 г. z Впервые в стенах НБ Ур. ГУ произносятся слова «репозиторий» и «DSpace» : y 4/02/2004 — письмо в дискуссионный лист «Электронные библиотеки» (diglib@mlist. sgu. ru) с обзором статьи «DSpace vs. ETD-db: Choosing software to manage electronic theses and dissertations» (журнал «Ariadne» , вып. 38, январь 2004 г. ; http: //www. ariadne. ac. uk/issue 38/jones/)
Хроника: август 2004 г. z Пакет документов в рамках проекта НФПК «Совершенствование управлением библиотечными ресурсами в ВУЗах» , в том числе: y профильный стандарт «Электронные информационные ресурсы: Структура, атрибуты, жизненный цикл» : x «Все внутренние электронные ресурсы архивируются в репозитории Ур. ГУ, за исключением электронных изданий, которые не могут быть архивированы из-за особенностей технической или программной реализации» .
Другие документы z «Технологическая схема контроля качества подготовки электронных информационных ресурсов» . z «Интегрированный набор метаданных информационных ресурсов» (локальный профиль метаданных). z Схемы соответствий локального профиля метаданных для RUSMARC и Dublin Core.
Хроника: август-декабрь 2004 z Тестовая инсталляция DSpace (вначале 1. 2 beta 3, затем 1. 2). z Русификация DSpace. z Изучение и модификация схемы метаданных. z Определение структуры репозитория. z Первичное наполнение репозитория.
Хроника: январь-апрель 2005 z Запуск OAI-провайдера для DSpace. z Пополнение репозитория новыми поступлениями электронных документов (текущие поступления в электронную коллекцию авторефератов и диссертаций). z Переговоры о включении в архив материалов, прошедших через редакционно -издательский отдел университета (около 100 наименований в год, начиная с 2002 г. ).
DSpace: основное z Репозиторий — архив электронных документов: y архивирование; y хранение; y поиск. z Open source. z Первоначальная разработка: Hewlett. Packard Research Labs + MIT Libraries.
DSpace: основное z В настоящее время переход к более открытой разработке. z Реализованная в DSpace модель больше всего подходит для крупного научного учреждения. z Более 70 архивов на основе DSpace в настоящее время.
Технические детали z Язык программирования — Java. z СУБД — Postre. SQL 7. 0+, возможна поддержка других СУБД, в т. ч. Oracle (добавлено в новых версиях). z Tomcat. z 1, 5– 2 Gb на диске для полной установки (без учета хранимых электронных документов).
Технические детали z OAI PMH 2. 0. z Handle — поддержка постоянных идентификаторов. z SRW — возможность переадресовать запрос из Z 39. 50 среды и получить ответ.
Аппаратное обеспечение z НБ Ур. ГУ: P-IV 1, 4 Ghz, 512 Mb RAM, 2 х36 Gb Raid. z На 1 физическом сервере расположено 4 виртуальных сервера (http: //lib. usu. ru, http: //www. eril. ru, http: //library. usu. ru, http: //dspace. lib. usu. ru). z Желательно: выделенный двухпроцессорный сервер; объем RAM и дисковых массивов — в зависимости от задач.
Временные затраты z Установка ПО — 1 день для установки по умолчанию. z Русификация — в нашем случае 1, 5– 2 месяца.
Русификация z В НБ Ур. ГУ выполнена русификация пользовательского интерфейса. z Интерфейс не представлен в виде отдельного модуля (это запланировано для версии 1. 3), поэтому необходимо изменение основного программного кода. z Проблемы с сортировкой по алфавиту и т. п. для кириллических символов.
Naming Resources on the Net The Solution Internet Naming Service www. acme. com http: //www. acme. com/chapter. pdf Name = Value(s) 10. 123/xyz = http: //www. acme. com/chapter. pdf Lannom, Larry. Handle System Overview // ERPANET Seminar on Persistent Identifiers. 17/06/2004. http: //www. erpanet. org/events/2004/cork/presentations/ERPANET-CORK-LL. ppt
Naming Resources on the Net The Solution www. newbusiness. com http: //www. newbusiness. com/chapter. pdf Internet Naming Service www. acme. com Name = Value(s) 10. 123/xyz = http: //www. newbusiness. com/chapter. pdf
Взаимодействие ЭЛЕКТРОННЫЕ РЕСУРСЫ РЕПОЗИТОРИЙ Ур. ГУ РЕПОЗИТОРИЙ … OAI Z 39. 50 ЭЛЕКТРОННЫЙ КАТАЛОГ ЭЛЕКТРОННЫЕ РЕСУРСЫ РЕПОЗИТОРИЙ …
DSpace vs. E-Prints DSpace E-Prints Java Perl Postre. SQL, Oracle и др. My. SQL Система постоянных идентификаторов + — Поддержка технических метаданных + — Политика сохранности цифровых материалов + — Язык программирования СУБД
DSpace vs. E-Prints DSpace E-Prints User, Submitter, Reviewer, Approver, Editor, Administrator User, Editor, Administrator Настройка ролей и уровней доступа к каждой коллекции + — Шаблоны метаданных + — Qualified Dublin Core на основе DC Library Application Profile Dublin Core + — Роли Схема метаданных Сложная иерархическая структура репозитория
DSpace: язык запросов z Слова: политическая культура. z Отбрасывание окончаний: политическая культур* z Фраза: "политическая культура". z Логические операторы: политическая AND культура; политическая OR культура; политическая NOT культура. z Операторы включения/исключения: +политическая +элита –культура.
DSpace: язык запросов z Сложные логические выражения: (политическая OR экономическая) AND (этика OR история) политическая этика; политическая история; экономическая этика; экономическая история. z Ограничение поиска рамками отдельного сообщества или коллекции. z Поиск по полному тексту и по полям метаданных.
Спасибо за внимание!
Негуляев Е. А. Электронный архив в Научной библиотеке университета: DSpace в Ур. ГУ Доклад на V Международной конференции «Science Online: электронные информационные ресурсы для науки и образования» (Турция, г. Кемер, 12– 15 мая 2005 г. ) Работа опубликована под Creative Commons Attribution. Non. Commercial-No. Derivs 2. 0 License, http: //creativecommons. org/licenses/by-nc-nd/2. 0/
c2cb6ed8dc340b121dc8831a328ba3fe.ppt