ЗАНЯТИЕ 2.ppt
- Количество слайдов: 45
ЗАНЯТИЕ 2 ТЕХНОЛОГИИ ЭЛЕКТРОННЫХ БИБЛИОТЕК
Мы свидетели становления Глобального Информационного общества, под которым понимается «ступень развития цивилизации, для которой характерно увеличение роли ИКТ в ВВП, создание глобального единого информационного пространства, которое обеспечивает эффективное информационное взаимодействие людей – непрерывный доступ к мировым информационным ресурсам и удовлетворение социальных и личностных потребностей людей в информационных продуктах и услугах (сервисах)» (Библиотечная Энциклопедия. – М. : Пашков Дом, 2007
Итак, Появление и бурное развитие Интернета и возникновение Интернет-сообщества привело к бурному росту объемов информации и поставило перед человечеством проблему информационного переполнения: это одна из самых больших проблем современного общества. Проблема доступа к информационным ресурсам определяет необходимость построения сервиса на основе цифровых коллекций.
Возникновение проблемы Информационного переполнение в значительной мере определяет ся ростом Интернета, Гипермедиа связывает в единый объект разнородные объекты, вплетают элементы в глобальную Гипермедиа-структуру –Всемирную Паутину. Интернет вытупает как всемирное хранилище, открывающее доступ пользователям к миллио- нам и миллиардам различных Информацион- ных ресурсов, независимо от их географической и национальной локализации.
Всемирная паутина - Web World Wide Web (его часто называют Веб): глобаль- ная распределенная гипермедийная информацион- ная система. Вместе с тем, Веб является средой функционирования приложений с распределенным доступом через Интернет. Создатель «всемирной паутины» Тим Бернер-Ли: «Веб разрабатывался как информационное пространство, полезное не только для коммуникации человека с человеком, но и пространство, в котором эффективное содействие могут оказывать также и машины» . Информационное наполнение Веб составляет множество взаимосвязанных веб-сайтов.
Приведем полезные Определения Веб-браузер это программа для навигации по информационному наполнению Всемирной паутины или локальной гипермедийной информации, хранимой на данном компьютере, и его визуализации. Веб-ресурс это объект данных или сервис, идентифицируемый универсальным идентификатором ресурса. Ресурсы доступны в разнообразных представлениях - Форматы данных, языки, размерах и т. д.
Определения Веб-сайт это основанный на веб-технологиях информационный репозиторий, представля- ющий собой совокупность взаимосвязанных веб-страниц, поддерживаемых на одном узле Интернета и доступных с помощью Веб-сервера и обладающих содержательной общностью. Роль входного интерфейса вебсайта выполняет специальная веб-страницадомашняя страница сайта. Навигацией по гиперссылкам от домашней страницы должна быть доступна любая страница вебсайта.
Определения Веб-страница: это предназначенная для одновременной визуализации Веббраузером совокупность информации, продуцируемая из одного и более вебресурсов и идентифицируемая единым унифицированным идентификатором Ресурса. Веб-технология – технология Всемирной паутины.
Определения 1. Веб-сервер: программа, выполняющая функции системы управления веб-сайтами в данном узле Интернета. Веб-сервер осуществляет обработку запросов пользователей Всемирной паутины на веб-страницы по протоколу http. 2. Веб-сервером называется также компьютер, на котором выполняется программа в смысле пункта 1.
Интернет-Портал Веб-Портал или Интернет-Портал: Информационная система, являющаюся ядром, механизмом интеграции на уровне презентации основных источников информации и сервисов. Портал для пользователя обеспечивает единую точку входа в информационную систему для доступа к информации.
Информационный Поиск и использование нужной информации становится все более сложным, трудоемким и неэффективным, несмотря на огромные научно-технические и организационнофинансовые усилия. Мировым сообществом уже осознано направление главного «удара» в борьбе с информационным взрывом – переход от хранения и обработки данных к накоплению и обработке знаний.
Web 2. 0 Новое поколение Всемирной паутины получило название Web 2. 0 или Веб 2. 0. Web 2. 0 отличается возможностью поддержки информации и доступа к ней на семантическом уровне. Основная нагрузка по обработке информации переносится с человека на средства ИКТ: информационнокоммуникационных технологий. Основой Веб 2. 0 является новая технологическая платформа: комплекс стандартов XML.
Ричард Уотсон Футуролог (Великобритания) «К 2050 году интернет, киноиндустрия, фармакология, компьютерная отрасль и наука о мозге станут единым целым, предлагая человеку всеобъемлющее пространство и безграничные возможности для развлечений и самовыражения. Если web 2. 0 пропел песнь кооперации юзеров, а web 3. 0 несет с собой семантический переворот. »
то «четвертый веб» предложит чувственный опыт пребывания в Сети. Мы будем ощущать виртуальное пространство всеми пятью чувствами, одевшись в специальную униформу и наглотавшись таблеток. Но все же один продукт наших дней доживет до 2050 -го. Это местные газеты, которые будут читать старики, напуганные технологическим беспределом вокруг.
Переход к накоплению знаний Один из Подходов, в рамках которого для решения проблемы перехода от хранения и обработки данных к накоплению и обработке знаний, сейчас сосредоточены значительные научно-технические ресурсы, - это миграция от классического Интернет (WWW) к семантичес- кому Semantic Web. Международная организа- ция World-Wide Consortim, сокращенно W 3 C, разрабатывающая технологии глобальной сети, предложила новую концепцию развития интернета - Semantic Web, направленную на изменение принципов функционирования Сети.
Semantic Web обеспечивает машинное управление информационным пространством • 2000 г. – предложена концепция Semantic Web (Tim Berners-Lee) • Расширение WWW, в рамках которого Web-контент представляется в форматах, обеспечивающих его использование программными агентами, позволяя им искать, разделять и интегрировать информацию значительно легче, чем это происходит сейчас (это определение концорциума W 3 C).
2007 г. – концепция Semantic Wave К 2012 году в 80% общедоступных вебсайтах будет, в той или иной степени, использоваться семантический гипертекст для создания семантических веб-документов (с вероятностью 0. 7), а в 15% общедоступных веб-сайтов будут использоваться развитые веб-онтологии для создания семантических баз данных (с вероятностью 0. 6) Прогноз Gartner Group
Основные Результаты • Уже создан базис стандартизации в виде разработки технологий XML-, RDF(S)-, OWL- и SPARQL-спецификаций • Активно ведутся исследования по теории Semantic Web • В последнее время начаты разработки прикладных интеллектуальных систем, функционирующих в сети Интернет
Semantic Wave-эра, в отличие от эпохи Интернет, еще только приближается На этом пути существует значительное число научных, технических, технологических и чисто человеческих проблем: Доступность семантического контента; Доступность онтологий и средств их разработки, а также эволюция онтологий; Мультиязыковость; Визуализация и стабильность.
Семантический контент Что требуется для того, чтобы обеспечить доступность семантического контента, по Бернесу -Ли: «подход семантического веба базируется на разработке языков для выражения информации в форме, пригодной для машинной обработки» . Семантизация Web-контента является основной проблемой на пути формирования и использования пространств знаний, так как основная масса информации на Web не представлена в Semantic Web-форматах и нет надежды, что эта работа может быть выполнена вручную.
По определению W 3 C: «Семантический Веб – это расширение традиционного веба в направлении существенно лучшего определения смысла информации, позволяющего компьютерам и людям эффективнее выполнять совместную работу. Мы хотим, чтобы данные в вебе были определены и связаны ссылками так, чтобы их можно было легче находить, интегрировать, автоматизировать и повторно использовать в различных приложениях…как автоматизированными средствами, так и людьми» . .
Безбрежность Сети и, в то же время, часто скудость требуемой информации, полученной при поиске в Сети, - типичная ситуация, с которой сталкивается современный пользователь Интернета. Повсеместное распространение компьютеров во всех сферах деятельности и бурное развитие Интернета делают доступным все больший объем информации. Поэтому привычные, отлаженные приемы обработки информации становятся все менее эффективными. Поиск нужной информации стал серьезной проблемой.
Поисковые машины, индексирующие htmlстраницы, находят много ответов на запросы и охватывают большую часть всего веба. Однако, количество неудовлетворительных, возвращаемых ответов на запрос, слишком велико, поскольку не существует понятия «правильности» ответов на запросы. Причина в том, что поис основан на сравнении строки запроса со строками документов. Но при этом никак не учитывается смысл информации, ради которой проводится поиск. Такая ситуация возникла сравнительно недавно.
Именно тогда, когда развитие Интернета привело к тому, что объемы информации, получаемой при поиске, стали намного превышать возможности человеческого восприятия. Отметим, что совокупность технологий первоначального Интернета, названная впоследствии Web 1. 0, была ориентирована только на формальное содержание документа (контент). В настоящее время используется набор технологий, который принято обозначать Web 2. 0 и который также оперирует в основном с контентом. Ведущие разработчики программного обеспечения
Oracle, IDM, Sun, Microsoft в качестве основного направления развития Интернета на ближайшее будущее разрабатывают новую систему, обозначенную как Web 3. 0 и основанную на семантической обработке информации. Особенность этой системы состоит в том, что программные модули (а не пользователи!), опираясь на метаданные и метабазы, осуществляют поиск информации по содержимому – включая поиск по видео- и цифровым изображениям. Основная задача Web 3. 0 состоит в решении самой сложной
проблемы развития Интернета – поиска значимой информации и отделения ее от информационного мусора. Семантический веб рассматривает Интернет в целом как глобальную базу данных (БД). Точно так же, как разработчик запрашивает сведения из обычной БД и создает приложения, оперирующие этой информацией, любой пользователь семантической Сети получает возможность собирать данные и в соответствии со своими потребностями строить приложения,
обрабатывающие взаимосвязанные, но разрозненные сведения из различных источников. Бернерс-Ли: «основной ролью технологий семантического веба является интеграция данных, содержащихся в различных приложениях» . Название Semantic Web появилось в статье 2001 г. В русскоязычной компьютерной литературе используют термины «семантический веб» , «семантическая сеть» и «семантическая паутина» . Слово «семантика» происходит от греческого semantikos, т. е. «важное значение» . Компьютер должен понимать семантику документа в том
смысле, что он не просто интерпретирует набор символов, содержащихся в документе, а выделяет смысл документа. Современное определение Semantic Web: «Семантическая паутина – часть глобальной концепции развития Интернета, целью которой является реализация возможности машинной обработки информации, доступной во Всемирной паутине. Основной акцент концепции делается на работе с метаданными, характеризующими свойства и содержание ресурсов Всемирной паутины, -
вместо используемого в настоящее время текстового анализа документов. В семантической паутине предполагается повсеместное использование: 1) URI - универсальных идентификаторов ресурсов и 2) онтологий и языков описания метаданных. Сейчас большая часть информации в сети совершенно не приспособлена к компьютерной, обработки – не удалось создать программы, которые были бы способны разобраться в смысловой составляющей текста.
Например, просто сгруппировать несколько текстов в одну общую категорию. В семантической паутине предлагается использовать форматы описания, доступные для машинной обработки позволяющие решить эту задачу. Семантический веб создается как надстройка над уже существующими системами сетей, но при этом поиск и обработка информации организуются как машиноориентированные. Чтобы это стало возможным, производится дублирование содержания контента в метабазы.
Информация, предназначенная для людей, готовится в виде текста, образов и звуков, а для машин – в виде специальных кодов. Семантический веб объединяет эти виды информации в единую структуру, в которой каждому элементу «человеческой» информации будет соответствовать машинный код – специальный смысловой тег. Метаданные должны в обязательном порядке включать сведения о том, как, где и кем была собрана данная информация и как она структурирована. Уже сейчас работают сайты, созданные по технологии Web 3. 0.
ИНТЕГРАЦИЯ ЗНАНИЙ УРОВНИ ИНТЕГРАЦИЙ ЗНАНИЙ: 1. Web 2. Semantic Web Современный этап информатики – это • Переход от Хранения и Обработки данных к Накоплению и обработке знаний, • Формирование интерактивного контента в распределенных сетях. • Роль Онтологий: семантика данных и метаданных. Онтологии обеспечивают Автоматизацию процессов Интеграции Знаний.
Эволюция Интернета The semantic wave embraces four stages of internet growth. The first stage,
• Web 1. 0, поддерживает обмен информацией и получение информации. • Web 2. 0 соединяет индивидуального пользователя, используя интерфейс, и людей в веб – через социальные сети. • Следующая стадия: Web 3. 0 начинает развитие. • Будет поддерживать представление смыслов, соединение знания.
SEMANTIC WAVE Web 3. 0 putting these to work in ways that make our experience of Internet more relevant, useful, and enjoyable. • Web 4. 0 will come later. It is about connecting intelligences in a ubiquitous Web where both people and things reason and communicate together.
ФОРМИРОВАНИЕ ПОЛЯ ЗНАНИЙ • Анализ Предметной области • Классификация Знаний • Структурирование Знаний • Формирование Поля знаний – Извлечение Знаний Информационные технологии, Распределенные информационные системы.
Биоинформатика (пример) Технологический прогресс в области обеспечения биологических исследований привел к тому, что данные стали поступать в очень больших объемах. Если раньше, было так: исследуется один белок – один эксперимент – одна статья, то теперь в одном эксперименте вы изучаете сразу тысячу белков или тысячу генов. И это все равно одна статья. Одна публикация.
Биоинформатика Только когда благодаря компьютерной поддержке вы смотрите на экспериментальные данные сразу на тысячу объектов, у вас возникает необходимость – для того, чтобы анализировать - смотреть на результаты с более общей точки зрения. На результаты массовых опытов, которые делают другие и свободно выкладывают в Интернете. Так был накоплен колоссальный объем данных.
Появилась такая деятельность –направление в новой науке, названной биоинформатика, в середине 1980 -х годов. Но как только стали к научным работникам приходить от эксперимен- таторов такие массовые данные, оказалось, что какие-то абсолютно внятные биологические утверждения можно делать, не проводя собственных опытов, а глядя на опубликован- ные в Интернете чужие результаты – но с общей точки зрения. Анализ данных используется для извлечения знаний из данных и для вывода новых знаний и их интерпретации.
Выводы: • Биоинформатика интегрирует все частные реультаты. • Био. Информатика долгое время была наукой для неудачников, потому что туда приходили криворукие биологи, несложившиеся математики и т. д. • Биоинформатика – это способ заниматься биологией, не наблюдая живые существа, как зоологи, не делая опытов в пробирке, как экспериментальные биологи.
• Биоинформатика – анализирует результаты массовых данных или целых проектов. • Биоинформатика - есть два аспекта. Один – чисто практический. Оказывается, глядя на буковки, или на структуры белков, или на карты белковых взаимодействий, которые получены из таких массовых экспериментов, вы можете делать совершенно конкретные, проверяемые биологические утверждения.
Автоматизация Интеграции Знаний • После возникновения т. н. электронной науки: e-Infrastructure, e-Research community развивается Распределенное интегрированное пространство электронных ресурсов. Ступени Интеграции: 1. Уровень данных и вычислений (обработки) 2. Информационный уровень 3. Уровень знаний
ГЕОИНФОРМАТИКА Представление данных и метаданных в интегрированной среде неоднородных (гетерогенных) информационных ресурсов: e-Infrastructure, SDI – Spatial Data Infrastructure. • Инфраструктура: информационными объектами являются потоки данных в реальном времени - данные спутниковых наблюдений, образующих массивы террабайтового и даже – петабайтового объема.
Контрольные вопросы по материалу Лекции • 1. Сокращение электронно-цифрового разрыва: путь к свободному распространению информации и знаний. • 2. Всемирная паутина Web. • 3. Интернет-сообщество и проблемы Информационного переполнения. • 4. Что такое Веб-браузер. Представление о Веб-ресурсе. • 5. Веб-сайт и веб-сервер.
Контрольные вопросы • 6. Веб-страница. Веб-технологии. • 7. Веб-Портал. • 8. Информационная потребность, информационный запрос. • 9. От информационного общества к обществу знаний: свободный доступ к мировым информационным ресурсам • 10. Представление о Web 2. 0
ЗАНЯТИЕ 2.ppt