1 Курс «Интернет-технологии» Лекция 2 Поиск информации и

Скачать презентацию 1 Курс «Интернет-технологии» Лекция 2 Поиск информации и Скачать презентацию 1 Курс «Интернет-технологии» Лекция 2 Поиск информации и

37834-web-02_bow_tie_and_search1.ppt

  • Количество слайдов: 26

>1 Курс «Интернет-технологии»   Лекция 2  Поиск информации и его документирование 1 Курс «Интернет-технологии» Лекция 2 Поиск информации и его документирование

>2 Поиск информации и его документирование План лекции Рекомендуемая литература  Общая организация поиска 2 Поиск информации и его документирование План лекции Рекомендуемая литература Общая организация поиска по теме Модель веб-пространства Базовая структура HTML-документа Особенности лабораторных работ, связанных с поиском

>3 Поиск информации и его документирование Общая: Кузьмин А.В., Золотарева Н.Н. Поиск в Интернете. 3 Поиск информации и его документирование Общая: Кузьмин А.В., Золотарева Н.Н. Поиск в Интернете. Как искать, чтобы найти. – СПб.: Наука и техника, 2006. – 160 с. Крупник А. Поиск в Интернете: самоучитель. СПб: Питер, 2001. – 272 с. Байков В.Д. Интернет: поиск информации и продвижение сайтов. - СПб.: БХВ – Санкт-Петербург, 2000. – 288 с. Рекомендуемая литература

>4  Поиск информации и его документирование Общая: Кузьмин А.В., Золотарева Н.Н. Поиск в 4 Поиск информации и его документирование Общая: Кузьмин А.В., Золотарева Н.Н. Поиск в Интернете. Как искать, чтобы найти. – СПб.: Наука и техника, 2006. – 160 с. Крупник А. Поиск в Интернете: самоучитель. СПб: Питер, 2001. – 272 с. Байков В.Д. Интернет: поиск информации и продвижение сайтов. - СПб.: БХВ – Санкт-Петербург, 2000. – 288 с. По ведущим поисковым системам: Абрамзон М. Яндекс для всех. – СПб.: БХВ-Петербург, 2007. – 544 с. Гусев В.С. Google: эффективный поиск. Краткое руководство. – М.: «Вильямс», 2006. – 240 с. Рекомендуемая литература

>5  Поиск информации и его документирование История поисковых компаний: Вайз Д. А., Малсид 5 Поиск информации и его документирование История поисковых компаний: Вайз Д. А., Малсид М. Google. Прорыв в духе времени. – М.: Эксмо, 2007. Вламис Э., Смит Б. Бизнес-путь: Yahoo! Секреты самой популярной в мире Интернет-компании. – СПб.: Идательство «Крылов», 2003. – 256 с. Рекомендуемая литература

>6  Поиск информации и его документирование История поисковых компаний: Вайз Д. А., Малсид 6 Поиск информации и его документирование История поисковых компаний: Вайз Д. А., Малсид М. Google. Прорыв в духе времени. – М.: Эксмо, 2007. Вламис Э., Смит Б. Бизнес-путь: Yahoo! Секреты самой популярной в мире Интернет-компании. – СПб.: Идательство «Крылов», 2003. – 256 с. Теория поиска: Ашманов И., Иванов А. Оптимизация и продвижение сайтов в поисковых системах. СПб: Питер, 2008. – 400 с. Ландэ Д.В. Поиск знаний в INTERNET. Профессиональная работа.: Пер. с англ. – М.: «Вильямс», 2005. Рекомендуемая литература

>7  Поиск информации и его документирование Поиск информации в Интернете http://pechischev.pp.ru/index/0-4 Иван Михайлович 7 Поиск информации и его документирование Поиск информации в Интернете http://pechischev.pp.ru/index/0-4 Иван Михайлович Печищев Пермский государственный университет Информационно-поисковые системы “http://ru.wikipedia.org/wiki/Поисковая система” Теория информационного поиска http://dwl.kiev.ua/ Дмитрий Владимирович Ландэ, докт. техн. наук, Соломонов Университет, Киев Учебные курсы Yandex

>8 Поиск информации и его документирование Общая организация  поиска по теме в рамках 8 Поиск информации и его документирование Общая организация поиска по теме в рамках курсах «Интернет- технологии»

>9 Поиск информации  и его документирование 3-11 недели 9 Поиск информации и его документирование 3-11 недели

>10  Поиск информации и его документирование Пример поисковой  таблицы 10 Поиск информации и его документирование Пример поисковой таблицы

>11 Поиск информации и его документирование В таблицы включаются результаты только по наиболее характерным 11 Поиск информации и его документирование В таблицы включаются результаты только по наиболее характерным и показательным запросам (минимум на трех языках минимум по 5-7 запросов на каждом языке) с использованием ведущих поисковых систем (5-7), ориентированных на украиноязычные, русскоязычные и англоязычные ресурсы. При этом обязательными являются следующие запросы: Тема выпускной работы на различных языках Слова и/или словосочетания, входящие в название темы Руководитель и тематика его исследований Слова и/или словосочетания по различным аспектам и задачам темы Требования к поиску

>12 Поиск информации и его документирование Русскоязычные: Google.ru (www.google.ru): <количество страниц> Yandex (www.yandex.ru): <количество 12 Поиск информации и его документирование Русскоязычные: Google.ru (www.google.ru): <количество страниц> Yandex (www.yandex.ru): <количество страниц> Rambler (www.rambler.ru): <количество страниц> Украиноязычные: Google.ua (www.google.com.ua): <количество страниц> Yandex.ua (www.yandex.ua): <количество страниц> Meta (www.meta.ua): <количество документов> Англоязычные: Google (www.google.com): <количество страниц> Yahoo (www.yahoo.com): <количество документов> MSN (www.msn.com): <количество страниц> Основные поисковые системы:

>13 Поиск информации и его документирование (http://news.netcraft.com/, 2006 Рост объемов информации в Интернет Количество 13 Поиск информации и его документирование (http://news.netcraft.com/, 2006 Рост объемов информации в Интернет Количество активных хостов с 2000 года выросло с 5 млн до 50 млн

>14  Поиск информации и его документирование Рост объемов информации в Интернет Открытый Web: 14 Поиск информации и его документирование Рост объемов информации в Интернет Открытый Web: > 20 млрд. документов > 100 млн. web-сайтов Рост: ~10 млн. документов в месяц ~ 1 млн. сайтов в месяц Скрытый Web: 20-50 млрд. документов

>15 Поиск информации и его документирование Рост объемов информации в Интернет Открытый Web: 15 Поиск информации и его документирование Рост объемов информации в Интернет Открытый Web: > 20 млрд. документов > 100 млн. web-сайтов Рост: ~10 млн. документов в месяц ~ 1 млн. сайтов в месяц Скрытый Web: 20-50 млрд. документов

>16 Поиск информации и его документирование Модель Web-пространства Bow Tie (А. Брёдер) 27% 16 Поиск информации и его документирование Модель Web-пространства Bow Tie (А. Брёдер) 27% CSS 22% IN 22% OUT 22% «отростки» 7 % «острова» Институт поиска и анализа текстов (США) на базе исследования 200 млн страниц, 1999 год

>17 Поиск информации и его документирование Основные свойства модели Брёдера Пропорции основных категорий web-страниц 17 Поиск информации и его документирование Основные свойства модели Брёдера Пропорции основных категорий web-страниц в течение времени остаются неизменными, несмотря на значительное увеличение общего объема web-ресурсов. Модель Bow Tie примерно одинакова для различных подмножеств web-пространства, т.е. обладает фрактальными свойствами С большой вероятностью случайно выбранные web-страницы окажутся никак не связанными

>18 Поиск информации и его документирование Дополнительные свойства модели Брёдера Среднее расстояние между страницами 18 Поиск информации и его документирование Дополнительные свойства модели Брёдера Среднее расстояние между страницами с односторонними связями – 16 Среднее расстояние между страницами с двусторонними связями – 7-8 Никакие поисковые машины не могут найти «острова», если на них не ведут гиперссылки Недостаток модели: недооценка количества «островов» По оценке компании BrightPlanet в 2000 году число скрытых ресурсов в интернете было в сотни раз больше, чем доступных через поисковые системы!

>19 Поиск информации и его документирование  Динамически генерируемые страницы Информация из баз данных 19 Поиск информации и его документирование Динамически генерируемые страницы Информация из баз данных Файлы нераспознаваемых форматов Системы интерактивного взаимодействия с пользователем Сайты, защищенные паролем Прочее Скрытый Web (deep Web, invisible Web):

>20 Поиск информации и его документирование  Сайты, защищенные паролем и берущие плату за 20 Поиск информации и его документирование Сайты, защищенные паролем и берущие плату за доступ, по некоторым оценкам, составляют всего 10% скрытого Web Пример: Система БД Dialog www.dialog.com Создана в 1965 году. Содержит 900 баз данных, доступных 700 тыс. пользователей, которые просматривают более 17 млн. документов в час! Услугами Dialog пользуются в более чем 100 странах Скрытый Web (deep Web, invisible Web):

>21 Поиск информации и его документирование Скрытый Web (deep Web, invisible Web): Крупнейший каталог 21 Поиск информации и его документирование Скрытый Web (deep Web, invisible Web): Крупнейший каталог скрытых ресурсов: www.completeplanet.com Содержит более 100 тыс. ссылок Другие известные каталоги – www.bighub.com www.invisible-web.net

>22 Поиск информации и его документирование Веб-пространство и поисковые системы A, B, C, D 22 Поиск информации и его документирование Веб-пространство и поисковые системы A, B, C, D –области, охватываемые поисковыми системами (10-30%) 1 – часть ядра, охватываемая всеми поисковыми системами 2 – видимое ядро 3 – невидимое ядро 4 – доступный системе А скрытый Web 5 – полностью скрытый Web

>23 Поиск информации и его документирование Базовая структура HTML-документа 23 Поиск информации и его документирование Базовая структура HTML-документа

>24 Поиск информации и его документирование Базовая структура HTML-документа 24 Поиск информации и его документирование Базовая структура HTML-документа

>25 Повышение эффективности поиска:  Opera 9.Х – экспресс-панель Поиск информации и его документирование 25 Повышение эффективности поиска: Opera 9.Х – экспресс-панель Поиск информации и его документирование

>26 Лабораторная работа:   ПОИСК ИНФОРМАЦИИ  И ЕГО ДОКУМЕНТИРОВАНИЕ  Цель работы: 26 Лабораторная работа: ПОИСК ИНФОРМАЦИИ И ЕГО ДОКУМЕНТИРОВАНИЕ Цель работы: Первичный поиск информации по теме выпускной работы и его документирование. Задание: Выполнить тематический поиск информации и оформить отчет о результатах поиска. Найти в интернете принципы работы поисковых систем. Понимать разницу в работе Википедии, Вольфрама и поисковых систем. Поиск информации и его документирование