Поиск информации.ppt
- Количество слайдов: 26
Эффективный поиск информации, размещенной в сети Internet С. В. Буга
Основные вопросы темы þ Постановка задачи по поиску þ Инструментарий поиска информации þ Принципы функционирования информационно-поисковых систем þ Классификация и специфика основных инструментов поиска информации þ Приемы эффективного поиска информации
Постановка задачи по поиску þ Какую информацию искать? þ Где искать нужную информацию? þ Как искать нужную информацию?
Источники информации в Internet þ Документы, размещенные на сайтах þ Статьи в группах новостей и списках рассылки þ Файлы в архивах и библиотеках файлов þ Справочники адресной информации: Желтые страницы (yellowpages) – по рубрикам Ш Белые страницы (whitepages) – по именам собственным Ш þ Документы в тематических базах данных
Способы поиска информации в Internet þ Поиск “вслепую” þ Использование справочников адресов (специальные книги, лазерные компактдиски; тематические разделы журналов и других изданий) þ Использование инструментов автоматизированного поиска в Internet
Информационно-поисковые системы – это системы, обеспечивающие поиск и отбор необходимой информации по определенным правилам поиска Такие системы используют специальный информационно-поисковый язык
Классификация информационно-поисковых систем Ш по зоне поиска: – локальные – региональные – глобальные – специализированные Ш по назначению: – поиск документов WWW – поиск организаций и персон – поиск файлов
Основное назначение информационно-поисковой системы – поиск релевантной информации по запросу пользователя
Индексирование – описание источников информации для использования в специальных базах данных (индексов), используемых информационно-поисковыми системами Индексирование (создание описаний) может производиться: ● ● ● непосредственно автором(-ами) документов автором-составителем тематического каталога программой-роботом, автоматически описывающей содержание размещенных в сети документов
Определения Поисковая машина (search engine) – компьютерный процессор (программа), осуществляющий перевод (трансляцию) запроса пользователя на информационнопоисковом языке в формальный запрос специализированной базы данных, выполнение соответствующего запроса и предоставление его результатов пользователю
Определения Робот-индексировщик (spider) компьютерный процессор (программа), выполняющий сканирование Internet (последовательный просмотр размещенных в сети документов) и поддержание актуального состояния записей базы данных (индексов), используемой информационно-поисковой системой
Источники для автоматического создания индексов ШЗаголовок документа (Title) ШПодзаголовки разных уровней (используются 6 верхних) ШАннотация ШСписок (Description) ключевых слов (Key words) ШГипертекстовые ШПолный ссылки текст документа
Основные средства поиска информации в Internet Ш Каталоги Ш Локальные поисковые системы Ш Глобальные поисковые системы Ш Метапоисковые системы (поисковые службы) Ш Программы ускоренного поиска
Каталоги WWW Каталог ресурсов WWW – поисковая система с иерархически классифицированным по темам списком ссылок (URL) докуметов WWW Индексы имеют минимальный размер и создаются обслуживающим каталог персоналом Поиск ведется путем последовательного уточнения тем
Примеры каталогов Регистр белорусских WWW-ресурсов www. zubr. com Каталог “Созвездие Интернет” www. stars. ru Каталог Google http: //directory. google. com Yahoo www. yahoo. com Internet Resource Guide for Zoology http: //www. biosis. org. uk/free_resources/resource_guide. html
Простой поиск ШЗапрос набирается вручную без использования или с использованием операторов ШЗапрос формируется выбором категории из списка
Операторы В настоящее время не существует стандартов на синтаксис и количество операторов в запросах, и поэтому различные поисковые машины могут использовать разные варианты синтаксиса Например, поиск в заголовке с помощью оператора 'title' задается следующим образом: Altavista Yandex Aport title: ”текст” $title (текст) title=
Операторы ➢ Title – поиск в заголовках ➢ Url – поиск документа, содержащего определенный адрес или фрагмент URL ➢ Link – поиск документов, ссылающихся на указанный адрес (URL) ➢ Domain – поиск в пределах информации, размещенной на сайтах указанного домена
Операторы, устанавливающие отношения между компонентами запроса And & И – обязательное присутствие объединяемых оператором компонентов ➢ ➢ Or | ИЛИ – присутствие хотя бы одного из указываемых компонентов ➢ Not ! НЕ – отсутствие указываемого компонента
Расширенный (advanced) поиск предусматриваетпри создании запроса использование специального бланка запроса (окно, создаваемое поисковой машиной), при этом операторы расставляются путем выбора из имеющегося списка или расстановкой флажков
Наиболее известные поисковые системы www. google. com www. yachoo. com www. altavista. com www. go. com / www. infoseek. com www. hotbot. com www. northernlight. com www. alltheweb. com
Российские поисковые системы www. yandex. ru www. rambler. ru www. aport. ru
Белорусские поисковые системы http: //all. by http: //akavita. by http: //helloworld. by
Метапоисковые системы компьютерные процессоры (программы), способные осуществлять поиск с использованием нескольких поисковых систем одновременно www. metacrawler. com www. search. com www. excite. com
Программы ускоренного поиска Программы, размещаемые на компьютере пользователя и способные осуществлять: поиск информации с использованием нескольких поисковых систем одновременно Ш сортировку результатов поиска по уровню релевантности Ш Ш удаление дубликатов ссылок § Web. Ferret § Search Spides § Copernic
Поиск адресной информации о персонах и организациях Белые страницы (whitepages) – по именам собственным www. whowhere. com www. bigfoot. com http: //people. yahoo. com Желтые страницы (yellowpages) – по рубрикам www. yellowpages. com