Поисковики.ppt
- Количество слайдов: 23
Поиск информации
1 - роботы поисковых систем – спайдер (spider) и краулер (crawler). l Краулер – это робот, который собирает ссылки на сайтах, проходя по ним. l 1 маршрут краулер переходит по первой попавшейся ему ссылке на следующую страницу, там происходит то же самое, и этот путь продолжается, пока краулер не зайдет в тупик и повторяет эту операцию со следующими ссылками. l 2 маршрут : краулер сначала определяет все страницы, расположенные вокруг начальной, а потом для каждой определенной страницы ищется свое окружение. l Больше «любят» короткие адреса страниц.
Спайдер l –задача заключается в скачивании страниц Интернета.
модуль индексатора l Все скачанные спайдером страницы проходят тщательный анализ, в ходе которого обрабатывается текстовое содержание страницы, ее структурные элементы, HTML-код, ссылки и т. д. l База данных поисковой системы - огромное хранилище информации – индекс. l базу данных нужно все время обновлять и расширять - финансовых вложений – выживет сильнейший!
Модуль ранжирования l определяет, какое место будет занимать сайт в результатах поиска.
пользовательский интерфейс l создание максимально удобного и понятного пользователю интерфейса. l Конечно, все поисковые системы отличаются друг от друга, и многие поисковики держат в секрете нюансы работы своих алгоритмов.
Что ищем? l Свет мои, зеркальце! скажи l Да всю правду доложи: l Я ль на свете всех милее, l Всех румяней и белее?
Поиск информации в Интернете/Поиск файлов l Найти файл qwer. dll из дистрибутива офисного пакета с условным названием Super. Office. l Введите поисковый запрос qwer. dll Super. Office. l FTP-сервер – н-р, proisk. ru l Отличие этой поисковой системы от обычных поисковых систем, таких как Yandex, Rambler, Aport и т. п. в том, что эти системы осуществляют поиск на WWW серверах и html страницах по их содержимому, в то время как File. Search ищет файлы на FTPсерверах по именам самих файлов и каталогов. l Если вы ищете какую-либо программу, или еще что-то, то на WWWсерверах вы скорее найдете их описание, а с FTP-серверов сможете перекачать их к себе. l шаблон (например, 'far*. exe' или '*. mpg')
Поиск информации в Интернете/Поиск программного обеспечения Большая популярность среди российских пользователей снискали l СОФТ@Mail. Ru ( http: //soft. mail. ru/ ), l Freeware ( http: //freeware. ru/ ) l Softodrom ( http: //www. softodrom. ru/ ). l l Из зарубежных каталогов программного обеспечения следует отметить Download. com ( http: //www. download. com/ ) и Tucows Downloads ( http: //www. tucows. com/ ).
Поиск информации в Интернете/Поиск законодательного акта l Consultant. ru. l Специальная интернет-версия. Включает федеральное законодательство, законодательство Москвы, Московской области, Санкт-Петербурга и Ленинградской области, судебные акты ФАС округов, финансовые консультации, схемы корреспонденций счетов, законопроекты, международные правовые акты и др. l Интернет-версия "Налоги и бухучет". Содержит все необходимые в практической работе документы по налогообложению и бухучету. l Интернет-версия "Региональное законодательство". Включает законодательство 79 субъектов РФ: новые поступления документов и каталоги.
Поиск информации в Интернете/Советы по поиску информации в Интернете l Проверяйте орфографию. l Используйте синонимы. фотографии | фотоснимки
Поиск информации в Интернете/Советы по поиску информации в Интернете l Ищите больше, чем по одному слову. l Не пишите большими буквами Например, "группа Черный кофе", "телепередача Здоровье". l Применяйте редкие слова, Не употребляйте очень распространенных терминов. l Добавить в «Избранное» !
Поиск информации в Интернете/Советы по поиску информации в Интернете/ Яндекс l Нажмите на ссылку "найти похожие документы". l Используйте знаки "+" и "-" Чтобы исключить документы, где встречается определенное слово, поставьте перед ним знак минуса. l И наоборот, чтобы определенное слово обязательно присутствовало в документе, поставьте перед ним плюс. l l Обратите внимание, что между словом и знаком плюс-минус не должно быть пробела. l Например, если вам нужно описание Парижа, а не предложения многочисленных турагентств, имеет смысл задать такой запрос "путеводитель по парижу -агентство -тур". l Чтобы найти цитату из Гамлета, надо задать запрос "+быть или +не быть".
l Поиск картинок и фотографий l Яндекс умеет искать не только в тексте документа, но и отыскивать картинки по названию файла или подписи. Для этого перейдите в "расширенный поиск". Для поиска картинки предусмотрены два поля. В поле "Название картинки" вписываются слова для поиска по названиям картинок, обычно появляющихся, когда к картинке подводится курсор. Например, название картинки "Венера" выдаст все страницы с картинками Венеры (всего, что можно понимать под этим словом). l В поле "Подпись к картинке" вписывается название файла, содержащего картинку. Например, запрос dog найдет в Интернете все картинки, в имени файла которых встречается слово "dog". С большой вероятностью эти картинки связаны с собаками.
Поиск информации в Интернете/Советы по поиску информации в Интернете l Поиск картинок и фотографий l Расширенный поиск l Поиск без учета морфологии l Перед термином ставится знак "!". Сделаем это с нашим примером: l !информация_!база_!марп_!данных_…
l Поиск с оператором И l Оператор ИЛИ в строгом запросе обозначается запятой. l Оператор И (&) означает, что текст должен содержать все термины или логические выражения, соединенные данным оператором. l В языке запросов Яndex один значок оператора означает его действие в пределах абзаца, а два подряд - в пределах всего текста. Используем наш пример: l информация&&база&&марп&&данных&&…
l Поиск с расстоянием. Яndex позволяет задавать порядок следования и расстояние между словами. l Расстояние между словами А и В равно: 1 ( В следует сразу за А ), 2 ( В следует за А через одно слово ) и т. д. Или -1 ( В стоит перед А ), -2 … Знак "/" между словами, за которым стоит число, означает, что расстояние между ними не должно превышать этого числа слов. l Например, "развитие/3 предпринимательства" означает, что должны быть найдены документы, в которых содержатся оба слова, и расстояние между ними не должно превышать 3 слов. l В общем виде это ограничение задается в форме /(nm), где n - минимальное, а m максимально допустимое расстояние. Отсюда следует, что запись /n эквивалентна /(-n+n), а запись /+n эквивалентна /(+n+n). l Когда знаки ограничения стоят после двойных операторов, то употребленные там числа - это расстояние не в словах, а в абзацах. l Пример: развитие/(+1+4) предпринимательства - слова должны идти друг за другом в таком порядке на расстоянии от 1 до 4 слов. l Пример: развитие/+1 предпринимательства - поиск словосочетаний "развитие предпринимательства". Результат: 722 документа.
Mozilla Firefox l l l свободно распространяемый браузер. Второй по популярности браузер в мире. В нем присутствуют вкладочный интерфейс, проверка орфографии, поиск по мере набора, "живые закладки", менеджер закачек, поисковая система. Новые функции можно добавлять при помощи расширений.
l Оператор НЕ l В языке Яndex этот оператор обозначается "~", и так же его одинарное использование означает исключение следующего за ним термина в пределах абзаца, а двойное - в пределах всего текста. l Пример: предприятие~~малое - поиск по слову "предприятие" за исключением текстов, содержащих слово "малое".
l Поиск по словосочетанию или фразе l Искомое словосочетание в запросе заключается в кавычки. l Пример: "малое предприятие".
l Сложный запрос l Яndex позволяет использовать вместо слов целые логические выражения, при этом его нужно заключить в скобки. l Пример: (малое, среднее)/+1 предприятие задает поиск документов, содержащих любое из словосочетаний "малое предприятие" или "среднее предприятие".
l Поиск в найденном l Позволяет осуществить поиск по документам, найденным по предыдущему запросу. l Для этого в конце запроса нужно поставить "$$" или просто сделать отметку в окошке "поиск в найденном", расположенном на странице запроса. l Эта функция очень удобна для последовательного сужения поиска.
l http: //soc-work. ru/ l www. mysitex. com/sitex/about/. . . /SPortal/ social. htm Si. Tex – Социальный портал
Поисковики.ppt