2. Поисковые запросы.ppt
- Количество слайдов: 45
Поиск информации в интернете Сложные запросы в ПС
Не ранжирующее «И» • Оператор не ранжирующее «И» << очень похож на оператор определения слов в одном документе &&, с той лишь разницей, что слово, которое находится справа, влияет на возможность документов попасть в результаты поиска, но не влияет на ранжирование.
Не ранжирующее «И» (пример) • Например, запрос Трутнев && биография найдет документы, где указанные слова будут расположены в пределах одного документа. При этом одно из первых мест в результатах займет, например, документ, в котором будет словосочетание «биография Трутнева» .
Ранжирующее «И» (пример) • А на запрос Трутнев << биография будут найдены документы, где будут присутствовать оба слова, но слово «биография» не будет влиять на ранжирование и первые места в списке результатов поиска займут документы со словом «Трутнев» .
Поиск текста в заголовке страниц • Поиск текста в заголовке страниц (title): $title (запрос) • На запрос Максвелл << $title (биография) будут найдены документы со словом «биография» в заголовке и словом «Максвелл» в тексте. • Причем слово «Максвелл» будет определяющим.
Поиск текста на сайте • Поиск ограничивается группой страниц, с заданным адресом. url= «www. url. ru/cat/*» • Пример: «кот Бублик» << url= «www. exler. ru*» • Будет найдены все упоминания о коте Бублике на сайте www. exler. ru
Поиск файлов • Позволяет ограничить поиск определенным типом файла: HTML, PDF, DOC, PPT, XLS, RTF, SWF. mime= «тип_файла» • На запрос: (инструкция && микроволновая печь) << (mime= «pdf» | mime= «rtf» ) будет найдены документы PDF и RTF, в теле которых присутствуют слова «инструкция» и «микроволновая печь» .
Определение языка текста • Можно отобрать для поиска документы, написанные на определенном языке: • • • русском (ru), украинском (uk), белорусском (be), английском (en), французском (fr), немецком (de). lang= «язык» • Пример: DAAD << lang= «de»
Поиск по дате • Поиск производится только по страницам, дата которых удовлетворяет заданному условию date= «ГГГГ{*|ММ{*|ДД}}» • Пример: date= « 200310*» • По запросу будет производится поиск документов, датированных октябрем 2003 года.
Сложные запросы: выручат скобки • Вы можете строить сколь угодно сложные конструкции, подставляя в каждом из операторов вместо отдельного слова целые выражения. • Чтобы Яндекс при этом правильно понимал вас, заключайте выражения в круглые скобки.
Сложные запросы • Чтобы пореже натыкаться на уменьшение количества результатов, вызванные неверным синтаксисом, используйте несколько правил: 1. Всегда ставьте перед стоп-словами «+» ; 2. Отделяйте операторы поиска в элементах от слов запроса символами «&&» ; 3. По возможности, используйте в сложных запросах «/+1» вместо кавычек.
Анализ сложных запросов
Пример запроса 1 • Общий запрос на тему бокса не совсем релевантен: (бокс|боксерский) • Очевидно, что по результатам поиска будет найдено довольно много документов в том числе и не относящихся к спорту. • Улучшим запрос…
Пример запроса 1 • Отсечем анекдоты, собак, чехлы для техники, душевые, больничную тему. • Запрос (бокс|боксерский) ~~ (анекдот|собака|больничный|медицинский|ду шевая|чехол) выдаст более релевантные документы. После нескольких проверок запрос можно улучшить еще.
Пример запроса 2 • Например, нужно найти резюме жителей Москвы со знанием французского языка, имеющих опыт работы с Windows, Linux. При этом уровень знания французского языка имеет первостепенное значение. • Строим запрос — $title(резюме) && +(москва | !495) && +французский && +linux && +windows
Пример запроса 2 • $title(резюме) && +(москва | !495) && +французский && +linux && +windows • = «В заголовке должно быть слово «резюме» , а в пределах одного документа – слова: «москва» (или код города 495), «французский» , «linux» , «windows» в точной словоформе»
Проблема • ПС так выбирает слова для аннотации результатов поиска, что слово «французский» попадает в них редко — придется открывать все страницы. • Или слово «французский» играет второстепенное значение, так что смысл документов не соответствует запросу. • Переформулируем…
Пример запроса 2 • Можно воспользоваться оператором <<: +французский << ($title(резюме) && +(москва | !495) && +linux && +windows) Теперь слово «французский» будет иметь первостепенное значение для ранжирования, но при этом остальные слова тоже играют роль в результатах поиска.
Пример запроса 3 • Если вы ищете описание мумие, но не хотите наталкиваться на прайсы интернет-магазинов, можете задать такой запрос: мумие << (лечение|лечебный|болезни) ~~ (цена|прайс|рубль|доллар|фирма|магазин) • Будут найдены все страницы, где есть слово мумие, а также любое из слов лечение, лечебный или болезни, и нет ни одного из слов, перечисленных после оператора ~~.
Таблица операторов Yandex Пример Значение "К нам на утренний рассол" Слова идут подряд в точной форме. "Прибыл * посол" Пропущено слово в цитате. полгорбушки & мосол Слова в пределах одного предложения. снаряжайся && добудь Слова в пределах одного документа.
Таблица операторов Yandex Пример Значение технический прогресс +антирес Поиск документов, в которых обязательно встречается определённое слово. Поиск любого из слов. глухаря | куропатку | кого-нибудь не смогешь << винить я должон /2 казнить «Неранжирующее и» : выражение после оператора не влияет на позицию документа в выдаче. Расстояние в пределах двух слов в любую сторону (то есть между заданными словами может встречаться одно слово).
Таблица операторов Yandex Пример Значение государственное дело && /3 улавливаешь нить Расстояние в 3 предложения в любую сторону. нешто я ~~ пойму нешто я -пойму Исключение слова «пойму» из поиска. при моем /+2 уму Расстояние в пределах двух слов в прямом порядке. чай ~ лаптем Поиск предложения, где слово «чай» встречается без слова «лаптем» .
Таблица операторов Yandex Пример Значение щи /(-1 +2) хлебаю Расстояние от одного слова в обратном порядке до двух слов в прямом. !тихий !Дон Поиск документа, в котором есть слово «тихий» , начинающееся со строчной или заглавной буквы, или слово «Дон» , начинающееся с заглавной. Скобки формируют группы в сложных запросах. получается && (+на | !мне) !!политика Словарная форма слова.
Таблица операторов Yandex Пример Значение title: (в стране) Поиск по заголовкам документов. url: ptici. narod. ru/ptici/kuropatka. htm Поиск по URL. беспременно inurl: vojne Поиск с учетом фрагмента URL. host: lib. ru Поиск по хосту.
Таблица операторов Yandex Пример Значение rhost: ru. lib. * Поиск по хосту в обратной записи. site: http: //www. lib. ru/PXESY/ FILATOW Поиск по всем поддоменам и страницам заданного сайта. mime: pdf Поиск по одному типу файлов. rhost: ru. lib. * Поиск по хосту в обратной записи.
Практическое задание (тест) • Создайте запрос для поиска резюме жителя Перми, обладающего опытом верстки и предпечатной подготовки, владеющего программами графического пакета Adobe. • Создайте запрос для поиска вакансии в пермских СМИ, службах PR и рекламных агентствах для работы по гибкому графику.
Практическое задание (тест) • «Запрос пресс-службы» : у журналистов и работников служб PR существует необходимость создавать запросы для отслеживания публикаций и документов в интернете, связанных с определенной компанией и ее руководителем. • Очевидно, что в запросе должны присутствовать все варианты названия компании и имя руководителя.
Практическое задание (тест) • Сформулируем запрос для ПГУ: (пгу|пермгу|(пермский /+1 (государственный|классический) /+1 университет)) && (маланин|(владимир /1 маланин)) • Как видно, запрос учитывает четыре варианта названия вуза и два варианта упоминания имени ректора.
Практическое задание (тест) • Существует один нюанс: в результатах поиска присутствуют документы с официального сайта университета www. psu. ru • Чтобы отсечь эти документы, добавим в конце запроса ~~ url= «www. psu. ru*»
Практическое задание • Создайте «запрос пресс-службы» для известной Вам компании. • Учитывайте русской и английское написание названия, аббревиатуры, сокращенное и полное имя руководителя. • Кроме этого, можно ограничить запрос темой документа, упоминанием региона и т. п.
Практическое задание «Переведи запрос»
«Переведи запрос» • Сначала перед Вами появится запрос, описанный «естественным» языком. Ваша задача – «перевести» описание на язык запросов. • После этого Вы увидите, наоборот, формализованный запрос. Ваша задача – сделать обратный перевод на «естественный» язык.
Запрос 1 • Необходимо найти документы со словами «новый» или «анонсировал» , или «представил» , или «появился» и словами «гаджет» или «устройство» , или «девайс» , или «аппарат» .
Запрос 2 • тхэквандо|тэквадно|таэквандо|тхек-вандо
Запрос 3 • Необходимо найти документы со словами «биография» или «жизнь» в заголовке, чтобы в тексте были слова «розинг» или «зворыкин» в точной словоформе; слова «изобретение» , «телевидение» , «электронно-лучевая трубка» в любой словоформе.
Запрос 4 • ((фехтование|фехтовальщик|фехто-вать) && сабля) | саблист
Запрос 5 • Необходимо найти документы со словами «прежнее» и «название» друг за другом или «называлась» , или «переименовали» и словами «советский» и «спорт» друг за другом – в одном предложении.
Запрос 6 • (спортивная /1 гимнастика | (гимнаст|гимнастка|гимнастика)) && (конь|кольца|брусья|опорный /1 прыжок)
Немного об операторах Google Оператор Назначение « » Пробел – логическое «И» , дает команду для Гугла на поиск всех слов, разделенных пробелом OR Логическое «ИЛИ» позволяет найти несколько вариантов слов или выражений. Ему соответствует символ «!» + Заставляет Гугл обязательно учитывать слово перед которым стоит «+» - Минус – дает поисковику команду на исключение этого слова
Немного об операторах Google Оператор Назначение «» Двойные кавычки позволяют найти только то выражение, которое в них содержится ~ Данный символ заставляет Гугл искать не только конкретное слово, но и его синонимы * Знак умножения говорит о том, сколько может быть слов между искомыми . . Указываются в случае описания диапазона между датами (1873. . 1880)
Немного об операторах Google Оператор Назначение filetype: Оператор дает понять, в каком формате файлов должны находится искомые слова site: Ограничивает поиск в пределах одного сайта movie: Этот запрос дает команду для поиска различной информации о видеофайлах allintitle: В результате поискового запроса будет выдан список страниц, у которых есть данные слова в заголовке
Немного об операторах Google Оператор Назначение intitle: Первое слово будет содержаться в заголовке, а остальные в любом месте страницы allinurl: В результате запроса будет выдан список страниц, у которых есть данные слова в адресе страницы, в её URL. Inurl: Аналогичен оператору allinurl, только производит поиск в адресах страниц одного слова. Allintext: Используется для поиска слов только в тексте документов. Игнорирует ссылки, URL-адреса и названия.
Немного об операторах Google Оператор Назначение filetype: Оператор дает понять, в каком формате файлов должны находится искомые слова Intext: Аналогичен оператору allintext, только производит поиск по тексту документа одного слова. Allinanchor: Inanchor: При этом запросе поиск будет производиться по тексту ссылок, все слова должны быть в ссылке Аналогичен оператору allinanchor, только производит поиск по тексту ссылок одно слово.
Немного об операторах Google Оператор Назначение Define: Покажет страницы на которых есть описание значения введенного слова. Своего рода - толковый словарь. Related: Поисковик выдаст страницы, которые похожи по тематике с указанной в строке поиска. Info: Cache: Информация о странице, для просмотра дополнительных сведений необходимо пройти по ссылкам. Этот оператор покажет последнюю сохраненную в кеше Google копию страницы и дату её сохранения.
Спасибо за внимание!


