Скачать презентацию Информационнопоисковые системы СОДЕРЖАНИЕ 1 Введение 2 Что Скачать презентацию Информационнопоисковые системы СОДЕРЖАНИЕ 1 Введение 2 Что

Информационно-поисковые системы.ppt

  • Количество слайдов: 30

Информационнопоисковые системы Информационнопоисковые системы

СОДЕРЖАНИЕ 1. Введение 2. Что такое ИПС? A) Классификация Б) Базы данных 3. История СОДЕРЖАНИЕ 1. Введение 2. Что такое ИПС? A) Классификация Б) Базы данных 3. История создания 4. Принцип работы 5. Архитектура современных ИПС WWW 6. Коррекция запроса по релевантности 7. Язык запросов 8. Возможные проблемы при работе с ИПС 9. Зарубежные ИПС А) Google 10. Отечественные ИПС А) Яндекс 11. Терминология ИПС 12. THE END

Большинство пользователей Интернет сообщества начинают свой рабочий день с поисковых систем, где пытаются найти Большинство пользователей Интернет сообщества начинают свой рабочий день с поисковых систем, где пытаются найти столь необходимую им информацию и решить свои проблемы. Помочь пользователю найти нужную информацию в Сети призваны поисковые системы.

ИПС? такое Что же исковая ионно-по нформац И икладная а – это пр систем ИПС? такое Что же исковая ионно-по нформац И икладная а – это пр систем еда для терная ср компью анения, ботки, хр обра трации и вки, филь сортиро массивов больших поиска рованной структури рмации. инфо

Классификация ИПС: 1. Документографические. В документографических ИПС все хранимые документы индексируются специальным образом, т. Классификация ИПС: 1. Документографические. В документографических ИПС все хранимые документы индексируются специальным образом, т. е. Каждому документу присваивается индивидуальный код, составляющий поисковый образ. 2. Фактографические. В фактографических ИПС хранятся не документы, а факты, относящиеся к какой-либо предметной области. Поиск осуществляется по образцу факта.

Каждая ИПС состоит из двух частей: Базы данных (БД) и системы управления базами данных Каждая ИПС состоит из двух частей: Базы данных (БД) и системы управления базами данных (СУБД). База данных - это поименованная совокупность структурированных данных, относящихся к определенной предметной области. Система управления базами данных - это комплекс программных и языковых средств, необходимых для создания баз данных, поддержания их в актуальном состоянии и организации поиска в них необходимой информации. На настоящий момент существует множество различных СУБД. Наиболее широкую известность получили такие как Dbase, Clipper, Fox. Pro, Paradox, Microsoft Access.

Немного из истории… Первой поисковой машиной стал «Wandex» , уже не существующий web-сайт, который Немного из истории… Первой поисковой машиной стал «Wandex» , уже не существующий web-сайт, который создал Мэтью Грэйем из Массачусетского технологического института в 1993. Чуть позднее появляется поисковая система «Aliweb» , существующая до сих пор. Первой полнотекстовой поисковой системой стала «Web. Crawler» , запущенная в 1994. В отличие от своих предшественников, она позволяла пользователям искать по любым ключевым словам на любой веб-странице, с тех пор это стало стандартом во всех основных поисковых системах. Кроме того, это был первый поисковик, о котором было известно в широких кругах. В 1994 был запущен «Lycos» , разработанный в университете Карнеги Мелона. Развитие русских поисковых машин началось в 1996 году с появлением морфологического расширения к поисковику Altavista и запуском оригинальных российских поисковых машин Rambler и Aport. Вскоре, в 1997 году была открыта поисковая машина Яндекс. Сегодня в мире работает несколько сотен разнообразных поисковых машин, отличающихся специализацией, возможностями и методиками поиска.

Принципы работы поисковых систем По своей сути поисковые системы, каталоги и метапоисковые системы являются Принципы работы поисковых систем По своей сути поисковые системы, каталоги и метапоисковые системы являются специализированными базами данных, в которых хранится информация о других сайтах Internet. От традиционных информационных систем они отличаются тем, что хранят не сами документы, а информацию о документах и ссылки на них. В ответ на запрос пользователя выдается список адресов, где может присутствовать запрашиваемая информация. Обычно поиск производится по словам и фразам, однако в некоторых «продвинутых» системах и каталогах можно составлять весьма сложные запросы на специальном языке.

Для простоты восприятия информации о классификации поисковых систем была составлена следующая схема: Для простоты восприятия информации о классификации поисковых систем была составлена следующая схема:

Архитектура современных информационно-поисковых систем World Wide Web Архитектура современных информационно-поисковых систем World Wide Web

client это программа просмотра конкретного информационного ресурса. В настоящее время наиболее популярны мультипротокольные программы client это программа просмотра конкретного информационного ресурса. В настоящее время наиболее популярны мультипротокольные программы типа Netscape Navigator. Такая программа обеспечивает просмотр документов World Wide Web, Gopher, Wais, FTP-архивов, почтовых списков рассылки и групп новостей Usenet. В свою очередь все эти информационные ресурсы являются объектом поиска информационно-поисковой системы.

user interface интерфейс пользователя - это не просто программа просмотра. В случае информационно -поисковой user interface интерфейс пользователя - это не просто программа просмотра. В случае информационно -поисковой системы под этим словосочетанием понимают и способ общения пользователя с поисковым аппаратом системы, т. е. с системой формирования запросов и просмотров результатов поиска.

search engine поисковая машина служит для трансляции запроса пользователя, который подготавливается на информационнопоисковом языке search engine поисковая машина служит для трансляции запроса пользователя, который подготавливается на информационнопоисковом языке (ИПЯ), в формальный запрос системы, поиска ссылок на информационные ресурсы Сети и выдачи результатов этого поиска пользователю.

index database индекс - это основной массив данных информационно-поисковой системы. Он служит для поиска index database индекс - это основной массив данных информационно-поисковой системы. Он служит для поиска адреса информационного ресурса. Архитектура индекса устроена таким образом, чтобы поиск происходил максимально быстро и при этом можно было бы оценить ценность каждого из найденных информационных ресурсов сети.

queries запросы пользователя сохраняются в его личной базе данных. На отладку каждого запроса уходит queries запросы пользователя сохраняются в его личной базе данных. На отладку каждого запроса уходит достаточно много времени, и поэтому чрезвычайно важно хранить запросы, на которые система дает хорошие ответы.

index robot робот-индексировщик служит для сканирования Internet и поддержки базы данных индекса в актуальном index robot робот-индексировщик служит для сканирования Internet и поддержки базы данных индекса в актуальном состоянии. Эта программа является основным источником информации о состоянии информационных ресурсов сети.

www sites это весь Internet. А если говорить более точно, то это те информационные www sites это весь Internet. А если говорить более точно, то это те информационные ресурсы, просмотр которых обеспечивается программами просмотра.

Многие системы применяют механизм коррекции запроса по релевантности. Это означает, что процедура поиска носит Многие системы применяют механизм коррекции запроса по релевантности. Это означает, что процедура поиска носит интерактивный и итеративный характер. После проведения первичного поиска пользователь отмечает из всего списка найденных документов релевантные. На следующие итерации система расширяет/уточняет запрос пользователя терминами из этих документов и снова выполняет поиск. Так продолжается до тех пор пока пользователь не сочтет, что лучшего результата, чем он уже имеет добиться не удастся. Коррекция запроса по релевантности - это достаточно широко внедренный способ уточнения запросов. В некоторых системах пользователь может и не знать, о том, что эта процедура применяется, например, Open. Text. В этом случае несколько итераций выполняется без его вмешательства.

Язык запросов Практически все поисковые системы поддерживают так называемый язык запросов, позволяющий задавать мощнейшие Язык запросов Практически все поисковые системы поддерживают так называемый язык запросов, позволяющий задавать мощнейшие комбинации различных критериев поиска. Знание и правильное применение языка запросов конкретной поисковой машины улучшает и упрощает пользователю процесс поиска информации. Язык поисковых запросов состоит из логических операторов, префиксов обязательности, возможности учета расстояния между словами, морфологии языка, регистра слов, расширенных операторов, возможностей расширенного поиска, уточнения поиска.

1. Исключение/включение определенных слов знаки «+» и «-» . 2. Перечисление альтернатив - знак 1. Исключение/включение определенных слов знаки «+» и «-» . 2. Перечисление альтернатив - знак «|» 3. Поиск точного соответствия - знак «!» 4. Поиск точной фразы – кавычки 5. Задание расстояния между слов - «/n» 6. Ограничение по адресам - команда «#url» 7. Поиск ссылок – команда «#link»

К сожалению, поисковые системы часто не способны точно и справедливо интерпретировать ресурсы. Как результат, К сожалению, поисковые системы часто не способны точно и справедливо интерпретировать ресурсы. Как результат, на первых позициях поиска зачастую оказываются сайты "далекие" от решаемого вопроса. При этом ресурсы представляющие реальную пользу оказываются "за бортом" поиска. Причина такого положения проста и кроется в технологии получения и представления результатов поисковыми системами. Главная проблема заключается в отсутствии четких правил, доступных и открытых для всех желающих. Чем больше неопределенности в алгоритмах формирования поисковых индексов, тем меньше поисковые системы отражают процесс формирования реальной информации. И соответственно, тем меньше будет уровень доверия к результатам поиска поисковых систем.

Полезные советы! 1) 2) 3) 4) 5) 6) Вы хотите найти сайты, на которых Полезные советы! 1) 2) 3) 4) 5) 6) Вы хотите найти сайты, на которых есть рецепты салатов, но при этом вы не хотите, чтобы в ингредиентах были огурцы. : «+рецепт +салат-огурцы» - это означает команду искать страницы, на которых в обязательном порядке присутствуют слова «рецепт» и «салат» , однако отсутствует слово «огурцы» . Система ищет хотя бы одно из перечисленных слов. Например, если вы хотите найти страницы, где встречается одно из слов «папа» , «мама» , «дочка» , «внучка» : «папа | мама | дочка | внучка» . Однако если вам нужно найти только данную конкретную форму - «школа» , тогда задавайте поисковую строку так: «!школа» . Если вам нужна точная фраза «зеленое яблоко» , тогда при поиске заключите фразу в кавычки: «зеленое яблоко» Вы хотите найти все варианты фразы «зеленое [любое слово] яблоко» можно отразить это в поисковом запросе с помощью знака «/» если вы хотите найти все страницы, на которых встречается слово «квадроид» , исключив сайт www. kvadroid. ru, дайте следующую команду: «квадроид ~~#url=» www. kvadroid. ru» » .

Популярные зарубежные поисковые машины: Популярные зарубежные поисковые машины:

История «Google» • Поиск Google привлекает преданных поклонников среди растущего числа Интернетпользователей, которые любили История «Google» • Поиск Google привлекает преданных поклонников среди растущего числа Интернетпользователей, которые любили его простой интерфейс. В 2000 году Google начала продажу рекламы, связанную с ключевыми словами поиска. Реклама была текстовой, не загромождая дизайн страницы и не уменьшая скорость её загрузки. • Имя «Google» произошло от слова «гугол» , означающего цифру 1 со ста нолями. Всё чаще употребляющийся в повседневном языке, глагол «to google» (ru: «гуглить» ) был в 2006 -м году добавлен в Оксфордский английский Словарь как обозначающий «использование Google для поиска в интернете» . Google появился в марте 1996 года как научный проект Ларри Пейджа и Сергея Брина, доктора наук, студенты Стэнфорда работали над Стэнфордским Проектом Цифровой Библиотеки (SDLP). • К концу 1998 года Google проиндексировал около 60 миллионов страниц. На главной странице по-прежнему была метка «BETA» , но статья в Salon. com уже утверждала, что результаты поиска Google были лучше, чем у других поисковиков, таких как Hotbot или Excite. com, и похвалил google за большие технологические инновации, чем было у перегруженных сайтовпорталов.

Популярные отечественные поисковые машины Популярные отечественные поисковые машины

История компании История компании "Яндекс" началась в 1990 Слово "Яndex" придумал за несколько году с разработки поискового программного лет до этого один из основных и обеспечения в компании "Аркадия". В 1993 - старейших разработчиков поискового механизма. "Яndex" означает "Языковой 1994 годы программные технологии были существенно усовершенствованы благодаря index", или, если по-английски, "Yandex" сотрудничеству с лабораторией Ю. Д. Апресяна - "Yet Another indexer". (Институт Проблем Передачи Информации РАН). В ноябре 1997 года, был реализован естественно-языковый запрос. Отныне к Yandex. Ru можно обращаться просто "по-русски", задавать длинные запросы и получать точные ответы. В 1998 году на Yandex. Ru появилась возможность "найти похожий документ", список найденных серверов, поиск в заданном диапазоне дат и сортировка результатов поиска по времени последнего изменения. За 1999 год Yandex выпустил новый поисковый робот, который позволил оптимизировать и ускорить обход сайтов Рунета. Появился поиск в категориях каталога и впервые в Рунете было введено понятие "индекс цитирования".

Терминология ИПС Релевантность (relevance) - в приложении к поисковым системам, соответствие ответов системы информационным Терминология ИПС Релевантность (relevance) - в приложении к поисковым системам, соответствие ответов системы информационным потребностям пользователя. Tag (тег, таг, дескриптор) - основной элемент кодирования, принятый в стандарте HTML. В HTML практически все зависит от дескрипторов (тегов). Они служат для привлечения внимания к определенным словам в документе, тем самым давая браузеру "понять" что и как нужно выделить, где и как отобразить графику, что является гиперссылками. Индексирование - выражение главного содержания текста какоголибо документа в терминах языка информационно-поисковой системы. Запрос – вербально выраженная на естественном языке потребность пользователя в определенной информации. Информационно-поисковой язык – формальный язык, предназначенный для описания документа, хранящегося в ИПС и формулировки запроса для ИПС. Тезаурус – специально организованный нормативный словарь, содержащий как слова естественного языка, так и информационнопоискового.

СПАСИБО ЗА ВНИМАНИЕ! СПАСИБО ЗА ВНИМАНИЕ!

Презентацию выполнили: Новикова Виктория Семичева Мария РГФ. Немецкое отделение. Первая группа. Первый курс. Презентацию выполнили: Новикова Виктория Семичева Мария РГФ. Немецкое отделение. Первая группа. Первый курс.