Скачать презентацию Вычислительные системы и сети Лекция 15 Глобальная вычислительная Скачать презентацию Вычислительные системы и сети Лекция 15 Глобальная вычислительная

Лекция_15 ВСС.ppt

  • Количество слайдов: 29

Вычислительные системы и сети Лекция 15. Глобальная вычислительная сеть Internet: поисковый сервис Вычислительные системы и сети Лекция 15. Глобальная вычислительная сеть Internet: поисковый сервис

Задание на СР 1. Ответить на вопрос (к лекции № 15). Что понимается под Задание на СР 1. Ответить на вопрос (к лекции № 15). Что понимается под Web 2. 0? В чем отличие Web 3. 0 от Web 2. 0?

Вводная часть Лекция № 15. Глобальная вычислительная сеть Internet: поисковый сервис. Тема № 3. Вводная часть Лекция № 15. Глобальная вычислительная сеть Internet: поисковый сервис. Тема № 3. 4. Глобальная вычислительная сеть Internet. Модуль № 3. Современные вычислительные сети и коммуникации. Цель занятия: Изучить основы поискового сервиса сети Internet. Учебные вопросы: 1. Проблема эффективного поиска информации и поисковые системы. 2. Архитектура поискового сервиса. 3. Логика и результаты поиска. 3

Вводная часть Литература: А) Основная Башлы, П. Н. Вычислительные системы и сети: учебник. Ч. Вводная часть Литература: А) Основная Башлы, П. Н. Вычислительные системы и сети: учебник. Ч. 1/ П. Н. Башлы. – Ростов н/Д: Российская таможенная академия, Ростовский филиал, 2012. Б) Дополнительная Бройдо, В. Л. Вычислительные системы, сети и телекоммуникации: учебное пособие/ СПб. : Питер, 2011. 4

1 Проблема эффективного поиска информации и поисковые системы 1 Проблема эффективного поиска информации и поисковые системы

1. Проблема эффективного поиска информации и поисковые системы Проблема поиска информации? Эффективный поиск информации? 1. Проблема эффективного поиска информации и поисковые системы Проблема поиска информации? Эффективный поиск информации? Internet Поиск информации – один из востребованных сервисов Internet! наиболее 6

1. Проблема эффективного поиска информации и поисковые системы Эффективный поиск - действия пользователя, позволившие 1. Проблема эффективного поиска информации и поисковые системы Эффективный поиск - действия пользователя, позволившие ему за относительно небольшой период времени определить есть ли! в информационных ресурсах сети Internet требуемая информация и если есть, то где она! расположена. Для решения задачи эффективного поиска информации сеть Internet предоставляет пользователям поисковый сервис, т. е. услугу по поиску информации, который реализуется поисковыми системами. 7

1. Проблема эффективного поиска информации и поисковые системы Типовые результаты поиска информации: 1. Требуемый 1. Проблема эффективного поиска информации и поисковые системы Типовые результаты поиска информации: 1. Требуемый ресурс существует, однако он не проиндексирован ни одной из поисковых систем, адрес узла неизвестен пользователь не узнает о существований данного информационного ресурса. 2 Требуемый ресурс существует и проиндексирован. Пользователь не знает механизмов поиска, не умеет использовать поисковый сервер пользователь не сможет найти требуемый информационный ресурс. 3 Требуемый ресурс существует и проиндексирован поисковым сервером, пользователь знает механизмы поиска пользователь найдет требуемый информационный ресурс 8

1. Проблема эффективного поиска информации и поисковые системы В сети Internet представлены три типа 1. Проблема эффективного поиска информации и поисковые системы В сети Internet представлены три типа поисковых систем: § каталоги ресурсов - упорядоченный по темам набор ссылок. § рейтинговые системы – список ресурсов составленный по степени важности. § поисковые серверы - сетевые ресурсы, предоставляющие пользователю сервис по поиску информации в сети Интернет на основе ключевых слов запроса. 9

1. Проблема эффективного поиска информации и поисковые системы Каталог ресурсов 10 1. Проблема эффективного поиска информации и поисковые системы Каталог ресурсов 10

1. Проблема эффективного поиска информации и поисковые системы Рейтинговая система 11 1. Проблема эффективного поиска информации и поисковые системы Рейтинговая система 11

1. Проблема эффективного поиска информации и поисковые системы Поисковый сервер + каталог ресурсов 12 1. Проблема эффективного поиска информации и поисковые системы Поисковый сервер + каталог ресурсов 12

2 Архитектура поискового сервера 2 Архитектура поискового сервера

2. Архитектура поискового сервера Пользователь текст запроса Переход к ресурсам список ресурсов Ресурсы сети 2. Архитектура поискового сервера Пользователь текст запроса Переход к ресурсам список ресурсов Ресурсы сети Internet Поиск и обработка результатов 3. Поисковая машина Результаты поиска Поиск по ключевым словам 2. База данных «индекс» Индексирован -ные ресурсы сети 14

2. Архитектура поискового сервера Принцип работы поискового сервера: Поиск информации ведется лишь в базе 2. Архитектура поискового сервера Принцип работы поискового сервера: Поиск информации ведется лишь в базе данных поискового сервера. Результаты обработки запроса напрямую зависят от содержимого базы данных поискового сервера. Один и тот же запрос к двум разным поисковым серверам, в большинстве случаев даст разные результаты. 15

2. Архитектура поискового сервера Принцип работы поискового сервера: 1. Поиск и анализ содержимого ресурсов 2. Архитектура поискового сервера Принцип работы поискового сервера: 1. Поиск и анализ содержимого ресурсов сети Internet – специальные программы-роботы. 1. Порядок индексации Результаты анализа – аннотация и ссылка на ресурсов? ресурс сохраняются в специальную базу индексов. 2 Обработка запроса пользователя – поисковая 2. Порядок выдачи машина. результатов? Результат - упорядоченный список ресурсов сети, соответствующих запросу пользователя. 16

2. Архитектура поискового сервера Программы автоматической индексации: Поисковый агент – комплекс программ для поиска, 2. Архитектура поискового сервера Программы автоматической индексации: Поисковый агент – комплекс программ для поиска, обнаружения и индексирования ресурсов сети Internet. § перемещается по гипертекстовой структуре сети Интернет; § запрашивает ресурс; § анализирует и индексирует ресурс (создает аннотацию); § передает результат в базу данных; § проверяет существование индексированных ресурсов! ранее 17

2. Архитектура поискового сервера Программы автоматической индексации: 1. Программы-пауки (spider)/web-агенты; 2. Кроулеры (crawler); (Indexer) 2. Архитектура поискового сервера Программы автоматической индексации: 1. Программы-пауки (spider)/web-агенты; 2. Кроулеры (crawler); (Indexer) - анализи Программа-индексатор -рует web-страницы, скаченные «пауками» : 3. Программы-индексаторы (indexer). разбирает их на составные части, применяя собственные лексические и морфологические Программы- «пауки» результатыпрограмма, (spider) - анализа в алгоритмы; передает скачивания web – предназначенная для базу данных индексов. из них ссылок и страниц, извлечения сохранения документов. Кроулер - программа, предназначенная для поиска новых документов, просмотра ссылок, найденных «пауком» и определения дальнейшего пути следования «паука» . 18

2. Архитектура поискового сервера Система выдачи результатов пользователь 1 запрос результаты анализа 3 модуль 2. Архитектура поискового сервера Система выдачи результатов пользователь 1 запрос результаты анализа 3 модуль ранжирования аннотация документов 2 4 5 6 рейтинг документов Страница выдачи результатов 19

2. Архитектура поискового сервера Система выдачи результатов поиска основана на оценке релевантности документа. Релевантность 2. Архитектура поискового сервера Система выдачи результатов поиска основана на оценке релевантности документа. Релевантность - степень соответствия содержания документа запросу пользователя. § сравнение даты создания документов; § сравнение времени хранения документов в базе данных поискового сервера; § анализ гипертекста; § ссылочное ранжирование (тематическое взвешенное (по популярности) цитирование); § учет индекса цитирования документов. и 20

2. Архитектура поискового сервера Система выдачи результатов Google Page. Rank - алгоритм расчёта авторитетности 2. Архитектура поискового сервера Система выдачи результатов Google Page. Rank - алгоритм расчёта авторитетности страницы, используемый поисковой системой Google. Основан на Шкала Page. Rank на до 10: подсчете важных ссылок от 0 страницу, т. е. 4 -5 - сайты средней популярности; в Google. характеризует «важность» страницы 6 - очень популярные сайты; Page. Rank рассматривает ссылку со страницы 7 -9 – страницу Б как голосизвестных А на страницы значимых в пользу страницы Б от страницы А. (Microsoft, Wikipedia); проектов, компаний 10 – Google, правительственные сайты (несколько десятков страниц в Internet). 21

3 Логика поиска информации 3 Логика поиска информации

3. Логика поиска информации Базовая логика поиска информации: В основе логики поиска информации лежат 3. Логика поиска информации Базовая логика поиска информации: В основе логики поиска информации лежат базовые логические операторы Булевой логики: § «И» - логическое «И» (англ. «AND» ) § «ИЛИ» - логическое «ИЛИ» (англ. «OR» ) § «НЕ» - логическое «НЕ» (англ. «NOT» ) 23

3. Логика поиска информации «Факультет и таможенного и дела» Факультет + таможенного Факультет + 3. Логика поиска информации «Факультет и таможенного и дела» Факультет + таможенного Факультет + дела таможенного + дела

3. Логика поиска информации «Факультет или кафедра или академия 25 3. Логика поиска информации «Факультет или кафедра или академия 25

3. Логика поиска информации «Факультет не кафедра не академия 26 3. Логика поиска информации «Факультет не кафедра не академия 26

3. Логика поиска информации Язык запросов: Для повышения эффективности поиска информации используют команды «языка 3. Логика поиска информации Язык запросов: Для повышения эффективности поиска информации используют команды «языка запросов» поисковых систем - расширенный набор операторов и логических условий, определяющих условия поиска. §Факультет & РТА - слова в пределах одного предложения. §Студенты && Ростова-на-Дону - слова в пределах одного документа. 27

2. Архитектура поискового сервера Показатели качества работы поискового сервера: § количество индексированных ресурсов в 2. Архитектура поискового сервера Показатели качества работы поискового сервера: § количество индексированных ресурсов в базе данных; § возможности расширенного поиска; § функциональность языка запросов; § удобный пользовательский интерфейс; § качественная справочная система; § отсутствие «мертвых» ссылок. 28

Задание на СР 1. Ответить на вопрос (к лекции № 16). Кого олицетворяет персонажи Задание на СР 1. Ответить на вопрос (к лекции № 16). Кого олицетворяет персонажи на титульном слайде (к лекции № 16)? 2. Каков Page. Rang главной страницы портала РФ РТА – www. donrta. ru? Задание на СР: изучить понятие и виды поисковой оптимизации (SEO), ознакомиться с ресурсами, позволяющими оптимизировать поиск ресурсов и рейтинг документа в поисковой системе. 29