поиск информации в комп сетях.pptx
- Количество слайдов: 35
Поиск информации в Интернете 03. 04. 2013
Количество информации в мире растет: • Калифорнийский университет подсчитал , что в 2002 году в мире произведено 5 000 терабайт информации
На июль 2006 года: • По данным аналитической службы Netcraft, в интернете зарегистрировано 88 166 395 сайтов • В течение 2006 года количество сайтов увеличивалось примерно на 2 миллиона в месяц!
Русскоязычный интернет В поисковой системе Яндекс на декабрь 2007 года проиндексировано: • сайтов: 4 832 533, • web-страниц: 2 058 914 756, • объем проиндексированной информации: 54 778 ГБ.
Что необходимо для эффективного поиска информации? • Представление о структуре интернета. • Представление о способах и методах поиска информации в интернете. • Умение сформулировать запрос и выбрать ответ из результатов поиска.
Схема информационных потоков Сайты компаний Личные сайты Форумы, блоги Поисковые системы Информ. агентства Сетевые СМИ Информационные компании Специализированные базы данных
Парадокс интернета: • Полезной информации становится все больше, а найти что-то необходимое – все сложнее.
р одбо П ок сыл ис к и г тало Ка «Продвинутые» каталоги Поисковые системы Метапоиск Классификация поисковых средств
Способы поиска информации в web Поиск информации – одна из самых востребованных на практике задач, которую приходится решать любому пользователю Интернета. Существуют три основных способа поиска информации в Интернет: 1. Указание адреса страницы. 2. Передвижение по гиперссылкам. 3. Обращение к поисковой системе (поисковому серверу).
Способ 1: Указание адреса страницы Это самый быстрый способ поиска, но его можно использовать только в том случае, если точно известен адрес документа или сайта, где расположен документ. Не стоит забывать возможность поиска по открытой в окне браузера web-странице (Правка-Найти на этой странице. . . ).
Способ 2: Передвижение по гиперссылкам Это наименее удобный способ, так как с его помощью можно искать документы, только близкие по смыслу текущему документу. Пользуясь гипертекстовыми ссылками, можно бесконечно долго путешествовать в информационном пространстве Сети, переходя от одной web-страницы к другой, но если учесть, что в мире созданы многие миллионы web-страниц, то найти на них нужную информацию таким способом вряд ли удастся.
Способ 3: Обращение к поисковой системе На помощь приходят специальные поисковые системы (их еще называют поисковыми машинами). Адреса поисковых серверов хорошо известны всем, кто работает в Интернете. В настоящее время в русскоязычной части Интернет популярны следующие поисковые серверы: Яндекс (yandex. ru), Google (google. ru) и Rambler (rambler. ru).
Поисковая система — веб-сайт, предоставляющий возможность поиска информации в Интернете. Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на ftp-серверах, товары в интернет-магазинах, а также информацию в группах новостей Usenet и др. По принципу действия поисковые системы делятся на два типа: поисковые каталоги и поисковые индексы.
Поисковые каталоги служат для тематического поиска. Информация на этих серверах структурирована по темам и подтемам. Имея намерение осветить какую-то узкую тему, нетрудно найти список web-страниц, ей посвященных. Катало г ресурсов в Интернете или каталог интернет-ресурсов или просто интернет-каталог — структурированный набор ссылок на сайты с кратким их описанием. Каталог в котором ссылки на сайты внутри категорий сортируются по популярности сайтов называется рейтинг (или топ).
Каталог Яндекс. Подраздел: Культура – Литература -Электронные библиотеки
Поисковые индексы работают как алфавитные указатели. Клиент задает слово или группу слов, характеризующих его область поиска, — и получает список ссылок на web-страницы, содержащие указанные термины. Первой поисковой системой для Всемирной паутины был «Wandex» , уже не существующий индекс, разработанный Мэтью Грэйем из Массачусетского технологического института в 1993.
Как работает поисковой индекс? Поисковые индексы автоматически, при помощи специальных программ (веб-пауков), сканируют страницы Интернета и индексируют их, то есть заносят в свою огромную базу данных. Поиско вый робот ( «веб-пау к» ) — программа, являющаяся составной частью поисковой системы и предназначенная для обхода страниц Интернета с целью занесения информации о них (ключевые слова) в базу поисковика. По своей сути паук больше всего напоминает обычный браузер. Он сканирует содержимое страницы, забрасывает его на сервер поисковой машины, которой принадлежит и отправляется по ссылкам на следующие страницы. В ответ на запрос, где найти нужную информацию, поисковый сервер возвращает список гиперссылок, ведущих web-страницам, на которых нужная информация имеется или упоминается. Обширность списка может быть любой, в зависимости от содержания запроса.
Индекс Яндекс: поиск по запросу "Информатика и ИКТ"
Поисковые механизмы 1. Поисковые машины. Эти средства поиска в ответ на запрос выдают список страниц, удовлетворяющих заданным критериям. Примеры поисковых машин: Яndex (http: //www. yandex. ru) Rambler (http: //www. rambler. ru) Google (http: //www. google. com. ru http: //www. google. ru)
http: //www. yandex. ru/ Яндекс — российская система поиска в Сети. Сайт компании, Yandex. ru, был открыт 23 сентября 1997 года. Головной офис компании находится в Москве. У компании есть офисы в Санкт-Петербурге, Екатеринбурге, Одессе и Киеве. Количество сотрудников превышает 700 человек. Слово «Яндекс» (состоящее из буквы «Я» и части слова index; обыгран тот факт, что русское местоимение «Я» соответствует английскому «I» ) придумал Илья Сегалович, один из основателей Яндекса, в настоящий момент занимающий должность технического директора компании. Поиск Яндекса позволяет искать по Рунету документы на русском, украинском, белорусском, румынском, английском, немецком и французском языках с учётом морфологии русского и английского языков и близости слов в предложении. Отличительная особенность Яндекса — возможность точной настройки поискового запроса. Это реализовано за счёт гибкого языка запросов.
http: //www. google. ru/ Лидер поисковых машин Интернета, Google занимает более 70 % мирового рынка. Cейчас регистрирует ежедневно около 50 млн поисковых запросов и индексирует более 8 млрд веб-страниц. Google может находить информацию на 115 языках. По одной из версий, Google — искажённое написание английского слова googol. "Googol (гугол)" – это математический термин, обозначающий единицу со 100 нулями. Этот термин был придуман Милтоном Сироттой, племянником американского математика Эдварда Каснера, и впервые описан в книге Каснера и Джеймса Ньюмена "Математика и воображение" (Mathematics and the Imagination). Использование этого термина компанией Google отражает задачу организовать огромные объемы информации в Интернете. Интерфейс Google содержит довольно сложный язык запросов, позволяющий ограничить область поиска отдельными доменами, языками, типами файлов и т. д.
http: //www. rambler. ru/ Rambler Media Group — интернет-холдинг, включающий в качестве сервисов поисковую систему, рейтингклассификатор ресурсов российского Интернета, информационный портал. Rambler создан в 1996 году. Поисковая система Рамблер понимает и различает слова русского, английского и украинского языков. По умолчанию поиск ведётся по всем формам слова.
Поисковые механизмы 2. Каталоги, в которых сайты упорядочены по категориям специально разработанного дерева-рубрикатора. Примеры каталогов: Yahoo (http: //www. yahoo. com) Русские каталоги http: //www. au. ru http: //www. stars. ru
Поисковые механизмы 3. Тематические подборки ссылок. Иногда они содержат рубрикатор и могут рассматриваться как частный случай каталога, ограниченного некоторой темой. Например, сайт alledu. ru содержит мощную систему для поиска информации в области образования.
Поисковые механизмы 4. Порталы http: //www. edu. ru – федеральный образовательный портал http: //www. km. ru http: //www. 5 ballov. ru
Поисковые механизмы 5. Поисковые механизмы, действующие в пределах Web-сайта Многие крупные сайты содержат внутренний поисковый механизм для документов, находящихся в пределах сайта. Кроме того, сайт часто содержит более или менее подробный перечень документов или разделов сайта в виде специальной страницы — "карты сайта".
Язык запросов Учет различных форм слова 1. Независимо от того, в какой форме Вы употребили слово в запросе, поиск учитывает все его формы по правилам русского языка. Например, если задан запрос 'идти', то в результате поиска будут найдены ссылки на документы, содержащие слова 'идти', 'идет', 'шел', 'шла' и т. д.
Язык запросов Учет различных форм слова 2. Если Вы набрали в запросе слово с большой буквы, будут найдены только слова с большой буквы, в противном случае будут найдены как слова с большой, так и с маленькой буквы. Например, запрос `стрижи' найдет и птиц, и летную группу. Запрос ‘Стрижи' - летную группу и те случаи упоминания птицы, когда она написана с большой буквы.
Язык запросов Учет различных форм слова 3. Хотя по умолчанию поиск учитывает все формы заданного слова, существует возможность поиска по точной словоформе. В этом случае перед запросом ставится восклицательный знак '!'. Например: !гимназии будет найдены ссылки, где содержится слово гимназии.
Язык запросов Знаки "+" и "-" Если Вы хотите, чтобы слова из запроса обязательно были найдены, то поставьте перед каждым из них "+". Если Вы хотите исключить какие-либо слова из результата поиска, — поставьте перед каждым из них "-". Внимание! Знак "-" — это именно минус. Его надо писать через пробел от предыдущего и слитно с последующим словом, например, 'рак -гороскоп'. Если написать 'рак-гороскоп' или 'рак - гороскоп', то знак "-" будет проигнорирован.
Язык запросов Знаки "+" и "-" Например, запрос 'частные обьявления продажа велосипедов', выдаст много ссылок на сайты с разнообразными частными объявлениями. А запрос 'частные обьявления продажа +велосипедов' покажет объявления о продаже именно велосипедов. Если Вам нужно описание Парижа, а не предложения многочисленных турагентств, имеет смысл задать такой запрос 'путеводитель по Парижу -агентство -тур'
Синтаксис оператора Что означает оператор Пример запроса пробел или Логическое И (в пределах & предложения) лечебная физкультура && Логическое И (в пределах документа) рецепты && (плавленый сыр) | Логическое ИЛИ фото | фотография | снимок | фотоизображение + Обязательное наличие слова в найденном документе +быть или +не быть () Группирование слов (технология | изготовление) (сыра | творога) ~ Бинарный оператор И НЕ (в пределах предложения) банки ~ закон ~~или_ Бинарный оператор И НЕ (в пределах документа) путеводитель по Парижу ~~ (агентство | тур) /(n m) Расстояние в словах (минус (-) назад, плюс (+) - вперед) поставщики /2 кофе музыкальное /(-2 4) образование вакансии ~ /+1 студентов "" Поиск фразы "красная шапочка" Эквивалентно: красная /+1 шапочка &&/(n m) Расстояние в предложениях (минус (-) - назад, плюс (+) вперед) банк && /1 налоги
Конкурсы по поиску информации в Интернет
Вопросы: • • Назовите основные способы поиска информации в web? В каком случае может возникнуть необходимость поиска по уже открытой в браузере web-странице? Какую работу выполняют поисковые машины? Назовите наиболее популярные поисковые машины Интернета.
Домашнее задание • п. 2. 10 • Стр. 187 • Записи в тетради