15af13e7088c71f291771efb2e1e049f.ppt
- Количество слайдов: 35
Вебометрические исследования научных сайтов Печников Андрей Анатольевич к. ф. -м. н. , ст. н. с. лаборатории телекоммуникационных систем ИПМИ Кар. НЦ РАН Выступление на Ученом совете ИПМИ Кар. НЦ РАН. Март 2009 г.
Вебометрические исследования научных сайтов Вебометрика 1. Интернет — глобальная телекоммуникационная информационных и вычислительных ресурсов. сеть 2. Веб (World Wide Web, WWW, Web, Всемирная паутина) — глобальное информационное пространство, основанное на физической инфраструктуре Интернета, протоколе передачи данных HTTP и языке HTML. 3. Вебометрика (webometrics) — раздел информационных технологий, в рамках которого исследуются количественные аспекты конструирования и использования информационных ресурсов, структур и технологий применительно к Вебу. Термин был введен Томасом Алминдом и Петером Ингверсеном (Tomas C. Almind and Peter Ingwersen) в 1997 году в работе "Informetric analyses on the World Wide Web: Methodological approaches to «webometrics» ". Journal of Documentation 53 (4): 404– 426. Выступление на Ученом совете ИПМИ Кар. НЦ РАН. Март 2009 г.
Вебометрические исследования научных сайтов Вебометрика На сегодня считается, что вебометрика включает в себя как минимум четыре основных направления исследований: • Веб-индикаторы (индексы цитирования, размеры, «научность» , видимость [visibility] сайтов, ранжирование сайтов …), • Поиск и сбор данных в Вебе (информационный поиск, поисковые машины, роботы, краулеры, черви, пауки…), • Социальные феномены в Вебе (социальные сети, сообщества сайтов, форумы, самоорганизация …), • Анализ гиперссылок (связи между сайтами, мотивация ссылок, структура фрагментов Веба. . . ). Peter Ingwersen, «Webometrics – Ten Years of Expansion» , Invited Plenary talk. The International Workshop on Webometrics, Informetrics and Scientometrics, 10 -12 May, 2006, Nancy (France) Выступление на Ученом совете ИПМИ Кар. НЦ РАН. Март 2009 г.
Вебометрические исследования научных сайтов Вебометрика В Вебе много всего и хорошего, и не очень. Многие исследователи отмечают одновременное наличие в Вебе как хаоса, так и порядка, при этом если хаос носит разносторонний и всеобъемлющий характер, то признаки порядка проявляются на некоторых его частях. Но Веб велик. Яндекс ведет поиск по 4 673 368 696 страницам. Нами отсканировано 1 262 511 страниц российского сегмента научного Веба, то есть лишь 0, 03% от Яндекса. Поэтому внимание и ресурсы концентрируются на узких сегментах Веба с расчетом дальнейших обобщений и переноса результатов. Нами были проведены различные вебометрические исследования в следующих сегментах: A. официальные сайты классических университетов России, научных учреждений РАН, университетов Финляндии, российских конференций по информационным технологиям; B. экологические и юридические сайты; C. весь российский сегмент (на основе данных Яндекса). В работе по вебометрическим исследованиям принимает участие целая группа: ИПМИ Кар. НЦ (В. В. Мазалов, Н. Б. Луговая, Ю. В. Чуйко) и Петр. ГУ (И. Э. Косинец, О. Г. Илюкевич). Сайт http: //webometrics. krc. karelia. ru. Выступление на Ученом совете ИПМИ Кар. НЦ РАН. Март 2009 г.
Вебометрические исследования научных сайтов Вебометрика Обратим внимание на то, что все рассмотренные сегменты Веба пункта А. состоят из т. н. регламентируемых сайтов (в предположении того, что у них меньше хаоса). Регламентируемый сайт – существует официальный документ, определяющий цели, задачи, структуру, правила наполнения контентом и т. д. (Лучше сказать – «может/должен существовать документ…» ). Далее речь пойдет о регламентируемых сайтах. Рассмотрим 4 темы: • измерительные устройства и роботы (что измеряют, чем измеряют и что еще можно узнать о сайте), • рейтинги научных сайтов (на примере северо-западных учреждений РАН), • структура научного Веба (кусочек исследований по гранту РФФИ), • некоторые оптимизационные модели. Выступление на Ученом совете ИПМИ Кар. НЦ РАН. Март 2009 г.
Вебометрические исследования научных сайтов Измерительные устройства и роботы Измерения с помощью поисковых машин Используются многими исследователями. Введено, по-видимому, испанской группой Cybermetrics Lab (http: //internetlab. cindoc. csic. es). Что измеряют: • размер сайта (S - size) - общее количество страниц, обнаруживаемых на сайте поисковыми машинами; • видимость сайта (V - visibility) – общее количество обнаруживаемых уникальных гипертекстовых ссылок с других веб-ресурсов; • количество полнотекстовых файлов (R - rich files) - суммарное количество файлов с расширениями PDF, DOC, PS и PPT; • научность сайта (Sc - "scholar") – количество обнаруживаемых Google Scholar ссылок на сайт. Также измеряют PR (Page Rank Google) и т. ИЦ (тематический Индекс Цитирования Яндекса). Чем измеряют: Испанцы (да и все кроме россиян) используют Google, Yahoo Search, Live Search, Exalead и Google Scholar. Мы, естественно, добавляем в этот список Яндекс (и может быть Ramler). Выступление на Ученом совете ИПМИ Кар. НЦ РАН. Март 2009 г.
Вебометрические исследования научных сайтов Измерительные устройства и роботы Измерения с помощью поисковых машин Когда измеряют Значения индикаторов могут существенно изменяться в зависимости от даты измерений. Примеры, приведенные далее – на середину января 2009 года. Как измеряют: Поисковые машины имеют соответствующие сервисы. Например, для измерения V в Google надо ввести в строке поиска link: mathem. krc. karelia. ru. Результат: «… 229 связанных с mathem. krc. karelia. ru» . Хорошо ли измеряют: Много критических работ по самым разным поводам. Пример. Сайт Кар. НЦ РАН (www. krc. karelia. ru): SЯндекс=30000, SGoogle=5670, а SYahoo=18. (На самом деле не менее 64000 страниц. ) VЯндекс=215, VGoogle=189 и VYahoo=1025. (Сколько на самом деле? – а где взять по другому!? ? ) Выступление на Ученом совете ИПМИ Кар. НЦ РАН. Март 2009 г.
Вебометрические исследования научных сайтов Измерительные устройства и роботы Специализированные роботы (Robots, Spiders, Crawlers) Что делают: Обходят постранично сайт и собирают требуемую информацию. Например, просто собирают страницы в хранилище для последующей обработки. Проблемы: глубина поиска, зацикливания и прочее. Тематические краулеры собирают страницы на заданную тему, спамовые краулеры собирают почтовые адреса и т. д. На сайте http: //www. user-agents. org/ - большой список. Известные роботы: У каждой поисковой системы есть свой робот (например, Googlebot/2. 1, Yahoo. Seeker/1. 1 и т. д. ). Soc. Sci. Bot – университет Вулверхэмптона, сайт http: //cybermetrics. wlv. ac. uk. Soc. Sci. Bot собирает гиперссылки с заданного сайта на внешние сайты для последующего анализа. Выступление на Ученом совете ИПМИ Кар. НЦ РАН. Март 2009 г.
Вебометрические исследования научных сайтов Измерительные устройства и роботы Собственные разработки - робот LPR (Link, Page & Robot) и БД ВГ Необходимость разработки собственного поискового робота: • закрытость кодов и отсутствие технической документации у «чужих» , • неустойчивые каналы связи у нас, • разница в научных подходах и постановке задач, • невозможность развития в требуемых направлениях, возникающих по мере проведения исследований. Основные идеи LPR: • забраться как можно глубже, • собрать как можно больше информации о гиперссылках в виде <исходная страница> <уровень страницы> <контекст> <целевая страница>, • записать информацию в специально разработанную Базу данных внешних гиперссылок (БД ВГ). Поскольку ссылок очень много, в БД ВГ реализованы две операции над множеством гиперссылок: УНИФИКАЦИЯ (убирает дубли на одном уровне) и МИНИМИЗАЦИЯ (оставляет дубль с наименьшим уровнем). Полученное множество ссылок называется далее уникальным. Полезные «побочные эффекты» работы LPR как измерительного устройства: может подсчитать количество страниц на сайте (т. е. S), «битых» ссылок и др. Выступление на Ученом совете ИПМИ Кар. НЦ РАН. Март 2009 г.
Вебометрические исследования научных сайтов Измерительные устройства и роботы Некоторые результаты работы LPR Сайты РАН Отсканировано сайтов на 15. 02. 2009 сайты РАН отделения РАН (по областям науки) Региональные отделения РАН Региональные научные центры РАН Научные центры отделений Институты и научные учреждения РАН ВСЕГО количество 1 4 3 9 15 229 261 Отсканировано страниц, всего 950 000 Найдено ссылок, всего 540 000 Из них уникальных 73 000 количество страниц на сайтах учреждений РАН до 500 до 1000 до 2000 до 3000 до 10000 свыше 10000 сайтов в % 57% 15% 10% 6% 8% 5% Выступление на Ученом совете ИПМИ Кар. НЦ РАН. Март 2009 г.
Вебометрические исследования научных сайтов Рейтинги научных сайтов Ранжирование сайтов научных организаций Проект испанской исследовательской группы Cybermetrics Lab «Ranking Web of World Research Centers» (http: //research. webometrics. info). V измеряются Yahoo Search, Live Search и Exalead, нормируются по каждой поисковой машине и суммируются для каждого сайта, затем ранжируются; QV – место; S измеряются Google, Yahoo, Live Search и Exalead, нормируются по каждой поисковой машине, отбрасываются max и min и суммируются, затем ранжируются; QS – место; R – практически как S, QR – место; Sc - с помощью Google Scholar; QSc - место. WR=5 QV+2 QR+1. 5 QSc, затем ранжируются по WR. From TOP 2000 WORLD RANK 80 120 246 274 335 394 417 467 546 564 RESEARCH CENTER Russian Academy of Sciences Siberian Branch Russian Academy of Sciences State Institute of Information Technologies and Telecommunications Joint Institute for Nuclear Research Institute of Automation and Electrometry Russian Academy of Sciences Space Research Institute Russian Academy of Sciences Ural Branch Russian Academy of Sciences Dorodnicyn Computing Centre Russian Academy of Sciences Steklov Mathematical Institute Russian Academy of Sciences Institute of Cytology and Genetics Russian Academy of Sciences Выступление на Ученом совете ИПМИ Кар. НЦ РАН. Март 2009 г.
Вебометрические исследования научных сайтов Рейтинги научных сайтов Ранжирование сайтов научных организаций РАН Проект Института вычислительных технологий СО РАН «Рейтинг сайтов научных учреждений СО РАН» (http: //www. ict. nsc. ru/ranking) WShok = log 10(V) + log 10(S) + 2∙log 10(R) + 1, 5∙Sc 1 V = [VЯндекс+VGoogle+VYahoo]/3, S = [SЯндекс+SGoogle+SYahoo]/3 R = [RЯндекс+RGoogle+RYahoo]/3, Sc 1 = [log 10(Sc. Яндекс)+log 10(Sc. Google)]/2. Рейтинг от 11/12/2008 1 Портал Сибирского отделения РАН 2 Институт математики им. С. Л. Соболева CО РАН 3 Институт ядерной физики им. Г. И. Будкера СО РАН 4 Институт вычислительных технологий СО РАН 5 6 Президиум СО РАН Институт цитологии и генетики СО РАН Новосибирский институт органической химии им. Н. Н. Ворожцова СО РАН 7 8 Институт систем информатики имени А. П. Ершова СО РАН 9 Государственная публичная научно-техническая библиотека СО РАН 10 Институт философии и права СО РАН Выступление на Ученом совете ИПМИ Кар. НЦ РАН. Март 2009 г.
Вебометрические исследования научных сайтов Рейтинги научных сайтов Ранжирование сайтов научных организаций РАН северо-запада России Мы взяли 40 сайтов: 3 сайта региональных научных центров (Санкт-Петербургский, Карельский и Кольский), 24 сайта институтов РАН, географически расположенных в Санкт-Петербурге и Ленинградской области (подчиняющихся Отделениям РАН по областям науки), 1 научное учреждение Санкт-Петербургского научного центра, 7 – Карельского научного центра и 5 – Кольского научного центра. ИНДИКАТОРЫ SE R (PDF, DOC, V PPT) S No Название 3 Санкт-Петербургский научный центр РАН Sc SЯндекс SGoogle SYahoo VЯндекс VGoogle VYahoo RЯндекс RGoogle RYahoo Sc. Яндекс Sc. Google SLPR 1 Карельский научный центр РАН 30000 5670 2 Кольский научный центр РАН ДАННЫЕ LPR RLPR 18 215 189 1025 93 14 0 750 5072 3070 33200 689 74 5701 241 436 872 475 149 3890 552 420 41 223 3 15 34 500 0 1675 8 50 1650 614 68 16560 1305 Выступление на Ученом совете ИПМИ Кар. НЦ РАН. Март 2009 г.
Вебометрические исследования научных сайтов Рейтинги научных сайтов Ранжирование сайтов научных организаций РАН северо-запада России Формула для Wmod – это WShok и размеры сайтов S, измеренные LPR Место в рейтинге Wshok Место в рейтинге WMod 2 1 5 4 6 7 3 1 2 3 4 5 6 7 1 2 3 9 16 5 6 Название Физико-технический институт им. А. Ф. Иоффе РАН Зоологический институт РАН Институт проблем машиноведения РАН Петербургский институт ядерной физики РАН Институт русской литературы РАН (Пушкинский дом) Кольский научный центр РАН Кунсткамера - Музей антропологии и этнографии РАН Попарные значения коэффициентов корреляции на множестве из 40 сайтов - свыше 0, 7. Выводы: • «большие» оказываются наверху, а «маленькие» внизу вне зависимости от методик, по-видимому, это сильно связано с большой разницей в количестве страниц, • значительное влияние оказывает выбор «единицы анализа» , например, использование в качестве единицы анализа не только доменного имени официального сайта ИПМИ Кар. НЦ РАН, но и всех его веб-ресурсов, известных авторам, изменяет положение в рейтинге с 34 -го сразу на 16 -е, • побольше бы, например, полнотекстовых файлов. Выступление на Ученом совете ИПМИ Кар. НЦ РАН. Март 2009 г.
Вебометрические исследования научных сайтов Структура научного Веба Целевое множество исследования Российская академия наук (1) - это 9 (4) отделений по областям науки, 3 (3) региональных отделения, 14 (9) региональных научных центров, 15 (15) научных центров региональных отделений и 470 (229) научных учреждений (институтов, центров, музеев, станций). В принципе, нас интересуют все официальные сайты, но не все институты их имеют (по крайней мере, с индивидуальным доменным именем). Мы знаем, что требуемых сайтов примерно 340 -350. (Красным в скобках – количество отсканированных) В случае наличия у учреждения нескольких сайтов в целевое множество включался тот из них, который удовлетворяет одному из следующих условий (приоритет сверху вниз): • включен в перечень информационных систем научных учреждений РАН; • указан в соответствующем перечне на сайте регионального отделения или регионального научного центра; • указан в соответствующем перечне на сайте научного центра регионального отделения; • на самом сайте сказано, что он является официальным сайтом учреждения. Выступление на Ученом совете ИПМИ Кар. НЦ РАН. Март 2009 г.
Вебометрические исследования научных сайтов Структура научного Веба Типология внешних ссылок 73000 уникальных гиперссылок распределяются примерно по 30 -35 типам. Некоторые из них: Название типа внешней ссылки Вышестоящая организация Фонды Коллеги Публикации сотрудников Научные труды организации Новостные ленты Научное мероприятие Доступ к базам данных Научные библиотеки Личные страницы Рекламные ссылки Разработчики сайта Счётчики Гостевые хостеров) ссылки Описание внешней ссылки Ссылка на веб-ресурс организации, структурным подразделением которой является организация-владелец сайта. Ссылка на веб-ресурс организации, осуществляющей финансирование проектов. Ссылка на веб-ресурс организации, занимающейся видами деятельности, аналогичными с организацией-владельцем сайта. Ссылка на опубликованную в Вебе статью или тезисы автора(ов), работающего в организации-владельце сайта. Ссылка на веб-ресурс, на котором опубликован сборник, монография или материалы конференции организации. Ссылка на новостной веб-ресурс. Ссылка на веб-ресурс с информацией о проведении научной конференции, семинара, совещания и др. Ссылка на онлайновые базы данных. Ссылка на веб-ресурс научной библиотеки. Ссылка на персональную страницу сотрудника, расположенную на другом веб-ресурсе. Ссылки на информацию о товарах, услугах, развлекательных мероприятиях. Ссылка на сайт разработчиков сайта данной организации. Ссылка на сайт разработчиков счетчика статистики. (ссылки Ссылки, не имеющие прямого отношения к содержанию сайта и сделанные с веб-ресурсов других организаций, размещенных на сайте организации-владельца. Выступление на Ученом совете ИПМИ Кар. НЦ РАН. Март 2009 г.
Вебометрические исследования научных сайтов Структура научного Веба Частота встречаемости внешних ссылок • Очень предварительное исследование. • «Вручную» обследованы уникальные ссылки 26 сайтов, выбранных произвольным образом. • Приводятся результаты по агрегированным типам: 1 2 3 4 5 6 7 Организации Публикации Справочная информация Персоналии Реклама, счетчики, разработчики Ссылки хостеров Прочие 29, 1% 3, 3% 32, 9% 1, 5% 28, 3% 1, 6% 3, 2% Анализ ссылок «свои-чужие» «Свои ссылки» – уникальные ссылки на сайты целевого множества, «чужие ссылки» – все остальные уникальные ссылки. Соотношение «своих» к «чужим» сильно меняется от сайта к сайту, но в среднем по всем отсканированным сайтам равно 0, 055. Выступление на Ученом совете ИПМИ Кар. НЦ РАН. Март 2009 г.
Вебометрические исследования научных сайтов Структура научного Веба Административный каркас. Структура РАН В Российской академии наук существуют два типа подчиненности: Административная подчиненность (по Уставу РАН, 2007, примеры): Отделение математических наук входит в РАН, Институт прикладной математики им. М. В. Келдыша РАН входит в Отделение математических наук РАН, Сибирское отделение РАН входит в РАН, ИМПМИ Кар. НЦ РАН входит в Кар. НЦ РАН, Амурский научный центр ДВО РАН (в Уставе нет, используем термин «входит» ). Научно-методическое руководство (по Уставу, пример): Отделение математических наук осуществляет методическое руководство ИПМИ Кар. НЦ РАН. научно- Выступление на Ученом совете ИПМИ Кар. НЦ РАН. Март 2009 г.
Вебометрические исследования научных сайтов Структура научного Веба Административный каркас. Определения Из ссылок на организации выделим часть «своих ссылок» , указывающих на сайт (ближайшей) вышестоящей (или подчиненной) организации. Будем говорить, что существует каркасная ссылка вверх, если существует хотя бы одна ссылка с данного сайта на сайт вышестоящей организации. Аналогично определяется каркасная ссылка вниз. Определим силу связности (FСud - Force of Connectivity) между вышестоящим сайтом u и нижестоящим сайтом d: Соответственно, сила связности между вышестоящим сайтом u и всеми нижестоящими сайтами d D: Выступление на Ученом совете ИПМИ Кар. НЦ РАН. Март 2009 г.
Вебометрические исследования научных сайтов Структура научного Веба Административный каркас. Исследования Административный каркас научного Веба - отражение административных и научно-методических отношений подчиненности. Мы можем судить, насколько он крепок, вычисляя FСud. Примеры FСu. D для отношения «входит» : u – РАН, D – научные отделения РАН: FСu. D = 0. 9, u – РАН, D – региональные научные центры РАН: FСu. D = 0. 778, u – СО РАН, D – научные центры СО РАН: FСu. D = 0. 583, u – Кар. НЦ РАН, D – институты Кар. НЦ РАН: FСu. D = 1. А вот для научно-методических отношений FСu. D практически равен нулю. (Всего две ссылки из 200 потенциально возможных). Поэтому далее мы это отношение подчиненности не рассматриваем. Выступление на Ученом совете ИПМИ Кар. НЦ РАН. Март 2009 г.
Вебометрические исследования научных сайтов Структура научного Веба Административный каркас. Структура и сила связности Выступление на Ученом совете ИПМИ Кар. НЦ РАН. Март 2009 г.
Вебометрические исследования научных сайтов Структура научного Веба Связность научных подмножеств Научное подмножество – подмножество целевого множества, объединенное по некоторому содержательному признаку. Пример: сайты институтов Отделения химии и наук о материалах. Отделение химии и наук о материалах 95 101 161 211 220 234 272 277 292 352 Институт биохимической физики им. Н. М. Эмануэля РАН Институт высокомолекулярных соединений РАН Институт металлоорганической химии РАН Институт проблем химической физики РАН Институт синтетических полимерных материалов РАН Институт структурной макрокинетики и ПМ РАН Институт химии растворов РАН Институт химической физики им. Н. Н. Семенова РАН Институт элементоорганических соединений РАН Центр фотохимии РАН 95 101 161 211 220 234 272 277 292 352 95 101 161 211 1 1 220 1 234 1 272 1 277 1 1 1 1 292 1 1 1 1 352 В целом сила связности научных подмножеств очень низкая. В примере 0. 17, это очень хороший результат. На сегодня обследовано 17 подмножеств, в среднем сила связности равна 0. 066. Выступление на Ученом совете ИПМИ Кар. НЦ РАН. Март 2009 г.
Вебометрические исследования научных сайтов Структура научного Веба Ближайшее окружение научного сайта (окрестность, пучок) Окрестность - это веб-ресурсы организации или учреждения, не являющиеся официальным сайтом. Существуют, по крайней мере, два вида: • размещены на доменном имени официального сайта на следующих уровнях (типа ddd. nnn. ss); • доменные имена указаны прямым перечислением в разделе типа «Веб-ресурсы научного учреждения» . Недостатки: в первом случае это не всегда элемент окрестности, во втором - списка может и не быть. По результатам обследования 40 сайтов можно предсказать, что около 13% уникальных ссылок являются пучковыми ( 10000). Выступление на Ученом совете ИПМИ Кар. НЦ РАН. Март 2009 г.
Вебометрические исследования научных сайтов Структура научного Веба Научные веб-коммуникаторы Научным веб-коммуникатором называется сайт, имеющий отношение к научной деятельности, не являющийся официальным сайтом научного учреждения и/или организации РАН и имеющий входящие ссылки с и/или исходящие ссылки на множество официальных сайтов. «Имеющий отношение к научной деятельности» - небесспорный термин, но можно попытаться определить и прямым перечислением. Виды веб-коммуникаторов: посредник – много входящих, много исходящих, индуктор – мало входящих, много исходящих, коммутатор – много входящих, мало исходящих. Примеры: • прекрасный посредник - Math. Net. Ru (342 входящих с, 186 исходящих на), • коммутатор – РФФИ (451 входящая), • индуктор – Википедия (очень много исходящих на; почти шутка). Исследования только начались. Выступление на Ученом совете ИПМИ Кар. НЦ РАН. Март 2009 г.
Вебометрические исследования научных сайтов Структура научного Веба Научные веб-коммуникаторы группа сайтов-коммуникаторов библиотеки вузы высокотехнологичные фирмы журналы конференции научные общества научные порталы поисковые системы и счетчики системы поиска публикаций федеральные органы власти фонды ВСЕГО количество обследовано уникальных коммуникаторов ссылок 5 3 2 2 2 7 5 4 2 3 9 44 количество сайтов 402 494 915 69 18 157 419 189 441 310 733 112 93 32 27 9 63 49 101 42 111 191 4147 830 Примерно 94 уникальных ссылки (или 20 сайтов) на 1 коммуникатор. Выступление на Ученом совете ИПМИ Кар. НЦ РАН. Март 2009 г.
Вебометрические исследования научных сайтов Структура научного Веба Схемой научного Веба называется ориентированный граф G=(V, E), где V – множество вершин, состоящее из следующих непересекающихся подмножеств: Vk – вершины, соответствующие официальным научным сайтам, Vbk – вершины, соответствующие сайтам окрестностей официальных сайтов, Vcom – вершины, соответствующие научным коммуникаторам. E – множество дуг, соответствующих гиперссылкам между сайтами, задающими множество вершин V; дуга e(i, j) существует тогда и только тогда, когда существует хотя бы одна гиперссылка с сайта i на сайт j; петель e(j, j) не существует. Выступление на Ученом совете ИПМИ Кар. НЦ РАН. Март 2009 г.
Вебометрические исследования научных сайтов Структура научного Веба Схема научного Веба Выступление на Ученом совете ИПМИ Кар. НЦ РАН. Март 2009 г.
Вебометрические исследования научных сайтов Структура научного Веба Схема научного Веба Выводы и результаты: • в модели представлен достаточно большой охват уникальных исходящих ссылок (прогноз: каркас и научные подмножества 4000, окрестности 10000 и коммуникаторы – не менее 40000, т. е. около 70% всего множества), • сделана попытка минимальным количеством понятий описать структуру достаточно сложного сегмента Веба, • очевидные возможности планирования дальнейшего развития, в том числе и с использованием административных возможностей. Выступление на Ученом совете ИПМИ Кар. НЦ РАН. Март 2009 г.
Вебометрические исследования научных сайтов Некоторые оптимизационные модели Задача размещения ссылок в сообществе (например, в научном подмножестве) n – количество участников, ci – значимость i -го участника, mi – максимально возможное количество прямых ссылок от i -го на других участников, . Матрица ссылок X={xij}, xij =1, если существует ссылка от i-го участника к j-му, и xij =0, если ссылки не существует. Функция приращения значимости Ограничения , , . Одна из возможных целевых функций: ( ) Содержательно: распределение ссылок должно привести в первую очередь к увеличению значимости наименее значимых ресурсов, при этом суммарный прирост значимости по всем участникам системы должен быть максимальным. Выступление на Ученом совете ИПМИ Кар. НЦ РАН. Март 2009 г.
Вебометрические исследования научных сайтов Некоторые оптимизационные модели Моделирование клик-сообществ - это вероятность нахождения i-го рядового сайта на j-й позиции в каталоге Выступление на Ученом совете ИПМИ Кар. НЦ РАН. Март 2009 г.
Вебометрические исследования научных сайтов Некоторые оптимизационные модели Моделирование клик-сообществ Позиция i-го участника изменяется за один сеанс следующим образом: • если пользователь переходит с i-го рядового сайта на головной сайт, то повышается; • если пользователь попадает с головного сайта на i-го участника, то понижается; • если пользователь за сеанс не делает перехода с головного сайта на рядовой (или наоборот), то позиции всех рядовых сайтов остаются прежними. Выступление на Ученом совете ИПМИ Кар. НЦ РАН. Март 2009 г.
Вебометрические исследования научных сайтов Некоторые оптимизационные модели Моделирование клик-сообществ Система: Здесь Функция выигрыша для i-го рядового сайта Выступление на Ученом совете ИПМИ Кар. НЦ РАН. Март 2009 г.
Вебометрические исследования научных сайтов Некоторые оптимизационные модели Моделирование клик-сообществ Результаты моделирования 1 Выступление на Ученом совете ИПМИ Кар. НЦ РАН. Март 2009 г.
Вебометрические исследования научных сайтов Некоторые оптимизационные модели Моделирование клик-сообществ Результаты моделирования Law. Dir (реальное клик-сообщество) Выступление на Ученом совете ИПМИ Кар. НЦ РАН. Март 2009 г.
Вебометрические исследования научных сайтов Заключение 1. Сформулированы основные направления исследований. 2. Созданы собственные программные средства для проведения исследований. 3. Исследованы задачи ранжирования научных сайтов, получен ряд результатов, сформулированы собственные подходы. 4. Предложены собственные подходы к моделированию научного сегмента Веба. 5. Построены и исследованы математические оптимизационные модели фрагментов Веба. Выступление на Ученом совете ИПМИ Кар. НЦ РАН. Март 2009 г.
15af13e7088c71f291771efb2e1e049f.ppt