939f8023b9329bea0baa500bbd7f9587.ppt
- Количество слайдов: 7
ВЕБОМЕТРИЧЕСКОЕ РАНЖИРОВАНИЕ: СРАВНЕНИЕ ДВУХ ПРОЕКТОВ Печников Андрей Анатольевич Институт прикладных математических исследований Кар. НЦ РАН
Первый проект Ranking Web of Research Centers - http: //research. webometrics. info/en/Europe/Russian%20 Federation Испанская группа Cybermetrics Lab В июле 2013 года было проведено ранжирование веб-сайтов около 8000 научных организаций, в том числе 183 российских. Второй проект Вебометрический рейтинг научных учреждений России - http: //webometrics-net. ru ИПМИ Кар. НЦ РАН (при поддержке РГНФ) В ноябре 2013 года было проведено ранжирование веб-сайтов 397 научных учреждений РАН. Целевое множество в обоих проектах - множество официальных сайтов учреждений, идентифицируемых по их доменным именам. Например, www. ipu. ru или mathem. krc. karelia. ru. Целевые множества совпали по 100 учреждениям. 2 -й из 7
Т. н. индикаторы, измеряемые некоторой поисковой системой: • S – количество страниц сайта; • R – количество полнотекстовых файлов на сайте, имеющих тип. pdf, . ps, . doc и. ppt; • V – количество уникальных внешних гиперссылок, сделанных на сайт; • Sc – индикатор «научности» сайта: число статей, отчётов, докладов, измеряемый Google Scholar. Инструменты У испанцев в 2013 - Google, Yahoo, Live Search и Exalead В 2014: Majestic SEO, Ahrefs Site Explorer, SCImago У нас - Google, Яндекс. Написано специальное ПО для автоматизации процесса сбора данных. Кроме того, у нас добавлены два новых индикатора: Vlink - количество ссылок, сделанных на сайт с других сайтов целевого множества, Vsite - количество сайтов, с которых сделаны эти ссылки. Измерения проводятся Bee. Crawler. 3 -й из 7
Измерения Пример измерения V для ИПУ РАН в Google: link: www. ipu. ru «Результатов: примерно 39. . . » 1. В проекте испанцев формализованная запись запросов к поисковым системам определена нестрого. «… измерения проведены с помощью Google Scholar» можно трактовать по разному. 2. Проблема «сглаживания ошибок» – у нас кое-как решена. Что у испанцев – неизвестно. 3. Поисковые системы «захватывают» поддомены, пример: www. krc. karelia. ru и mathem. krc. karelia. ru. 4 -й из 7
Ранжирование У испанцев даются ссылки на формулу примерно такого вида: Rating(i) = 5*KVav(i) + 2*KSav(i) + 1, 5*KRav(i) + 1, 5*KSc(i). Для научных организаций значения коэффициентов не приводятся. В проекте для университетов формула описана более подробно, чем для научных организаций, можно считать, что наибольшая значимость придается V (половина от общей значимости), затем следуют S, R и Sc. У нас по девяти индикаторам Sy, Sg, Sb, Ry, Rg, Vg, Sc, Vlink и Vsite (символы y, g и b обозначают Яндекс, Google и Bee. Crawler) вычисляются 7 параметров: • i 1 и i 2 – два ближайших ранга из трех, получаемых в результате ранжирования Sy, Sg, Sb; • i 3 – ранг, получаемый в результате ранжирования Vg; • i 4 – ранг, получаемый в результате ранжирования произведения (Vlink*Vsite); • i 5, i 6 – ранги, получаемые в результате ранжирования Ry, Rg; • i 7 – ранг, получаемый в результате ранжирования Sc. Далее находятся суммы i 1+…+i 7 для каждой единицы анализа, которые упорядочиваются по возрастанию, сайт с наименьшей суммой получает наивысший ранг и т. д. 5 -й из 7
№ Название учреждения РАН domain name Cyb. Labrank IPMIrank 1 Российская академия наук www. ras. ru 66 16 2 Уральское отделение РАН www. uran. ru 157 28 3 Физико-технический институт им. Иоффе РАН www. ioffe. ru 204 1 4 Музей антропологии и этнографии им. Петра Великого (Кунсткамера) РАН www. kunstkamera. ru 318 8 5 Институт прикладной математики им. М. В. Келдыша РАН www. keldysh. ru 342 4 6 Институт цитологии и генетики СО РАН www. bionet. nsc. ru 495 3 7 Вычислительный центр им. А. А. Дородницына РАН www. ccas. ru 541 25 8 Институт ядерной физики им. Г. И. Будкера СО РАН www. inp. nsk. su 543 18 9 Институт системного программирования РАН www. ispras. ru 551 46 10 Институт космических исследований РАН www. iki. rssi. ru 555 12 . . . . . ………………. … 91 Институт молекулярной биологии им. В. А. Энгельгардта РАН www. eimb. ru 5390 275 92 Институт "Международный томографический центр" СО РАН www. tomo. nsc. ru 5425 278 93 Институт синтетических полимерных материалов им. Н. С. Ениколопова РАН www. ispm. ru 5669 243 94 Институт экономических исследований ДВО РАН ecrin. ru 5797 189 95 Институт мозга человека им. Н. П. Бехтеревой РАН www. ihb. spb. ru 5925 293 96 Институт автоматизации проектирования РАН www. icad. org. ru 6431 301 97 Центр египтологических исследований РАН www. cesras. ru 6636 287 98 Научный центр нелинейной волновой механики и технологии РАН www. nwmtc. ac. ru 6749 320 99 Институт теоретической и экспериментальной биофизики РАН web. iteb. psn. ru 6773 318 100 Институт прикладной математики ДВО РАН www. iam. dvo. ru 6788 328 6 -й из 7
Коэффициент ранговой корреляции Кендалла =0. 74 Очень осторожный вывод: по-видимому, полученный результат может служить подтверждением правильности подходов и методов в проекте ИПМИ. 7 -й из 7
939f8023b9329bea0baa500bbd7f9587.ppt