Как осчастливить 1000 человек за 24 часа Dating Service на основе социальной сети Антон Алексеев, Алексей Сергушичев, Виктор Евстратов, Евгений Путин, Федор Царев
Люди хотят быть счастливыми Всего лишь одна великая любовь за всю жизнь оправдывает беспричинные приступы отчаяния, которым мы подвержены. Альбер Камю 2
«Пирамида любви» 9 000 900 000 3
OK – сеть для адюльтера? • ~130000 человек с мужем/женой и несколькими любовниками/любовницами 4
Распределение возрастов людей в парах 5
Классификация для рекомендации ? 6
Данные для построения классификатора • 1500 пар, которые задекларировали свои отношения • 1500 пар вида (пользователь из пары, его друг) • 1500 случайно выбранных пар 7
Базовые графовые фичи • Число друзей • Есть ли хотя бы один друг каждого из типов: – Friend – Love – Spouse – Parent – Child –… 8
Демография “half-your-age-plus-seven” 9
Разница в возрасте • Мужчины старше • Средняя разница в возрасте ~1. 4 года • В развитых странах – 2 -3 года (http: //en. wikipedia. org/wiki/Age_disparity_i n_sexual_relationships) 10
Разница в возрасте (ОК vs США) 11
Разница в регионе проживания 12
Текстовые фичи • Пишет всего 151 пользователь • Всего ~1500 постов • Видимо, люди заняты более приятными вещами! 13
Фичи, связанные с лайками и сообществами • Число лайков для каждой группы • Корреляция числа лайков для пары пользователей • Суммарное число лайков • Число сообществ, в которые входит каждый в паре 14
Более сложные графовые фичи • Построены подграфы друзей для каждого друга 3000 пользователей ~750000 графов • Modularity, clusterization, average clusterization, density, … 15
Результаты построения классификатора • Использует базовые графовые фичи, демографию и географию • Random forest (n = 30), точность классификации ~0. 74 16
Масштабируемость • Все фичи считались на сервере с помощью Pig 17
Спасибо за внимание! Будьте счастливы и любите друга! 18