Приходит пользователь к Яндексу и говорит одно слово: [вендетта]. Без контекста невозможно понять, что он ищет. Значение слова? Фильм «V значит ”вендетта”»? Или альбом Земфиры? Конечно, можно ответить наугад, но это же не рулетка. Чтобы дать точный ответ, Яндекс анализирует поисковые интересы пользователя и выдаёт результаты, подходящие именно ему.
Эта задача сложнее, чем кажется, ведь интересы пользователей не статичны. Они всё время меняются, и более половины из них живут не больше суток. Яндекс научился учитывать эти сиюминутные интересы на основе недавней поисковой истории пользователя и сразу же адаптировать под них результаты поиска.
К примеру, пользователь ищет холодильник. Чтобы не ошибиться с выбором, он читает обзоры и отзывы. Остановившись на холодильниках определённого производителя, он возвращается на Яндекс с новым запросом, чтобы найти конкретную модель. Яндекс учитывает сиюминутный интерес пользователя к обзорам и первыми показывает в поисковой выдаче сайты нужной тематики. Если пользователь ещё не готов к покупке – ему важнее сайты с обзорами, а не интернет-магазины.
Учёт сиюминутных интересов начинает влиять на результаты поиска уже через несколько секунд, даже если человек впервые зашел на Яндекс и задал всего пару вопросов. Для этого Яндекс анализирует данные поисковых сессий в режиме реального времени, обрабатывая около 10 терабайт данных в сутки, с нагрузкой до 200 мегабайт в секунду.
Сиюминутные интересы на то и сиюминутные, чтобы появляться и быстро исчезать. Поэтому они учитываются только тогда, когда это нужно. Если сегодня любитель классики ищет билеты на «Нашествие», то это вовсе не значит, что его музыкальные вкусы резко изменились. Может, он хочет сделать подарок другу? В будущем он будет получать в ответ на запрос [нашествие тема] не ссылки на рок-фестиваль, а информацию о теме нашествия фашистов в Седьмой симфонии Шостаковича. Если, конечно, вдруг не полюбит рок.
Сиюминутные интересы – важный элемент пользовательского контекста. Чем больше таких элементов учитывает Яндекс, тем сильнее меняется качество поиска, а с ним и поведение пользователей. К примеру, когда в поиске появился учёт региона, пользователи перестали писать [подержанные автомобили Самара], потому что уточнять регион стало излишне. Когда Яндекс начал анализировать историю запросов, пользователи стали чаще видеть в выдаче любимые сайты и ссылки на интересные им темы (см. исследование Яндекса о постоянных поисковых интересах). Теперь, с добавлением анализа текущей поисковой сессии, поиск научился учитывать не только привычки, но и сиюминутные потребности пользователей, а значит – лучше решать их задачи.
Как работает новый персональный поиск, смотрите в нашем ролике.
Команда поиска
P.S. Подробнее о том, как устроен персональный поиск, читайте в следующем посте.
На один и тот же вопрос может быть несколько правильных ответов — в зависимости от нужд пользователя. Например, кому-то по запросу [nevermind] нужно найти перевод слова, а кому-то — альбом «Нирваны». Персональный поиск умеет учитывать личные интересы и предпочтения пользователя и выбирать наиболее подходящий для него ответ.
В основе персонального поиска лежит анализ поискового поведения — например, какие запросы задает человек, на какие сайты переходит, на каком языке общается с поисковой системой. Анализируя вопросы и переходы пользователя, Яндекс делает вывод о том, что ему сейчас важно и интересно. Так, если человек часто ищет бесплатный софт, бесплатные книги и музыку, вероятно, его в принципе интересует бесплатный контент. Эти данные учитываются как при выборе подсказок, так и при поиске персонального ответа на вопрос.
Подсказки
Выбирая для человека подсказки, Яндекс пытается предугадать его следующие запросы. При этом поисковая система опирается на вопросы людей с похожим поисковым поведением. Для этого было выделено 400 000 групп пользователей, интересы которых более-менее сходны. Разумеется, человек не зачисляется ни в одну из этих групп навсегда. По мере изменения интересов он переходит из одной группы в другую.
Практика показывает, что примерно четверть своих запросов пользователи задают повторно и часто кликают по одним и тем же результатам. Таким образом они переходят к любимым сайтам и документам. Чтобы облегчить им эту задачу, Яндекс добавляет в подсказки недавние запросы человека и его любимые сайты. Разумеется, при вводе запроса на соответствующие буквы. Например, если вчера пользователь спрашивал про [обои для гостиной], сегодня Яндекс сам предложит ему этот запрос в подсказках. А завсегдатаю ВКонтакте покажет ссылку на его любимую сеть — стоит только начать вводить ее название в поисковой строке.
Отбирая персональные подсказки, Яндекс учитывает также, какие запросы характерны для одной поисковой сессии. Например, если человек только что спрашивал [назад в будущее], и следующий его запрос начинается на «к», [кристофер ллойд] будет более полезен в подсказках, чем другие запросы на эту букву.
Персональные ответы
Мало помочь человеку задать вопрос, нужно еще подобрать ему наилучший ответ. Для этого используется специальная формула ранжирования. Она подстраивается под каждого пользователя с учетом его интересов и языковых предпочтений. С помощью персональной формулы Яндекс определяет, насколько каждый из найденных по запросу документов подходит конкретному человеку. Все документы получают свою оценку и располагаются в результатах поиска в соответствующем порядке. Получается, что по одному и тому же запросу два разных человека видят разные ответы. Например, вот как различаются подсказки и результаты поиска для людей с разной поисковой историей:
Формула ранжирования учитывает как постоянные (долгосрочные и среднесрочные), так и сиюминутные интересы человека. Все они в разной мере влияют на качество ответа на вопрос. Так, постоянные интересы отражают языковые предпочтения пользователя, его привычки и близкие ему темы. А сиюминутные — показывают, что важно человеку прямо сейчас. Например, пользователь, который обычно спрашивает про кино и музыку, может неожиданно заинтересоваться компьютерными играми, а потом надолго о них забыть. Таких интересов, которые быстро возникают и так же быстро сходят на нет, больше половины.
Чтобы быть в курсе постоянных интересов пользователя, Яндекс анализирует его поисковую историю за последние два месяца и за неделю. А чтобы следить за сиюминутными интересами – обрабатывает данные поисковых сессий в режиме реального времени. Это позволяет понять, что важно человеку прямо сейчас, и подстроиться под его интересы. Скажем , если в поисковой сессии любителя литературы вместе с названием произведения встретилось слово [афиша], возможно, что в данный момент человека интересует экранизация. Вот как различаются результаты поиска с учетом и без учета сиюминутных интересов пользователя:
Чтобы мгновенно реагировать на изменения в поисковом поведении людей, Яндекс создал систему обработки данных в режиме реального времени. Она обрабатывает более 10 терабайт данных в сутки, постоянно корректируя свои знания о потребностях пользователей. Благодаря этой системе запросы и клики, которые человек сделал только что, начинают влиять на результаты поиска уже через несколько секунд.
По умолчанию персональный поиск работает для всех пользователей поиска. И чем больше запросов задает человек, тем лучше поиск его понимает. Впрочем, каждый пользователь может сам решать, нужны ему ответы с учетом интересов или нет. Персональный поиск можно в любой момент включить или отключить в настройках сервиса.
2012-12-13 11:03:38
На основе материала Selling to the modern individual Конечно, вокруг нас всегда будут люди, которые ...
+ развернуть текстсохранённая копия
На основе материала Selling to the modern individual Конечно, вокруг нас всегда будут люди, которые видят мир только в белом или черном цвете. Никогда не исчезнут политики, ратующие за однопартийную систему, указывая на простоту ее эксплуатации. И, скорее всего, в сфере электронной коммерции всегда найдутся интернет-продавцы, считающие своих клиентов недалекими простаками. При этом, мир в [...]
2012-12-13 10:21:52
Яндекс запустил персональный поиск. Он предлагает пользователям подсказки и ответы, учитывая их ...
+ развернуть текстсохранённая копия
Яндекс запустил персональный поиск. Он предлагает пользователям подсказки и ответы, учитывая их личные интересы и предпочтения. Так, по запросу [гарри поттер] любителю чтения Яндекс найдет прежде всего книгу, а не фильм или игру. Персональный поиск стал основой для новой поисковой платформы Яндекса – «Калининград». Яндекс пытается понять, что интересует пользователя, анализируя его поисковое поведение — о [...]
Согласитесь, общаться легче, когда вас понимают с полуслова. Например, спрашиваешь у друга: «А что такое хумус?», а он отвечает: «Так это ж дип из нута». И все всё поняли — потому что есть опыт общения, контекст.
Мы учим Яндекс понимать пользователей практически так же хорошо. Причём каждого в отдельности, персонально. Первые шаги в этом направлении мы начали делать в прошлом году, запустив «Рейкьявик» — поисковую платформу, которая учитывает языковые предпочтения пользователей. Сегодня игру в города продолжил «Калининград».
Калининградский персональный поиск учитывает при ответе поведение каждого конкретного пользователя, его предпочтения. Также с оглядкой на это формируется набор поисковых подсказок. Подробно о том, как работает новая поисковая платформа, написано в статье раздела «Технологии» на company.yandex.ru. И конечно, как любой хороший друг, персональный поиск ненавязчив — в настройках у него есть кнопка отключения.
Между буквами «к» в конце одного города и начале второго происходило много чего «персонального». О чём-то мы уже рассказывали, к примеру: как вам сократить 12,4 секунды до 1,5 или в каких случаях Кристофер Ллойд важнее карты метро. При этом, конечно, что-то оставалось за кадром, как 6 формул ранжирования и 11 экспериментов (правда, теперь о них тоже можно узнать — в блоге Яндекса на Хабрахабре).
Из всего этого и не только мы и создаём персональный поиск. Останавливаться в ближайшее время не собираемся — будем учить Яндекс быть вам ещё лучшим другом.