Теперь мы думаем одинаково

Новость от 20.09.2017

 

 

 

    Месяц назад, 22 августа, «Яндекс» официально запустил новую версию своей поисковой системы. Алгоритм «Королёв», который лёг в основу поисковика, стал усовершенствованной версией появившегося в ноябре прошлого года алгоритма «Палех». Суть инновации в том, что теперь Яндекс понимает то, о чем его спрашивают, и выдает страницы не только по ключевым словам, но и по смыслу.

 

    Создание этих алгоритмов происходило на основе нейронных сетей. Такая компьютерная модель способна заменить очень умного человека: нейросети работают по такому же принципу, что и человеческий мозг, их главная особенность — самостоятельность и способность учиться на своих же ошибках. Теперь пользователи могут найти даже то, в чём не уверены или недостаточно осведомлены — нужно лишь ввести описание искомой вещи и нажать кнопку «Enter». Кроме того, разработчики показывают нейронной сети картинки с нужными объектами — так называемые положительные примеры, и отрицательные, что позволяет пользователям находить изображения, наиболее точно соответствующие описанию. Такой результат получается посредством сравнения трёхсотмерных чисел, в которые поиск преобразует наш словесный запрос. Этот способ обработки называется семантическим вектором. Все эти числа представлены в пространстве координат, поэтому чем ближе друг к другу их расположение, тем лучше страница отвечает на запрос. Со временем семантический вектор стал применяться не только в поисковике, но и в таких сервисах, как «Картинки». Но для того, чтобы обучаться, поисковая система нуждается и в обычных пользователях - зарегистрировавшись на сервисе «Яндекс.Толока», можно оценивать работу поисковика и даже получать за это деньги.

 

    Разработчики системы «Палех», распределяя запросы в Яндексе по частоте, схематически представили их в виде птицы, имеющей «Клюв» (частые запросы), «туловище» (средняя частотность) и «хвост» (редкие запросы). Последняя составляющая схемы - хвост - стала основой разработки. Таким длинным хвостом славится героиня палехской миниатюры — Жар-птица, откуда и пошло название алгоритма.

 

    Редкие запросы сложны для поисковой системы, но их тоже удалось разделить на группы (запросы (от детей), содержащие неточности и ошибки; запросы о нахождении названия какого-либо произведения искусства по описанию запомнившегося эпизода и т.д.). В итоге, Яндекс начал понимать смысл заголовка и сопоставлять его с сутью запроса.

 

    Усовершенствованный алгоритм назван в честь учёного и основоположника советской космонавтики. Но «Королёв» называют космическим, прежде всего, из-за его принципов работы. Во-первых, теперь система определяет суть контента в момент индексации и эти данные хранит. Во-вторых, учитывается смысл других запросов, которым релевантна страница.

 

    Запустившийся месяц назад алгоритм «Королёв», уже завоевал уважение пользователей и доказал своё право на существование. Эти нововведения не говорят, а уже кричат о том, что САЙТЫ должны быть ДЛЯ ЛЮДЕЙ, а не для роботов. Ведь искусственный интеллект, который используется в этой системе, теперь общается с нами на одном языке и даже думает так же, как и мы. Разработчикам сайтов это говорит о том, что теперь ключевые слова не так важны в тексте, как контент, который должен заставлять пользователей проводить на станице как можно больше времени, и тем самым ранжировать сайт выше.

 

Татьяна Кудряшова

Назад