«Палех» - умный алгоритм Яндекса


Недавно запущенный Яндексом новый алгоритм «Палех» должен значительно повысить точность понимания вводимых пользователем запросов, а поисковик – выдавать еще более эффективные ответы. Базой алгоритма являются искусственные нейронные сети (ИНС), созданные по типу деятельности нейронных связей в человеческом мозге. Иными словами, это уже искусственный интеллект, который способен самостоятельно обучаться.

Предпосылки

Как сообщает блог Яндекса, ежедневно ведущему российскому поисковику приходится выдавать ответы почти на 300 миллионов запросов. Некоторые из них, как например, «вконтакте», «фейсбук» или «одноклассники», пользователи вводят практически ежесекундно. Из всего перечня подобные и иные высокочастотные запросы занимают лишь небольшой процент. Их выдача хорошо отлажена, на основе поведенческой и иной информации.

Зато свыше 100 миллионов – это редкие, либо вовсе уникальные словосочетания. Тут статистика во многих случаях просто отсутствует. Поэтому поисковику сложно выдавать максимально релевантные ответы. В ряде случаев в выдаче могут вовсе не встречаться слова из запроса. Чтобы улучшить ситуацию в сфере низкочастотников, Яндекс и разработал алгоритм «Палех» на базе новой математической модели – нейросетей.

Принцип работы

Так как программный язык представляет собой цифры, разработчики создали алгоритм, преобразующий сотни миллионов запросов в группы. А каждая группа состоит из 300 чисел. Это, своего рода, 300-мерное семантическое пространство, в котором каждая страница сайта имеет свои координаты.

Нашему мозгу такое количество измерений объять сложно, но для аналогии можно взять нашу традиционную двухмерную систему координат (плоскость), где имеется ось абсцисс и ось ординат. Запрос пользователя Яндекс помещает в это пространство, и те из страниц, которые окажутся наиболее близкими к координатам запроса, и будут самыми релевантными. При этом каждый раз алгоритм будет учить и совершенствовать сам себя.

Такая методика названа «семантическим вектором». Этот принцип поиска является очень эффективным при выдаче ответов на низко- и микрочастотные запросы.

Влияние на SEO

Пока что «Палех» работает с содержанием «тайтла», сравнивая его с текстом запроса. Теперь Яндексу необязательно подбирать страницы с точным вхождением ключевых слов. Более того, в заголовке их может вовсе не быть.

Учитывая этот момент, у многих оптимизаторов появится соблазн повлиять на выдачу с помощью «тайтлов», делая их более длинными и добавляя хвосты-ассоциации из разных фраз. Такое SEO чревато совершенно обратным результатом.

«Палех» и так сообразит, чему посвящена страница. Поэтому лучше писать нормальные описания. А вот сами статьи, которые «заточены» под средне- и низкочастотные запросы, лучше писать объемнее, используя максимум смысловых оборотов, а не просто точных вхождений ключевиков. Ведь в ближайшей перспективе более корректный анализ с использованием нейросетей дойдет и до самих текстов. Зачем же делать работу дважды!

Возврат к списку