Ликбез: Все о новом алгоритме Google RankBrain

google-brain-620x250Google использует систему искусственного интеллекта  RankBrain, чтобы лучше обрабатывать поисковые запросы. Вот все, что мы знаем об этом.

Недавно появились новости о том, что Google использует самообучающуюся систему искусственного интеллекта под названием  “RankBrain”, которая помогает отсортировывать поисковые результаты. Вам интересно, как же она работает, и какое место занимает в общей системе ранжирования? Мы расскажем вам все, что знаем.

Информация была взята из несколько источников. Первый — блог Блумберга. Второй — информация, которую разместила компания Google в Search Engine Land. Третий — наши предположения на основе существующих знаний в тех вопросах, на которые Google не дает ответов.

Что такое RankBrain?

RankBrain — это самообучающаяся система искусственного интеллекта от Google, позволяющая обрабатывать более сложные запросы в краткий период времени.

Что значит самообучающаяся?

Самообучающаяся система — это когда компьютер самостоятельно учится выполнять команды, вместо того чтобы следовать заданной программе, разработанной человеком.

Что такое искусственный интеллект?

Настоящий искусственный интеллект обладает такими же умственными способностями, что и человек, по крайней мере, в том, что касается приобретения знаний путем обучения и нахождения новых связей на основе существующих знаний.

Конечно, настоящий искусственный интеллект существует только в рамках фантастической литературы. На практике искусственным интеллектом считается такая компьютерная система, которая была создана для изучения и создания определенных связей.

Чем искусственный интеллект отличается от самообучающихся систем? В рамках RankBrain эти два термина звучат практически как синонимы, которые легко взаимозаменить.

Появилось ли что-то новое в обработке результатов с внедрением RankBrain?

Нет. RankBrain — это часть общего поискового алгоритма Google, это компьютерная программа, призванная обрабатывать миллиарды страниц и находить наиболее релевантные, исходя из поискового запроса.

Как называется новый поисковой алгоритм Google?

Он называется Hummingbird. Многие годы у этого алгоритма не было официального названия. И только в середине 2013 компания Google раскрыла тайну об алгоритме и дала ему имя — Hummingbird.

Является ли RankBrain частью алгоритма Hummingbird?

Как понимаем мы. Hummingbird — это основной поисковой алгоритм. Можно провести аналогию с машиной: у нее один двигатель. Двигатель в свою очередь состоит из различных частей: маслоочиститель, топливный насос, радиатор и т.д. Также и Hummingbird собирает воедино различные алгоритмы, и RankBrain — самый новый из них.

В частности, мы знаем, что RankBrain — это часть основного алгоритма  Hummingbird, так как Блумберг писал в своем блоге о том, что RankBrain не затрагивает работу всего поиска, как это делает основной алгоритм.

Hummingbird также содержит в себе части других алгоритмов, известных в мире SEO под названием Panda, Penguin и Payday, борющихся со спамом, Pigeon, созданный для улучшения локального поиска, Top Heavy, сбрасывающий вниз страницы, перегруженные рекламными объявлениями, Mobile Friendly, поднимающий в топ страницы, поддерживающие мобильные устройства, и Pirate, который убирает из поиска страницы, нарушающие авторские права.

Я думал, что алгоритм Google называется “PageRank”

PageRank — это тоже часть алгоритма Hummingbird, который присваивает “важность” определенным страницам, основываясь на количестве источников, ссылаемых на эти страницы.

PageRank — уникален уже тем, что это первый алгоритм, которому Google дал название, с самого зарождения поисковой системы в 1998 году.

Что насчет “сигналов” ранжирования?

Сигналы — это элементы Google, использующиеся для ранжирования вебстраниц. Например, все слова, размещенные на странице, — это сигналы. Следующий сигнал — слова, выделенные жирным шрифтом. Если страница поддерживает мобильные устройства, это еще один сигнал, и так далее.

Все эти сигналы считываются различными составляющими алгоритма Hummingbird, предопределяя, какие страницы окажутся в поисковой выдаче.

Как много существует сигналов?

В поиске Google существует более чем 200 основных сигналов ранжирования, которые, в свою очередь, имеют 10 000 вариаций подсигналов.  

Если хотите иметь представление о том, как ранжируются поисковые сигналы, взгляните на картинку:

RankBrain

Это очень хорошее руководство о том, с помощью чего поисковые системы, такие как Google, ранжируют страницы в интернете.  

RankBrain — третий по значимости поисковой сигнал?

Все верно. Эта новая система является третьим по значимости фактором, решающим, какие страницы будут лучше ранжироваться.  Из статьи Блумберга:

RankBrain — это один из “сотни” сигналов, которые подчиняются алгоритму, влияющему на ранжирование страниц в поиске Google. Через несколько месяцев он начнет работать, RankBrain стал третьим по значимости сигналом, способствующим обработки поисковых запросов.

Какие сигналы первые и вторые по значимости?

Google не дает никаких комментариев по этому поводу.

Это нечестно, что Google замалчивает информацию о первых двух сигналах. И статья Блумберга не случайность. Google хочет подогреть интерес, делая намеки на прорыв в развитии самообучающихся систем.

Но чтобы действительно оценить данное открытие, будет полезно узнать о других процессах, которые Google использует сейчас, перед тем как анонсировать RankBrain.

По нашему предположению, ссылки остаются самым важным сигналом., а вторым по значимости сигналом являются слова.

Для чего нужен RankBrain?

RankBrain используется для того, чтобы находить страницы, не содержащих такие же слова, которые были использованы пользователями для поиска.  

Разве Google уже не находил страницы, выходящие за пределы поискового запроса?

Да, долгое время Google не находил страницы, выходя за рамки введенного слова. Например, давным-давно если вы вводили слово “сапог”, то Google не мог найти страницы, содержащие слово “сапоги”, потому что с технической точки зрения это два разных слова. Но время идет, и теперь Google понимает, что слово “сапоги” — это вариация слова “сапог”, как “бегущий” — вариация слова “бежать”.

Также Google стал понимать синонимы, и если вы вбиваете в поиск слово “сникеры”, он знает, что вы имеете ввиду “обувь для бега”. Также у него появилось своего рода абстрактное мышление, и теперь Google понимает, что слово “яблоко” может обозначать фрукт и IT-компанию.

Что мы знаем о Knowledge Graph?

С помощью базы знаний Knowledge Graph, запущенной в 2012 году, Google стал умнее и научился лучше распознавать связи между словами. Самое важное, что он выстраивает поисковые результаты не по отдельным словам, а целой цепочкой.

Это означает, что если мы введем в поиск слово “Обама”, Google будет знать, что мы имеем в виду президента Соединенных Штатов Барака Обаму, конкретного человека и события, которые относятся к нему.

Knowledge Graph — это база данных о всех вещах в мире и связей между ними. Вот почему вы можете вбить в поиск “когда родилась жена Обамы” и не получить ни одного результата, где бы не упоминалось её имя:

RankBrain

Как RankBrain помогает уточнять запросы?

Способ, с помощью которого Google уточняет поисковые запросы, можно сопоставить с тем, как человек в процессе размышлений выстраивает ассоциативные ряды и находит связь между ними. Да, у людей это происходит на автомате. Но, так или иначе, человек также прилагает определенные усилия.

Проблема в том, что в Google вбиваются миллиарды поисковых запросов в день. В 2007 году представители Google сказали, что 20-25% этих запросов не были замечены ранее. В 2013 году этот показатель упал до 15%. Но даже 15% от 3 млрд. это уже очень много —  450 миллионов в день.

RankBrain был создан для того, чтобы лучше интерпретировать такие запросы и правильно переводить их, с целью найти самые релевантные для пользователя.  

Как сказали представители Google, алгоритм может распознавать шаблон двух несвязанных между собой поисковых запросов и находить в них схожесть. Это,  в свою очередь, способствует лучшему пониманию сложных поисковых запросов и как они относятся к той или иной статье.  Самое важное — алгоритм сможет анализировать страницы и целевые группы и определять, какие поисковые результаты понравятся им больше всего.

Но Google не привел примеры целевых групп и не рассказал, как же RankBrain будет определять лучшие страницы.

Нужны примеры?

В качестве примера возьмем фразу:

Как называется потребитель, находящийся наверху пищевой цепочки?

Слово “потребитель” относится к человеку, который собирается покупать что-либо. Также известно, что это слово может быть связано с биологическим термином, обозначающим потребление пищи. Также существуют различные виды потребителей (консументов) в пищевой цепи. Так, кто же находится наверху? Хищники.  

И хотя запрос сформулирован немного странным образом, результаты очень хорошие:

RankBrain

А теперь посмотрим, насколько похожи или отличаются результаты по запросу “верх пищевой цепочки”:

RankBrain

Представим, что RankBrain связывает эти два запроса (длинный и короткий) вместе. В результате этого Google справился с ответом на вопрос по распространенным запросам, и немного усовершенствовал выдачу результатов по редким.

Мы не знаем, каким образом алгоритм RankBrain связывает эти два запроса. Можно лишь строить предположения на основе этого примера.

Еще пример?

Давайте узнаем: “Как много чайных ложек в чашке?” Google сказал, что RankBrain выдает разные результаты в Австралии и США по этому запросу, так как система измерения в этих странах отличается.

Мы попытались протестировать поиск в Google.com и в Google Australia. И не заметили особой разницы. Даже без алгоритма RankBrain результаты отличались из-за старой системы оценки страниц пользователями.

Действительно ли RankBrain помогает?

Несмотря на два примера сверху, которые немного изобличили работу алгоритма RankBrain, мы все равно надеемся, что он оказал большое влияние на систему ранжирования. Компания Google постоянно тестирует и обновляет свои алгоритмы. А значит, шансы на успех увеличиваются.

И даже то, что RankBrain занимает третье место по значимости в обработке поисковых запросов, уже очень даже неплохо.  

Когда RankBrain начнет действовать?

Представители Google сказали, что плановое внедрение алгоритма RankBrain началось в начале 2015 года, и сейчас он уже вовсю влияет на поиск.

На какие запросы он влияет?

В своей статье Блумберг ответил, что огромное количество запросов обрабатывается алгоритмом RankBrain. Но нам, конечно, хотелось бы узнать подробности.

Способен ли RankBrain к постоянному обучению?

Алгоритм RankBrain обучается всему в оффлайн режиме. Он изучает запросы из истории поиска и на основе этого строит свои прогнозы.

Эти прогнозы проверяются, и если соответствуют действительности, применяются в последней версии RankBrain. Затем цикл повторяется.

На что еще способен RankBrain?

Обычно, уточнение запроса (с помощью морфологии, синонимов или алгоритма RankBrain) не является сигналом или ранжирующим фактором.

Сигналы обычно тесно связаны с содержимым страницы, например, слова на странице, ссылки, ведущие на страницу и т.п. Также они могут быть связаны с пользователем. Например, местоположение пользователя и его история браузера.

Поэтому когда Google говорит, что RankBrain — третий по значимости сигнал, означает ли, что он именно сигнал к ранжированию? Да. Google подтвердил, что так или иначе RankBrain напрямую влияет на ранжирование страниц.

Но как именно? Есть ли какая-нибудь “мера измерения RankBrain” на проверку качества? Возможно, но нам кажется, что алгоритм RankBrain каким-то образом помогает Google лучше классифицировать страницы, основываясь на их контенте.

Или нет. Ведь Google не раскрывает всю информацию.

Где можно больше узнать о RankBrain?

Представители Google сказали, что люди, которые хотят узнать больше о “векторах” слов — то, как слова и фразы родственны с математической точки зрения — могут почитать их статью в блоге, в которой рассказывается, как новая система определяет соотношение стран со столицами, просто анализируя различные публикации:

RankBrain

Подробное исследование можно посмотреть здесь. Также вы можете побаловаться со своей собственной самообучающейся системой с помощью инструмента word2vec. Вдобавок ко всему, в Google есть целый раздел, посвященный исследованию искусственного интеллекта и самообучающимся машинам.  

Если у вас возникли дополнительные вопросы — пишите нам info@adviko.by

Читайте также:  Вышел WooCommerce 4.0

Или звоните:

+375 17 209 00 95

+375 17 254 73 89

+375 17 306 43 05

+375 29 619 05 79

Прочитайте и другие полезные статьи:

Один комментарий к “Ликбез: Все о новом алгоритме Google RankBrain

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *