Эволюция поисковых алгоритмов Яндекса
Алгоритм ранжирования сайтов в Яндексе постоянно меняется: добавляется новый функционал, устраняются баги, обновляются ограничения и фильтры, выдача подгоняется, чтобы соответствовать статусу качественной и релевантной запросу. Очень долгое время учёт алгоритмов ранжирования вёлся лишь внутри компании (скорей всего внутри одного отдела) и когда его резко обновляли, пользователи и вебмастера негодовали: “что это было?”.
С июля 2007 года сотрудники Яндекса начали анонсировать введение новых алгоритмов, но долгое время они оставались безымянными, а также нельзя было увидеть changelog (списка изменений). Оптимизаторам приходилось самим ставить эксперименты и тестировать выдачу, чтобы узнать, что именно поменял Яндекс в своём алгоритме. Это, конечно же, имело и свои плюсы, так как многие оптимизаторы-экспериментаторы получали доверие от других, выступая на конференциях и публикуя статьи на сайтах о наблюдениях в работе новых алгоритмов Яндекса, а seo-компании за счёт этих людей получали конкурентное преимущество.
Так продолжалось до начала 2008 года, когда Яндекс впервые упомянул название алгоритма 8 SP1 и пообещал после этого называть их именами городов. Пройдёмся по этим городам, чтобы немного вспомнить развитие алгоритма ранжирования…
Магадан
В мае 2008 г. на свет появился алгоритм под названием “Магадан”, в котором:
– вдвое увеличено количество факторов ранжирования;
– добавлены классификаторы контента и ссылок;
– улучшен геоклассификатор;
– улучшена скорость поиска по запросам, по которым находится большое число документов;
– смягчена фильтрация отбора документов для ранжирования увеличением допустимого расстояния между словами запроса в документе;
– производится обработка аббревиатур, перевода и транслитерации;
В поиске, кроме слов из текста страницы, участвуют перевод и транслитерация частей URL. Благодаря этому поиск понимает, что “mail” — это “почта”, а “bmw” — это “бмв”,
– улучшена обработка многословных запросов;
– осуществляется поиск текстов с дореволюционной орфографией;
Скажем, по запросу [кафедра Ветхого завета] найдется “каѳедра Ветхаго Завѣта”, и наоборот. Если необходимо найти только слова со старой орфографией, можно ограничить поиск точной формой, взяв слова в кавычки: [“Бѣлый, блѣдный, бѣдный бѣсъ”]. При этом поиск старается отличить такие слова от украинских. Например, по запросу [мiнiстр] найдется только украинское слово “мiнiстр” и не найдется русское “министр”. В то же время, когда нужны старые русские слова с “i”, например, по запросу [мiр], находится и русское слово “мир”.
– усовершенствован колдунщик;
Яндекс старается дать ответ на запрос, сократив время и усилия пользователей. Спрашиваете “погода”? Отвечаем: “Москва, +12 °C, дождь”, если вы живете не в Москве, погода будет показана для вашего города. Спрашиваете “Елена Колмановская”? Отвечаем: “Елена Колмановская — Яндекс, главный редактор”. И ссылка на пресс-портрет, составленный по материалам СМИ. Мы называем такие подсказки “колдунщиками”, потому что от них иногда создается впечатление, что поисковая система понимает всё, что вы хотели, и даже больше. 🙂
В июле 2008 появляется вторая версия Магадана, в которой добавлены ещё несколько факторов ранжирования (например, учитывающие уникальность контента, его принадлежность к порнографическому и др.) и пофикшены некоторы баги первой версии.
Находка
В сентябре 2008 г. Яндекс запускает “Находку”, где:
– выросло качество ранжирования по запросам со стоп-словами;
– разработан новый подход к машинному обучению;
– заметно расширены словари Яндекса;
Например, в нем появились сочетания слов, которые в раздельном написании означают то же самое, что и в “склеенном” виде (теперь по запросу [авто ваз] найдутся страницы и со словом “автоваз”).
Оптимизаторы замечают, что старые домены работают лучше новых, поэтому, возрастает спрос на старые домены. Также в этот период Яндекс строго относится к сайтам, которые меняют содержимое родительского окна, осуществляя редирект на посторонние ресурсы.
Арзамас (Анадырь)
В апреле 2009 г. Яндексом выложен следующий алгоритм под названием “Арзамас”, в котором:
– Яндекс научился лучше понимать русский язык, разрешая неоднозначности слов в запросах;
Если вы спросили [реконструкция Маяковской], мы покажем также страницу со словами [станция Маяковская открылась после реконструкции]. Но русский язык — тонкий, сложный и неоднозначный. Тем, кто ищет [фото львов], могут быть нужны как фотографии животных, так и фотографии города Львова. Человек может уточнить свое высказывание, добавив к нему одно или несколько слов: [фото африканских львов] или [фото город львов]. Теперь эти уточнения наш поиск научился понимать.
– учитывается регион пользователя, результаты поиска по одному и тому же запросу в разных регионах стали разными, всего выделено 19 крупных регионов;
– сайтам присваивается регион, который зависит от ip-адреса хостинга, контактных данных на странице или настроек в Яндекс.Каталоге;
– запросы поделились на геозависимые и геонезависимые, вводятся региональные формулы ранжирования;
– в подсказке об опечатках учитывается настройка языка браузера при определении языка запроса (в сложных случаях);
– введены жесткие фильтры для страниц с попандер-баннерами, а также кликандер и бадиклик (clickunder и bodyclick);
– улучшена формула по многословным запросам;
Снежинск
Ноябрь 2009 г. ознаменован выходом в свет алгоритма под названием “Снежинск”, где:
– введены дополнительные параметры ранжирования (нескольких тысяч поисковых параметров для одного документа);
– внедрение дополнительных региональных факторов;
– запуск самообучающейся системы MatrixNet,
– замечено плохое влияние простыней,
– стал лучше поиск оригиналов (первоисточников) контента;
– появились фильтры АГС;
Конаково
Алгоритм “Конаково” появился в декабре 2009 г., как усовершенствование версии “Снежинск”. В нём было улучшено лишь локальное ранжирование. Теперь ранжирование сайтов различно не только в 19 крупных регионах, но и в 1250 городах по всей России. В этот период в Яндексе также появился новый язык запросов.
Обнинск
Алгоритм “Обнинск” вышел в свет в сентябре 2010 г., в нём:
– улучшено ранжирование по гео-независимым запросам (таких в потоке до 70 процентов) пользователей из России;
– объём формулы ранжирования составил 280 Мбайт;
– ограничено влияние искусственных ссылок на ранжирование;
За последний месяц был произведен ряд изменений в поисковом алгоритме, чтобы существенно ограничить влияние SEO-ссылок на ранжирование. В первую очередь это относится к SEO-ссылкам с сайтов, содержащих некачественный контент, и к недавно появившимся SEO-ссылкам.
– расширился словарь транслитерации и улучшен ответ на запросы, заданные латиницей;
– улучшено определение авторства текста;
В этот же период обновился интерфейс просмотра сохраненных копий страниц, в частности, теперь можно видеть дату кэша документа.
Краснодар
Последняя смена алгоритма произошла в декабре 2010 г.. Для нового алгоритма Яндекса под названием Краснодар разработана специальная технология Спектр.
– Яндекс классифицирует запросы, выделяя из них объекты (имена, модели авто и др) и присваивая запросам категорию (товары, лекарства, поэты и др.);
– дополнительные слова из спектра запроса также вносят вклад в ранжирование;
– для улучшения качества выдачи учитываются некоторые поведенческие факторы;
– обновлено ранжирование по геозависимым запросам;
Также за этот период Яндекс проиндексировал соц.сеть вконтакте и ввёл расширенные сниппеты для многих типов организаций.
Яндекс на этом не останавливается, а работает и поныне, совершенствуя свои алгоритмы и улучшая качество выдачи.



43 ответа (оставить свой)
И с каждым новым алгоритмом делает жизнь оптимизаторов все интереснее и интереснее. 😉
Разрозненно раньше встречал упоминания об этих алгоритмах.
Спасибо, что навели порядок и отметили особенности произошедших изменений.
Отличная статья!очень точно резюмировано. Жаль что это не дает понимание принципов ранжирования:)
Спасибо за систематизацию знаний. Всё в моей башке теперь упорядочилось.)))
Хотелось бы вернуться в Магадан 🙂
Очень полезная статья, как начинающий узнал много интересного
Так вот что за Краснодар и Снежинск.
Сколько слов на серче про эти “интернет героические города”
теперь они вошли в историю, как
и Орловско Курская дуга 🙂
иненно тут танковую машину черных SEO оптимизаторов
остановила красная армия Яндекса!
Ура, товарищи!
пожалуйста, дайте ссылку на формулу.
Как всегда великолепно описано, полезно – в закладки!
Как бы яндекс не старался, все равно гугл the best ))
Интересная история. Оригинальный этот Яндекс… Что уж тут скажешь…
Спасибо за время, потраченное на эту периодику. Весьма наглядно, помогло навести порядок в некоторых обрывках знаний.
Спасибо, отличный обзор всех алгоритмов в одном посте. В закладки!
Сергей, как всегда очень грамотная и детальная статья, спасибо большое за полезную информацию!
Полно описано, спасибо. теперь осталось спокойно все сложить воедино, и получиться список, длинный список алгоритмов яши.
Если бы яндекс еще научился первоисточник контента определять, было бы вообще чудесно. А то никак не доэволюционирует до этого.
Как новичек узнал старые моменты – прошлого Яндекса)) очень интересно и поучительно. Благодарю!
Хорошая работа! а когда планируют следующий апдейт??
После снежинска стало “жить” на много интересней
Ну да, особенно после АГС )
Как начинающему оптимизатору очень познавательно понимать хронологию событий. Благодарю за статью.
Вылазить в топы становится все сложнее и сложнее)
Сохранил, а то часто задают вопросы про алгоритмы, а сводного источника не было.
Недавно пытался при помощи ЖЖ блогов продвинуть ключевик один. Вначале подготовил несколько SEO текстов в своём блоге, а потом уже провёл эксперимент с ЖЖ блогами. Правда, ключевик не очень «сильный», но зато за неделю преодолел больше 20 строчек в Яндексе, а в Гугле за несколько дней стал первым. Единственная жалось – тИЦ таким образом не повысишь :(. Сам эксперимент, если что, с таблицами у меня на сайте.
довольно таки классно написана статья, я поняла больше половины, и это уже хорошо
Также занижен вес ссылок с длинном в анкоре !
Алгоритмы хорошие, только почему-то огромное количество сайтов безо всякой причины вылетают из индекса. И не могут восстановиться по два месяца, поисковый робот просто не заходит и всё. В отчётах пишут, что сервер хостинга глючит не правильно выдаёт информацию. Что робот не может зайти на сайт. Показывают ошибки в сервисе Вебмастер, из которых видно, что адреса не правильные вместо – html – обрезано – htm
Яндекс в письмах признаёт свои ошибки, что это его вина, обещает восстановить, только вся это тянется слишком долго. Хотелось бы больше открытой и честной информации от Яндекса.
Смотрю на комментарии и удивляюсь, сколько же людей, которым не безразличны какие-то там “алгоритмы”… Пусть хоть оптимизатор, пусть хоть веб-мастер, пусть хоть простой пользователь – не понимаю, в чём интерес к этим “алгоритмам”?
Если человек планирует пойти работать в “яндекс” или разрабатывать свою поисковую систему, несомненно такие вещи нужно знать и читать про них всевозможную литературу, анализируя и делая выводы, что можно подкорректировать, какие недоработки есть у существующего поисковика и что изменить, чтобы пользователям “жилось комфортнее”… В иных случаях просто не вижу смысла забивать голову какими-то названиями и методиками “А как это работает?”, заведомо зная, что никаких секретных данных всё равно в интернет не выложено 🙂
Добрый день Сергей.
Не могли бы вы добавить в свою статью мою временную диаграмму из webpavilion.ru/статьи/алгоритмы-яндекса-с-2007-по-2010-год читателям будет полезно, а мне очень приятно.
в каком же году мы увидим алгоритм, наверняка определяющий первоисточник контента…
Юра, как вы это себе представляете с техническрй стороны? Есть какие-нибудь предложения?
Webpavilion, спасибо за ссылку. Информацию добавлю.
Купить у Японии роботов =)
Нормальные алгоритмы только у гугла!
Каждый новый вводимый алгоритм будет ухудшать жизнь оптимизаторов, а главное, будет более релевантная выдача без ГС сайтов в ТОП.
Спасибо за полезную информацию, Алексей.
Руслан, новые алгоритмы будут ухудшать жизнь не оптимизаторов, а афро-оптимизаторов 😉
Блог хороший. Автор хороший. Ждём когда выйдет новый алгоритм, который наконец дост вздохнуть хорошим авторам и сайтам.
И тиц надо убрать он не корректен по причине продажности и чёрного сео.
Какой сейчас алгоритм у Яндекса?
Периодическое изменение поисковых алгоритмов это бесспорно полезное решение Яндекса. Помню несколько лет назад просто бесили такие ошибки по типу “африканских львов”.
У Яндекса сейчас алгоритм “ПИЗДЕЦ”
Не особо разбираюсь в алгоритмах, но с последними изменения в выдаче Яндекс, сайт моего магазина потерял довольно много позиций. я долгое время сотрудничал с одной компанией по продвижению, которая снабжала нас оптимизированными текстами. Теперь же все пришлось убрать..не работает..вот сейчас заключили договор с одной питерской фирмой «Раскруткой» вроде ситуация стала меняться в лучшую сторону. Теперь говорят, нужно развивать сайт и делать его удобным для пользования, не знаю. Посмотрим, то будет завтра.
Дмитрий, естественно, сайт должен быть удобным! А тем более если у Вас магазин! Если над юзабилити постараетесь, то и процент отказов меньше будет, а это, как выясняется из описанных в статье алгоритмов – залог успеха в Яндексе!
P.S: Автору Спасибо за статью!
На мой взгляд сайты действительно должны быть удобными. Над процентом отказов необходимо работать круглосуточно, в этом и проявляется СДЛ-ность сайта. Хорошее юзабилити деньги считай в кормане. :))
Если внимательно изучить информацию о истории развития поисковых алгоритмов, то можно выявить для себя определенные правила ранжирования и продвижения. Например, благодаря алгоритму “снежинск” мы знаем, что ТИЦ не оказывает влияния на продвижение сайта.