Что такое PageRank
PageRank — это числовая величина, характеризующая «важность» веб-страницы. Чем больше ссылок на страницу, тем она становится «важнее». Кроме того, «вес» страницы А определяется весом ссылки, передаваемой страницей B. Таким образом, PageRank — это метод вычисления веса страницы путём подсчёта важности ссылок на неё.
Введение
Понятие Google PageRank является одним из ключевых моментов в работе поисковой машины Google. Наряду с другими параметрами, влияющими на выдачу (сортировку) сайтов в результатах поиска, знание модели PageRank необходимо как для понимания процесса поиска, так и для использования оптимизаторами при продвижении своих сайтов в поисковой системе.
Истории появления этого параметра будет посвящена другая статья. Здесь я, как автор, хочу лишь изложить математические основы вычисления PageRank, используемые повсеместно. Для начала, примем за аксиому, что при расчете Google PR, не будет учитываться “рассовая” принадлежность ссылок, их “языковая группа” или “внешний вид”, а будем полагать, что все страницы в сети Интернет равны (как мы с вами), и вес ее будет определяться лишь весом ссылающихся страниц-доноров.
Представьте себе, что вы Учитель (или свою профессию – сапожник, программист, оптимизатор, доктор с пиявками …), и что вам надо делать свою работу. Перед вами стоит задача: как найти тех людей, которым вы нужны, и которые будут рады воспользоваться вашими услугами?! Для этого можно либо сделать себе рекламу (баннеры, adsense, директ и др.), либо устроиться в какую-нибудь контору, которая будет поставлять вам клиентов (фриленсерские сайты, статьи, социальные закладки). Единственное, когда клиенты сами будут к вам приходить, это если другие скажут им о вас, посоветуют, расхвалят и т.д. Здесь вы не тратите средства на рекламу, и это самые эффективные клиенты, которым действительно нужна ваша помощь.
Говоря другими словами, мы подошли к понятию PageRank, который отражает вес вашей страницы по ссылкам (“слухам”) с других страниц. И понятно, что чем больше ссылающихся на вас страниц, тем больше у вас вес.
Определение PageRank
PageRank (далее просто PR) это числовая величина — мера “важности” страницы в поисковой системе Google. Зависит от числа внешних ссылок на данную страницу и от их веса (важности). Другими словами от количества и качества ссылающихся страниц. А если говорить математическим языком, то PR это алгоритм расчёта авторитетности страницы, используемый поисковой системой Google. PR не является основным, но является одним из вспомогательных факторов при ранжировании сайтов в результатах поиска.
Следует отметить, что при расчете PR Google учитывает не все ссылки, а отфильтровывает ссылки с сайтов, специально предназначенных для скопления ссылок. Некоторые ссылки могут не только не учитываться, но и отрицательно сказаться на ранжировании ссылающегося сайта (такой эффект назвается поисковой пессимизацией).
Классическая модель представления PageRank
Документ (на англ. языке), подробно описывающий модель PageRank, введеной Сергеем Брином и Ларри Пейджем, можно скачать по ссылке: The_PageRank_Citation_Ranking.pdf [299.73KB].
Основная формула, описывающая PR выглядит следующим образом.
![]()
где d — демпфирующий коэффициент, отражающий какую долю веса может передать страница-донор на страницу-акцептор. Обычно его принимают равным 0.85, что означает, что страница может передать 85% веса (распределяется между всеми акцепторами, на которые ссылается донор). В других источниках d является вероятностью, с которой пользователь перейдет на один из акцепторов, а не закроет браузер, что, в принципе, то же самое. Какое числовое значение у этого параметра в Google знают только там, остальные принимат его равным 0.85 (видимо из эксперементальных данных);
n — количество страниц, ссылающихся на страницу-акцептор (на которые не наложен фильтр);
Ti — i-ая ссылающаяся страница;
C — количество внешних ссылок на странице-доноре.
Тулбарное представление PageRank
Поскольку ссылающихся страниц может быть много, и общее количество страниц в поисковой системе Google достаточно велико (около десятка биллионов штук) а также их количество постоянно растет, то представлять вес страницы в абсолютных значениях для вебмастеров было бы весьма неправильно. Для этого ввели понятие TLPR — ToolBar PageRank, который имеет значение от 0 до 10 (зелененькая шкала в Google Toolbar).
Для того, чтобы уложить все веса страниц между значениями от 0 до 10 используют логарифмическую шкалу.
TLPR = Logbase(PR) * a
где base — основание логарифма, которое зависит от количества страниц в поисковой машине (возможно и от ряда других факторов). Некоторые принимают его равным 7;
a — некий коэффициент приведения, который удовлетворяет неравенству 0 < a ≤ 1. Оптимизаторам его можно принять равным единице для упрощения расчетов.
Из вышесказанного неверно делать выводы, что нулевой TLPR означает нулевой реальный PageRank. По первой формуле видно, что даже при n = 0, мы получим минимальный PRmin = (1-d) = 0.15. Это значение соответствует TLPR ≈ -1. При таких (отрицательных) значениях тулбарного PR считается что PR = N/A (или еще не определен), однако он также оказывает влияние на распределение веса между ссылками-акцепторами. Также следует заметить, что тулбарное значение предназначено только для отображения вебмастерам в Google Toolbar и никак не влияет на выдачу в серпе. На выдачу в серпе влияние оказывает реальный PR страницы!
Выводы
Исходя из принципов расчета Google PageRank, можно теперь легко расчитать, с каких ссылок нужно ссылаться и сколько нужно ссылок, чтобы получить тот или иной PR. Также можно прогнозировать PR. Один из важных выводов, который я для себя сделал заключается в следующем. Если мы имеем новый сайт со страницами более 10,000 (число страниц зависит от количества ссылок с них на другие страницы), они правильно перелинкованы и каждая ссылается на главную страницу, то главная страница получит хороший вес от этих ссылок. Вот немного математики по этому поводу.
PRmin = 0.15;
PR = 0.15 + 0.85 * 20000/10; (при учете в среднем 10 ссылок на странице)
TL*PR* = Log(1700.15, 7) = 3.823 ≈ 4
Вот вам и пример хорошего PR без единой внешней ссылки с других сайтов 🙂
Теперь понятно, почему у таких систем как Digg.com, Del.icio.us и других подобных весьма большой PageRank.
На вышеизложенной теории построен JavaScript калькулятор для расчета PR (правда без учета ссылок с PR0). Калькулятор можно разместить на своем сайте. Код прилагается.
Часто задаваемые вопросы
Как повысить PR моего сайта?
Существует множество способов повышения веса своих страниц, но главная идея — это качественные ссылки с других сайтов. Для этого можно использовать каталоги, социальные закладки, статьи, форумы, блоги и другие типы сайтов. Однако не следует глупо расставлять множество ссылок на других сайтах, так как помимо PageRank существует множество других ранков, влияющих на выдачу страницв в результатах поиска (например TrustRunk).
Бывает ли отрицательный PR?
Нет, не бывает. Реальный PR минимум равен 0.15, минимальный тулбарный PR равен нулю.
Нужно ли ставить ссылки на своем сайте и как это влияет на PR моей страницы?
Ссылки на своем сайте на другие сайты ставить необходимо, так как своими ссылками вы увеличиваете PR страниц-акцепторов и тем самым, по первой формуле, к вам возвращается еще больший вес из огромной системы ссылок.
Когда происходят апдейты PageRank?
Апдейты для тулбарного PR происходят раз в 2-4 месяца, для реального PR я уверен, что апдейты происходят чаще. В Google каталоге Dmoz можно посмотреть TLPR на текущий момент для вашего сайта, если он размещен в каталоге.
Влияет ли язык ссылки на PR?
Ни коим образом язык на передачу веса PR не влияет. Влияет только качество и количество ссылающихся на вас страниц.
Влияет ли посещаемость сайта на Google PageRank?
Нет, не влияет. На значение PageRank влияет только количество и качество ссылающихся ресурсов.
Перетекает ли PR с картинок?
С картинок PageRank “перетекает”, только если они являются ссылками, по которым пользователь может перейти на другой ресурс.



50 ответа (оставить свой)
спасибо за калькулятор, очень полезная штука
Проверял калькулятор, подставляя данные из таблиц по подсчету ПР, так по калькулятору и таблице разные значения. В основном на 2 пункта расходятся…
Калькулятор и таблицы сделаны разными людьми 🙂
А если математически подходить, то там просто коэффициенты для логарифма чуть отличаются.
“Бывает ли отрицательный PR?
Нет, не бывает. Реальный PR минимум равен 0.15, минимальный тулбарный PR равен нулю.”
Откуда такая уверенность? Как можно проверить этот тезис? Ибо в этом же блоге написано, что:
“де d — демпфирующий коэффициент, отражающий какую долю веса может передать страница-донор на страницу-акцептор. Обычно его принимают равным 0.85, что означает, что страница может передать 85% веса (распределяется между всеми акцепторами, на которые ссылается донор). В других источниках d является вероятностью, с которой пользователь перейдет на один из акцепторов, а не закроет браузер, что, в принципе, то же самое. Какое числовое значение у этого параметра в Google знают только там, остальные принимат его равным 0.85 (видимо из эксперементальных данных);”
Если бы я был директором гугла, то я бы сделал d ступенчатой функцией, которая бы при отстутствии внешних ссылок на страницу принимала бы значение 1. Ну или почти один 😉
Хотя нет, если бы я был директором Гугола, я бы купил яхту, затарил много жратвы и пива, всех друзей существенных бы собрал и поехал в кругосветку))))
Но вот если бы я отвечал за ранжирование….)))) Почти 1 – это чтобы не искать тот самый первый сайт с ненулевым ПР.))) Хотя как я щас по-быстрому могу прикинуть, совсем 1 тоже подходит – функция же ступенчатая))
Урал, во-первых, это теория, которая работает с самого начала основания Google. Во-вторых, если бы вы отвечали за ранжирование в Гугли, тогда вы бы понимали, что факторов ранжирования более 250, и PageRank не является среди них весомым. Поэтому, все, что вы придумали со ступенчатым d это конечно хорошо, однако, изначально, модель PageRank отражает серфинг пользователей в сети Интернет от узла к узлу, ничего более.
А никто и не говорил, что PR главный фактор. Как я понимаю, для нас с вами это одиин из немногих параметров обратной связи черного ящика типа Гугол.
Формула, безусловно, интересная. Возможно, как нибудь попробую. Воспользоваться этим знанием. ))
В формуле расчета PR во втором слагаемом множитель 0,15 не пропущен? Тот, что PR каждой внутренней страницы определяет.
Здравствуйте спасибо за информацию была очень полезна.
Но у меня остался один вопрос: Отдает ли страница часть своего PR внешней ссылке. Или PR остается и не тратися?
Насчёт минимального pr- некоторые проги показывали не 0.15, а даже 0.1
Вот прошу подтвердить или отвергнуть мое понимание “трастовости ссылок” и всего прочего: если у меня сайт о музыке, то я могу сколько угодно много ставить ссылки на этот сайт ТОЛЬКО в сайтах (блогах, форумах, каталогах) по тематике “музыка” – и PR и все остальное будет только расти?! Или все же соблюдение тематичности – не единственный критерий??!
То что некоторые проги показывают, это одно, минимальный пр несущественен и вам от этого толку явно не будет, так что лучшу думать куда глубже
Насчет ПР без внешних ссылок Вы совершенно правы. Я был очень удивлен когда у одного из проектов который только создал и добавили гуглу в аддурилу при апе ПР стал 3, а ведь я вообще не размещал ни где внешних ссылок 🙂
digi: +1! Внутренними ссылками набил PR2 для морды.
Посмотрел я на эту формулу. (первую не тулбарный ПР) И вот что подумал:
Представим сайт без внешних ссылок(новый) Из 10 страниц. Морда и 9 страниц, с каждой страницы ссылка на морду, с морды ссылка на все. Как собственно расчет будет идти? Ведь это бесконечный цикл получается. Допустим расчет выполняется 1 раз, а при первом расчете нерасчитанные, еще PR принимаются минимальными(0,15). Но даже так, при каждом пересчете по формуле PR будет расти как у морды так и у остальных страниц. Например первый расчет PR(морды)= 1,3 PR(страниц)=0,26, при втором уже PR(морды)= 2,14 PR(страниц)=0,33. Парадокс 🙂
Юрий, формула расчета ПР – функция, которая с каждым кругом расчета теряет 0,15 передаваемого веса и стремится (в бесконечности) к определенному предельному значению.
Вычислять бесконечно не нужно т. к. поправки с каждым разом становятся менее существенными. Достаточно нескольких циклов, чтобы оценить результат 🙂
Прошу прощения, я хотел поставить ваш калькулятор на свой сайт, скопировал код, только цвета поменял и “оп!” – калькулятор не работает. Скопировал код заново и поставил его в оригинальном виде – то же самое, при клике на “Вычислить” ничего не происходит 🙁
Помогите пожалуйста. Вот страница – http://teemk.com/2010/01/im-back/
Teem-k, у вас в коде вместо некоторых знаков стоит html сущности. Например, вместо знака “больше” (>) стоит < и т.д. Попробуйте скопировать код, потом разместить его где-нибудь в блокноте и проверить. Мне кажется вы вставляете сразу в форму (в браузере) из буфера, а браузер эти символы преобразует. Либо же вручную в коде замените сущности типа > на соответствующие символы.
Спасибо за быстрый ответ.
Вставляю в html-режиме, проверяю – этих символов нет, но в записи они появляются.
Сначала я подумал, что в этом виноват плагин Типограф ( http://iskariot.ru/wordpress/typo/#typo-light ), отключил его – но < остался, тогда залез в /wp-admin/options-writing.php и убрал галочку с “WordPress должен исправлять некорректный XHTML-код автоматически.” – <, > и прочие ИСЧЕЗЛИ из вывода. Я подумал “Ура!” но не тут то было – калькулятор всё так же не работает :-((
Отключил почти все плагины, на странице настроек даже выключил “Преобразовывать смайлики наподобие 🙂 и 😛 в картинки” – всё равно не работает.
Причём сохраняю – смотрю код страницы:
(‘S’)&&4.5
Проверяю в редакторе WP:
(‘S’)&&4.5 – то есть там всё нормально, но при выводе WP почему то заменяет некоторые символы.
Не подскажете в чём может быть причина? Буду очень благодарен!
Teem-k, вынесите скрипт в отдельный файл calc.js и вместо кода вставьте тег script с указанием внешнего скрипта.
Вынес, но блин всё равно не работает 🙂
http://teemk.com/tools/pr_calc.js – вот проверьте пожалуйста, всё ли правильно? На странице вроде бы скрипт подгружается нормально
Наконец-то прочёл нормальную статью про PR. Хорошо бы ещё кто-то систематизировал информацию о переходе PR при разного рода редиректах. Я вот по глупости потерял PR на главной из-за не правильно поставленного редиректа.
+стотыщпицот !!!!! Наконец-то начал потихоньку разбираться что к чему 🙂 Спасибо огромное !!!!
Спасибо! Очень познавательно!
Ураган!
Реальная статья, грамотный подход. И описанный в этой статье калькулятор очень полезным оказался!
А как Вы думаете, если PR – это как вИЦ, то стоит ли в Sape ставить в фильтр условие покупки ссылки со страниц, имеющих PR. Или для тИЦ это не важно?
отличная статья
Девака, очень понравилось Ваша статья. Спасибо. Вы даете ответы именно на те вопросы, которые могут возникнуть. Мне было полезно узнать, что “Ссылки на своем сайте на другие сайты ставить необходимо, так как своими ссылками вы увеличиваете PR страниц-акцепторов и тем самым, по первой формуле, к вам возвращается еще больший вес из огромной системы ссылок”.
Спасибо. Прочитал с интересом. Блог в избранное занес=)
Спасибо автору за формулу)
Давно ее искал
Спасибо. Прочитал с интересом. Блог в избранное занес
“Ссылки на своем сайте на другие сайты ставить необходимо, так как своими ссылками вы увеличиваете PR страниц-акцепторов и тем самым, по первой формуле, к вам возвращается еще больший вес из огромной системы ссылок.”
Не понятный для меня вывод о возвращении веса, ведь чем больше ссылок на внешние сайты, тем больше значение знаменателя C(Tn). А чем больше значение знаменателя, тем меньше получается значение слагаемого в скобках и как следствие – тем меньше значение PR(A)
Как по этой формуле возвращается вес странице-донору?
Вот и открыта загадка века) Все же калькулятор нужная вещ поствил себе на сайт
По PR и Садовкого читал и не раз объяснения про него на конференциях слушал, но до сих пор остаются вопросы. Хотя я думаю главный и основной принцип я уловил, а остальное детали так сказать не так уж и важны.
Эт все хорошо конечно, но вот разгадайте загадку – сайту www.semioweb.ru отроду 2 недели, а PR уже 4 !!! =)
Выходит, что для ПР 1-2 нужна всего одна ссылка с ПР 5?
А кто обнародовал все эти формулы!? Интересно сильно ли ПР влияет на монетизацию.
вообще то PR практичнее Тиц…
Ну у меня Блог на blogger без pr находится в топ 10 гугла по 5 запросам связанным с заработком в интернете.
А в яндекс страницы вообще почти не индексируются
Очень позновательная статья про PR, благодаря ей абсолютно полностью понял что такое page rank и ещё особое внимание уделил формуле PR, приколно всё объясняете, Сергей.
Всё понятно и доступно описано! Теперь PR моего сайта уже = 3!
Влияет ли ПР и Тиц сайта, с которого есть внешняя ссылка, на рейтинг сайта, на который ссылаются? Есть ли закономерность, что чем больше ПР и Тиц ссылающегося, тем больше поднимется ранг сайта, на который ссылаются? Спасибо.
Неужели это и вправду Брин придумал? что-то меня терзают смутные сомненья
PR более перспективен, чем тот же ТИЦ Яндекса. Редкое изменение показателя придает ему еще бОльшую ценность)
Хорошая Статья,я до этого на ПР вообще не обращал внимания,смотрел только на тиц )
А что, page rank уже обновляться не будет никогда? тИЦ где-то 3 месяца назад обновился, а PR – уж более полугода наверное 🙁
Подскажите пожалуйста, как вывести иконку со значением PageRank, как например у Яндекса индекс цитирования ТИЦ?
А вообще, Яндекс при учете своего тиц все больше ориентируется на методы Google. И тиц сейчас “отбирается” пачками у многих сайтов. Хотя до полного очищения индекса яндекса от некачественных сайтов пока далековато. Тем не менее, выдача все-таки улучшилась
По отношению к PR я заметил такую особенность:
Каждая новая страница на сайте без ссылок на предыдущие берет на себя часть PR и занижает его у других страниц на сайте. Позиции предыдущих страниц в поиске падают. Чтобы поднять PR много страниц не нужно создавать с информацией.
Я ссылки с каталогов (после прогона) дают мало результата для поднятия PR, потому что во-первых они находятся на страницах, где PR 0. А даже если ссылки размещаются, то из-за большого количества ссылок на все сайты в каталоге вес одной ссылки очень занижен и не дает никакого результата. Поэтому безплатные методы для поднятия PR тут не срабатывают.