На главную
 
Здесь вы можете проверить, свободен ли
интересующий вас домен, и сколько он стоит
 
Выберите необходимую вам зону
 
Главная CMS Joomla! Инструкция Joomla! Алгоритм PageRank: изнутри
Алгоритм PageRank: изнутри PDF Печать E-mail

8.1.        Создатели PageRank

Алгоритм PageRank, как мы уже знаем, используется для вычисления ранга веб-страницы. Помните, я говорил, что данный алгоритм — тайна за семью замками, и никто его не знает, кроме самих разработчиков Google? Это не совсем так. Полностью этот алгоритм, конечно, неизвестен никому, кроме разработчиков Google, но его общие принципы сформулированы. В этой главе мы поговорим об алгоритме PageRank как таковом, а именно как вычисляется ранг определенной страницы.

Первоначально алгоритм PageRank, используемый поисковой машиной Google, был сформулирован Сергеем Брином (Sergey Brin) и Лэрри Пэйд-жем (Larry Page) в их работе Анатомия большой гипертекстовой поисковой веб-машины (The Anatomy of a Large-Scale Hypertextual Web Search Engine).

Данный алгоритм основан на давно используемом в академическом мире методе: чем больше цитируется какая-нибудь исследовательская работа, тем она важнее. Брин и Пэйдж просто перенесли этот метод из научного мира в мир компьютерных технологий: важность веб-страницы определяется количеством ссылок, указывающих на эту страницу. Чем важнее страница, тем больше ссылок на нее указывает.

8.2.        Без математики — никак

Теперь немного математики. Ранг (PageRank) рассчитывается для каждой страницы по довольно простой формуле (рис. В.1):

PageRank{A) := (1-d) + d(PageRank(T1)+...+PageRank(Tn) )

                                                     C(T1)                          C(Tn)

Рис. B.I. Формула Page Rank-расчета

Формула довольно простая, коэффициент d — это коэффициент дампинга, обычно равен 0,85 (может быть в пределах 0— 1). Элемент С( Ti) — это количество исходящих ссылок страницы 77. Как видите, ранг веб-страницы вычисляется как сумма рангов всех страниц, которые указывают на нашу страницу (т.е. являются входящими ссылками), разделенная на число исходящих ссылок для каждой страницы.

Исходя из этой формулы, на ранг вашей страницы в поисковой машине Google могут существенно повлиять два фактора:

■             количество входящих ссылок;

■             количество исходящих ссылок.

Начнем с количества входящих ссылок. Очевидно, что чем их больше, тем лучше, во всяком случае, лишняя входящая ссылка никогда не повредит. В худшем случае входящая ссылка может не оказать никакого эффекта (одна ссылка уж точно никакого эффекта не окажет), но ее наличие никак не повлияет на PageRank — значение отрицательно!

С исходящими ссылками ситуация обратно пропорциональная. Посмотрим на формулу: количество ссылок находится в знаменателе, следовательно, чем меньше это количество, тем больше будет результат. Следовательно, чем меньше исходящих ссылок, тем лучше. Приведем небольшой пример. Допустим, на вашу страницу указывают две страницы одинакового с вашей рангом. У одной страницы 5 исходящих ссылок, а у второй — 10. Вы получите прирост PageRank только от страницы, имеющей 5 исходящих ссылок.

Казалось бы, что плохого в исходящих ссылках? Перейдем из мира виртуального в мир реальный. Представьте себе научную работу, состоящую в основном из ссылок на работы других авторов. Первый напрашивающийся вывод: а что, собственно, нового сделал этот автор, если он то и дело ссылается на других? Возможно, этот автор сделал очень важное научное открытие, которое не заметили остальные, написавшие все перечисленные в его работе научные труды. Но это станет известно только после прочтения работы. А теперь обратно в виртуальный мир: Google пока не может "прочитать" вашу страницу, чтобы проанализировать и оценить важность того, что вы там написали, поэтому считается: чем больше исходящих ссылок, тем меньше нового вы написали. Реальный пример: каталог ссылок. Что нового в нем? Ничего, одни ссылки на другие страницы, а реальной информации нет. Вот вам и логика.

В.З. Насколько же важен алгоритм PageRank

Неужели только этот алгоритм влияет на результаты поиска? Нет, PageRank — это всего лишь часть (бесспорно, очень важная часть) общего алгоритма ранжирования Google. Кроме PageRank на ранг вашей страницы влияет довольно много факторов. Google действует так: сначала она проверяет свой индекс и ищет страницы, соответствующие введенному запросу, потом вычисляет "уровень соответствия" каждой страницы введенному запросу, а затем умножает "уровень соответствия" на PageRank. Ясное дело, чем выше PageRank, тем больше вероятность, что ваша страница окажется в начале результатов поиска. Конечно, это упрощенная схема, но в общем все так и происходит.

Ваш ход рассуждений: если от входящих ссылок хуже не становится, а может стать только лучше, значит, нужно заполучить их побольше, несмотря на число исходящих ссылок. И тут начинаются посещения различных каталогов сайтов, обмены баннерами, ссылками или кнопками.

Рис. В.2. Калькулятор PageRank

He совсем так. Алгоритм PageRank очень хорошо сбалансирован. Это как закон сохранения энергии в физике: энергия ниоткуда не берется и никуда не пропадает — она переходит из одного вида в другой. Посмотрите на формулу вычисления PageRank. В ней в знаменателях стоят переменные C(Ti), которые содержат количества исходящих ссылок. Нормально, если на вашей странице есть исходящие ссылки, равно как и в научной работе есть ссылки на другие работы. Представляете: если у вас не будет исходящих ссылок, в знаменателе формулы вычисления PageRank другой страницы будет стоять 0. Нет, ошибки деления на ноль не произойдет, но тогда общее значение слагаемого будет равно 0. Ваш сайт с каким бы то ни было высоким PageRank не принесет никому пользы. А что будет, если на всех сайтах не будет исходящих ссылок? Ваш PageRank тоже будет равен 0. Хотя бы потому, что не будет входящих ссылок.

Если хотите рассчитать PageRank той или иной страницы, посетите Калькулятор PageRank (http: //pr.blogflux. com/index2.php) (рис. В.2).

Есть еще один неплохой калькулятор PageRank: http: //www.markhorrell.com/seo/pagerank.asp. Пользоваться калькулятором очень просто. Вы вводите число ссылок, для которых хотите вычислить PageRank, затем вводите эти ссылки (рис. В.З), задаете начальные значения алгоритма (например, начальное значение PageRank и коэффициент d) (рис. В.4) и получаете результат (рис. В.5).

Puc. В А. Вводим начальные значения

Рис. В.5. Результат

 

Новости

Статистика

Просмотры материалов : 1256697

Кто на сайте

Сейчас 214 гостей онлайн
 
 
Баннер
 
 
Партнер REG.RU Мы принимаем WebMoney, Здесь находится аттестат нашего WM идентификатора 110005872604 Мы принимаем QIWI Мы принимаем Яндекс.Деньги Мы принимаем Z-PAYMENT
Разработка сайтов компания “СВАРОГ”
© 2012 Host Solutions - Хостинг и регистрация доменов. Все права защищены.
Дизайн, Разработка сайтов компания “WEB-SVAROG”