PageRank

 - Dieser Post hat es sich zur Aufgabe gemacht, mit einigen weit verbreiteten Meinungen zum PageRank aufzuräumen.

Zwischenzeitlich habe ich eine größere Anzahl von Berechnungen zum PageRank durchgeführt, von denen ich den bedeutsamsten Teil veröffentlichen werde.

PageRank-Updates sind nicht komplex


Von Anfang an war es mein Ziel, einen Beweis dafür zu finden, dass das TBPR-Update (PageRank-Update) keinesfalls so komplex abläuft und nachzuvollziehen ist, wie es von allen mir bekannten Seiten vorgegeben wird. Wenn man sich die ersten zwanzig Suchergebnisse in Google bei einigen Keywordkombinationen zum Thema PageRank-Berechnung, PageRank-Algorithmus, etc., anschaut, verdichtet sich der Eindruck, dass bestimmte Erkenntnisse immer wieder übernommen wurden, ohne dass man eine Detailprüfung vornahm.

Google Toolbar PageRank-Anzeige arbeitet nicht mit logarithmischer Skala


Meiner Meinung nach arbeitet die Google Toolbar PageRank-Anzeige nicht mit einer logarithmischen Skala, wie nahezu überall vermutet wird. Es gäbe demnach keinen PageRank von 40, 5000 oder gar 1.000.000, der durch die Google Toolbar in einen PR0 - PR10 zurückgewandelt würde. Der PageRank aller Seiten kann direkt nach der veröffentlichten PageRank-Formel mit entsprechenden Iterationen berechnet werden.

Wir arbeiten nun weiter mit dem besten Ergebnis bisher. Dem PageRank-Ergebnis aus Berechnung 01 zum Blogpost PageRank 5:

PageRank - 4 Seiten verlinken untereinander - PageRank-Ergebnis

PR-Update - Einrechnung des PageRank von Backlinks


Auf einer Seite sah ich eine PageRank-Berechnung, auf die ich kurz eingehen möchte. Diese Berechnung nahm bereits zu Beginn den PageRank eines von extern eingehenden Links in die Iterationen mit hinein. Schauen wir uns das an einem Beispiel an:

Einbeziehung PageRank-Backlink ab der ersten Iteration ist falsch

PDF: Google PageRank-Algorithmus - Warum man zu Beginn der Iterationen den PageRank eines Backlinks/von Backlinks nicht mit einrechnen kann - PageRank-Berechnung 01
(Berechnung 01 zum Blogpost PageRank 7)

Die externe Seite X mit PR3 und vier ausgehenden Links verlinkt auf Seite A. Wäre diese PageRank-Berechnung richtig, würde Seite A einen PR4 erhalten. Dieses ist nicht möglich, da in diesem Beispiel ein eingehender PR3-Link die Seite nicht zu einem PR4 aufwerten kann. Zudem ergibt sich ein Durchschnitt (Average) von 2,0625 "aller Seiten des Webs" am Ende der Iterationen. Da dieser immer nahezu 1 beträgt, ist diese Berechnung eindeutig falsch.

Fakten, die bei der PageRank-Berechnung eine Rolle spielen


Überlegen wir einmal gemeinsam, welche logischen Fakten eine Rolle spielen:
  • Zu Beginn des PR-Updates ist der PageRank aller Seiten des Webs unbekannt.


  • Demnach ist auch der PageRank der eingehenden Links unbekannt.


  • Die PageRank-Berechnung aller Seiten des Webs erfolgt zur gleichen Zeit.


  • Die Berechnung aller Seiten einer Domain erfolgt unabhängig von allen anderen Domains, somit muss Google doch zwischen Verlinkungen innerhalb und außerhalb einer Domain unterscheiden.


  • Erst nachdem die internen Verlinkungen/interne Linkstruktur berechnet wurde, ist der PageRank einer Domain bekannt. Somit auch der PageRank anderer Domains und Unterseiten, die auf diese Domain bzw. Unterseiten verlinken.

Fazit


Alle Iterationen erfolgen für alle Seiten des Webs. Dazu werden zunächst alle Seiten auf 0 gesetzt und jede Domain ohne externen Linkeinfluss berechnet. Erst nachdem der interne PageRank berechnet wurde, werden dem PageRank-Ergebnis die externen Backlinks in einer letzten Iteration hinzugerechnet.

Einen Beweis dafür stellt die Google Toolbar dar. Die PR-Anzeige in der Google Toolbar müsste während des PR-Updates auf 0 gehen und sich kontinuierlich verändern. Es ist jedoch so, dass erst am Ende des PR-Updates die PR-Anzeige in der Toolbar hin und her springt, da die endgültigen PR-Ergebnisse nicht in allen Data Centern zeitgleich vorliegen. Eine Domain mit PR3, die darauf PR4 erhält, springt am Ende (in der Regel mehrfach) zwischen PR3 und PR4 hin und her, bis alle Google Data Center die PR-Berechnungen abgeschlossen haben und sie PR4 erhält.

Basis für den Erfolg einer Website ist die interne Verlinkung. Erst danach, am Ende des PR-Updates, kann diese durch Einrechnung von Backlinks verbessert werden. Ist die interne Verlinkung nicht optimal, fließt der Saft (Linkjuice) nicht korrekt durch die Seiten und stärkt oder schwächt ggf. die falschen Seiten.

Ein Backlink mit hohem PageRank steigert den Erfolg der Website


Diese Aussage ist zwischenzeitlich mit größter Vorsicht zu genießen und nur bedingt richtig. Wenn wir einen Backlink von einer Seite erwerben würden, wird ein Preis erzielt, der vom aktuellen PageRank abgeleitet wird. In der Regel kennen wir die Geschichte der Website nicht, von der wir den Backlink erhalten und haben auch keinen Überblick darüber, welche Inhalte die Website insgesamt bietet, die ggf. zur Abstrafung durch einen "Google Quality Rater" oder den Google TrustRank-Algorithmus führen können. Natürlich wissen wir somit nicht, ob dieser Backlink nach dem PageRank-Update noch diesen PageRank haben wird, dennoch zahlen wir für einen bestimmten PR-Wert, selbst wenn er nach dem PageRank-Update (deutlich) niedriger ausfallen würde.

PR-Update - Einrechnung des PageRank von Backlinks in der Praxis


Im nun folgenden Berechnungsbeispiel setzen wir einen PageRank 3-Link auf unsere Seite A. Wir müssen für unsere Berechnung davon ausgehen, dass dieser auch nach dem PageRank-Update einen PR3 haben wird. Wir geben der PR3-Seite 4 ausgehende Links vor.

PageRank - PR3-Backlink auf Seite A

Nach 33 Iterationen erhalten wir das Ergebnis der internen Verlinkungen unserer Seite. Erst jetzt wird der PR3-Backlink in der 34. Iteration hinzugerechnet. Der Linkjuice durchfließt unsere interne Linkstruktur.

PageRank - PR3-Backlink auf Seite A - Ergebnis

Im Ergebnis erhält Seite A einen PR3 (2,5564), Seite B, C und D einen PR1 (0,8743).

PDF: Google PageRank-Algorithmus - Verlinkung zwischen vier Seiten - A-BCD, B-A, C-A, D-A - Einfluß von eingehenden Links - Backlink auf Seite A - PageRank-Berechnung 02
(Berechnung 02 zum Blogpost PageRank 7)

Die Anzahl der Backlinks ist wichtig?


Überall ist zu lesen, dass die Anzahl der Backlinks wichtig wäre. Diese Meinung halte ich für den größten Hype in der Geschichte des PageRanks. Es gibt Auswertungen darüber, bei denen die Anzahl der Backlinks bei zehntausenden von Websites untersucht wurde. Hierdurch kam man zu dem vermeintlichen Ergebnis, welche Anzahl von Backlinks jeweils für den entsprechenden PageRank notwendig wären. Vom PageRank-Algorithmus selbst kann diese Aussage keinesfalls abgeleitet werden.

Was wäre, wenn diese Aussage vom Grundsatz her falsch ist? Der gesamte Linkhandel hätte nicht so dermaßen erfolgreich ablaufen können.

Über Reverse Engineering herausfinden zu wollen, ob die Anzahl der Backlinks einen Einfluss auf den PageRank hat, führt nicht zu einem verwertbaren Ergebnis. Eine Website, die qualitativ hochwertigen Content bietet, erhält im Laufe der Zeit viele Backlinks mit nahezu allen Werten von PageRank. Der Inhaber der Website hat keine Kontrolle über die Qualität der natürlichen Backlinks. Würde diese Website nur 10 Backlinks mit hohem PageRank erhalten, könnte sie den gleichen PageRank erzielen, wie mit 1.000 Backlinks mit PR-. Somit könnte man die Anzahl der Backlinks grundsätzlich als irrelevant betrachten.

Im oben aufgeführten Berechnungsbeispiel sieht man, dass bei entsprechender Linkstruktur bereits mit einem einzigen PR3-Backlink ein PR3 für seine Website erreicht werden kann. Es geht noch weiter. Bei einem einzigen Link von einer PR10-Seite, die theoretisch nur 2 ausgehende Links hätte, erreicht die Domain einen PR6 und die Seiten BCD einen PR2.

Um einen PR6 - PR10 zu erhalten, benötigt man eine größere Anzahl von qualitativ hochwertigen Links oder eine unendlich große Anzahl von durchschnittlichen Links, demnach Links mit unkontrollierbarem PR-Wert.

Die Masse beschäftigt sich mit der unkontrollierten, kontinuierlichen Setzung von Backlinks, dessen PageRank egal zu sein scheint. Es ist ja einfacher als sich auf wenige hochwertige Backlinks zu konzentrieren. Aufgrund dessen spricht der Volksmund wohl von "die Anzahl ist entscheidend".

Welche Auswirkungen ein Backlink auf die Gewichtung einer Seite wirklich hat, hängt neben dem PageRank der ausgehenden Seite und der Anzahl der von dort ausgehenden Links zwischenzeitlich auch vom Trust ab, den diese Seite bei Google genießt.

Letztendlich ist es jedoch durchaus möglich, dass Google einen Schutzmechanismus integriert hat, der unabhängig vom PageRank-Algorithmus eine Mindestanzahl von Links für einen bestimmten PageRank voraussetzt.

Auswirkungen von Backlinks auf die Gewichtung der Unterseiten


Wie aber verhalten sich nun die einzelnen Seiten einer Website bei von extern eingehenden Links? Wie verändert sich die Gewichtung der Seiten bei kontrolliert eingehenden Links?

Wir setzen nun einen PR3-Link (mit 4 ausgehenden Links) auf Seite B:

PageRank - PR3-Backlink auf Seite B - Anfängliche Berechnung und Ergebnis

Ergebnis:
Seite A PR2 (1,9189)
Seite B PR1 (1,3312)
Seite C PR1 (0,6937)
Seite D PR1 (0,6937)

Vergleichen wir dieses mit dem Ergebnis der vorhergehenden Berechnung, haben wir somit Seite B als wichtigste Unterseite hervorgehoben:

Seite A PR3 (2,5564)
Seite B PR1 (0,8743)
Seite C PR1 (0,8743)
Seite D PR1 (0,8743)

PDF: Google PageRank-Algorithmus - Verlinkung zwischen vier Seiten - A-BCD, B-A, C-A, D-A - Einfluß von eingehenden Links - Backlink auf Seite B - PageRank-Berechnung 03
(Berechnung 03 zum Blogpost PageRank 7)

Folgerichtig ergibt sich für die Seiten C und D:

PR3-Link auf C:

PageRank - PR3-Backlink auf Seite C - Ergebnis

Ergebnis
Seite A PR2 (1,9189)
Seite B PR1 (0,6937)
Seite C PR1 (1,3312)
Seite D PR1 (0,6937)

PR3-Link auf D:

PageRank - PR3-Backlink auf Seite D - Ergebnis

Ergebnis
Seite A PR2 (1,9189)
Seite B PR1 (0,6937)
Seite C PR1 (0,6937)
Seite D PR1 (1,3312)

Setzen wir nun jeweils einen PR3-Backlink (mit je 4 ausgehenden Links) auf jede unserer vier Seiten:

PageRank - PR3-Backlink auf Seite ABCD - Ergebnis

Ergebnis (!)
Seite A PR3 (2,5564)
Seite B PR2 (1,5118)
Seite C PR2 (1,5118)
Seite D PR2 (1,5118)

Wenn Theorie sich so einfach in Praxis umsetzen lassen würde, gäbe es wahrscheinlich nur noch Seiten mit hohem PageRank. In der Praxis scheitert diese Theorie daran, dass es eher selten Seiten mit hohem PR und geringster Anzahl ausgehender Links gibt. Verwirklichen wir die Theorie in der Praxis, müssen wir in der Regel von mindestens 25 ausgehenden Links der auf uns verlinkenden Seiten ausgehen:

PageRank - PR3-Backlink mit 25 Outgoing Links auf Seite ABCD - Ergebnis

Ergebnis
Seite A PR2 (2,0209)
Seite B PR1 (0,8246)
Seite C PR1 (0,8246)
Seite D PR1 (0,8246)

(Vergleiche es mit dem vorherigen.)

Wenn wir uns nur auf den PageRank-Algorithmus konzentrieren und weitere Faktoren unberücksichtigt lassen, müssten wir doch den Saft (Linkjuice) durch nur eine Öffnung fließen lassen können, oder? Wozu der Aufwand, jede Unterseite mit Backlinks zu versorgen?

Setzen wir einmal alle vier PR3-Backlinks (mit je 4 ausgehenden Links) auf unsere Seite A:

PageRank - 4 PR3-Backlinks auf Seite A - Ergebnis

Ergebnis (!)
Seite A PR4 (4,4689)
Seite B PR1 (1,4162)
Seite C PR1 (1,4162)
Seite D PR1 (1,4162)

Interessant, ein oder zwei hochwertige Backlinks mehr und schon haben wir PR5 mit 3x PR2... (Vergleiche mit dem Ergebnis je 1 PR3-Backlink auf je 1 Seite oben...)

PDF: Google PageRank-Algorithmus - Verlinkung zwischen vier Seiten - A-BCD, B-A, C-A, D-A - Einfluß von eingehenden Links - Backlink auf Seite A oder B oder C oder D - Je 1 Backlink je Seite - 4 Backlinks auf Seite A - Übersicht - PageRank-Berechnung 04
(Berechnung 04 zum Blogpost PageRank 7)

Die verbreitete Theorie, dass eine hohe Anzahl von Backlinks notwendig wäre, ist falsch. Nur wenige gute Backlinks sind notwendig.

Warum funktioniert unser letztes Beispiel eher weniger in der Praxis?


  • Websites bestehen nahezu immer aus deutlich mehr als 4 Seiten, somit wären deutlich mehr hochwertige Backlinks notwendig

  • wir verschaffen uns oft keinen vollständigen Überblick mehr über alle Seiten unseres Internetauftritts, somit können wir auch nicht mehr die Anzahl und Qualität der ausgehenden Links von diversen Unterseiten kontrollieren

  • wir müssen in der Regel mit Veränderungen des PageRank von auf uns verlinkende Seiten rechnen

  • es gibt zwischenzeitlich zahlreiche weitere Faktoren für den PageRank, die eine Rolle spielen
Somit kann man das Ziel der höchsten Form von Optimierung der Linkstruktur kombiniert mit hoher Gewichtung der Domain gar nicht erreichen? Die Antwort auf diese Frage ist einfach: Doch, man kann. - Die Umsetzung ist allerdings etwas aufwendiger.

Wir erkennen nun, dass wir selbst für unseren PageRank durch die Qualität der internen Verlinkung verantwortlich sind. Wenn wir heute einen PR4 erreichen, fließt dieser zu keiner Zeit in eine zukünftige PageRank-Berechnung mehr ein. Jedes Mal wird von neuem der PageRank unserer Website ermittelt.

Wenn wir nun also ein PageRank-Ergebnis der internen Verlinkung berechnet haben, dient dieses als Basis für die Berechnung und Beeinflussung von extern eingehenden Links.

Die bisherige Investition von Zeit hat sich vollends gelohnt. Man könnte regelrecht sagen: Nie war der PageRank so einfach wie heute. Hohe Konzentration war erforderlich und viel Energie. Noch mehr davon wird zum Erreichen des Endes des Regenbogens notwendig sein...

PageRank-Posts

zurück: PageRank 6 (Teil 6)

Anfang: PageRank Einleitung




6 comments:

Marvin said...

"Letztendlich ist es jedoch durchaus möglich, dass Google einen Schutzmechanismus integriert hat, der unabhängig vom PageRank-Algorithmus eine Mindestanzahl von Links für einen bestimmten PageRank voraussetzt."

Hmmm... Relativ Unnötig: Stell dir vor dich verlinkt das W3C und NUR das W3C - nur ein Backlink. Aber es wird keine Woche dauern bis du die ersten Links bekommst.
"Wenn das W3C den verlink, dann ist das schon sinnvoll - mach ich auch!" Usw. Das ist bei anderen PR∞ Seiten wie Techcrunch od. ähnl. noch extremer: Die sind vielleicht nicht soooo wichtig wie das W3C, aber stärker "viral frequentiert". Weitersagen und Link setzen ist in.

Wulffy said...

Hi Marvin, danke für Deinen Kommentar! Ich bin der Überzeugung, dass ein Schutzmechanismus existiert. Stell Dir eine neue Website vor, die direkt einen Backlink vom W3C erhalten würde. Da wäre doch etwas faul, oder? Eine Website muss sich zunächst mit der Zeit profilieren, um einen hohen PR erhalten zu können.

Dietmar aus Südtirol said...

Hallo Wulffy,

Kompliment toller Artikel! Vor allem eine der Kernaussagen: "Dazu werden zunächst alle Seiten auf 0 gesetzt und jede Domain ohne externen Linkeinfluss berechnet." finde ich gut nachvollziehbar.

Wulffy said...

Hallo Stammleser! Danke für das Lob.

Anonymous said...

Ich habe eine neue Site online genommen (einen Blog mit Drupal Engine, neue Domain), habe sechs PR4-7 Links drauf gesetzt (sonst keine ext. Links) und habe sofort (beim Frühjahrsupdate 08) einen PR5 bekommen.

Nur so zum nachdenken...

Wulffy said...

Warum zum Nachdenken? Das steht doch dort oben.

Allerdings zum Nachdenken für die Masse, die darüber berichtet, dass die Anzahl der Backlinks wichtig wäre, was völliger Unsinn ist.

Aber was einmal in den Köpfen drin ist, bekommt man eher nicht wieder raus.