PageRank - Die Praxis


Nach dem letzten Post PageRank - Teil 4 vergingen 11 Tage. Als ich am 27.01. den Post PageRank - Einleitung erstellte, war mir bereits bewusst, dass dieser PageRank-Workshop nur mit einem großen Zeitaufwand zu verwirklichen ist. Immer wieder stieß ich bei meinen Berechnungen an Punkte, die kein Weiterkommen ermöglichten. Fünfmal habe ich von vorne angefangen und zwischenzeitlich einhundert Diagramme erstellt und berechnet. Rekord dabei waren 40 untereinander verlinkte Seiten.

Ich erinnerte mich zurück an meine Schulzeit. Damals in der 8. (oder 9.?) Klasse leiteten wir her, warum die Wurzel aus 2 nicht rational ist. Eigentlich wollte ich das nie wissen. Nun ist es aber im Fall Das Vermächtnis des Google-Algorithmus' anders. Mir ist auch bewusst, dass man den PageRank kurz erklären kann. Wir wollen uns aber nicht mit einer kurzen Erklärung abfinden, sondern herleiten, warum was genau so ist. Nicht also wissen, dass man etwas macht, sondern genau wissen, warum man es macht und mit welchen Verlinkungen man kontrolliert das wirklich optimalste Ergebnis erzielen kann. Schließlich stellt dieses Wissen die Grundlage für wirklichen Erfolg im Internet dar.

In der letzten Woche las ich sehr viel über den PageRank auf Englisch (und ein wenig auf Deutsch). Keine kurzen Erklärungen, sondern seitenlange Ausarbeitungen. Einige Seiten machten mich dabei völlig kirre, z. B. die deutsche Seite eines Suchmaschinenoptimierers, die es völlig übertrieb, da sie ständig mit anderen Dämpfungsfaktoren rechnete und dabei logischerweise keine vergleichbaren Ergebnisse lieferte. Eine andere Seite bot eine automatisierte Berechnung der Iterationen des PageRank-Alogrithmus' an. Als in den Berechnungen ein externer PR3-Link dazu führte, dass die Domain direkt in der ersten Iteration einen PR3,0 bekam, löschte ich diese Seite aus meinen Favoriten.

Die Aussage, dass Google zu Beginn der Neuberechnung alle Seiten des Internets auf PR1 setzen würde, sorgte dann eine Zeit lang für Chaos. Dem ist definitiv nicht so.

Mir wurde immer mehr bewusst, dass ich beabsichtige, etwas zu veröffentlichen, was offenbar noch nie soweit veröffentlicht wurde. Wahrscheinlich aber auch, weil niemand unentgeltlich einen so großen Aufwand betreiben würde. Dabei verstehe ich nicht, wieso einige dennoch einen großen Aufwand betrieben, es so zu veröffentlichen, dass man sehr schnell die Lust daran verliert es zu lesen, sobald man merkt, dass es in der Praxis nicht hilft, man es dennoch nicht versteht und sich danach auch weiterhin im Kreis bewegen wird.

Neben den Berechnungen entwickelte ich diverse grafische Darstellungen, die eine verständliche Erklärung ermöglichen sollten. Nun habe ich ein Ergebnis.

Anfänglicher PageRank adé - Schonfrist beendet


Immer wieder stellte sich mir die Frage, wie weit ein Mensch einen Algorithmus nachrechnen kann und wo die Grenzen sind. Mehr als einmal wollte ich alles hinwerfen, wurde aber kräftig motiviert von zwei guten Bekannten.

Je weiter man sich mit dem PageRank-Algorithmus auseinandersetzt, vielmehr, je mehr Berechnungen man durchführt, desto schneller versteht man, dass der anfängliche PageRank völlig egal für das Verständnis ist, welche Verlinkungen zu welchem PageRank-Ergebnis führen. Man kann sich Dinge schön rechnen und wenn irgendetwas zu schön dabei wird, weiß man, dass irgendwo ein Fehler drinsteckt und löscht besser alles.

Kommen wir zurück zur PageRank-Praxis. Wir beginnen heute mit vier Seiten, die untereinander verlinken:

PageRank - 4 Seiten verlinken untereinander

Und schauen uns direkt den anfänglichen PageRank an:

PageRank - 4 Seiten verlinken untereinander - Anfänglicher PageRank

Soweit waren wir bisher. Nur was ergibt sich daraus, nachdem der PageRank-Algorithmus durchgelaufen ist? Wie oft muss er durchlaufen? Wann ist das Ende?

Unser erstes PageRank-Ergebnis


In diesem Beispiel muss der PageRank-Algorithmus 31 - 33 Iterationen (also Berechnungsdurchläufe) durchführen, je nachdem, wie genau Google ist. (Für alle Berechnungen geben wir uns mit einer Genauigkeit von vier Nachkommastellen beim PageRank zufrieden.) - Am Ende muss sich (aus jetziger Sicht) ein Durchschnitt von 1 ergeben. Der durchschnittliche PageRank aller Seiten entspricht einem PageRank von 1.

Schauen wir uns das Ergebnis an:

PageRank - 4 Seiten verlinken untereinander - PageRank-Ergebnis

Durch genau diese Art der internen Verlinkungen wurde aus einem anfänglichen PageRank von 0,15 bei der Domain im Ergebnis ein PageRank von 1,9189. Hört sich doch einfach an, oder? - Die Unterseiten, die anfänglich mit 0,1925 stärker als die Domain aussahen, sind es aber überhaupt nicht. Sie haben nun einheitlich einen PageRank von 0,6937.

Soweit. So gut.

Falls Du mehr Details wissen möchtest, stelle ich hier die Iterationen...

PageRank - 4 Seiten verlinken untereinander - PageRank-Iterationen

und den Einstieg der Berechnung zur Verfügung:

PageRank - 4 Seiten verlinken untereinander - Anfängliche Berechnung PageRank

PageRank - Fragen über Fragen


Auf dieser Basis geht es ab jetzt weiter. Welche Verlinkungen werden uns zum optimalsten PageRank-Ergebnis bringen? Wie können wir die PageRank-Vererbung genau kontrollieren? Wie können wir eingehende Links steuern? Mit Sicherheit werden es nicht die letzten Fragen sein, die uns dabei einfallen werden...

PageRank-Posts

vor: PageRank 6 (Teil 6)

zurück: PageRank 4 (Teil 4)

Anfang: PageRank Einleitung




8 comments:

Mary said...

Lieber Wulffy,
da leistest Du wirklich eine grossartige Arbeit! Mit Interesse lese ich jeden Deiner Artikel - manchmal auch 2 mal, um auch wirklich alles genau zu verstehen.

Und natürlich freue ich mich heute bereits darauf, wie es weitergeht mit Deinen Berechnungen des Pagerank. Da steckt viel Arbeit dahinter. Bin begeistert davon, was Du da leistest!

Da lerne ich viel und dafür bin ich Dir sehr dankbar. Es gibt nicht viele Blogs, die inhaltlich wirklich so Top-Infos liefern wie Deiner!

Ebenfalls ein herzliches Dankeschön für Deinen Kommentar zu meinem Post in: Meditation Music.
Ich habe den von Dir empfohlenen Link besucht. Wenn ich solchen Tönen lausche, tauche ich ab in meine Gedankenwelt und lasse allen Bildern freien Lauf und so leben in mir die Bilder auf, die mich in andere Welten entführen und die mir zeigen welchen Weg ich gehen soll. Ich folge der Berufung, die meinem Innersten entspringt und wenn es manchmal auch nur eine kurze Gedanken-Reise durch das Universum ist, so schöpfe ich dabei meist viel Kraft für das Bevorstehende... auf jeden Fall fühle ich mich so richtig zufrieden dabei.

Alles Gute, vielen Dank und sonnige Grüsse aus der Schweiz,
Mary
CEO Modern Music School - Glarnerland

Wulffy said...

Hallo Mary,

nachdem ich meine Sprachlosigkeit nach Deinem Kommentar überwunden hatte, fand ich heraus, dass es etwas Schwierigeres gibt, als den PageRank-Algorithmus nachzurechnen: einen Smiley zu finden, der errötet...

Mary, das ist der schönste Kommentar, den ich jemals erhalten habe. Du hast mir schon soviel Inspiration und Kraft gegeben. Ich danke Dir dafür sehr.

Auch wenn viele sich wieder lächerlich über Deine abschließenden Worte machen werden, können wenige als auch wir beide verstehen, was Du beschreibst. Es gibt nichts Schöneres als Gedanken loszulassen und frei von Gedanken erst wirklich zu sehen und zu verstehen. Gedanken erzeugen Unzufriedenheit. Frei davon zu sein, wenn auch manchmal nur für kurze Zeit, bedeutet absolute Zufriedenheit und Entspannung.

Mary, nun werde ich wieder sprachlos.

Auch Dir nur das Beste, die besten Grüße von Herzen,

Wulffy

Sebastian said...

Hallo.

Ich bedanke mich soweit fuer die ausfuehrliche Erklaerung.

Dennoch existieren aber ungefaehr 160 Faktoren die den PR bestimmen und nur ca. 40 sind bekannt.

Oder wollen Sie ausdruecken, dass Sie all diese Faktoren beruecksichtigt haben.

Mit freundlichem Gruss
JackpotCity
http://www.jackpotcity.com

Wulffy said...

Hallo Sebastian,

danke für Deinen Kommentar.

Es kursieren natürlich verschiedene Gerüchte über die Anzahl der Faktoren. I. d. R. spricht man in der SEO-Welt von ca. 200 Ranking Faktoren. Und genau hier wirfst Du etwas durcheinander. Nicht der PageRank setzt sich aus 200 Faktoren zusammen, sondern das Ranking. Das Ranking steht im Normalfall kaum in Zusammenhang mit dem PageRank. Erst dann, wenn man mit allen bekannten Faktoren es nicht schafft, dauerhaft auf Platz 1 zu kommen, kann auch der PageRank eine Rolle spielen.

In diesem Blog geht es sich und wird es sich darum gehen, wie man auf Dauer eine Top-Position erreicht und bald auch z. B., wie man herausfindet, was derjenige, der auf Platz 1 steht, im kleinsten Detail genau macht, damit er dort stehen bleibt.

Die weltweit bekannteste Zusammenstellung der Ranking Faktoren findest Du hier: SEOmoz Ranking factors

Es sind wesentlich mehr als 40 Ranking Faktoren bekannt.

Wie gesagt, in diesem PageRank-Workshop geht es sich um den PageRank-Algorithmus, der die Basis und das Grundverständnis darstellt für Google als auch das Erstellen einer jeden Seite im Web.

Beste Grüße,
Wulffy

Dietmar said...

Hallo Wulffy,

gelesen, als sehr interessant befunden und - nein nicht abgehackt! Jetzt geht es ans testen und an eigene Plausibilitätsüberlegungen ;-)

Schön finde ich, dass die Berechnung überraschend einfach ausfällt, wobei ich mir aber schon vorstellen kann, dass dein Arbeitsaufwand dahinter nicht ganz so klein war.

Wulffy said...

Hallo Stammgast, ;-)

100 Stunden Vorarbeit. Die Problematik lag darin, dass unterschiedliche Meinungen und Beispiele für die Berechnung im Internet zu finden sind. Da man nicht einfach sagen kann, dass die ein oder andere falsch ist, muss man sie an mehreren Seitenberechnungen testen. Wenn z. B. am Ende bei allen Arten von Verlinkungen immer der selbe PageRank herauskommt, dann ist diese Berechnung für die Katz. Leider musste ich auch so etwas finden. Oder wenn ein externer Link eingeht, der einen völlig falschen PR der Zielseite in der Kalkulation ergibt, wie geschrieben, dann ist das zum Haareraufen.

Wie genannt, hat mich die Aussage, dass Google "gelegentlich" zu Beginn der Berechnungen alle Seiten auf PR1 setzen würde, völlig aus der geplanten Zeit geworfen, da das Herausfinden, dass diese Aussage falsch ist, viel Zeit gekostet hat. Eigentlich hat alles viel zu viel Zeit gekostet und am Ende werden vielleicht 200 - 250 Stunden vergangen sein. Dann kann ich mir aber wenigstens sagen, dass es definitiv so ist, wie man sagt oder auch wie man nicht sagt.

Zwischenzeitlich müssten in etwa 150 Stunden Arbeitszeit vergangen sein.

Bitte noch nicht ausprobieren. Warte wenigstens den nächsten Post ab!

Beste Grüße,
Wulffy

Dani said...

Interessante Aufstellung. Allerdings ist der externe Pagerank wahrscheinlich ein anderer als der interne. Der Pagerank spielt bei der Suchmaschinenoptimierung eine kleine Rolle.

Wulffy said...

Danke für Deinen Kommentar, Dani. Der PageRank unterscheidet nicht intern und extern. Für ihn gibt es nur Seiten.

Dass der PageRank eine kleine Rolle spielt, ist relativ ausgedrückt. Definiere klein. ;-) Hinzu kommt die Veränderung der Größe der kleinen Rolle mit der Zeit.

Wir kommen noch ausführlicher zum Thema. Die Google Toolbar zeigt längst mehr als den PageRank an, d. h. der Balken setzt sich nicht nur aus dem PageRank zusammen. Aber später dazu mehr.