PageRank ist ein Google-Algorithmus zum Ranking von Seiten basierend auf dem Autoritätsfluss über Links, der von Larry Page und Sergey Brin erstellt wurde.
PageRank war einst das Herzstück der Suche – und hat Google zu dem Imperium gemacht, das es heute ist.
Auch wenn Sie glauben, dass sich die Suche vom PageRank weiterentwickelt hat, lässt sich nicht leugnen, dass sie in der Branche seit langem ein allgegenwärtiges Konzept ist.
Jeder SEO-Profi sollte ein gutes Verständnis dafür haben, was PageRank war – und was es heute noch ist.
In diesem Artikel behandeln wir:
- Was ist PageRank?
- Die Geschichte, wie sich PageRank entwickelt hat.
- Wie PageRank die Suche revolutionierte.
- Symbolleiste PageRank im Vergleich zu PageRank.
- Wie PageRank funktioniert.
- Wie der PageRank zwischen den Seiten fließt.
- Wird PageRank noch verwendet?
Lassen Sie uns eintauchen.
Contents
Was ist PageRank?
PageRank wurde von den Google-Gründern Larry Page und Sergey Brin entwickelt und ist ein Algorithmus, der auf den kombinierten relativen Stärken aller Hyperlinks im Internet basiert.
Die meisten Leute argumentieren, dass der Name auf Larry Pages Nachnamen basiert, während andere vorschlagen, dass „Page“ sich auf eine Webseite bezieht. Beide Positionen sind wahrscheinlich wahr, und die Überlappung war wahrscheinlich beabsichtigt.
Als Page und Brin an der Stanford University waren, schrieben sie eine Arbeit mit dem Titel: Das PageRank-Zitationsranking: Ordnung ins Web bringen.
Das im Januar 1999 veröffentlichte Papier zeigt einen relativ einfachen Algorithmus zur Bewertung der Stärke von Webseiten.
Das Papier wurde in den USA zum Patent angemeldet (aber nicht in Europa, wo mathematische Formeln nicht patentierbar sind).
Die Stanford University besitzt das Patent und hat es an Google abgetreten. Das Patent läuft derzeit im Jahr 2027 aus.
Die Geschichte der Entwicklung des PageRanks
Während ihrer Zeit in Stanford in den späten 1990er Jahren beschäftigten sich sowohl Brin als auch Page mit Methoden zum Abrufen von Informationen.
Zu dieser Zeit war die Verwendung von Links, um herauszufinden, wie „wichtig“ jede Seite relativ zu einer anderen war, eine revolutionäre Möglichkeit, Seiten zu ordnen. Es war rechnerisch schwierig, aber keineswegs unmöglich.
Aus der Idee wurde schnell Google, das zu dieser Zeit eine Elritze in der Welt der Suche war.
Einige Parteien glaubten so sehr an den Ansatz von Google, dass das Unternehmen seine Suchmaschine zunächst ohne die Möglichkeit startete, Einnahmen zu erzielen.
Und während Google (damals bekannt als „BackRub“) die Suchmaschine war, war PageRank der Algorithmus, mit dem Seiten in den Suchergebnisseiten (SERPs) eingestuft wurden.
Der Google-Tanz
Eine der Herausforderungen von PageRank bestand darin, dass die Mathematik zwar einfach ist, aber iterativ verarbeitet werden muss. Die Berechnung läuft mehrfach, über jede Seite und jeden Link im Internet. Um die Jahrtausendwende dauerte die Verarbeitung dieser Mathematik mehrere Tage.
Die Google-SERPs bewegten sich in dieser Zeit auf und ab. Diese Änderungen waren oft unregelmäßig, da für jede Seite neue PageRanks berechnet wurden.
Dies wurde als „Google Dance„ bezeichnet und stoppte bekanntermaßen die SEO-Profis des Tages jedes Mal, wenn Google sein monatliches Update startete.
(Der Google Dance wurde später der Name einer jährlichen Party, die Google für SEO-Experten in seinem Hauptsitz in Mountain View veranstaltete.)
Vertrauenswürdige Seeds
Eine spätere Iteration von PageRank führte die Idee eines „vertrauenswürdigen Seeds“ ein, um den Algorithmus zu starten, anstatt jeder Seite im Internet den gleichen Anfangswert zu geben.
Vernünftiger Surfer
Eine weitere Iteration des Modells führte die Idee eines „vernünftigen Surfers ein.“
Dieses Modell legt nahe, dass der PageRank einer Seite möglicherweise nicht gleichmäßig mit den Seiten geteilt wird, auf die sie verlinkt ist – aber der relative Wert jedes Links könnte basierend darauf gewichtet werden, wie wahrscheinlich es ist, dass ein Benutzer darauf klickt.
Der Rückzug des PageRanks
Googles Algorithmus wurde anfangs intern als „unspambar“ angesehen, da die Bedeutung einesdie Seite wurde nicht nur durch ihren Inhalt bestimmt, sondern auch durch eine Art "Abstimmungssystem", das durch Links zur Seite generiert wurde.
Googles Vertrauen währte jedoch nicht lange.
PageRank begann problematisch zu werden, als die Backlink-Industrie wuchs. Also zog Google es aus der Öffentlichkeit zurück, verließ sich aber weiterhin auf es für seine Ranking-Algorithmen.
Die PageRank-Symbolleiste wurde bis 2016 zurückgezogen, und schließlich wurde der gesamte öffentliche Zugriff auf PageRank eingeschränkt. Aber zu diesem Zeitpunkt war insbesondere Majestic (ein SEO-Tool) in der Lage, seine eigenen Berechnungen recht gut mit PageRank zu korrelieren.
Google hat viele Jahre damit verbracht, SEO-Profis durch seine „Google-Richtlinien„ Dokumentation und durch Ratschläge seines Spam-Teams unter der Leitung von Matt Cutts bis Januar 2017 davon abzuhalten, Links zu manipulieren.
In dieser Zeit änderten sich auch die Algorithmen von Google.
Das Unternehmen verließ sich weniger auf PageRank und nach dem Kauf von MetaWeb und seinem proprietären Knowledge Graph (2014 Freebase genannt) begann Google, die Informationen der Welt auf verschiedene Arten zu indizieren.
Toolbar PageRank Vs. PageRank
Google war anfangs so stolz auf seinen Algorithmus, dass es das Ergebnis seiner Berechnung gerne öffentlich mit jedem teilte, der es sehen wollte.
Die bemerkenswerteste Darstellung war eine Symbolleistenerweiterung für Browser wie Firefox, die für jede Seite im Internet eine Punktzahl zwischen 0 und 10 anzeigte.
In Wahrheit hat PageRank eine viel größere Bandbreite an Bewertungen, aber 0-10 gab SEO-Profis und Verbrauchern eine sofortige Möglichkeit, die Wichtigkeit jeder Seite im Internet zu bewerten.
Die PageRank-Symbolleiste machte den Algorithmus extrem sichtbar, was auch mit Komplikationen verbunden war. Insbesondere bedeutete dies, dass klar war, dass Links der einfachste Weg zu „Spiel“ Google waren.
Je mehr Links (oder genauer gesagt, je besser der Link), desto besser könnte eine Seite in den SERPs von Google für jedes Ziel-Keyword ranken.
Dies bedeutete, dass ein Sekundärmarkt gebildet wurde, der Links kaufte und verkaufte, die auf dem PageRank der URL bewertet wurden, auf der der Link verkauft wurde.
Dieses Problem wurde noch verschärft, als Yahoo ein kostenloses Tool namens Yahoo Search Explorer auf den Markt brachte, mit dem jeder die Möglichkeit hatte, Links zu einer bestimmten Seite zu finden.
Später bauten zwei Tools – Moz und Majestic – auf der kostenlosen Option auf, indem sie ihre eigenen Indizes im Internet erstellten und Links separat bewerteten.
Wie PageRank die Suche revolutionierte
Andere Suchmaschinen verließen sich stark darauf, den Inhalt auf jeder Seite einzeln zu analysieren. Diese Methoden hatten wenig, um den Unterschied zwischen einer einflussreichen Seite und einer einfach mit zufälligem (oder manipulativem) Text geschriebenen Seite zu identifizieren.
Dies bedeutete, dass die Abrufmethoden anderer Suchmaschinen für SEO-Profis extrem einfach zu manipulieren waren.
Googles PageRank-Algorithmus war also revolutionär.
In Kombination mit einem relativ einfachen Konzept von „Ngrammen“, um die Relevanz zu ermitteln, hat Google eine Erfolgsformel gefunden.
Es überholte bald die wichtigsten etablierten Unternehmen des Tages, wie AltaVista und Inktomi (die unter anderem MSN betrieben).
Durch das Arbeiten auf Seitenebene fand Google auch eine viel skalierbarere Lösung als der „verzeichnisbasierte“ Ansatz von Yahoo und später DMOZ –, obwohl DMOZ (auch Open Directory Project genannt) Google zunächst ein eigenes Open-Source-Verzeichnis zur Verfügung stellen konnte.
Wie PageRank funktioniert
Die Formel für PageRank gibt es in verschiedenen Formen, kann aber in wenigen Sätzen erklärt werden.
Zunächst wird jeder Seite im Internet ein geschätzter PageRank-Wert zugewiesen. Dies könnte eine beliebige Zahl sein. Historisch gesehen wurde PageRank der Öffentlichkeit als Punktzahl zwischen 0 und 10 präsentiert, aber in der Praxis müssen die Schätzungen nicht in diesem Bereich beginnen.
Der PageRank für diese Seite wird dann durch die Anzahl der Links aus der Seite geteilt, was zu einem kleineren Bruchteil führt.
Der PageRank wird dann auf die verlinkten Seiten verteilt – und das gleiche geschieht für jede andere Seite im Internet.
Dann ist für die nächste Iteration des Algorithmus die neue Schätzung für den PageRank für jede Seite die Summe aller Bruchteile von Seiten, die auf jede gegebene Seite verlinken.
Die Formel enthält auch einen „Dämpfungsfaktor“, der als Chance beschrieben wurde, dass eine Person, die im Internet surft, das Surfen ganz einstellen könnte.
Vor jeder nachfolgenden Iteration des Algorithmus wird der vorgeschlagene neue PageRank um den Dämpfungsfaktor reduziert.
Diese Methode wird wiederholt, bis die PageRank-Werte ein ausgeglichenes Gleichgewicht erreichen. Die resultierenden Zahlen wurden dann der Einfachheit halber im Allgemeinen in einen besser erkennbaren Bereich von 0 bis 10 transponiert.
Eine Möglichkeit, dies mathematisch darzustellen, ist:
Bild vom Autor, April 2023
Wobei:
- PR = PageRank in der nächsten Iteration des Algorithmus.
- d = Dämpfungsfaktor.
- j = die Seitennummer im Internet (wenn jede Seite eine eindeutige Nummer hat).
- n=Gesamtzahl der Seiten im Internet.
- i = die Iteration des Algorithmus (anfänglich auf 0 gesetzt).
Die Formel kann auch in Matrixform ausgedrückt werden.
Probleme und Iterationen der Formel
Die Formel hat einige Herausforderungen.
Wenn eine Seite nicht auf eine andere Seite verlinkt, erreicht die Formel kein Gleichgewicht.
In diesem Fall würde also der PageRank auf jede Seite im Internet verteilt. Auf diese Weise könnte sogar eine Seite ohne eingehende Links einen PageRank erhalten – aber es würde sich nicht genug ansammeln, um signifikant zu sein.
Eine weitere, weniger dokumentierte Herausforderung besteht darin, dass neuere Seiten, obwohl sie möglicherweise wichtiger sind als ältere Seiten, einen niedrigeren PageRank haben. Dies bedeutet, dass alte Inhalte im Laufe der Zeit einen überproportional hohen PageRank aufweisen können.
Die Zeit, in der eine Seite live war, wird im Algorithmus nicht berücksichtigt.
Wie der PageRank zwischen den Seiten fließt
Wenn eine Seite mit einem Wert von 5 beginnt und 10 Links enthält, erhält jede Seite, auf die sie verlinkt, 0,5 PageRank (abzüglich des Dämpfungsfaktors).
Auf diese Weise fließt der PageRank zwischen Iterationen durch das Internet.
Wenn neue Seiten ins Internet kommen, beginnen sie mit nur einer winzigen Menge an PageRank. Wenn jedoch andere Seiten auf diese Seiten verlinken, steigt ihr PageRank mit der Zeit.
Wird PageRank noch verwendet?
Obwohl der öffentliche Zugriff auf den PageRank im Jahr 2016 entfernt wurde, wird angenommen, dass der Score für Suchingenieure innerhalb von Google weiterhin verfügbar ist.
Ein Leck der von Yandex verwendeten Faktoren zeigte, dass der PageRank als Faktor erhalten blieb, den er verwenden konnte.
Google-Ingenieure haben vorgeschlagen, dass die ursprüngliche Form des PageRanks durch eine neue Näherung ersetzt wurde, die weniger Rechenleistung für die Berechnung erfordert. Während die Formel für die Rangfolge von Google-Seiten weniger wichtig ist, bleibt sie für jede Webseite eine Konstante.
Und unabhängig davon, welche anderen Algorithmen Google möglicherweise verwendet, ist PageRank wahrscheinlich bis heute in vielen Systemen des Suchriesen eingebettet.
Dixon erklärt in diesem Video ausführlicher, wie PageRank funktioniert:
Originalpatente und -papiere Zum ausführlicheren Lesen:
- Methode zum Knoten-Ranking in der Datenbank
< eine verknüpfte Datenbank.
- Das PageRank-Zitationsranking: Ordnung ins Web bringen
- Die Anatomie einer groß angelegten hypertextuellen Websuchmaschine