Vom Erlernen des Suchverlaufs bis hin zur Unterscheidung von Entitäten und Schlüsselwörtern – Verstehen Sie wirklich, was Entitäten sind, damit Sie gezielteren Suchverkehr erzielen können.
Es gibt eine Menge Verwirrung darüber, wie SEO-Profis „Entitäten“ in SEO verstehen und, was noch wichtiger ist, nutzen sollten.
Ich verstehe, woher das kommt, besonders wenn es beim traditionellen SEO-Ansatz um Wörter und Phrasen geht.
Tatsächlich hatten die meisten Algorithmen, mit denen die erste Welle von SEO-Profis (wie ich) aufgewachsen war, kein Konzept für eine „Entität“ bei der Suche. SEO-Prinzipien – vom Schreiben von Inhalten über Ankertexte in Links bis hin zum SERPs-Tracking – waren (und sind größtenteils immer noch) schlüsselwortgesteuert, und vielen Menschen fällt es immer noch schwer zu verstehen, was sich geändert hat.
Aber im letzten Jahrzehnt hat sich die gesamte Suche darauf zubewegt, die Welt als eine Reihe von Wörtern und als eine Reihe miteinander verbundener Einheiten zu verstehen.
Die Arbeit mit Entitäten in SEO ist die Grundlage für eine zukunftssichere Suchstrategie.
Sie sind auch wichtig für eine Zukunft mit generativer KI und ChatGPT.
Dieser Artikel spricht darüber, warum. Es umfasst:
- Was sind Entitäten?
- Was ist der Wissensgraph?
- Eine kurze Geschichte der Entitäten in der Suche: Freebase, Wikidata und Entitäten.
- Wie Entitäten funktionieren und wie sie für das Ranking verwendet werden.
- Beispiele für Entitäten in Google.
- Wie man für Entitäten optimiert.
- Schema verwenden, um Entitäten zu definieren.
Contents
- 1 Was sind Entitäten?
- 2 Was ist „Der Wissensgraph“?
- 3 Eine kurze Geschichte der Entitäten in der Suche
- 4 Wikidata
- 5 Wie Entitäten funktionieren und wie sie für das Ranking verwendet werden
- 6 Beispiele Für Entitäten In Google
- 7 Wie man für Entitäten optimiert
- 8 Diese Entitätssignale in SEO zusammenfassen
- 9 Schema verwenden, um Entitäten zu definieren
Was sind Entitäten?
SEOs verwechseln häufig Entitäten mit Schlüsselwörtern.
Eine Entität (in Suchbegriffen) ist ein Datensatz in einer Datenbank. Eine Entität hat im Allgemeinen eine bestimmte Datensatzkennung.
In Google könnte das sein:
„MREID=/m/23456“ oder „KGMID=/g/121y50m4.“
Es ist sicherlich kein „Wort“ oder „Satz.” Ich glaube, dass die Verwirrung mit Schlüsselwörtern auf zwei Ursachen zurückzuführen ist:
- Die erste ist, dass SEO-Profis ihr Handwerk vor 2010 in Bezug auf Schlüsselwörter und Phrasen gelernt haben. Viele tun es immer noch.
- Die zweite ist, dass jede Entität mit einer Bezeichnung versehen ist, die im Allgemeinen ein Schlüsselwort oder ein Deskriptor ist.
Während der „Eiffelturm“ für uns als Menschen wie eine perfekt identifizierbare „Entität“ erscheint, sieht Google ihn als „KGMID=/m/02j81“ und kümmert sich wirklich nicht darum, ob Sie ihn „Eiffelturm“ oder “ Torre Eiffel“ oder “ Torre Eiffel“ nennen;ایفل بورجو" (Das ist Aserbaidschan für „Eiffelturm“). Es weiß, dass Sie sich wahrscheinlich auf diese zugrunde liegende Entität in seinem Wissensdiagramm beziehen.
Das kommt zum nächsten Punkt:
Was ist „Der Wissensgraph“?
Es gibt feine, aber wichtige Unterschiede zwischen „einem Wissensgraphen“ „Dem Wissensgraphen“ und „Dem Wissensfeld.“
- Ein Wissensgraph ist eine halbstrukturierte Datenbank, die Entitäten enthält.
- Der Knowledge Graph ist im Allgemeinen der Name, der dem Knowledge Graph von Google gegeben wird, obwohl Tausende von anderen existieren. Wikidata (selbst ein Wissensgraph) versucht, Kennungen aus verschiedenen seriösen Datenquellen zu referenzieren.
- Das Knowledge Panel ist eine spezifische Darstellung der Ergebnisse aus dem Knowledge Graph von Google. Dies ist der Bereich, der häufig rechts neben den Ergebnissen (SERPs) einer Desktop-Suche angezeigt wird und weitere Details zu einer Person, einem Ort, einem Ereignis oder einer anderen Entität enthält.
Eine kurze Geschichte der Entitäten in der Suche
Metaweb
Im Jahr 2005 begann Metaweb mit dem Aufbau einer Datenbank namens Freebase, die es als „offene, gemeinsam genutzte Datenbank des Weltwissens bezeichnete.“
Ich würde es als halbstrukturierte Enzyklopädie beschreiben.
Es gab jeder „Entität“ (oder Artikel, um die Metapher zu erweitern) eine eigene eindeutige ID-Nummer – und von dort aus versuchte das System anstelle eines traditionellen Artikels in Worten, Artikel durch ihre Beziehungen mit anderen ID-Nummern im System zu verbinden.
Rund 50 Millionen Dollar Kapitalfinanzierung, und 5 Jahre später wurde das Projekt an Google verkauft.
Es wurde nie ein kommerzielles Produkt entwickelt, aber der Grundstein für einen 10-jährigen Übergang für Google von einer keyword-basierten Suchmaschine zu einer entitätsbasierten gelegt.
Wikidata
Im Jahr 2016 – etwa sechs Jahre nach dem Kauf – schloss Google Freebase offiziell, weil es migriert und die Ideen zu einem eigenen „Knowledge Graph“ entwickelt hatte, der moderne Begriff für diese Datenbanken.
Zu diesem Zeitpunkt ist es nützlich zu beachten, dass Google öffentlich erklärte, dass es einen Großteil seiner Entitätsdaten mit Wikidata synchronisiert habe und dass Wikidata (das die in Wikipedia verwendeten Daten untermauert) in Zukunft eine Möglichkeit sei, wie Googles Knowledge Graph mit der Außenwelt interagieren könnte.
Wie Entitäten funktionieren und wie sie für das Ranking verwendet werden
Entitäten Im Kernalgorithmus
Entitäten werden hauptsächlich verwendet, um Ideen zu unterscheiden, nicht um Seiten mit denselben Ideen zu bewerten.
Das heißt nicht, dass der geschickte Einsatz von Entitäten nicht dazu beitragen kann, dass der Inhalt Ihrer Website effektiver eingestuft wird. Es kann. Aber wenn Google versucht, Ergebnisse für eine Nutzersuche bereitzustellen, zielt es in erster Linie auf eine genaue Antwort ab.
Nicht unbedingt das verdienstvollste.
Daher verbringt Google viel Zeit damit, Textpassagen in zugrunde liegende Entitäten umzuwandeln. Dies geschieht sowohl bei der Indizierung Ihrer Site als auch bei der Analyse einer Benutzeranfrage.
Wenn ich zum Beispiel „Die Namen der Restaurants unter dem Eiffelturm“eingebe,“ weiß Google, dass der Suchende nicht nach „Namen“ oder dem „Eiffelturm sucht.”
Sie suchen nach Restaurants. Nicht irgendein Restaurant, sondern eines an einem bestimmten Ort. Die beiden relevanten Entitäten bei dieser Suche sind „Restaurant“ im Kontext von „Champ de Mars, 5 Av. Anatole Frankreich, Paris” (Die Adresse des Eiffelturms).
Dies hilft Google bei der Entscheidung, wie die verschiedenen Suchergebnisse gemischt werden sollen – Bilder, Karten, Google-Unternehmen, Anzeigen und organische Webseiten, um nur einige zu nennen.
Am wichtigsten ist für den SEO-Profi, dass es für die Website des Restaurants Jules Verne sehr wichtig ist, über die spektakuläre Aussicht auf den Eiffelturm zu sprechen, wenn Google erkennen soll, dass die Seite für diese Suchanfrage relevant ist.
Dies könnte schwierig sein, da sich das Jules Verne Restaurant im Eiffelturm befindet.
Sprachunabhängig
Entitäten eignen sich hervorragend für Suchmaschinen, da sie sprachunabhängig sind. Darüber hinaus bedeutet diese Idee, dass eine Entität durch mehrere Medien beschrieben werden kann.
Ein Bild wäre eine naheliegende Art, den Eiffelturm zu beschreiben, da er so ikonisch ist. Es könnte auch eine Sprachdatei oder die offizielle Seite für den Turm sein.
Diese stellen alle gültige Bezeichnungen für die Entität und in einigen Fällen gültige Bezeichner in anderen Wissensgraphen dar.
Verbindungen zwischen Entitäten
Das Zusammenspiel zwischen Entitäten ermöglicht es einem SEO-Profi, kohärente Strategien zur Entwicklung von relevantem organischem Traffic zu entwickeln.
Natürlich ist die „maßgeblichste” Seite für den Eiffelturm wahrscheinlich die offizielle Seite oder Wikipedia. Wenn Sie nicht buchstäblich der SEO-Profi für den Eiffelturm sind, können Sie wenig tun, um diese Tatsache in Frage zu stellen.
Das Zusammenspiel zwischen Entitäten ermöglicht es Ihnen jedoch, Inhalte zu schreiben, die einen Rang einnehmen. Wir haben bereits „Restaurants“ und „Eiffelturm“ – erwähnt, aber was ist mit „Metro“ und „Eiffelturm" oder „Rabatten“ und „Eiffelturm“?
Sobald zwei Entitäten ins Spiel kommen, sinkt die Anzahl der relevanten Suchergebnisse dramatisch. Wenn Sie zu "ermäßigten Eiffelturm-Tickets kommen, wenn Sie mit der U-Bahn fahren", werden Sie zu einer von nur einer winzigen Auswahl von Seiten, die sich auf die Gegenüberstellung von U-Bahn-Tickets, Eiffelturm-Tickets und Rabatten konzentrieren.
Viel weniger Leute geben diesen Satz ein, aber die Conversion-Rate wird viel höher sein.
Es könnte sich auch als ein monetarisierbareres Konzept für Sie erweisen! (Dieses Beispiel soll das Prinzip erklären. Ich weiß nicht, ob es solche Rabatte gibt. Aber sie sollten.)
Dieses Konzept kann skaliert werden, um außergewöhnlich starke Seiten zu erstellen, indem zuerst alle konkurrierenden Seiten für einen Suchbegriff in eine Tabelle unterteilt werden, die die zugrunde liegenden Entitäten und ihre relative Bedeutung für die Hauptabfrage zeigt.
Dies kann dann als Inhaltsplan für einen Autor dienen, um einen neuen Inhalt aufzubauen, der maßgeblicher ist als jeder der anderen konkurrierenden Teile.
Obwohl eine Suchmaschine also behaupten kann, dass Entitäten kein Rankingfaktor sind, geht die Strategie auf den Kern der Philosophie ein, dass „Wenn Sie gute Inhalte schreiben, werden sie kommen.“
Beispiele Für Entitäten In Google
Entitäten In der Bildersuche
Screenshot von der Suche nach [Hund auf einem Skateboard], Google, August 2023
Entitäten können auch bei der Optimierung von Bildern sehr hilfreich sein.
Google hat sehr hart daran gearbeitet, Bilder mithilfe von maschinellem Lernen zu analysieren. In der Regel kennt Google die Hauptbilder in den meisten Fotos.
Nehmen Sie also [einen Hund auf einem Skateboard] als Suchbegriff…Wenn Sie sicherstellen, dass Ihr Inhalt das Bild vollständig unterstützt, können Ihre Inhalte besser sichtbar werden, genau dann, wenn der Benutzer danach sucht.
Entitäten in Google Discover
Eine der am meisten unterschätzten Traffic-Quellen für SEO-Profis ist Google Discover.
Google stellt Nutzern einen Feed mit interessanten Seiten zur Verfügung, auch wenn sie nicht aktiv nach etwas suchen.
Dies geschieht auf Android-Handys und auch in der Google-App auf iPhones. Während Nachrichten diesen Feed stark beeinflussen, können Nicht-Nachrichtenseiten Traffic von „Discover .“
Wie? Gut – Ich glaube, dass Entitäten einen großen Faktor spielen!
Screenshot von der Google Search Console, August 2023
Seien Sie nicht entmutigt, wenn Sie in Ihrer Google Search Console keinen „Discover“-Tab sehen. Wenn Sie dies jedoch tun, kann dies ein willkommenes Zeichen dafür sein, dass mindestens eine Ihrer Webseiten so weit mit Entitäten ausgerichtet ist, dass sich die Interessen mindestens einer Person so weit mit Ihren Inhalten überschneiden, dass die Seite in einem Feed enthalten ist, der speziell auf den Benutzer ausgerichtet ist.
Im obigen Beispiel gibt es immer noch eine Klickrate von 4,2%, obwohl „Discover“-Ergebnisse nicht genau zu dem Zeitpunkt angezeigt werden, zu dem ein Benutzer sucht.
Dies liegt daran, dass Google durch die Zuordnung von Entitäten die Interessen und Gewohnheiten vieler seiner Nutzer an den Inhalten im Internet ausrichten kann.
Wenn eine starke Korrelation auftritt, kann Google eine Seite für einen Nutzer anbieten.
Wie man für Entitäten optimiert
Einige Recherchen eines Googlers
Im Jahr 2014 kam ein Artikel heraus, den ich sehr hilfreich finde, um zu demonstrieren, dass Google (oder zumindest seine Forscher) daran interessiert waren, die Ideen der Verwendung von Schlüsselwörtern zum Verständnis von Themen und der Verwendung von Entitäten zu trennen.
In diesem Artikel stellen Dunietz und Gillick fest, wie sich NLP-Systeme in Richtung entitätsbasierter Verarbeitung entwickelt haben. Sie zeigen, wie ein binäres "Salience" -System für große Datensätze verwendet werden kann, um die Entitäten in einem Dokument (Webseite) zu definieren.
Ein „binäres Bewertungssystem“ legt nahe, dass Google entscheiden könnte, dass ein Dokument sich entweder auf eine bestimmte Entität bezieht oder nicht.
Spätere Hinweise deuten darauf hin, dass „salience“ jetzt von Google auf einer gleitenden Skala von 0 bis 1 gemessen wird (z. B. die Bewertung in seiner NLP-API).
Trotzdem finde ich dieses Papier sehr hilfreich, um zu sehen, wo nach Ansicht von Google „Entitäten“ auf einer Seite erscheinen sollten, um „als hervorstechend zu zählen“.
Ich empfehle, das Papier für ernsthafte Forschung zu lesen, aber sie listen auf, wie sie „salience als Studie von ‘ Artikeln der New York Times’ klassifizierten.“
Konkret zitierten sie:
1st-loc
Dies war der erste Satz, in dem eine Entität zum ersten Mal erwähnt wurde.
Der Vorschlag ist, dass die Erwähnung der Entität zu Beginn Ihrer Webseite die Wahrscheinlichkeit erhöhen könnte, dass eine Entität als „hervorstechend“ für den Artikel angesehen wird.
Kopfzahl
Dies ist im Grunde die Häufigkeit, mit der das „Kopf“-Wort der ersten Erwähnung der Entität erscheint.
„Hauptwort“ ist im Artikel nicht speziell definiert, aber ich verstehe es als das Wort, das in seiner einfachsten Form verkettet ist.
Erwähnungen
Dies bezieht sich nicht nur auf die Wörter/Bezeichnungen der Entität, sondern auch auf andere Faktoren, wie z. B. Verweise der Entität (er/sie/es)
Überschrift
Wo, wenn eine Entität in einer Überschrift erscheint.
Head-lex
Wird als „kleingeschriebenes Kopfwort der ersten Erwähnung beschrieben.“
Zentralität der Entitäten
Das Papier spricht auch über die Verwendung einer Variation von PageRank – wo sie Webseiten für Freebase-Artikel ausgetauscht haben!
Das Beispiel, das sie teilten, war eine Debatte im Senat, an der FEMA, die Republikanische Partei, (Präsident) Obama und ein republikanischer Senator beteiligt waren.
Nachdem sie einen PageRank-ähnlichen iterativen Algorithmus auf diese Entitäten und ihre Nähe zueinander im Wissensgraphen angewendet hatten, konnten sie die Gewichtung der Wichtigkeit dieser Entitäten im Dokument ändern.
Diese Entitätssignale in SEO zusammenfassen
Ohne spezifisch für Google zu sein, würde hier ein Algorithmus Werte für alle oben genannten Variablen für jede Entität erstellen, die ein NLP- oder benanntes Entitätsextraktionsprogramm (NEEP) auf einer Textseite findet (oder in diesem Fall für alle in einem Bild erkannten Entitäten).
Dann würde auf jede Variable eine Gewichtung angewendet, um eine Punktzahl zu erhalten. In dem besprochenen Artikel wird diese Punktzahl zu einer 1 oder 0 (hervorstechend oder nicht hervorstechend), aber ein Wert von 0-1 ist wahrscheinlicher.
Google wird niemals die Details dieser Gewichtungen teilen, aber was das Papier auch zeigt, ist, dass die Gewichtungen erst bestimmt werden, nachdem Hunderte Millionen Seiten gelesen wurden.“
Dies liegt in der Natur großer Sprachlernmodelle.
Aber hier sind einige Top-Tipps für SEO-Profis, die Inhalte nach zwei oder mehr Entitäten ordnen möchten. Zurück zum Beispiel „Restaurants in der Nähe des Eiffelturms“:
- Entscheiden Sie sich für einen „toten“ Begriff für jede Entität. Ich könnte "Restaurant" "Eiffelturm" und " Entfernung" wählen, weil Entfernung eine gültige Bedeutung und einen gültigen Artikel in Wikipedia hat. Cafe könnte ein geeignetes Synonym für Restaurant sein, ebenso wie „Restaurants“ im Plural.
- Ziel ist es, alle drei Entitäten in der Kopfzeile und im ersten Satz zu haben. Beispielsweise: „Restaurants in geringer Entfernung vom Eiffelturm.“
- Zielen Sie im Text darauf ab, über die Wechselbeziehung zwischen diesen Entitäten zu sprechen. Zum Beispiel: „Das Jules-Verne-Restaurant befindet sich buchstäblich darin.“ Angenommen „es“ bezieht sich im Kontext des Schreibens eindeutig auf den Eiffelturm, er muss nicht jedes Mal ausgeschrieben werden. Halte die Sprache natürlich.
Reicht das für Entity SEO?
Nein. Wahrscheinlich nicht. (Sie sind herzlich eingeladen, mein Buch zu lesen!) Es liegen jedoch nicht alle Faktoren in Ihrer Kontrolle als Autor oder Websitebesitzer.
Zwei Ideen, die jedoch Auswirkungen zu haben scheinen, sind das Verknüpfen von Inhalten von anderen Seiten im Kontext und das Hinzufügen von Schemata, um bei den Definitionen zu helfen.
Schema verwenden, um Entitäten zu definieren
Suchmaschinen könnten durch die Verwendung des Schemas „about“ und „mentions“ weitere Klarheit verschaffen, um einer Suchmaschine bei der eindeutigen Unterscheidung von Inhalten zu helfen.
Diese beiden Schematypen helfen zu beschreiben, worüber eine Seite spricht.
Indem ein SEO-Profi eine Seite „über“ eine oder zwei Entitäten und „Erwähnungen“ von vielleicht ein paar mehr erstellt, kann er schnell einen langen Inhalt in seine Schlüsselbereiche auf eine Weise zusammenfassen, die für den Konsum von Wissensgraphen bereit ist.
Es sollte jedoch beachtet werden, dass Google nicht ausdrücklich auf die eine oder andere Weise angegeben hat, ob es dieses Schema in seinen Kernalgorithmen verwendet.
Ich würde dieses Schema wahrscheinlich zu meinem Artikel hinzufügen:
Die genaue Wahl des Schemas ist ebenso eine philosophische Frage wie eine SEO-Frage.
Aber denken Sie an das Schema, das Sie verwenden, um Ihren Inhalt zu „disambiguieren“ und nicht „Ihren Inhalt zu optimieren“, und Sie werden hoffentlich gezielteren Suchverkehr erhalten.
Anmerkung des Herausgebers: Dixon Jones ist der Autor von Entity SEO: Umzug von Strings zu Dingen.