Google indiziert jetzt CSV-Dateien, obwohl es zuvor CSV-Daten über strukturierte Daten für verbesserte Suchauftritte verwendet hat
Google hat seine zentrale Dokumentation für die Google-Suche leise aktualisiert, um zu beachten, dass sie jetzt indiziert werden.csv-Dateien.
Dies eröffnet eine neue Möglichkeit, gecrawlt zu werden oder wenn ein Publisher dies nicht möchte.CSV-Dateien gecrawlt, kann dies bedeuten, dass Roboter aktualisiert werden.txt, um diese Dateien auszuschließen.
Contents
Kommagetrennte Werte (CSV)
Kommagetrennte Werte (CSV)-Dateien sind Textdateien, die Daten in einem Tabellenformat speichern, das als Tabellenkalkulation angezeigt werden kann.
CSV-Dateien enthalten Daten im Klartext, was bedeutet, dass die CSV-Dateien weder Stilelemente wie Schriftarten noch Bilder oder aktive Links enthalten.
Sie sind nützlich, um Dinge wie das Hochladen einer Liste von URLs zum Crawlen in Software wie Screaming Frog zu tun.
Sie sind aber auch nützlich, um Daten in einer Tabelle zu organisieren.
Die Indizierung von CSV-Dateien ist neu
Googles Fähigkeit, CSV-Dateien zu indizieren, ist eine neue Funktion, da eine „Dateityp“-Suche auf Google nach CSV-Dateien derzeit keine CSV-Dateien zurückgibt.
Suchvorgänge wie die folgenden geben derzeit keine CSV-Dateien zurück:
- Dateityp:csv site:.gov
- dateityp:csv site:.edu
- dateityp:csv site:.com
Google hat bereits indirekt CSV-Dateien verwendet
Etwas Merkwürdiges an der Indizierung von CSV-Dateien durch Google ist, dass Googles Datensatzsuche bereits CSV-Dateien verwendet, aber anscheinend nur, wenn sie mit strukturierten Daten beschrieben werden.
Dokumentation zu strukturierten Datensatzen in der alten Entwicklerdokumentation von Google (sichtbar auf Archive.org ) besagt, dass CSV-Dateien ein akzeptabler Standard für die Anzeige in Datensatzsuchfunktionen sind.
Die Verwendung von Tabellendaten als Suchauftritt geht auf das Jahr 2018 zurück, als Google ankündigte, diese Art von Daten in der Suche anzuzeigen, wenn die Daten von strukturierten Daten begleitet werden.
Gemäß der Originaldokumentation:
„Datensätze sind leichter zu finden, wenn Sie unterstützende Informationen wie Name, Beschreibung, Ersteller und Verteilungsformate als strukturierte Daten bereitstellen.…
Hier sind einige Beispiele dafür, was sich als Datensatz qualifizieren kann:
- Eine Tabelle oder eine CSV-Datei mit einigen Daten
- Eine organisierte Sammlung von Tabellen
- Eine Datei in einem proprietären Format, die Daten enthält
- Eine Sammlung von Dateien, die zusammen einen aussagekräftigen Datensatz bilden
- Ein strukturiertes Objekt mit Daten in einem anderen Format, das Sie möglicherweise in ein spezielles Tool zur Verarbeitung laden möchten
- Bilder, die Daten erfassen
- Dateien mit Bezug zum maschinellen Lernen, z. B. trainierte Parameter oder Strukturdefinitionen für neuronale Netzwerke
- Alles, was für Sie wie ein Datensatz aussieht“
Google hat die obige Dokumentation im Jahr 2022 aktualisiert und umgeleitet zur neuen Suchzentraldokumentation.
Die aktualisierte Dokumentation macht deutlich, dass Google auf die strukturierten Daten angewiesen ist, um CSV-Dateien in ihrem Datensatzsuchauftritt zu verwenden.
Aber bedeutet diese Änderung, dass Google irgendwann CSV-Dateien crawlen und diese für Suchauftritte verwenden wird (zusätzlich zu tabellarischen Daten, die in strukturierten Daten notiert sind)?
Dies erklärt die aktuelle Dokumentation heute:
„Datensätze sind leichter zu finden, wenn Sie unterstützende Informationen wie Name, Beschreibung, Ersteller und Verteilungsformate als strukturierte Daten bereitstellen.
Googles Ansatz zur Datensatzentdeckung nutzt schema.org und andere Metadatenstandards, die Seiten hinzugefügt werden können, die Datensätze beschreiben…
Hier sind einige Beispiele dafür, was sich als Datensatz qualifizieren kann:
Eine Tabelle oder eine CSV-Datei mit einigen Daten…“
Google Indexing CSV Im Zusammenhang mit dem letzten Update?
Die Definition eines Kernalgorithmus-Updates ist, wenn Google „signifikante“ und „umfassende Änderungen“ an seinem Kernalgorithmus vornimmt.
Es kann ein Zufall sein, dass die Indizierung von CSV-Dateien und die Aktualisierung des Kernalgorithmus praktisch gleichzeitig stattfanden.
Aber es kann sich lohnen zu überlegen, ob Google seine Crawling-Engine verbessert hat, um CSV indizieren zu können, oder ob diese Funktion bereits vorhanden war.
Lesen Sie die aktualisierte Liste indizierbarer Dateitypen:
Von Google indizierbare Dateitypen
Lesen Sie die Dokumentation zu Google Search Central Dataset:
Datensatz (Datensatz, Datenkatalog, DataDownload) strukturierte Daten
Ausgewähltes Bild von Shutterstock/Jane Kelly