Die Google-Suchkonsole warnt Publisher vor 404-Fehlern: 404 und Soft 404 .
Obwohl sie beide 404 heißen, sind sie sehr unterschiedlich.
Folglich ist es wichtig, den Unterschied zwischen den Fehlern zu verstehen, um sie zu beheben.
HTTP-Statuscodes
Eine Webseite, auf die von einem Browser zugegriffen wird, antwortet mit einem Statuscode, der angibt, ob die Anfrage erfolgreich war und falls nicht, warum nicht.
Diese Antworten werden mit sogenannten HTTP-Antwortcodes kommuniziert, aber offiziell heißen sie HTTP-Statuscodes.
Ein Server stellt fünf Kategorien von Antwortcodes bereit; In diesem Artikel geht es speziell um eine Antwort, den Statuscode 404-Seite nicht gefunden.
Contents
Die Bedeutung eines 404-Antwortcodes
Alle Codes innerhalb der 4xx-Antwortserie bedeuten, dass die Anfrage nicht gefunden werden konnte erfüllt sein, da die Seite nicht gefunden wurde.
Die offizielle Definition lautet:
4xx (Client-Fehler): Die Anfrage enthält eine schlechte Syntax oder kann nicht erfüllt werden
Die 404-Antwort ist mehrdeutig, ob die Webseite möglicherweise zurückkehrt.
Beispiele für die Ursache von 404 Seite nicht gefunden passiert
- Wenn jemand versehentlich eine Webseite löscht, antwortet der Server mit der 404-Antwort „Seite nicht gefunden“.
- Wenn jemand auf eine nicht vorhandene Webseite verlinkt, wird die Server antwortet, dass die Seite nicht gefunden wurde (404).
Die offizielle Dokumentation ist eindeutig in Bezug auf die Mehrdeutigkeit, ob eine Seite vorübergehend oder dauerhaft verschwunden ist:
“Der Statuscode 404 (Not Found) zeigt an, dass der Ursprungsserver keine aktuelle Darstellung für gefunden hat die Zielressource ist oder nicht bereit ist, offenzulegen, dass eine existiert.
Ein 404-Statuscode gibt nicht an, ob dieser Mangel an Repräsentation vorübergehend oder dauerhaft ist…”
Zusammenfassend bedeutet der 404-Seite-nicht-gefunden-Code, dass bei der Browseranforderung ein Fehler aufgetreten ist, weil die angeforderte Seite nicht gefunden werden konnte.
Was ist ein Soft-404-Fehler?
Ein Soft Der Fehler 404 ist kein offizieller Statuscode. Der Server sendet keine Soft 404-Antwort an einen Browser, da es so etwas wie einen Soft 404-Statuscode nicht gibt.
Soft 404 beschreibt eine Situation, in der der Server eine Webseite präsentiert und mit einem 200 OK-Status antwortet Code, der den Erfolg anzeigt, wenn die Webseite oder der Inhalt tatsächlich fehlt.
Vier häufige Gründe für einen Soft 404
Eine Webseite fehlt und ein Server sendet den Status 200 OK.
Diese Art von Soft 404 tritt auf, wenn eine Seite fehlt, aber die Serverkonfiguration die fehlende Seite auf die Homepage oder a umleitet benutzerdefinierte URL.
Die Seite ist weg, aber der Publisher hat etwas unternommen, um die Anfrage für die fehlende Seite zu erfüllen.
Der Inhalt fehlt oder ist „dünn.“
Wenn Inhalt vollständig fehlt oder nur sehr wenig davon vorhanden ist (auch bekannt als dünner Inhalt), antwortet der Server mit einem 200-Statuscode, was bedeutet, dass die Anforderung für die Seite erfolgreich war.
Aber für die Indexierung Webseiten, die keine erfolgreichen Webseitenanfragen sind, bezeichnen Suchmaschinen als weiche 404-Fehler.
Die fehlende Seite leitet auf die Homepage weiter.
Einige glauben fälschlicherweise, dass mit einer 404-Fehlerantwort etwas nicht stimmt.
Um die 404-Fehlerantworten zu stoppen, kann ein Publisher die fehlende Seite also weiterleiten die Homepage, obwohl die Homepage nicht die angeforderte ist.
Google bezeichnet diese fehlgeschlagenen Seitenanforderungen als Soft 404s.
Fehlende Seite, die auf eine benutzerdefinierte Webseite umgeleitet wird.
Manchmal leiten fehlende Seiten zu einer maßgeschneiderten Webseite weiter, die einen 200-Statuscode bereitstellt, was dazu führt, dass Google diese Seiten als weiche 404-Fehler kennzeichnet.
Who Invented The Phrase Soft 404?
Das Konzept eines Soft 404 stammt möglicherweise aus einer Forschungsarbeit aus dem Jahr 2004 mit dem Titel Towards an Understanding of the Web’s Decay (PDF).
Die fehlenden Seiten, die unsachgemäß ersetzt werden, stellen ein Problem für Suchmaschinen dar, die versuchen, echte Seiten zu indizieren.
So umrahmt die Forschungsarbeit weiche 404-Fehler:
“ Gemäß dem HTTP-Protokoll soll der Server einen Fehlercode zurückgeben, wenn an einen Server eine Seite angefordert wird, die nicht mehr verfügbar ist , keinen 404-Code zurückgeben – stattdessen geben die Server eine Ersatzseite und einen OK-Code (200) zurück.
…Unsere Studie zeigt, dass diese Art von Substitutionen, die als „Soft-404s” machen mehr als 15 % der toten Links aus.“
Soft 404 aufgrund von Codierungsfehlern
Es gibt Fälle, in denen die Seite nicht fehlt, sondern spezifisch ist Probleme (z. B. Codierungsfehler) haben Google veranlasst, sie als fehlende Seite zu kategorisieren.
Soft 404-Fehler müssen unbedingt untersucht werden, da sie fehlerhaften Code signalisieren könnten.
Typische Codierungsprobleme:
- Fehlende Datei oder fehlender Include, der eine Webseite mit Inhalt füllen soll.
- Datenbankfehler.
- Fehlendes JavaScript.
- Leere Suchergebnisseiten.</li
404-Fehler haben zwei Hauptursachen
- Ein Fehler im Link leitet Benutzer auf eine Seite weiter, die nicht existiert.
- Ein Link zu eine Seite, die früher existierte, aber plötzlich verschwunden ist.
Linking Error
Wenn die Ursache für den 404 ein Linking Error ist, müssen Sie die Links korrigieren.
Der knifflige Teil dieser Aufgabe besteht darin, alle defekten Links auf einer Website zu finden. Es kann eine größere Herausforderung sein, große komplexe Websites mit Tausenden oder Millionen von Seiten zu crawlen.
In Fällen wie diesen sind Crawling-Tools praktisch.
Sie haben so viele Website-Crawler-Softwareoptionen zur Auswahl: das kostenlose Xenu und Greenflare; oder kostenpflichtige Software wie Screaming Frog, DeepCrawl, Botify, Sitebulb und OnCrawl, von denen einige kostenlose Testversionen oder kostenlose, aber eingeschränkte Funktionsversionen haben.
Eine Seite, die nicht mehr existiert
Wenn eine Seite nicht mehr existiert, haben Sie zwei Möglichkeiten:
- Stellen Sie die Seite wieder her, wenn sie versehentlich entfernt wurde.
- 301-Weiterleitung auf die nächste verwandte Seite, falls die Entfernung war Absicht.
Zunächst müssen Sie alle Verlinkungsfehler auf der Seite lokalisieren. Ähnlich wie bei der Suche nach allen Fehlern bei der Verlinkung einer großen Website können Sie Crawling-Tools verwenden.
Crawling-Tools finden jedoch möglicherweise keine verwaisten Seiten: Seiten, die nicht von irgendwo innerhalb der Navigationslinks oder von einer der Seiten verlinkt sind.
Verwaiste Seiten können existieren, wenn sie früher Teil der Website waren, dann später B. einer Website-Neugestaltung, verschwindet der Link zu dieser alten Seite, aber externe Links von anderen Websites können immer noch auf sie verweisen.
Um zu überprüfen, ob diese Art von Seiten auf Ihrer Website vorhanden sind, können Sie verwenden verschiedene Tools.
So identifizieren Sie 404-Antwortseiten
Google Search Console-Berichte
Der Abdeckungsbericht listet 404-Fehler-URLs auf einer Website auf.
Screenshot von der Google Search Console, August 2022
Die Search Console wird 404-Seiten melden, während Google alle Seiten durchsucht, die es finden kann. Dies kann Links von anderen Websites zu einer Seite beinhalten, die früher auf Ihrer Website vorhanden war.
Google Analytics
In Google Analytics finden Sie standardmäßig keinen Bericht zu fehlenden Seiten. Sie können sie jedoch auf unterschiedliche Weise nachverfolgen.
Zum einen können Sie einen benutzerdefinierten Bericht erstellen und Seiten mit einem Seitentitel segmentieren, der Error 404 – Seite nicht gefunden.
Eine andere Möglichkeit, verwaiste Seiten in Google Analytics zu finden, besteht darin, benutzerdefinierte Inhaltsgruppierungen zu erstellen und alle 404-Seiten einer Inhaltsgruppe zuzuweisen.
Website: Betreiber Suchbefehl
Man kann den site: Suchbefehl nicht verwenden, um 404-Fehler zu finden, da Google 404-Webseiten oder Soft-404-Webseiten nicht indiziert.
Website von Google: Der Suchoperator ist nützlich, um Webseiten auf einer Website zu finden, die eine bestimmte Schlüsselwortphrase im Inhalt der Webseiten enthalten.
Die Suchkonsole von Google ist die beste Quelle zum Identifizieren einer Liste von Soft 404-Fehler und reguläre 404-Fehler.
Die Website-Traffic-Fehlerprotokolle sind eine nützliche Quelle für die Identifizierung von 404-Fehlerantworten.
Andere Backlink-Recherche-Tools
Backlink-Recherche-Tools wie Majestic, Ahrefs, Moz Open Site Explorer, Sistrix, Semrush, LinkResearchTools und CognitiveSEO können ebenfalls hilfreich sein.
Die meisten dieser Tools exportieren eine Liste von Backlinks, die auf Ihre Domain verlinken. Von dort aus können Sie alle verlinkten Seiten überprüfen und nach 404-Fehlern suchen.
So beheben Sie weiche 404-Fehler
Crawling-Tools erkennen keine weichen 404-Fehler, da es sich nicht um einen handelt 404 Fehler. Aber Sie können Crawling-Tools verwenden, um etwas anderes zu finden.
Hier sind einige Dinge zu finden:
- Thin Content: Einige Crawling-Tools melden Seiten mit dünnem Inhalt und einer sortierbaren Wortanzahl. Beginnen Sie mit Seiten mit den wenigsten Wörtern, um zu beurteilen, ob die Seite dünnen Inhalt hat.
- Duplicate Content: Einige Crawling-Tools sind ausgeklügelt genug, um zu erkennen, welcher Prozentsatz der Seite Vorlageninhalte sind. Und es gibt auch Tools, die speziell zum Auffinden interner doppelter Inhalte wie SiteLiner entwickelt wurden. Wenn der Hauptinhalt fast identisch mit vielen anderen Seiten ist, sollten Sie sich diese Seiten ansehen und feststellen, warum doppelter Inhalt auf Ihrer Website vorhanden ist.
Neben den Crawling-Tools können Sie auch verwenden Google Search Console und überprüfen Sie unter Crawling-Fehler, um Seiten zu finden, die unter Soft 404-Fehlern aufgeführt sind.
Wenn Sie eine ganze Website durchsuchen, um Probleme zu finden, die Soft 404-Fehler verursachen, können Sie Probleme lokalisieren und beheben, bevor Google sie erkennt.
Nachdem Sie diese Soft 404-Probleme erkannt haben, müssen Sie sie beheben.
Meistens scheinen die Lösungen gesunder Menschenverstand zu sein. Dies kann einfache Dinge wie das Erweitern von Seiten mit dünnem Inhalt oder das Ersetzen doppelter Inhalte durch neue und einzigartige Inhalte umfassen.
Während dieses Prozesses sind einige Dinge zu beachten:
Seiten konsolidieren
Manchmal werden dünne Inhalte dadurch verursacht, dass das Seitenthema zu spezifisch ist, sodass Sie wenig zu sagen haben.
Das Zusammenführen mehrerer dünner Seiten zu einer Seite kann dazu führen besser geeignet, wenn die Themen verwandt sind. Dies löst nicht nur Probleme mit dünnen Inhalten, sondern kann auch Probleme mit doppelten Inhalten beheben.
Beispielsweise kann eine E-Commerce-Website, die Schuhe in verschiedenen Farben und Größen verkauft, für jede Größen- und Farbkombination eine andere URL haben. Dies hinterlässt eine große Anzahl von Seiten mit dünnem und relativ identischem Inhalt.
Der effektivere Ansatz besteht darin, dies alles stattdessen auf einer Seite zusammenzufassen und die verfügbaren Optionen aufzuzählen.
<Finden Sie technische Probleme, die doppelte Inhalte verursachen
Selbst mit dem einfachsten Web-Crawling-Tool wie Xenu (das keine Inhalte, sondern nur URLs, Antwortcodes und Titel-Tags betrachtet) können Sie immer noch Probleme mit doppelten Inhalten finden, indem Sie sich URLs ansehen.
Dies umfasst www- und nicht-www-URLs, HTTP und HTTPS, mit index.html und ohne, mit Tracking-Parametern und ohne usw.
404-Fehler und weiche 404-Fehler
Die meisten Wichtig bei 404-Fehlern ist, dass es nichts zu beheben gibt, wenn die Seiten wirklich fehlen. Es ist in Ordnung, eine 404-Antwort für Anfragen nach Seiten anzuzeigen, die nicht existieren.
Aber wenn die Seiten existieren, aber unter einer anderen URL, dann können Sie das beheben, indem Sie einen defekten Link auf die umleiten tatsächliche URL, Wiederherstellen einer fehlenden Seite oder Umleiten der alten URL auf eine neue Seite, die sie ersetzt hat.
Ein Soft 404 ist immer das Ergebnis eines Problems, das diagnostiziert und behoben werden muss.
Das Verständnis des Unterschieds zwischen den 404-Fehlern ist unerlässlich, um eine Website mit Spitzenleistung zu betreiben.
Vorgestelltes Bild: Paulo Bobita/Search Engine Journal