Skip to main content

Crawling Budget und 404 vs. 410

  • SEO-Küche Logo


PDF herunterladen

404 Fehler Zum Wochenstart eine kleine Auffrischung in Sachen Crawling Budget und 404 vs. 410. Nicht die spannendste Schlagzeile (im Gegensatz zu Panda 4.0 in der letzten Woche) aber eine häufige Quelle für SEO-Fehler, die eigentlich sehr einfach ausgemerzt werden können.

Um was geht es? Um das Crawling Budget und dessen Verbindung mit 404 bzw. 410 Fehlercodes.

Das Crawling Budget
Googles Crawler indexieren alle deine Unterseiten – aber nicht alle Unterseiten sofort. Jede Domain bekommt, je nach PageRank, ein Crawling-Budget zugewiesen. Dieses legt fest, wie viele Unterseiten gecrawlt werden. Seiten mit einem hohem PageRank bekommen mehr Budget zugewiesen. Wichtig: Das Crawling-Budget ist nicht gleich dem Index-Budget. Dieses legt fest, wie viele Seiten indexiert werden können. Logisch ist das Index-Budget dem Crawling-Budget nachgestellt: erst wird gecrawlt, dann indexiert.

Bildlich gesprochen: Im Internetland gibt es viele viele Häuser (= Domains). Google entsendet Inspekteure (= Crawler) in diese Häuser um die einzelnen Zimmer (= Unterseiten) anzuschauen und zu indexieren. Die Inspekteure gehen aber nicht wahllos von Haus zu Haus, sondern bevorzugen die bekannten, tollen Häuser (= Seiten mit einem hohem PageRank). Weniger schöne Häuser bekommen auch weniger Besuch von den Inspekteuren und diese haben dann auch weniger Zeit alle Zimmer anzuschauen (= Crawling Budget). Und es ist natürlich unschön, wenn ein Inspekteur einen Raum anschauen will, dort aber nichts zu finden ist (= 404-Fehler). Seine Zeit hätte er auch für Räume benutzen können, in denen etwas steht. Steht an der Tür aber so etwas wie „Hier ist nichts drin“ (= 410-Code), wird der Inspekteur direkt zur nächsten Türe gehen ohne seine Zeit zu verschwenden.

410-Code und weitere Möglichkeiten Budget zu sparen.
Ok, genug der Bildsprache. Hat eine Domain eine 404-Fehlerseite, ist das einfach ärgerlich. Bleibt dieser 404-Code bestehen, wird der Crawler immer wieder auf die Seite kommen um nachzuschauen ob sich etwas auf der Seite geändert hat. Weiß man aber, dass die Seite permanent leer bleiben wird, dann zeichnet man die Seite mit einem 410-Code aus. In Zukunft wird sich der Crawler also nicht mehr die Mühe machen, diese Seite anzuschauen – sondern seine Zeit für tatsächlich existierende Seiten aufbrauchen.

Um das Crawling-Budget effektiv einzusetzen, ist es ratsam, unwichtige Seiten wie Kontaktformulare, das Impressum (meines Erachtens) etc. mit Hilfe der robots.txt auszuschließen. Seiten die unbedingt gecrawlt werden sollen, verlinkt man intern stark und versucht für diese, Backlinks zu generieren.

Welche Seiten gecrawlt werden sollen und welche eher nicht, ist von der Art der Webseite abhängig: Im B2B-Bereich ist das Impressum häufig gut besucht, ebenso wie Kontaktformulare: Eine Sperrung mit robots.txt wäre hier nicht sinnvoll, da diese Seiten häufig Leads generieren. Ein Online-Shop hingegen, hat andere URLs als das Impressum, mit denen er Konversionen erzielt: hier würde es Sinn machen, das Impressum einfach im Footer zu verlinken, aber ansonsten zu sperren.

Eine ordentliche XML-Sitemap, in der die wichtigsten Seiten ausgezeichnet werden sowie eine möglichst flache Seitenarchitektur helfen dem Crawler, sich schneller zurecht zu finden. Bleibt die eigene Seite dauerhaft konstant, wird also nicht regelmäßig neuer Content eingestellt, Stichwort “Freshness Update”, reduziert Google den Besuch von Crawlern auf der Seite.

P.S.: Es gibt Hinweise darauf, dass der Google Browser Chrome tatsächlich ein Google Crawler-Bot ist. Ein Hinweis findet ihr hier, einen anderen hier. Ich werde mal schauen, was da dran ist und halte euch auf dem Laufenden…

Kommentare

Servus Tilmann,

danke für deinen interessanten Beitrag. Insbesondere finde ich den Ansatz mit 410 statt 404 sehr interessant. Wo ich allerdings widersprechen muss ist der Punkt mit der Sperrung von Impressum, Kontaktformular, etc via robots.txt. Diese Seiten sind i.d.R. stark intern verlinkt und erhalten somit viel Linkjuice. Sperrt man diese nun über die robots.txt, kommt der Crawler dort natürlich immer noch hin, liest die Seiten aber nicht und folgt letztendlich auch nicht den dort befindlichen Links. Hierdurch wird Linkjuice verschwendet und auf das Crawlbudget hat es keinen Effekt.

Viele Grüße

Tobias

Tilmann Klosa

Servus Tobi,

danke für dein Kommentar. Du hast Recht, ich möchte aber einschränken: Ja, vor allem im B2B-Bereich sind Impressum o.ä. stark verlinkt und nützlich für die Kundenakquise. Bei Online-Shops mit mehreren hundert Artikeln, spielt das Impressum aber eine untergeordnete Rolle. Bei komplexeren Dienstleistungen, bspw. die Installation von Solarmodulen, spielt das Kontaktformular eine größere Rolle. Von daher kommt es auf die Art der Webseite und des Konversionsziel an, ob man Impressum/Kontakformular sperrt oder nicht.
Werde den Beitrag aber entsprechend anpassen, danke für den Hinweis!

Grüße
Tilmann


Hast du eine Frage oder Meinung zum Artikel? Schreib uns gerne etwas in die Kommentare.

Ihre E-Mail Adresse wird nicht veröffentlicht

Jetzt den SEO-Küche-Newsletter abonnieren

Ähnliche Beiträge

Keine Ideen für Content? So hilft Euch Datenanalyse weiter

  • christoph pawletko
  • von Christoph
  • 14.01.2022

4 Wege, wie Dir Datenanalyse helfen kann, neue Ideen zu entwickeln und Inhalte zu optimieren Wenn Eure Konkurrenten besser ranken als Ihr, gibt es dafür wahrscheinlich einen guten Grund. Datenanalysen lassen sich sehr gut nutzen, um diese Gründe herauszufinden und neue Content-Ideen zu entwickeln, mit denen Ihr die Lücke schließen […]

Prduktseite Google Tipps für Produktbeschreibungen

Darum ranken eure Produktseiten nicht

  • christoph pawletko
  • von Christoph
  • 07.01.2022

Eigenschaften sollten auf Produktseiten auch im Text auftauchen Produktseiten enthalten in der Regel ein Produktbilder und die wichtigsten Informationen zum Produkt. Damit das Produkt bei Google auch gefunden werden kann, sollten auch alle Produkteigenschaften im Produkttext vorkommen. Nur dann kann das Produkt auch für alle wichtigen Produkteigenschaften ranken. Ein gutes […]

Digitale Inhalte Richtlinie (EU) 2019/770

Richtlinie (EU) 2019/770 (Digitale-Inhalte-Richtlinie)

  • Händlerbund
  • von Haendlerbund
  • 23.12.2021

Diese Änderungen bringt die Digitale-Inhalte-Richtlinie 2022 Im neuen Jahr kommt es zu einigen rechtlichen Änderungen im Verbrauchsgüterkauf. Der Gesetzgeber muss sich dem technischen Fortschritt anpassen und so wird es spezielle Regeln für digitale Inhalte und digitale Dienstleistungen geben. Neben der Warenkaufrichtlinie und der Umsetzung der Omnibus-Richtlinie wird im neuen Jahr […]

Titelbild Google Abstrafung

Google Abstrafung: Algorithmus-Penalty oder manuelle Maßnahme? Was tun?

  • christoph pawletko
  • von Christoph
  • 17.12.2021

So erkennt ihr, warum eure Rankings abstürzen Oft werden stärkere Änderungen in den Google Rankings gleich als Google Penalty bzw. Abstrafung bezeichnet. In den meisten Fällen liegt jedoch kein direkter Eingriff seitens Googles vor, sondern lediglich eine normale Neubewertung durch den Google Algorithmus. Eine Google Abstrafung wegen schlechter Links oder […]

Nachhaltigkeit für klimaneutrale Website

CO2-neutrale Website: Unsere Website ist klimaneutral

  • christoph pawletko
  • von Christoph
  • 08.12.2021

Die SEO-Küche als Teil der Initiative CO2 neutrale Website Nachhaltigkeit wird in allen Bereichen immer wichtiger, auch im Online-Marketing. Auch das Internet an sich verbraucht CO2, denn jede Website wird irgendwo gespeichert, jeder Server und jeder Datentransfer verbraucht Strom. Die SEO-Küche bemüht sich in allen Bereichen nachhaltig zu arbeiten, daher […]

neue Gesetze im Onlinehandel 2022

Für Onlinehandel: Gesetzesänderungen ab 2022

  • Händlerbund
  • von Haendlerbund
  • 02.12.2021

Diese Gesetzesänderungen für den Verkauf mit Verbrauchern bringt das neue Jahr Der Jahreswechsel wird gerne genutzt, um ein paar neue Gesetze auf den Weg zu bringen. Mit der Umsetzung einiger EU-Richtlinien ändert sich gerade im B2C-Bereich im Jahr 2022 einiges. Neben Änderungen im Verpackungs- und Elektrogesetz, wird im Januar die […]