Ihr habt die Möglichkeit, URLs bei Google zu löschen, wenn diese ungewollt indexiert wurden. Man kann über die Google Search Console mit wenigen Klicks festlegen, welche Seiten im Index erscheinen sollen und welche nicht.
Wir zeigen Euch, wie Ihr eine Seite aus dem Google-Index löschen könnt und worauf Ihr dabei achten solltet.
Was ist der Google-Index?
Der Google-Index ist ein geordnetes Verzeichnis, das alle von Google gecrawlten (erkannten) und indexierten (gespeicherten) URLs von verschiedenen Webseiten enthält. Auf den Suchergebnisseiten (SERP) der Suchmaschine Google befinden sich demnach nur URLs, die mithilfe des Crawlers indexiert und somit im Google-Index aufgenommen wurden.
Beim Google-Index handelt es sich um ein dynamisches Verzeichnis, das stets neue URLs aufnimmt und andere entfernt. Gleiches gilt auch für andere Suchmaschinen wie Bing, wobei die Suchmaschine eigene Webmaster-Tools besitzt.
Welche Seiten Eurer Webseite indexiert sind, könnt Ihr über die Google-Suche durch die Eingabe der Suchabfrage „site:https://domain.de“ und Eurem Domainnamen herausfinden. Sucht Ihr eine bestimmte URL, müsst Ihr einfach die gewünschte URL anhängen: site:https://domain.de/url.
Was versteht man unter Indexierung?
Mithilfe des Crawlers, auch als Bots bezeichnet, fügt Google URLs seinem Index hinzu. Dabei liest der Crawler den Quellcode einer Webseite aus, wobei er von Link zu Link springt, um somit miteinander verlinkte Seiten zu erkennen. Jede neu entdeckte Seite bzw. URL wird dann gecrawlt und an den Index gesendet. Anhand verschiedener Rankingfaktoren wird die besagte URL dann im Index bewertet und einsortiert. Die Indexierung unternehmen Crawler automatisch, doch man kann als Webseitenbetreiber Google auch manuell anweisen, eine URL im Index aufzunehmen oder einen Link bei Google zu löschen.
Um die Indexierung selbst zu veranlassen, hat man drei Möglichkeiten:
- Unter http://www.google.de/addurl/ könnt Ihr einen Antrag auf Indexierung für Eure Webseite oder eine URL Eurer Webseite stellen. Die Aufnahme ist aber nicht garantiert.
- Die Google Search Console nutzen, um eine XML-Sitemap bei Google einzureichen. Was eine Sitemap ist und wie man eine erstellt, könnt Ihr im Artikel „Wie wichtig ist eine Sitemap?“ nachlesen. Google crawlt dann die enthaltenden URLs.
- In der Google Search Console mit der Funktion „Crawling“ und anschließend „Abruf wie durch Google“ eine einzelne URL im Index aufnehmen lassen.
Wann und wie kann man eine Indexierung verhindern?
Eine Indexierung kann man auch verhindern, wodurch die Seite weder im Index noch in den SERPs der Suchmaschine erscheint. Dies ist sinnvoll, wenn man eine Webseite noch nicht fertiggestellt hat oder sie relauncht wird. Außerdem möchte man nicht immer alle Seiten der Öffentlichkeit zugänglich machen. Unter anderem kann es aber auch urheber- oder/und datenschutzrechtliche Gründe dafür geben, die Seite nicht im Index aufzunehmen.
Die Indexierung kann verhindert werden, indem
- man dem Crawler mit dem Meta-Tag „noindex“ den Befehl dazu gibt: <meta name=“robots“ content=“noindex“/>. Wie das genau funktioniert, zeigen wir Euch im unteren Abschnitt des Beitrags.
- man Crawler mit der txt ausschließt: User-agent: *und Disallow: / oder Disallow: /unterordner1 für Unterordner.
- man Crawler per .htaccess von der Indexierung abhält.
Wann wird eine URL aus dem Google-Index entfernt?
Durch den Meta-Tag „noindex“, per .htaccess oder mit robots.txt kann der Crawler von der Indexierung abgehalten werden. Andernfalls kann man eine bereits indexierte URL auch manuell über die Google Search Console entfernen.
Verstößt eine Webseite oder URL jedoch gegen die Google-Richtlinien, wird die URL aus dem Index gelöscht. Auch bei einer permanenten Weiterleitung im Sinne eines 301-Redirects wird die alte URL gelöscht und mit der neuen URL ersetzt. Nur bei einer temporären 302-Weiterleitung wird die alte URL beibehalten und der User kurzzeitig auf eine neue URL umgeleitet.
URL aus dem Google-Index löschen
Um eine spezifische URL von Eurer Webseite aus dem Google-Index zu entfernen, habt Ihr im Grunde genommen zwei verschiedene Möglichkeiten:
- Entfernung der URL mithilfe der Google Search Console (früher Webmaster Tool).
- Verhinderung der Indexierung durch den Meta-Tag „noindex“
Wie kann man mit der Search Console eine Seite aus dem Google-Index entfernen?
Google stellt einige Tools bereit, um eine URL schnell aus den Suchergebnissen zu entfernen. Möchte man jedoch über die Search Console den Link bei Google löschen, muss man Besitzer der Webseite sein und ein Google-Konto besitzen. Anschließend kann man mithilfe des Tools die URL aus dem Google-Index entfernen.
Mit dem URL-Removal Tool macht es Google Webseitenbesitzer einfach, die beliebige URL entfernen zu lassen. Unter dem Menüpunkt Google Index gibt es verschiedene Optionen für die Indexierung. Im Bereich Indexierungsstatus wird die Anzahl der indexierten Seiten sowie die durch robots.txt geblockten URLs angezeigt.
Search Console: URL entfernen
Unter URLs entfernen, können die gewünschten Links bei Google gelöscht werden. Dadurch werden die URLs aber nicht dauerhaft aus dem Index gelöscht, sondern nur vorübergehend für 90 Tage. Anschließend auf den Button „vorübergehend ausblenden“ klicken.
Im leeren Feld müsst Ihr die URL eintragen, die Ihr löschen möchtet, und durch Anklicken von „Weiter“ den Vorgang bestätigen.
Wer hingegen die Inhalte permanent löschen möchte, sollte die Links und Seiten auch auf der eigenen Webseite löschen oder den HTTP-Code 404 oder 410 nutzen.
Sobald Google die Anfrage auf Löschung durchgeführt hat, werdet Ihr als Webseitenbetreiber unter „Status“ informiert, ob die Entfernung erfolgreich war. Andernfalls kann man auch über die site-Abfrage, die oben erläutert wurde, den Indexierungsstatus prüfen.
Indexierung mithilfe des Meta-Tags NOINDEX verhindern
Eine weitere Möglichkeit, die Indexierung zu verhindern, ist die Nutzung des Meta-Tags „NOINDEX“. Hierfür muss man dem Quellcode der Webseite, das Meta-Element Robots mit dem Wert „noindex“ hinzufügen. Fügt hierfür die folgenden Zeilen ein, um die URL bei Google zu löschen:
Diese Zeile muss im <head> eingefügt werden. Es kann passieren, dass die Seite bereits über den Wert INDEX verfügt; diesen könnt Ihr dann in NOINDEX ändern. Bei dieser Variante wird durch das Setzen von NOINDEX auch in der Suchmaschine Bing die URL entfernt.
Häufig gestellte Fragen
Weiterführende Informationen & Quellen
- Flyeralarm weist nochmals darauf hin, dass man mithilfe einer Gegenprüfung über einen entsprechenden Suchbefehl wie „site:http://beispiel.de/entfernte-url“ prüfen kann, ob Google die URL tatsächlich entfernt hat.
- Wer hingegen Inhalte aus der Google-Suche entfernen möchte, sollte sich den Beitrag von Ahrefs durchlesen, denn hier werden 5 Methoden vorgestellt, wie man als Seiteninhaber und Nicht-Seiteninhaber Inhalte löschen kann.
- Sistrix warnt Nutzer nochmals davor, dass URLs zwar für 90 Tage garantiert entfernt werden, aber sie danach erneut aufgenommen werden könnten, wenn sie noch aufrufbar sind.
- Die Google-Search-Console-Hilfe beinhaltet zusätzlich Tipps und Hinweise zum Entfernen von Inhalten und stellt hierfür ein praktisches Tool bereit. Mit diesem Werkzeug könnt Ihr URLs von Webseiten entfernen, deren Inhaber Ihr seid.
- Ferner sollte Euch sowohl das Video mit einer Anleitung zum Indexierungsstatus einer URL als auch das Erklärvideo für das Tool zum Entfernen der URLs weiterhelfen.