Was ist URL-Hijacking?
URL-Hijacking beschreibt die Situation, dass eine Website nicht direkt, sondern mithilfe einer Weiterleitung (Redirect) verlinkt wird. Das kann bei Suchergebnisseiten wiederum dazu führen, dass statt der Zielseite die Weiterleitungsseite angezeigt wird. Die eigentliche Zielseite wurde dabei aus dem Suchmaschinenindex entfernt und kann dementsprechend nicht mehr in den Suchergebnissen angezeigt werden.
Beispiel für URL-Hijacking
Die Seite www.beispiel.de wird von einer Unterseite des Verzeichnisses www.verzeichnis.de verlinkt, aber nicht wie üblich über den HTML Tag ᐸaᐳ, sondern mittels Weiterleitung. Das sieht folgendermaßen aus:
www.verzeichnis.de/redirect.php?target=www.beispiel.de
Dabei kann es passieren, dass in den Suchergebnissen nicht www.beispiel.de erscheint, sondern eben die Seite mit der Weiterleitung, also: www.verzeichnis.de/redirect.php?target=www.beispiel.de. Die Suchmaschine sieht beide Seiten – die “Verzeichnis-Seite” und die “Beispiel-Seite” – als identisch an und führt daher nur eine der beiden in den Suchergebnissen auf, im schlechtesten Fall den Redirect.
Das kommt besonders häufig bei Webkatalogen vor, welche die Ziel-URL oft per PHP dynamisch einbinden. Über diese “Zwischenseite” können z.B. Klickdaten für statistische Zwecke gespeichert werden.
Ursachen: 301 und 302 – permanente und temporäre Weiterleitungen
Eine Weiterleitung ist über verschiedene Wege möglich. Dafür gibt es konkrete HTTP Status Codes, nämlich 302 und 301:
Eine 301-Weiterleitung ist eine permanente Weiterleitung.
Mit 302 werden Seiten temporär umgeleitet. PHP-Skripte erzeugen oft eine Umleitung mit 302.
Permanente Weiterleitungen werden z.B. bei URL-Tippfehlern gesetzt, um den User auf die richtige Hauptseite zu führen oder wenn z.B. durch einen Relaunch Teile der Seite einen neuen Dateinamen bekommen haben. Temporäre Weiterleitungen werden dann genutzt, wenn die gesuchte Seite nur vorübergehend über eine andere Adresse erreichbar sein soll.
Da sich die Suchmaschinencrawler an diesen Standards orientieren, indexieren sie bei 302 die erste Adresse, auch wenn diese auf eine andere Seite weiterleitet. Sie können nicht erkennen, um welchen Seitentyp es sich handelt, z.B. einen Webkatalog, von dem aus auf einen Shop verlinkt wird. Denn die Suchmaschine “schlussfolgert” nur: 302 = temporär. Heißt also: Die Seite, auf die verlinkt wird, wird ohnehin nur kurz bestehen und die erste Seite wird bald wieder normal erreichbar sein.
Hijacking erkennen
Ob eine Seite “entführt” wurde, ist z.B. folgendermaßen erkennbar:
Siteabfrage: site:meine-seite.de – hier taucht die Hijacking-Seite statt der eigenen Website auf
Cacheabfrage: cache:http://www.meine-domain.de – statt den eigenen Domainnamen zu finden, steht hier die Hijacking-Seite
Die meisten Fälle von Hijacking basieren auf Unkenntnis von Webmastern und geschehen daher auch nicht mit Absicht. Es ist aber auch möglich, die Weiterleitung missbräuchlich zu verwenden, um die eigene Seite in den SERPs nach vorn zu bringen. Dies fällt unter Black Hat SEO und gilt als kriminelle Handlung.
Folgen des URL-Hijacking
Wenn Webseite A auf Webseite B per 302 umleitet und die Suchmaschine dennoch B zu A zuordnet, dann übernimmt/”entführt” Seite A das Ranking von Seite B, steht also anstelle der üblichen Suchergebnis-Position von B. Eine Seite, die nicht mehr in den Suchergebnissen erscheint, wird natürlich nicht mehr angeklickt, sodass es zu einem Besuchereinbruch kommt.
Maßnahmen nach einer “URL-Entführung”
Um das Problem zu lösen, müssen Sie entweder den Webmaster, der den Redirect gesetzt hat, oder die Suchmaschine kontaktieren. Denn Ihre URL verschwindet (wird entführt) aus dem Datenbestand der Suchmaschinen und somit auch aus den Suchergebnissen.
Für dauerhafte Umleitungen sollten Sie immer den 301-Redirect wählen. Dieser ist auf jeden Fall deutlich weniger anfällig für den Hijacking-Effekt. Sollte sich das Umleitungsziel aber bei jedem Aufruf ändern, ist eine 302-Umleitung sinnvoll.
Falls Inhalte doch über einen längeren Zeitraum per 302-Redirect weitergeleitet werden sollen, können Sie das Script auch für den Crawler sperren und damit das Hijacking ausschließen.