Skip to main content

Wayback Machine


PDF herunterladen

Was ist die Wayback Machine?

Die Wayback Machine ist ein Onlinedienst des Internet Archive, das dem Nutzer archivierte Versionen von Websites zur Ansicht zur Verfügung stellt. Das Archiv wurde 1996 als gemeinnütziges Projekt gegründet und beinhaltet mittlerweile neben den Inhalten der Wayback Machine (Start: 2001) auch weitere digitale Inhalte. Die Nutzung der Wayback Machine ist kostenfrei.

Geschichte der Wayback Machine

Die Wayback Machine begann bereits 1996 mit dem Speichern von Webseiten. 2001 wurde der Service dann veröffentlicht. Bis zu diesem Zeitpunkt hatte die Wayback Machine bereits 10 Milliarden Seiten archiviert. Der Name soll eine Anlehnung an die “WABAC machine” sein, eine fiktionale Zeitmaschine aus der Zeichentrickserie “The Rocky and Bullwinkle Show”. Ziel der Wayback Machine ist laut der Gründer Brewster Kahle und Bruce Gilliat die Archivierung des gesamten Internets und die damit verbundene Bereitstellung allen Wissens.

Wozu wird die Wayback Machine genutzt?

Vor allem Wissenschaftler aus den Bereichen Informationstechnologie, Bibliothekswissenschaften und Sozialwissenschaften profitieren bei Ihrer Forschung von den archivierten Daten der Wayback Machine. So wurden bereits unzählige wissenschaftliche Artikel über die Wayback Machine verfasst. Wissenschaftler können beispielsweise die Relevanz der Entwicklung von Websites für das Wachstum von Unternehmen analysieren.

Auch für Journalisten weltweit ist die Wayback Machine hilfreich bei der Untersuchung von Websiteinhalten und der Recherche nach alten Nachrichtenbeiträgen und Berichten. So wurden in der Vergangenheit beispielsweise Falschaussagen von Politikern aufgedeckt. Wikipedia Redakteure nutzen die Wayback Machine, um Quellen zu verifizieren.

Auch vor Gericht trugen die archivierten Webseiten der Wayback Machine schon in mehreren Fällen zur Aufklärung bei. Vor allem im Patentrecht können Zeitstempel aus dem Internetarchiv genutzt werden, um nachzuvollziehen, wann eine Website veröffentlicht wurde.

Seit Oktober 2019 können Nutzer nur noch fünf Anfragen pro Minute stellen.

Kritik an der Wayback Machine

Im Laufe der letzten Jahre sind das Internet Archive und die Wayback Machine immer wieder in die Kritik geraten. Bei dieser Kritik steht vor allem das Urheberrecht im Vordergrund. Die Wayback Machine nutzt ein Opt-Out-Verfahren beim Crawlen von Inhalten. Das bedeutet, dass zunächst alle Webseiten indexiert werden können. Webseitenbetreiber, die dies für ihre Website nicht möchten, müssen eine Entfernung aus dem Archiv beantragen. Vor allem nach deutschem Recht stellt das eine Verletzung des Urheberrechts dar. Die Archivierung stellt eine Art der Vervielfältigung dar, die nach deutschem Recht nur dem Urheber zusteht.

Zwar können Betreiber einer Website versuchen sich durch eine Konfiguration der robots.txt-Datei zu schützen, doch die Betreiber der Wayback Machine haben 2017 bekannt gegeben, dass der Crawler immer weniger Rücksicht auf die Konfigurationen in der robots.txt-Datei nehmen wird.

Die Wayback Machine und SEO

Die Wayback Machine kann für die Suchmaschinenoptimierung von Webseiten sehr hilfreich sein. Beispielsweise, wenn eine Website im Ranking abstürzt, kann die Wayback Machine die Ursachenforschung erleichtern. Der Code älterer Versionen der Website kann mit der aktuellen Version verglichen werden, um Schwachstellen ausfindig zu machen. Auch bei einer Abstrafung seitens Google können so mögliche Fehlerquellen identifiziert werden.

Im Linkmanagement kann das Archiv Betreibern von Webseiten und SEO Experten dabei helfen, fehlerhafte oder tote Links ausfindig zu machen. Viele fehlerhafte Links können das Ranking einer Website bei Google negativ beeinflussen. Im Falle von Duplicate Content lässt sich mithilfe der Wayback Machine nachweisen, dass bestimmte Inhalte schon zu einem früheren Zeitpunkt bestanden haben.

Jetzt den SEO-Küche-Newsletter abonnieren

Ähnliche Artikel

CSS

Was ist CSS? CSS ist die Abkürzung für Cascading Style Sheets, was sich am besten mit „gestufte Stilvorlagen“ übersetzen lässt. Dabei handelt es sich um ei-ne Gestaltungs- und Formatierungssprache, mit deren Hilfe sich das optische Erscheinungsbild elektronischer Dokumente (z. B. HTML-Websites) bestimmen lässt. Anhand einfacher Anweisungen im Quelltext ist es so möglich, gestalterische Elemente wie das Layout, die […]

Google Groups

Was ist Google Groups? Google Groups ist ein kostenloser Dienst von „Google Inc.“, welcher einen kombinierten Zugang zu Usenet, Diskussionsforen und Social Communitys ermöglicht. Durch den Online-Dienst können Internetforen durchsucht sowie eigene „Groups“ (deutsch = Gruppen) erstellt werden. Geschichte von Google Groups Google Groups wurde 2001 im Rahmen einer Übernahme […]

Entitäten

Was ist eine Entität? Der von dem lateinischen Wort „ens“ (deutsch: „Ding“ oder „Seiendes“) abgeleitete Begriff Entität findet sich in der Philosophie, Informatik und Semantik. Er beschreibt ein Objekt, das sich eindeutig identifizieren lässt und Informationen beinhaltet. Entitäten können sowohl in der realen Welt existierende Dinge (auch „Benannte Entitäten“ genannt) […]

Datenbank

Was ist eine Datenbank? Eine Datenbank ist ein elektronisches System, in dem sich größere Datenmengen zentral speichern lassen. Ein Datenbanksystem (DBS) setzt sich aus zwei Teilen zusammen: einem Datenbankmanagementsystem (DMBS) und der Datenbank (DB) im eigentlichen Sinne, in der die Menge der zu verwaltenden Daten (auch Datenbasis genannt) gespeichert ist. Heute verwenden nahezu alle IT-Anwendungen wie ERP-, CRM- und Warenwirtschafts-Systeme, aber auch Suchmaschinen […]

Google Alerts

Was ist Google Alerts? Google Alerts ist ein seit 2014 existierender kostenloser Dienst der Suchmaschine Google. Jeder Nutzer kann Benachrichtigungen für beliebige Keywords oder Begriffe einrichten und Google benachrichtigt per E-Mail oder über seinen RSS-Feed, wenn die Suchmaschine einen passenden neuen Eintrag in ihrer Ergebnisliste findet. Alerts informieren Benutzer automatisch, […]

Release Management

Release Management einfach und verständlich erklärt Der Begriff Release Management beschreibt die Planung, Umsetzung und das Controlling von Softwareentwicklungsprozessen und der angewendeten IT-Infrastruktur. Release Management – Definition Durch das Release Management wird es möglich, einen Überblick über den gesamten Entwicklungsprozess von Softwares, Web-Anwendungen und deren Updates sicherzustellen. Das Release Management […]