Skip to main content

Wayback Machine


PDF herunterladen

Was ist die Wayback Machine?

Die Wayback Machine ist ein Onlinedienst des Internet Archive, das dem Nutzer archivierte Versionen von Websites zur Ansicht zur Verfügung stellt. Das Archiv wurde 1996 als gemeinnütziges Projekt gegründet und beinhaltet mittlerweile neben den Inhalten der Wayback Machine (Start: 2001) auch weitere digitale Inhalte. Die Nutzung der Wayback Machine ist kostenfrei.

Geschichte der Wayback Machine

Die Wayback Machine begann bereits 1996 mit dem Speichern von Webseiten. 2001 wurde der Service dann veröffentlicht. Bis zu diesem Zeitpunkt hatte die Wayback Machine bereits 10 Milliarden Seiten archiviert. Der Name soll eine Anlehnung an die “WABAC machine” sein, eine fiktionale Zeitmaschine aus der Zeichentrickserie “The Rocky and Bullwinkle Show”. Ziel der Wayback Machine ist laut der Gründer Brewster Kahle und Bruce Gilliat die Archivierung des gesamten Internets und die damit verbundene Bereitstellung allen Wissens.

Wozu wird die Wayback Machine genutzt?

Vor allem Wissenschaftler aus den Bereichen Informationstechnologie, Bibliothekswissenschaften und Sozialwissenschaften profitieren bei Ihrer Forschung von den archivierten Daten der Wayback Machine. So wurden bereits unzählige wissenschaftliche Artikel über die Wayback Machine verfasst. Wissenschaftler können beispielsweise die Relevanz der Entwicklung von Websites für das Wachstum von Unternehmen analysieren.

Auch für Journalisten weltweit ist die Wayback Machine hilfreich bei der Untersuchung von Websiteinhalten und der Recherche nach alten Nachrichtenbeiträgen und Berichten. So wurden in der Vergangenheit beispielsweise Falschaussagen von Politikern aufgedeckt. Wikipedia Redakteure nutzen die Wayback Machine, um Quellen zu verifizieren.

Auch vor Gericht trugen die archivierten Webseiten der Wayback Machine schon in mehreren Fällen zur Aufklärung bei. Vor allem im Patentrecht können Zeitstempel aus dem Internetarchiv genutzt werden, um nachzuvollziehen, wann eine Website veröffentlicht wurde.

Seit Oktober 2019 können Nutzer nur noch fünf Anfragen pro Minute stellen.

Kritik an der Wayback Machine

Im Laufe der letzten Jahre sind das Internet Archive und die Wayback Machine immer wieder in die Kritik geraten. Bei dieser Kritik steht vor allem das Urheberrecht im Vordergrund. Die Wayback Machine nutzt ein Opt-Out-Verfahren beim Crawlen von Inhalten. Das bedeutet, dass zunächst alle Webseiten indexiert werden können. Webseitenbetreiber, die dies für ihre Website nicht möchten, müssen eine Entfernung aus dem Archiv beantragen. Vor allem nach deutschem Recht stellt das eine Verletzung des Urheberrechts dar. Die Archivierung stellt eine Art der Vervielfältigung dar, die nach deutschem Recht nur dem Urheber zusteht.

Zwar können Betreiber einer Website versuchen sich durch eine Konfiguration der robots.txt-Datei zu schützen, doch die Betreiber der Wayback Machine haben 2017 bekannt gegeben, dass der Crawler immer weniger Rücksicht auf die Konfigurationen in der robots.txt-Datei nehmen wird.

Die Wayback Machine und SEO

Die Wayback Machine kann für die Suchmaschinenoptimierung von Webseiten sehr hilfreich sein. Beispielsweise, wenn eine Website im Ranking abstürzt, kann die Wayback Machine die Ursachenforschung erleichtern. Der Code älterer Versionen der Website kann mit der aktuellen Version verglichen werden, um Schwachstellen ausfindig zu machen. Auch bei einer Abstrafung seitens Google können so mögliche Fehlerquellen identifiziert werden.

Im Linkmanagement kann das Archiv Betreibern von Webseiten und SEO Experten dabei helfen, fehlerhafte oder tote Links ausfindig zu machen. Viele fehlerhafte Links können das Ranking einer Website bei Google negativ beeinflussen. Im Falle von Duplicate Content lässt sich mithilfe der Wayback Machine nachweisen, dass bestimmte Inhalte schon zu einem früheren Zeitpunkt bestanden haben.

Jetzt den SEO-Küche-Newsletter abonnieren

Ähnliche Artikel

Domain

Was ist eine Domain? Eine Domain ist ein einmaliger, eindeutiger Name, der den Zugriff auf Webseiten im Internet bereitstellt. Sie begegnet jedem Menschen, der eine Internetseite aufruft. Neben diesem Merkmal für die Identifizierung von Webseiten hat die Domain in der Suchmaschinenoptimierung ebenfalls eine kleine, aber womöglich relevante Bedeutung. Warum existieren […]

Broken Link

Was ist ein Broken Link? Ein Broken Link ist ein Hyperlink auf einer Webseite, der zu einer nicht oder nicht mehr erreichbaren Zielseite führt oder zu einer verlinkten Datei, die nicht mehr auf den Servern befindlich ist. Das Resultat eines Klicks auf einen Broken Link ist in der Regel die […]

ASCII Code

Was ist ASCII Code? ASCII Code ist ein Zeichensatz, der mit insgesamt 7 Bits die Darstellung der meisten Zeichen auf einer Computertastatur erlaubt. Da es sich um eine US-amerikanische Erfindung handelt, fehlen im Deutschen (und anderen Sprachen) vorkommende Zeichen wie Umlaute und das ß. Durch eine ASCII Code Tabelle lässt […]

Amazon Web Service

Was sind die Amazon Web Services? Amazon Web Services, auch als AWS bekannt, ist eine vom gleichnamigen Unternehmen angebotene Plattform für Cloud-Computing. Kunden können dort Anwendungen, Webseiten und Dienste hosten lassen, Ressourcen für rechenintensive Aufgaben mieten und vieles mehr. AWS existiert seit 2006 und ist einer der größten Cloud-Services der […]

410 Fehler-Code

Was ist der Fehler 410? Der 410 Statuscode oder 410 Fehler erscheint im Browser, wenn der Nutzer eine URL aufrufen wollte, die jedoch dauerhaft gelöscht ist. Die genaue Formulierung des Fehlercodes hängt vom Webseitenserver ab. Mögliche Varianten sind unter anderem “Error 410”, “Gone”, “HTTP Status 410” oder “410 Gone”. Auch […]

Dialogmarketing

Was ist Dialogmarketing? Das Dialogmarketing ist eine Art des Direktmarketings. Wie der Name es bereits verrät, geht es um den direkten Dialog zwischen Unternehmen und Kunden. Die Akquise der Neukunden sowie Bestandskundenerhaltung sind im Dialogmarketing enthalten. Die Definition Dialogmarketing Aufgrund der sich verändernden Rechtslage ist die Form des Marketings in […]