Skip to main content

Wayback Machine


PDF herunterladen

Was ist die Wayback Machine?

Die Wayback Machine ist ein Onlinedienst des Internet Archive, das dem Nutzer archivierte Versionen von Websites zur Ansicht zur Verfügung stellt. Das Archiv wurde 1996 als gemeinnütziges Projekt gegründet und beinhaltet mittlerweile neben den Inhalten der Wayback Machine (Start: 2001) auch weitere digitale Inhalte. Die Nutzung der Wayback Machine ist kostenfrei.

Geschichte der Wayback Machine

Die Wayback Machine begann bereits 1996 mit dem Speichern von Webseiten. 2001 wurde der Service dann veröffentlicht. Bis zu diesem Zeitpunkt hatte die Wayback Machine bereits 10 Milliarden Seiten archiviert. Der Name soll eine Anlehnung an die “WABAC machine” sein, eine fiktionale Zeitmaschine aus der Zeichentrickserie “The Rocky and Bullwinkle Show”. Ziel der Wayback Machine ist laut der Gründer Brewster Kahle und Bruce Gilliat die Archivierung des gesamten Internets und die damit verbundene Bereitstellung allen Wissens.

Wozu wird die Wayback Machine genutzt?

Vor allem Wissenschaftler aus den Bereichen Informationstechnologie, Bibliothekswissenschaften und Sozialwissenschaften profitieren bei Ihrer Forschung von den archivierten Daten der Wayback Machine. So wurden bereits unzählige wissenschaftliche Artikel über die Wayback Machine verfasst. Wissenschaftler können beispielsweise die Relevanz der Entwicklung von Websites für das Wachstum von Unternehmen analysieren.

Auch für Journalisten weltweit ist die Wayback Machine hilfreich bei der Untersuchung von Websiteinhalten und der Recherche nach alten Nachrichtenbeiträgen und Berichten. So wurden in der Vergangenheit beispielsweise Falschaussagen von Politikern aufgedeckt. Wikipedia Redakteure nutzen die Wayback Machine, um Quellen zu verifizieren.

Auch vor Gericht trugen die archivierten Webseiten der Wayback Machine schon in mehreren Fällen zur Aufklärung bei. Vor allem im Patentrecht können Zeitstempel aus dem Internetarchiv genutzt werden, um nachzuvollziehen, wann eine Website veröffentlicht wurde.

Seit Oktober 2019 können Nutzer nur noch fünf Anfragen pro Minute stellen.

Kritik an der Wayback Machine

Im Laufe der letzten Jahre sind das Internet Archive und die Wayback Machine immer wieder in die Kritik geraten. Bei dieser Kritik steht vor allem das Urheberrecht im Vordergrund. Die Wayback Machine nutzt ein Opt-Out-Verfahren beim Crawlen von Inhalten. Das bedeutet, dass zunächst alle Webseiten indexiert werden können. Webseitenbetreiber, die dies für ihre Website nicht möchten, müssen eine Entfernung aus dem Archiv beantragen. Vor allem nach deutschem Recht stellt das eine Verletzung des Urheberrechts dar. Die Archivierung stellt eine Art der Vervielfältigung dar, die nach deutschem Recht nur dem Urheber zusteht.

Zwar können Betreiber einer Website versuchen sich durch eine Konfiguration der robots.txt-Datei zu schützen, doch die Betreiber der Wayback Machine haben 2017 bekannt gegeben, dass der Crawler immer weniger Rücksicht auf die Konfigurationen in der robots.txt-Datei nehmen wird.

Die Wayback Machine und SEO

Die Wayback Machine kann für die Suchmaschinenoptimierung von Webseiten sehr hilfreich sein. Beispielsweise, wenn eine Website im Ranking abstürzt, kann die Wayback Machine die Ursachenforschung erleichtern. Der Code älterer Versionen der Website kann mit der aktuellen Version verglichen werden, um Schwachstellen ausfindig zu machen. Auch bei einer Abstrafung seitens Google können so mögliche Fehlerquellen identifiziert werden.

Im Linkmanagement kann das Archiv Betreibern von Webseiten und SEO Experten dabei helfen, fehlerhafte oder tote Links ausfindig zu machen. Viele fehlerhafte Links können das Ranking einer Website bei Google negativ beeinflussen. Im Falle von Duplicate Content lässt sich mithilfe der Wayback Machine nachweisen, dass bestimmte Inhalte schon zu einem früheren Zeitpunkt bestanden haben.

Jetzt den SEO-Küche-Newsletter abonnieren

Ähnliche Artikel

Release Management

Release Management einfach und verständlich erklärt Der Begriff Release Management beschreibt die Planung, Umsetzung und das Controlling von Softwareentwicklungsprozessen und der angewendeten IT-Infrastruktur. Release Management – Definition Durch das Release Management wird es möglich, einen Überblick über den gesamten Entwicklungsprozess von Softwares, Web-Anwendungen und deren Updates sicherzustellen. Das Release Management […]

Google Doodle

Was ist Google Doodle? Als Google Doodle (deutsch: Kritzelei, Gekritzel ) bezeichnet der US-amerikanische Suchmaschinenbetreiber Google die unterschiedliche Darstellung seines Firmenlogos auf der Startseite und in den Suchergebnisseiten (kurz: [a href=https://www.seo-kueche.de/lexikon/serp-search-engine-result-page/]SERP[/a]). Seit 1998 ist es bei dem Tech-Unternehmen Tradition, zu besonderen Anlässen wie Geburtstagen wichtiger Persönlichkeiten aus Kunst und Wissenschaft, […]

Data Warehouse

Was ist ein Data Warehouse? Bei einem Data Warehouse (manchmal auch Datenlager genannt, kurz: DWH) handelt es sich um ein zentrales Datenbanksystem, das sich in Unternehmen zu Analyse- und Prognosezwecken einsetzen lässt. Für diesen Zweck sammelt und verdichtet das System relevante Daten aus verschiedenen heterogenen Datenquellen wie zum Beispiel dem Customer Relationship Management (CRM), Human Resources (HR) oder Enterprise Resource Planning (ERP) und stellt diese nachgelagerten Anwendungen zur Verfügung. […]

Search Engine Marketing SEM

Search Engine Marketing einfach und verständlich erklärt Der Begriff Search Engine Marketing (SEM) ist ein Teilbereich im Online-Marketing und beschreibt alle Maßnahmen, die getroffen werden können, um eine prominente Positionierung einer Webseite innerhalb der Suchmaschinen in den Suchergebnissen (englisch: Search Engine Result Pages, kurz SERPs) und damit Besucher für eine […]

bit.ly

Was ist Bit.ly? Bitly (auch bitly oder bit.ly geschrieben) ist ein 2008 von Peter Stern gegründetes Tech-Unternehmen mit Sitz in New York. Kerngeschäft der SaaS-Firma ist der Betrieb des gleichnamigen Kurz-URL-Dienstes. Dieser lässt sich wahlweise über die Website bit.ly (oder bitly.com), mittels API oder über die für iOS und Android […]

TYPO3

TYPO3 einfach und verständlich erklärt TYPO3 ist ein freies und webbasiertes Content Management System (WCMS) auf PHP-Basis, welches sowohl für private als auch kommerzielle Zwecke lizenzkostenfrei verwendet werden kann. Begriffsdefinition TYPO3 ist ein lizenzfreies Content Management System (CMS), welches 1997 vom dänischen Webdesigner Kasper Skårhøj entwickelt wurde. TYPO3 zählt neben […]