Skip to main content

User Agent


PDF herunterladen

Was ist ein User Agent?

Während User “echte” Menschen sind, bezeichnen User Agents keine Personen, sondern Programme. Sie führen automatische Datenabfragen beim Server durch, z.B. bei Suchmaschinen und bilden damit die Schnittstelle zwischen dem Benutzer und dem Netzwerksdienst. Übermittelt wird der User Agent durch den HTTP Header.

User Agent Typen

User Agents lassen sich in folgende Typen unterteilen:

Browser: z.B. Firefox, Internet Explorer, Chrome. Browser werden für die einheitliche Webseiten-Darstellung benötigt.

Suchmaschinen-Crawler: z.B. Googlebot, MSN-Bot. Sie besuchen regelmäßig Webseiten auf der Suche nach neuen Informationen und Änderungen auf Webseiten.

Webapplications: z.B. Flash Player, Adobe Acrobat Reader. Unter diesen Typ fallen alle Programme, die für die Ausführung einer Datei benötigt werden und dafür Anfragen an den Server stellen. Sie werden zum Beispiel zum Abspielen von Videos und Musik oder zum Öffnen von Text-/Grafikdateien benötigt.

Sinn und Zweck des User Agent

Jeder User Agent hat als Identifikation eine eigene Kennung. Diese Kennung bezeichnet man auch als Agent Name. Übermittelt wird sie über seinen HTTP Header. Durch diese Information kann der Webserver entsprechend andere Informationen an den Benutzer ausliefern, was z.B. bei Browsernutzern mit einem Mobilgerät eine Rolle spielt. Denn durch die Herkunftsinfo wird dem Nutzer eine für das Gerät optimierte Seite angezeigt.

Außerdem können mit dem User Agent Menschen von Maschinen, also den Suchmaschinen-Crawlern unterschieden werden. Ihre Anfrage ähnelt stark den menschlichen Anfragen, nur sind hier eben Informationen wie „Googlebot/2.1“ oder „msnbot-media/1.0“ hinterlegt. Diese Unterscheidung ist vor allem für die statistische Auswertung wichtig.

Wie funktioniert die Übertragung des User Agent?

Die Übertragung des User Agent über den Header erfolgt bei jedem Seitenaufruf. Enthalten sind im Header folgende Informationen:

– Name und Version des aufrufenden Programms
– Name des Betriebssystems und dessen Version
– evtl. Plugins bei Browsern

Das kann folgendermaßen aussehen:

Mozilla/5.0 (Windows; U; Windows NT 5.1; de; rv:1.8.1.12) Gecko/20080201 Firefox/2.0.0.12

Wenn ein Browser, eine Applikation oder ein Crawler auf ein Dokument zugreift, wird automatisch der User Agent mitgeteilt. Der Wert ist nicht standardisiert. Daher gibt es sowohl inhaltlich als auch beim Aufbau verschiedene Angaben. Aus technischer Sicht kann ein User Agent beliebige Informationen schicken. Deshalb übermittelt er teilweise auch falsche Angaben, um seine Identität zu verschleiern und sich als ein anderes Programm auszugeben.

User Agent – Bedeutung für die Suchmaschinenoptimierung

Bekommt das anfragende Programm einen auf seinen User Agent zugeschnittenen Inhalt, dann wird das als Agent Name Delivery bezeichnet. Bei der Suchmaschinenoptimierung findet Agent Name Delivery Anwendung, indem realen Nutzern andere Informationen ausgeliefert werden als Suchmaschinen-Crawlern. Diese Vorgehensweise wird als Cloaking bezeichnet. Ziel ist es, dem realen Nutzer über seine Browseransicht aufwendig gestaltete Seiten zu liefern und dem Crawler lediglich eine einfache Struktur “vorzusetzen”.

Diese Suchmaschinentechnik fällt unter den Bereich Spam und verstößt gegen die Google Webmaster-Richtlinien. Da die Manipulation des User Agent aber recht einfach zu bewerkstelligen ist, funktioniert diese Spam-Methode auch kaum noch. Die meisten Suchmaschinen geben mittlerweile ihre Crawler mit einer User Agent Kennung aus, die einem normalen Browser gleichkommt.

Jetzt den SEO-Küche-Newsletter abonnieren

Ähnliche Artikel

Ixquick

Ixquick war eine Metasuchmaschine, die freiwillig auf die Speicherung nutzerbezogener Daten verzichtete. Sie wurde 1998 in den USA entwickelt und ab dem Jahr 2000 von der Surfboard Holding B.V. betrieben. Im März 2016 wurde Ixquick mit der ebenfalls zur Surfboard Holding B.V. gehörenden Suchmaschine “Startpage” zusammengeführt. Zwei Jahre später wurde der Support für Ixquick eingestellt.[1] Geschichte Die […]

Crawl Budget

Der Begriff „Crawl Budget“ beschreibt den zeitlichen Rahmen, in welchem der Webcrawler von Google das Crawlen, Indizieren und Positionieren einer Website ansetzt. Crawl Budget – Schlüsselbegriffe Googlebot Der Googlebot (Webcrawler) ist für die Analyse aller Websites im WorldWideWeb verantwortlich. Täglich führt der Googlebot einen FreshCrawl und im Abstand von circa […]

Google MUM (Multitask Unified Model)

Das Multitask Unified Model (kurz MUM) bedeutet übersetzt: Das “vereinheitlichte Vielfachaufgaben Modell”) und ist eine Technologie innerhalb der Google Suche, die es ermöglichen soll, komplexe Themenbereiche durch die Anwendung von KI für Suchende besser zu bündeln. Mit MUM sollen künftig umfangreiche Recherchen mit weniger Suchanfragen ausgeführt werden können als bisher. […]

UTF-8

Was ist UTF-8? UTF-8 steht für Unicode Transformation Format – 8 Bits. Die „8“ bedeutet, dass zur Darstellung eines Zeichens 8-Bit-Blöcke verwendet werden. Die Anzahl der Blöcke, die zur Darstellung eines Zeichens benötigt werden, variiert zwischen 1 und 4. UTF-8 ist eine kompromisslose Zeichenkodierung, die so kompakt wie ASCII sein kann […]

Google Drive

Was ist Google Drive? „Google Drive“ ist ein von Google entwickeltes Produkt zum Speichern und Synchronisieren von Dateien. Es ermöglicht den Nutzern, Dateien in der Cloud zu speichern, Dateien zwischen Geräten zu synchronisieren und Dateien freizugeben. Wie ist Google Drive entstanden? 2006 wurden die Dienste „Google Docs“ und „Google Sheets“ […]

Google News

Was ist Google News? Google News ist eine Nachrichtensuchmaschine, die in mehr als 70 Ländern und in über 35 Sprachen verfügbar ist. Die Nachrichtensuchmaschine ist auch als App für iOS und Android verfügbar, die über die Formate RSS-Feeds oder Atom-Feeds abonniert werden können. Dadurch kann man sich Nachrichten auf das […]