Skip to main content

XML Sitemap


PDF herunterladen

Was ist die Sitemap.xml?

Eine Sitemap ist eine Seitenübersicht oder eine Art Inhaltsverzeichnis, das die Darstellung einer Webseite vollständig und hierarchisch wiedergibt. Sie dient in erster Linie dazu, den Bots verschiedener Suchmaschinen wie Google oder Bing die Erfassung von Webseiteninhalten zu vereinfachen. Die Sitemap.xml steuert die Indexierung der Website bei Google und das Crawling. Da sie in der Google Search Console hinterlegt wird, wird sie oft auch Google Sitemap genannt.

Es muss zwischen der sitemap.xml für die Indexierung und der für Website-Besucher sichtbaren HTML-Sitemap unterschieden werden. Die HTML-Sitemap dient Besuchern als Übersicht und zeigt vereinfacht die Navigationsstruktur der Website.

Was genau ist eine Sitemap und wofür wird sie verwendet?

Bei einer Sitemap handelt es sich um eine Art Inhaltsverzeichnis für Webseiten, die allerdings primär von Bots und Crawlern als von Usern genutzt werden. Ohne sie würden Webseiten von Suchmaschinen nur schwer oder gar nicht gefunden und könnten nicht richtig gecrawlt werden. Daher ist die Sitemap.xml ein wichtiges Instrument der SEO.

Doch wie funktioniert das? Webcrawler durchsuchen und analysieren Webseiten, damit diese dann in den Suchmaschinen bei den Resultaten erscheinen, wenn sie relevante Inhalte aufweisen. Die erste Sitemap-Technologie wurde 2005 von Google entwickelt, um Webseitenbetreibern die Möglichkeit zu geben, Listen und Protokolle mit Links ihrer Webseite zu veröffentlichen und diese dadurch zu indexieren.

Sitemaps vereinfachen den Crawlern die Analyse und liefern dadurch schnellere und bessere Ergebnisse. Das ist vor allem dann von Bedeutung, wenn die Webseite nicht bloß einfach strukturiert, sondern verschachtelt aufgebaut ist. Bei einer umfangreichen Webseite dauert es nämlich länger, bis die intelligenten Crawler alle Inhalte korrekt erfasst und analysiert haben – eine Sitemap unterstützt und beschleunigt diesen Prozess und teilt den Suchmaschinen dadurch mit, dass die Webseite existiert beziehungsweise neue Inhalte bietet.

Wie ist eine Sitemap.xml aufgebaut?

Sitemaps bilden eine eigene Datei, die in der ersten Ebene einer Domain abgelegt ist und können in unterschiedlichen Formaten erstellt werden. Im HTML-Format hilft eine Sitemap dem Nutzer, über die Inhalte der Webseite zu navigieren und bestimmte Unterseiten zu finden. Für die Leserfreundlichkeit und den Nutzer ist eine Sitemap im HTML-Format empfehlenswert, aber damit die Webseite von den Crawlern im Internet aufgefunden werden kann, muss sie im XML-Format vorliegen. Die XML-Variante bekommen Nutzer und Webseitenbesucher nicht zu sehen und kommuniziert ausschließlich mit den Crawlern der Suchmaschinen.

Des Weiteren sollte die Sitemap gut strukturiert sein und hierarchisch den korrekten Aufbau der Webseite wiedergeben. Im Gegensatz zu einem bloßen Inhaltsverzeichnis zeigen Sitemaps überdies nicht nur den Inhalt, sondern auch die Verknüpfungen und Verlinkungen der einzelnen Seiten und Unterseiten.

Neben HTML- und XML-Sitemaps gibt es aber auch andere Arten, die dazu da sind, die Suche bestimmter Inhalte zu erleichtern. Dazu gehören zum Beispiel:

  • News-Sitemaps
  • Bild-Sitemaps
  • Video-Sitemaps

Für die Erstellung einer Sitemap sind unterschiedliche Methoden möglich:

  • über die entsprechende Funktion des verwendeten Content-Management-Systems
  • Verwendung eines Sitemap-Generators
  • manuelle Anfertigung (langwieriger und aufwendiger Prozess)

Beschränkungen einer Sitemap.xml

So gut aufgebaut eine Sitemap auch sein mag, hat sie doch einige Beschränkungen, die beachtet werden müssen. Zum Beispiel ist es nicht erlaubt, mehr als 50.000 URLs, die auf Webseiteninhalte verweisen, in einer Sitemap zu listen. Sollte die Webseite über mehr Inhalte verfügen, müssen lediglich die wichtigsten in die Listung aufgenommen werden. Alternativ kann die sitemap.xml gesplittet werden. Sollten zu viele Unterseiten dies notwendig machen, lassen sich die gesplitteten Sitemaps in einer Sitemap-Index-Datei bündeln.

Außerdem darf eine Sitemap die Größe von maximal 10 MB nicht überschreiten. Möglich ist allerdings die Verwendung mehrerer Sitemaps, bei denen eine Haupt-Sitemap auf alle anderen Sitemaps verweist.

Kann die Sitemap auch mit Sonderzeichen wie & und % von Google gelesen werden?

Ja, Google kann Sitemaps lesen, die sowohl „&“ als auch „%“ in den URLs enthalten. Diese Zeichen müssen jedoch korrekt codiert sein, damit sie von Google richtig interpretiert werden können.

Im Allgemeinen sollten URLs in einer Sitemap XML-Datei bereits URL-codiert sein, was bedeutet, dass „&“ durch „%26“ und „%“ durch „%25“ ersetzt wird. Wenn Sie jedoch unsicher sind, ob Ihre URLs korrekt codiert sind, können Sie eine Online-URL-Codierungstool (zum Beispiel urlencoder.org) verwenden, um sicherzustellen, dass sie korrekt codiert sind.

Außerdem muss die Sitemap-Datei im korrekten XML-Format vorliegen und darf keine Syntaxfehler enthalten, da dies dazu führen kann, dass Google die Datei nicht korrekt verarbeiten kann.

Gehören Canonical Tags in die XML-Sitemap?

Nein, Canonical-Tags gehören normalerweise nicht in eine XML-Sitemap. Eine XML-Sitemap ist eine Datei, die Suchmaschinen wie Google dabei hilft, alle Seiten einer Website zu entdecken und zu indexieren. Die Canonical-Tags werden jedoch verwendet, um doppelte Inhalte auf einer Website zu vermeiden, indem sie Suchmaschinen anweisen, welche URL als die bevorzugte Version einer bestimmten Seite betrachtet werden soll.

Enthält die Website übersetzte Unterseiten und auf diese wird per hreflang verwiesen, so gehört dies auch in die Sitemap. Selbiges gilt auch für mobile Websiten per rel=“alternate“-Befehl oder AMP-Versionen.

Fazit

Sitemaps sind zwar kein unverzichtbarer Bestandteil von Webseiten, können aber dennoch ein wichtiger Faktor in der Suchmaschinenoptimierung (SEO) sein. Vor allem bei umfangreichen Webseiten mit vielen Unterseiten helfen Sitemaps, den Crawlern im Web die Analyse der Inhalte zu vereinfachen und die Seite in den Suchergebnissen besser ranken zu lassen.

Siehe auch: Unser Ratgeberartikel zum Thema „Sitemap SEO“

Weiterführende Informationen: WordPress Sitemap Erstellen

Jetzt den SEO-Küche-Newsletter abonnieren

Keine Kommentare vorhanden


Hast du eine Frage oder Meinung zum Artikel? Schreib uns gerne etwas in die Kommentare.

Ihre E-Mail Adresse wird nicht veröffentlicht

Ähnliche Artikel

Leadinfo

Leadinfo in Kürze Leadinfo ist ein B2B-Tool zur Identifizierung von Website-Besuchern auf Unternehmensebene. Es hilft Unternehmen dabei, anonyme Zugriffe besser einzuordnen, potenzielle Firmenkontakte zu erkennen und Vertriebschancen früher sichtbar zu machen. Besonders im Zusammenspiel mit SEO, SEA, Content-Marketing und CRM-Systemen kann Leadinfo dabei unterstützen, den Weg von der Website zum […]

Google GIST

GIST ist ein neuer Google Algorithmus, der die Auswahl von Trainingsdaten für KI-Modelle grundlegend neu angeht, um Rechenleistung zu sparen. GIST steht für „Greedy Independent Set Thresholding“ und wurde im Rahmen der NeurIPS 2025 (einer der wichtigsten internationalen Konferenzen für Machine Learning und KI) offiziell vorgestellt. Die zentralen Ideen und Ergebnisse […]

GEO (Generative Engine Optimization)

GEO steht für Generative Engine Optimization und beschreibt die Optimierung von Inhalten für generative Such- und Antwortsysteme, die Informationen nicht mehr nur verlinken, sondern eigenständig zusammenfassen und ausgeben. Dazu zählen unter anderem KI-Suchmaschinen, Chatbots und Antwortsysteme wie Google AI Overviews oder Perplexity. Im Fokus von GEO steht nicht das klassische […]

GAIO (Generative AI Optimization)

GAIO steht für Generative AI Optimization und beschreibt die Optimierung von Inhalten, Marken und Informationen für generative KI-Systeme. Ziel von GAIO ist es, in KI-gestützten Such- und Antwortsystemen wie ChatGPT, Google AI Overviews oder Perplexity korrekt verstanden, bevorzugt berücksichtigt und zitiert zu werden. GAIO geht damit über klassische Suchmaschinenoptimierung (SEO) […]

Google AI Overview

Google AI Overviews sind KI-generierte Antwortboxen in der Google-Suche, die Nutzenden zusammengefasste Antworten direkt oberhalb oder innerhalb der Suchergebnisse anzeigen. Sie basieren auf generativer KI und sollen komplexe Suchanfragen schneller und verständlicher beantworten, ohne dass zwingend einzelne Websites angeklickt werden müssen. Die Funktion ist Teil von Googles Weiterentwicklung der Suche […]

Grok

Grok ist ein KI-gestützter Chatbot und Sprachassistent, der von xAI entwickelt wurde. Grok ist darauf ausgelegt, aktuelle Informationen, insbesondere aus der Plattform X (ehemals Twitter), in seine Antworten einzubeziehen und Nutzerfragen dialogbasiert zu beantworten. Im Vergleich zu klassischen KI-Chatbots positioniert sich Grok bewusst als direkt, meinungsstark und kontextnah – mit […]