XML-Sitemap erstellen und einreichen
Was ist eine XML-Sitemap?
Eine XML-Sitemap ist eine Übersicht aller indexierbaren Unterseiten einer Webseite. Sie sorgt dafür, dass Suchmaschinen Inhalte und Strukturen einer Website besser verstehen und auffinden können. Eine XML-Sitemap ist insbesondere bei sehr verschachtelten Webseiten hilfreich. Sie kann daher positiv zur Indexierung von Unterseiten beitragen, garantiert diese jedoch nicht. Als Format für die Sitemap hat sich XML als Standard etabliert.
Der Unterschied zwischen einer XML- und einer HTML-Sitemap
Nicht verwechselt werden sollte die XML-Sitemap mit der HTML-Sitemap. Eine HTML-Sitemap wird häufig von Content Management Systemen (CMS) erstellt und gibt für den Nutzer und Suchmaschinen ein Inhaltsverzeichnis einer Website wieder. Die XML-Sitemap ist für den Nutzer zunächst nicht sichtbar und wird nur als Datei an die Suchmaschine übergeben. Ist die URL der XML-Sitemap bekannt, kann diese auch von Nutzern aufgerufen werden.
Vorteile der XML-Sitemap
Das Erstellen und Nutzen einer XML-Sitemap bringt folgende Vorteile:
- Schwer zugängliche Unterseiten (da sie z.B. neu oder schlecht intern verlinkt sind) sind besser auffindbar
- Bei einer neuen Website, die nicht über viele Backlinks verfügt, sind die Unterseiten besser auffindbar
- Content-Archiv, das intern nur gering verlinkt ist, kann besser gecrawlt und indexiert werden
Eine XML-Sitemap erstellen
Viele gängige CMS Systeme wie TYPO3, Magento oder WordPress können eine XML-Sitemap per Standardfunktion oder per Extension erstellen. Des Weiteren gibt es allerdings auch einige kostenlose Tools, die diese Aufgabe übernehmen können.
Aufbau der XML-Sitemap
Als Auszeichnungssprache hat sich das Google Sitemap Protokoll 0.9 etabliert. Das Protokoll ist auf sitemaps.org zu finden.
Folgende Elemente sollten vorhanden sein:
- Angaben zum Zeichencode
- Alle Unterseiten der Webseite
- Änderungsdatum
- Änderungsfrequenz
- Priorität der Unterseiten
Die Angaben zum Änderungsdatum, zur Änderungsfrequenz und zur Priorität sind optional.
Das Attribut lastmod
Das Attribut enthält das letzte Änderungsdatum der Seite und sollte das W3C Datetime-Format (YYYY-MM-DD) aufweisen. Das hilft den Suchmaschinen zu erkennen, welche Seiten neue und/oder geänderte Inhalte besitzen und unterstützt bei einer schnellen Indexierung. Seiten, die sich inhaltlich nicht geändert haben, sollten stattdessen das letzte Änderungsdatum beibehalten und werden korrekterweise dann nicht priorisiert gecrawlt. Die Angabe von Stunden und Sekunden sind optional.
Folgender Screenshot zeigt die Verwendung des Attributs:
Das Attribut changefreq
Das Attribut <changefreq> gibt an, mit welcher Häufigkeit sich die Seite wahrscheinlich ändern wird. Damit wird Suchmaschinen ein Hinweis gegeben, wie oft diese Seite gecrawlt werden sollte.
Gültige Argumente sind:
- always
- hourly
- daily
- weekly
- monthly
- yearly
- never
Das Argument „always“ wird hierbei für Seiten verwendet, die sich bei jedem Zugriff ändern, etwa Börsenkurse. Für Archive kann das Argument „never“ verwendet werden. Die Angabe ist hierbei lediglich eine Empfehlung für Suchmaschinen. Die tatsächliche Crawl-Häufigkeit kann unter Umständen abweichen.
Das Attribut priority
Das Attribut <priority> gibt die Priorität einer Seite im Vergleich zu den anderen Seiten einer Webseite an. Die Werte können dabei zwischen 0.0 und 1.0 liegen. Die Standardpriorität einer Seite liegt bei 0.5. Es macht keinen Sinn, allen Seiten eine hohe Priorität zuzuweisen, da diese relativ zu den anderen Seiten der Webseite festgelegt wird. Die höchste Priorität sollten die Startseite und Kategorieseiten bzw. die wichtigsten Unterseiten bekommen.
Anforderungen an eine XML-Sitemap
Beim Anlegen einer Sitemap sollten folgende Punkte beachtet werden:
- Nur Seiten mit Statuscode 200; keine Weiterleitungen, keine 404 Statuscodes
- Keine URLs mit Sitzungs-IDs
- Nur indexierbare Seiten, keine Seiten mit dem Meta Robots Tag „noindex“
- Keine Seiten, die durch die robots.txt von der Indexierung ausgeschlossen sind
- Keine Seiten, die mit einem Canonical Tag auf eine andere Seite verweisen
- Keine Success-Seiten, die nur bestehen, um Conversions zu messen (z.B. /vielen-dank/)
- Für jede Seite nur einen Eintrag
- Für Bilder, Videos oder Google News-Inhalte kann eine separate Sitemap angelegt werden
- Nicht mehr als 50.000 URLs pro Sitemap, ansonsten mehrere Sitemaps anlegen
- Nicht größer als 50 MB unkomprimiert
Wichtig ist, dass sich die Sitemap täglich aktualisiert und bei Veränderungen die Seiten entfernt werden, die bspw. gelöscht oder weitergeleitet wurden. Es sollte also gewährleistet sein, dass die Sitemap möglichst immer aktuell ist. Hilfreich ist es, dabei mit einer Extension für Ihr CMS zu arbeiten.
Weitere Informationen zu den Richtlinien von Google finden sich hier.
Die Sitemap-Indexdatei
Würde eine XML-Sitemap mehr als 50.000 URLs enthalten oder über 50 MB groß sein, sollte eine Sitemap-Indexdatei verwendet werden. Diese enthält eine Auflistung aller XML-Sitemaps. In der Google Search Console oder den Bing Webmaster Tools wird dann diese Sitemap-Indexdatei eingereicht und in der robots.txt verlinkt.
Weitere Informationen von Google zum Thema Sitemap-Indexdatei finden sich hier.
Die XML-Sitemap für die Suchmaschine zugänglich machen
Eine XML-Sitemap sollte für die Suchmaschinen über mehrere Wege veröffentlicht werden:
1. Ablegen im Root-Verzeichnis der Domain
2. Angabe von Position und Bezeichnung in der robots.txt
3. Hochladen in der Google Search Console oder den Bing Webmaster Tools
Beim Hochladen der Sitemap in der Search Console wird angegeben, bei welchen Seiten Fehler bei der Verarbeitung auftraten. Diese sollten korrigiert werden.
Fazit
XML-Sitemaps sind ein praktisches Tool, um das vollständige Crawling einer Website weitestgehend zu gewährleisten. Besonders für große Websites, neue Websites oder Websites mit neuen Unterseiten empfiehlt sich die Verwendung einer XML-Sitemap. Haben Sie Fragen oder benötigen Sie Hilfe bei der Erstellung einer XML-Sitemap? Sprechen Sie uns gerne an. Als professionelle SEO Agentur haben wir das Know How, von dem Ihr Webprojekt profitieren kann.
Ihr Ansprechpartner
für SEO & SEA
Beyond Media hilft Ihnen dabei, sich von der Konkurrenz abzuheben und bringt Ihre Website mit den richtigen SEO- & SEA-Maßnahmen nach vorne. Gewinnen Sie mit unserer Hilfe und unserer Expertise neue Kunden und sichern Sie sich und Ihrem Unternehmen langfristige und nachhaltige Erfolge mit einem starken digitalen Auftritt!