Skip to main content

Stemming


PDF herunterladen

Was ist Stemming?

Als Stemming (Stammformreduktion) wird in der Sprachwissenschaft und linguistischen Informatik ein Verfahren bezeichnet, das verschiedene morphologische Varianten eines Wortes auf ihren gemeinsamen Wortstamm zurückführt. Durch das Stemming können verbesserte und relevantere Suchergebnisse erzielt werden. Auf jeden Fall führt es zu einer Erweiterung der Ergebnisse.

Verwendung für die SEO

In der Informatik werden zwar seit 1968 verschiedene Stamming-Verfahren getestet, allerdings ist dies bisher vor allem in den USA weit verbreitet. Suchmaschinen nutzen die im Text enthaltenen Keywords, um relevante Suchergebnisse zu erhalten. Dafür setzt Google seit 2004 für die Optimierung der Suchmaschine verschiedene Stemming-Verfahren ein. Diese Veränderungen im Suchalgorithmus ermöglichen eine Differenzierung der Suchanfragen und analysieren so ganze Sätze wesentlich exakter.

Durch das Stemming erfolgt die Identifizierung der Wörter anhand ihres grammatikalischen Wortstamms. Demnach erkennt die Suchmaschine einen Zusammenhang zwischen den Varianten eines Wortes und weist dieser Seite eine Relevanz zu. Wer beispielsweise den Suchbegriff „Suchmaschinenoptimierung“ eingibt, erhält sowohl die Ergebnisse „Optimierung“ als auch „optimieren“. Zusätzlich verringert das Stemming den benötigten Speicherplatz und beschleunigt somit die Suche. Das Stemming reduziert nicht nur die Inhalte auf die Grundformen, sondern optimiert auch ähnliche Begriffe, die dem Themenfeld des Hauptkeywords entsprechen. So könnte zum Beispiel ein Text über Kartoffeln neben der Beschreibung des Gemüses auch über weitere Verwendungsmöglichkeiten und Kartoffelsorten informieren. Auf diese Art würde der Text seine Relevanz zu diesem Begriff erhöhen. Der Nutzer kann das Stemming umgehen, indem er seine gesuchte Begriffskombination in Anführungszeichen setzt.

Das Stemming-Verfahren

Die komplexen Stemming-Algorithmen sind aufgrund der unterschiedlichen sprachlichen Gegebenheiten (Grammatik) auf die jeweiligen Sprachen optimiert. So erkennt der Algorithmus beispielsweise aus den verschiedenen Wörtern „Hausbau“, „behausen“ sowie „Wohnhaus“ den gemeinsamen Wortstamm „Haus“ und liefert die entsprechenden Suchergebnisse. Für das Stemming stellt es keine Herausforderung mehr dar, ob der Text Wörter im Singular oder Plural enthält oder ob diese durch einen Bindestrich getrennt sind. Das Verfahren ermöglicht sowohl die Reduktion der Wörter auf ihre Grundform als auch die Kürzung der Suffixe oder Präfixe. Die häufigste Variante stellt die Suffix-Entfernung dar.

Jetzt den SEO-Küche-Newsletter abonnieren

Ähnliche Artikel

Release Management

Release Management einfach und verständlich erklärt Der Begriff Release Management beschreibt die Planung, Umsetzung und das Controlling von Softwareentwicklungsprozessen und der angewendeten IT-Infrastruktur. Release Management – Definition Durch das Release Management wird es möglich, einen Überblick über den gesamten Entwicklungsprozess von Softwares, Web-Anwendungen und deren Updates sicherzustellen. Das Release Management […]

Google Doodle

Was ist Google Doodle? Als Google Doodle (deutsch: Kritzelei, Gekritzel ) bezeichnet der US-amerikanische Suchmaschinenbetreiber Google die unterschiedliche Darstellung seines Firmenlogos auf der Startseite und in den Suchergebnisseiten (kurz: [a href=https://www.seo-kueche.de/lexikon/serp-search-engine-result-page/]SERP[/a]). Seit 1998 ist es bei dem Tech-Unternehmen Tradition, zu besonderen Anlässen wie Geburtstagen wichtiger Persönlichkeiten aus Kunst und Wissenschaft, […]

Data Warehouse

Was ist ein Data Warehouse? Bei einem Data Warehouse (manchmal auch Datenlager genannt, kurz: DWH) handelt es sich um ein zentrales Datenbanksystem, das sich in Unternehmen zu Analyse- und Prognosezwecken einsetzen lässt. Für diesen Zweck sammelt und verdichtet das System relevante Daten aus verschiedenen heterogenen Datenquellen wie zum Beispiel dem Customer Relationship Management (CRM), Human Resources (HR) oder Enterprise Resource Planning (ERP) und stellt diese nachgelagerten Anwendungen zur Verfügung. […]

WLAN

Was ist WLAN? Der Begriff WLAN (auch Wireless LAN oder Wi-Fi) ist eine Abkürzung für das englische “Wireless Local Area Network” (zu Deutsch: drahtloses lokales Netzwerk). Innerhalb dieses drahtlosen Funknetzwerks, das in der Regel auf einem Standard der IEEE-802.11-Familie basiert, sind WLAN-fähige Geräte wie Drucker, Computer, Smartphones oder Tablets in […]

Search Engine Marketing SEM

Search Engine Marketing einfach und verständlich erklärt Der Begriff Search Engine Marketing (SEM) ist ein Teilbereich im Online-Marketing und beschreibt alle Maßnahmen, die getroffen werden können, um eine prominente Positionierung einer Webseite innerhalb der Suchmaschinen in den Suchergebnissen (englisch: Search Engine Result Pages, kurz SERPs) und damit Besucher für eine […]

bit.ly

Was ist Bit.ly? Bitly (auch bitly oder bit.ly geschrieben) ist ein 2008 von Peter Stern gegründetes Tech-Unternehmen mit Sitz in New York. Kerngeschäft der SaaS-Firma ist der Betrieb des gleichnamigen Kurz-URL-Dienstes. Dieser lässt sich wahlweise über die Website bit.ly (oder bitly.com), mittels API oder über die für iOS und Android […]