Skip to main content

Stemming


PDF herunterladen

Was ist Stemming?

Als Stemming (Stammformreduktion) wird in der Sprachwissenschaft und linguistischen Informatik ein Verfahren bezeichnet, das verschiedene morphologische Varianten eines Wortes auf ihren gemeinsamen Wortstamm zurückführt. Durch das Stemming können verbesserte und relevantere Suchergebnisse erzielt werden. Auf jeden Fall führt es zu einer Erweiterung der Ergebnisse.

Verwendung für die SEO

In der Informatik werden zwar seit 1968 verschiedene Stamming-Verfahren getestet, allerdings ist dies bisher vor allem in den USA weit verbreitet. Suchmaschinen nutzen die im Text enthaltenen Keywords, um relevante Suchergebnisse zu erhalten. Dafür setzt Google seit 2004 für die Optimierung der Suchmaschine verschiedene Stemming-Verfahren ein. Diese Veränderungen im Suchalgorithmus ermöglichen eine Differenzierung der Suchanfragen und analysieren so ganze Sätze wesentlich exakter.

Durch das Stemming erfolgt die Identifizierung der Wörter anhand ihres grammatikalischen Wortstamms. Demnach erkennt die Suchmaschine einen Zusammenhang zwischen den Varianten eines Wortes und weist dieser Seite eine Relevanz zu. Wer beispielsweise den Suchbegriff „Suchmaschinenoptimierung“ eingibt, erhält sowohl die Ergebnisse „Optimierung“ als auch „optimieren“. Zusätzlich verringert das Stemming den benötigten Speicherplatz und beschleunigt somit die Suche. Das Stemming reduziert nicht nur die Inhalte auf die Grundformen, sondern optimiert auch ähnliche Begriffe, die dem Themenfeld des Hauptkeywords entsprechen. So könnte zum Beispiel ein Text über Kartoffeln neben der Beschreibung des Gemüses auch über weitere Verwendungsmöglichkeiten und Kartoffelsorten informieren. Auf diese Art würde der Text seine Relevanz zu diesem Begriff erhöhen. Der Nutzer kann das Stemming umgehen, indem er seine gesuchte Begriffskombination in Anführungszeichen setzt.

Das Stemming-Verfahren

Die komplexen Stemming-Algorithmen sind aufgrund der unterschiedlichen sprachlichen Gegebenheiten (Grammatik) auf die jeweiligen Sprachen optimiert. So erkennt der Algorithmus beispielsweise aus den verschiedenen Wörtern „Hausbau“, „behausen“ sowie „Wohnhaus“ den gemeinsamen Wortstamm „Haus“ und liefert die entsprechenden Suchergebnisse. Für das Stemming stellt es keine Herausforderung mehr dar, ob der Text Wörter im Singular oder Plural enthält oder ob diese durch einen Bindestrich getrennt sind. Das Verfahren ermöglicht sowohl die Reduktion der Wörter auf ihre Grundform als auch die Kürzung der Suffixe oder Präfixe. Die häufigste Variante stellt die Suffix-Entfernung dar.

Jetzt den SEO-Küche-Newsletter abonnieren

Ähnliche Artikel

Heading-Tag

Was ist ein Heading-Tag? Was ist ein Heading-Tag? Unter einem Heading-Tag versteht man ein kennzeichnendes Element für Überschriften in der Webseiten-Beschreibungssprache HTML. HTML-Dateien sind grundsätzlich hierarchisch aufgebaut. Die einzelnen Bereiche werden dabei durch sogenannte Tags markiert. Heading-Tags zeichnen Überschriften aus. Der Rang der entsprechenden Überschrift wird zusätzlich mit einer Ziffer […]

Framework

Was ist ein Framework? Was ist ein Framework? Das Framework ist insbesondere in der Software-Entwicklung ein fester Begriff. Es steht für ein Grundgerüst, das dem Programmierer bestimmte vorgefertigte Module und Funktionen bietet. Diese kann er durch einfache Befehle in sein Programm einbinden. Der Vorteil ist, dass wiederkehrende Aktionen, etwa das […]

AIDA-Formel

Die AIDA-Formel Die Abkürzung AIDA steht für die englischen Begriffe: Attention (Aufmerksamkeit) Interest (Interesse) Desire (Verlangen) Action (Handlung) Das AIDA-Model ist in Werbe- und Marketingkreisen sehr erfolgreich und weit verbreitet. Das Modell beschreibt die verschiedenen Schritte, die vom Eintritt einer Person in die Bewusstseinsphase eines Marketing-Instruments bis zur endgültigen Entscheidungsfindung […]

Dedicated Server

Was ist ein Dedicated Server? Alle Unternehmen müssen Daten speichern. Das sind zum Beispiel Kundendaten, Geschäftsvorgänge, Schriftverkehr, E-Mails, Berichte, Analysen u.v.a. Diese Daten werden in den meisten Fällen auf gehosteten Servern gespeichert. Rein technisch gesehen, ist ein Server ein Stück Computer-Hardware mit hohem Datenverkehr, zum ausschließlichen Hosten von Websites, Daten […]

Core Web Vitals

Was sind Core Web Vitals? Core Web Vitals sind eine Reihe von benutzerbezogenen Metriken. Diese messen beim Laden von Webseiten die Geschwindigkeit, Reaktionsfähigkeit und die visuelle Stabilität. Besitzer von Webseiten können auf diese Weise die Benutzererfahrung im Web messen und zu verbessern. Die Zeiten, in denen Internetseiten Zeile für Zeile […]

First Input Delay (FID)

Was ist der First Input Delay? Der First Input Delay (FID) misst die Zeit, die von der Eingabe eines Nutzers auf einer Webseite bis zur Antwort jener Webseite vergeht. Da ein besserer Wert ein positives Nutzungserlebnis ist, werden Webseiten mit einem geringeren FID, der Teil der Core Web Vitals ist, […]