Skip to main content

Semantische Suche – ein kurzer Überblick

  • SEO-Küche Logo


PDF herunterladen

semantic_xkcd.com
http://xkcd.com/1046/

Google wird semantisch – und das schon länger. Den Gedanken einer semantischen Suchmaschine, die natürlich gesprochene, bzw. geschriebene Fragen erkennt und passende Antworten liefert, gibt es schon seit den 1990ern. Google hat mit der “Knowledge Box” schon einiges in der Richtung geliefert. Leider kann die Box nicht wirklich viel. Wie das Wetter wird, ist zwar ganz interessant, die Körpergrößen verschiedener Politiker haben im besten Fall einen Unterhaltungswert.

semantic_körpergroesse

Schauen wir uns in Auszügen den aktuellen Stand der semantischen Suche an.

Was Google können sollte

Bill Slawski ist mit seobythesea.com wohl die beste Adresse, um Google Patente erklärt zu bekommen. Erst kürzlich erschienen zwei Blogbeiträge zur semantischen Suche:

Insightful Connections Between Entities On Google’s Knowledge Graph

Der Kern des Beitrages dreht sich um „insightful connections“ zwischen Entitäten. Das bedeutet folgendes:

Wir haben zwei Entitäten, I und II, die untereinander eine Verbindung erster Ordnung aufweisen. I und II haben eine weitere Verbindung zu Entität III – aber mit unterschiedlicher Qualität und Ordnung. Das Patent soll diese Verbindungen und deren unterschiedlichen Qualitäten erkennen und indexieren können.

Beispiel: Ein Schauspieler I spielt in einem Film II mit. Im Film II spielt außerdem Schauspieler III mit. Die Verbindung zwischen I und II ist eine Verbindung erster Ordnung. Damit haben II und III ebenfalls eine Verbindung erster Ordnung, I und III aber eine Verbindung zweiter Ordnung.

Genug des müßigen Geredes, was soll das bedeuten? Wir behalten dieses Verbindungs-System im Hinterkopf und kommen zum zweiten Beitrag:

How A Search Engine Might Use Entities To Respond To Compositional Queries

Es geht um zusammengesetzte Suchanfragen und wie Google diese verstehen könnte. Eine zusammengesetzte Suchanfrage wäre bspw. „McDonalds in der Nähe von Rosenheim“ aber auch „Filme, die im 2. WK gedreht wurden“. Hier muss Google die Suchanfrage aufsplitten:

„McDonalds“ ist eine Entität, „Rosenheim“ ebenso. Außerdem haben wir „in der Nähe von“, welche eine räumliche Verbindung zwischen den beiden Entitäten darstellt. Google muss nun die Entitäten, und die Art der Verbindung zwischen diesen, definieren und indexieren.

Bisher noch nichts Neues, interessant wird es, wenn man Synonyme und “false friends” hinzuzieht: Erkennt Google „McDoof“ als „McDonalds“? Oder „Rosenheim“ als „Stadt in Oberbayern, in der die Autobahnpolizei stationiert ist“?

Folgt man Bill Slawski, so ist dies theoretisch möglich – Google könnte das alles gut einordnen. Aber wir sehen es noch nicht. Die „Knowledge Box“ beschäftigt sich mit eher einfachen Suchanfragen, wie das Wetter wird und so weiter. Google hat die theoretischen Grundlagen, die Praxis ist noch nicht sichtbar

Bedenken sollte man auch, dass die theoretische Arbeit hinter der semantischen Suche schon älter als Google und nicht auf Google beschränkt ist. Wer wissen will, wie eine semantische Suche funktionieren könnte und welche Konzepte es gibt, findet hier einen Einstieg: Hanna Bast, Semantische Suche

Bilderkennung

semantic_bilderkennung

Der Text unter den Bildern wurde maschinell generiert und zwar vom selben Algorithmus, der die Bilder ausgelesen hat. Diese Technik kommt aus dem Google Research Programm, genauer von Andrej Karpathy. Weitere Beispiele und das zugehörige Paper findet ihr hier: Deep Visual-Semantic Alignments for Generating Image Descriptions

Schema.org soll Harmonie herstellen

Nehmen wir ein kleines Video, das das Kernproblem der semantischen Suche verdeutlicht: Die fehlende Harmonie des Internets.

[youtube id=”-R87nJi9YyQ” width=”600″ height=”350″]

Es gibt unzählige verschiedene Server, Serverkonfigurationen, Datenbanken, Zugriffsarten, Webseitenstrukturen etc. Ein Crawler muss mit all diesen Konfigurationen zurechtkommen, was sehr viele Ressourcen bindet. Es gibt aber (mindestens) eine Lösung: Microformate, die jede Entität in einer einheitlichen Sprache auszeichnen. Dann ist es auch egal, wie verkorkst eine Webseite aufgesetzt ist. Der Crawler kann jede Entität einer Seite erkennen, “verstehen” und mit anderen Enitäten auf anderen Seiten in Verbindung bringen. Genau dafür scheint Hummingbird ausgelegt zu sein. Favorit der Suchmaschinen ist schema.org.

Longtail, Synonyme, Keyword-Clouds und Themen

Neben schema.org gibt es eine ganze Reihe weiterer Maßnahmen, mit denen man eine Webseite für eine semantische Suche fit machen kann wie das gezielte Einsetzen von Synonymen, Keyword-Clouds, Topics statt Keywords, Longtail-Keywords sowie logische und semantische Zusammenhänge zwischen der Domain und der “Marke” hinter der Domain.

Fazit

Ob sich schema.org langfristig durchsetzen oder durch einen besseren Algorithmus einer Suchmaschine obsolet wird, ist unsicher. Sicher ist aber, Hummingbird ist da. Und dass eine semantische SEO Optimierung zu besseren Rankings führt. Der Alt-Tag wird vielleicht mittelfristig ausgedient haben, zusammen mit einer einer Keyword-Cloud, kann man auch mit Synonymen optimieren. Was eine Marke im SEO ist, wird in Grundzügen langsam klarer, eine umfassende Definition steht noch aus. Wer hier Einwände hat, immer her damit 😉

Keine Kommentare vorhanden


Hast du eine Frage oder Meinung zum Artikel? Schreib uns gerne etwas in die Kommentare.

Ihre E-Mail Adresse wird nicht veröffentlicht

Jetzt den SEO-Küche-Newsletter abonnieren

Ähnliche Beiträge

Titelbild CTR optimieren

CTR optimieren

  • christoph pawletko
  • von Christoph
  • 19.04.2024

CTR optimieren: Unsere Tipps für eine bessere Klickrate Die Klickrate oder CTR (Click-Through-Rate) ist eine der wichtigsten Metriken im Online-Marketing und SEO. Um Traffic und damit letztlich auch Gewinn bzw. Leads zu generieren, muss eine Webseite nicht nur möglichst weit oben im Google Ranking auftauchen, sondern auch angeklickt werden. Lest […]

12 Gründe, warum euer organischer Traffic zurückgeht

  • christoph pawletko
  • von Christoph
  • 11.04.2024

12 Gründe, warum euer organischer Traffic zurückgeht Habt ihr festgestellt, dass der organische Traffic auf eurer Website nachlässt und ihr wisst nicht warum? Geht die folgenden 12 Fragen durch, um mögliche Schwachstellen in eurer SEO-Strategie zu identifizieren und zu korrigieren. 1. Könnte es ein Problem mit der Datenerfassung geben? Bevor […]

Content Plan erstellen Titelbild

Content Plan erstellen in 6 Schritten

  • christoph pawletko
  • von Christoph
  • 05.04.2024

Content Planung leicht gemacht Content ist King. Das gilt seit Jahren, doch ohne Plan funktioniert Content Marketing einfach nicht. Wer wirklich die eigene Website mit dem richtigen Content nach vorne bringen will, sollte einen Content-Plan erstellen und nach diesem arbeiten. Wir zeigen, wie es geht. Was versteht man unter einem […]

SEO-Abkürzungen Titelbild

SEO-Abkürzungen

  • christoph pawletko
  • von Christoph
  • 28.03.2024

Alle SEO-Begriffe und Abkürzungen aus der Suchmaschinenoptimierung Jedes Fachgebiet hat oft eigene Abkürzungen und Fachbegriffe. Für Eingeweihte sind die üblichen SEO-Abkürzungen wie SEA, CPC, SEM, SERP, CTR, PPC, etc. völlig normal, doch Branchenfremde oder Einsteiger sind bei Fachartikeln oder in Gesprächen schnell überfordert. Wir erklären kurz und knapp die wichtigsten […]

Storytelling Tools Titelbild

Storytelling-Tools Sammlung

  • christoph pawletko
  • von Christoph
  • 22.03.2024

Storytelling Tools und Scrollytelling Tools: Diese Tools helfen euch, Geschichten zu erzählen Gute Geschichten wecken Emotionen und reißen Menschen beim Lesen mit. Das hat schon vor tausenden von Jahren an der Feuerstelle funktioniert und tut dies auch heute noch im digitalen Zeitalter. Storytelling-Tools helfen euch im Content-Marketing eure Geschichten noch […]

Titelbild barrierefreie Website

Barrierefreie Website – Das muss man wissen

  • christoph pawletko
  • von Christoph
  • 15.03.2024

Webseiten ohne Zugangsbeschränkungen: Ein Gewinn für jeden Die Zugänglichkeit von Webseiten ist auch heute noch keine Selbstverständlichkeit. Eine Studie von Google und Aktion Mensch zeigt, dass zwei Drittel der großen Online-Shops in Deutschland nicht ohne Barrieren zugänglich sind. Solche Hindernisse im Netz machen es unmöglich, dass Webangebote von jedem uneingeschränkt […]