Suchmaschine (Bild: Pixabay)

Wie funktioniert eine Suchmaschine?

Wer SEO wirklich verstehen will, sollte wissen, wie Google, Bing & Co. funktionieren. Wir erklären es.

Ein Gastbeitrag von Jonas Preckeler

Was sind die Hauptaufgaben einer Suchmaschine?

Der Nutzer tippt einen Begriff ein und schon spuckt die Suchmaschine passende Ergebnisse aus. So weit, so einfach. Obwohl zwischen Anfrage und Ergebnispräsentation oftmals nur wenige Millisekunden vergehen, spielen sich im Hintergrund verschiedenste Prozesse ab. Diese lassen sich grob in drei Kategorien unterteilen:

    1. Datengewinnung
    2. Analyse und Aufbereitung
    3. Verarbeitung der Suchanfrage und Ergebnispräsentation

Schritt 1: Datengewinnung

Eine Suchmaschine präsentiert keine Live-Ergebnisse. Vielmehr wird bei einer Nutzeranfrage eine Datenbank des Anbieters wie Google oder Bing durchsucht. Das bedeutet, der Suchmaschinenanbieter muss eine möglichst aktuelle Datenbank aller relevanten Webdokumente aufbauen und pflegen.

Diese Aufgabe übernimmt das Webcrawler-System. Hierbei entsendet zum Beispiel Google sogenannte Crawler, die das Internet abgrasen und eine Kopie der Webdokumente erstellen.

Basierend auf einer Übersicht, der in der Datenbank enthaltenen Dokumente (Dokumentenindex), wird eine Art „Schichtplan“ (Scheduler) für die Crawler erstellt. So ist stets deutlich welche URLs sie zu besuchen und abzuspeichern haben. Beim Besuchen einer URL erhält der Crawler verschiedenste Informationen vom Webserver. Diese sammelt der Storeserver und wertet sie aus.

Mithilfe dieser Information aktualisiert sich der Dokumentenindex. So kann es zum Beispiel vorkommen, dass eine Website nicht mehr unter der gespeicherten URL erreichbar ist und darum aus der Datenbank gelöscht werden muss. Schlussendlich speichert der Crawler das heruntergeladene Webdokument in der Datenbank (Repository).

Schritt 2: Analyse und Aufbereitung

Um die relevantesten Dokumente für eine Suchanfrage präsentieren zu können, müssen Google & Co. diese verstehen und analysieren können. Hierzu bringen die Suchmaschinen die Webdokumente zuerst in ein einheitliches Format. Diese Aufgabe übernimmt der sogenannte Parser, ein Computerprogramm zur Analyse von Quellcodes.

Nachdem Entfernen aller HTML-Tags, beginnt der Parser mit der Identifikation der einzelnen Wörter. Hierzu analysiert er verschiedene Wortseparatoren, zum Beispiel Leer- oder Satzzeichen . Anschließend geht es darum, die Sprache des Dokuments zu erkennen. Basierend auf der Identifikation der Sprache können die einzelnen Wörter auf Ihre Grundform reduziert werden. So kann die Suchmaschine verwandte Begriffe wie „Tisch“ oder „Tische“ zusammenfassen und effizienter arbeiten.

Danach entfernt das System alle Stoppwörter. Hierbei handelt es sich um Begriffe mit keiner oder geringer inhaltlicher Bedeutung, zum Beispiel „aber“ oder „mit“.

Alle oben genannten Schritte dienen dem Ziel der Keyword-Extrahierung. Das bedeutet, der Parser identifiziert Schlüsselwörter, die das Thema eines Textes möglichst genau beschreiben. Hierbei zählt nicht nur die reine Häufigkeit des Auftretens, vielmehr wird die inhaltliche Relevanz eines Textes für ein bestimmtes Suchwort mithilfe von verschiedensten, geheimen Algorithmen bestimmt.

Danach nimmt der Parser mithilfe von verschiedenen Berechnungen eine Gewichtung der extrahierten Suchbegriffe vor. All diese Prozesse dienen schlussendlich dazu, eine durchsuchbare Datenstruktur zu erstellen.

Schritt 3: Verarbeitung der Suchanfrage und Ergebnispräsentation

Auch die Suchanfrage des Nutzers muss von der Suchmaschine verstanden und analysiert werden. Die Verarbeitung der Suchanfrage erfolgt nach einem ähnlichen Prinzip, wie die Analyse der Webdokumente. Wieder identifizieren Google und Bing einzelne Wörter, entfernen Stoppwörter und führen ein Stemming-Verfahren durch. Anschließend erstellen sie eine Query („Suchanfrage“), die nur noch die nötigsten Informationen enthält und ein Durchsuchen des Dokumentenindexes erlaubt.

Das Durchsuchen des Dokumentenindex nennt man Matching. Hierbei werden alle Dokumente gesucht, die für die Query relevant sind. Diese Dokumente werden schlussendlich, basierend auf Ihrer Gewichtung, in einer sortierten Ergebnisliste für den Nutzer aufbereitet. Diese Liste kennen wir als SERPs (Search Engine Result Pages).

Fazit

Zusammenfassend kann man also sagen, dass eine Suchmaschine alle relevanten Dokumente des World Wide Webs in einer ständig aktualisierten Datenbank sammelt, diese Dokumente anschließend aufbereitet, analysiert und gewichtet. Das Ergebnis ist eine nach Relevanz sortierte Ergebnisliste.


Über den Autor:

Jonas Preckeler arbeitet im Bereich Online Marketing mit Erfahrung in SEO, SEA und Content-Marketing. Er verfügt über einen Masterabschluss mit Auszeichnung in Digital Marketing. Außerdem interessiert er sich sehr für die Konversionsoptimierung mit Behaviour Patterns. Im SEO-Otter Blog schreibt er über spannende Themen aus der SEO- und CRO-Welt.


Vermittle dein Wissen bei uns!


Bist du ein Experte in einem Fachgebiet? Pushe dein Image und werde Gastautor! Veröffentliche bei StartUpWissen.biz einen kostenlosen Gastbeitrag, um eine große Zielgruppe anzusprechen.

> Gastbeiträge einreichen: mehr Infos

Bilder: Pixabay, SEO-Otter

Kommentar hinterlassen