Google prüft grundlegende Änderung der Suche
Google erwägt umfassende Anpassungen an seiner Suchmaschine. Künstliche Intelligenz (KI) und große Sprachmodelle (LLMs) könnten künftig eine deutlich wichtigere Rolle im Ranking und in der Darstellung von Suchergebnissen einnehmen. Darüber hinaus wurden neue Details zu den Rankingfaktoren bekanntgegeben, darunter Informationen zu sogenannten Twiddlern und zur Berücksichtigung des Nutzerverhaltens.
Neue Einblicke in Googles Rankingmechanismen
Pandu Nayak, Vice President Search bei Google, hat gegenüber dem US-Justizministerium Informationen zu den Rankingfaktoren und der Funktionsweise der Suche erläutert. Ein entsprechendes Dokument datiert auf den 2. Mai 2025.
Wichtige Punkte im Überblick
- Google erwägt umfassende Änderungen an der Suche, bei denen LLMs und KI eine größere Bedeutung erhalten könnten.
- Es gibt eine Unterscheidung zwischen traditionellen Rankingsignalen und Signalen, die durch maschinelles Lernen erzeugt werden.
- Rankingsignale können eingestellt werden, etwa bei Leistungsproblemen oder technologischen Neuerungen.
- Die Existenz von Twiddlern, also Systemen zum Re-Ranking bestehender Ergebnisse, wurde bestätigt.
Top-Level- und Raw-Rankingsignale
Googles Top-Level-Rankingsignale fassen verschiedene einzelne Signale, sogenannte Raw Signals, zusammen. Einige davon basieren auf maschinellen Lernmodellen, während andere als klassische Signale gelten.
Navboost: Nutzerdaten für die Bewertung
Das Signal Navboost misst, wie oft Nutzende für eine bestimmte Suchanfrage auf ein Dokument klicken. Dafür werden Daten der letzten 13 Monate verwendet. Eine reine Vorhersage von Klicks vermeidet Google bewusst, da diese zu leicht manipulierbar und kein verlässlicher Indikator für Nutzererfahrung sind.
Navboost wird in einer sogenannten „QD Table“ gespeichert, die Suchanfragen und Dokumente sowie deren Häufigkeit miteinander verknüpft.
Einfluss von Nutzerdaten und Signal-Anpassungen
Wie stark Nutzerdaten einzelne Rankingsignale beeinflussen, ist laut Nayak schwer zu beziffern. Einige Signale seien stärker davon abhängig als andere. Google stellt regelmäßig Signale ein, wenn bessere Alternativen verfügbar sind, ihre Leistung nachlässt oder sie aufgrund der Weiterentwicklung des Internets an Bedeutung verlieren.
Twiddler: Re-Ranking von Ergebnissen
Bestätigt wurde auch die Existenz sogenannter Twiddler, die dazu dienen, bestehende Suchergebnisse nachträglich neu zu bewerten und zu ordnen.
RankEmbed: Maschinelles Lernen für das Ranking
Ein wichtiges ML-basiertes Rankingsignal ist RankEmbed. Hierbei werden Suchanfragen und Dokumente in einen gemeinsamen sogenannten „Embedding Space“ übertragen. Anhand der Distanzen in diesem Raum wird das Ranking berechnet. Dabei kommen semantische und weitere Signale zum Einsatz.
Mit der verbesserten Zuverlässigkeit von Techniken wie RankEmbed, RankBrain und DeepRank nutzt Google zunehmend Modelle des maschinellen Lernens zur Erzeugung von Rankingsignalen.
Untersuchungen haben ergeben, dass sich die Signale von DeepRank ML, einem auf BERT basierenden Modell, in Einzelteile zerlegen lassen, die klassischen Signalen ähneln. Die Kombination traditioneller und vorhergesagter Signale führt laut Google zu besseren Ergebnissen.
PageRank und Q*
Nach wie vor wird der ursprüngliche PageRank zur Bewertung der Qualität von Seiten herangezogen. Die Qualität eines Dokuments bezeichnet Google dabei als „Q*“ (ausgesprochen „Q star“).
Früher nutzte Google ein Rankingverfahren nach dem Vorbild von Okapi BM25, um die Relevanz von Dokumenten für Suchanfragen zu bestimmen.
Möglichkeiten des Google-Nachbaus
Bereits einige Hundert Kombinationen aus Suchanfragen und Ergebnissen könnten ausreichen, um Googles Rankingsignale näherungsweise zu bestimmen. Wettbewerber könnten so die Suche nachbauen. Google selbst hat den Zeitraum für die genutzten Daten in ML-Modellen schrittweise verkürzt – von 90 auf 60 Tage und weniger. Ziel ist es, diese Reduzierung nur so weit vorzunehmen, dass die Leistungsfähigkeit für Nutzende nicht beeinträchtigt wird.
Grundlegende Überarbeitung der Google-Suche im Gespräch
Derzeit wird bei Google über eine grundlegende Überarbeitung des gesamten Search Stack nachgedacht. LLMs könnten dabei eine zentrale Rolle spielen. Geplant ist, Kernbereiche wie das Ranking, die Ergebnisbereitstellung und die Darstellung der Suchergebnisse an die Möglichkeiten moderner KI-Systeme anzupassen. Dabei soll auch die benötigte Rechenzeit je nach Anwendung berücksichtigt werden.