Die Google Quality Rater Guidelines sind ein Leitfaden, der speziellen Google-Mitarbeitern, den Quality Ratern, für die manuelle und objektive Bewertung von Suchanfragen und dazugehörigen Landingpages zur Verfügung gestellt wird. Mithilfe der darin enthaltenen Informationen und Handlungsempfehlungen sollen die Quality Rater stichprobenartig die Effizienz des Suchalgorithmus überprüfen und dabei wichtige Daten für seine Optimierung sammeln.
Die aktuelle Version der Quality Rater Guidelines (auch Richtlinien zur Bewertung der Suchqualität genannt) umfasst 171 Inhaltsseiten und ist wie folgt aufgebaut:
Die erste offizielle Veröffentlichung der Guidelines durch Google erfolgte im Jahr 2013. Seitdem werden die Richtlinien in unregelmäßigen Abständen aktualisiert – die neueste Version können Sie hier herunterladen: Google Quality Rater Guidelines 2022 PDF
Googles Ziel ist es, dem Suchmaschinen Nutzer stets die relevantesten Ergebnisse für eine spezifische Suchanfrage zu liefern. Dazu nutzt die Suchmaschine seinen allgemeinen Algorithmus „Hummingbird“. Um die Google-Suche schneller und präziser zu machen, wird dieser ständig aktualisiert – Experten sprechen von rund 500-600 Updates pro Jahr. Viele dieser Änderungen sind marginal und werden kaum von der Öffentlichkeit wahrgenommen, größere Updates (z.B. Fred, Panda, Penguin oder Medic) können dagegen zu nachhaltigen Veränderungen der SERPs führen.
Zur Überprüfung, ob die durchgeführten Aktualisierungen letztlich das Google-Nutzererlebnis verbessert haben, setzt der Suchmaschinen-Riese auch auf die Mithilfe des Menschen. So werden pro Jahr rund 40.000 Präzisionsauswertungen vor und nach einem Update durch Quality Rater vorgenommen.
Konkret bewerten die Quality-Rater die Relevanz einer Landingpage für eine Suchanfrage sowie den Fit zwischen einer Suchanfrage und den angezeigten Suchergebnissen. Ihre Ergebnisse bezüglich der Seitenqualität (PQ) und der Befriedigung der Nutzerintention (NM) übermitteln die Quality Rater abschließend mithilfe spezieller Bewertungsskalen an Google.
Die Einschätzung der Qualität einer Website lässt sich in drei Teilaufgaben untergliedern, die stets in der gleichen chronologischen Abfolge erfüllt werden:
Bei der Identifikation der Seitenzielstellung können sich die Quality Rater an einer Vielzahl von Beispielen aus den Guidelines orientieren. Grundsätzlich ist es der Suchmaschine egal, welches Ziel eine Seite verfolgt – wichtig ist nur, dass sie dem Nutzer einen Mehrwert liefert.
Eine Seite, die offensichtlich keinen Mehrwert für den Nutzer liefert oder ihm im schlimmsten Fall sogar schadet, muss von den Evaluations-Experten sofort mit der schlechtesten PQ-Bewertung eingestuft werden.
Besonders wichtig ist die korrekte Identifikation der Seitenzielstellung im Zusammenhang mit YMYL-Seiten (Your Money Your Life). Diese haben aufgrund ihrer Inhalte einen potenziellen Einfluss auf die Gesundheit, das Wohlbefinden oder die finanzielle Situation eines Nutzers und werden dementsprechend an höheren Qualitätsstandards gemessen.
Nachdem die Zielstellung einer Website identifiziert ist, müssen die Evaluatoren die Qualität einer entsprechenden Landingpage bewerten. Dazu werden Seiteninhalte den folgenden Kategorien zugeordnet:
Die Guidelines schreiben an dieser Stelle vor, dass ein Quality Rater nicht jeden Inhaltsbaustein einer Website einzeln prüfen und korrekt kategorisieren muss. Vielmehr sind die Rater dazu angehalten, ihren Fokus auf die Identifikation und Bewertung des Main Contents zu legen.
Dieser Main Content setzt sich aus allen Inhaltselementen (Text, Bilder, Videos, etc.) zusammen, die direkt der Zweck-/Zielerfüllung einer Seite dienen. Nicht sichtbare Inhalte, die beispielsweise unter Tabs zu finden sind, können ebenso zum MC einer Seite zählen.
Als Werbung gelten jegliche Banner oder Pop-Ups von Dritten, die auf einer Seite dargestellt werden. Aus Sicht von Google führt Werbung nicht zwangsläufig zu einer schlechten Bewertung der Seitenqualität. Störende Ads, die vom Main Content einer Seite ablenken, ihn unterbrechen oder überdecken haben allerdings immer einen negativen Einfluss auf das PQ-Rating.
Zum Supplementary Content (SC) gehören schließlich alle Inhaltselemente, die sich weder dem Main Content noch der Werbung zuordnen lassen. Dies sind beispielsweise Navigationselemente oder andere Inhalte, die zur Verbesserung der User Experience beitragen.
Ob eine Seite ein hohes PQ-Rating erzielt, ist auch von ihrem Level an EEAT bzw. der Glaubwürdigkeit oder Reputation ihrer Inhalte abhängig.
Dass EEAT für das PQ-Rating von großer Bedeutung ist, wird in den Guidelines an mehreren Stellen betont:
„Experience, Expertise and Authoritativeness are important concepts that can support your assessment of Trust.“
Ebenso wird deutlich, dass Google besonders bei YMYL-Seiten großen Wert auf Glaubwürdigkeit, Vertrauenswürdigkeit und Autorität der Inhalte legt:
„If the purpose of a page on a clear YMYL topic is to give information or offer advice, a high level of expertise may be required for the page to be trustworthy.financial or legal advice.“
oder
„Pages that share first-hand life experience on clear YMYL topics may be considered to have high E-E-A-T as long as the content is trustworthy, safe, and consistent with well-established expert consensus. In contrast, some types of YMYL information and advice must come from experts.“
Zur Einschätzung des EEAT-Grades einer entsprechenden Website sollen sich die Quality Rater vor allem an bisherigen Nutzererfahrungen, den Meinungen anerkannter Experten und vorhandenen Website-Informationen orientieren.
Nachdem ein Quality Rater die Zielstellung, den Inhalt und die Vertrauenswürdigkeit einer Seite überprüft hat, muss er nun seine Einschätzung an Google weiterreichen. Dafür nutzt er die von Google bereitgestellte Page-Quality-Rating Skala:
Dabei gelten zunächst zwei Grundsätze:
Folgende Voraussetzungen müssen erfüllt sein, dass von einem Quality Rater die Bewertung Highest oder High Quality vergeben werden kann:
Als hochqualitative Inhalte definiert Google einzigartige Inhalte, die von Experten des jeweiligen Themenfeldes verfasst wurden und in deren Erstellung offensichtlich großer Aufwand geflossen ist.
Der Kategorie Medium Quality sollen Rater zwei Arten von Seiten zuordnen:
Ein Beispiel: Publiziert beispielsweise die renommierte Universität Harvard auf ihrer Website einen qualitativ hochwertigen Fachbeitrag, könnte ein Quality Rater grundsätzlich über ein sehr gutes PQ-Rating nachdenken. Eine fehlende Auszeichnung des Autors jenes Fachbeitrages würde die Bewertung allerdings negativ beeinflussen. Schließlich könnte auch ein Student diesen Artikel verfasst haben, was sein Level an EEAT deutlich senken würde. Das Ergebnis wäre folglich ein Medium Quality Rating (Typ 2).
Mit einer „Low Quality“ sollen die Google-Evaluatoren Seiten bewerten, die folgende Eigenschaften aufweisen:
Seiten, die keinen erkennbaren Nutzen haben oder dem Nutzer schaden, erhalten die Bewertung „Lowest Quality“.
Für eine erfolgreiche Optimierung des Google-Algorithmus müssen Quality Rater außerdem die Suchintention eines Nutzers identifizieren und verstehen. Anschließend ist es ihre Aufgabe zu bewerten, inwieweit ein Suchergebnis die jeweilige Suchintention erfüllt.
„Remember: If you can’t understand the query and user intent, please release the task. For this reason, understanding the query is a good first step.“
Wie der Name bereits vermuten lässt, beschränken sich die Guidelines hierbei ausschließlich auf mobile Suchanfragen. Die verschiedenen Suchintentionen ordnet Google speziellen Kategorien zu:
Know simple query | Know query | Do query | Device action query | Website query | Visit-in-person query | |
Beispiel | „Wie groß ist Angela Merkel?“ | „Wofür kann das chemische Element Nickel genutzt werden?“ | „BMI berechnen“ | „Termin für 9 Uhr eintragen“ | „Youtube“ | „Chinesisches Restaurant“ |
Beschreibung | Einfache Wissensfrage, die in wenigen Sätzen umfassend beantwortet werden kann. | Wissensfrage, die man nicht in wenigen Sätzen umfassend beantworten kann. | Suchanfragen, die eine bestimmte Aktion zur Folge haben sollen. | Suchanfragen, die eine Aktion des Smartphones selbst auslösen sollen. | Eine bestimmte Website soll gefunden werden. | Suchanfragen, die auf die Ausgabe einer Adresse abzielen. |
Wichtig für ein umfassendes Verständnis der Suchintention ist außerdem die Art der Suchanfrage. Besonders interessant sind dabei Anfragen, die mehrere Bedeutungen und somit verschiedene Interpretationen haben können:
Ein Beispiel: Sucht ein englischsprachiger User nach Apple, so gilt die Marke Apple als dominante Bedeutung. Der Apfel als Frucht wäre die allgemeine Bedeutung und die Stadt Apple in Oklahoma entspräche der geringfügigen Bedeutung.
Darüber hinaus setzen Quality Rater bei der Evaluation der mobilen Nutzerbedürfnisse sogenannte „Flags“ ein. Das Vorhandensein einer oder mehrerer Flags führt letztlich zu einem schlechteren Needs-Met-Rating. Insgesamt können vier verschieden Flags von den Ratern vergeben werden:
Keinen negativen Einfluss auf die Bewertung eines Quality-Raters hat die Foreign Language Flag, wenn der Suchende explizit mit einem fremdsprachigen Suchergebnis gerechnet hat. Die Guidelines liefern hierbei keine fest definierten Vorgaben, wann dies der Fall ist – Quality Rater müssen sich somit auf ihre Erfahrung verlassen und von Fall zu Fall entscheiden.
Ähnlich wie beim PQ-Rating nutzen die Google Evaluatoren anschließend eine spezielle Rating Skala (NM-Rating-Skala), um den Grad der Bedürfnisbefriedigung zwischen Suchanfrage und Suchergebnis an Google zu übermitteln:
Rating | Definition |
Fully Meets (FullyM) | Spezielle Bewertungskategorie, die nur für bestimmte Anfragen & Ergebnisse gilt. Alle oder fast alle mobilen Nutzer würde das Ergebnis sofort und vollumfänglich befriedigen. |
Highly Meets (HM) | Sehr hilfreiches Suchergebnis für viele oder alle mobilen Nutzer. Einige Nutzer möchten sich möglicherweise zusätzliche Ergebnisse ansehen. |
Moderately Meets (MM) | Hilfreich für viele oder sehr hilfreich für einige mobile Nutzer. Möglicherweise würden sich Nutzer zusätzliche Ergebnisse ansehen. |
Slightly Meets (SM) | Hilfreich für wenige Nutzer. Verbindung zwischen Suchanfrage und Ergebnis ist vorhanden. Allerdings ist diese weder stark noch befriedigend. Großteil der mobilen Nutzer würde sich zusätzliche Ergebnisse anschauen. |
Fails to Meet (FailsM) | Ergebnis erfüllt die Bedürfnisse mobiler Nutzer nicht. Alle oder fast alle Nutzer würden sich zusätzliche Ergebnisse ansehen. |
Wie jedes Jahr ermöglichen die Quality Rater Guidelines auch dieses Jahr einen interessanten Einblick in die Arbeitsweise der Google Quality Rater und sind deshalb eine Pflichtlektüre für jeden, der die Black Box „Google Algorithmus“ besser verstehen möchte.
Durch ausführliche Beschreibungen und viele Beispiele zur Bewertung der PQ und der Bedürfnisbefriedigung mobiler Nutzer wird eines erneut deutlich: Für Google steht das Nutzererlebnis im Mittelpunkt eines jeden Algorithmus-Updates. Die einfache Rechnung: Relevante SERPs führen zu zufriedenen Nutzern, zufriedene Nutzer kommen wieder und Google sichert somit seine Stellung als Suchmaschinen-Monopolist.
Wer also bei zukünftigen Google-Updates nicht abgestraft werden möchte, sollte ebenfalls dem Mantra der Nutzerzentrierung folgen. SEOs und Webmaster können dazu die Clicks – Quality Rater Checkliste nutzen: