Was sind die Google Quality Rater Guidelines?

Die Google Quality Rater Guidelines sind ein Leitfaden, der speziellen Google-Mitarbeitern, den Quality Ratern, für die manuelle und objektive Bewertung von Suchanfragen und dazugehörigen Landingpages zur Verfügung gestellt wird. Mithilfe der darin enthaltenen Informationen und Handlungsempfehlungen sollen die Quality Rater stichprobenartig die Effizienz des Suchalgorithmus überprüfen und dabei wichtige Daten für seine Optimierung sammeln.

 

Die aktuelle Version der Quality Rater Guidelines (auch Richtlinien zur Bewertung der Suchqualität genannt) umfasst 168 Inhaltsseiten und ist wie folgt aufgebaut:

Die erste offizielle Veröffentlichung der Guidelines durch Google erfolgte im Jahr 2013. Seitdem werden die Richtlinien in unregelmäßigen Abständen aktualisiert – die neueste Version können Sie hier herunterladen: Google Quality Rater Guidelines 2019 PDF

 

Wer sind Google Quality Rater und welche Aufgabe haben sie?

 

Googles Ziel ist es, dem Suchmaschinen Nutzer stets die relevantesten Ergebnisse für eine spezifische Suchanfrage zu liefern. Dazu nutzt die Suchmaschine seinen allgemeinen Algorithmus „Hummingbird“. Um die Google-Suche schneller und präziser zu machen, wird dieser ständig aktualisiert – Experten sprechen von rund 500-600 Updates pro Jahr. Viele dieser Änderungen sind marginal und werden kaum von der Öffentlichkeit wahrgenommen, größere Updates (z.B. Fred, Panda, Penguin oder Medic) können dagegen zu nachhaltigen Veränderungen der SERPs führen.

 

Zur Überprüfung, ob die durchgeführten Aktualisierungen letztlich das Google-Nutzererlebnis verbessert haben, setzt der Suchmaschinen-Riese auch auf die Mithilfe des Menschen. So werden pro Jahr rund 40.000 Präzisionsauswertungen vor und nach einem Update durch Quality Rater vorgenommen.

 

Konkret bewerten die Quality-Rater die Relevanz einer Landingpage für eine Suchanfrage sowie den Fit zwischen einer Suchanfrage und den angezeigten Suchergebnissen. Ihre Ergebnisse bezüglich der Seitenqualität (PQ) und der Befriedigung der Nutzerintention (NM) übermitteln die Quality Rater abschließend mithilfe spezieller Bewertungsskalen an Google.

 

Das Google Page Quality Rating

 

Die Einschätzung der Qualität einer Website lässt sich in drei Teilaufgaben untergliedern, die stets in der gleichen chronologischen Abfolge erfüllt werden:

Website-Ziel bzw. Website-Zweck

 

Bei der Identifikation der Seitenzielstellung können sich die Quality Rater an einer Vielzahl von Beispielen aus den Guidelines orientieren. Grundsätzlich ist es der Suchmaschine egal, welches Ziel eine Seite verfolgt – wichtig ist nur, dass sie dem Nutzer einen Mehrwert liefert.

 

Eine Seite, die offensichtlich keinen Mehrwert für den Nutzer liefert oder ihm im schlimmsten Fall sogar schadet, muss von den Evaluations-Experten sofort mit der schlechtesten PQ-Bewertung eingestuft werden.

 

Besonders wichtig ist die korrekte Identifikation der Seitenzielstellung im Zusammenhang mit YMYL-Seiten (Your Money Your Life). Diese haben aufgrund ihrer Inhalte einen potenziellen Einfluss auf die Gesundheit, das Wohlbefinden oder die finanzielle Situation eines Nutzers und werden dementsprechend an höheren Qualitätsstandards gemessen.

 

Main Content (MC), Supplementary Content (SC) & Werbung (Ads) – welche Inhalte bewerten die Quality Rater?

Nachdem die Zielstellung einer Website identifiziert ist, müssen die Evaluatoren die Qualität einer entsprechenden Landingpage bewerten. Dazu werden Seiteninhalte den folgenden Kategorien zugeordnet:

 

Die Guidelines schreiben an dieser Stelle vor, dass ein Quality Rater nicht jeden Inhaltsbaustein einer Website einzeln prüfen und korrekt kategorisieren muss. Vielmehr sind die Rater dazu angehalten, ihren Fokus auf die Identifikation und Bewertung des Main Contents zu legen.

 

Dieser Main Content setzt sich aus allen Inhaltselementen (Text, Bilder, Videos, etc.) zusammen, die direkt der Zweck-/Zielerfüllung einer Seite dienen. Nicht sichtbare Inhalte, die beispielsweise unter Tabs zu finden sind, können ebenso zum MC einer Seite zählen.

 

Als Werbung gelten jegliche Banner oder Pop-Ups von Dritten, die auf einer Seite dargestellt werden. Aus Sicht von Google führt Werbung nicht zwangsläufig zu einer schlechten Bewertung der Seitenqualität. Störende Ads, die vom Main Content einer Seite ablenken, ihn unterbrechen oder überdecken haben allerdings immer einen negativen Einfluss auf das PQ-Rating.

 

Zum Supplementary Content (SC) gehören schließlich alle Inhaltselemente, die sich weder dem Main Content noch der Werbung zuordnen lassen. Dies sind beispielsweise Navigationselemente oder andere Inhalte, die zur Verbesserung der User Experience beitragen.

 

Expertise, Authoritativeness & Trustworthiness (EAT) – die Bedeutung glaubwürdiger Inhalte

 

Ob eine Seite ein hohes PQ-Rating erzielt, ist auch von ihrem Level an EAT bzw. der Glaubwürdigkeit oder Reputation ihrer Inhalte abhängig.

 

Dass EAT für das PQ-Rating von großer Bedeutung ist, wird in den Guidelines an mehreren Stellen betont:

 

„Highest quality pages and websites have a very high level of expertise or are highly authoritative or highly trustworthy.“

 

Ebenso wird deutlich, dass Google besonders bei YMYL-Seiten großen Wert auf Glaubwürdigkeit, Vertrauenswürdigkeit und Autorität der Inhalte legt:

 

„Formal Expertise is important for YMYL topics such as medical, financial or legal advice.“

 

oder

 

„Medical search results should be high quality, authoritative and trustworthy.“

 

Zur Einschätzung des EAT-Grades einer entsprechenden Website sollen sich die Quality Rater vor allem an bisherigen Nutzererfahrungen, den Meinungen anerkannter Experten und vorhandenen Website-Informationen orientieren.

 

Die Page Quality Rating Skala

 

Nachdem ein Quality Rater die Zielstellung, den Inhalt und die Vertrauenswürdigkeit einer Seite überprüft hat, muss er nun seine Einschätzung an Google weiterreichen. Dafür nutzt er die von Google bereitgestellte Page-Quality-Rating Skala:

 

Google Page Quality Rating Skala

 

Dabei gelten zunächst zwei Grundsätze:

 

Highest & High Quality Pages

 

Folgende Voraussetzungen müssen erfüllt sein, dass von einem Quality Rater die Bewertung Highest oder High Quality vergeben werden kann:

Als hochqualitative Inhalte definiert Google einzigartige Inhalte, die von Experten des jeweiligen Themenfeldes verfasst wurden und in deren Erstellung offensichtlich großer Aufwand geflossen ist.

 

Medium Quality Pages

 

Der Kategorie Medium Quality sollen Rater zwei Arten von Seiten zuordnen:

Ein Beispiel: Publiziert beispielsweise die renommierte Universität Harvard auf ihrer Website einen qualitativ hochwertigen Fachbeitrag, könnte ein Quality Rater grundsätzlich über ein sehr gutes PQ-Rating nachdenken. Eine fehlende Auszeichnung des Autors jenes Fachbeitrages würde die Bewertung allerdings negativ beeinflussen. Schließlich könnte auch ein Student diesen Artikel verfasst haben, was sein Level an EAT deutlich senken würde. Das Ergebnis wäre folglich ein Medium Quality Rating (Typ 2).

 

Seiten mit niedriger Qualität

 

Mit einer „Low Quality“ sollen die Google-Evaluatoren Seiten bewerten, die folgende Eigenschaften aufweisen:

Seiten, die keinen erkennbaren Nutzen haben oder dem Nutzer schaden, erhalten die Bewertung „Lowest Quality“.

 

Bedürfnisse mobiler Nutzer verstehen – Mobile User Needs

 

Für eine erfolgreiche Optimierung des Google-Algorithmus müssen Quality Rater außerdem die Suchintention eines Nutzers identifizieren und verstehen. Anschließend ist es ihre Aufgabe zu bewerten, inwieweit ein Suchergebnis die jeweilige Suchintention erfüllt.

 

„Remember: If you can’t understand the query and user intent, please release the task. For this reason, understanding the query is a good first step.“

 

Wie der Name bereits vermuten lässt, beschränken sich die Guidelines hierbei ausschließlich auf mobile Suchanfragen. Die verschiedenen Suchintentionen ordnet Google speziellen Kategorien zu:

 

 Know simple queryKnow queryDo queryDevice action queryWebsite queryVisit-in-person query
Beispiel„Wie groß ist Angela Merkel?“„Wofür kann das chemische Element Nickel genutzt werden?“„BMI berechnen“„Termin für 9 Uhr eintragen“„Youtube“„Chinesisches Restaurant“
BeschreibungEinfache Wissensfrage, die in wenigen Sätzen umfassend beantwortet werden kann.Wissensfrage, die man nicht in wenigen Sätzen umfassend beantworten kann.Suchanfragen, die eine bestimmte Aktion zur Folge haben sollen.Suchanfragen, die eine Aktion des Smartphones selbst auslösen sollen.Eine bestimmte Website soll gefunden werden.Suchanfragen, die auf die Ausgabe einer Adresse abzielen.

 

Wichtig für ein umfassendes Verständnis der Suchintention ist außerdem die Art der Suchanfrage. Besonders interessant sind dabei Anfragen, die mehrere Bedeutungen und somit verschiedene Interpretationen haben können:

Ein Beispiel: Sucht ein englischsprachiger User nach Apple, so gilt die Marke Apple als dominante Bedeutung. Der Apfel als Frucht wäre die allgemeine Bedeutung und die Stadt Apple in Oklahoma entspräche der geringfügigen Bedeutung.

 

Flags

 

Darüber hinaus setzen Quality Rater bei der Evaluation der mobilen Nutzerbedürfnisse sogenannte „Flags“ ein. Das Vorhandensein einer oder mehrerer Flags führt letztlich zu einem schlechteren Needs-Met-Rating. Insgesamt können vier verschieden Flags von den Ratern vergeben werden:

Keinen negativen Einfluss auf die Bewertung eines Quality-Raters hat die Foreign Language Flag, wenn der Suchende explizit mit einem fremdsprachigen Suchergebnis gerechnet hat. Die Guidelines liefern hierbei keine fest definierten Vorgaben, wann dies der Fall ist – Quality Rater müssen sich somit auf ihre Erfahrung verlassen und von Fall zu Fall entscheiden.

 

Die Needs Met Rating Skala

 

Ähnlich wie beim PQ-Rating nutzen die Google Evaluatoren anschließend eine spezielle Rating Skala (NM-Rating-Skala), um den Grad der Bedürfnisbefriedigung zwischen Suchanfrage und Suchergebnis an Google zu übermitteln:

 

Google Neds Met Rating Skala

 

RatingDefinition
Fully Meets (FullyM)Spezielle Bewertungskategorie, die nur für bestimmte Anfragen & Ergebnisse gilt. Alle oder fast alle mobilen Nutzer würde das Ergebnis sofort und vollumfänglich befriedigen.
Highly Meets (HM)Sehr hilfreiches Suchergebnis für viele oder alle mobilen Nutzer. Einige Nutzer möchten sich möglicherweise zusätzliche Ergebnisse ansehen.
Moderately Meets (MM)Hilfreich für viele oder sehr hilfreich für einige mobile Nutzer. Möglicherweise würden sich Nutzer zusätzliche Ergebnisse ansehen.
Slightly Meets (SM)Hilfreich für wenige Nutzer. Verbindung zwischen Suchanfrage und Ergebnis ist vorhanden. Allerdings ist diese weder stark noch befriedigend. Großteil der mobilen Nutzer würde sich zusätzliche Ergebnisse anschauen.
Fails to Meet (FailsM)Ergebnis erfüllt die Bedürfnisse mobiler Nutzer nicht. Alle oder fast alle Nutzer würden sich zusätzliche Ergebnisse ansehen.

 

Fazit

 

Wie jedes Jahr ermöglichen die Quality Rater Guidelines auch dieses Jahr einen interessanten Einblick in die Arbeitsweise der Google Quality Rater und sind deshalb eine Pflichtlektüre für jeden, der die Black Box „Google Algorithmus“ besser verstehen möchte.

 

Durch ausführliche Beschreibungen und viele Beispiele zur Bewertung der PQ und der Bedürfnisbefriedigung mobiler Nutzer wird eines erneut deutlich: Für Google steht das Nutzererlebnis im Mittelpunkt eines jeden Algorithmus-Updates. Die einfache Rechnung: Relevante SERPs führen zu zufriedenen Nutzern, zufriedene Nutzer kommen wieder und Google sichert somit seine Stellung als Suchmaschinen-Monopolist.

 

Wer also bei zukünftigen Google-Updates nicht abgestraft werden möchte, sollte ebenfalls dem Mantra der Nutzerzentrierung folgen. SEOs und Webmaster können dazu die Clicks – Quality Rater Checkliste nutzen:

Checklist: Quality Rater Guideline


Leseempfehlungen
blank