Neue Gemius-Methodik in einer Welt ohne Drittanbieter-Cookies
Kreuzmedien

Neue Gemius-Methodik in einer Welt ohne Drittanbieter-Cookies

Bei der Durchführung der gemiusAudience-Studie standen wir wiederholt vor Herausforderungen, wie wir die Anzahl der Real Internet Users basierend auf den gezählten Identifikatoren messen können, die Browser in „Cookies“ zuweisen ließen. Von Anfang an enthielt unsere Methodik Elemente, die Phänomene wie die Nutzung mehrerer Geräte durch eine Person, die gemeinsame Nutzung eines Geräts durch mehrere Personen oder das Löschen von Cookies eliminierten. Die Einstellung der Unterstützung von Drittanbieter-Cookies (TPC) durch Browser und deren Abschaltung durch Chrome stellt eine weitere methodische Herausforderung dar.

Unsere Antwort auf die „Welt ohne Cookies“ ist eine neue Version der gemiusAudience-Methodik:
JAR (Joint Apocalypse Response) – eine umfassende Lösung, die die Kontinuität und Qualität der gemiusAudience-Ergebnisse auch nach dem viel angekündigten „Apokalypse“-Szenario bewahrt. Diese neue Methode ermöglicht es auch, die Anzahl der Real Users für andere Browser zu schätzen, die das Drittanbieter-Cookie-Tracking früher als Chrome deaktiviert haben.

Wie wird die Anzahl der Real Users neu geschätzt?

Die gemiusAudience-Studie basiert auf einer hybriden Methodik, deren zwei Hauptkomponenten der Site-centric Audit und die Panelbefragung sind. In beiden Bereichen waren Drittanbieter-Identifikatoren die Quelle für Nutzerinformationen. Die neue Realität ohne Drittanbieter-Identifikatoren bringt zwei Herausforderungen mit sich:

  1. Wie kann die Anzahl der Real Users für domänenspezifische Daten geschätzt werden, die auf site-zentrierten Daten basieren?
  2. Wie können Panelisten in Cookie-Panel-Studien rekrutiert und überwacht werden, um das soziodemografische Profil der Internetnutzer zu bestimmen?
Neue Gemius-Methodik in einer Welt ohne Drittanbieter-Cookies graph 2

Die Anzahl der Real Users ist eine Schlüsselmetrik, die die Größe des Publikums anzeigt. Sie kann sowohl aus Umfragestichproben als auch aus Vollerhebungen geschätzt werden. Letzteres eliminiert statistische Fehler, die für kleine oder mittelgroße Verlage oder Werbekampagnen die Ergebnisse statistisch unbedeutend machen können. Deshalb enthält die Mediapanel-Studie seit 2004 einen site-zentrierten Audit, der es ermöglicht, jeden Seitenaufruf und jeden Nutzerkontakt mit einer Verlagsseite genau zu messen.

Die Anzahl der Real Users ist eine wichtige Kennzahl zur Bestimmung der Zielgruppengröße. Sie kann aus Stichproben sowie aus Vollerhebungen, also Messungen innerhalb der gesamten Population, geschätzt werden. Letzteres Verfahren eliminiert den statistischen Fehler, der bei mittelgroßen oder kleinen Verlagen bzw. Werbekampagnen die Ergebnisse statistisch unbedeutend machen könnte. Aus diesem Grund enthält die Mediapanel-Umfrage für Verlage seit 2004 eine Site-Centric-Komponente (Audit), die es ermöglicht, jede Seitenansicht und jeden Benutzerkontakt mit der Website eines Verlags präzise zu messen.

Der "Real User"-Algorithmus zur Schätzung der RU-Werte aus den Audit-Daten besteht aus zwei Komponenten:

  1. Die Komponente zur Schätzung der Browser-Instanz-Nummer (BN), die basierend auf den gesammelten Identifikatoren, nach der Eliminierung von Cookie-Löschungen und unter Berücksichtigung von Nicht-Cookie-Traffic bestimmt, mit wie vielen verschiedenen Browser-Instanzen Benutzer eine Domain besucht haben.
  2. Ein Schätzer für die Anzahl der Benutzer, die diese Browser verwendet haben.

Die RU-Werte werden für die folgenden Segmente berechnet:

  • Gruppe von Domains
  • Domain/Anwendung/Audio-/Videoplayer
  • Dienst auf der Domain

Die Änderung der Chrome-Unterstützung führt dazu, dass der gemessene Teil des Internets in so viele ID-Räume aufgeteilt wird, wie es Domains/Apps in der Studie gibt. Dies erfordert eine Anpassung der Algorithmen, die doppelte Benutzer zwischen Domains innerhalb der Eigentümergruppe zählen. Darüber hinaus erforderte der Übergang zu 1st-Party-Identifikatoren eine Änderung der Methode zur Eliminierung der Löschbarkeit von Cookies. Die Löschbarkeit von 1st-Party-Identifikatoren weist deutlich andere Eigenschaften auf als die von 3rd-Party-Identifikatoren.

In der neuen Version der Browser-Nummern-Komponente wurde der Algorithmus in vier Berechnungsphasen unterteilt:

  • Für eine Domain an einem Tag
  • Für eine Gruppe von Domains an einem Tag
  • Für eine Domain über einen Zeitraum von z. B. einem Monat
  • Für eine Gruppe von Domains über einen Zeitraum von z. B. einem Monat

Für eine einzelne Domain an einem einzigen Tag wechselten wir die Berechnung von 3rd-Party- zu 1st-Party-Identifikatoren und berücksichtigten die geänderten Eigenschaften dieser Sets.

Neue Gemius-Methodik in einer Welt ohne Drittanbieter-Cookies graph 2

Um doppelte Abdeckung innerhalb einer Domain-Gruppe zu eliminieren, haben wir eine Methode entwickelt, die auf dem festgelegten Satz charakteristischer IP-Adressen und den in einer früheren Phase berechneten Browser-Nummern (BN) für jede Domain basiert. Diese Methode bestimmt den Gesamtwert der Real Users für die Eigentümergruppe. Der BN-Schätzer für eine Gruppe von Domains ermittelt die prozentualen Ergänzungswerte der Browseranzahl für jede Domain und fasst diese Informationen zu einem einzigen BN-Wert für die gesamte Gruppe zusammen.

Bei der Schätzung der Anzahl von Browsern für eine Domain pro Monat mussten wir das Problem der Löschbarkeit von 1st-Party-Cookie-Identifikatoren (FPC) über die Zeit lösen. Je länger der Zeitraum, desto höher ist die Wahrscheinlichkeit, dass ein bestimmter Identifikator gelöscht und durch einen neuen ersetzt wird. Wir haben unser Modell an die Eigenschaften der Löschbarkeit von 1st-Party-Identifikatoren angepasst.

Die letzte Stufe der Berechnung der Zielgruppengröße für die Eigentümergruppe kombiniert die Methode zur Schätzung von Duplikaten und die Eliminierung von Identifikatorlöschungen. Die so vorbereiteten Audiodaten werden für die weiteren Modellierungsphasen der Daten aus den Stichproben als Referenzwerte verwendet. Diese reduzieren den statistischen Fehler und ermöglichen eine präzise Analyse von Reichweite und Kontaktfrequenz, selbst bei kleinen Domains oder Kampagnen.

Änderungen in der Panelumfrage: Die Mediapanel-Umfrage basiert auf drei Arten von Forschungspanels:

  • Cookie-Panel: das umfangreichste, deckt jedoch nur geprüfte Domains ab.
  • Software-Panel (PC, Tablet und Smartphone): umfasst alle Domains und mobilen Anwendungen, ist jedoch deutlich kleiner als das Cookie-Panel und erfordert die Installation der Gemius-Messanwendung.
  • Hardware-Panel: eine Stichprobe von Personen, die mit Gemius-Messgeräten ausgestattet sind, um Internet, Fernsehen, Radio und Kontakt mit Außenwerbemedien (traditionelle OOH und DOOH) zu messen.
graf_4

Cookie-Panel – eng verbunden mit dem Site-centric Audit – umfasst zufällig ausgewählte Personen, die Rekrutierungsumfragen abgeschlossen haben, die während der Nutzung von Websites der in der Prüfung enthaltenen Publisher angezeigt wurden. Diese Person blieb Panelist, bis der Drittanbieter-ID, über den ihre Aktivitäten auf verschiedenen Domains verknüpft wurden, aus irgendeinem Grund gelöscht wurde.

Die Änderung in Chrome führte zu einer Überarbeitung unseres Ansatzes zur Erstellung und Verwaltung des Cookie-Panels. Der erste Schritt bestand darin, die Emission von Rekrutierungsumfragen mit 1st-Party-IDs anzupassen. Da die Umfrage einer 1st-Party-ID zugeordnet ist, stammen die Aktivitäten der befragten Person nur von der Domain, auf der der Panelist rekrutiert wurde. Um seine Aktivitäten auf anderen geprüften Domains zuzuordnen, haben wir ein Modell entwickelt, das 1st-Party-IDs vom gleichen Gerät, aber von verschiedenen Domains kombiniert.

Zu diesem Zweck entwickelten wir einen Klassifikator, der die Wahrscheinlichkeit schätzt, dass zwei 1st-Party-Identifikatoren von einem einzigen Gerät stammen, basierend auf ihrer Verteilung über Zeiträume in unterschiedlichen charakteristischen Subnetzen (IP-Adressen). Die Kombination der Identifikatoren ermöglicht es uns, die gewünschte Wahrscheinlichkeit zu bestimmen. Der Klassifikator wird in einem Lernmodell aufgebaut, bei dem die Trainingsdaten aus unseren Testpanels (Software und Hardware) stammen.

Wir überprüften die Effektivität des Klassifikators anhand aktueller Daten von Chrome, für das Drittanbieter-IDs noch verfügbar sind. In Zukunft wird die Bewertung der Qualität der reproduzierten Identifikatoren auf Daten unserer Forschungspanels mit Software- und Hardware-Messgeräten basieren. Diese Situation unterstreicht, wie wichtig qualitativ hochwertige Forschungspanels in Zukunft sein werden.

Real User ID – verknüpfte 1st-Party-Identifikatoren, die von einer bestimmten Browserinstanz des Nutzers stammen.

Die Beziehung, auf demselben Gerät gepaart zu sein, ist eine transitive Beziehung: Wenn A und B vom selben Gerät stammen und auch B und C, kann geschlossen werden, dass A und C ebenfalls miteinander in Beziehung stehen. Diese Eigenschaft ermöglicht es, verschiedene 1st-Party-Identifikatoren zu einem einzigen Set zu kombinieren, ohne dass eine hohe Wahrscheinlichkeit für jedes Paar erforderlich ist. Je mehr Domains durch die Mediapanel-Prüfung erfasst werden, desto höher ist die Wahrscheinlichkeit, dass diese Eigenschaft des Algorithmus genutzt wird.

Eine solche Sammlung von verknüpften 1st-Party-IDs wird als „Community of Real User 1st Party IDs“ (CRUD) bezeichnet. Durch die Vergabe einer ID an jede CRUD erstellen wir eine Real User ID, eine probabilistische ID, die die Eigenschaften einer Drittanbieter-ID aufweist.

Für die gemiusAudience-Studie wählen wir nur die Real User IDs aus, die über eine bestimmte Demografie verfügen (abgeschlossene Rekrutierungsumfrage), also zu einem unserer Tausenden Cookie-Panelisten gehören. Auf diese Weise bleibt das Cookie-Panel eine gültige Datenquelle für die Mediapanel-Studie.

Erhalt der hohen Qualität der Umfrageergebnisse

Durch die Anpassung der Algorithmen zur Schätzung der Anzahl von Browsern und die Entwicklung einer Methode zur Wiederherstellung des Cookie-Panels können wir die bestehende Qualität der Mediapanel-Ergebnisse beibehalten. Trotz des Rückzugs von Drittanbieter-Cookies im Chrome-Browser sind wir dank unserer Forschungspanels, der allgegenwärtigen Prüfung und unserer Erfahrung im Datenmodellierungsbereich weiterhin in der Lage, Informationen über die Internetnutzung bereitzustellen.