Wie vermeide ich falsche Daten in meinen Google Analytics Reports?

Sie kennen das Problem, die Zahlen in Ihren Excel Reports oder Dashboards weichen von den Zahlen in Ihrem Google Analytics Konto ab? Dann ist Ihnen sicherlich auch der Begriff „Daten-Sampling“ (Stichprobenerhebung) geläufig.

 

Was genau ist „Daten-Sampling“ (Stichprobenerhebung)

Google Analytics Server verarbeitet tagtäglich mehrere Milliarden Webanfragen. Sprich jedes Mal, wenn ein Webseiten-Besucher eine neue Aktion durchführt, ob es das Laden einer neuen Unterseite ist, oder einen Button drückt, wird ein so genannter Event an Google Analytics geschickt. Dieser wird registriert und erscheint dann in Ihren Google Analytics Statistiken. Um Ressourcen zu sparen werden bei großen Datenmengen nur Teilmengen betrachtet, wobei auf einer Datenstichprobe dann die entsprechenden Statistiken hochgerechnet werden. Damit ist die Auswertung schneller verfügbar und die Belastung der Server sinkt.

Laut Google erfolgt die Stichprobenerhebung in den Berichten automatisch sobald mehr als 500.000 Sitzungen erfasst wurden. Vor allem bei sehr großen Webseiten kann diese Grenze schnell erreicht werden.

 

Wie erkenne ich wann meine Google Analytics Daten gesampelt werden?

Ganz einfach, indem Sie unter Benutzerdefinierten Berichten einen Bericht mit den zu vergleichenden Metriken und Dimensionen anlegen und diesen als „Gesamtdatenbericht“ exportieren. Je nach Datenmenge kann es einige Minuten dauern bis der Gesamtdatenbericht zu Verfügung steht.

Der Gesamtdatenbericht enthält nun 100% korrekte Daten und kann nun dafür eingesetzt werden, ihre Reports auch Richtigkeit zu prüfen. Beachten Sie das für jeden Gesamtbericht auch s.g. Credits verbraucht werden. Diese werden jedoch täglich zurückgesetzt.

 

Wann die Stichprobenerhebung in Google Analytics für Ihr Reporting zum Problem wird

Normalerweise reicht es zur Betrachtung von Trends und der gesamten Entwicklung aus, mit Stichproben zu arbeiten. Problematisch wird das Ganze nur, wenn man zum Beispiel die Sitzungen oder Zielabschlüsse je nach Landingpage analysieren möchte. Umso mehr Dimensionen (Zeit, Landingpage, Medium, Source usw.) in einer Abfrage eingesetzt werden, desto wichtiger wird es mit ungesampelten Daten zu arbeiten. Man könnte sonst basierend darauf falsche Annahmen treffen.

 

Wie kann das Sampling verhindert werden?

Erstmal gar nicht, an die Vorgaben von Google Analytics muss sich wohl jeder halten. Es gibt jedoch Mittel und Wege dies elegant zu umgehen. Folgende Möglichkeiten gibt es:

  • Kleinere Betrachtungszeiträume wählen: Je kleiner der Ausschnitt ist, desto weniger Daten sind es.
  • Weniger Dimensionen verwenden: In einer Abfrage mit weniger Dimensionen dafür mehr Filtern arbeiten.
  • Unter Benutzerdefinierten Berichten kann man Daten auch als „unsampled Reports“, oder als s.g. Gesamtbericht herunterladen und in Excel oder sonstigen Tools weiterverarbeiten.

Bildergebnis für unsampled google analytics

 

Gibt es Tools oder Software die mir dabei hilft Daten aus Google Analytics zu extrahieren?

Es gibt diverse Tools z.B. Excel Plugins, die es ermöglichen Daten direkt in Excel zu laden um diese dort weiterzuverarbeiten. Aber auch diese Tools können das Sampling Problem nur bedingt lösen. Ich selbst habe folgende Tools analysiert und wurde leider vom Ergebnis jedes Mal enttäuscht.

  • NEXT Analytics: Ein Excel Plugin um Daten aus Google Analytics, Adwords und anderen Tools direkt in ein Excel File zu laden.
  • SSIS CDATA Google Analytics Connector: Eine SSIS Komponente die es ermöglicht Daten aus Google Analytics direkt in einer SQL Datenbank weiterzuverarbeiten.

 

Was also kann man tun damit man 100% richtige Daten aus Google bekommt?

Unser Entwicklungsteam hat eine eigene Lösung programmiert die es ermöglicht 100% richtige Daten aus Google Analytics zu exportieren. Dafür haben wir eigens einen API-Konnektor geschrieben und ausgiebig getestet. Das Ergebnis war jedes Mal positiv.

 

Wie haben wir es gemacht? Wie kann man das API Request Limit von Google Analytics umgehen?

Gar nicht, das steht ausdrücklich in der Beschreibung. Pro API Request erlaubt Google Analytics max. täglich 50.000 Request pro Projekt und 10 Datenbankabfragen pro Sekunde pro IP-Adresse. Wir haben es gelöst indem wir die Abfragen automatisiert solange verkleinern, bis wir von Google keine negative Meldung über ein Sampling zurückerhalten. Nutzt man außerdem mehrere IP-Adressen je nach Last, so kann man auch mehr Daten auf einmal ziehen.

Nutzen Sie doch ganz einfach unsere kostenlose Google Analytics App in ABIS. Hier erhalten Sie kostenlos einen Zugang den sie mit 3 Domains gleichzeitig nutzen können.

Schlusswort:

Wenn Sie das Thema näher interessiert und Sie Unterstützung benötigen, können Sie uns gerne kontaktieren. Wir helfen Ihnen dann gerne weiter.

In folgendem Artikel erklären wir wie sie Ihr eigenes Google Analytics KPI Dashboard einfach erstellen können: Wie erstelle ich ein eigenes Google Analytics KPI Dashboard?

 

Quellen:

https://developers.google.com/analytics/devguides/config/mgmt/v3/limits-quotas#unsampled_reporting