Business Intelligence/5. Juli 2023 -Aktualisiert am 21. Dezember 2023/2 Min. Lesezeit

Google Analytics 4: Interface vs. BigQuery

Illustration einer Tabelle und eines Dashboards. In der Mitte ist ein Haken abgebildet.

Wie wir, habt auch ihr da draußen sicherlich die Herausforderung die Google Analytics 4 Rohdaten aus Google BigQuery so abzufragen, dass sie mit dem GA4 Interface übereinstimmen 🤯. Googl selbst hat sich hierzu in einem Artikel geäußert. Die Kernpunkte in dem Artikel sind:

  1. Active Users: Total Users lassen sich im Interface zwar noch anzeigen, aber die primäre Kennzahl sind mittlerweile Active Users.
  2. Abweichungen, durch geschätzte Werte: Im Interface werden mittlerweile viele Metriken durch den HyperLogLog++ Algorithmus geschätzt, deshalb können hier leichte Abweichungen zu sehen sein.
  3. High-cardinality reports: Weniger häufige Dimensionen werden im Interface zu (other) zusammengefasst.
  4. Google Signals: Google fast User, von denen sie wissen, dass sie zusammengehören (bspw. mehrere Devices eines Users) zu einem User zusammen, Google BigQuery nicht, daher sind die Anzahl User in BigQuery höher, als im Interface.
  5. Traffic attribution data: Hier sieht es leider erstmal düster aus, laut Google ist es nicht so einfach möglich auf dieselben Zahlen wie im Interface zu kommen, da sie im Interface auf Session-Level attribuieren, in BigQuery aber nur auf User- oder Event-Level. Laut Google wird es hierzu in Zukunft möglicherweise mehr Informationen in den BigQuery-Daten geben.

Zusammenfassend lässt sich sagen, dass es nicht möglich ist die Daten 1:1 zu matchen, wir uns stattdessen diesen Unterschieden bewusst sein müssen und, bei Tracking-Daten grundsätzlich sinnvoll, mit Schätzungen und Verhältnissen arbeiten sollten.