Business Intelligence/14. Mai 2024 -Aktualisiert am 24. September 2024/4 Min. Lesezeit

Einfache Schätzung der Kosten zur Nutzung von Google Analytics 4 Daten in BigQuery

Taschenrechner und BigQuery Logo

Die Nutzung der Google Analytics 4 (GA4) Rohdaten in Google BigQuery bringt eine Vielzahl an Vorteilen mit sich. Durch den detaillierten, eventbasierten Charakter der Rohdaten sind individuelle Analysen in BigQuery möglich, welche im GA4 Interface nicht möglich sind. Auch lassen sich die GA4 Rohdaten je nach Use Case aggregieren, segmentieren und mit weiteren Daten kombinieren. Dabei ist es wichtig zu erwähnen, dass die Kosten von BigQuery auf dem tatsächlichen Verbrauch basieren, wodurch eine hohe Kostenkontrolle und -effizienz sichergestellt werden kann.

Google ermöglicht eine benutzerfreundliche Methode für den Export der GA4 Daten nach BigQuery, welche mit wenigen Klicks in dem GA4 Interface initialisiert wird. Der Export allein ist kostenfrei (ausgenommen Streaming). Eine Anleitung dazu ist hier zu finden. Häufig stellt sich aber die Frage, welche Kosten die Speicherung und insbesondere die Abfrage dieser GA4 Daten mit sich bringen.

Wir haben dafür einen BigQuery Kostenrechner entwickelt

Mit unserem BigQuery Kostenrechner geben wir eine Schätzung der möglichen Kosten, die für die Nutzung der GA4 Daten anfallen. Dabei basiert die Schätzung auf den individuellen Eingabeparametern, um eine möglichst hohe Genauigkeit gewährleisten zu können.

 BigQuery Kostenrechner
Folgende Parameter sind relevant zur Kostenschätzung:
  1. Events pro Tag
    Das GA4 Datenmodell basiert auf Events, wodurch eine Zeile der Rohdaten in BigQuery einem Event entspricht. Die Anzahl der Events pro Tag ist im GA4 Interface (folgender Pfad: Berichte -> Engagement -> Ereignisse) einzusehen, wie im Screenshot abgebildet. Sie gibt die Menge der abzufragenden Daten an.
Google Analytics 4 Interface
  1. Abfragezeitraum der Rohdaten
    Bei der Abfrage der Rohdaten ist der Zeitraum einzugrenzen, welcher abgefragt werden soll. Dadurch kann die Datenmenge auf den wirklich relevanten Zeitraum reduziert und Kosten gespart werden.
  2. Anzahl Abfrage pro Monat
    Wie häufig die Abfrage ausgeführt wird, hängt davon ab, ob dies automatisiert erfolgt (bspw. als eine Scheduled Query) und ob Visualisierungstools wie Looker Studio direkt auf diese Daten zugreifen zur Erstellung von Reports.
    Beispiel: Meine Abfrage läuft automatisiert jeden Tag im Monat und wird in 2 Reports genutzt. Dies ergibt 30*2 = 60 Abfragen pro Monat.
  3. % der Spalten, die in den Abfragen genutzt werden
    Die GA4 Rohdaten bieten eine enorme Menge an Informationen pro Event, was schnell zu über 100 Spalten (Dimensionen und Metriken) führen kann. In der Abfrage wird meist allerdings nur eine Auswahl davon benötigt. Diese Eingrenzung ist eine relevante Information zur Schätzung der Kosten.

Ein wichtiger Hinweis: Google bietet die ersten 1TB für On-Demand-Computing und die ersten 10GB für Speicherung kostenfrei an. Mehr Infos hier.

Wie hilft mir diese Information nun weiter?

Zunächst liefert der BigQuery Kostenrechner eine Schätzung der Kosten, mit denen geplant werden kann. Es kann abgeschätzt werden, ob die gewünschte Abfrage zu komplex ist und beispielsweise zu viele (nicht benötigte) Spalten enthält. Es kann auch hinterfragt werden, ob die Anzahl der monatlichen Abfragen angemessen ist oder ob die Anzahl der nachgelagerten Berichte zu hoch ist. Durch die einfache Anpassung der vier Eingabeparameter kann ein potenzieller Kostentreiber leichter identifiziert werden.

In diesem Zuge wird auch empfohlen, für komplexere und wiederkehrende Analysen nicht direkt auf die Rohdaten zuzugreifen, sondern hierfür neue Tabellen zu erstellen, die aggregierte Informationen aus den Rohdaten enthalten. Für komplexe Analysen kann dann auf die aggregierten Tabellen zugegriffen werden, ohne immer wieder auf Millionen von Zeilen der Rohdaten zugreifen zu müssen. Dieser Ansatz reduziert sowohl die Komplexität als auch die Kosten erheblich.

Mit den BigQuery Preismodellen haben wir uns in einem weiteren Blogartikel "Nutzung des richtigen BigQuery Preismodells: Ein Blick auf die verschiedenen Preismodelle" tiefergehend beschäftigt.