GCP BI Engine Nutzung mit Data Studio

Google Cloud BI Engine für BigQuery ist aktuell noch in Beta und soll wiederholte Anfragen hin zu BigQuery stark beschleunigen.


Um BI Engine zu nutzen muss man dies für ein Projekt aktivieren. Man kann aktuell für verschiedene Regionen bis zu 10 GB freischalten. Diese 10 GB werden dann für alle Verbindungen, die von Data Studio ausgehen, genutzt.
Eine gute Anleitung findet sich direkt unter Google Cloud BI Engine Docs

Wenn Sie viele Datasets und große Tabellen in Ihren Projekten haben werden Sie nicht unbedingt für jede Abfrage eine Beschleunigung erkennen. Man bemerkt zwar schnell in Data Studio, dass die Google Cloud BI Engine große Auswirkungen hat, konnte aber bis vor kurzem nur raten, ob es damit zu tun hat.

BI Engine in Data Studio

Das ist jetzt anders. Wenn Sie in Data Studio einen Report editieren und z.B. eine Tabelle angelegt haben werden Sie oben rechts ein Symbol erkennen können, das entweder als grauer Blitz oder durchgestrichener Blitz dargestellt wird. Der Blitz zeigt, ob die Daten hinter der Tabelle beschleunigt werden.

Icon keine Beschleunigung
keine Beschleunigung der Daten

Sie können das auch im Sub Menü eines Charts nachsehen, indem Sie auf die 3 Punkte klicken und dort Diagnose Query Performance auswählen.

Drop Down Menü
DropDown Menü in Data Studio

Der Klick liefert jetzt zwei Ergebnisse als Overlay. Entweder die Daten im Chart / Tabelle werden beschleunigt oder sie werden nicht beschleunigt.

Accelerated by BI Engine
Tabelle wird beschleunigt

Sollte es Probleme geben oder wenn die Tabelle eine View ist oder aber eine Custom Query im Connector gewählt wurde, dann findet aktuell keine Zwischenspeicherung der Daten statt.

not accelerated by BI engine
Tabelle wird nicht beschleunigt

Die BI Engine gleicht einem großen Cache. Ähnlich wie es in der EXASolution Datenbank der Fall ist werden die Daten der verschiedenen Abfragen in BI Engine abgelegt, damit diese sofort verfügbar sind. Die Abfragen, die häufig gemacht werden bleiben im Cache. Wenn der Cache zu voll wird werden die wenig genutzten Tabellendaten wieder entfernt. Die Daten erfahren nicht immer eine Beschleunigung, speziell bei vielen großen Tabellen. Diese treten leicht in Konkurrenz zueinander bei der Ausnutzung des Caches. Hier kann es sich sonst empfehlen die Daten in Projekte aufzuteilen. Vermutlich wird aber nach dem Verlassen der Betaphase das 10GB noch erhöht.

Die Beta Phase ist kostenlos. Ein Test lohnt sich, denn die Daten laden deutlich schneller als zuvor.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Diese Website verwendet Akismet, um Spam zu reduzieren.Erfahren Sie, wie Ihre Kommentardaten verarbeitet werden