COVID-19 Fallzahlen in Data Studio Reports nutzen

COVID-19 beschäftigt uns derzeit alle. Auf unzähligen Webseiten werden weltweit die neuesten Entwicklungen berichtet. Rund um die Uhr sind ForscherInnen und WissenschaftlerInnen auf der Suche nach einem Impfstoff. Zudem haben mehrere Initiativen angefangen, Daten über dessen Entwicklung bereitzustellen. Die beliebete Data-Science-Plattform Kaggle hat nicht nur Wettbewerbe gestartet, bei denen man mit Hilfe maschinellen Lernens wichtige Facetten des Virus systematisiert, sondern sammelt auch Datensätze zum Virus.

Zudem stellt Google die Daten der Johns Hopkins University als “Public Dataset“ über BigQuery zur Verfügung. Dadurch wird es möglich, SQL-Abfragen auf den Datasets durchzuführen sowie diese mit anderen Google Services, wie etwa Google Data Studio, zu verbinden. Um das Angebot nutzen zu können, benötigt man ein Projekt in der Google Cloud Platform, das über gültige Zahlungsdaten verfügt – wobei Datenabrufe in diesem Dataset und jegliche Abfragen darauf bis zum 15. September kostenlos sind.

Die Daten des Datasets werden täglich aktualisiert und lassen sich sehr gut nutzen, um sie mit eigenen Daten oder Reports zu verbinden. In diesem ersten Artikel führen wir euch durch die Einbindung eines Datensatzes in Data Studio.

An der Stelle möchten wir darauf hinweisen, dass sowohl dieser Artikel als auch die Diagramme, die in hier gezeigt werden, lediglich als eine Einführung in Google Data Studio dienen sollen. Wir möchten hiermit keine Aussagen über das Virus und seine Entwicklung treffen. Für den aktuellsten Stand empfehlen wir als erste Quelle den täglichen Lagebericht des Robert Koch Instituts. Dort existiert ebenfalls ein Beispiel eines interaktiven Dashboards.

Verfügt man über ein Google-Konto, ist man direkt eingeloggt, wenn man Data Studio besucht. Das Einbinden einer Datenquelle läuft dann mit wenigen Klicks. Zunächst wählen wir “Create”, dadurch werden wir auf das Menü geführt, in dem wir zwischen einem Report, einer Data Source, oder dem Explorer wählen können.

Data Source mit Google Data Studio anbinden
„Data source“ anklicken

Aufgrund der Auswahl von „Data Source“ werden einem nun mehrere Konnektoren präsentiert. Hier wählen wir BigQuery.

Data Studio BigQuery connector
Den BigQuery Konnektor auswählen

Hat man noch nie Google Cloud benutzt, muss man ein Projekt erstellen, unseres haben wir “pp-examples” genannt.

Billing Project zur Anbindung eines Datensatzes

Anschließend hat man die Möglichkeit, Datasets und Tabellen auszuwählen. Wir werden mit der Tabelle summary in dem Dataset covid19_jhu_csse_eu arbeiten.

Alle Public Datasets in Google BigQuery
Die summary Tabelle auswählen
Anbindung eines Datensatzes mit Google Data Studio
Per „Connect“ mit der Tabelle verbinden

Befindet man sich außerhalb Europas, z.B. in den USA, so steht ein anderes Dataset zur Verfügung (covid19_jhu_csse), das auf amerikanischen Servern gehostet wird. Jedes Dataset mit dem Präfix covid19 und jede darin enthaltene Tabelle stellt unterschiedliche Informationen über das Virus und seine Entwicklung bereit. Weitere Datasets lassen sich über den Marketplace erkunden.

Alle dimensionen und Metriken in der Tabelle Summary
Liste mit allen Dimensionen und Metriken

Nun können wir einen Bericht erstellen und klicken dazu im Menü nicht auf wie vorher auf Data Source, sondern auf „Report“.

Erstellung eines Reports in Google Data Studio
„Report“ anklicken

Ein Report kann nicht ohne Daten existieren, deshalb wird man direkt aufgefordert, einen Datensatz zu selektieren. Aus der Liste „My data sources“ wählen wir nun den die vorher angebundenen Daten. Dem Report wird anschließend automatisch eine einfache Tabelle mit den Spalten province_state und Record Count eingefügt.

Auswählen eines Datensatzes für Google Data Studio Report
Unter „My data sources“ den Datensatz „summary“ auswählen

Wie man nun verschiedene Grafiken erstellt, um den Datensatz auszuwerten, zeigen wir im nächsten Blog-Post.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Diese Website verwendet Akismet, um Spam zu reduzieren.Erfahren Sie, wie Ihre Kommentardaten verarbeitet werden