Business Intelligence/25. September 2023 -Aktualisiert am 29. Januar 2024/4 Min. Lesezeit

Metabase - schnelles Reporting ohne SQL, unsere Eindrücke

Metabase ist ein Open Source Reporting Tool, welches verspricht, mit einem einfachen und intuitiven Bedienungskonzept schnell Berichte zu generieren - selbst ohne fundierte SQL-Kenntnisse. In diesem Artikel präsentieren wir kurz unsere Erkenntnisse und hoffen einen ersten Einblick geben zu können.

Ein Dashboard in Metabase mit verschiedenen Graphen

"Ein Dashboard in Metabase"

(Quelle: https://www.metabase.com/images/stats-dashboard.svg)

Aufbau von Metabase

Metabase stellt eine benutzerfreundliche Oberfläche bereit, die es ermöglicht, Datenquellen zu verbinden, Abfragen zu erstellen und Berichte einfach zu generieren.

Ein Bericht oder Dashboard wird in Metabase aus mehreren einzelnen Graphen oder Visuals zusammengesetzt. Ein Visual kann somit in beliebig vielen Dashboards zum Einsatz kommen. Bei der Erstellung eines Visuals startet man ausgehend von einer Question, also z.B. ‘Was ist die Verteilung meiner Nutzer nach Ländern?’. Die Frage kann dann mit Hilfe einer UI zusammengesteckt oder direkt in SQL auf Basis von angebundenen Datenquellen formuliert werden. Zudem gibt es verschiedene Möglichkeiten die Abfrage weiter zu bearbeiten, indem man weitere Daten durch “join data” oder benutzerdefinierte Spalten hinzufügt, Daten filtert, sortiert oder einschränkt.

Aufbau einer Question in Metabase

"Aufbau einer Question in Metabase"

(Quelle: https://www.metabase.com/docs/latest/questions/images/notebook-editor.png)

Um die erstellten Visuals nun in einem Dashboard zu verarbeiten, kann man auf “Add to dashboards” klicken und diese zu bereits existierenden oder vorhandenen Dashboards hinzufügen. Für eine individuelle Visualisierung können die Visuals separat nochmal im Dashboard angepasst werden, ohne sich auf das “Haupt”- Visual auszuwirken. Es können ebenfalls dashboardweite Filter definiert werden, die dann mit den einzelnen Visuals verknüpft werden und somit z.B. einfach eine Übersicht zu den Daten der letzten 2 Monate erlauben.


Vor- und Nachteile im Überblick

Beim Arbeiten mit Metabase sind uns einige Punkte aufgefallen, die wir im folgenden kurz teilen wollen.

Die Vorteile:

  • Open Source und Kosteneffizient: es fallen in der Grundversion keine gesonderten monatlichen Gebühren an und man kann Implementierungsdetails direkt im Code nachschauen. Doch auch Achtung bei eigenen Weiterentwicklungen: die eingesetzte Lizenz AGPL ist copy-left.
  • Starke Dokumentation: eine Menge an Tutorials und Schritt-für-Schritt Anleitungen auf dem aktuellen Stand der Software erleichtern den Einstieg.
  • Schnelle Erfolge: auch ohne ein langwieriges Tutorial können schnell die ersten Visuals gebaut und in Dashboards zum Einsatz gebracht werden.
  • Niedrige technische Grundvoraussetzung: die Nutzung und Erstellung von Dashboards ist auch ohne SQL-Kenntnisse möglich.
  • Benutzerfreundliche Oberfläche: Einstellungen zu den Daten, Anpassungen an Visuals und deren Verbindung in Dashboards sind schnell gefunden und selbsterklärend konzipiert.
  • Vorschläge auf Basis der Datenquellen: Für angebundene Datenquellen kann Metabase mit der ‘x-Ray’ Funktion Visualisierungen generieren und Vorschläge für Insights automatisiert erstellen.
  • Datensicherheit und Kontrolle: Durch das Hosting auf eigenen Servern verlassen kritische Unternehmensdaten nie die eigene Infrastruktur.

Die Nachteile:

  • Eingeschränkte Plotfunktionen: so sind z.B. Zeitraumvergleiche relativ zu einem Filter recht umständlich in der Umsetzung - hier geben andere Tools weitaus komfortablere Möglichkeiten.
  • Datenlimits: Metabase gibt selbst hardcoded limits für die Menge an verarbeiteten Daten vor (2000 für Tabellenvisualisierungen, 10.000 für andere Anfragen). Diese können Stand jetzt nicht administriert werden ohne den Code neu zu kompilieren.
  • Eingeschränkte Komposition: Visuals haben feste Größen, die auf einem Dashboard nur an Hand eines Rasters angepasst werden können.
  • Eingeschränkte Designmöglichkeiten: so sind z.B. nur 24 Grundfarben verfügbar und Farbabstufungen nur bedingt möglich.
  • Komplexere Datenvisualisierung sind nur mit zusätzlicher SQL-Kenntnis möglich
  • Fehlende DEV/Test Umgebung: Visuals sind sofort online und für alle ersichtlich (Permissionmanagement ist ein Premiumfeature)
  • Übersichtlichkeit: Bei vielen Visuals ist es sehr leicht die Übersicht zu verlieren. Zwar können Ordner (Collections) angelegt und ineinander verschachtelt werden, doch fehlen weitere Strukturfeatures wie tagging und dynamische Collections (z.B. auf Basis der verwendeten Daten)
  • Eingeschränktes Alerting: Aktuell werden als Alerting Kanäle nur E-Mail und Slack angeboten.

Fazit

Das Tool wird natürlich beständig weiter entwickelt und ggf. sind einige der Nachteile von heute schon bald gelöst und in einer neuen Version verfügbar oder in der Premiumversion enthalten. Zusammenfassend ist es ein intuitiv bedienbares Reporting Tool, was durch die Möglichkeit des self-hostings im Thema Datensicherheit punktet. Für die Verarbeitung größerer Datenmengen und zur Erstellung komplexerer Visualisierungen haben jedoch andere Tools wie Looker Studio mehr zu bieten.