Spam-Traffic mit Hilfe des User-Agents identifizieren

Ihr habt es sicher schon mitbekommen, seit Anfang Februar stellt Google die Informationen zu Internetanbieter und ISP-Domain in Google Analytics nicht mehr zur Verfügung. Schaut man in den Netzwerk-Bericht, so wird ab dem 04. Februar 2020 der Wert “(not set)” angezeigt.

Viele nutzen den Internetanbieter und die ISP-Domain, um Spam zu identifizieren und diesen aus ihren Datenansichten in Google Analytics herauszufiltern. Diese Filter funktionieren nun leider nicht mehr.

Um zu überprüfen, ob und wie sehr euch das betrifft, schaut a) mal in eure Datenansichtsfilter, ob ihr die oben genannten Dimensionen verwendet, und b) in eure Daten, ob es da einen Anstieg gibt aus z.B. bestimmten Ländern und Städten, die nicht zur eurer Zielgruppe gehören. Wenn diese die typischen Merkmale für Spam-Traffic aufweisen – 100% Absprungrate, niedrige Durchschnittliche Sitzungsdauer, wenige Seiten pro Sitzung – könnt ihr davon ausgehen, dass es sich um Spam-Traffic handelt.

Wenn ihr euch jetzt gefragt habt, wie ihr in Zukunft solchen Spam aus euren Datenansichten raushalten könnt, so haben wir da eine Lösung für euch.

Natürlich könnt ihr auf Lösungen zurückgreifen, die Drittanbieter zur Verfügung stellen. ipgeolocation zum Beispiel, bietet die Möglichkeit, den Internetanbieter als benutzerdefinierte Dimension an Google Analytics zu senden. Nähere Infos dazu findet ihr in diesem Artikel von Simo Ahava.

Bei solchen Lösungen solltet ihr immer beachten, dass es Drittanbieter sind, und sie transparent Auskunft darüber geben sollten, was mit den verarbeiteten Daten geschieht und ob die Nutzung des Dienstes mit den Datenschutzrichtlinien übereinstimmt.

Wollt ihr auf die Nutzung eines Drittanbieter-Tools verzichten, so gibt es noch eine andere Option, die auch einfach umzusetzen ist. Das Zauberwort heißt “User-Agent”. Er kann verwendet werden, um festzustellen, welche Version eines bestimmten Browsers auf einem bestimmten Betriebssystem verwendet wird. Hier ist ein Beispiel für einen User-Agent von Google Chrome:

Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36

Üblicherweise gibt der User-Agent also Auskunft über Namen und Version des Browsers. Weist er jedoch bedeutungslose Werte auf, dann habt ihr bereits den ersten Spam Traffic identifiziert.

Da der User-Agent standardmäßig nicht von Google Analytics zur Verfügung gestellt wird, müsst ihr ihn manuell als benutzerdefinierte Dimension erfassen. Diese lässt sich in einem Datenansichtsfilter zur Ausschließung von unerwünschtem Spam Traffic verwenden.

Der User-Agent lässt sich mit der userAgent Property tracken:

navigator.userAgent

Nutzt ihr den Google Tag Manager, so lässt sich der User-Agent in einer JavaScript-Variable speichern. Diese ordnet ihr dann mit dem Index der benutzerdefinierten Dimension zu, die ihr in Google Analytics angelegt habt.

Ihr müsst bei dieser Lösung an das Thema Datenschutz denken: Obwohl Google ISP-Daten nicht als personenbezogene Daten betrachtet, kann diese Methode möglicherweise Datenschutzprobleme aufwerfen, wenn zum Beispiel die DSGVO eine Rolle spielt.

Der User-Agent liefert Informationen über den Browser und das Betriebssystem.  Das allein reicht nicht aus, um eine Person zu identifizieren, aber in Kombination mit anderen Details wie der Geolokalisierung oder Postleitzahl könnte der User-Agent zur Identifizierung einer Person verwendet werden.  Darum raten wir euch, den User-Agent wirklich nur zur Identifizierung von Spam-Traffic zu tracken und nicht für weitere Zwecke zu nutzen.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Diese Website verwendet Akismet, um Spam zu reduzieren.Erfahren Sie, wie Ihre Kommentardaten verarbeitet werden