Ghost Referrals loswerden… und zwar für immer!

 

Best Practice

Wie bei jeder neuen Herausforderung ist es auch hier sinnvoll, nach Best Practice vorzugehen. Bitte beachten Sie bei allen Einstellungen, die Sie in Google Analytics vornehmen, die folgenden Regeln:

  • Stellen Sie sicher, dass immer eine völlig ungefilterte Ansicht in Ihrer Property verbleibt.
  • Arbeiten Sie nicht in der Hauptansicht, sondern erzeugen Sie ein Duplikat, in dem Sie Filter anlegen und testen können.
  • Übernehmen Sie die Filter erst dann in die Hauptansicht, wenn alle Tests zu Ihrer Zufriedenheit ausfallen.

[symple_box color=“blue“]
Hier außerdem noch einige oft empfohlene Methoden, die erprobtermaßen nicht funktionieren:

Die Verweis-Ausschlussliste
In zahlreichen Artikeln wird empfohlen, die Verweis-Ausschlussliste in Google Analytics (Verwalten >Property >Tracking-Informationen >Verweis-Ausschlussliste) zu verwenden. Für die hier behandelten Fälle ist dies falsch — auch wenn Ihr Verweis-Bericht danach schön aufgeräumt daherkommt, wird der entsprechende Verweis-Besuch möglicherweise als direkter Besuch gewertet und verfälscht weiterhin Ihre Metriken.

Hostnamen ausschließen
Viele Tippgeber empfehlen, Spamquellen mithilfe eines Ausschließen-Filters nach Hostnamen herauszufiltern. Prinzipiell ist das eine valide Möglichkeit, aber sie löst Ihr Problem nur sehr kurzfristig. Denn schon nach kürzester Zeit wird neuer Referrer Spam aus anderen Quellen in Ihren Berichten auftauchen – Sie möchten aber nicht bis zum Ruhestand für jeden neuen Spambot neue Filter und neue Segmente bauen.

Nach Verweisen filtern
Viele Tippgeber empfehlen, Ghost Referrals nach Verweis zu filtern, was naheliegend scheint. Es ist jedoch deutlich cleverer, nach Hostname zu filtern. Denn da die Ghosts niemals wirklich auf Ihrer Website waren, kennen sie Ihre validen Hostnamen nicht. Mit einem Filter, der nur die richtigen Hostnamen zulässt, kann es Ihnen deshalb heute und für alle Zeiten gleichgültig sein, welche neuen darodars und ilovevitalys im Internet umherschwirren. Valider Traffic ruft den Content ab, der auf Ihren Servern liegt – alles andere können Sie ignorieren.

[/symple_box]

[symple_highlight color=“green“]Der erste Filter: Alle Ghost Referrals eliminieren … [/symple_highlight]

Valide Hostnamen einschließen

Lassen Sie bei diesem Schritt alle gebotene Sorgfalt walten – anderenfalls laufen Sie Gefahr, validen Traffic aus Ihrer Statistik auszusperren. Es ist wichtig, dass Sie alle validen Hostnamen erfassen, die Ihre Tracking ID möglicherweise benutzt. Neben Ihrer eigenen Domain können dazu viele weitere Seiten gehören – zum Beispiel Zahlungsprovider wie PayPal oder Paymill, Ihr YouTube-Kanal oder eventuelle weitere Domains, die Sie unter derselben Tracking ID betreiben. Ebenfalls sinnvoll ist es, translate.googleusercontent.com und webcache.googleusercontent.com einzuschließen, um diejenigen Besuche zu registrieren, die über den Google-Übersetzer oder den Google-Cache auf Ihren Content zugreifen.

Die für Ihre Website validen Hostnamen finden Sie, indem Sie unter Zielgruppen >Technologie >Anbieter einen möglichst langfristigen Bericht abrufen und die primäre Dimension Hostname wählen. Dann kopieren Sie die für Ihre Website relevanten Domains heraus und sammeln diese in einer Textdatei.

Möglicherweise taucht hier sehr viel Traffic auf, bei dem für Hostname (not set) angezeigt wird. Dieser Traffic stammt höchstwahrscheinlich von Ghost Referrern. Für die Erstellung des Filters ist er nicht relevant. Aber:

[symple_box color=“green“]

Achtung!
Falls Sie in Ihren Berichten bei Google Analytics auf Traffic mit der Angabe Hostname (not set) stoßen, sollten Sie nach der Ursache forschen. Meist handelt es sich bei diesem Traffic um Referrer Spam oder eventbasierte Conversions, die nicht mit einem Seitenaufruf verbunden sind (beispielsweise wenn Sie für einen mehrstufigen Prozess in modalen Fenstern ein Tracking-Ziel definiert haben); es sind aber auch andere Ursachen wie z.B. ein Konfigurationsfehler denkbar. In diesem Fall sollten Sie eine entsprechende Warnung im oberen Bereich Ihres Google Analytics Frontends sehen.

[/symple_box]


Zunächst benötigen Sie nun eine weitere Ansicht.

Sicher haben Sie in Ihrer bisher genutzten Ansicht bereits einige Einstellungen vorgenommen, auf die Sie Wert legen. Deshalb sollten Sie keine neue Ansicht erzeugen, sondern die vorhandene Ansicht duplizieren. Gehen Sie dazu auf Verwalten >Datenansicht >Einstellungen der Datenansicht >Datenansicht kopieren und geben Sie der neuen Ansicht einen Namen. Nun können Sie Ihre Filter anlegen und testen. Wie oben erwähnt, sollten Sie eine ungefilterte Ansicht behalten – Sie werden diese von Zeit zu Zeit benötigen, um sicherzustellen, dass Sie in der gefilterten Ansicht keinen validen Traffic eliminieren. Übertragen Sie die Filter deshalb nach erfolgreichem Test auf die bestehende Ansicht. Dann löschen sie die Filter im Duplikat Ihrer Ansicht und passen ggf. den Namen der Ansicht an (zum Beispiel in Ungefilterte Ansicht).


Als nächstes legen Sie den Filter an.
Gehen Sie in der Test-Ansicht auf Filter >Neuer Filter und geben Sie dem Filter einen Namen, zum Beispiel „Ghost Referrals“. Wählen Sie die Einstellungen Benutzerdefiniert – Filtertyp: Einschließen – Filterfeld: Hostname und geben Sie die Filterregel als RegEx ein.

Klingt kompliziert? Ist es aber nicht. Gehen Sie einfach wie folgt vor:

  1. Fügen Sie in Ihrer Textdatei mit den validen Hostnamen vor jedem Punkt einen Backslash (\) ein
  2. Trennen Sie die Hostnamen durch senkrechte Striche (|) voneinander
  3. Löschen Sie alle Leerzeichen
  4. Ersetzen Sie alle Subdomains durch den RegEx .*
  5. Testen Sie den Filter. Wenn Google Analytics keine Veränderung anzeigt, steckt ein Fehler drin (z.B. Leerzeichen)
  6. Wenn der Filter funktioniert, speichern Sie ihn

Bitte beachten:

  • Filterregeln sind auf 255 Zeichen beschränkt
  • Bitte keine Leerzeichen
  • Bitte kein | am Anfang oder Ende der Filterregel
  • Natürlich können Sie nach Herzenslust optimieren, wenn Sie sich mit RegEx auskennen.
  • Laut Google werden Subdomains automatisch mitgefiltert. Die Regular Expression .* ist somit nicht zwingend erforderlich.
  • Dasselbe gilt für das „Escapen“ der Punkte mittels Backslash. Ich verwende trotzdem beides, weil es die korrekte Syntax ist.

Ihre Filterregel sieht nun in der einfachsten Form etwa folgendermaßen aus:

[symple_box color=“gray“ fade_in=“false“ float=“left“ text_align=“center“] hostname1\.de|hostname2\.com|.*googleusercontent\.com [/symple_box]

Nächste Seite: Spambots ausschließen – aber richtig!