Spam referral verwijderen uit Google Analytics

Spam referral verwijderen uit Google Analytics: waarom je dat moet willen en hoe je het moet doen (oh, en wat het eigenlijk is).

Als je Google Analytics voor de statistieken van je website gebruikt, en je af en toe verdiept in de bezoekers van je website, dan kom je soms vreemde snuiters tegen: bij de verwijzende websites zie je domeinnamen staan als ‘Iloveitaly.com’, Darodar, Semalt en de lijst groeit alleen maar. We noemen deze verwijzingen ‘referral spam’.
Deze serie artikelen gaat over wat het is, welke soorten er zijn, hoe je ervan af komt, waarom je ervan af zou willen en waarom ze het eigenlijk doen, die pipo’s die de referral spam in je statistieken plaatsen.

Weesch gewaarschuwd, dit is een vrij technisch en lang artikel, vol jargon. Ik zal het daarom ook over verschillende blogs verdelen.Dit eerste artikel gaat over welke soorten er zijn. Vervolgens wordt er de komende dagen een artikel geplaatst over hoe je met de verschillende soorten spam referral omgaat. Als laatste volgt er nog een artikel over waarom deze spam referrers blijkbaar bestaansrecht hebben.

Ongeduldig? Deze serie blogs is een vertaling van deze blogpost van Mike Sullivan van Analytics Edge, die mij toestemming gaf het artikel in het Nederlands te plaatsen. Je kunt daar dus al het volledige artikel in het Engels lezen.

Heb je zelf nooit Google Analytics geïnstalleerd? Stuur dit artikel dan door naar degene die het voor je heeft geïnstalleerd, anders is het waarschijnlijk een hoop abracadabra.

[share title=”Interessant? Delen mag!” facebook=”true” twitter=”true” google_plus=”true” linkedin=”true” email=”true”]

Er is veel verkeerde informatie op het internet te vinden over het verwijderen van zogenaamde ‘referral spam’ uit je overzichten in Google Analytics. Maar hier is ie: de volledige handleiding hoe je van die meuk af komt. Het uitlezen van je statistieken is al een kunst op zich, maar wanneer je geautomatiseerde bezoekers op je website krijgt, dan wordt het leven pas echt zwaar.

Updates

UPDATE 2015-02-09:

  • bestwebsitesawards.com/best-design/gallery/day/2015/02/04/ referral op hostname forum.advokateg.ru verschijnt nu. Onderdeel van de darodar-serie
  • cenoval.ru / referral met een hostnaam die je tracking-ID number.cenokos.ru bevat. NIET OP KLIKKEN! !
  • “google officially -recommends ilovevitaly.com search shell” en “resellerclub scam” organische zoektermen gebruiken dezelfde spam techniek als de darodar-serie en kunnen op dezelfde manier worden verwijderd. Let op: bounces van ghost referrals hebben geen invloed op je ranking in Google. Dit heeft Google erover te zeggen: video.
  • “hulfingtonpost.com/2015/01/15/woman_revenge_6424828.html” referral: onderdeel van de darodar-serie

Drie soorten bezoek

Om te beginnen zijn er drie soorten ongewenste bezoekers en verschillende manieren om van elk van hen af te komen:

  1. Ghost referrals zoals darodar / ilovevitaly / priceg / blackhatworth / hulfingtonpost.com / cenoval
  2. Enge crawlers zoals Semalt en Makemoneyonline
  3. Goed opgevoede bots en spiders

Hieronder leg ik eerst uit wat deze drie verschillende typen zijn.

1. Ghost Referrals

De nieuwste trend op het gebied van spam referral is wat we noemen ‘ghost referrals’. Denk hierbij aan verwijzende domeinen zoals darodar.com / econom.co / ilovevitaly.co / priceg.com / blackhatworth.com / hulfingtonpost.com. Dit zijn ‘ghost referrals’, omdat ze JE WEBSITE DUS NOOIT ECHT HEBBEN BEZOCHT. Door een soort software-hocus-pocus weten ze nep-pagina-views toe te voegen aan Google’s tracking service door gebruik te maken van een willekeurige serie tracking ID’s. Wanneer ze zo’n serie selecteren waar de tracking ID van jouw website onder valt, registreert Google een verwijzingsbezoek vanaf hun bron in jouw rapportage.

De nieuwste variant op deze aanval is om niet bestaanden bezoeken via Google /organic search aan je rapportage toe te voegen met zoektermen waar je zelf achter aan gaat (zoals “google officially -recommends ilovevitaly.com search shell”).

Omdat ze in werkelijkheid je website nooit hebben bezocht, kun je deze vorm logischerwijs ook niet blokkeren met veel gebruikte Javascript- of .htaccess-methoden. De enige manier is om er een filter voor aan te maken (zoals hieronder staat beschreven). Het grootste probleem met deze “ghost referrals” is, dat ze net zo snel komen als gaan. Het kan er dus op neerkomen dat je een dagtaak gaat hebben aan het bouwen van filters.

2. ‘Enge’ crawlers zoals Semalt

Niet alle bots zijn even vriendelijk door zichzelf zichtbaar te maken en de regels te volgen. Sommige zijn zelfs berucht voor het doorspitten van websites en het daarmee om zeep helpen van statistieken. Ze kruipen door de krochten van het wereldwijde web, graaiend naar informatie voor twijfelachtige doeleinden. In sommige gevallen, zoals bij de Semalt-crawler, kun je hun website bezoeken en vragen of ze jouw website(s) uit willen sluiten van verder crawlen.

In de meeste andere gevallen de verwijzende url bezoeken echt het laatste wat je zou moeten doen, omdat dit een open uitnodiging is om een virus of Trojan horse op je computer te installeren. Ik raad je aan om eerst even kort in Google te zoeken op de naam van de desbetreffende site om te kijken of je ze kunt vertrouwen. Check vooral ook de tweede en de derde pagina in de zoekresultaten om ook andere meningen over verwijzingssites te lezen. Er staat gewoon te veel verkeerde informatie bij de eerste zoekresultaten waarop je in een geval als niet kunt vertrouwen. Open in geen enkel geval de links in de zoekresultaten; doorgaans is de informatie die je in de stukjes tekst onder de zoekresultaten voldoende om te ernst van het probleem met de desbetreffende site te beoordelen. Als je er via de zoekresultaten niet uitkomt, check dan deze Google+pagina.

3. Goed opgevoede bots en spiders

Het web bestaat bij de gratie van bots en spiders. Normaal gesproken zijn het ook goede lui. Ze ontdekken je website en delen deze met anderen (hoe ben je hier eigenlijk terecht gekomen?). Google zou niet van jouw website hebben gehoord zonder ze. Om te voorkomen dat deze bots en spiders apart in je statistieken terecht komen, zijn er bepaalde standaards ontwikkeld waardoor ze automatisch geïdentificeerd en uitgefilterd worden.

[content_band inner_container=”true” no_margin=”true” border=”all” padding_top=”10px” padding_bottom=”10px” bg_color=”#eee” bg_image=”” parallax=”true” bg_video=”” bg_video_poster=””]
[column type=”one-half” last=”false” ]

Goed advies: gebruik ervaringen van anderen

Voordat je als een dolle gaat lopen klikken op allerlei instellingen in Google Analytics, lees dan eerst even deze Engelse handleiding van LunaMetrics door over het instellen van nieuwe filters:

1. Zorg dat je een ongefilterde rapportage in je ‘property’ hebt zonder filters.
2. Voer het niet meteen door in je hoofdrapportage. Maak eerst een testrapportage met daarin een kopie van je hoofdrapportage en voeg dan een of meer filters toe.
3. Pas wanneer je op basis van deze testomgeving tevreden bent met je nieuwe gefilterde rapportage, pas dan de filters toe op je hoofdrapportage.

[/column][column type=”one-half” last=”true” ]

Slecht advies: gebruik de lijst met verwijzingsuitsluitingen

Veel websites raden je aan om de Lijst met verwijzingsuitsluitingen te gebruiken (Beheerder > property > tracking info). Doe dit vooral niet, want deze maatregel werkt niet op een consistente manier! Het zal zeker bepaalde irritante verwijzingen uit je statistieken verwijderen, maar in plaats daar van kan het ongewenste bezoek toch in je statistieken terug komen als direct verkeer. Je moet de lijst met verwijzingsuitsluitingen eigenlijk alleen gebruiken voor bezoekers van Paypal of andere betaalsystemen die wel onderdeel zijn van een bezoekerssessie, doorgaans een stap in een betaalproces. Wat Google in dit geval doet is de oorspronkelijke sessie van deze bezoeker samenvoegen met de terugkeer naar je website nadat de betaling is voldaan. Anders wordt het verwijzende verkeer van je betaalserver als een aparte bezoeker gezien en dat is ook niet wat je wilt.[/column][/content_band]

 

[content_band inner_container=”true” no_margin=”true” border=”all” padding_top=”10px” padding_bottom=”10px” bg_color=”#eee” bg_image=”” parallax=”true” bg_video=”” bg_video_poster=””]

In deze blogserie “Hoe verwijder je referral spam uit Google Analytics?” zijn de volgende artikelen verschenen:

1. Wat is referral spam?

2. Ghost referrals verwijderen uit Google Analytics

3. ‘Enge’ crawlers zoals Semalt verwijderen uit Google Analytics

4. Bots en spiders die zich wel gedragen

5. Waarom bestaat spam referral en hoe doen ze het?

Deze serie artikelen is een vertaling van een blogpost van Mike Sullivan van Analytics Edge.

[/content_band]

[share title=”Interessant? Delen mag!” facebook=”true” twitter=”true” google_plus=”true” linkedin=”true” email=”true”]

1 reactie

  1. Rick op 11 februari 2015 om 1:06 pm

    Dank voor dit nuttige artikel en de heldere uitleg!

Laat een reactie achter