Not Provided keyword data in Google Analytics

Sinds eind 2011 toont Google Analytics niet langer alle keywords die bezoekers hebben ingetypt om op uw website landen. In de keywordrapporten zal u merken dat vanaf dan steeds een gedeelte van de visits wordt toegewezen aan “not provided” verkeer. Deze verandering zorgde in de eerste plaats voor heel wat frustratie bij de SEO’s die op die manier in 1 oogopslag heel wat waardevolle keyword data verloren zagen gaan. Ook de rapportage naar klanten toe in de toekomst zou nooit meer hetzelfde kunnen zijn aangezien er altijd rekening gehouden moet worden met een stukje “niemandsland” zijnde de “not provided” keyword resultaten.

Hoe komen not provided keywords tot stand in Google Analytics rapporten

Hoe komt Google Analytics exact aan zijn not provided keyword resultaten? Voorheen wanneer iemand een keyword intypte in een zoekrobot en een zoekresultaat voor uw website aanklikte werd er automatisch de nodige data doorgestuurd om deze visit te linken aan een bepaald keyword. Na de update wordt er een onderscheid gemaakt tussen gebruikers die ingelogd zijn met hun Google account en gebruikers die niet ingelogd zijn met hun Google account. Gebruikers die zijn ingelogd worden via “encrypted search” via SSL doorgestuurd naar een https versie van Google die belet dat de keyword data nog wordt doorgestuurd naar het keyword rapport in Google Analytics. Het resultaat is dat de visit wordt toegekend aan “not provided” Algemeen wordt aangenomen dat ongeveer 30% van de visits wordt toegewezen aan not provided verkeer, toch merk ik dat de verschillen soms tamelijk groot zijn op verschillende accounts.

Welke praktische problemen brengen not provided keywords met zich mee?

Not provided verkeer zorgt voor enkele praktische problemen bij het opmaken van rapportages. Een van de parameters die vroeger (en nu nog) gebruikt wordt voor het meten van het effect van de SEO inspanningen is de groei in het aantal keywords en het feit dat er steeds meer en meer long tail opduikt tussen de zoekwoorden. Long tail keywords zijn query’s die uit 3 of meer woorden bestaan. Algemeen wordt aangenomen dat omdat long tail keywords specifieker zijn de bezoeker ook naar meer specifiekere informatie op de website op zoek is en sneller geneigd is om te converteren. Doordat na de update een hele reeks keywords werd samengenomen onder de noemer “not provided” is de groei in het aantal verschillende keyword phrases niet exact meer te meten. Sommige unieke keyword phrases worden niet meer getoond. Dit kan leiden tot foute interpretaties, bijvoorbeeld interpreteren dat het aantal verschillende keywords lager is dan vorig jaar terwijl dit in realiteit niet zo is.

Top keywords vergelijken met de data van 2011 is ook niet altijd meer even correct. Sinds not provided is geïntroduceerd in Google Analytics zijn er, zeker op de topkeywords, een hele reeks bezoekers ongetwijfeld toegewezen aan “not provided”. Om op het eerste zicht dezelfde resultaten te behalen qua visits op topkeywords moet je sowieso meer visits hebben aangetrokken. Kort samengevat zijn de inspanningen op keywordniveau niet altijd meer zichtbaar in de Google Analytics rapporten. Toch even uitkijken dus!

Ook de ratio tussen non branded verkeer en branded verkeer op keywordniveau is helemaal verstoord na de introductie van “not provided”. Als SEO heb je natuurlijk het liefst dat het non branded verkeer op de website steeds maar stijgt. Dit toont aan dat de website op steeds meer en meer keyword variaties te vinden is in Google. Het stukje “not provided” echter bestaat uit een onbekend stuk branded verkeer en non branded verkeer zodat nooit helemaal accuraat te achterhalen valt wat het exact aantal branded en nonbranded keywords is voor de periode in kwestie.

Hoe achterhaal ik zoveel mogelijk not provided gegevens in Google Analytics?

Een manier om alvast meer inzicht te krijgen in het “not provided” gedeelte van de website is de volgende. Ga in Google Analytics naar de organische zoekresultaten en klik op het keyword “not provided”. Kies vervolgens als 2e dimensie voor “landingpage”. Op deze manier krijg je naast elk “not provided” keyword de landingspagina opgelijst. De exacte keywords achterhalen is niet mogelijk maar dit geeft toch enig inzicht in de topics waarin de bezoekers interesse toonden. Er wordt soms ook beweerd dat je de visitors op de root pagina als branded kan nemen maar dit lijkt me nogal kort door de bocht hoewel het merendeel dat landt op home mogelijk wel branded kan zijn.

Een andere techniek om tot meer aannemelijke resultaten te komen is de techniek van het schatten. Hoe begin je hieraan? Eerst en vooral stel je de periode in in Google Analytics waarvan je de data wil meten. Filter dan achtereenvolgens je branded aantal bezoekers, je non branded aantal bezoekers en je not provided aantal bezoekers. Zet het aantal non branded bezoekers en het aantal branded bezoekers ten opzichte van het totale aantal visits en bereken zo de percentages van deze bezoeken. Achtereenvolgens doe je volgende 2 berekeningen:

Non-branded / (Organic traffic – Not Provided) = % Non-branded traffic
Branded / (Organic traffic – Not Provided) = % Branded traffic

Deze 2 percentages moeten op 100% uitkomen. Aan de hand van de bovenstaande 2 percentages kan je dan je not provided verkeer gaan splitten om een geschat aantal branded en non branded bezoekers extra toe te kennen aan de google Analytics gegevens.

Er is reeds langere tijd ook een filter beschikbaar voor Google Analytics die not provided bezoeken gaat omzetten in np-/[URI]. Dit wil zeggen dat wanneer iemand binnen komt op not provided steeds de URI getoond zal worden in het zoekwoordrapport. De URI zijnde het gedeelte van het websiteadres na de domeinnaam. Hierdoor krijg je als SEO ook een inzicht op welke pagina een bezoeker geland is.

De meest veelbelovende oplossing voor het toekkennen van not provided analytics verkeer is eentje die voorgesteld is door Ben Goodsell op SearchEngineWatch. Hij stelt een oplossing voor waarbij zowel gegevens uit Google Analytics als uit Google Webmaster Tools worden geëxporteerd en via de excel VLOOKUP formule worden geanalyseerd. Behoorlijk uitgebreid en tijdrovend maar tegelijkertijd wel de meest accurate oplossing van de 4 voorgestelde procedures.

Heeft u zelf ook uw hoofd gebroken over een oplossing om zoveel mogelijk not provided keyword data efficient te kunnen toewijzen aan branded of non branded verkeer? Of weet u hoe u eenvoudig enkele zoektermen terug kan samenstellen vanuit not provided? Laat ons zeker weten hoe u dit heeft aangepakt in de comments van dit artikel!

Executive Summary

Sinds eind 2011 geeft Google niet alle keyword data meer vrij in analytics
Hoe wordt not provided verkeer opgebouwd in Google analytics? Wat zijn de praktische problemen die dit met zich meebrengt? Hoe achterhalen we toch nog zoveel mogelijk gegevens?

1 Comment




    Leave a Reply

    Your email address will not be published. Required fields are marked *