30.11.2012 - Search

Regex in Analytics voor beginners

Om te beginnen leggen we even uit wat Regex (Regular Expressions) juist zijn: Regular Expressions zijn uitdrukkingen die als doel hebben om een match te maken met tekststrings (zoals bijvoorbeeld url's). Aan de hand van deze Regex zal je bepaalde informatie kunnen filteren in programma's, zoals Google Analytics zonder daar enorm uitgebreide filters voor op te zetten. Een expert in Regex word je niet snel, want deze kunnen heel complex en overweldigend overkomen. Een aantal expressies zijn wel enorm handig wanneer je bepaalde handelingen wil doen in Google Analytics, zoals het opzetten van filters, doelen of bepaalde content wil segmenteren.

De pipe Regex |

het OF-statement wordt in Regex voorgesteld door de pipe |. Wil je in je organische bezoeken filteren op alle branded bezoeken, maar heb je verschillende merknamen? Gebruik dan deze Regex: merkX|merkY|merkZ en zo filter je op zoekwoorden die overeenkomen met merkX of merkY of merkZ.

Dit kan op vele manieren ingezet worden, zoals het instellen van verschillende uri's als 1 conversie bij je doelen binnen Google Analytics.

De haakjes Regex ()

We bouwen voort op wat we geleerd hebben met de pipe regex. Haakjes betekenen dat de items binnen de haakjes als aparte items moeten beschouwd worden. Een voorbeeld zal alles duidelijker maken. Wanneer we willen filteren op pagina's van 2 soortgelijke producten van één bepaald merk, dan kunnen we de Regex zo opbouwen:

/samsung(led|lcd)/

Deze Regex zal filteren op alle pagina's waar /samsungled/ of /samsunglcd/ deel uitmaakt van de url.

De vierkante haakjes Regex []

Vierkante haakjes duiden in de Regex wereld een range aan van cijfers of letters, of juist bepaalde specifieke tekens. We splitsen beide mogelijkheden even op.

De expressie [abc] komt overeen met de tekens "a","b" of "c".

Wanneer we een range gaan aanduiden, doen we dit door middel van -.  De Regex [a-c] betekent dus hetzelfde als [abc], namelijk "a","b" of "c".

Voor cijfers is het dezelfde toepassing, maar met uitzonderingen: zo zal de Regex [1-9] overeenkomen met 1, 2, 3, 4, 5, 6, 7, 8 en 9, maar [1-37] zal niet matchen met de cijfers 1, 2, 3, 4,..., 37. De reden hiervoor is omdat men elk element binnen de [] als een apart element beschouwd. Zo zal [1-37] een match geven met 1,2,3 en 7.

Wil je url's filteren waar het id een cijfers is tussen 1 en 37, dan moet je volgende expressie ingeven:

[1-9]|1[0,9]|2[0-9]|3[0-7]

Deze expressie zal de url's filteren met id 1 tot en met 9, 10 tot en met 19, 20 tot en met 29 en 30 tot en met 37.

Voor grote ranges hoef je het niet telkens per 10 op te splitsen, zo kan je voor de range 10-99 ook de volgende expressie gebruiken: [1-9][0-9]

Het punt Regex .

Het punt staat voor elk willekeurig karakter/teken in Regex, dus cijfers, letters, speciale tekens (%, #,...) en zelfs spaties. Dit zorgt ervoor dat sams.ng overeenstemt met samsung, samsing, sams2ng en zelfs sams ng. Het match elk mogelijk karakter, maar er moet dan ook echt een karakter of teken staan. Deze Regex zal dus niet matchen met samsng, waar het punt vervangen wordt door geen enkel karakter of teken.

De backslash regex

De backslash is een heel speciaal teken in de Regular expressions. Het wordt meestal in combinatie met andere tekens gebruikt want het ontdoet speciale regex tekens van hun regex functie. Het zet hun speciale eigenschap dus om in gewone tekst.

Wil je dus een punt gebruiken in je Regex en vermijden dat het match met eender welk willekeurig karaketer of teken, dan kan je de speciale eigenschap van het punt 'escapen' door er een backslash voor te zetten: "."

Het is vooral enorm handig bij het uitsluiten van bepaalde IP's omdat daar de cijfers gescheiden worden door punten. Wil je dus bijvoorbeeld het volgende IP adres uitsluiten: 10.255.255.255

Dan zal je dit als volgt moeten ingeven in Google Analytics: 10.255.255.55

Zo zal Analytics de punten in het IP adres ook beschouwen als echte punten en niet als extra willekeurige cijfers.

 

Dit was de eerste Regex in Google Analytics voor beginners, volgende keer doen we er nog een schepje bovenop.

Onlyhumans

De Human Anonymous gunt je een indiscrete kijk achter de computerschermen van onze storytellers en legt zijn oor te luisteren in onze wandelgangen.

Lees meer van Onlyhumans