Meer content, snellere indexatie – het ‘Freshness’ algoritme

Google kondigde vorige week een update aan voor hun Google Search algoritme. Het algoritme werd namelijk op zo’n manier aangepast dat content sneller geïndexeerd en dus zoekbaar is voor de consument. Er is een steeds groeiende hoeveelheid content die dagelijks gepubliceerd wordt en dus vindbaar moet zijn en daarom werd het zoekalgoritme geüpdatet: om zo relevant en recent mogelijke resultaten te kunnen bieden.

Eric Schmidt van Google zegt het volgende: “Every two days now we create as much information as we did from the dawn of civilization up until 2003, according to Schmidt. That’s something like five exabytes of data, he says.”

Net omdat content zo snel aangemaakt en gepubliceerd wordt, moet die ook even snel toegankelijk zijn. Bovendien hebben we tegenwoordig al andere kanalen om het nieuws in real-time te volgen, namelijk sociale netwerken als Twitter, Facebook & Google Plus. Jammer genoeg worden tweets nog steeds niet opgenomen in de zoekresultaten van Google sinds de ‘firehoseovereenkomst tussen Google & Twitter stopgezet werd.

De content is dus ‘verser’ maar toch nog niet echt real-time…

De volgende stap in het Caffeine proces

Sinds vorig jaar is Google al bezig met een nieuw indexatiesysteem, namelijk ‘Caffeine’. Bij het oude systeem was het zo dat Google een heel deel pagina’s crawlde om die vervolgens te gaan analyseren en vast te stellen waarover de content juist gaat. Pas nadat alle pagina’s en documenten geanalyseerd waren, werden ze ook geïndexeerd.

Het nieuwe systeem zorgt ervoor dat iedere pagina die gecrawld wordt, ook meteen geanalyseerd en geïndexeerd wordt zodat ze sneller vindbaar is.

Het real-time web

Het nieuwe indexatiesysteem heeft er nu dus toe geleid dat ook het algoritme aangepast werd zodat je, wanneer je nu zoekt, de meest recente resultaten te zien krijgt voor bepaalde zoekopdrachten. Volgens Google leidt deze ‘Freshness update’ er toe dat Google beter kan bepalen welke ‘graad van versheid’ de zoekresultaten moeten hebben. Gevolg? Maar liefst 35% van alle zoekopdrachten zou beïnvloedt worden door het algoritme.

Het algoritme zal in volgende gevallen bepalen of het nodig is up-to-date resultaten te geven:

  • Recente events of hot topics, bv.: MTV Awards
  • Regelmatig terugkerende events, bv.: presidentsverkiezingen
  • Frequente updates, bv.: zoekopdrachten naar info die regelmatig verandert bv. over auto’s

Het Google Search algoritme is nu dus beter in staat om te bepalen hoe up-to-date bepaalde zoekresultaten voor een bepaalde zoekopdracht moeten zijn. Als je bijvoorbeeld zoekt naar de Olympische Spelen, ‘weet’ Google dat je allicht op zoek bent naar info over de komende Olympische Spelen en niet naar die van 50 jaar geleden…

Naast de versheid wordt uiteraard nog steeds de kwaliteit en de relevantie van zoekresultaten geanalyseerd. Dit moet ervoor zorgen dat spam die dan wel ‘vers’ is uit de zoekresultaten geweerd blijft.

Het blijft dus belangrijk voor bedrijven en webmasters om content up-to-date te houden en regelmatig ook nieuwe content te publiceren.

De mededeling van Google over het Freshness algoritme is na te lezen op de Google Blogspot.

Executive Summary

Wat? Update voor het Google Search algoritme
En? De update heeft een impact op maar liefst 1/3e van alle zoekresultaten
Dus? Zoekresultaten zijn bijna terug real-time, maar nog niet helemaal…

2 Comments




    Leave a Reply

    Your email address will not be published. Required fields are marked *