Voici les posts que j'ai relevés qui mentionnent "l'indexation express" de Google :
Google : aussitôt publié, aussitôt indexé sur le blog de Sébastien Billard
Il est frais mon spider, il est frais ! sur le blog d'Abondance
Google passe au référencement en temps réel ! sur le blog de 1ere Position
Certains des commentaires sur ces posts indiquent que d'autres personnes ont fait les mêmes observations.

Le problème c'est que sur certains des sites que je gère, je n'ai pas du tout constaté cela. Google ne semble pas indexer en quelques heures, mais plutôt en quelques jours ! Le dernier post fait sur ce blog date du 19 juillet. Nous sommes le 21, il n'est pas indexé par Google dont la dernière visite sur la homepage des Carnets de Référencement date du 15 juillet.

Fraîcheur des pages selon les moteurs

Sur un de mes sites, j'utilise une petite astuce pour repérer les dates d'indexation des robots et la fraîcheur de leurs informations : une date serveur présente sur toutes les pages. Il me suffit par la suite de faire taper une commande site:monsite.tld +"une date" pour voir le nombre de pages indexées ce jour là. Voici les chiffres pour ces derniers jours sur Google, Yahoo et MSN.

Date Google Yahoo MSN
21/07/2007 0 0 0
20/07/2007 0 3 2
19/07/2007 1 1 6
18/07/2007 26 14 18
17/07/2007 20 2 14
16/07/2007 23 24 5
15/07/2007 37 15 17
14/07/2007 42 30 24
13/07/2007 29 34 9
Comme on peut le voir, Google est plus régulier que Yahoo et MSN. Il capture entre 20 et 40 pages sur le site tous les jours. Par contre, il faut 2 ou 3 jours pour qu'elles apparaîssent dans les SERPS. Yahoo et MSN sont plus rapides d'une journée pour la publication dans l'index.

Vitesse d'indexation variable sur Google ?

Si Googlebot est moins rapide que MSN et Yahoo sur ce test comment se fait-il qu'il soit capable d'indexer des posts en quelques heures ?
Il y a plusieurs réponses possibles à cette question, mais la plus probable est que Google favorise certains sites. Les blogs qui ont pu voir leurs articles indexés en quelques heures ont un PR de 5 ou 6. Le site sur lequel je pratique mes tests à un PR de 4. Idem pour le blog sur lequel vous lisez ces lignes. Il serait logique que le PageRank (ou le TrustRank) influe sur la fréquence et la profondeur du crawl. Mais ce n'est probablement pas le seul facteur. Le dernier post du blog (PR7) de Fred Cavazza n'est toujours pas indexé près d'une journée après sa publication. Mais que fait donc Google ?