Googlebot : spider à vitesse variable
Par Olivier Ffrench, samedi 21 juillet 2007 à 18:33 :: General :: #56 :: rss
Plusieurs blogs de référenceurs émérites se sont récemment faits l'écho d'un phénomène surprenant : Google aurait entrepris d'indexer de nouveaux contenus en quelques heures, voire quelques dizaines de minutes. C'est peut être le cas pour une petite quantité de sites populaires, mais c'est loin d'être généralisé.Voici les posts que j'ai relevés qui mentionnent "l'indexation express" de Google :
Google : aussitôt publié, aussitôt indexé sur le blog de Sébastien Billard
Il est frais mon spider, il est frais ! sur le blog d'Abondance
Google passe au référencement en temps réel ! sur le blog de 1ere Position
Certains des commentaires sur ces posts indiquent que d'autres personnes ont fait les mêmes observations.
Le problème c'est que sur certains des sites que je gère, je n'ai pas du tout constaté cela. Google ne semble pas indexer en quelques heures, mais plutôt en quelques jours ! Le dernier post fait sur ce blog date du 19 juillet. Nous sommes le 21, il n'est pas indexé par Google dont la dernière visite sur la homepage des Carnets de Référencement date du 15 juillet.
Fraîcheur des pages selon les moteurs
Sur un de mes sites, j'utilise une petite astuce pour repérer les dates d'indexation des robots et la fraîcheur de leurs informations : une date serveur présente sur toutes les pages. Il me suffit par la suite de faire taper une commande site:monsite.tld +"une date" pour voir le nombre de pages indexées ce jour là. Voici les chiffres pour ces derniers jours sur Google, Yahoo et MSN.
| Date | Yahoo | MSN | |
|---|---|---|---|
| 21/07/2007 | 0 | 0 | 0 |
| 20/07/2007 | 0 | 3 | 2 |
| 19/07/2007 | 1 | 1 | 6 |
| 18/07/2007 | 26 | 14 | 18 |
| 17/07/2007 | 20 | 2 | 14 |
| 16/07/2007 | 23 | 24 | 5 |
| 15/07/2007 | 37 | 15 | 17 |
| 14/07/2007 | 42 | 30 | 24 |
| 13/07/2007 | 29 | 34 | 9 |
Vitesse d'indexation variable sur Google ?
Si Googlebot est moins rapide que MSN et Yahoo sur ce test comment se fait-il qu'il soit capable d'indexer des posts en quelques heures ?
Il y a plusieurs réponses possibles à cette question, mais la plus probable est que Google favorise certains sites. Les blogs qui ont pu voir leurs articles indexés en quelques heures ont un PR de 5 ou 6. Le site sur lequel je pratique mes tests à un PR de 4. Idem pour le blog sur lequel vous lisez ces lignes. Il serait logique que le PageRank (ou le TrustRank) influe sur la fréquence et la profondeur du crawl. Mais ce n'est probablement pas le seul facteur. Le dernier post du blog (PR7) de Fred Cavazza n'est toujours pas indexé près d'une journée après sa publication. Mais que fait donc Google ?
Commentaires
1. Le lundi 23 juillet 2007 à 10:03, par Julien
2. Le lundi 23 juillet 2007 à 11:08, par Patrice
3. Le lundi 23 juillet 2007 à 11:34, par Kilroy
4. Le lundi 23 juillet 2007 à 14:48, par Patrice
5. Le lundi 13 août 2007 à 19:35, par Al-Kanz
6. Le lundi 13 août 2007 à 19:54, par Kilroy
7. Le jeudi 20 mars 2008 à 11:35, par Voyance
Ajouter un commentaire