L'article est paru sur le site LinkBuildingBlog sous le titre aguicheur : Secrets to Beating the Sandbox 2.0 REVEALED: The Ultimate Guide. C'est du link baiting pur et simple, comme je viens de le prouver en lui fournissant un lien supplémentaire. Mais l'article est très intéressant pour tout webmaster qui, comme moi, est passé par les affres de la sandbox de Google.

Je ne résiste pas à la tentation d'en détailler quelques points (en français pour ceux que l'article original en anglais rebute) :

La sandbox existe bel et bien et elle s'applique à tous les nouveaux domaines

Andy lance régulièrement de nouveaux sites et son expérience lui permet de couper court aux polémiques : la sandbox n'est pas une vue de l'esprit de webmasters impatients. Tout nouveau domaine est sandboxé, indépendamment de son secteur d'activité, type de site, nombre de pages, etc... Les sites sont pénalisés par un filtre, jusqu'à ce qu'ils aient acquis la confiance de Google, et la sandbox devrait en fait s'appeler "trustbox".

J'ajouterais que j'ai vu des effets proches de la sandbox sur des sites dont le nom de domaine est ancien, mais qui ont des caractéristiques précises :
  • Site ayant utilisé des méthodes de référencement "borderline", typiquement des pages satellites détectables
  • Site ayant fait l'objet d'un refonte complète (et qui perdent donc le bénéfice de leurs anciennes pages)

La sandbox influe sur le crawl et l'indexation

Au lancement d'un site, Google est souvent lent à indexer les premiers niveaux d'arborescence. Matt Cuts lui même l'a dit : les sites n'ayant pas la confiance de Google sont crawlés moins fréquemment et moins en profondeur. C'est bien entendu le cas des sites nouveaux qui doivent acquérir cette confiance.

Andy ajoute que lorsque le site commence à être indexé plus correctement, cela montre qu'il est en bonne voie pour sortir de la sandbox. Un indicateur pratique !

Les étapes de sortie de la sandbox

Andy distingue 4 étapes dans le sandboxing avec des symptômes bien distincts :
  1. Site complètement sandboxé. Il n'est pas crawlé ou indexé, ne ressort sur rien dans les résultats de recherche
  2. Site en cours de sortie. Il a quelques liens entrants de sites de confiance et est mieux indexé. Il apparaît sur des requêtes spécifiques ou médianes, mais pas sur des requêtes génériques. (Un article pour savoir ce que j'entends par requête spécifique, médiane, générique)
  3. Site complètement sorti de la sandbox. Il a désormais un nombre important de liens entrants provenant de sites de confiance et peut apparaître sur certaines requêtes génériques
  4. Le site est une autorité dans son domaine. Ses pages sont crawlées tous les jours, indexées dans les 48 heures et rankent facilement sur des requêtes qui font partie de ses thématiques centrales.
Il est clair que de nombreux sites n'atteignent pas la troisième étape. Sans un effort au niveau du linking, certains n'atteignent pas l'étape 2, à moins d'avoir des contenus particulièrement intéressants.

Les moyens pour sortir de la sandbox

Sur cette partie, je dois avouer qu'Andy est moins original. J'ai retrouvé des idées qu'il avait déjà développées dans d'autres articles. Mais il s'agit quand même d'étapes qui devraient normalement être prévues dans le lancement de tout nouveau site :
  • Concevoir des contenus intéressants, uniques, qui susciteront des liens unilatéraux (et non réciproques)
  • Inscrire le site dans un petit nombre d'annuaires de confiance. Vous avez noté les mots petit nombre. Placer son site sur 1000 annuaires qui valident automatiquement les inscriptions, ont un PR de 2 et ne génèreront aucune visite est une perte de temps. Il ne s'agit pas de liens de confiance. Même s'ils ne sont pas réciproques, ils auront peu de poids pour Google.
  • Utiliser les sites de confiance qui permettent d'insérer des contenus. Typiquement : Wikipedia. Les liens tiendront s'ils sont mis avec discernement et si le site linké est réellement intéressant
  • Acheter des liens à partir de sites de confiance (blogs typiquement). Pub gratuite pour le réseau Text Link Ads :-)
  • Utiliser ses propres sites (logique)
J'ajouterais à cette liste : tirer parti au maximum des communiqués de presse qui annoncent la création du site, surtout s'il s'agit d'un changement pour une marque déjà connue.

Conclusion

Je vois régulièrement sur les forums des personnes qui viennent de lancer leur site et s'étonnent de n'avoir que la home indexée et de ne pas apparaître sur leur nom. Je fais alors une petite vérification et je découvre que le site à 2 liens entrants à partir de pages PR 0.

L'article d'Andy Haggans donne toutes les solutions à ce problème : il n'y a plus qu'à les appliquer. Au travail !