Optimiser le rapport signal / bruit d'un site web
Par Olivier Ffrench, jeudi 5 juillet 2007 à 14:38 :: Gestion de l'indexation :: #53 :: rss
Gérer l'indexation d'un site, ce n'est pas seulement faire en sorte que les moteurs puissent en indexer une intégralité. Il est souvent nécessaire de circonscrire leur activité à certaines pages seulement.
L'idée du rapport signal / bruit est venue d'un article d'Aaron wall sur le linking interne intitulé : internal architecture made easy. L'un des chapitres est intitulé Keep the Noise Out of the Index et indique clairement qu'il y a deux types de pages : celles qu'il faut faire indexer et les autres ! En fait, il y a pas mal de cas différents et des critères simples pour déterminer quelles pages faire indexer ou non.
Pages qu'il faut impérativement exclure de l'indexation
Parmi les pages qui doivent être éliminées on peut trouver :- Les pages présentant des risques de sécurité pour le site.
- Toutes les pages en duplicate content. L'équation à respecter est toujours la même : 1 contenu = 1 page = 1 URL.
- Les pages permettant aux internautes d'effectuer certaines actions : envoyer à un ami, imprimer, afficher le contenu au format PDF, mettre un article dans le panier...
- Les popups (qui peuvent avoir un lien crawlable) car l'internaute qui aboutirait dessus ne pourrait plus naviguer sur le site.
- Un site d'e-commerce qui permettait l'indexation de pages "mise dans le panier". Les internautes pouvaient donc arriver d'un moteur de recherche et avoir un article dans leur panier dès leur entrée sur le site.
- Un forum qui permettait l'indexation des pages "répondre à ce message". Il y avait une page supplémentaire par message sur le forum !
Commentaires
1. Le vendredi 6 juillet 2007 à 10:35, par Ramenos
2. Le vendredi 6 juillet 2007 à 11:54, par Kilroy
Ajouter un commentaire