Sébastien Billard en parle dans un article intitulé la longue traîne en pratique, l'agence éditoriale Dixxit l'évoque dans un livre blanc sur les contenus et le référencement, mais qu'est-ce donc que la longue traîne ?

A la base il s'agit d'une distribution de valeurs statistiques particulière observable sur certains types de données. Sébastien et Dixxit montrent que les visites par mots clefs d'un site web à fort contenu obéissent à cette loi et sont distribuées de cette façon particulière. Le nombre de mots clefs qui génère un trafic important est faible alors que les mots clefs qui génèrent peu de trafic sont nombreux et jouent un rôle important dans le trafic total.

J'ai voulu moi aussi tester la distribution du trafic sur un site avec un bon volume de contenus. Pour cela, j'ai utilisé les statisiques de janvier 2007 de mon site France in Photos qui a les caractéristiques suivantes :
  • Site avec 780 pages
  • 8358 visites moteurs avec mots clefs associés
  • 2628 mots clefs différents
Sur ce site, la courbe est tellement prononcée qu'elle est totalement illisible. La courbe descend très vite et la traîne est très longue.

long tail illustréePour y voir plus clair, j'ai fait un second graphique qui montre la part dans le trafic total des mots clefs à n visites.

La ventilation du trafic sur ce site est assez atypique par rapport aux observations du livre blanc de Dixxit :
  • Les deux mots clefs principaux (pictures of Paris et Paris photos) totalisent 18% du trafic
  • Le top 25 des mots clefs totalise 40% du trafic
  • Les mots clefs à moins de 10 visites totalisent 45% du trafic
  • Pas grand chose entre les deux : seules une cinquantaine de mots clefs (sur 2628) ne font partie d'aucun des deux groupes précédents
Ce site est probablement un peu particulier. Il a moins de pages que les sites évoqués par Dixxit et Sébastien Billard. Un petit nombre de ces pages sont bien positionnées sur des expressions à fort potentiel de trafic, ce qui influe beaucoup sur les résultats.
Il serait intéressant de voir cette distribution sur d'autres types de sites, par exemples ceux où des référenceurs ont déployé un grand nombre de pages satellites optimisées sur des mots clefs précis, mais aux contenus assez similaires.
L'évolution de ce type de distribution sera également intéressante à suivre.