Comme beaucoup, j'ai mis du temps à découvrir cette fuite. J'ai probablement vu passer l'information noyée dans le flux de posts plus ou moins intéressants concernant chaque micro-mouvement de Google qui remplit mon agrégateur de flux RSS. Pourtant cette présentation contient quelques perles sur la stratégie de Google pour les années à venir.

Vous trouverez une analyse de l'ensemble des slides sur le site d'Adscriptor par lequel j'ai découvert cette information et qui fait un superbe travail, notamment de traduction. Pour ma part, je vais rentrer dans les détails sur le sujet qui m'intéresse le plus : les orientations du moteur de recherche.

Les slides couvrant ce sujet ne constituent en fait qu'une partie de la première présentation, celle d'Eric Schmidt.

Les priorités stratégiques de Google pour 2006



La priorité N°1 de Google reste la qualité des résultats de recherche. Une des premières affirmations de cette partie surprend tout de même un peu : we built our brand on being the best search engine, with the best results, but our competitors have caught up on us. La suite détaille les points sur lesquels Google devra progresser pour obtenir des avantages concurrentiels déterminants.
Rapidité
Le but est d'atteindre la performance des US pour le reste du monde. Je n'avais pas noté que Google était particulièrement lent, quelles que soient les applications utilisées (sauf Analytics, si on sort du moteur de recherche), mais apparemment c'est normal car les utilisateurs ne réalisent que c'est lent que dès lors qu'on rend les choses plus rapides. Un point intéressant est ajouté avec la mention des investissements matériels et logiciels destinés à atteindre les buts fixés (sur le slide Google Evolution)
Exhaustivité et fraîcheur


Une des affirmations les plus surprenantes faites par Eric Schmidt au tout début de sa présentation : nous considérons que nous disposons de 5% des informations que nous pourrions indexer. Intéressant si on considère le nombre de documents que Google met à notre disposition, et dont les pages webs ne constituent qu'une partie !
A priori il est possible de faire bien mieux et les commentaires de la slide Lead in Search indiquent les buts suivants :
  • Inclure toutes les pages webs disponibles
    Deux éléments sous jacents non mentionnés de ce premier but : le web invisible et le rafraîchissement des données. Mais il est probable qu'ils sont implicites.
  • Diversifier les sources de données (images, videos, recherche géographique)
Pertinence
On arrive à la partie que j'ai trouvée la plus intéressante. Google chercherait améliorer la pertinence des résultats de recherche en utilisant des informations fournies directement ou non par ses utilisateurs. La citation exacte est : leverage implicit or explicit user feedback to improve popular and nav queries. Il y a pas mal de choses dans cette portion de phrase :
  • Implicit user feedback : à priori, il s'agit d'examiner le comportement des utilisateurs pour en tirer des conclusions sur la pertinence d'un document. Plusieurs indicateurs étaient déjà évoqués dans le brevet déposé en mars 2005 : Information retrieval based on historical data. Le choix par les utilisateurs d'une page dans la liste des résultats et le temps passé dessus étaient mentionnés et potentiellement utilisables pour ranker un document. Ces informations peuvent être recueillies par Google via la toolbar ou les cookies.
  • Explicit user feedback : Google ferait appel directement à ses utilisateurs pour obtenir leur avis sur des documents. Ce point est évoqué une seconde fois sur la slide suivante où est mentionnée la possiblité d'intégrer des commentaires, tags et évaluations sur les documents afin d'améliorer leur évaluation. Un wiki of search est également mentionné, ce qui me laisse un peu perplexe.
  • popular and nav queries : le traitement ci dessus ne peut pas être appliqué à toutes les requêtes. Seules certaines seraient concernées : celles sur lesquelles il y a les plus gros enjeux de trafic et pour lesquelles la pertinence est plus difficile à obtenir. Il s'agit aussi des cas pour lesquels Google pourra obtenir le plus d'avis d'utilisateurs et donc lisser les résultats obtenus.
La mise à contribution des utilisateurs du moteur peut être envisagée comme un outil de lutte efficace contre le spam. Les commentaires et ratings ne laisseront pas passer de pages douteuses ou de redirections. Il est possible que Google utilise déjà les éléments de feedback implicites, mais la possibilité de commenter ou de noter une page donnée serait quelque chose de très intéressant si tout le monde joue le jeu ! La slide de "la vache" que je ne résiste pas à la tentation de faire figurer ci dessous vient peut être appuyer ce point : la sagesse collective comme soutien aux algorithmes de ranking ?


Interface utilisateur
Quelques pistes sont données pour l'amélioration de l'expérience utilisateur :
  • Ajouter des fonctionnalités et rendre les outils plus faciles à utiliser (difficile de dire de quoi il s'agit exactement)
  • Ajouter des éléments d'interface pour permettre de mieux interpréter les requêtes ou affiner les recherches (un affinage des recherches à la Exalead ?)
La personnalisation transparente est mentionnée plus loin. L'exemple donné est Google desktop, mais les homepages personnalisées récemment mises en place vont dans le même sens.

Conclusion

Il est clair à la lecture de cette présentation que Google nous réserve encore des surprises. Reste à savoir dans quels délais ces innovations seront mises en place et surtout ce que recouvrent exactement certaines des phrases les moins explicites de ce document !

Pour ceux qui souhaiteraient la lire par eux même, la présentation commentée est disponible via le blog de Paul Kedrosky.