Google analyst day 2006 - le futur du moteur de recherche
Par Olivier Ffrench, lundi 20 mars 2006 à 07:46 :: Actualités des moteurs :: #9 :: rss
Le 2 mars dernier, une présentation de Google faite à des analystes financiers a été brièvement disponible sur le net en version intégrale commentée. Elle a été retirée rapidement, mais les commentaires ont été reconstitués et la présentation intégrale est toujours disponible : une lecture très intéressante.
Comme beaucoup, j'ai mis du temps à découvrir cette fuite. J'ai probablement vu passer l'information noyée dans le flux de posts plus ou moins intéressants concernant chaque micro-mouvement de Google qui remplit mon agrégateur de flux RSS. Pourtant cette présentation contient quelques perles sur la stratégie de Google pour les années à venir.
Vous trouverez une analyse de l'ensemble des slides sur le site d'Adscriptor par lequel j'ai découvert cette information et qui fait un superbe travail, notamment de traduction. Pour ma part, je vais rentrer dans les détails sur le sujet qui m'intéresse le plus : les orientations du moteur de recherche.
Les slides couvrant ce sujet ne constituent en fait qu'une partie de la première présentation, celle d'Eric Schmidt.
La priorité N°1 de Google reste la qualité des résultats de recherche. Une des premières affirmations de cette partie surprend tout de même un peu : we built our brand on being the best search engine, with the best results, but our competitors have caught up on us. La suite détaille les points sur lesquels Google devra progresser pour obtenir des avantages concurrentiels déterminants.
Une des affirmations les plus surprenantes faites par Eric Schmidt au tout début de sa présentation : nous considérons que nous disposons de 5% des informations que nous pourrions indexer. Intéressant si on considère le nombre de documents que Google met à notre disposition, et dont les pages webs ne constituent qu'une partie !
A priori il est possible de faire bien mieux et les commentaires de la slide Lead in Search indiquent les buts suivants :

Pour ceux qui souhaiteraient la lire par eux même, la présentation commentée est disponible via le blog de Paul Kedrosky.
Vous trouverez une analyse de l'ensemble des slides sur le site d'Adscriptor par lequel j'ai découvert cette information et qui fait un superbe travail, notamment de traduction. Pour ma part, je vais rentrer dans les détails sur le sujet qui m'intéresse le plus : les orientations du moteur de recherche.
Les slides couvrant ce sujet ne constituent en fait qu'une partie de la première présentation, celle d'Eric Schmidt.
Les priorités stratégiques de Google pour 2006
La priorité N°1 de Google reste la qualité des résultats de recherche. Une des premières affirmations de cette partie surprend tout de même un peu : we built our brand on being the best search engine, with the best results, but our competitors have caught up on us. La suite détaille les points sur lesquels Google devra progresser pour obtenir des avantages concurrentiels déterminants.
Rapidité
Le but est d'atteindre la performance des US pour le reste du monde. Je n'avais pas noté que Google était particulièrement lent, quelles que soient les applications utilisées (sauf Analytics, si on sort du moteur de recherche), mais apparemment c'est normal car les utilisateurs ne réalisent que c'est lent que dès lors qu'on rend les choses plus rapides. Un point intéressant est ajouté avec la mention des investissements matériels et logiciels destinés à atteindre les buts fixés (sur le slide Google Evolution)Exhaustivité et fraîcheur

Une des affirmations les plus surprenantes faites par Eric Schmidt au tout début de sa présentation : nous considérons que nous disposons de 5% des informations que nous pourrions indexer. Intéressant si on considère le nombre de documents que Google met à notre disposition, et dont les pages webs ne constituent qu'une partie !
A priori il est possible de faire bien mieux et les commentaires de la slide Lead in Search indiquent les buts suivants :
- Inclure toutes les pages webs disponibles
Deux éléments sous jacents non mentionnés de ce premier but : le web invisible et le rafraîchissement des données. Mais il est probable qu'ils sont implicites. - Diversifier les sources de données (images, videos, recherche géographique)
Pertinence
On arrive à la partie que j'ai trouvée la plus intéressante. Google chercherait améliorer la pertinence des résultats de recherche en utilisant des informations fournies directement ou non par ses utilisateurs. La citation exacte est : leverage implicit or explicit user feedback to improve popular and nav queries. Il y a pas mal de choses dans cette portion de phrase :- Implicit user feedback : à priori, il s'agit d'examiner le comportement des utilisateurs pour en tirer des conclusions sur la pertinence d'un document. Plusieurs indicateurs étaient déjà évoqués dans le brevet déposé en mars 2005 : Information retrieval based on historical data. Le choix par les utilisateurs d'une page dans la liste des résultats et le temps passé dessus étaient mentionnés et potentiellement utilisables pour ranker un document. Ces informations peuvent être recueillies par Google via la toolbar ou les cookies.
- Explicit user feedback : Google ferait appel directement à ses utilisateurs pour obtenir leur avis sur des documents. Ce point est évoqué une seconde fois sur la slide suivante où est mentionnée la possiblité d'intégrer des commentaires, tags et évaluations sur les documents afin d'améliorer leur évaluation. Un wiki of search est également mentionné, ce qui me laisse un peu perplexe.
- popular and nav queries : le traitement ci dessus ne peut pas être appliqué à toutes les requêtes. Seules certaines seraient concernées : celles sur lesquelles il y a les plus gros enjeux de trafic et pour lesquelles la pertinence est plus difficile à obtenir. Il s'agit aussi des cas pour lesquels Google pourra obtenir le plus d'avis d'utilisateurs et donc lisser les résultats obtenus.

Interface utilisateur
Quelques pistes sont données pour l'amélioration de l'expérience utilisateur :- Ajouter des fonctionnalités et rendre les outils plus faciles à utiliser (difficile de dire de quoi il s'agit exactement)
- Ajouter des éléments d'interface pour permettre de mieux interpréter les requêtes ou affiner les recherches (un affinage des recherches à la Exalead ?)
Conclusion
Il est clair à la lecture de cette présentation que Google nous réserve encore des surprises. Reste à savoir dans quels délais ces innovations seront mises en place et surtout ce que recouvrent exactement certaines des phrases les moins explicites de ce document !Pour ceux qui souhaiteraient la lire par eux même, la présentation commentée est disponible via le blog de Paul Kedrosky.
Commentaires
Aucun commentaire pour le moment.
Ajouter un commentaire