TripAdvisor et ses algorithmes de popularité : bons classificateurs ou outils standardisants?

Last modified date

La plateforme TripAdvisor créée en 2000 a changé la manière dont le consommateur sélectionne ses hôtels, restaurants, villes et régions à visiter, ainsi que ses loisirs. Avec l’arrivée d’Internet, ainsi que les vols « low cost », le voyageur devient de plus en plus indépendant et préfère se passer des agences de voyages trop chères ou encore de guides touristiques soumis à un jugement d’expert, en lequel le consommateur n’a pas toujours confiance. En effet, l’expert étant parfois soupçonné d’être corrompu, trop partial ou autocentré (Cardon 2015), les acheteurs potentiels de services préfèrent se fier à des avis plus authentiques et transparents d’un ensemble de personnes «  comme eux » . 

Le site américain comme plein d’autres (Yelp, LaFourchette, L’Internaute, etc..) se base sur un système N&A (notations et avis) des différents services par les consommateurs qui peuvent leur attribuer une note, ainsi que des commentaires dans le but de bénéficier à des futurs clients qui chercheraient à faire un choix d’hôtel, restaurant, activité ou encore région à visiter. Grâce à Internet, Ce type de plateforme offre un espace supplémentaire de partage sur des services participant à la création d’une intelligence collective faisant office d’autorité.

Malgré une certaine démocratisation de l’opinion, la plupart des sites comme TripAdvisor fonctionnent sur la base d’algorithmes servant d’intermédiaires qui décident, à terme de la hiérarchisation des différents services de la plateforme. Ces algorithmes agissent comme « modérateurs »  et se baseraient, selon la plateforme sur trois principes: la qualité, la récence et la quantité des avis. Mais qu’en est-il de leur réelle nature et fiabilité? Sont-ils réellement de bons indicateurs de la qualité d’un hôtel ou d’un restaurant par exemple? Ne créeraient-ils pas une norme non exhaustive et à terme un standard auquel les gens se conformeraient? Ce sont ces questions que je tâcherai d’aborder dans de ce travail. 

D’une pratique solitaire à un nouvel espace de communication

TripAdvisor a participé au remplacement de pratiques de consultation autrefois solitaires par un système collaboratif de production de connaissances. Internet contribue aux besoins des individus et des communautés de créer une forme de proximité, là où demeure une distance et permet, ainsi d’aménager un espace où l’on peut agir ensemble (Beaude 2012). Avant l’arrivée d’Internet, La consultation d’avis sur des services de restauration hôtellerie ou loisirs, se faisait principalement à travers des guides comme le Guide Michelin, apparu en 1900 et constituait une pratique solitaire. La création de plateformes tels que TripAdvisor a permis de construire une réelle communauté de bouche-à-oreille dont l’abondance des évaluateurs provoque un climat de confiance chez l’acheteur potentiel. Avec internet et ses virtualités, nous devenons témoins de ce que Beaude appelle la synchorisation, « le processus qui consiste à se donner un espace commun pour être et pour agir » (Beaude 2012). Le mot est dérivé du terme « chôra » du grec ancien définissant l’espace existentiel, pensé en terme de distance et de relations énergétiques entre les choses. TripAdvisor se rapporte à la synchorisation, car nous ne sommes plus seuls face à nos choix en tant que consommateurs, mais nous évaluons, choisissons et agissons ensemble dans l’espace prévu à cet effet.

« C’est la toute la puissance de la connexité. Quel que soit le lieu où l’on se trouve aux États-Unis, en un instant, il est possible de consulter des informations relatives à un film sur IMDb, de l’acheter ou de le louer sur Amazon, avant de le regarder chez soi. »

(Beaude 2012)

La plateforme qui accueille plusieurs centaines de millions de visiteurs par mois est un espace de communication considérable. Depuis peu, TripAdvisor s’est alliée avec LaFourchette et le Guide Michelin mais également Booking.com pour proposer des services plus complets et permettre notamment aux consommateurs de réserver directement depuis le site principal. Ces mutations sont symptomatiques de ce à quoi nous assistons ces dernières années : « la coalescence des espaces les plus importants et à la disparition des espaces les plus petits » (Beaude 2012). Dans un but ultime, les plateformes numériques majeures comme Facebook ou Amazon, chercheraient à « créer une centralité suffisamment forte pour déployer par la suite tout un espace qui recouvre la majeure partie des pratiques qui ont lieu sur Internet » (Beaude 2012). TripAdvisor qui fonctionne de la même manière en s’alliant avec les différents services de restaurations et hôtellerie (Booking.com et LaFourchette) est devenu donc, non seulement un espace qui permet le partage d’avis de consommateurs, mais également un lieu de «  coalescence réticulaire » (Beaude 2012). Après avoir consulté les avis des différents services à disposition, notamment les hôtels et les restaurants, le consommateur peut directement faire une réservation depuis le site, grâce à son partenariat avec LaFourchette et Booking.com. Peu importe ou l’on se trouve dans le monde, on peut préparer ses prochaines activités ou voyages en consultant le site TripAdvisor, et en y réservant l’hôtel ou le restaurant de son choix en quelques clics.

Qualité, récence et quantité : Les avis interceptés

Si le classements des différents services se fait à l’aide des notations et des commentaires des utilisateurs, des algorithmes viennent intercepter ces avis, afin de les synthétiser. Même s’il est difficile de connaître les métriques exactes des algorithmes de classification de la plateforme, on sait cependant qu’ils sont basés sur trois grands principes: la qualité, la récence ou encore la quantité d’avis. La qualité est déterminée par le nombre de « bulles » (de 1 à 5) attribuées aux services et biens. Les restaurants ou hôtels obtenant des notes de 4 ou 5 vont être classés plus haut que ceux avec 2 ou 3 points, par exemple. Les avis les plus récents sont favorisés car selon le site, les services doivent constamment satisfaire les attentes des consommateurs, la récence témoignant de cette continuation. La quantité des avis joue également un rôle important car elle évite des biais possible liés à certains services qui arrivent rapidement en haut du classement car leur moyenne est élevée, mais fondée sur très peu d’avis. En effet, si un restaurant ou un hôtel obtient une moyenne de 5 avec l’avis de deux consommateurs seulement, l’algorithme fera en sorte que cela vaudra moins qu’un service noté par 1000 personnes et ayant une note de 4,5, par exemple 1. Comme il est pas facile de faire une analyse sémantique sophistiquée des commentaires avec des outils automatiques, les algorithmes se basent principalement sur les note quantitatives pour classer. En 2009, le site TripAdvisor a également déclaré que les calculs algorithmiques prenaient également en considération certaines entrées de guides touristiques, des articles de journaux ou d’autres contenus issus d’Internet.

Les algoritmes ne jugent pas

Avant d’entrer dans les problématiques liées à la synthèse algorithmique, il est important de rappeler la fonction et l’essence même de ces systèmes automatiques. L’augmentation constante et massive des données produites par les plateformes numériques demandent qu’elles soient d’une manière ou d’une autre gérées. Les algorithmes sont des outils nécessaires au tri de l’information, à la personnalisation des affiches publicitaires, à la recommandation et ainsi de suite. Même si ces instruments ont de la peine à atteindre une neutralité pure, il est important qu’ils soient loyaux, c’est-à-dire que leur fonctionnement soit connu aux utilisateurs des plateformes mobilisant les différents algorithmes : « L’obligation de loyauté interroge donc, non pas une vaine neutralité, objectivité ou vérité de la représentation des informations, mais l’alignement, ou le désalignement, entre le service que la plateforme prétend rendre et la réalité de ce qu’elle offre » (Cardon D. 2018). Dans le cas de TripAdvisor, il est important de savoir que les algorithmes ne vont pas véritablement et objectivement nous faire part des meilleurs restaurants ou hôtels de la région, ils suivent simplement une procédure pré-programmée.

Il est important de comprendre que les algorithmes ne « jugent » pas, c’est-à-dire que leurs règles de calculs sont d’ordre « procédurales » et non « substantielle » (Cardon D. 2018). En effet, dans le cas des algorithmes de popularité de TripAdvisor, l’on considère ce qui constitue la métrique de qualité : la moyenne des notes attribuées au service. La note permet la simplification des qualités en une quantité mesurable et vient «  objectiver une dimension subjective du rapport à l’hôtel » (Bertin et Granier 2015).Les algorithmes sont parfois accusés de tromper , trahir mais, en réalité, ces outils ne peuvent pas être « biaisés », « si l’on ne peut opposer aux classements algorithmiques une représentation bonne ou juste » (Cardon D. 2015). Ce reproche n’est donc pas valable pour les algorithmes de popularité. De ce fait, il est impossible d’avoir un point de vue totalement objectif à travers la médiation des algorithmes quant à la qualité d’un service, mais ce n’est de toute façon pas le but principal de la plateforme. L’ambition d’utilisation de ces outils d’automatisation est de parvenir à « épouser si étroitement le milieu dans lequel il intervient que les comportements des acteurs se règlent sur ses verdicts et que les principes qu’il met en oeuvre nourrissent leurs représentations » (Cardon D. 2018). Dans ce sens là, les algorithmes de TripAdvisor sont tout à fait « fonctionnels ».

Les biais relatifs aux données

Si les algorithmes de classification ne sont pas réellement « biaisés », les données qu’ils synthétisent, elles, le sont et l’impact est essentiel. Tout d’abord, il est important de parler de la représentativité des entités d’évaluation. Il a été démontré que dans ce type de plateforme de notes et avis, seulement un petit pourcentage évaluait les services contre une grande majorité qui n’utilise ces sites que pour s’informer. Il est également important de distinguer ce qui est noté, l’hôtel ou l’expérience hôtelière? En effet, selon Vincent Cardon, « la recommandation emprunte aisément la voie du récit égocentré attestant de la capacité de l’hôtel en question à avoir rempli ce contrat implicite, et de la mise en scène et en mots du fait que tel hôtel est à même de fournir une expérience relevant d’une forme d’incommensurabilité qui appelle le récit singulier » (Cardon V. 2014). Même si TripAdvisor facilite l’objectivation des critères de notation à travers les diverses modalités d’évaluation (service, cuisine, rapport qualité/prix, etc…), il est difficile de mesurer les expériences subjectives des individus. De plus les attentes hôtelières ou culinaires vont varier d’un pays à l’autre, ce qui ne favorise pas la représentativité des notes. En outres, selon les nationalités, les gens laissent plus ou moins de commentaires (Miguet 2019). Un dernier biais à prendre en considération est celui des avis non consensuels. Si pour un même service est noté 1/5 et 5/5 par plusieurs utilisateurs, l’algorithme fera une moyenne difficilement représentative. Les algorithmes de classification se basant sur ces données souvent biaisées ne contribuent donc pas à leur objectivité mais sont là pour les classifier.

Enjeux économiques des algorithmes

Dans un article de la revue Capital, la propriétaire d’un hôtel près de Carcassonne se plaint que suite à un bug informatique son bien a été déclassé et que son chiffre d’affaire a énormément baissé (Miguet 2019). Cet incident montre le pouvoir considérable des algorithmes de classification qui déterminent les bien que 80% des voyageurs vont voir et à terme choisir. En 2017, un journaliste anglais a réussi à piéger le site TripAdvisor en créant un faux restaurant. Il a demandé à des connaissances d’évaluer de manière très favorable son restaurant et six mois plus tard il fut à la tête du classement des establissements londoniens, sans avoir jamais servi de plats (Miguet 2019). Cette plaisanterie montre à quel point les faux avis peuvent facilement influencer et même tromper totalement la classification.

Ce changement rapide dans la hiérarchisation des services visibilisés par TripAdvisor est symptomatique de la réactivité des traces numériques. L’action s’oppose à l’explication, le consommateur qui enquête ne cherche plus à expliquer ou à comprendre pourquoi mais il se base sur ces données de masses qui deviennent figure d’autorité. On ne cherche plus, par exemple, à savoir qui se trouve derrière les profiles d’utilisateurs, mais on prend pour acquis qu’il s’agit forcément d’une identité véritable. C’est sur cette stratégie marketing là qu’est construite la plateforme TripAdvisor: « lorsque l’enjeu consiste à agir (à trouver des protocoles thérapeutiques, à générer une activité en ligne relative au nom de marque, par exemple), l’important est le résultat et non l’explication » (Boullier 2015). Grâce aux avis, la plateformes offre des résultats : de la visibilité aux hôtels, restaurants et autres services et biens : « grâce à cette simplification radicale, où les entités de référence ne sont plus des individus équipés de toutes leurs propriétés socio-démographiques, les traces circulent vite et modifient le statut même des bases de données qui deviennent dynamiques […], ce que les sciences sociales n’avaient jamais eu l’occasion de traiter » (Boullier 2015). L’agrégation de toutes les données des consommateurs, ainsi que leur synthétisation crée des tendances dynamiques qui, à terme, influencent les acheteurs dans leurs choix.

Des outils standardisants

Si les algorithmes de classifications sont là pour nous aider à la prise de décision parmi les nombreux commentaires et évaluations, ils ne constituent pas moins des outils standardisants. Une expérience d’économie comportementale a confirmé que les algorithmes de recommandation influencent nos choix, jusqu’à modifier nos goûts (Cuvelliez 2019). Une équipe de chercheurs a demandé à 169 étudiants d’écouter les 30 premières secondes de plein de chansons auxquelles l’on a attribué des scores aléatoires. L’étude à démontré que par chaque point supplémentaire, la volonté des étudiants d’acheter le morceau après avoir écouté l’extrait augmentait de 12% à 17%, alors que les chansons ne reflétaient en rien leurs préférences. De plus, les cobayes se sentiraient obligé d’apprécier une chanson si son évaluation est élevée 2. Selon Charles Cuvelliez, cette étude montrerait que nos goût changent en fonction des systèmes de recommandation. L’algorithme de classification ne serait donc pas seulement un pur « outil » mais « un actant qui réalise, au sens sémiotique, un « faire manipulatoire » sur les utilisateurs, puisqu’il exerce une contrainte sur leur mode de réception et d’accès à l’information » (Bertin et Granier 2015).

Pour ne pas se faire avoir, une solution possible serait celle de l’approche transversale qui consiste à ne pas prendre pour acquis les notes et avis de TripAdvisor et de les comparer avec d’autres sources, que ce soit des sites Internet ou encore des guides touristiques ou des articles de journaux. Ces biais exigent également une meilleure transparence des algorithmes qui organisent les données de ce type de plateformes numériques et une amélioration des interfaces qui proposerait idéalement plusieurs listes de recommandation sur la base de critères différents (Cuvelliez 2019). Même si les filtres sur TripAdvisor permettent de personnaliser sa recherche en y intégrant tous les critères formels déterminés par l’utilisateur, les critères de qualité des différents demeurent subjectifs et à la merci des évaluateurs.

La mutation en tant que réseau social

photo: TripAdvisor

Depuis peu, TripAdvisor a changé de forme et son modèle s’apparente désormais au réseaux sociaux du type Facebook ou Instagram. L’utilisateur n’a plus uniquement la possibilité d’écrire des avis mais il peut également partager son expérience de voyage avec des proches, discuter en live avec eux à l’aide de l’espace « chat » ou partager des photos comme il le ferait sur Instagram, par exemple. Ce changement rend la synchorisation bien plus « puissante » car il y a désormais plus d’occasions d’interagir avec des individus et des objets (Beaude 2012). Les utilisateurs de la plateforme numérique devraient bientôt pouvoir également partager leurs avis sur d’autres réseaux sociaux, participant une fois de plus à la puissance de la connexité (Beaude 2012). Les « likes » basés su les modèles Facebook et Instagram, permettent d’aimer les activités d’autre contributeurs.

La recommandation va prendre plusieurs aspects en compte : « au-delà du traditionnel avis, les photos, vidéos et articles sont désormais de véritables témoignages d’expériences. L’objectif est de partager des contenus qui inspirent les utilisateurs » 3. Il est important de noter l’utilisation du mot « inspirer », au lieu de « recommander » ou « influencer » par exemple. Assisterait-on à une vraie émancipation de l’utilisateur qui se libérerait de l’emprise des algorithmes standardisants, grâce à la nouvelle forme du site? Dans tous les cas, ce qui est probable, c’est que cette mutation a eu un impact important sur l’algorithme de popularité de TripAdvisor. En effet, selon le site My Hotel Reputation, un avis avec beaucoup de visibilité à travers les likes, partages et republications aura plus de poids qu’un quelconque autre avis plus discret.

Conclusion

Comme observé tout le long de ce travail, les algorithmes n’ont pas pour but concret de déterminer réellement quels sont les meilleurs services. En effet, ils agissent dans un environnement bien précis avec des règles définissant leur mode de fonctionnement. Ces instruments sont la pour gérer une masse d’informations considérable qui sans ces outils auraient du mal à être cadrée. Il est important de prendre en compte l’essence procédurale des algorithmes qui sont programmés selon certaines modalités (qualité, récence et quantité) dont les métriques (nombre d’avis, moyenne des notes, etc…) sont déterminées à priori. Dès lors il ne s’agit plus de se demander si les algorithmes modérateurs sont « fiables » mais plutôt de prendre du recul sur les données numérique qu’ils synthétisent. En effet, les divers problèmes liées aux traces numériques (faux avis, non représentativité, métriques de notations, etc..) sont la raison première des «  biais » algorithmiques dépendant de ces données. ces derniers sont d’autant plus importants qu’il a été démontré que les algorithmes de popularité ou de recommandation influencent les personnes et modifient leurs goûts. L’humain a une tendance naturelle à la conformité pour se faire accepter dans un groupe et l’étude « The Hidden Side Effects of Recommendation Systems » confirme ce penchant. Dès lors, il est important de prendre du recul, afin d’éviter d’être manipulé involontairement et privé de son libre arbitre.

Bibliographie

  1. https://blog.leonardo.com/tripadvisor-algorithm/.
  2. Gediminas Adomavicius, Jesse Bockstedt, Shawn P. Curley, Jingjing Zhang and Sam Ransbotham « The Hidden Side Effects of Recommendation Systems », MIT Sloan Management Review, hiver 2019
  3. https://www.my-hotel-reputation.com/comment-tirer-parti-de-la-mutation-de-tripadvisor-en-tant-que-reseau-social/ 

Vanessa Colella