Comment faire de l’IA que les utilisateurs adorent
L’intelligence artificielle (IA) orientée utilisateur peut ravir les utilisateurs, mais elle peut également exaspérer les utilisateurs de manière inattendue. La clé pour les créateurs de l’IA (scientifiques des données, ingénieurs, chefs de produit et concepteurs) est de ne pas manquer de répondre à l’attente de l’utilisateur que l’IA possède des capacités surhumaines omniscientes. Certaines tactiques courantes sont: 1. Ne vous trompez pas, 2. Laissez l’utilisateur aider, 3. Restez simple, 4. Aidez l’utilisateur à comprendre, 5. Évitez d’encourager les comportements préjudiciables, et enfin 6. Donnez aux utilisateurs une raison de se soucier .
L’IA et l’apprentissage automatique sont des technologies incroyables qui peuvent faire partie intégrante de produits que les utilisateurs adorent lorsqu’ils sont conçus de manière réfléchie. Vous pouvez probablement vous rappeler facilement à quelques reprises lorsque l’IA vous a ravi, et tout aussi facilement, quand elle vous a frustré. J’espère que ces conseils peuvent vous guider – que vous soyez un spécialiste des données, un ingénieur, un concepteur ou un chef de produit – sur la façon de créer de délicieux produits et fonctionnalités axés sur l’IA.
Un peu sur moi – au cours des dernières années, j’ai créé une IA orientée utilisateur et j’ai eu ma juste part de succès et de f learna̶i̶l̶u̶r̶e̶s̶ «apprentissages». Mes responsabilités ont été principalement la science des données, mais comprennent également des aspects de génie logiciel, de gestion de produits et de conception. À MOCAP Analytics, nous avons créé des infographies pour les fans et les équipes de la NFL et de la NBA à partir de données spatio-temporelles de suivi des joueurs. À Tonal, nous développons un entraîneur personnel virtuel qui, entre autres fonctionnalités, compte les répétitions, repère le poids lorsqu’un utilisateur se débat, suit les progrès et ajuste le poids à mesure qu’un utilisateur se renforce au fil du temps.
Au cœur des lignes directrices suivantes se trouve la compréhension de la différence entre les perception de l’utilisateur de l’IA et de la réalité de l’IA. Pour vos utilisateurs et le grand public, l’IA est perçue comme un être surhumain infaillible omniscient qui les connaît mieux qu’eux-mêmes (par exemple, Jared et Fiona sur la Silicon Valley, test de base dans Blade Runner).
Bien sûr, la réalité est que l’IA aujourd’hui n’est généralement passablement bonne qu’à la seule tâche étroite qu’elle est formée à résoudre, et si quelque chose dévie, elle se détériore rapidement (quelques exemples amusants sont piratage de Tesla avec du ruban adhésif sur un signe, Assistant Google échoue, Google Maps dirige les voitures dans la boue, tromper la reconnaissance d’objets dans les images). De plus, les façons dont l’IA est déclenchée ne sont pas les mêmes que celles des humains. La vérité est que le plus grand avantage de l’IA sur l’intelligence humaine (à des exceptions comme AlphaGo) n’est pas que ce soit plus intelligent que les humains, mais c’est plus rapide et moins cher. L’IA peut classer un million d’images comme contenant un chat ou un chien en une heure et pour quelques dollars. Mais demandez à cette même IA de classer également un lapin et vous n’avez pas de chance. Pendant ce temps, un humain, à une image par seconde, prendrait 11 jours et nuits sans sommeil et des milliers de dollars pour réaliser le même exploit, mais le lapin n’est pas grave.
Une IA qui ne répond pas aux attentes d’un utilisateur peut entraîner une perte de confiance (voir biais de négativité), le désengagement, la démotivation et même les comportements préjudiciables involontaires. La solution est, bien sûr, de ne pas violer les attentes de l’utilisateur, et le reste de cet article explique quelques stratégies pour atteindre cet objectif.
(De nombreux exemples proviennent de Google car ils sont bien connus et parce que Google fait progresser la technologie de l’IA et l’expérience utilisateur de l’IA. Je n’ai aucune affiliation.)
Alors que l’IA peut être très précise, aucune IA n’est précise à 100%. Vous pensez peut-être que si l’IA ne peut pas toujours avoir raison, alors comment puis-je éventuellement suivre « Don’t Be Wrong »? Il existe des moyens d’éviter ou d’atténuer les situations présentant une dichotomie stricte correcte ou incorrecte.
- Ne faites pas toujours de l’IA une opinion, c’est-à-dire, créez une option pour qu’elle s’abstienne. Par exemple, par le passé, si l’IA de Google Translate ne pouvait pas détecter la langue, plutôt que de faire une mauvaise supposition, elle dirait «non détecté» et laisserait l’utilisateur choisir la bonne langue. Leurs algorithmes sont meilleurs maintenant et ils font toujours une supposition, mais ils le marquent également comme «détecté» pour clarifier cette supposition et proposer d’autres langues en un seul clic.
- Lorsque cela est possible, échangez en temps réel pour un court délai et une précision accrue. Le retard peut même être préférable comme moyen subtil de communiquer à l’utilisateur que l’IA magique est en jeu, et qui n’apprécie pas la magie? Par exemple, Google Voice-to-Text a un délai pour entendre quelques mots de plus pour le contexte, ce qui améliore la précision. Un récit édifiant est celui des voitures autonomes; pour réussir, ils doivent fonctionner en temps réel et prendre une opinion en tout temps. Il n’est pas surprenant que des milliards de dollars aient été dépensés au cours de la dernière décennie.
- Évitez les situations où il n’y a pas de réponse correcte ou de comportement correct parmi vos utilisateurs. Dans ces situations, même une intelligence parfaite, humaine ou artificielle, serait de courte durée. Quelque chose doit changer, et c’est souvent l’interface utilisateur. Un exemple est une recherche Google où très peu de résultats correspondent à tous les mots clés. Google aurait pu choisir de fournir soit très peu de résultats pour les utilisateurs puristes, soit de laisser certains mots clés manquants pour les utilisateurs pragmatiques. Au lieu de cela, via l’interface, ils satisfont les deux camps en montrant quels mots clés n’apparaissent pas et en offrant la possibilité d’appliquer un mot clé.
Parfois, un peu d’aide de votre ami, l’utilisateur, peut aider considérablement l’IA à faire plus tout en agissant comme l’utilisateur le souhaite.
- Offrez des suggestions plutôt que de faire tapis avec la meilleure estimation de l’IA du bon résultat. Imaginez que si Google avait, « Je me sens chanceux », qui va directement au premier résultat de recherche. La plupart d’entre nous se sentiraient malchanceux! De même, évitez d’imposer un résultat erroné à un utilisateur. Par exemple, la correction automatique sur les téléphones mobiles est généralement correcte. Mais les quelques fois où c’est faux, le f̵ducking exaspère les utilisateurs même s’il réduit objectivement le taux de fautes de frappe. Une meilleure approche permet à l’utilisateur de choisir parmi les mots prédits (avant même de les taper!).
- Permettez à l’utilisateur de vous faire part de ses attentes, puis souvenez-vous-en. Un exemple simple de ceci est la « Recherche sécurisée » de Google, qui est activée par défaut mais un utilisateur peut rapidement comprendre le paramètre et l’ajuster. De plus, Google se souvient de ce paramètre.
- L’utilisateur peut collaborer avec l’IA. Un exemple est la façon dont Google Photos identifie les amis, les membres de la famille et les animaux domestiques. Il regroupe des sujets d’aspect similaire, puis permet à l’utilisateur de corriger les regroupements et de fournir le nom de la personne ou de l’animal. En quelques itérations et minutes, une bibliothèque entière d’images est consultable par nom.
Les utilisateurs passent rarement plus de quelques secondes à penser à quelque chose avant de décider que c’est trop compliqué.
- Utilisez des nombres et des échelles que les utilisateurs connaissent déjà. Par exemple, lors de la synchronisation de fichiers sur Google Drive, il indique le nombre de fichiers à synchroniser et fournit une barre de progression plutôt que de simplement afficher le temps restant. Cependant, la plupart d’entre nous ont vu un logiciel qui affiche des estimations de temps extrêmement inexactes lors de la copie de fichiers (ou de l’exécution d’autres tâches longues). Lorsqu’elle se termine tôt ou tard, elle soulève des doutes quant à la copie de tous les fichiers et garantit une vérification rapide avant de supprimer les originaux.
- Supprimer des détails importants et utiliser un langage vague parce que le sujet est compliqué n’est pas de la simplification, c’est de l’obscurcissement. Comme l’a dit le physicien Richard Feynman: « Si vous ne pouvez pas expliquer quelque chose en termes simples, alors vous ne le comprenez pas. » Explication du « Tomatomètre » de Rotten Tomatoes est un bon exemple, fournissant une brève explication tout en donnant juste assez de détails pour les utilisateurs qui s’en soucient. De plus, la métrique elle-même, le pourcentage de critiques qui ont aimé le film, est facile à interpréter correctement.
- En ce qui concerne les résultats centrés sur les données tels que les informations et les métriques, les scores abstraits ont leur place. Mais les utilisateurs ont tendance à être impitoyables envers un score avec lequel ils ne sont pas d’accord, et leur aversion a tendance à augmenter à chaque fois qu’ils le voient. Par exemple, un autre site Web populaire de classification de films utilise une classification de 1 à 10 avec des mécanismes complexes pour atténuer les problèmes et améliorer la précision (s’il existe une telle précision en matière de qualité de film). Leur longue FAQ suggère qu’ils ont beaucoup de détracteurs. Le problème fondamental est que les utilisateurs concluent qu’un film 9/10 est universellement meilleur qu’un 8/10, ce qui est une conclusion raisonnable à tirer. Malheureusement, c’est également faux car différentes personnes ont des préférences différentes dans les films. En comparaison, Rotten Tomatoes est plus simple à interpréter correctement comme signifiant «uniquement l’opinion de certains critiques».
Lorsque nous interagissons avec les gens, nous suivons naturellement les déclarations avec nos raisons. « Vous devriez utiliser le navigateur Internet Brave au lieu de Google Chrome », les anneaux creux, même impersonnels et exigeants, sans ajouter, « parce que vous vous souciez de la confidentialité des données. » Cependant, l’IA n’est souvent pas conçue pour faire de même. Bien qu’il puisse être difficile d’expliquer le fonctionnement interne d’un réseau de neurones, il existe des moyens d’aider l’utilisateur à comprendre le raisonnement de l’IA.
- Expliquez les principales raisons des résultats. Par exemple, la page d’accueil de Netflix est une grille de spectacles recommandés où chaque ligne a une explication unique pour tout ce qu’elle contient. Cette courte explication se double intelligemment comme un moyen pour l’utilisateur de savoir s’il est d’humeur pour une émission de cette ligne sans lire individuellement chaque émission.
- Frappez un bouton d’information «i» dessus. Le bouton peut ouvrir un modal ou un lien vers une page Web avec quelques phrases expliquant comment fonctionne l’IA et les raisons courantes des résultats communs. C’est de loin le ROI le plus élevé pour améliorer un produit existant. Les explications doivent déboucher sur un résumé clair et fournir plus de détails ultérieurement (Pyramide inversée).
Les utilisateurs feront tout ce qui est nécessaire pour obtenir le résultat souhaité de votre IA, que ce soit un score plus élevé, un crédit pour leurs actions ou autre chose. Via votre IA, un système de valeurs leur est imposé. Parfois, les actions des utilisateurs peuvent ne pas être ce que vous vouliez, et peuvent être nuisibles et contraires à l’objectif initial (Loi de Goodhart).
Un exemple positif est le suivi de la condition physique de Google, qui a pour principale mesure un calcul simple basé sur les minutes pendant lesquelles un utilisateur était actif, qui encourage tous les types d’activité et met davantage l’accent sur toute activité intense, imposant ainsi peu de valeurs inutiles aux utilisateurs.
Un exemple négatif est les trackers de fitness qui se concentrent principalement sur les étapes et la combustion des calories. Les étapes sont la forme d’activité la plus courante, presque tout le monde marche ou court, mais presque personne ne marche ou court exclusivement comme seule forme d’exercice. Les utilisateurs se plaignent de ne pas obtenir de crédit pour l’entraînement en force, le vélo, la natation, etc. Certains utilisateurs peuvent même être moins susceptibles de faire ces exercices parce qu’ils ne reçoivent pas de crédit dans ce système de valeurs implicite.
Un autre exemple négatif est les évaluations par les pairs qui sont allées trop loin. Un cadre m’a dit une fois avec enthousiasme un système élaboré de questions et de notation de l’IA (chaîne de Markov) pour déterminer les promotions et la rémunération des employés. Il n’est pas difficile d’imaginer les employés, d’une part, exigeant de connaître le fonctionnement interne de ce système compte tenu de son pouvoir sur eux, et d’autre part, agissant pour optimiser leur perception dans ce système de valeurs, même au détriment du succès plus large de l’entreprise. Les actions ou les options sur actions auraient pu être le meilleur choix.
En ce qui concerne les informations, les métriques, les graphiques et autres résultats centrés sur les données, «utile» vaut mieux que «cool». Des résultats utiles provoquent une action ou un changement d’attitude qui a un impact sur l’avenir. En revanche, un résultat cool pourrait attirer l’attention au début, mais il ne mène nulle part et est principalement un divertissement – des bonbons pour les yeux ou une factoïde à évoquer dans une conversation inactive. Découvrez ce qui compte et fournissez des détails et des graphiques pour le sauvegarder. Vos utilisateurs devraient avoir des réponses positives à quelques-unes de ces questions après avoir vu le résultat centré sur les données de votre IA:
- Et alors?
- Pourquoi je m’inquiète?
- Quelles actions puis-je entreprendre?
- Quel est le message ou l’histoire?
- Vais-je revoir cela?
De plus, permettre aux utilisateurs d’explorer eux-mêmes des données plus détaillées est un moyen de les aider à comprendre, comme expliqué précédemment. La transparence renforce leur confiance dans le message ou l’histoire principale et l’IA et le produit sous-jacents, même s’ils regardent rarement les données détaillées.
Un exemple est le suivi de l’utilisation des données d’Android. Il présente un graphique de l’utilisation des données mobiles sur le cycle de facturation mensuel et une liste des applications triées par utilisation des données. Il fournit des réponses évidentes aux questions brûlantes de l’utilisateur.
- Combien de données mobiles ai-je utilisées?
- Quelles applications utilisent le plus de données mobiles?
- Comment puis-je réduire mon utilisation des données mobiles?
De plus, les utilisateurs peuvent sélectionner les mois précédents et d’autres options pour explorer et obtenir plus de contexte, par exemple, en recherchant des modèles tels que des pointes d’utilisation le week-end.
Il convient également de noter ce que cet écran ne fait pas faire.
- Afficher l’utilisation des données wifi. Bien que certains utilisateurs puissent trouver ces informations sympas, « Je ne savais pas que la mise à jour des applications utilisait autant de données wifi, intéressant! », Aucune action ne se produira et il échoue donc la plupart des questions du test décisif énumérées ci-dessus.
- Prévoyez la quantité de données qui seront utilisées dans le cycle de facturation. Un utilisateur peut vouloir savoir, mais la prédiction est souvent erronée, donc cela doit être évité comme expliqué précédemment. Au lieu de cela, l’utilisateur a des graphiques pour trouver ses propres conclusions.
- Affichez l’utilisation des données mobiles sur toute la durée en plus du cycle de facturation en cours. Cela peut être cool ou, dans certains cas, légèrement utile, mais cela diluerait et confondrait principalement le message principal sur le cycle de facturation actuel.
Créer des produits d’IA réussis est un défi. Espérons que certaines de ces directives seront utiles, mais elles peuvent parfois se contredire. En fin de compte, le succès nécessite de la réflexion, une rétroaction précoce des utilisateurs et une étroite collaboration entre les scientifiques des données, les ingénieurs logiciels, les chefs de produit et les concepteurs.
Veuillez ajouter vos questions et commentaires!