Intelligence artificielle

Est-ce que votre chatbot vous comprend vraiment? Partie II – Shubhashis Sengupta

Est-ce que votre chatbot vous comprend vraiment? Partie II - Shubhashis Sengupta


Photo de Franck V. sur Unsplash

Dans le blog précédent de la série, nous avons présenté certains des défis actuels rencontrés pour développer un BOT vraiment intelligent. Parmi de nombreux autres, il existe trois problèmes fondamentaux: (a) les BOT actuels ne comprennent pas les paroles de l'utilisateur de manière profonde et significative, (b) les BOT actuels ne peuvent pas raisonner sur les données de domaine et les axiomes et ils ne possèdent même pas un minimum de bon sens; et par conséquent, (c) les TAC d’aujourd’hui ne peuvent générer une réponse vraiment pertinente, contextuelle et empathique.

En d’autres termes, les BOT d’aujourd’hui ne sont ni humanisés ni anthropomorphes. Par conséquent, lorsque vous utilisez des BOT pour exécuter des tâches et exécuter des commandes, telles que jouer une chanson, récupérer votre solde bancaire ou même suggérer une recette; vous n’auriez pas encore un BOT en tant que compagnon pour discuter d’actualité ou de discorde conjugale.

Examinons chacune des questions mentionnées ci-dessus. Dans le blog précédent, nous avons donné des exemples anecdotiques pour chaque type. Maintenant, nous allons approfondir un peu plus techniquement et essayer de trouver où en est la recherche et ce que nous faisons chez Accenture Labs pour répondre à certains des problèmes.

Tout d'abord, le CET doit comprendre non seulement ce que vous dites (compréhension lexicale), mais également ce que vous voulez dire (compréhension sémantique). Il convient de distinguer entre le premier jambe d'un itinéraire de vol, premier jambe d'un tournoi de football et avant jambe d'un animal. Il convient de distinguer entre les actions de Libération d'un film et Libération d'un prisonnier. Une telle interprétation variable du même mot en fonction du contexte (également appelée polysémie de mots) est un minimum absolu. L'interprétation ou la représentation de la signification d'un texte est un domaine de recherche passionnant en IA et les techniques de la recherche SynSet à l'intégration de texte neuronal sont largement utilisées dans ce contexte. De plus, de nouvelles recherches sur la représentation de signification abstraite (AMR) d’un énoncé par le biais de techniques d’analyse sémantique pour apprendre la grammaire et le calcul catégoriques aideront à créer une abstraction de signification algébrique calculée sur l’énoncé entièrement interprétable par machine (la machine peut désormais capturer le sens sémantique complet). des mots, des actions et des dépendances sur tout énoncé sur un domaine). Le deuxième problème de la compréhension linguistique est la pragmatique - l'utilisation libérale de références et de contextes dans nos conversations. Trouver des références précédentes pour une mention, créer un lien vers une mention correcte et résoudre une ambiguïté non seulement sur les entités mais également sur la propriété des entités est un défi complexe.

Dans notre précédent blog, un utilisateur fictif demande à la compagnie aérienne BOT: Mon étui à violon est assez gros. Je suis classe entraîneur. Pensez-vous que je peux le placer sous les sièges? Deux tâches ambiguës et délicates se cachent dans cet ensemble apparemment simple de déclarations. La première tâche est appelée résolution de co-référence en pragmatique. Le système d'intelligence artificielle doit comprendre que «cela» fait référence à l'étui de violon et que «là-bas» désigne l'espace situé au-dessous en tant que siège d'une classe économique de l'avion. La deuxième tâche relève du schéma général de ce que nous appelons le Winograd Schema Challenge. Le système d'intelligence artificielle doit comprendre que l'étui pour violon est «plus grand» et qu'il ne rentre peut-être pas sous un «petit» siège. Si la deuxième tâche (et donc la réponse) de raisonner selon laquelle une grande chose peut ne pas tenir dans un petit espace peut être abordée séparément, la simple tâche de relier l’étui de violon à quelque chose de grand et la surface sous le siège à quelque chose de petit et créer une question logique de comparaison est une tâche difficile en soi. La bonne nouvelle est que des progrès considérables ont déjà été réalisés dans la compréhension de la pragmatique.

La deuxième chose concerne la connaissance et le raisonnement. Dans nos conversations quotidiennes avec nos collègues, amis, planificateurs fiscaux, chauffeurs de taxi ou dentistes, nous nous appuyons beaucoup sur nos antécédents, notre domaine, nos interactions passées et le contexte actuel. Dans une machine, un tel contexte peut être stocké dans un graphe de connaissances contenant les détails du domaine dans une mémoire associative entité-relation, les interactions passées dans une mémoire temporelle ou épisodique et le contexte actuel dans une mémoire de travail. En plus de chercher des réponses à vos questions (comme votre dentiste) ou de faire des recommandations sur les économies d'impôt (comme votre planificateur fiscal), et de vous préparer sur les autoroutes de l'État de New York (comme votre chauffeur de taxi); le BOT devrait également avoir suffisamment de bon sens pour résoudre un niveau de base de mots croisés du New York Times. Ou il devrait au moins pouvoir dire que vous pouvez transporter du grain dans un sac en coton mais pas de l'eau.

Le rythme effréné de la progression dans le graphique de la connaissance est porteur d'espoir pour nous. Les grandes bases de données graphiques sont déjà en train de devenir des systèmes de choix pour le stockage de grands graphiques relationnels dans lesquels les entités sont des nœuds et les relations entre eux des arcs. Les techniques d'apprentissage à distance et semi-supervisées sont de plus en plus utilisées pour acquérir et gérer des instances d'ontologies de grands domaines à partir de données textuelles variées. Les techniques d’incorporation de graphes de connaissances (KGE) pour les relations entre entités et les épisodes temporels sont utilisées pour la représentation des connaissances. Il y a également eu une évolution consciente vers l'agglomération de graphes de connaissances et d'analyse de réseaux sociaux - dans lesquels les relations d'entité et les connexions sociales peuvent être combinées pour produire des informations puissantes. Parfois, il suffit de parcourir le graphique pour voir s’il existe un lien de relation entre deux nœuds d’entité.

Par exemple, pour répondre à la question Pouvons-nous embarquer une poussette pour ma fille de 2 ans? l’intelligence artificielle peut faire un parcours graphique pour voir si un enfant de 2 ans (ou un passager inférieur à un groupe d’âge donné) est associé à un bagage spécial et si une poussette est un type de bagage spécial. Un système basé sur la propagation logique (également appelé système de chaînage avant ou arrière) peut parcourir les nœuds d'un graphique pour établir le lien et répondre à la question.

Pour relever le troisième défi, le CET doit avoir une capacité de raisonnement par domaine et par bon sens. Les techniques de raisonnement par domaine sur la connaissance sont généralement appliquées au moyen de la logique symbolique, d’un apprentissage relationnel statistique et de diverses techniques d’apprentissage représentationnel en profondeur. D'autre part, le raisonnement fondé sur le sens commun est une question difficile du point de vue de l'IA; et, à partir de maintenant, les chercheurs utilisent l'approche basée sur l'ontologie supérieure avec l'inférence de langage naturel et l'entraînement textuel. Une ontologie supérieure ou à usage général, telle que OpenCyc, Sumo, Freebase ou YAGO, capture un très grand nombre de relations taxonomiques et ontologiques entre des concepts et des entités du monde réel courants - un élément que la conversation peut utiliser pour répondre à une question de connaissances générales ou pour raisonner sur des faits connus. Les techniques d'inférence et de dédoublement en langage naturel fonctionnent sur des paires prémisse-hypothèse, la machine essayant de prédire une hypothèse plausible à partir d'une prémisse.

Dans l’un des exemples donnés dans notre précédent blog, l’utilisateur demande aux compagnies aériennes BOT - Puis-je apporter une béquille en métal avec moi? A quoi, si l'utilisateur est autorisé, un BOT doit répondre de manière humaine - Avez-vous besoin d'aide pendant l'embarquement? En dessous, le système d'intelligence artificielle associe la question de l'utilisateur à un lieu de travail - Une personne invalide ou âgée aura besoin d'un accessoire de marche (Le graphique de taxonomie indique au raisonneur de l'IA que la béquille en métal est une sorte d'accessoire de marche et une vérification du PNR indiquera à l'IA si la personne est âgée ou si elle présente une difformité physique) et parvient à l'hypothèse. Le passager peut être invalide ou âgé. Le système d'intelligence artificielle peut alors simplement rechercher les règles commerciales associées pour trouver la règle: L'embarquement assisté peut être proposé à un passager invalide ou âgé et générer une question appropriée via un système de génération de langage naturel. Vous pouvez voir différents systèmes sous-jacents en jeu ici!

Show More

SupportIvy

SupportIvy.com : Un lieu pour partager le savoir et mieux comprendre le monde. Meilleure plate-forme de support gratuit pour vous, Documentation &Tutoriels par les experts.

Related Articles

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Close
Close