Quand ne pas utiliser l’apprentissage automatique ou l’IA
Aventures dans les vœux pieux, la non-stationnarité et la recherche de modèles
Imaginez que vous venez de mettre la main sur un base de données d’un essai clinique. Passionnant! Pour vous aider à entrer dans le personnage, j’ai inventé quelques données à consulter:
Imaginez que ces points de données tracer la relation entre le jour de traitement (entrée «fonctionnalité« ) et le dosage correct d’un remède miracle en milligrammes (sortie «prédiction« ) qu’un patient devrait recevoir pendant 60 jours.
#The data:
(1,28) (2,17) (3,92) (4,41) (5,9) (6,87) (7,54) (8,3) (9,78) (10,67) (11,1) (12,67) (13,78) (14,3) (15,55) (16,86) (17,8) (18,42) (19,92) (20,17) (21,29) (22,94) (23,28) (24,18) (25,93) (26,40) (27,9) (28,87) (29,53) (30,3) (31,79) (32,66) (33,1) (34,68) (35,77) (36,3) (37,56) (38,86) (39,8) (40,43) (41,92) (42,16) (43,30) (44,94) (45,27) (46,19) (47,93) (48,39) (49,10) (50,88) (51,53) (52,4) (53,80) (54,65) (55,1) (56,69) (57,77) (58,3) (59,57) (60,86) ...
Imaginez maintenant que vous traitez un patient et que c’est le jour 2. Quelle dose proposez-vous que nous utilisions?
J’espère vraiment que vous avez répondu « 17mg » car ce n’était certainement pas censé être une question piège. Et le jour 4? 41mg? Oui en effet!
Maintenant, comment construiriez-vous un logiciel pour produire les bonnes doses les jours 1 à 5? Souhaitez-vous essayer d’utiliser apprentissage automatique (ML)? En d’autres termes, tenteriez-vous de trouver des modèles dans ces données et de les transformer en recette (« modèle ») pour passer des entrées aux sorties?
Non, bien sûr que non! Vous obtiendrez que votre logiciel fasse exactement ce que vous faites: recherchez la réponse dans un tableau. De cette façon, vous obtiendrez la bonne réponse 100% du temps pour les 60 jours. Pas besoin de modèles ici et pas besoin de machine learning non plus.
Alors, quel genre de situation nécessite un apprentissage automatique?
Et maintenant? C’est le jour 61. Quelle est la bonne réponse ici?
Eh bien, nous n’avons jamais vu de données pour le jour 61, donc nous ne pouvons pas trouver la réponse ici. Que pouvons-nous faire? Sommes-nous malchanceux? L’apprentissage automatique peut-il nous aider?
Ça dépend.
S’il n’y a pas de motif qui relie les entrées aux sorties, oubliez-le. Dans ce cas, rien ne peut nous aider… la magie, qui n’existe pas (au cas où vous pensiez que l’apprentissage automatique l’était). Abandonnez maintenant!
Nous devons trouver un modèle utile
Mais s’il y a est un motif et si (c’est un gros si!) nous pourrions le trouver, puis nous pourrions essayer de l’appliquer au jour 61 pour essayer de prédire / deviner la bonne réponse. L’apprentissage automatique pourrait peut-être nous aider.
Le modèle doit généraliser
Le problème est qu’il ne suffit pas qu’il y ait un modèle dans nos données. Ce serait beaucoup trop pratique. Le modèle doit également être pertinent au-delà du jour 60. Et si les conditions sont fondamentalement différentes au jour 61, de sorte que le modèle ne fonctionne pas généraliser? Pour tout ce que vous savez, peut-être qu’au jour 61, tous les patients sont complètement guéris ou morts ou sous un médicament incompatible. Ensuite, le modèle n’est pas bon pour vous.
Univers non stationnaires
Laissez cela pénétrer. Si vos données ne sont pas une fenêtre utile sur le monde de demain – peut-être parce qu’une pandémie a changé toutes les règles – peu importe la qualité de vos informations d’hier. Si vous vivez dans un coin instable de l’univers, vous aurez du mal à justifier ce que nous appelons stationnarité hypothèses. Cela se traduit à peu près par « Je crois que les règles n’ont pas changé » et ils sont nécessaires à presque toutes les prévisions. Si vos données antérieures ne s’appliquent soudainement pas à votre non stationnaire futur, vous n’êtes pas autorisé à utiliser hier pour prédire demain avec un visage impassible.
Vous avez peut-être de la chance
Mais s’il y a est un motif et si ce schéma est adapté à la nouvelle situation dans laquelle nous nous trouvons, alors nous sommes en affaires. Nous pourrions aller trouver le modèle dans les anciennes données, faire une recette à partir de celle-ci, puis utiliser cette recette pour réussir au jour 61 et au-delà!
Trouver des modèles et les utiliser est ce qu’est l’apprentissage automatique.
Quand utiliser l’apprentissage automatique
Dans appliqué l’apprentissage automatique (et AI), vous n’êtes pas en train de régurgiter des exemples mémorisés que vous avez vus auparavant – vous n’avez pas besoin de ML pour cela, regardez-les! – vous êtes ici pour apprendre.
Répétez simplement les anciennes réponses? ML peut faire mieux! Il réussit sur de nouveaux exemples.
Ta mission? Pour construire une solution qui se généralise avec succès (ou débranchez la fiche de votre projet). (Que signifie «avec succès»? J’ai un guide complet pour vous sur ce sujet.)
En d’autres termes, votre solution n’est pas bonne si elle ne peut pas gérer Nouveau des exemples qu’il n’a jamais vus auparavant. Pas de nouveaux exemples spectaculaires qui enfreignent toutes les règles d’un univers stationnaire, mais de légers rebondissements sur le thème appris.
Nous ne sommes pas ici pour mémoriser comme un perroquet. Nous sommes ici pour généraliser à de nouvelles situations. C’est la puissance et la beauté de l’apprentissage automatique.
Si vous ne l’avez pas vu exact combinaison de valeurs d’entrée avant (jour 61), quelle est la bonne réponse de sortie? Eh bien, nous pouvons peut-être transformer les anciens modèles en une recette qui fait une estimation décente.
Par exemple, si vous avez formé un chat / non-chat classificateur parmi des milliers de photos d’animaux, vous pouvez lui demander de vous dire si une nouvelle photo contient un chat, mais vous ne devriez pas lui demander de vous dire si une peinture est de style cubiste.
L’apprentissage automatique est-il pour vous?
Si vous en avez marre de m’entendre appeler ça un étiqueteur Et un approche alternative à l’écriture de code, permettez-moi d’essayer de le dire autrement.
L’apprentissage automatique est une approche automatiser les décisions répétées Cela implique trouver des motifs par algorithme dans les données et en les utilisant pour créer des recettes qui traitent correctement des nouvelles données.
Pour savoir si l’apprentissage automatique est fait pour vous, j’ai trois guides qui pourraient vous plaire:
Alors, y avait-il un schéma utile?
Toujours curieux du Jour 61? Il s’avère que * il y a * un motif dans les données de jouets que j’ai faites pour cet exemple. Je le sais parce que je l’ai mis là. Je peux même te promettre que ça se généralise au jour Le-plus-grand-nombre-que-vous-pouvez-penser-de-plus-onecar en ces temps follement non stationnaires, je trouve luxueusement réconfortant de travailler avec des données qui jouent bien pour un changement.
#The data:
(1,28) (2,17) (3,92) (4,41) (5,9) (6,87) (7,54) (8,3) (9,78) (10,67) (11,1) (12,67) (13,78) (14,3) (15,55) (16,86) (17,8) (18,42) (19,92) (20,17) (21,29) (22,94) (23,28) (24,18) (25,93) (26,40) (27,9) (28,87) (29,53) (30,3) (31,79) (32,66) (33,1) (34,68) (35,77) (36,3) (37,56) (38,86) (39,8) (40,43) (41,92) (42,16) (43,30) (44,94) (45,27) (46,19) (47,93) (48,39) (49,10) (50,88) (51,53) (52,4) (53,80) (54,65) (55,1) (56,69) (57,77) (58,3) (59,57) (60,86) ...
Pour ceux qui aiment un défi, pourquoi n’essayez-vous pas de voir si votre machine learning préféré algorithme peut trouver le modèle et le transformer en une recette utile? Faites le moi savoir ce que vous pensez est la réponse pour le jour 61. Dans exactement une semaine, j’ajouterai une note de bas de page avec le code que j’ai utilisé pour générer ces données, afin que vous puissiez voir si vous avez bien compris.
Je soupçonne également qu’il pourrait y avoir plus de gens qui l’obtiennent avec une approche analytique qu’en utilisant l’apprentissage automatique (voir cette pour comprendre la différence, plus l’indice que je viens de vous donner) mais GLHF. Que la meilleure approche gagne!
Si vous souhaitez essayer le ML, n’oubliez pas de faire les choses dans le bon ordre – voici un guide étape par étape pour vous aider.