Les nouveaux actuaires doivent connaître l’apprentissage automatique
La profession évolue
Bien que certains algorithmes de Machine Learning fonctionnent silencieusement en arrière-plan depuis les années 1990, il semble que le monde se soit rapidement tourné de plus en plus vers l’IA. Les cas d’utilisation commerciale sont abondants et l’IA et le ML se trouvent dans toutes sortes de produits et services (alimenter nos téléphones, nos sites Web préférés et les processus de production industrielle dont nous dépendons tous les jours). Mais ML a aussi des applications dans les domaines actuariels: analyse de l’expérience de mortalité pour trouver de nouvelles tendances, tarification des produits d’assurance, prévision des données financières…
C’est-à-dire jusqu’en 2019. Le programme a été remanié – avec de nouveaux documents frais introduits et d’anciens documents d’importance décroissante retirés. Et voilà, l’un des nouveaux ajouts à l’examen du sujet CS2 de l’Institut et de la Faculté des actuaires (IFoA) était l’apprentissage automatique – avec le sujet étroitement lié d’analyse de données dans le sujet CM1. Ces changements ont été effectuées «pour garantir que le programme d’études est pertinent, à jour et reflète les compétences, les connaissances et les qualités requises des actuaires dans un environnement commercial mondial en constante évolution.» Cela semble être une justification suffisante – mais le nouveau matériel est-il à la hauteur de cette affirmation?
- Concepts de haut niveau concernant l’apprentissage à partir des données
- Descriptions et exemples de techniques clés
- Appliquer des techniques de ML à des problèmes simples
- Comprendre les perspectives d’autres chercheurs quantitatifs non actuariels (data scientistes, statisticiens…)
Définitions et champ d’application du ML
Assez raisonnablement, nous commençons par quelques définitions et explications de base sur le type de problèmes pour lesquels ML est utile. Il n’y a pas grand intérêt à développer un algorithme sophistiqué de ML pour une situation où une méthode classique fera l’affaire – et de même, ML n’a rien à offrir s’il n’y a pas de modèles authentiques à détecter dans les données.
Aperçu des concepts clés
Vient ensuite une discussion des concepts clés dans le domaine. En particulier:
- Méthodes d’évaluation des modèles (exactitude, précision, rappel, matrice de confusion, etc.)
- Paramètres et hyperparamètres
- Formation, validation et tests
- Sur-ajustement
- Régularisation du modèle
Branches d’apprentissage automatique
Les distinctions essentielles entre les différents types d’algorithmes ML sont faites ici, couvrant les techniques d’apprentissage supervisé, non supervisé, semi-supervisé et par renforcement. Cette section aborde également la régression par rapport à la classification et les modèles génératifs par rapport à discriminants, ainsi que des théories, des exemples et des applications actuarielles supplémentaires. Encore une fois, c’est une excellente enquête sur les sujets, mais vous voudrez faire d’autres recherches pour consolider certains des concepts. Regardez des vidéos, lisez des livres et des blogs – essayez de créer des liens pour tirer le meilleur parti du contenu.
Le processus d’apprentissage automatique
Les étapes générales d’un projet ML reçoivent une quantité raisonnable de biens immobiliers dans les notes, et à juste titre. L’apprentissage automatique ne se limite pas au développement, à la formation et à l’évaluation de modèles – il y a beaucoup plus à consacrer au déploiement réussi d’une solution ML. Ici, nous parlons de:
- L’analyse exploratoire des données
- Préparation des données
- Formation modèle
- Validation et test
- Amélioration des performances du modèle
- L’importance de la documentation et de la reproductibilité
Algorithmes clés
Ensuite, quelques algorithmes clés sont discutés – notamment:
- Classement Naïve Bayes
- Arbres de décision
- Clustering K-means
Perspectives d’autres chercheurs quantitatifs
Enfin, nous discutons de la façon dont les perspectives d’un praticien en ML diffèrent peut-être des chercheurs et des modélisateurs plus traditionnels, tels que les statisticiens. Cette section traite des difficultés de communication entre les groupes – en particulier lorsque des termes différents peuvent être utilisés pour ce qui sont essentiellement les mêmes concepts, ou lorsque les deux groupes peuvent être intéressés par différents aspects de l’analyse. L’apprentissage automatique est absolument un domaine d’étude interdisciplinaire, de sorte que les praticiens communiqueront fréquemment avec des professionnels d’autres horizons. Le «zoom arrière» pour discuter de certaines des questions plus générales, mais tout aussi importantes, qui se posent lors du développement et de l’application de solutions ML dans le monde réel complète bien la matière, en ce que nous sortons des profondeurs théoriques pour terminer sur une note pragmatique.
Tout étudiant (qui est assez courageux pour l’admettre) saura que plus d’efforts ont tendance à être consacrés à du matériel qui est effectivement testé. Strictement, tout dans la lecture peut être examiné, mais c’est ce qui s’est produit jusqu’à présent dans les deux séances depuis l’ajout du nouveau matériel.
Cela peut sembler une occasion manquée de ne pas engager les étudiants dans des projets de pratique de ML plus pratiques et de bout en bout en Python ou en R – surtout maintenant que l’analyse des données et les statistiques actuarielles avec R font désormais partie non seulement d’un mais deux examens IFoA. Même le tout nouveau Certificat en science des données ne nécessite l’écriture d’aucun code pour se terminer. D’une part, cela peut sembler complètement fou – après tout, la meilleure façon d’apprendre la science des données ou l’apprentissage automatique est sans doute de vous y plonger et de commencer à jouer avec un ensemble de données qui vous intéresse.
Le rôle actuariel évolue. Le président de l’IFoA, John Taylor, a présidé une expansion rapide de la science des données au sein de la profession au cours de la dernière année. Il est clair que ce n’est que la première étape – la mise à jour d’une profession entière n’est certainement pas une tâche facile, mais c’est indéniablement la bonne chose à faire. La formalisation des techniques de science des données et d’apprentissage automatique dans le programme d’études de l’IFoA est un mouvement qui consolide les positions des actuaires en tant que professionnels qui peuvent apporter une réelle valeur ajoutée aux clients – et qui ne se révèlent de plus en plus utiles que les actuaires continuent de travailler dans les industries. plus loin.