Technologie

Un héros dans le monde de la non-linéarité et du non-gaussien

Un héros dans le monde de la non-linéarité et du non-gaussien


0*N6dEnuxd9fyE8Ctt - Un héros dans le monde de la non-linéarité et du non-gaussien

La supériorité de la technologie du filtre à particules dans les systèmes non linéaires et non gaussiens détermine son large éventail d'applications. De plus, la capacité de traitement multimodal du filtre à particules est l'une des raisons pour lesquelles il est largement utilisé. À l'échelle internationale, le filtrage des particules a été appliqué dans divers domaines.

  • En économie, il est utilisé dans les prévisions de données économiques. La supériorité de la technologie du filtre à particules dans les systèmes non linéaires et non gaussiens détermine son large éventail d'applications. De plus, la capacité de traitement multimodal du filtre à particules est l'une des raisons pour lesquelles il est largement utilisé. Au niveau international, le filtrage des particules a été appliqué dans divers domaines. Les chiffres sont présents partout et, lorsqu'ils sont collectés et enregistrés, nous les désignons comme des données. L'apprentissage automatique est la science de l'apprentissage de modèles mathématiques à partir de données. De tels modèles, une fois appris à partir de données
  • Dans le domaine militaire, il a été appliqué au suivi radar d'objets aéroportés, au suivi passif air-air, au suivi passif air-sol
  • Dans le domaine du contrôle du trafic, il s’applique à la surveillance vidéo de voitures ou de personnes.
  • Dans le domaine de l'analyse visuelle, un nouveau modèle de reconnaissance de formes pour la segmentation et le suivi des contours des lèvres dans les séquences vidéo a été développé à l'aide de filtres à particules.
  • Il est également utilisé pour le positionnement global de robots.

Les questions auxquelles il était impossible de répondre par les méthodes d'analyse traditionnelles sont maintenant résolues au moyen de la simulation de particules.

Dans la sélection du modèle, la détection des pannes et le diagnostic des systèmes dynamiques, des tests d'hypothèses basées sur les particules, le multimodèle particulaire, la détection du rapport de vraisemblance des particules et d'autres méthodes ont émergé.

En termes d'estimation de paramètres, les paramètres statiques sont généralement pris en compte dans le vecteur d'état étendu, mais comme les paramètres sont statiques, les particules dégénéreront rapidement en un échantillon. Pour éviter toute dégradation, les méthodes couramment utilisées augmentent artificiellement le bruit dynamique des paramètres statiques.

La méthode de lissage du noyau et la méthode d’estimation ponctuelle proposée par Doucet et al. évite l'échantillonnage direct des paramètres et estime directement les paramètres inconnus à l'aide de l'algorithme d'estimation du maximum de vraisemblance (ML) et de la valeur maximale attendue (EM) dans le cadre particulaire.

L’idée du filtre à particules (PF: Particle Filter) est basée sur Méthodes de Monte Carlo, qui utilisent des ensembles de particules pour représenter les probabilités et peuvent être utilisés dans n’importe quelle forme de modèle d’espace à états. L'idée centrale est d'exprimer sa distribution en extrayant des particules d'état aléatoires de la probabilité postérieure. C'est une méthode d'échantillonnage d'importance séquentielle (échantillonnage d'importance séquentielle).

La décomposition du concept

En termes simples, la méthode de filtrage de particules fait référence au processus consistant à obtenir la distribution de variance d'état minimale en trouvant un ensemble d'échantillons aléatoires se propageant dans l'espace d'état pour se rapprocher de la fonction de densité de probabilité et en remplaçant l'opération intégrale par la moyenne de l'échantillon.

L'échantillon ici fait référence à la particule et, lorsque le nombre d'échantillons N → ∝, il peut approcher toute forme de distribution de densité de probabilité.

Bien que la distribution de probabilité dans l'algorithme ne soit qu'une approximation de la distribution réelle, en raison des caractéristiques non paramétriques, elle peut éliminer la contrainte selon laquelle la quantité aléatoire doit satisfaire la distribution gaussienne lors de la résolution du problème de filtrage non linéaire et peut exprimer: une distribution plus large que le modèle gaussien.

Il a également une plus grande capacité à modéliser les caractéristiques non linéaires des paramètres variables. Par conséquent, le filtrage de particules peut exprimer avec précision la distribution de probabilité postérieure sur la base des quantités d'observation et de contrôle, ce qui peut être utilisé pour résoudre le problème du SLAM.

Markov Chain Monte Carlo stratégie d'amélioration

La méthode de Markov Chain Monte Carlo (MCMC) produit des échantillons de la distribution cible en construisant des chaînes de Markov avec une bonne convergence. À chaque itération du SIS, la MCMC est combinée pour déplacer les particules vers différents emplacements afin d’éviter toute dégradation, et la chaîne de Markov peut pousser les particules plus près de la surface. fonction de densité de probabilité (PDF) Rendre la distribution de l'échantillon plus raisonnable.

Filtre à particules non parfumé (UPF)

Le filtre de Kalman sans odeur (UKF) a été proposé par Julier et al. Le filtre EKF (filtre de Kalman étendu) se rapproche du terme non linéaire en utilisant un développement de Taylor du premier ordre et se rapproche de la distribution d'état avec une distribution gaussienne. Le format UKF est similaire au format EKF, avec une distribution gaussienne se rapprochant de celle de l’état, mais sans linéarisation, seuls quelques échantillons appelés points Sigma sont utilisés.

Une fois que ces points ont passé le modèle non linéaire, la moyenne et la variance obtenues peuvent être précises au terme du second ordre de l'expansion non linéaire de Taylor, ce qui rend le filtrage non linéaire plus précis. Merwe et al. a proposé l’utilisation de UKF pour générer la distribution d’importance de PF, appelée filtre à particules non parfumées (UPF). La distribution d'importance générée par UKF est supérieure au chevauchement de l'état PDF réel et la précision de l'estimation est supérieure.

Les filtres à particules sont maintenant largement utilisés dans l'estimation de modèles pour les marchés financiers, en particulier pour les modèles de volatilité stochastique.

Les méthodes de filtres à particules sont des filtres bayésiens récursifs qui fournissent une approche pratique et attrayante pour se rapprocher des distributions postérieures lorsque le modèle est non linéaire et lorsque les bruits ne sont pas gaussiens.

Ces techniques apportent des solutions générales à de nombreux problèmes où la linéarisation et les approximations gaussiennes sont insolubles ou donneraient des performances trop faibles. Les hypothèses de bruit non gaussien et l'incorporation de contraintes sur les variables d'état peuvent également être effectuées de manière naturelle. De plus, les méthodes de filtrage des particules sont très flexibles, faciles à mettre en œuvre, parallélisables et applicables dans des contextes très généraux.

Localisation de robot à l'aide de filtres à particules

Un robot d'intérieur naviguant dans un bureau
Le robot perdu sur une carte avec l'approximation de son emplacement

Le filtre à particules résout de nombreux problèmes en robotique appliquée. Supposons que nous ayons des objets en mouvement que nous voulons suivre. Peut-être que les objets sont des avions de combat et des missiles, ou peut-être que nous suivons des personnes qui jouent au cricket dans un champ. Ce n’est pas grave. Réfléchissons aux caractéristiques d’un problème robotique tridimensionnel:

  • Multimodal: Nous voulons suivre zéro, un ou plusieurs objets simultanément
  • Occlusions: Un objet peut en cacher un autre, ce qui donne une mesure pour plusieurs objets.
  • Comportement non linéaire: Les avions sont agités par les vents, les balles se déplacent dans des paraboles et des personnes se heurtent.
  • Mesures non linéaires: Le radar nous donne la distance à un objet. Convertir cela en une coordonnée (x, y, z) nécessite une racine carrée, qui est non linéaire.
  • Bruit non gaussien: Lorsque des objets se déplacent sur un arrière-plan, la vision par ordinateur peut confondre une partie de l'arrière-plan avec l'objet.
  • Continu: la position et la vitesse de l’objet (c’est-à-dire l’espace des états) peuvent varier sans à-coups dans le temps.
  • Multivarié: nous voulons suivre plusieurs attributs, tels que la position, la vitesse, les taux de virage, etc.
  • Modèle de processus inconnu: nous pouvons ne pas connaître le modèle de processus du système
L'hypothèse initiale de la pose localisée est bruyante car nous pouvons voir les points répartis sur la grille (carte). Au fur et à mesure que le robot se déplace, les particules convergent, ce qui explique la convergence des particules.

Un certain nombre de robots affirment qu'un robot d'intérieur naviguant dans un entrepôt pourrait utiliser des filtres à particules pour se localiser sur la base des informations fournies par un capteur télémétrique, tel qu'un scanner laser 2D ou des filtres à particules pour voitures autonomes, pour fusionner les entrées sensorielles. et identifier les marques de voie sur la route. Un drone pourrait utiliser un filtre à particules pour optimiser le flux optique et.

Algorithme d'apprentissage par renforcement et filtres à particules

L'apprentissage par renforcement, dans le contexte de l'intelligence artificielle, est un type de programmation dynamique qui apprend et perfectionne un algorithme à l'aide d'un système de récompense et de sanction.

L'algorithme d'apprentissage par renforcement (RL) basé sur les filtres à particules est peu coûteux en calcul et présente une empreinte mémoire très faible. L'algorithme RL qui inclut une recherche directe directe de stratégie globale, basée sur des filtres de particules, effectuera une recherche dans l'espace de stratégie défini par le paramétrage de stratégie sélectionné.

Le filtre à particules pourrait être un concept de base de l'algorithme RL, pourrait être un moyen de guider l'exploration et l'exploitation, en créant des particules, chacune représentant une politique complète. En raison de la capacité des filtres à particules à effectuer une recherche globale, l’algorithme RL résultant doit pouvoir effectuer une recherche globale directe dans l’espace des politiques, ce qui représente une amélioration significative par rapport aux RL politiques basés sur la recherche locale traditionnelle.

Cela ajoute de la valeur car il hérite de nombreux avantages des filtres à particules, parmi lesquels:

  • Il est très simple à mettre en œuvre et peut être facilement réalisé dans des systèmes embarqués pour un apprentissage en ligne.
  • Il peut utiliser un calcul adaptatif en fonction des ressources disponibles (en termes de temps et de ressources CPU) en modifiant la valeur du paramètre σ
  • Il peut concentrer les efforts d’exploration de la LR sur les parties les plus importantes de l’espace politique,
  • Il peut présenter un taux de convergence adaptatif en fonction des exigences de précision et de temps, en modifiant le niveau de bruit initial et le facteur de déclin λ

Bien que l'algorithme de filtrage de particules puisse être utilisé comme un moyen efficace de résoudre le problème du SLAM, l'algorithme pose encore quelques problèmes. Le principal problème est qu’il faut un grand nombre d’échantillons pour se rapprocher de la densité de probabilité postérieure du système. Plus l'environnement auquel le robot est confronté est complexe, plus il faut d'échantillons pour décrire la distribution de probabilité postérieure et plus l'algorithme est complexe.

Par conséquent, l’algorithme est axé sur une stratégie d’échantillonnage adaptatif capable de réduire efficacement le nombre d’échantillons. De plus, la phase de ré-échantillonnage peut entraîner une perte de validité et de diversité des échantillons, entraînant leur épuisement. Comment maintenir la validité et la diversité des particules et surmonter l'épuisement des échantillons constitue également un nouvel échantillonnage de l'objectif de cet algorithme.

Dans l'apprentissage par renforcement, le filtre de particules, en tant que membre de méthodes de recherche globale, nécessite généralement davantage d'essais pour converger, car la portée de la recherche est la plus grande possible - tout l'espace de la politique.

Les filtres à particules n'ont pas de preuve stricte de convergence. En théorie, nous avons échangé une «preuve de la convergence locale» avec une méthode de recherche globale qui n’a aucune preuve de la convergence globale, mais qui a au moins la garantie de ne pas rester bloqué aux optima locaux.

Show More

SupportIvy

SupportIvy.com : Un lieu pour partager le savoir et mieux comprendre le monde. Meilleure plate-forme de support gratuit pour vous, Documentation &Tutoriels par les experts.

Related Articles

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Close
Close