Support IVY : Encyclopédie #1 et site d'informations, Conseils, Tutorials, Guides et plus
  • Accueil
  • Astuces
  • Magazine
    • Conseil en relations
      • Astuces
    • Rédaction & écriture
    • Web Design
    • Réseaux sociaux
      • Facebook
  • Lifestyle
    • Food
  • Ressources
    • Questions & Réponses
    • Graphique
      • PixelArt
No Result
View All Result
Support IVY : Encyclopédie #1 et site d'informations, Conseils, Tutorials, Guides et plus
  • Accueil
  • Astuces
  • Magazine
    • Conseil en relations
      • Astuces
    • Rédaction & écriture
    • Web Design
    • Réseaux sociaux
      • Facebook
  • Lifestyle
    • Food
  • Ressources
    • Questions & Réponses
    • Graphique
      • PixelArt
Support IVY : Encyclopédie #1 et site d'informations, Conseils, Tutorials, Guides et plus
No Result
View All Result
Home Intelligence artificielle

Méthodes statistiques robustes – Vers la science des données

19 mai 2020
in Intelligence artificielle
Reading Time: 5 mins read
Méthodes statistiques robustes – Vers la science des données

Table des matières

ArticlesA lire

Normalisation – Vitrine – Programmation

Normalisation – Vitrine – Programmation

Effet du traitement dans l’étude observationnelle

Effet du traitement dans l’étude observationnelle

Quelles sont les techniques pour détecter les anomalies

Quelles sont les techniques pour détecter les anomalies

Réseaux adverses génératifs – Vers la science des données

Réseaux adverses génératifs – Vers la science des données

Méthodes statistiques robustes – Vers la science des données

La régression OLS applique une certaine pondération à chaque point de données:

Dérivation sous forme fermée du coefficient de régression OLS[[la source]

Dites X ~ N (0,1), et Y est également ~ N (0,1). Disons que X¹ = 1, sa contribution au bêta serait (X¹ * Y¹) / (X¹ * X¹) = (1 * Y¹ / 1 * 1) = Y¹. Comme Y¹ est également uniformément normal, nous nous attendrions à ce que la Bêta soit d’environ +/- 1 (les deux ensembles ont la même variance, donc la régression est équivalente à la corrélation).

Cependant, supposons que Y¹ soit accidentellement stocké à 10 000 (vous pouvez blâmer le stagiaire), la contribution à l’estimateur de ce point bêta passerait de 1 à 10 000! C’est fou et clairement pas souhaité!

Les régressions sont donc très sensibles aux points de données anormaux (au pire, le problème peut être exponentiel) et étant donné la discussion ci-dessus, nous préférerions utiliser un estimateur avec un point de décomposition plus élevé et un degré d’efficacité plus élevé. C’est pour s’assurer que notre estimateur ne soit pas renversé par des points de données voyous, donc si le manque potentiel de normalité dans les données est inquiétant, alors le chercheur devrait utiliser des méthodes d’estimation robustes:

Les estimateurs M sont des variantes des méthodes d’estimation du maximum de vraisemblance (MLE). Les méthodes MLE tentent de maximiser la distribution de probabilité conjointe tandis que les estimateurs M tentent de minimiser une fonction ⍴ comme suit:

Résoudre le problème des estimateurs M[[la source]

Le lecteur astucieux verra rapidement que la régression linéaire est en fait un type de M-estimateur (minimise la somme des résidus au carré) mais elle n’est pas entièrement robuste. Ci-dessous, nous avons 4 autres types d’estimateurs M et d’autres peuvent être trouvés ici:

Différents choix de fonctions pour votre M-Estimator[[la source]

Par exemple, la déviation minimale absolue (LAD) estime les coefficients qui minimisent la somme des résidus absolus par opposition à la somme des erreurs quadratiques. Cela signifie que LAD a l’avantage d’être résistant aux valeurs aberrantes et aux écarts par rapport à l’hypothèse de normalité, bien qu’il soit plus coûteux en termes de calcul.

En tant que praticien, j’encouragerais les chercheurs à essayer plusieurs méthodes car il n’y a pas de règle stricte et rapide. Il est beaucoup plus convaincant de démontrer l’utilisation de plusieurs estimateurs donnant des résultats similaires, plutôt qu’un ensemble de résultats sporadiques et inexplicables.

Enfin, nous devons nous rappeler que les M-estimateurs ne sont normaux qu’asymptotiquement, donc même lorsque les échantillons sont grands, l’approximation peut être encore très mauvaise. Tout dépend du type et de la taille de l’anomalie!

ShareTweetPin

Related Posts

Normalisation – Vitrine – Programmation
Intelligence artificielle

Normalisation – Vitrine – Programmation

Normalisation - Vitrine - Programmation SCIENCE DES DONNÉES - COVID-19 - VISUALISATION - PROGRAMMATION Combien de personnes infectées vivent encore...

Effet du traitement dans l’étude observationnelle
Intelligence artificielle

Effet du traitement dans l’étude observationnelle

Effet du traitement dans l'étude observationnelle En inférence causale observationnelle à l'aide des dossiers de santé électroniques Inférence causale pour...

Quelles sont les techniques pour détecter les anomalies
Intelligence artificielle

Quelles sont les techniques pour détecter les anomalies

Quelles sont les techniques pour détecter les anomalies photo par Ali Hajian sur UnsplashDétection d'une anomalie est l'identification d'éléments, d'événements...

Réseaux adverses génératifs – Vers la science des données
Intelligence artificielle

Réseaux adverses génératifs – Vers la science des données

Réseaux adverses génératifs - Vers la science des données GAN dans le Deep Learning Une plongée dans le monde magique...

Next Post
Design : Spotify dans le Neumorphisme – UX Collective

Design : Spotify dans le Neumorphisme - UX Collective

Business : Entretien avec le cofondateur de Netflix, Marc Randolph

Business : Entretien avec le cofondateur de Netflix, Marc Randolph

Laisser un commentaire Annuler la réponse

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

  • Accueil
  • Questions & Réponses
  • Science
  • Astuces
  • Business
  • Cryptomonnaie
  • Design
  • Marketing
  • Programmation
  • Politique de confidentialité
  • A propos
  • Contact

© 2018-2020 SupportIVY - Premium Magazine.

No Result
View All Result
  • Accueil
  • Astuces
  • Magazine
    • Conseil en relations
      • Astuces
    • Rédaction & écriture
    • Web Design
    • Réseaux sociaux
      • Facebook
  • Lifestyle
    • Food
  • Ressources
    • Questions & Réponses
    • Graphique
      • PixelArt