Technologie

Regroupement des contributions à la campagne trimestrielle de la FEC – Justin Herman

Regroupement des contributions à la campagne trimestrielle de la FEC - Justin Herman


Cluster les rôles dans les données FEC pour créer des courses de barres animées visualisant la contribution par profession

2*5ZN7XUoAvWiTJ31FJaV0 g - Regroupement des contributions à la campagne trimestrielle de la FEC - Justin Herman

Les sondages attirent beaucoup d'attention de semaine en semaine, mais les nouvelles manquent généralement d'une analyse approfondie des documents déposés par la FEC. Les dépôts sont riches d'informations sur les donneurs qui s'auto-identifient, notamment le poste, le secteur et le lieu. Lors de la primaire de 2020, presque tous les candidats ont souscrit des contributions des lobbyistes. En apparence, c’est une noble tentative des candidats démocratiques de prouver qu’ils ne sont pas influencés par les grandes entreprises. Cependant, en creusant sous la surface, les données de la FEC peuvent être largement influencées par les entreprises. J'essaierai d'examiner exclusivement les dons individuels et de voir si nous pouvons détecter l'influence des entreprises au niveau individuel.

Les campagnes du mandat de la FEC signalent des dons inférieurs à 200 dollars; par conséquent, les données sont en grande partie incomplètes. Les statistiques agrégées Q1 / Q2 sont imprimées ci-dessous. En termes de fonds effectivement collectés, Bernie Sanders devrait mener les candidats avec près de quarante millions de dollars de contributions. Cet ensemble de données est orienté vers des contributions plus importantes. Pour un aperçu à jour des chiffres globaux, voir politico. Je peux me référer à ces chiffres agrégés ci-dessous.

En examinant les données ci-dessus, Bernie et Warren souffrent d’un désavantage important en ce qui concerne le montant moyen provenant de contributions individuelles. Biden et Gillibrand sont stimulés par d'importantes contributions. Buttigeg a été présenté comme disposant d’une solide base de dons individuels. Bien que ce soit extrêmement spéculatif sans toutes les données, il semble que ces donateurs individuels donnent de gros montants à Buttigeg (moyenne de 330 dollars), soit près de 17 millions sur ses 31 millions collectés. À titre de comparaison, Sanders a collecté 46 millions d’euros et seulement 8 millions d’entre eux se présentent ici (ce n’est pas aussi simple, car PACS a donné plusieurs millions à la campagne Sanders, mais également à Buttigeg)

Act Blue est un contributeur important à la collecte de fonds politique et on pourrait utiliser leurs données FEC exclusivement pour comparer les candidats. Cela donnerait probablement une image bien différente de la façon dont les Américains dans leur ensemble font des dons à des campagnes politiques. Cependant, le but de cet article est d'explorer les dons des entreprises. La manière dont davantage de personnes connectées font un don diffère de la simplicité de faire un don Act Blue.

Dans les rapports de la FEC, les données auto-identifiées entraînent une perte d'informations due à un manque de normalisation. En regardant les données FEC, vous trouverez de nombreux exemples légèrement divergents du mot PDG. (Chef de la direction, chef de la direction, chef de la direction, etc.). En utilisant des expressions régulières, je regroupe tous ces rôles dans un rôle singulier de PDG, en capturant une quantité importante de données «perdues». À partir de là, j'approfondis en regardant d'autres mots auto-déclarés (fondateur, directeur exécutif et président, etc.). Ces titres sont également représentatifs des responsables de leur organisation et sont donc équivalents aux PDG. Pourquoi s'arrêter ici cependant?

À gauche, le terme exact «PDG» apparaît 2902 fois dans les rapports actuels du FEC, cependant, le terme PDG apparaît 3533 fois dans les données. En étiquetant toutes les entrées du tableau de gauche en tant que PDG, nous avons augmenté de plus de 20% notre nombre de prises de participation.

La bonne chose est que nous pouvons développer à partir d'ici. J'ajoute dans des termes similaires à ceux de président, directeur exécutif, etc. et nous avons 4459 personnes interrogées supplémentaires qui représentent le rôle réel de PDG. Nous avons maintenant plus de 7500 répondants identifiés en tant que PDG. Augmentation de près de 300% par rapport à notre nombre initial de 2902

Groupe de PDG élargi

J'ai regroupé des postes de direction et des postes de direction au niveau c, comme indiqué ci-dessous.

Cadres en cluster à gauche et en cluster à droite

Lorsque nous regroupons tous ces postes de direction dans une catégorie, nous avons un groupe de près de 20 000 dirigeants de différentes professions que nous pouvons examiner plus avant afin de rechercher des relations plus étroites en matière de dons.

Dans le tableau ci-dessous, la ligne du bas représente la répartition des dons dans les données. Les deux premières lignes représentent les distributions de dons du chef de la direction dans nos données d'origine et les données en cluster.

Distribution des dons

En observant les distributions ci-dessus, il n’est pas nécessaire d’exécuter des tests statistiques. Le regroupement capture la population de PDG. Il est également clair que la distribution des dons de la population des PDG est très différente de celle de l’ensemble de données. Les PDG ont une moyenne et une médiane de (705 $, 250 $) par rapport à une personne moyenne ayant une moyenne et une médiane de (201 $, 38 $).

Certains lecteurs peuvent être confus que le min est un nombre négatif. Les individus ont un plafond de 2800 qui peuvent être donnés à un seul candidat. Un minimum de -2800 correspond à un remboursement de la campagne aux personnes qui ont accidentellement enfreint la loi de financement de la campagne.

Construisez des courses à barres qui permettent de suivre les dons aux candidats

Courses de dons parCEO (à gauche) et tous les postes de direction (à droite)
Dons cumulatifs du PDG (à gauche) et de tous les postes de direction (à droite)

Biden ne participera pas à la course avant le deuxième trimestre et rattrapera rapidement son retard en matière de dons. Biden, Harris et Buttigeg sont les favoris des donneurs d’entreprise. Booker, Klobuchar et Gillibrand forment la prochaine vague de candidats parmi le reste du monde (Inslee, Warren, Tulsi, Bernie, Castro et Yang), qui semblent tous attirer peu l’attention des fonds des entreprises.

Sanders et Warren font actuellement partie des trois meilleurs candidats et reçoivent très peu de financement d'entreprise. Il sera intéressant de voir les rapports du troisième trimestre, si cette tendance se maintient. En tant qu’observatrice occasionnelle des élections, j’ai le sentiment que malgré le programme progressiste de Warren, elle assistera à une augmentation significative des dons des entreprises au troisième trimestre.

J'ai approfondi et regroupé d'autres domaines d'emploi. Ce domaine d’analyse porterait davantage sur les pommes si nous n’utilisions que les données Act Blue FEC, car elles refléteraient probablement mieux les chiffres globaux des dons. Cependant, voici quelques résultats provisoires

Notez que les échelles sont toutes différentes pour ces graphiques. Harris réussit extrêmement bien avec les donateurs à la retraite. Biden fait extrêmement bien avec les avocats et ceux dans le domaine juridique. En me basant purement sur des suppositions d’identité, je me serais attendu à ce que Kamala, en tant qu’avocate, ait eu plus de connaissances en droit et que Biden, en tant qu’ancien dirigeant, ait obtenu de meilleurs résultats avec les retraités.

Bernie a une avance considérable sur les cols bleus, cependant, dans cette partie des données, ils ne représentent que 150 000 dollars en dons. Cela met en évidence le danger d'utiliser cet ensemble de données incomplet. Les cols bleus sont probablement à l'origine de la collecte de fonds de Bernie, mais ils ne donnent pas plus de 200 $ et ne figurent donc pas dans les données de la FEC. Il manque des millions de dons à nos données.

Je fais plusieurs hypothèses de catégorisation dans mes opérations de manipulation de données. L’approche regex que j’ai adoptée pour regrouper ces groupes inclura des exemples incorrects. La force brutale de zone d’expressions régulières tente de catégoriser les occupations de manière algorithmique. Cependant, comme j'ai suivi l'évolution de la profession d'origine, la plupart des titres de poste sont correctement identifiés. Mon DF agrégé est à ma site Internet, J’ai classé tous les titres d’emploi qui ont été modifiés avec un champ binomial pour les suivre. N'hésitez pas à regarder les hypothèses que j'ai faites et les fausses captures dans les grappes. si vous souhaitez prendre cela en compte dans votre propre analyse, ou peut-être développer vos propres clusters, n'hésitez pas à le faire également. Les intitulés de poste originaux non édités sont toujours présents dans le jeu de données.

Les données de la FEC sont un outil puissant pour identifier les structures de pouvoir des entreprises et leur influence sur les élections. L'interdiction des lobbyistes a forcé l'influence des entreprises à découvrir de nouvelles relations néfastes avec le parti démocratique. Ces données ne tiennent pas compte non plus du Super PACS et de son influence sur notre processus électoral après Citizens United. À un moment donné, j'essaierai d'utiliser ces données pour élaborer des modèles afin de déterminer les caractéristiques qui incitent les donateurs à voter pour chaque candidat.

Pour voir le code de l'article ci-dessus, s'il vous plaît visitez mon github dépôt. Le référentiel comprend un fichier de cahier qui permet de parcourir toutes les analyses en coulisses de R

Pour voir mes autres projets s'il vous plaît visitez mon site Internet . Si vous souhaitez me contacter, s'il vous plaît contactez-moi sur Linkedin

Show More

SupportIvy

SupportIvy.com : Un lieu pour partager le savoir et mieux comprendre le monde. Meilleure plate-forme de support gratuit pour vous, Documentation &Tutoriels par les experts.

Related Articles

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Close
Close