PC & Mobile

Bigfoot est-il républicain? – La start-up – Moyenne

Bigfoot est-il républicain? - La start-up - Moyenne


Les haineux vont dire que c'est Photoshop.

Je suis récemment tombé sur un ensemble de données contenant toutes les observations de Bigfoot de 1867-2017. Naturellement, j'ai commencé à réfléchir aux implications politiques que ces données doivent contenir. Après tout, le FBI vient d’annoncer qu’il enquêtait sur Bigfoot depuis les années 1970. Donc, si le gouvernement est intéressé, il doit y avoir une raison politique. Tels que Bigfoot est un donneur d'argent noir au parti républicain!

Ok, à part les blagues et les théories du complot, je pensais qu'il serait amusant de voir si les observations de Bigfoot étaient alignées sur les résultats de la dernière élection présidentielle. Cela m'a conduit à la question ironique qui figure dans le titre de cet article. Permettez-moi de vous présenter cette brève comparaison des résultats de l’élection présidentielle de 2016 et des observations historiques de Bigfoot, et de voir si nous ne pouvons pas répondre à la question que nous avons toujours secrètement posée: Bigfoot est-il républicain?

Commençons!

1.0 Importer les données

# Chargement dans nos colis
lapply (c (“tidyverse”, “openintro”, “usmap”),
bibliothèque,
character.only = TRUE)

# Chargement dans nos jeux de données
elec_results <- read_csv (“/ Users / auggieheschmeyer / Documents / Divers / Pratique R / Bigfoot: Résultats des élections / pres16results.csv”)
bigfoot <- read_csv (“/ Users / auggieheschmeyer / Documents / Divers / Entraînement R / Bigfoot: Résultats des élections / bfro_reports_geocoded.csv”)

# Mise en place d'éléments supplémentaires
auggie_pink <- '# # ffd1dc'
auggie_blue <- '# 5fa1e1'
usa <- map_data («usa»)
states = map_data (‘state’)

Pour résumer le code ci-dessus, je charge dans certains packages qui aideront éventuellement à tracer les observations de Bigfoot sur une carte, les jeux de données susmentionnés et des éléments supplémentaires qui aideront à relier les éléments.

2.0 Explorer les données

coup d'oeil (elec_results)
## Observations: 18,475
## Variables: 9
## $ comté NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ fips “US”, “US”, “US”, “US”, “US”, “US”, “US”, “US”, “US”, “US”…
## $ cand “Donald Trump”, “Hillary Clinton”, “Gary Johnson”, “…
## $ st “US”, “US”, “US”, “US”, “US”, “US”, “US”, “US”, “US”, “US”…
## $ pct_report 0,9951, 0,9951, 0,9951, 0,9951, 0,9951, 0,9951, 0,99…
## $ votes 60350241, 60981118, 4164589, 1255968, 451636, 180877…
## $ total_votes 127592176, 127592176, 127592176, 127592176, 12759217…
## $ pct 4.729933e-01, 4.779378e-01, 3.263985e-02, 9.843613e-…
## $ lead “Donald Trump”, “Donald Trump”, “Donald Trump”, “Don…
unique (elec_results $ cand)
## [1] “Donald Trump” “Hillary Clinton” 
## [3] «Gary Johnson» «Jill Stein»
## [5] «Evan McMullin» «Château Darrell»
## [7] “Gloria La Riva” “Rocky De La Fuente”
## [9] “Aucun de ces candidats” “Richard Duncan”
## [11] «Dan Vacek» «Alyson Kennedy»
## [13] “Mike Smith” “Chris Keniston”
## [15] «Lynn Kahn» «Jim Hedges»
## [17] «Monica Moorehead» «Peter Skewes»
## [19] “Emidio Soltysik” “Scott Copeland”
## [21] «Tom Hoefling» «Rocky Giordani»
## [23] «Laurence Kotlikoff» «Kyle Kopitke»
## [25] «Joseph Maldonado» «Michael Maturen»
## [27] «Princesse Jacob» «Ryan Scott»
## [29] «Rod Silva» «Jerry White»
## [31] «Bradford Lyttle» «Frank Atwood»
## [33] N / A
aperçu (bigfoot)
## Observations: 4,586
## Variables: 27
## $ observé “Ed L. pêchait le saumon avec un compagnon à…
## $ location_details “Côté est de Prince William Sound”, “Je voudrais…
## $ comté «Comté de Valdez-Chitina-Whittier», «Comté de York…
## $ state “Alaska”, “Pennsylvanie”, “Oregon”, “Oklahoma…
## $ title NA, NA, NA, «Report 9765: Un automobiliste et…
## $ latitude NA, NA, NA, 35.30110, 39.38745, 43.27314, 39.…
## $ longitude NA, NA, NA, -99.17020, -81.67339, -76.89331,…
## $ date NA, NA, NA, 1973-09-28, 1971-08-190, 2003-09-…
## $ numéro 1261, 8000, 703, 9765, 4983, 26566, 5692, 438…
## $ classification “Classe A”, “Classe B”, “Classe B”, “Classe A”, “…
## $ geohash NA, NA, NA, “9y32z667yc”, “dpjbj6r280”, “dr9q…
## $ temperature_high NA, NA, NA, 72,55, 76,32, 67,62, 88,56, NA, 7…
## $ temperature_mid NA, NA, NA, 63.225, 70.440, 58.160, 70.220, N…
## $ temperature_low NA, NA, NA, 53.90, 64.56, 48.70, 51.88, NA, 5…
## $ dew_point NA, NA, NA, 50,86, 62,45, 54,06, 43,89, NA, 5…
## $ humidité NA, NA, NA, 0,73, 0,82, 0,75, 0,42, NA, 0,73,…
## $ cloud_cover NA, NA, NA, 0,16, 0,86, 0,48, 0,00, NA, 0,22,…
## $ moon_phase NA, NA, NA, 0,07, 0,32, 0,81, 0,02, NA, 0,10,…
## $ précip_intensity NA, NA, NA, 0,0000, 0,0006, 0,0006, 0,0000, N…
## $ précip_probability NA, NA, NA, 0,00, 0,21, 0,21, 0,00, NA, 0,30,…
## $ précip_type NA, NA, NA, NA, “pluie”, “pluie”, NA, NA, “pluie…
## $ pression NA, NA, NA, 1017.29, 1022.74, 1020.75, 1011.9…
## $ summary NA, NA, NA, “Partiellement nuageux dans l…
## $ uv_index NA, NA, NA, 6, 6, 4, 9, NA, 8, 6, 5, 6, 1, 2,…
## $ visibilité NA, NA, NA, 10.00, 4.97, 9.53, 9.76, NA, 9.47…
## $ portant_vents NA, NA, NA, 263, 156, 253, 197, NA, 234, 63,…
## $ wind_speed NA, NA, NA, 8.15, 3.02, 8.73, 1.96, NA, 2.47,…

C'est toujours une bonne idée d'examiner la forme des données afin de pouvoir comprendre à quoi elles ressemblent et ce que vous pouvez en faire. Ci-dessus, nous pouvons voir que les résultats des élections sont ventilés par comté et par État et indiquent le pourcentage de victoire de chaque candidat majeur et mineur, ainsi que l'identité du vainqueur final dans ce comté. Il y a pas mal de candidats sur la liste, mais on peut affirmer sans crainte que nous ne regardons que Trump et Clinton. Désolé, Gary ¯ _ (ツ) _ / ¯

En ce qui concerne les données Bigfoot, Dieu bénisse quiconque gérait cet ensemble de données. Alors que les résultats des élections ne comportaient que neuf variables, ces données Bigfoot nous fournissent pas moins de 27 bits d’informations sur chaque observation Bigfoot. Ils ont même inclus la phase de la lune! Ils n’ont pas eu besoin de CELA pour cet ensemble de données, mais ils l’ont fait. Ils l'ont fait pour nous. Malheureusement, je ne vais utiliser que les données de localisation cette fois-ci. Peut-être que je devrai revoir ce jeu de données un jour et l'utiliser pour planifier ma propre observation Bigfoot.

3.0 Préparation des données

# Préparer les données à fusionner
elec_résultats <- elec_results %>% filter (cand == “Donald Trump” | cand == “Hillary Clinton”,
! is.na (comté))%>% group_by (comté)%>% arrange (comté, description (%))%>%
filtre (pct == max (pct))%>% de mutation (état = abbr2state (st))%>% select (comté,
état, plomb, pct)

bigfoot <- bigfoot %>% de sélection (date, comté, état, latitude, longitude)

Vient maintenant la partie de cette comparaison où je prépare les données pour répondre aux questions auxquelles nous souhaitons répondre. Pour simplifier les choses, ci-dessus, j'ai filtré les données électorales pour ne nommer que Trump et Clinton et choisir uniquement les variables indiquant qui a gagné et avec quel pourcentage.

Ci-dessous, je joins les deux ensembles de données par comté et par État. Jetez un coup d'œil au produit final.

# Fusion des deux jeux de données
combiné <- bigfoot %>% inner_join (elec_results, by = c (“comté”, “état”))

tête (combiné, 10)

## # Un tibble: 10 x 7
## date Etat du comté latitude longitude plomb pct
##
## 1 NA Yamhill Coun… Oregon NA NA Donald Tru… 0,501
## 2 1973-09-28 Washita Coun… Oklahoma 35,3 à 99,2 Donald Tru… 0,832
## 3 1970-09-09 Comté de Washoe dans le Nevada 39,6 à 120. Hillary Cl… 0.464
## 4 1979–07–04 Saunders Cou… Nebraska 41,2 -96,4 Donald Tru… 0,706
## 5 1988–03–15 Voiture du nord du comté de Yancey… 35,7 -82,3 Donald Tru… 0,649
## 6 1988–12–15 Silver Bow C… Montana 46,1-113. Hillary Cl… 0.527
## 7 2006–01–05 Tishomingo C… Mississip… 34,6 -88,2 Donald Tru… 0,856
## 8 2013–202–16 Tishomingo C… Mississip… 34,7 -88,3 Donald Tru… 0,856
## 9 2007–08–15 Silver Bow C… Montana 46,0 -112. Hillary Cl… 0.527
## 10 2011–08–21 Voiture du nord du comté de Yancey… 35,8 -82,2 Donald Tru… 0,649

Enfin, je rassemble un autre jeu de données que je vais utiliser pour cartographier toutes ces observations sous peu.

# Préparer un autre jeu de données dont nous aurons besoin pour notre carte
États <- states %>% mutate (state = paste (toupper (sous-chaîne (région, 1, 1))),
sous-chaîne (région, 2), sep = ""))%>% left_join (elec_results, by = c ("état"))%>%
select (long, lat, group, order, state, lead)

tête (états)

## lead lat de l'ordre des groupes
## 1 -87.46201 30.38968 1 1 Alabama Donald Trump
## 2 -87.46201 30.38968 1 1 Alabama Donald Trump
## 3 -87.46201 30.38968 1 1 Alabama Donald Trump
## 4 -87.46201 30.38968 1 1 Alabama Donald Trump
## 5 -87.46201 30.38968 1 1 Alabama Hillary Clinton
## 6 -87.46201 30.38968 1 1 Alabama Donald Trump

4.0 Répondre à la grande question

Maintenant que les données sont configurées à mon goût, je peux enfin commencer à les utiliser pour obtenir des réponses. La première question que je vais poser est celle de savoir s’il existe ou non une différence entre le nombre d’observations dans les comtés de Trump et de Clinton. Pour ce faire, je vais utiliser un test t bilatéral. Ce test t consiste à déterminer si la différence entre le nombre d'observations entre les comtés de Trump et de Clinton est due au hasard. Il pose l'hypothèse «il n'y a pas de différence entre les résultats» et vérifie ensuite si cela peut raisonnablement être considéré comme vrai. Dans la communauté des statistiques, si les résultats observés (ou les résultats les plus extrêmes) ne sont observés que 5% ou moins du temps, nous rejetons cette hypothèse et disons qu'il existe une différence «significative».

Voyons ce que dit le test.

t_test <- combined %>% group_by (county, lead)%>% résume (observations = n ())

t.test (observations ~ plomb, données = t_test)

  ## 
# T Test de Welch Two Sample
##
## données: observations par le plomb
## t = -2,3485, df = 158,23, valeur p = 0,02008
## hypothèse alternative: la vraie différence de moyennes n'est pas égale à 0
## 95% intervalle de confiance:
## -2.4356485 -0.2103888
## estimations de l'échantillon:
## moyenne dans le groupe Donald Trump moyenne dans le groupe Hillary Clinton
## 3.059334 4.382353

Le code comptait le nombre d'observations par comté, puis le nombre moyen d'observations par comté pour ceux qui ont voté pour Trump et ceux qui ont voté pour Clinton. Ces moyennes se retrouvent dans la partie «estimations de l’échantillon» de la production. La moyenne de Clinton est plus grande, mais encore une fois, cela pourrait être dû au hasard. Si nous regardons la valeur p, cependant, nous voyons 0,02. Ce nombre représente l’estimation de la probabilité que nous obtenions des résultats aussi extrêmes. Puisque 2% est inférieur au seuil de 5% que nous avons vu précédemment, nous pouvons rejeter l'hypothèse selon laquelle il n'y a pas de différence entre le nombre d'observations dans les comtés de Trump et de Clinton.

Cela signifie que les comtés qui ont voté pour Donald Trump ont en moyenne 1,2 observation de Bigfoot en moins par rapport à ceux qui ont voté pour Clinton. Bigfoot est donc beaucoup plus présent dans les pays démocratiques, hein? On dirait que je peux me tromper à propos d'un Bigfoot républicain…

5.0 Représentations visuelles

Les comtés de Clinton ont peut-être eu un nombre moyen d’observations plus élevé, mais peut-être est-ce dû au fait qu’elle avait un plus petit nombre de comtés avec un grand nombre d’observations. La moyenne des comtés de Trump était peut-être inférieure, car ils sont beaucoup plus nombreux. Faisons un graphique pour comparer les proportions d’observations de Bigfoot entre les deux comtés.

# Représentation graphique de la proportion de comtés ayant des signatures Bigfoot (1869-2017)
combiné%>% distinct (comté, .keep_all = TRUE)%>% select (lead)%>% group_by (lead)%>%
résumez (n = n ())%>% muté (prop = pâte (rond (n / somme (n), 4)) * 100, «%»,
sep = “”))%>% ggplot (aes (x = plomb, y = n, remplissage = plomb, étiquette = prop)) +
geom_col () + geom_text (aes (famille = «moyen Futura»), vjust = -0,25) + scale_fill_manual (breaks = c («Donald Trump», Donald Trump),
“Hillary Clinton”), values ​​= c (auggie_pink, auggie_blue)) + labs (title = “Résultats des élections de 2016 par les comtés ayant une vision bigfoot”,
sous-titre = "observations de 1869-2017", x = "", y = "nombre de comtés",
caption = "un visuel d'auggie heschmeyer") + theme_classic () + theme (text = element_text (family = "Futura Medium"),
legend.position = "none", plot.title = element_text (hjust = 0.5), plot.subtitle = element_text (hjust = 0.5))

Whoa. Il semble que mes soupçons étaient justes. Il y a beaucoup plus de comtés de Trump avec des observations de Bigfoot. Ce graphique me dit que Bigfoots (Bigfeet?) A toujours habité dans des comtés ayant voté républicain lors des dernières élections. Mais comment puis-je rectifier cela avec les résultats du test t qui montre que les comtés de Clinton ont des observations plus moyennes? Bigfoot est-il parti en vacances dans les mêmes comtés démocrates et y a-t-il été aperçu encore et encore? Peut-être qu'une carte montrant les observations m'aidera à résoudre le problème.

# Tracer toutes les observations de Bigfoot sur une carte
filtre combiné%>% (longitude> -135)%>% ggplot (aes (x = longitude, y = latitude,
color = lead)) + geom_polygon (données = états, aes (x = long, y = lat, groupe = groupe),
remplir = NA, couleur = "gris", show.legend = FALSE) + geom_point (alpha = 0.5) +
scale_color_manual (sauts = c (“Donald Trump”, “Hillary Clinton”), valeurs = c (auggie_pink,
auggie_blue)) + coord_quickmap () + labs (titre = «observations bigfoot (1869-2017)»,
sous-titre = "coloré par le candidat à la présidence du comté de 2016 en vue", color = "",
caption = "un visuel d'auggie heschmeyer") + theme_void () + theme (text = element_text (family = "Futura Medium"),
legend.position = "bottom", plot.title = element_text (hjust = 0.5), plot.subtitle = element_text (hjust = 0.5))

Cela clarifie les choses. Trump a gagné beaucoup de comtés ruraux peu peuplés à travers les États-Unis. «Peu peuplé et rural» ressemble beaucoup aux endroits où Bigfoot voudrait peut-être vivre. Tous ces points roses représentent les observations de Bigfoot dans les comtés de Trump et la plupart d’entre eux ne se trouvent pas à proximité d’une grande métropole. Les points bleus, cependant, semblent être centrés autour de ces métropoles. Cela corrobore ma théorie selon laquelle, peut-être, comme nous tous, Bigfoot aime visiter la ville et compte tenu du nombre de personnes présentes dans la ville, les chances qu’il soit repéré par davantage de personnes augmentent considérablement.

6.0 En conclusion

Alors, Bigfoot est-il républicain? Même si je me suis beaucoup amusé à jouer avec ces données, je ne pense pas pouvoir passer cet appel. Etant donné qu'il vit dans des comtés ruraux à tendance Trump, cela semble être une hypothèse sans danger, cependant. Ou peut-être que Bigfoot est un démocrate, mais ne peut tout simplement pas se payer un loyer en ville. Peut-être verrons-nous Bigfeet des États-Unis s'unir et voter pour Elizabeth Warren en 2020, car nous ne pouvons que présumer que son plan de redistribution de la richesse inclut des créatures velues, dressées, ressemblant à des singes.

Merci d'avoir lu le long. J'espère vous voir dans la prochaine étude de cas.

Show More

SupportIvy

SupportIvy.com : Un lieu pour partager le savoir et mieux comprendre le monde. Meilleure plate-forme de support gratuit pour vous, Documentation &Tutoriels par les experts.

Related Articles

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Close
Close