Technologie

Elizabeth Warren dirige la course présidentielle de 2020: une analyse en python

Elizabeth Warren dirige la course présidentielle de 2020: une analyse en python


2*jaDCzaMpvRadb aUH Gw3Q - Elizabeth Warren dirige la course présidentielle de 2020: une analyse en python
La source

Dans cet article, nous utiliserons l'API python google trends, pytrends, pour analyser lequel des principaux candidats démocratiques sont les plus recherchés.

Pour installer pytrends, ouvrez une ligne de commande et tapez:

pip installer pytrends

Ouvrez ensuite un IDE (j'utilise Spyder) et importez pytrends:

de pyrtends.request import TrendReq

Ensuite, nous spécifions la langue de l’hôte, le fuseau horaire et la charge utile. Nous spécifions la langue de l'hôte en anglais («en-US»), le fuseau horaire en tant que fuseau horaire standard central («360») et nous pouvons laisser le filtre de propriétés de Google (gprop) en tant que chaîne vide. Nous définissons également la catégorie = 0, qui correspond à toutes les catégories liées au mot clé.

Obtenons les données de janvier 2019 à octobre 2019 à New York pour Joe Biden:

pytrends = TrendReq (hl = 'en-US', tz = 360)
pytrends.build_payload (['Biden'], cat = 0, échéancier = '2019-01-01 2019-10-31', gprop = '', geo = 'US-NY')

Nous définissons ensuite un cadre de données en tant qu’objet pytrends résultant et imprimons les cinq premières lignes:

pytrends = TrendReq (hl = 'en-US', tz = 360)
print (df.head ())

Nous pouvons également utiliser seaborn et matplotlib pour tracer la série chronologique des recherches de ‘Biden’:

importer matplotlib.pyplot en tant que plt
importer seaborn as sns
importer des pandas en tant que pd
sns.set ()
df['timestamp'] = pd.to_datetime (df.index)
sns.lineplot (df['timestamp'], df['Biden'])
plt.title ("Recherches normalisées pour Biden à New York")
plt.ylabel ("Nombre de recherches")
plt.xlabel ("Date")

Faisons de même pour Biden dans le Wyoming:

Nous pouvons également regarder Sanders à New York:

À titre de comparaison, nous pouvons superposer les recherches de Biden, Sanders et Warren à New York:

Biden (bleu), Sanders (orange), Warren (vert)

D'après les données de Google sur les tendances, il semblerait qu'Elizabeth Warren ait davantage tendance à New York qu'à Biden et Sanders. Nous pouvons également regarder le même terrain dans le Wyoming, qui est républicain à 68%:

Biden (bleu), Sanders (orange), Warren (vert)

Warren a également mené dans le Wyoming. Il serait intéressant de regarder quelques états oscillants. Jetons un coup d’œil au Michigan:

Biden (bleu), Sanders (orange), Warren (vert)

Warren est largement en tête dans le Michigan, même s'il est considéré comme un état de champ de bataille.

Et pour l'Iowa, nous avons:

Biden (bleu), Sanders (orange), Warren (vert)

Enfin, regardons la Floride:

Biden (bleu), Sanders (orange), Warren (vert)

Il convient de noter qu’au moment de la rédaction de cet article, le New York Times signalait que Biden était en tête selon les sondages (26%) et Warren en deuxième position (21%). Il est intéressant de voir que plus de gens recherchent Warren dans des États démocratiques, républicains et swing, même si Biden est en tête.

Il serait intéressant d’effectuer cette analyse dans tous les États américains pour voir si Warren est toujours en tête.

Enfin, pour rendre ce code facile à réutiliser, nous pouvons le résumer dans une fonction:

importer matplotlib.pyplot en tant que plt
importer seaborn as sns
importer des pandas en tant que pd
à partir de pytrends.request import TrendReq
def get_searchs (candidat, état):
pytrends = TrendReq (hl = 'en-US', tz = 360)
pytrends.build_payload ([candidate], cat = 0, timeframe = '2019-01-01 2019-10-31', gprop = '', geo = 'US - {}'. format (état))
df = pytrends.interest_over_time ()

print (df.head ())

sns.set ()
df['timestamp'] = pd.to_datetime (df.index)
sns.lineplot (df['timestamp'], df[candidate])

plt.title ("Recherches normalisées pour Biden, Warren et Sanders au format {}". format (état))
plt.ylabel ("Nombre de recherches")
plt.xlabel ("Date")

et, par exemple, nous pouvons appeler la fonction pour effectuer des recherches dans le Massachusetts, comme suit:

get_searches ('Biden', 'MA')
get_searches ('Sanders', 'MA')
get_searches ('Warren', 'MA')

Et nous obtenons l'intrigue suivante:

Biden (bleu), Sanders (orange), Warren (vert)

Merci pour la lecture. Le code de cet article est disponible sur GitHub.

Afficher plus

SupportIvy

SupportIvy.com : Un lieu pour partager le savoir et mieux comprendre le monde. Meilleure plate-forme de support gratuit pour vous, Documentation &Tutoriels par les experts.

Articles similaires

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Bouton retour en haut de la page
Fermer