Technologie

Quelles données nous indique comment Airbnb est utilisé à Seattle

Quelles données nous indique comment Airbnb est utilisé à Seattle


1*US0Mh3za2hU2haF 6V5fLQ - Quelles données nous indique comment Airbnb est utilisé à Seattle

L’un des principaux défis pour les hôtes et les clients d’Airbnb consiste à déterminer le prix optimal à facturer ou à payer pour une annonce. Pouvons-nous, en tant que spécialistes des données, effectuer une analyse des listes Airbnb pour avoir un aperçu de la manière dont Airbnb est utilisé et donner quelques indications à cet égard?

Airbnb ne fournit toutefois pas de fichier de données ouvert sur lequel nous pouvons travailler. Inside Airbnb, une autre entité distincte, utilise les informations publiquement disponibles sur le site Web Airbnb pour analyser des données et fournir des filtres et des mesures clés pour nous aider à comprendre comment Airbnb est réellement utilisé dans les grandes villes du monde. Il met également les données à la disposition du public afin que nous puissions les analyser et en tirer nos propres idées.

J'ai consulté les données de 2016 Airbnb pour Seattle et effectué une analyse exploratoire pour trouver des réponses à certaines de mes questions.

L'ensemble de données contient 3 800 enregistrements de listes de différents quartiers de Seattle. Chaque enregistrement de liste contient des détails sur ses prix, les détails de son hôte, ses emplacements, ses commodités, etc. Bien qu'il y ait 92 colonnes au total, je n'en ai analysé que quelques-unes.

Ma première question était:

Quelles sont les périodes les plus achalandées de l'année lorsque vous visitez Seattle?

J'ai utilisé les données du calendrier pour tracer le pourcentage d'occupation moyen mensuel et visualiser leur variation au cours de l'année.

Les maisons Airbnb à Seattle semblent être les plus achalandées au début de l’année. Ensuite, il plonge vers la fin du mois de mars et atteint un sommet entre juillet et août.

Quand est-ce le séjour le plus cher et le moins coûteux, en moyenne, dans un listing Airbnb?

Les prix Airbnb à Seattle commencent à atteindre leur maximum vers juin, atteignant un maximum d’affaires de juillet à août. Les prix sont les moins chers de janvier à février.

En moyenne, un visiteur doit payer 35 $ de plus pour une nuit en haute saison que le prix qu’il paierait en basse saison.

Le taux d'occupation élevé en janvier semble un peu déroutant. Par simple corrélation prix / occupation, on pourrait s’attendre à ce que les mois de juillet et août soient les plus achalandés. Nous aurions besoin d'examiner des données de différentes années pour pouvoir tirer une meilleure conclusion à ce sujet.

De plus, j’ai examiné les prix sur une base hebdomadaire et constaté que les prix étaient plus élevés vers le week-end en raison de l’occupation accrue.

Quels sont les quartiers avec le plus grand nombre d'annonces?

Comme l'illustre le graphique ci-dessous, Broadway, Belltown et Wallingford sont les trois quartiers les plus populaires selon le nombre d'inscriptions.

Le nombre d'inscriptions ne fournit cependant que la moitié de la vue, car certains quartiers peuvent avoir des décomptes plus importants en raison de leur taille supérieure. Pour avoir une meilleure idée des meilleurs quartiers, nous devons examiner la densité de la liste, c’est-à-dire le degré de concentration ou d’extension des listes. Pour pouvoir explorer cela visuellement, j'ai tracé les coordonnées géographiques des listes sur une carte (reportez-vous à l'image d'en-tête dans l'article).

Selon le nombre d'inscriptions, les quartiers situés autour de Broadway et de Belltown et dans les environs semblent être ceux où se trouvent la plupart des inscriptions.

Où est-ce le séjour le plus cher et le moins cher en moyenne?

Sur la base des prix moyens, le quartier central des affaires est le plus cher et North Beacon Hill est le quartier le moins cher.

Pour mieux comprendre cela, j'ai également examiné la répartition des prix dans chacun des 25 quartiers les plus riches.

Les quartiers les plus chers ont la plupart de leurs inscriptions dans la fourchette de prix 101–200, alors que les autres ont la plupart de leurs inscriptions dans la fourchette de prix 1–100.

Broadway, qui se situe au milieu, a presque le même nombre d’inscriptions que Belltown dans la fourchette de prix 101-200. Mais cela est compensé par le nombre encore plus élevé d’inscriptions dans la fourchette de prix allant de 1 à 100.

Quelle est la relation entre la popularité d'une annonce et son prix?

J'ai utilisé le nombre d'avis fournis par les clients pour une liste afin de déterminer sa popularité. L’hypothèse étant, un plus grand nombre de commentaires correspond à une demande et à une popularité plus élevées.

Pour confirmer cela, j'ai tracé le prix moyen par rapport à la popularité moyenne des 10 quartiers les plus riches. Je n’avais pris en compte que les 10 meilleurs quartiers pour s’assurer qu’il y avait suffisamment d’échantillons d’échantillons pour chaque quartier afin de généraliser la tendance.

Il semble qu'il existe une corrélation négative entre le prix moyen et la popularité d'un quartier. En outre, il ressort clairement de la visualisation que la relation n’est pas forte, car certains quartiers ont résisté à la tendance.

Quelles propriétés des annonces peuvent être utilisées pour prévoir le prix?

Pour cela, j'ai construit un modèle prédictif, utilisant différents attributs des listes. L'idée était de construire un modèle sur les données de la liste, puis de déterminer les caractéristiques prédictives les plus importantes ayant contribué au modèle.

J'ai exclu certaines des caractéristiques dépendantes telles que les lits et les chambres pour fournir de l'espace à d'autres caractéristiques indépendantes.

J'ai utilisé 80% des données pour former le modèle et ensuite prévoir au repos 20% des données.

Voici la visualisation de la performance du modèle pour la prévision des prix. Chaque point du graphique représente une liste à partir des données de test, avec leur prix réel sur l'axe des x et leur prix prévu sur l'axe des y.

Le modèle a pu prédire de manière décente des prix inférieurs à 200, ce qui est bien, compte tenu du fait que la plupart des prix d'inscription sont inférieurs à 200. Il s'agissait également d'un modèle de base et il est encore possible d'améliorer le modèle.

Ensuite, j'ai utilisé les propriétés du modèle formé pour obtenir une liste des caractéristiques les plus importantes et leur importance relative dans la prévision d'un prix d'inscription.

Le nombre d'avis et de commodités ainsi que le score des évaluations, le nombre total d'annonces et leur adaptation semblent être les caractéristiques les plus importantes de la prévision des prix. Une autre chose à noter ici est que l'hébergement, les personnes supplémentaires, les salles de bain et les invités inclus sont tous liés à la taille du bien locatif et jouent un rôle important dans la détermination du prix d'inscription.

Le code complet pour cette analyse peut être trouvé ici.

Show More

SupportIvy

SupportIvy.com : Un lieu pour partager le savoir et mieux comprendre le monde. Meilleure plate-forme de support gratuit pour vous, Documentation &Tutoriels par les experts.

Related Articles

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Close
Close