Technologie

Entretien sur Twitter Data Scientist

Entretien sur Twitter Data Scientist


TQuestions d'entretiens chez witter Data Science

Où en êtes vous dans la distribution de la science des données - Entretien sur Twitter Data Scientist
Entretiens sur Twitter

Twitter est connu pour ses actualités et ses débats et détient le titre de SMS du monde. Créée en 2006 par Jack Dorsey, Noah Glass, Evan Williams et Biz Stone, elle s'est développée pour compter plus de 321 millions d'utilisateurs actifs par mois ainsi que 1,6 milliard de demandes de recherche chaque jour.

En plus d'être l'une des plus grandes entreprises technologiques, Twitter possède également l'un des les plus grands ensembles de données en temps réel au monde. Pour gérer de telles quantités de données, Twitter dispose d'équipes dédiées de science des données et d'analyse qui utilisent des outils avancés d'analyse et d'apprentissage automatique pour améliorer leurs produits et fonctionnalités afin de fournir un contenu plus pertinent sur leurs flux.

Le poste de data scientist sur Twitter est divisé en deux rôles des chercheurs et des données. Les rôles de Twitter en science des données sont adaptés aux équipes auxquelles ils sont affectés. Chaque rôle de science des données de Twitter est également différent les uns des autres. Les rôles de data scientist chez Twitter dépendent fortement des équipes auxquelles ils sont affectés dans des fonctionnalités ou des services spécifiques, et le rôle peut s'étendre des rôles basés sur l'analyse à la conception de modèles et à la construction de systèmes d'apprentissage automatique lourds.

Compétences requises

Comme la plupart des grandes entreprises technologiques, Twitter préfère embaucher uniquement des personnes qualifiées avec un minimum de 2 ans ou plus (5 ans et plus pour le data scientist senior) avec une certaine expérience dans l'infrastructure de données ou les systèmes backend. Ça signifie avoir une formation en ingénierie ou comprendre les systèmes de données est utile sauf si le poste est spécifique à l'analyse.

Les autres qualifications de base comprennent:

  • Baccalauréat, maîtrise ou doctorat en informatique, statistique, mathématiques, ingénierie ou autres disciplines quantitatives.
  • Expérience de travail avec / analyse de grands ensembles de données et des architectures Map Reduce comme Hadoop et d'autres projets d'exploration de données open source et d'apprentissage automatique.
  • Grande expérience de l'utilisation de langages de programmation numériques comme Python, SQL, R, Sparks ou Scalding pour l'écriture de flux de données complexes.
  • Bonne compréhension d'un ou plusieurs de ces langages de programmation orientés objet Scala, C ++ ou Java.
  • Maîtrise de l'utilisation de Tableau ou Zeppelin pour l'analyse, la modélisation et la visualisation des données.
  • Expérience dans l'application de techniques statistiques avancées pour modéliser le comportement des utilisateurs, identifier l'impact causal et l'attribution, construire et comparer les mesures.

Quels sont les types de scientifiques des données sur Twitter?

Twitter dispose d'un département de science et d'analyse des données avec des chercheurs et des scientifiques des données travaillant au sein d'un large éventail d'équipes. Que ce soit dans le une équipe d'heuristique d'application de la loi à l'échelle, une équipe de produits de consommation ou l'équipe d'accueil et d'exploration, les scientifiques des données de ces équipes utilisent les outils d'analyse et les modèles d'apprentissage automatique les plus récents et les plus avancés pour fournir des recommandations d'impact sur l'entreprise et améliorer les produits. Selon les équipes, le poste peut comprendre les éléments suivants:

  • Créez des modèles statistiques sophistiqués qui apprennent et évoluent pour diffuser des données.
  • Créez et interprétez des requêtes SQL sophistiquées pour les fonctions d'exploration de données standard et impromptues.
  • Interpréter et influencer les procédures de crowdsourcing et de calcul humain pour l'étiquetage des données.
  • Collaborez étroitement avec les équipes de produits et d'ingénierie pour créer et évaluer des feuilles de route de produits basées sur les données
Moments Twitter. Essayez d'utiliser l'application avant chaque entretien.

L'entrevue sur la science des données sur Twitter est très standardisée. Généralement, le processus d'entrevue commence par un filtrage des appels téléphoniques de recrutement basé sur le curriculum vitae. Après cela, un court entretien technique avec un responsable du recrutement, puis un écran technique avec un data scientist sur Twitter. Enfin, le dernier entretien consistera en un entretien sur place de 5 à 6 enquêteurs.

Filtrage téléphonique

L'écran initial du téléphone devrait durer de 10 à 30 minutes. On vous posera de nombreuses questions allant des compétences techniques à l'expérience passée ainsi que vos connaissances sur Twitter. Le recruteur répondra également aux questions et expliquera le fonctionnement des équipes de science des données sur Twitter tout en évaluant si votre expérience actuelle est un bon rôle pour l'équipe de Twitter.

Séance technique

Après l'entretien téléphonique initial, le prochain tour est un écran technique avec un scientifique des données. Les questions de cet entretien peuvent concerner la théorie de l'apprentissage automatique, intuition du produit avec un accent sur l'expérimentationet le codage SQL ou Python. Assurez-vous d'étudier le fonctionnement du produit Twitter et de réfléchir aux questions liées à tirer les résultats des tests expérimentaux.

Exemples de questions d'écran technique:

  • Quelles fonctionnalités utiliseriez-vous pour créer un algorithme de recommandation pour les utilisateurs de Twitter?
  • Supposons que nous souhaitons déployer un nouveau système de notification push pour voir si nous pouvons conserver plus d'utilisateurs. Comment pourrions-nous procéder?

Entretien sur place

Le processus d'entrevue sur place implique entretiens individuels avec 5 à 6 personnes (généralement des scientifiques et ingénieurs de données de Twitter) d'une durée de 45 minutes chacun. Cette interview nécessitera un codage du tableau blanc ainsi que des questions d'algorithme pouvant aller de l'apprentissage automatique aux statistiques / probabilités et aux questions basées sur le produit.

  • Statistiques et entretien probabiliste (principalement étude de cas)
  • Entretien sur l'apprentissage automatique et les systèmes de modélisation expérimentale
  • Intuition du produit (étude de cas)
  • Entretien de structures de données et / ou de conception de systèmes
  • Entretien avec un data scientist pendant le déjeuner
  • Entretien comportemental tournant principalement autour de l'expérience antérieure et de la culture

L'entretien sur place est une combinaison d'un large éventail de concepts techniques. Étudiez les questions de conception des tests expérimentaux et A / B, SQL, les questions d'apprentissage automatique et les questions de type de produit. Cela aide à pratiquer les questions d'interrogation; de préférence des questions de niveau moyen à difficile.

  • Que changeriez-vous dans l'application Twitter? Comment évalueriez-vous si le changement proposé est efficace ou non?
  • Concevez un système pour trouver les dix principaux hashtags de Twitter dans les plus récents 1 min, 10 min, 1 h.
  • Comment évalueriez-vous l'engagement des utilisateurs compte tenu de toutes les données d'analyse et de suivi de Twitter?
  • Écrivez une requête en SQL à
  • Étant donné un fichier à deux colonnes avec les codes d'utilisateur et les nombres, récupérez les utilisateurs les plus performants en fonction d'un score qui est fonction du nombre de fois qu'ils apparaissent dans le fichier et de ces nombres.
  • Étant donné une liste de tous les abonnés au format: 123, 345; 234, 678; 345, 123;… où la première colonne contient l'ID du suiveur, et la seconde est l'ID de qui est suivi, trouvez tous les suivis mutuels (paire 123, 345 dans l'exemple ci-dessus). Faites de même dans le cas où cette liste ne rentre pas dans la mémoire.
  • Si vous avez obtenu le poste sur Twitter et avez accès à toutes ses données, quel type d'analyse de données aimeriez-vous effectuer?
  • Comment pouvez-vous illustrer un système arborescent avec une requête SQL?

Intéressé par plus de questions d'entrevue Twitter avec les solutions? Consultez-nous à Interview Query.

Afficher plus

SupportIvy

SupportIvy.com : Un lieu pour partager le savoir et mieux comprendre le monde. Meilleure plate-forme de support gratuit pour vous, Documentation &Tutoriels par les experts.

Articles similaires

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Bouton retour en haut de la page
Fermer