Technologie

Quel est le Bootcamp Data Science qui vous convient? – Vers la science des données

Quel est le Bootcamp Data Science qui vous convient? - Vers la science des données


Photo par NESA par Makers sur Unsplash

Si vous envisagez d'assister à un camp d'entraînement en science des données mais que vous n'avez aucune expérience en science des données, vous ne pourrez probablement pas faire la part des choses.

Vous ne saurez pas lesquels se concentrent sur les bonnes choses, les choses inutiles, les choses étranges dans les cas extrêmes. Et plus important encore, vous ne saurez pas lesquels vous donneront vraiment l’opportunité de décrocher ce travail de rêve.

Je suis dans la science des données depuis environ une décennie. J’ai travaillé sur toutes sortes de projets de science des données avec toutes sortes de collègues. Certains avaient assisté à des bootcamps, certains avaient un doctorat, d'autres étaient des ingénieurs en logiciel d'abord et certains n'avaient aucune expérience préalable.

Chaque jour, je vois de nouvelles questions sur Quora posées par des personnes cherchant des opinions objectives sur ces programmes de bootcamp.

J’ai donc commencé à compiler cet article - une analyse approfondie de tous les camps d’information (bien connus) que je peux trouver.

Voici les bootcamps sur lesquels j’ai écrit ci-dessous (cet article est long, vous devriez utiliser CTRL + F si vous êtes intéressé par un cours particulier):

  • Bootcamp immersif en science de l'information en personne de l'Assemblée générale
  • Le camp d’initiation aux données en personne de l’école Flatiron
  • Le bootcamp de formation en entreprise du Data Science Dojo
  • Bootcamp d'analyse de données en personne d'Ironhack
  • Bootcamp Data Science en ligne de Springboard
  • Le bootcamp flexible de data science de Thinkful
  • Diplôme de Brainstation Data Science

Si vous souhaitez connaître mon opinion générale sur les bootcamps Data Science et lesquels sont les meilleurs, faites défiler l'écran jusqu'en bas.

Qui devrait assister à un bootcamp de science des données?

Avant de passer aux examens, il sera bon de préparer le terrain et d’expliquer ce qu’est un bootcamp de science des données et à qui ils sont destinés.

Les stages de formation en science des données sont des formations rapides qui visent à amener les personnes non qualifiées en science des données à un point où elles peuvent apporter une contribution significative à un projet.

Ces cours associent généralement des présentations de type conférence à des défis pratiques en matière de codage et comportent le plus souvent une sorte de projet de synthèse (ou module de focus sur le portfolio) et des conseils d’entrevue.

Je vais le dire dès le départ - de par leur nature, ces camps d’essais ne fournissent pas tout ce dont on a besoin pour devenir un «expert» en données. Ils se focalisent nécessairement sur les aspects techniques et pratiques du rôle et n'enseignent pas les affaires, ne développent pas d'expertise, ne se vendent pas, ne gèrent pas les autres, etc.

Ces camps d'entraînement se situent quelque part entre une classe d'un semestre et une formation technique industrielle. C'est problématique pour deux raisons.

La première est que les cours de niveau collégial ne sont pas isolés, ils sont renforcés par une gamme d’expériences (et d’autres cours) qui permettent d’acquérir des compétences en dehors d’un domaine technique restreint. Cela aide les étudiants à voir la grande image.

Deuxièmement, la formation technique industrielle est généralement dispensée en interne à des personnes qui connaissent très bien leur entreprise et leur rôle. Ils savent comment ils vont mettre en œuvre les nouvelles compétences dans leur travail et ils sauront ce qui profitera à leur entreprise.

En résumé, les camps de formation en science des données constituent un excellent moyen d’acquérir des compétences techniques isolées dans une discipline qui pourrait être très difficile à percer. Si vous souhaitez acquérir ces compétences techniques et préférez apprendre en personne, elles constituent un excellent choix. Soyez simplement conscient de ce qu’elles n’enseignent pas.

Avertissements

  1. Je ne travaille pour aucune de ces organisations et je n’ai suivi aucune de ces formations. J'utilise mon expérience en tant que data scientist, consultant et coach pour examiner ces programmes.
  2. La commande a été déterminée par le classement de recherche de cours sur Google et n’est pas indicative de la qualité.
  3. Je vais juger ces programmes sur leur contenu technique (bien sûr) mais aussi sur la manière dont ils préparent leurs étudiants au monde du travail.
  4. Aujourd'hui, mon travail consiste à aider les scientifiques de données à progresser dans leur carrière. C’est dans mon intérêt de dire que ces camps d’entraînement ne préparent pas leurs étudiants à la profession. Je vais faire de mon mieux pour reconnaître cela et examiner ces choses honnêtement.
  5. Si j'ai raté un camp d'entraînement auquel vous êtes vraiment intéressé, envoyez-moi un message. De même, si vous avez déjà assisté à un bootcamp ou à un autre et que vous avez l’impression que j’ai donné une critique inexacte, faites-le-moi savoir.

Après tout cela, commençons.

Le camp de formation immersif Data Science de l'Assemblée générale

C’est le lien avec le cours de l’Assemblée générale.

Ce cours de 12 semaines coûte 10 000 £.

Comme beaucoup d’autres cours de cette liste, le programme immersif de l’Assemblée générale explique ouvertement à quel point il est axé sur la réussite de votre carrière.

Ils promettent de vous aider à optimiser votre CV et à afficher vos compétences lors d'événements de réseautage.

Le cours dure de 9 h 30 à 17 h (après quoi des activités facultatives telles que les groupes de réflexion). Chaque jour comprend une conférence de 2,5 heures, une session de codage de 3 heures et une autre conférence d’une heure.

Unité 1: Principes fondamentaux

Cette unité couvre l'utilisation de Python (et NumPy), d'UNIX (commandes), de git, du calcul de statistiques descriptives et de la visualisation de données avec Matplotlib et Seaborn.

Le projet de cette unité (il y en a une pour chacune des 5 unités) répond à des questions en utilisant NumPy - ce n’est pas vraiment un élément du portefeuille.

Examen de l'unité

Correctement ou incorrectement, je suppose que chacune des 5 unités de ce bootcamp prend le même temps. Si tel est le cas, chaque unité prend environ 2,4 semaines, soit 10 jours.

10 jours, cela semble être une longue période de travail avec ce genre de choses, mais je peux voir l'intérêt d'introduire des outils comme git et UNIX lentement et à maintes reprises, après tout, les informaticiens les utilisent tous les jours. Il est donc important de les corriger dès le début.

Dans le programme détaillé, auquel je devais leur donner mon adresse électronique et mon numéro de téléphone pour pouvoir accéder, ils n'indiquent pas ce qui est couvert dans la section des statistiques descriptives de l'unité 1. J'imagine que cela couvre des choses telles que le calcul des moyennes et des médianes. et l'intervalle interquartile. J'espère que cela ira aussi loin que l'asymétrie, kurtosis, et que certaines descriptions des différentes distributions de probabilité sont décrites, mais je ne retiens pas mon souffle.

En résumé, il s’agit d’une unité d’introduction du type que j’imaginais, qui met beaucoup l’accent sur la syntaxe et moins sur les idées, les mathématiques et les statistiques.

Unité 2: Analyse exploratoire des données

Cette unité est un peu confuse. D'une part, il enseigne certains concepts statistiques tels que les valeurs p et les intervalles de confiance. De l'autre, il apprend au Web scraping et aux Pandas à rechercher et à nettoyer les jeux de données.

Le projet de cette unité consiste à nettoyer et à analyser des données en désordre (probablement celles que vous avez extraites du Web).

Examen de l'unité

Pour moi, l'analyse exploratoire de données signifie créer des graphiques. Je pense donc que cette unité porte un mauvais nom, mais ce n’est pas si grave.

La chose importante à mentionner est le temps écoulé (à la fin de cette unité, vous serez à la semaine 6 du bootcamp). Cela semble être une progression assez lente. Alors que git et UNIX sont des compétences essentielles au quotidien, je ne suis pas sûr que le nettoyage de sites Web ait besoin d’une telle priorité.

J'ai le sentiment que combiner de nombreuses informations syntaxiques sur les pandas avec des idées statistiques de haut niveau n'est peut-être pas le meilleur moyen de garantir que les étudiants conserveront les sujets les plus intéressants. En fait, il semble que les idées statistiques soient introduites sous forme de fonctions et de méthodes dans SciPy plutôt que d'un point de vue mathématique (ou conceptuel).

Unité 3: Modélisation statistique classique

Cette unité couvre la régression linéaire et logistique, la descente de gradient, la sélection de caractéristiques et l'algorithme k-plus proches voisins.

Le projet applique ces compétences à un ensemble de données nettoyé qui est remis aux étudiants par le personnel.

Examen de l'unité

Nous obtenons la première mention des mathématiques dans cette ventilation d'unité. Mais il est trop tard - il est présenté dans le cadre de la conférence sur la descente de gradient. J'espère que l'idée de trouver la pente idéale dans une équation linéaire simple à l'aide de la covariance et de la variance est décrite (car il s'agit d'un excellent aperçu), mais j'en doute.

La plupart des choses ici encore indiquent les bibliothèques et la syntaxe qui seront utilisées.

La chose la plus étrange à propos de ce module est le fait que les étudiants travaillent sur un jeu de données nettoyé alors qu'ils viennent de passer plus de 5 semaines à apprendre à récupérer et nettoyer les données eux-mêmes.

Cela signifie que le résultat à la fin de ce projet est probablement une application simple de techniques de base à des problèmes déjà résolus. Pas génial pour un morceau de portefeuille.

Unité 4: Modèles d'apprentissage automatique

Dans cette unité, vous aborderez la mise en cluster, les méthodes d'ensemble, la PNL, l'algorithme naïf de Bayes, l'architecture Hadoop et MapReduce et l'analyse des séries chronologiques.

Dans le projet, vous appliquerez ces techniques aux ensembles de données que vous avez trouvés (ou grattés) par vous-même.

Examen de l'unité

Je pense que je vais avoir du whiplash! 7 semaines d'inclinaison lente suivies de 2 semaines et un peu de course technique après technique.

La disposition de cette unité semble problématique. Il commence par un regroupement pour le comparer aux méthodes de classification, puis revient aux algorithmes de classification (ensachage et renforcement), puis passe à la PNL et à Bayes naïfs (qui sont probablement dans le bon ordre), puis à MapReduce (qui est vraiment utile pour les tâches liées au texte) avant de finir dans l’analyse de séries chronologiques.

Le modèle ARIMA est complexe, certainement. Mais je pense qu’il devrait être introduit beaucoup plus tôt (les entreprises tiennent vraiment aux prévisions). Quoi qu’il en soit, il n’appartient absolument pas à un module axé sur l’apprentissage automatique.

Chacune de ces choses est si différente à la surface qu’il n’ya aucune attention particulière à chacune d’elles et à la manière dont elles varient.

Là encore, cette unité semble commettre l’erreur de mélanger des idées conceptuelles avec des idées syntaxiques et il semble que Hadoop ait été intégré à ce module.

Unité 5: Sujets avancés et tendances

Le dernier module couvre les systèmes de recommandation, les bases du réseau de neurones, les bandits multi-bras et se concentre ensuite sur la préparation du portfolio et des entretiens.

Le projet de l'unité demande aux étudiants de faire une présentation publique de la façon dont ils ont utilisé toutes les techniques du bootcamp pour analyser un ensemble de données qu'ils ont trouvé ou effacé.

Examen de l'unité

L'unité commence avec les réseaux de neurones et la rétropropagation. Cela ne dit pas si des éléments tels que l’abandon, la régularisation, la transformation de données ou le réglage hyper-paramètres sont également couverts, mais j’imagine qu’un apprentissage approfondi ne mérite probablement pas son propre bootcamp.

Il semble également que les réseaux récurrents et convolutifs ne soient pas couverts.

La section relative au système de recommandation indique que les étudiants apprendront à créer un moteur de recommandation de base, ce qui, je suppose, signifie uniquement que l'apprentissage en profondeur n'est pas impliqué et que les transformations matricielles et les distances euclidiennes sont utilisées. C'est un peu un mélange étrange.

Enfin, nous abordons les problèmes liés au travail.

Il indique que les coachs de carrière vous aideront à peaufiner votre portefeuille qui, à ce que je sache, ne contient que 1 ou 2 projets uniques.

Vous terminez en passant par des entretiens techniques pratiques (ce qui est très utile).

Examen de l’Assemblée Générale

Bien que ce bootcamp puisse parcourir un grand nombre de sujets, il est bénéfique de les connaître.

Je pense que les premiers modules prennent moins de temps que les deux derniers (et j’espère avoir raison), ce qui aide à équilibrer un peu les choses.

Les plus gros problèmes avec ce bootcamp sont:

  • Les rares occasions de construire un portefeuille différent de celui des autres.
  • Introduction de la syntaxe des sujets clés en premier lieu au lieu d’idée en premier.
  • L’approche lourde de la fin pour préparer les étudiants aux entretiens.

Si vous voulez prendre ce bootcamp, je vous suggère:

  • En dehors du cours, prenez le temps de faire des projets qui vous intéressent.
  • Lisez les idées derrière la syntaxe (et n'ayez pas peur de demander pourquoi quand votre instructeur vous dit quelque chose).
  • Demander à votre famille et à vos amis de vous donner une fausse interview (cela vous aiderait vraiment à expliquer ce que vous venez d'apprendre à faire en termes simples).

Le camp d'entraînement Data Science de l'école Flatiron

Ceci est le lien vers le bootcamp Flatiron.

Ce cours de 15 semaines coûte 12 500 £.

Ce bootcamp de science des données se présente comme le cours le plus complet.

À l’instar du camp d’entraînement de l’Association, l’accent est mis sur le développement de carrière et Flatiron propose également des conseils de carrière individuels et des entretiens pratiques.

Le cours de Flatiron dure 50 heures par semaine, soit 10 heures par jour, tous les jours, de 9 à 7 heures.

Module A: Analyse de données exploratoires et statistiques descriptives

Ce module couvre les bases de Python, NumPy, Pandas et SQL. Il inclut également Matplotlib et une explication de la régression linéaire.

Les projets de ce bootcamp semblent tous être à la fin du cours dans leur propre module - Module E.

Examen du module

Ce module de 3 semaines est à peu près suffisant pour couvrir les sujets nécessaires. Je suis heureux que cela couvre SQL, quelque chose qui a été omis par l’Assemblée générale, mais cela n’inclut rien sur les commandes UNIX git ou de base.

On ne voit pas clairement comment vous êtes initié à la régression linéaire. Peut-être (bien que ce soit un voeu pieux) vous apprennez-vous l’équation normale et vous calculez la droite de meilleur ajustement à l’aide de transformations matricielles dans NumPy.

Ce module semble être une bonne introduction aux compétences techniques dont vous aurez besoin dans le reste du cours, mais le manque de formation git est un peu déconcertant.

Module B: Extraction de données avancée et analyse statistique

Dans ce module, vous apprendrez la descente de gradient telle qu’elle s’applique à la régression linéaire, ainsi que le théorème de Bayes (je me demande s’ils enseignent la méthode du maximum de vraisemblance de la régression?).

Après cela, vous étudiez le langage XML (de toutes choses) et JSON, effectuez des opérations de raclage Web et apprenez-en davantage sur la conception d'expériences pour le test A / B d'un site Web.

Examen du module

C’est juste moi ou est-ce que Advanced Data Retrieval vous donne l’impression que vous allez plonger dans l’océan à la recherche de la boîte noire d’un avion perdu?

J'aime le fait que ce camp d'entraînement présente Bayes si tôt. Cependant, encore une fois, je crains que les idées ne soient perdues si les étudiants découvraient XPath et interrogeaient des chaînes JSON.

Le projet de ce module, qui consiste à tester un site Web sur A / B, n’est pas tout à fait de la science des données, mais c’est une chose utile à faire et à avoir dans un portefeuille (s’il est bien fait).

Module C: Modèles d'apprentissage automatique

Dans ce module (toutes les trois semaines), vous en apprendrez sur la régression logistique, la machine de vecteurs de support et les arbres de décision, la réduction de la dimensionnalité (et l'analyse en composantes principales), le clustering k-means et la modélisation des séries chronologiques.

Examen du module

Un thème se développe ici. Flatiron et l’Assemblée générale mettent beaucoup de temps à introduire une régression linéaire, puis à se précipiter à travers autant d’algorithmes différents que possible.

En raison de la structure du cours, nous savons que Flatiron enseigne la modélisation par régression logistique, SVM, PCA, XGBoost, k-moyennes et chronologiques à la même vitesse qu’elles couvrent la régression linéaire et la statistique bayésienne. Il n’est pas possible qu’ils expliquent ces techniques avec suffisamment de détails.

En outre, il ne semble pas y avoir de possibilité d'utiliser ces différentes techniques dans des projets au fur et à mesure. Le programme mentionne bien que chaque jour vous ferez de la programmation en couple (un choix étrange pour la science des données), mais il n’est pas clair si ce ne sont que des examens / ensembles de problèmes plutôt que des projets réels.

Module D: Sujets avancés, Big Data et Deep Learning

Dans ce module, vous apprendrez les expressions régulières (!?), PySpark, les réseaux de neurones profonds, les réseaux de neurones à convolution et les réseaux de neurones récurrents.

Examen du module

L'inclusion de l'expression régulière ici est directement liée au fait que le cours ne présente pas les compétences UNIX comme le fait le cours de l'Assemblée générale.

Pour l’essentiel, je suis d’accord avec le rythme et le calendrier de ce module. Cependant, l'inclusion de réseaux convolutionnels est un peu surprenante, car tout le reste du module concerne les données textuelles (y compris les réseaux neuronaux récurrents).

Étant donné qu’ils couvrent un grand nombre de sujets avancés et que ce qu’ils ont enseigné aux étudiants avant ce module, j’ai du mal à voir comment les gens peuvent réellement faire le saut pour bien comprendre l’apprentissage en profondeur.

Module E: Projet de science des données avancées

Les trois dernières semaines du bootcamp sont consacrées à un projet de paires (Flatiron aime beaucoup la programmation par paires). Vous proposez à votre instructeur plusieurs projets sur lesquels vous aimeriez travailler et l’instructeur en choisit un.

Examen du module

OK, alors finalement, il y a quelque chose à faire qui peut aller dans votre portefeuille. Je ne suis pas sûr de l’aspect jumelé (il est difficile de diviser le travail de manière égale entre deux personnes), mais au moins, il reste assez de temps pour terminer le projet.

Comme cela vient juste après le module sur l’apprentissage en profondeur, je ne serais pas surpris si une très grande proportion de ces projets étaient liés à l’apprentissage en profondeur.

Mais cela pose un problème: les entreprises aiment les résultats qu’elles peuvent comprendre.

Examen du Bootcamp de l'école Flatiron

Ce bootcamp a commencé fort et au bon rythme. L’inclusion de SQL est très bonne, mais cela ne devrait pas se faire aux dépens des commandes git et UNIX.

Le parcours de Flatiron, comme celui de GA, est très serré au milieu. Connaître la régression linéaire et la descente de gradient en profondeur n’est pas suffisant; ils ne doivent pas simplement accumuler les algorithmes sans une explication suffisante.

L'apprentissage en profondeur est très populaire, mais je me demande s'il devrait être enseigné juste avant les projets. Dans la plupart des tâches quotidiennes, les scientifiques de données construisent des modèles beaucoup plus simples et un bon portefeuille devrait en tenir compte.

Les plus gros problèmes avec ce bootcamp sont:

  • Très peu de mention des projets et une dépendance excessive à la programmation en binôme (personne ne veut obliger une autre personne à suivre le cours).
  • Il n’ya rien dans les modules qui parle de ce dont les entreprises ont besoin dans le domaine des données, et le coaching de carrière semble être un peu plus lâche que celui de GA où il a été intégré à la fin du cours.
  • Je ne suis pas convaincu que le portefeuille qui vous resterait après ce cours vous aiderait vraiment à trouver un emploi.

Si vous voulez prendre ce bootcamp, je vous suggérerais:

  • Passez à travers tout par vous-même après la fin du cours. Ne présumez pas que votre partenaire sait ce qu’il fait.
  • Étendez le milieu en examinant tous ces différents algorithmes jusqu'à ce que vous compreniez dans quels cas ils fonctionnent et pourquoi.
  • Posez beaucoup de questions aux instructeurs sur les applications de ce que vous apprenez à de vrais problèmes d’affaires, afin de vous permettre de vous constituer un portfolio en dehors du cours.

Le Bootcamp Data Science Dojo

Ceci est le lien vers le cours Data Science Dojo.

La section sur le bootcamp de ce cours dure 5 jours et coûte un montant inconnu (si vous le savez, je vous serais reconnaissant de me le dire.)

Je ne considérerais pas que l’offre du Data Science Dojo soit un camp d’entraînement au sens traditionnel du terme. Il s’agit plus d’un programme de formation industrielle visant à améliorer les compétences des employés au sein d’une entreprise.

Ils répertorient des entreprises très impressionnantes en tant que clients passés, notamment Apple, Google, Amazon et Microsoft, et ont de très bonnes critiques.

Malheureusement, je ne peux pas approfondir le programme et je ne peux pas en trouver un.

Quoi qu’il en soit, je pense qu’il est prudent de dire que ce n’est pas votre camp d’entraînement informatique de base et que si vous souhaitez changer de carrière, vous pouvez envisager un programme différent.

Le Bootcamp d'Ironhack Data Analytics

Ceci est le lien vers le cours Ironhack Data Analytics.

Ce cours de 9 semaines coûte 7 000 euros (disponible en Europe et aux États-Unis).

Il s’appelle un bootcamp d’analyse de données mais couvre la plupart du même matériel que les autres cours, il est donc logique de l’inclure ici.

Les changeurs de carrière constituent le principal marché des camps d'entraînement Ironhack. Leur site Web de marketing est conçu pour ceux qui souhaitent changer de travail et ils semblent offrir un soutien continu à leur carrière une fois le cours terminé, ce qui est agréable.

Le cours dure de 9h à 18h (avec des soirées facultatives).

Prework

Faire en sorte que les étudiants améliorent leurs compétences fondamentales avant le cours ne peut que contribuer à faire en sorte que le temps passé en classe soit bien utilisé. Le composant de travail préliminaire couvre SQL, git, Python et les statistiques descriptives. Il s’agit donc d’un bon mélange entre les cours de l’Assemblée générale et ceux de Flatiron School. De plus, vous n’avez pas à apprendre ces choses en personne (elles sont livrées en ligne), ce qui vous permet d’économiser de l’argent.

Module 1: Introduction à l'analyse de données et à l'ingénierie de données

Dans le premier module de 3 semaines, vous répétez les travaux préliminaires en en apprenant plus sur git et MySQL. Vous commencerez également à explorer les pandas pour des conflits de données et à vous habituer à travailler avec des API.

Il n’est pas fait mention d’un projet pour ce module dans leur syllabus.

Examen du module

Hélas, la promesse faite à tous de maîtriser les bases le premier jour du cours n’était pas vraie.

Je serais ennuyé si je suivais 60 heures de vidéo en ligne (c’est tout ce qu’ils prétendent avoir dans le paquet de travail préparatoire) et que je me rendais ensuite en classe pour découvrir que j’en revenais.

Ce sont des compétences importantes, mais pourquoi faire en sorte que tout le monde fasse cet effort pour couvrir à nouveau les choses?

Un autre problème avec ce premier module est que tout est syntaxe. Je ne vois rien de ce qui concerne les statistiques dans le programme, ce qui est une préoccupation, car l’offre d’Ironhack est la plus courte des camps de démarrage en personne.

Module 2: Analyse de données avancée (une analyse approfondie)

Au cours de ce module de trois semaines, vous apprendrez à utiliser Python pour les statistiques inférentielles, vous travaillerez davantage dans Pandas, à vous familiariser avec Matplotlib et à tous les types de graphiques que vous pouvez créer avec ce dernier, puis commencez à "raconter des histoires" avec des données.

Examen du module

D'accord, le programme de ce module réitère le fait qu'il s'agit d'un bootcamp d'analyse de données plutôt que d'un bootcamp de données.

Au bout de six semaines, vous n’êtes pas allé très loin en termes de capacités prédictives (il n’ya pas eu de prévision ni de régression linéaire).

Etant donné que les étudiants étaient supposés se familiariser avec les statistiques descriptives avant le début du cours, le fait de laisser des statistiques inférentielles jusqu'aux semaines 4 à 6 rend ce cours très lent.

Module 3: Ingénierie de données avancée (Principes de base de l'apprentissage automatique)

Ces gars sont juste des mots-clés qui remplissent leurs titres de modules.

Dans ce module, vous apprendrez à propos de l'apprentissage supervisé par rapport à l'apprentissage non supervisé, obtenez une introduction détaillée à scikit-learn et développez quelques fonctionnalités.

Encore une fois, il n’ya pas de mention de projet ici même s’il s’agit du dernier module!

Examen du module

Le nom de ce module est tout simplement faux. Mais il y a des choses que j'aime dans cette partie du cours.

Pour sa part, Ironhack n’a pas pris le train de l’apprentissage en profondeur. Deuxièmement, ils terminent le bootcamp par 3 semaines d'exploration des algorithmes que les scientifiques de données utilisent réellement tous les jours.

A l’instar du camp d’initiation à la science des données de Flatiron School, il n’ya pas de mention explicite de l’orientation professionnelle dans le programme même du cours; je ne sais donc pas comment cela fonctionne ni quand il est dispensé.

Critique du Bootcamp d'Ironhack Data Analytics

Pour quelque chose de si centré sur la création de valeur pour les changeurs de carrière, le programme contient un manque d’informations remarquable sur la manière dont ils vous aident à changer de carrière.

Ironhack ne prétend pas vous enseigner l’intuition mathématique approfondie de la science des données (comme le font les autres) et je n’ai donc pas un si gros problème avec leurs omissions ici.

Les plus gros problèmes avec ce bootcamp sont:

  • Je ne trouve rien au sujet des projets dans leur programme. Si vous ne sortez pas un portefeuille du bootcamp, à quoi ça sert?
  • Revoir tout ce qui précède les travaux préparatoires me dérangerait énormément.
  • Ils ne décomposent pas les algorithmes précis que vous apprenez et je ne peux donc que supposer qu’ils s’arrêtent aux plus courants. Ce qui est bien, mais signifie qu'ils couvrent moins que leurs concurrents.

Si vous allez assister au bootcamp Ironhack, je vous suggère:

  • Écrémer les travaux préliminaires. Ne faites pas tout, pour votre santé mentale.
  • En utilisant les compétences que vous avez acquises pendant le cours, vous pourrez créer un portfolio pour vous-même le soir.

Le Bootcamp Data Science Online de Springboard

Ceci est le lien vers le cours de tremplin.

Ce cours dure 6 mois et coûte 7 500 dollars (mais vous ne payez que lorsque vous trouvez un emploi).

Ce bootcamp propose des appels hebdomadaires 1: 1 avec un mentor, utilise les cours en ligne de DataCamp pour vous enseigner les compétences techniques et comprend 14 projets (!)

Springboard offre plus de 500 heures de matériel en ligne sur lequel vous pouvez apprendre et les modules individuels sont extraits de la bibliothèque DataCamp.

Je ne vais pas détailler chaque module, car ils ne sont pas livrés en personne. Cela signifie que vous pouvez les regarder encore et encore et que vous pouvez faire référence à des sources extérieures si vous avez des problèmes avec l'un ou l'autre des sujets.

Une fois que vous avez maîtrisé les compétences de base, vous devez choisir une spécialité, ce qui est un très bon moyen de gérer les choses au lieu de confondre les étudiants avec des techniques issues de nombreux domaines de niche différents.

Dans l’ensemble, je pense que ce cours est assez coûteux (ce qui est atténué par le fait que vous ne payez que lorsque vous occupez un emploi), mais l’une des meilleures offres.

Springboard montre que certaines des meilleures formations sont fournies en ligne. La vraie question est de savoir si la qualification représente autant qu'un cours en personne lorsqu'il s'agit de rechercher ce deuxième, troisième ou quatrième emploi.

Les projets sont un problème potentiel. Je ne trouve pas ce qu’il en est, mais imaginez que certaines ne soient pas des pièces du portefeuille. Et ainsi, toute personne prenant ce cours devrait être consciente du fait qu’elle devrait toujours chercher des occasions de réaliser des projets par elle-même.

Le Bootcamp de Data Science flexible et réfléchi

Ceci est le lien vers le cours Thinkful.

Très similaire à l'offre de Springboard, le programme Thinkful est également en ligne, prend également 6 mois et coûte presque le même montant, soit 7 990 $.

Thinkful offre une garantie d’emploi, qui, à mon avis, est identique à celle de Springboard, en ce sens que vous ne paierez pas le cours si vous ne réussissez pas à obtenir un poste.

J'ai saisi mon adresse e-mail pour mettre la main sur le programme, mais je n'ai rien reçu de détaillé. Il semble être à peu près le même que les autres bootcamps de cette liste, passant par SQL, pandas, matplotlib. Nous aborderons ensuite la régression linéaire, l’apprentissage supervisé, l’apprentissage non supervisé et l’achèvement sur des spécialisations très similaires à celles de Springboard.

Le mentorat 1: 1 est également offert à Thinkful, mais au lieu d'appels une fois par semaine, ils offrent deux appels par semaine avec votre mentor assigné.

Comme avec Springboard, il n’est pas clair si l’objectif du mentor est de vous aider à trouver un emploi ou à terminer le cours (probablement ce dernier).

Il n’ya pas de nombre spécifique de projets mentionnés sur le site Web du cours et je ne suis pas sûr de savoir qui fournit leur contenu éducatif (c’est probablement créé en interne).

Là encore, la question est de savoir si ce cours aura un impact positif sur les employeurs (après le premier emploi qui satisfait à la garantie) et que c’est plus cher que le cours Springboard, je dois dire que celui-ci semble également trop cher.

Si vous souhaitez participer au bootcamp Thinkful Data Science flexible, utilisez bien votre temps de mentorat pour expliquer l’évolution de votre recherche d’emploi et utilisez votre temps libre pour renforcer votre portefeuille avec les compétences acquises pendant le cours.

Le diplôme de Brainstation Data Science

C'est le lien vers le cours Brainstation.

Ce programme dure 12 semaines et, malgré tous mes efforts, je n’ai trouvé aucun prix.

Brainstation déclare que ce camp de démarrage est axé sur un projet et qu’il vous restera à la fin un élément majeur du portefeuille.

Apparemment, le processus de candidature peut prendre entre 4 et 6 semaines.

Le programme comprend des entretiens simulés avec l’aide d’après-graduation.

Unité 1: Collecte des données stockées

Dans cette unité, vous en apprendrez plus sur Excel (!) Et SQL.

Examen de l'unité

J’ai très peu de choses à faire ici, Brainstation semble garder leurs prix et leur programme plus étroitement que les autres (j’aimerais bien savoir pourquoi).

Que Excel soit couvert est unique et surprenant. Les scientifiques de données utilisent souvent des feuilles de calcul dans le cadre de leurs flux de travail, mais pas dans la mesure où 2 semaines de formation les utilisant en valent la peine.

Inclure la formation SQL est utile mais n’est peut-être pas la meilleure façon de passer les deux premières semaines d’un prétendu cours de science des données.

Unité 2: Analyse des données

L’unité d’analyse des données couvre Python, la modélisation statistique et ce que l’on appelle l’analyse visuelle (création de graphiques, je pense).

Examen de l'unité

Une progression apparemment bonne de la première unité qui vous montre comment faire des choses avec du code que vous avez déjà fait à la main dans Excel (filtrage, tri, etc.)

Cette unité comprend également des tests d'hypothèses qu'il est bon de voir.

À la fin de cette unité, vous aurez la plupart des compétences techniques d’un analyste de données (mais pas les compétences en affaires car elles n’ont pas encore été mentionnées).

Je me méfie un peu de l’approche «axée sur les projets» proclamée par Brainstation - pour l’instant, rien ne permet de différencier le portefeuille d’une personne de celui d’une autre.

Unité 3: Visualisation des données

Dans cette unité, vous apprendrez Tableau.

Examen de l'unité

Si j’écris des brèves descriptions de chaque unité, c’est que je n’ai aucune idée du contenu réel des modules.

Encore une fois, Brainstation a choisi d’inclure un produit exclusif dans son bootcamp. Je ne sais pas si apprendre Tableau après avoir passé quelques semaines avec Matplotlib est la meilleure idée. Cela éloigne également les étudiants de la «science des données» pendant deux semaines, ce qui signifie qu’ils auront plus de difficulté à relier les points lorsqu’ils reviendront faire plus de modélisation.

Unité 4: Données de modélisation

Dans l’unité 4, vous découvrirez le clustering supervisé (un nouveau) et le clustering non supervisé avec des applications dans les domaines de la finance et du commerce électronique.

Examen de l'unité

The unit description states that you’ll be using both R and Python to complete the unit which must be super confusing for students who have spent the past 6 weeks being passed around various domain specific languages (Excel, Pandas, Tableau).

From what I can see on the website it looks as though this module is where previous students have developed their portfolio pieces, which is worrying because it seems like they only get taught a handful of algorithms before this.

Unit 5: Presenting Data

In this unit you’ll learn … presentation skills, I think?

Unit review

It’s a good thing that the course includes presentation skills but 2 weeks of mock presentations sounds like my personal hell.

Hopefully there’s some career advice that’s also a part of this section.

Unit 6: Advanced Topics

In Unit 6 you’ll learn TensorFlow and Hadoop.

Unit review

Bolting this on to the end of the course seems odd to me. These topics are far more advanced and nuanced and edge-casey than anything else the students would have learned up to this point.

Brainstation’s Data Science Diploma Review

Maybe I’m just grumpy because I’ve written all of this in one sitting, or maybe it’s because I’ve received three emails from these guys with no mention of price, but I doubt that’s it.

I feel like this course relies too heavily on proprietary products, has too large gaps between the data science content, starts off too slow, and ends too abruptly.

Those are all the major problems.

If you like what you see at Brainstation, I’d suggest:

  • Doing way more projects than they set.
  • Reviewing your notes from the previous weeks during the modules on Tableau and making presentations.
  • Reading widely about the algorithms they don’t teach.
  • Choosing your favourite language and committing to mastering it.

Closing thoughts

This has been an eyeopening article to write.

I’m surprised to see that so many bootcamps claim to be about helping people make or change careers and then teach nothing about business throughout the courses (careers only really happen inside organisations).

It’s also disconcerting that so many of them blend lots of advanced and nuanced topics together without the proper prerequisites.

If I was looking to get started with data science and thought bootcamps were the way to do that, I’d start by taking a data analysis bootcamp which taught databases and SQL, git, basic stats and visualisation. And then look for a data science bootcamp which skipped those things and dedicated more time to the algorithms and why they work.

Unfortunately, it doesn’t look like many of those exist.

The online courses are both very expensive and have me rethinking whether I’m charging way too little for my own courses. But at least they delve more in to why things work than the in-person bootcamps.

Of all the bootcamps I reviewed, GA’s probably has the best syllabus, despite its problems.

In short, anyone who feels that a bootcamp is the best way for them to move forward should be ready to spend additional time and resources building a great portfolio. They should also allocate time to studying the various algorithms in-depth.

If you do choose to participate in a data science bootcamp, be sure to use up as much of the instructors’ and career coaches’ time as possible — extract all you can.

Good luck!

Show More

SupportIvy

SupportIvy.com : Un lieu pour partager le savoir et mieux comprendre le monde. Meilleure plate-forme de support gratuit pour vous, Documentation &Tutoriels par les experts.

Related Articles

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Close
Close