FAQ Mastère Spécialisé® Big Data : gestion et analyse des données massives

Les questions / réponses sont classés en 5 thèmes. N’hésitez pas à nous contacter si vous avez des questions dont vous ne trouveriez pas la réponse ici.

Prérequis et admission

Ai-je le profil pour présenter ma candidature au Mastère Spécialisé® Big Data ?
Le Mastère Spécialisé® Big Data possède une couverture disciplinaire large, elle se veut exhaustive et englobe notamment les aspects sociétaux, juridiques et économiques. Mais il traite avant tout des questions techniques, des outils informatiques et des méthodes mathématiques. Il est donc nécessaire d’avoir des bases en mathématique, en informatique et en statistique pour pouvoir s’exprimer dans les codes de la formation. La plupart des enseignements en machine learning se font en python. Cependant, il n’est pas nécessaire d’être un expert en python en arrivant dans le Mastère Spécialisé®. Nous demandons un socle de connaissances mathématiques indispensables pour pouvoir suivre un enseignement formel.

Le Mastère Spécialisé® Big Data n’est pas un enseignement où on apprend simplement des briques technologiques qui peuvent être très vite obsolètes. Nous préférons transmettre un certain nombre de connaissances pour être capable de progresser, car c’est un champ qui évolue très vite. Avoir le langage formel avec un niveau de licence solide en mathématique, des bases en calcul numérique, probabilité, statistique et optimisation est indispensable.

La formation est progressive. Il ne s’agit pas d’attaquer dès au début du cursus les concepts avancés en mathématique ou en informatique. Le premier trimestre se focalise sur des séances de remise à niveau. Les élèves travaillent en groupe, les plus à l’aise en mathématique aident les autres.

Nous proposons un MOOC « Fondamentaux pour le Big Data » sur la plateforme France Université Numérique (FUN) qui permet d’évaluer son niveau. Si un candidat le valide, il a le niveau suffisant pour suivre la formation de Mastère Spécialisé®.

Quels sont les pré-requis ?
Il est demandé aux candidats de maîtriser suffisamment les concepts ci-dessous pour être à l’aise dans leur utilisation. Connaître ces concepts ne suffit pas, il faut pouvoir s’en servir facilement.

Mathématiques

  • Analyse : suites/séries numériques, éléments de calcul différentiel, éléments d’analyse de Fourier, d’analyse Hilbertienne
  • Algèbre : espaces vectoriels, applications linéaires, calcul matriciel, produits scalaires, formes quadratiques
  • Optimisation : multiplicateurs de Lagrange, descente de gradient
  • Statistique : expérience aléatoire, estimateur, risque, maximum de vraisemblance, moindres carrés, intervalles de confiance, tests statistiques
  • Probabilité : lois de probabilités, vecteurs aléatoires, loi/espérance conditionnelle, loi des grands nombres, théorème de la limite centrale, chaînes de Markov

Informatique

Programmation en Java

  • Concepts de base : comment définir une variable, structures de contrôle : boucles for, for each, while
  • Classes et objets : comment définir une classe, les attributs, les méthodes ; concepts de public, private, protected ; différence entre une variable ou méthode static ou normale (non-static) ; l’héritage : comment étendre une classe (extends) ; les interfaces : comment définir une interface et l’implémenter dans une classe ; le polymorphisme : comment surcharger une méthode, comprendre comment marchent les méthodes surchargées
  • Bases de la bibliothèque standard de Java : collections (ArrayList, HashMap, HashSet, etc.) ; comment insérer un item dans une liste, supprimer un item au début, à la fin, ou au milieu ; quand utiliser les collections (par exemple ArrayList versus LinkedList).
  • Comment prendre une description mathématique ou textuelle d’un algorithme et l’implémenter.

Programmation en Python

  • Maîtriser les concepts équivalents à ceux de Java ci-dessus (sauf public, private, protected et les interfaces).
  • Unix/Linux
  • Maîtriser les commandes de base.

Y a-t-il des sujets interessants à connaître pour un futur Data scientist et qui ne seront pas traités au cours du Master ?
Les cours de Télécom Paris s’étalent sur neuf mois (de fin septembre à fin juin). Aujourd’hui, Télécom Paris a une approche très exhaustive pour former quelqu’un qui deviendra un data scientist. Le savoir-faire de l’école dans le domaine du machine learning et des mathématiques appliquées est reconnu et compétitif au niveau de la recherche, en plus elle s’adjoint les services et le regard des industriels.

Télécom Paris possède aussi un incubateur. L’Ecole collabore avec des personnes compétentes, capables d’être multi facettes et multi tâches, et qui ont le pouvoir de mettre en œuvre toutes les compétences dans le domaine de la science des données, de l’acquisition des données à la production d’un service. Des éléments que l’on peut découvrir de façon très exhaustive dans la formation, qui est très dense. Il n’est pas nécessaire de prévoir d’autres sujets à aborder en parallèle de la formation.

Quels profils recherchez-vous ? Quelles sont les qualités attendues ?
Nous recherchons une certaine variété et une diversité en termes d’expérience professionnelle pour la trentaine d’étudiants formant la promotion. On peut par exemple trouver dans la promotion de cette année des étudiants qui ont une quinzaine, voire une vingtaine d’années d’expérience professionnelle et qui apportent de la valeur en termes de partage d’expérience, de recul dans la gestion de projets. Il y a aussi beaucoup d’étudiants en poursuite d’études après un Master 2.

Nous recherchons des personnes qui ont impérativement des compétences en informatique et en mathématique. Nous avons également besoin des candidats curieux, motivés, et qui ont une passion pour les données. Des personnes qui veulent comprendre comment on met en place les systèmes d’analyse et découvrir ce qui est caché dans les données. Ils doivent avoir une démarche de recherche, être capable de lire des articles scientifiques.

Enfin, beaucoup d’importance est accordée pendant l’entretien à la cohérence du projet professionnel. Il faut être capable de se projeter et d’avoir une démarche cohérente.

Je n’ai pas codé depuis longtemps, puis-je suivre ce MS?
Il est indispensable d’avoir une expérience de la programmation pour suivre ce cursus. Cependant nous ne sommes pas une école de programmation, il n’est pas obligatoire d’être un véritable développeur. Il est possible par exemple de se préparer en suivant un MOOC pour se remettre à niveau. La formation vise plutôt à comprendre dans le détail les concepts et à exploiter les briques technologiques actuelles : services Cloud, environnements pour faire de la recherche dans des bases de données peu structurées, plateformes de stockage distribué, etc.
Combien y a-t-il d’étudiants par promotion ?
Une soixantaine. Suite à l’engouement suscité par la formation les deux premières années, nous avons mis en œuvre des moyens supplémentaires afin accueillir plus d’étudiants dans de bonnes conditions d’encadrement. En effet, il y a une majorité d’enseignants-chercheurs qui interviennent dans la formation, nous ne faisons appel à des intervenants extérieurs que sur certaines matières spécifiques. Nous avons donc recruté des enseignants-chercheurs dans différentes disciplines afin de pouvoir conserver cette spécificité de la formation.
Je pense postuler au Mastère Spécialisé® Big Data, pourriez-vous regarder mon dossier pour me dire si je corresponds au profil cherché ? Est-il possible de passer un entretien avant de postuler ?
Pour postuler au Mastère Spécialisé® il faut être titulaire de l’un des diplômes suivants :

  • Diplôme d’ingénieur en informatique ou en télécommunications,
  • Master universitaire scientifique ou technique, en informatique ou en mathématiques appliquées,
  • Diplôme (bac+4) scientifique ou technique en informatique ou mathématiques appliquées et au moins 3 ans d’expérience professionnelle,
  • Diplômes étrangers de niveau équivalent à (bac+5), MSc ou MBA, en informatique ou mathématiques appliquées.

En raison du grand nombre de dossiers reçus, il ne nous est pas possible de pré-évaluer les dossiers ou de faire passer des entretiens avant le processus de recrutement. Nous vous conseillons de lire attentivement cette FAQ avant de vous décider à postuler. Vous pouvez également consulter les interviews de trois étudiants du Mastère Spécialisé® :

Interview-de-Soraya,-Mastère-spécialisé-BIG-DATA-Telecom-Paris

Interview-Denis--Mastère-spécialisé-BIG-DATA-Telecom-Paris

Interview-de-Mehdi--Mastère-spécialisé-Big-Data-Telecom-Paris

Je suis en dernière année de diplôme d’ingénieur ou de Master 2 et je n’ai pas encore d’attestation de diplôme. Dois-je la remplacer par un autre document ?
Si vous êtes en train de terminer votre dernière année de Master 2 ou d’école d’ingénieur, vous devez télécharger tous vos relevés de notes des trois dernières années, et obtenir au moins une lettre de recommandation de vos professeurs qu’ils peuvent envoyer directement à l’adresse masteres@telecom-paris.fr , en précisant votre nom et les Mastères Spécialisés auxquels vous postulez. Vous serez ensuite tenu de nous remettre votre diplôme ou attestation de réussite dans les meilleurs délais, et au plus tard le 15 décembre.
Pourquoi demander un TOEIC pour un Mastère Spécialisé® technique ?
Le TOEIC n’est pas obligatoire. Cependant, il faut avoir un niveau suffisant pour pouvoir suivre les cours dispensés en anglais, qui est la langue de la technologie et de la science, donc indispensable pour être en mesure de lire un article scientifique. Par conséquent, avoir le TOEIC est mieux ; dans le cas contraire, il faut pouvoir prouver son niveau en anglais, avec des relevés de notes par exemple.

Contenu de la formation et déroulement de l’année

Quelle est la pédagogie générale du programme ?
Elle consiste en cours magistraux pendant lesquels le professeur fait un discours en présentant un domaine et s’y ajoutent beaucoup de travaux pratiques sur toute l’année. Les salles de travaux pratiques sont bien équipées. L’IMT (Institut Mines-Télécom) s’est doté d’une plateforme, TeraLab, sur laquelle les étudiants peuvent travailler, en plus des plateformes commerciales de type Amazon Web Services.

Il y a également tous les jeudis un séminaire professionnel qui donne la possibilité aux élèves d’interagir avec des entreprises qui sont aussi des futurs recruteurs. Il permet de faire découvrir les enjeux du Big Data dans de nombreux domaines (santé, finance, énergie, marketing…). Des salons sont organisés à Télécom Paris, comme le Forum des Mastères Spécialisés au mois de mars et les élèves sont invités aux salons Big Data Paris en mars et DataJob en novembre.

Enfin les élèves peuvent interagir avec les élèves ingénieurs, avec qui ils partagent certains des cours.

Quel est l’apport économique du Mastère Spécialisé® ?
Il existe un département de Sciences économiques et sociales (SES) à Télécom Paris et en particulier une Chaire de recherche liée aux Valeurs et Politiques des Informations Personnelles, où on s’interroge sur la valorisation des données, sur les questions liées à la vie privée et aux aspects juridiques.

Nous avons trois cours supervisés par le département SES. Un cours autour des données Internet où il est question de propriété intellectuelle et de droit, un cours sur l’écosystème Big Data avec beaucoup d’intervenants extérieurs, des grands groupes comme des start-up et des institutions gouvernementales pour réfléchir à la création de valeurs à partir des données, et un cours plus spécifique sur l’économétrie du Big Data.

Il y a aussi un séminaire professionnel tous les jeudis où on fait venir des représentants de divers secteurs d’activités : la santé, la défense, l’e-commerce, la finance, l’assurance… pour partager avec les étudiants leurs expériences de gestion du Big Data. Cette partie valorisation économique est très présente dans la formation, qui reste par ailleurs très technique.

Pourquoi les séminaires du jeudi ?
C’est un séminaire qui n’est pas technique. L’idée est de donner la parole à une entreprise qui vient présenter un domaine, un enjeu du big data ou de l’IA. Cet enjeu peut être lié à des plateformes de calcul pour expliquer les différents systèmes, l’architecture de géomarketing, la cybersécurité, la défense, la finance, la santé, les nouvelles technologies, etc. C’est aussi une façon pour les entreprises de se retrouver en face de recrues potentielles.

Découvrir les résumés des derniers séminaires

Y a-t-il aussi du management dans la formation ?
Dans l’écosystème de la formation big data à Télécom Paris il y a des consultants, des Chiefs Data Officers, des personnes qui viennent expliquer ce qui est véritablement un projet, comment ça s’articule, comment on part des besoins, des contraintes pour arriver à un service ou à un produit. Il n’y a pas de cours de management, la formation en management se passe beaucoup via l’exemple, le stage et les projets. En revanche il y a des cours de droit et d’économie.
Quelle est la plue-value ou l’expertise qui différencie le Mastère Spécialisé® Big Data d’autres formations ?
Nous ne considérons pas être dans un secteur concurrentiel : pour offrir une bonne formation big data, il faut vraiment s’affranchir du carcan disciplinaire, être capable d’articuler un enseignement qui fait intervenir les mathématiques, de l’informatique, du business, de l’économie, du droit et il faut une proximité incontournable avec l’industrie.

En France, cela ne peut se faire aujourd’hui qu’au niveau d’une école d’ingénieur comme Télécom Paris et c’est là qu’est notre background et notre légitimité. L’une des particularités de Télécom Paris, c’est que ses chercheurs travaillaient déjà en étroite collaboration avec les entreprises avant l’émergence du concept du Big Data. Télécom Paris avait donc déjà une expérience et une crédibilité dans ces domaines. Il suffit de regarder par exemple la liste non exhaustive des publications de nos enseignants chercheurs sur le site de la chaire Machine Learning for Big Data.

Quelles sont les modalités d’évaluation ?
Chacun des modules est évalué individuellement, le diplôme est validé si l’on obtient suffisamment de crédits ETCS. Les modalités d’évaluation sont variées : contrôle continu, challenge, projet ou combinaisons de ces différents modes. L’évaluation vise avant tout à la vérification de la compréhension des concepts et de leur application opérationnelle.
Quel est le rythme de la formation ?
Les cours sont répartis sur 9 mois, d’octobre à juin. Les journées durent de 8h30 à 17h environ. Mais la quantité de travail personnel est très importante : on attend que chaque élève fournisse un temps de travail personnel équivalent. Il y a également des travaux de groupe qui s’étalent sur plusieurs trimestres. Un temps dans la semaine est réservé au travail personnel ou en groupe.

La période de stage (thèse professionnelles) dure ensuite entre 4 mois minimum et 6 mois, à partir du mois de juin.

Il n’est pas envisageable d’avoir une activité en parallèle du Mastère Spécialisé®, il s’agit véritablement d’une formation à temps complet. Les personnes qui ne seraient pas 100% disponibles peuvent plutôt s’orienter vers le Certificat d’études spécialisées (CES) « Data Scientist ».

Stages, projets et thèses professionnelles

Qu’est-ce que le « projet fil rouge » ?
Le « projet fil rouge » vise à faire soutenir un projet professionnel. Il est indépendant du stage de fin de cursus. C’est un projet qui se réalise en groupe (4 à 5 étudiants) et en parallèle des cours, une journée et demi de travail par semaine sur trois trimestres.

Les groupes travaillent en mode gestion de projet mais les notes sont individualisées. Ces projets sont apportés et encadrés par des entreprises et s’appuient sur une problématique concrète et des données réelles. L’objectif est de permettre aux étudiants d’aborder toutes les facettes du big data : acquisition, stockage, analyse, assortie d’une réflexion sur la propriété des données, notamment les questions de droit.

Comment se passe le stage de thèse professionnelle ?
Le stage de fin de cursus est complètement individualisé et dure 4 à 6 mois. Il vise à la rédaction d’une thèse professionnelle et peut être réalisée dans le cadre d’un CDI.
Avez-vous des exemples de thèses professionnelles ?
Elles sont en général confidentielles parce qu’elles touchent à des aspects qui sont très stratégiques pour les entreprises. Il y a eu des thèses professionnelles dans le domaine du consulting, ou très technologiques, liées à l’énergie par exemple, ou encore sur comment monter une plateforme big data, développer une solution et la mettre en web service. Il y a également des thèses qui sont plus liées à la réflexion et à l’organisation, comme construire un moteur de recommandation par exemple. C’est extrêmement varié.

Entreprises partenaires

Vous avez de grandes entreprises partenaires dans ce Mastère Spécialisé®. Que vous apportent-elles et que leur apportez-vous en retour ?
Il y a beaucoup de partenaires industriels dans le comité de perfectionnement qui gère l’organisation et la connaissance du Mastère Spécialisé®. Il faut également savoir que la recherche à Télécom Paris est financée quasiment exclusivement par des contrats. Ce sont des industriels et des mécènes qui financent les chaires de recherche sur lesquelles s’adosse cette formation : la chaire Data Science and Artificial Intelligence for Digitalized Industry and Services et la chaire Valeurs et Politiques des Informations Personnelles notamment, ainsi que les chaires d’enseignement en data et IA.

Télécom Paris apporte son savoir aux entreprises en formant des experts répondant aux besoins du marché. En retour les entreprises viennent nous parler de leur vision dans le cadre du séminaire du big data qui se tient tous les jeudis à Télécom Paris. Elles viennent expliquer comment le big data impacte l’organisation de leur DSI, les nouveaux marchés, et comment ils essayent d’anticiper les questions.

Elles peuvent intervenir aussi dans les cours en présentant des points techniques comme dans le domaine de la cybersécurité et de la biométrie. Elles peuvent mettre leurs données à disposition dans le cadre de challenges notés. Elles proposent et encadrent des sujets pour les projets fil rouge, pendant lesquels les élèves ont accès aux données réelles des entreprises. Dans le même temps, ils perçoivent les réalités du terrain. Enfin elles proposent une grande quantité de stages dans des domaines très variés.

Débouchés

Le Mastère Spécialisé® Big Data d’Entreprise est-il reconnu par les professionnels du secteur ?
Un Mastère Spécialisé® est une formation de niveau Bac+6, accessible après avoir validé un Master. Ce type de formation est agréé par la Conférence des grandes écoles . Une dizaine d’entreprises (Thales, Safran, Airbus, Orange…) sont membres du comité de perfectionnement du Mastère Spécialisé® Big Data ce qui permet que ses contenus restent toujours en adéquation avec les besoins des entreprises.

D’un point de vue notoriété, la première promotion a déjà fait ses preuves au sein d’entreprises variées (grands groupes internationaux comme start-up). Les étudiants reçoivent toutes les semaines des propositions de stage ou d’embauche.

Quels sont les secteurs qui recrutent le plus de data scientists en France aujourd’hui ?
Après leur formation, les élèves ont tellement d’offres qu’ils se permettent de choisir. Chaque semaine les entreprises nous envoient des offres de stage, de CDD ou de CDI. Evidemment le Big Data vient des grandes masses de données et son succès a d’abord été connu dans le secteur de l’internet, aussi est-ce le domaine le plus demandé. Mais aujourd’hui il y a un transfert dans tous les secteurs d’activités : énergie, transport, banque, commerce, sécurité, défense, police scientifique…
« Rejoignez le secteur le plus stratégique de l’économie numérique » ? Est-ce par cet angle que l’on accède aux postes les plus stratégiques ?
En data science, on a besoin d’un savoir-faire et de connaissances techniques au départ pour savoir ce qu’il est possible de faire. En général, les personnes qui accèdent aux postes stratégiques de management ont un background technique complètement incontournable. Aujourd’hui, les sciences et techniques de l’information et de la communication sont en train de révolutionner beaucoup de secteurs d’activités, il est donc indispensable de commencer par une formation technique pour aborder le Big Data.
Le Big Data n’est-il pas un peu « enfermant » ?
Au contraire, c’est un domaine pluridisciplinaire. Au-delà de la dynamique informatique/mathématiques, on y adjoint des compétences comme le droit et l’économie, le design avec la data visualisation, ainsi que la gestion de projet, le management… Mais il y a aussi la composante « métier » qui est très importante. Il est impossible d’être data scientist sans tenir compte de l’activité de l’entreprise, de son cœur de métier, pour avoir une action efficace et monter des projets qui tiennent la route. Le data scientist, ou chief data officer, doit pouvoir dialoguer avec toutes les composantes de l’entreprise. Il peut être acteur de l’innovation et de la stratégie. C’est donc loin d’être une discipline « enfermante ».
Quelle est l’insertion professionnelle des diplômés ?
L’insertion des diplômés est extrêmement facile. Selon la dernière enquête d’insertion, réalise entre décembre 2017 et janvier 2018 auprès de 159 répondants (5 promotions), 92% des étudiants ont trouvé un emploi facilement ou très facilement, et 76% avant même la fin de leur stage de thèse professionnelle. Certains étudiants ont même commencé directement en CDI à la place du stage et d’autres ont monté leur entreprise.
Quelle est le salaire d’un jeune data scientist ?
Selon notre dernière enquête d’insertion, 69 % des diplômés du MS Big Data ont un salaire supérieur à 50 k€ annuels (salaire brut, primes comprises). Pour les diplômés en reprise d’étude, qui ont déjà une expérience professionnelle, les salaires montent jusqu’à plus de 80 k€.