Newsroom

La data science au Centre de Recherches Interdisciplinaires (CRI)

Compte-rendu du séminaire industriel data science des Mastères Spécialisés Big Data et IA de Télécom Paris du jeudi 18 mars 2021 avec Jean-Marc Sevin, data scientist au CRI, diplômé du MS Big Data (2017-2018). Jean-Marc Sevin a travaillé pendant 15 ans dans le secteur du web.

Présentation du CRI

Le CRI a été fondé en 2006 et est rattaché à l’Université de Paris. C’est un établissement d’enseignement supérieur, une école postdoctorale et un centre de recherche et d’enseignement. Le CRI est spécialisé en sciences de la vie, en sciences de l’apprentissage et en sciences numériques. Selon son directeur et co-fondateur, François Taddei, l’objectif est de réinventer les manières d’apprendre, d’enseigner, de faire de la recherche. Le CRI soutient les objectifs de développement durable, via des paradigmes d’apprentissage, de recherche et d’enseignement reposant sur « le partage, le mentorat et la coopération ».

Partir des besoins du terrain pour innover

Premier constat : l’algorithme de recherche de Google est faillible, particulièrement quand deux sujets éloignés sont recherchés ensemble : la majorité des résultats portera alors sur l’un ou l’autre des deux sujets et s’oriente sur une mise en relation purement sémantique afin de les lier sans en distinguer le contexte. Le système de représentation des connaissances (voir plus bas) développé par le CRI a entre autres pour objectif de répondre à ce type de requêtes.

Second constat : on manque de cadres pour l’apprentissage. Dans le domaine médical, on dispose d’un carnet de santé puis d’un dossier médical, sans équivalent dans le domaine de l’enseignement. De ce constat est né le carnet d’apprenant.

Un exemple de projet : le carnet d’apprenant

Le carnet d’apprenant est un outil permettant de cataloguer les savoirs emmagasinés par « l’apprenant » en dehors du système scolaire classique, et notamment sur Internet (Wikipédia, MOOCs, etc.). Il compile ce qui a été appris, comment cela a été appris, et précise les prochains objectifs d’apprentissage, ainsi que le parcours à suivre pour cela. C’est en quelque sorte un GPS de l’apprentissage. Cet outil permet donc un « tracking » des apprentissages informels via les ressources en ligne. Ce système induit un changement de paradigme dans l’apprentissage : de « top-down » (Universités, centres de formations…) à « bottom-up ».

Les objectifs du carnet d’apprenant

  • Qu’est-ce que je sais ?
  • Comment je l’ai appris ?
  • Quels sont mes prochains objectifs d’apprentissage ?
  • Quel parcours d’apprentissage dois-je suivre pour y arriver ?

Exemple : Un élément du carnet

Le tracking des apprentissages se base sur une « carte des connaissances » particulière, qui est basée sur les concepts Wikipédia et est séparée en « topics ». La notion d’espace des connaissances existe depuis longtemps, mais il n’y a pas de consensus sur la méthode. La moins mauvaise serait Wikipédia, qui est bien une méthode ensembliste de l’accès aux connaissances.

Ainsi, les ressources pédagogiques utilisées sont rattachées à ces concepts Wikipédia, via de la classification multi-label. Les documents sont projetés dans l’espace des concepts, dont la dimension a été réduite via des algorithmes tels que U-Map ou T-SNE. La carte des connaissances ainsi obtenue est tout à fait visuelle. La classification étant parfois difficile, ou incomplète, une approche hybride est utilisée pour classifier au mieux les ressources pédagogiques.

Ci-dessous, une capture d’écran du widget WeLearn, qui dispose de l’option « Add Concept », permettant de mobiliser l’Intelligence Collective afin d’enrichir l’outil.

Via cette extension, il est aussi possible d’entrer en relation avec mentors et co-apprenants, ou encore de se voir recommander des projets adaptés à des objectifs d’apprentissage précis. La progression dans un domaine est quantifiée, et le niveau de compétences obtenu peut être évalué :  Curious / Basic / Competent / Expert. Enfin, des certifications académiques peuvent être recommandées à l’apprenant qui souhaite justifier de sa maîtrise sur un sujet donné.

Compte-rendu rédigé par Elliot Candale, Ernest Majdalani et Louis Rose, étudiants du Mastère Spécialisé Big Data promotion 2020-2021.

Illustration d’en-tête : site du CRI . Autres images : CRI/Jean-Marc Sevin.