Agenda

Soutenance de doctorat de Maxime Cornet : Travail de la donnée et données du travail : Gestion de l’incertitude et délégation des risques dans les chaînes de production de l’IA

Mercredi 19 novembre 2025 à 14h00 (heure de Paris) à Télécom Paris

Télécom Paris, 19 place Marguerite Perey F-91120 Palaiseau [y aller], amphi 2 et en visioconférence

Jury

  • Mireille Razafindrakoto, Directrice de Recherche, IRD (UMR LEDa-DIAL), Rapportrice
  • Julien Figeac, Directeur de Recherche, CNRS (CERTOP), Rapporteur
  • Catherine Comet, Professeure, Université Paris 8 (CSU – Cresppa), Examinatrice
  • Étienne Ollion, Directeur de Recherche, CNRS (CREST), Examinateur
  • Cécilia Rikap, Associate Professor, University of London (IIPP- UCL), Examinatrice
  • Antonio Casilli, Professeur, Télécom Paris (i3 – SES), Directeur de thèse
  • Paola Tubaro, Directrice de Recherche, CNRS (CREST), Co-directrice de thèse

Résumé

La numérisation croissante de nos sociétés et le développement rapide de l’intelligence artificielle (IA) entraîne une accélération de la circulation de données. La constitution des bases de données « d’entraînement » – qui peuvent comporter plusieurs centaines de milliers d’observations – est de plus très souvent externalisée auprès de prestataires de services par les entreprises technologiques, souvent dans des pays dits du Sud. De nombreux auteurs associent cette dynamique à un risque accru de « commodification » (marchandisation) du travail liée à l’invisibilisation des travailleurs des données derrière les algorithmes et à l’émergence d’un « marché mondial » de travail de la donnée.

Grâce à un terrain mené entre Paris et Antananarivo (Madagascar)...
… et mobilisant des méthodes d’analyses multiples – notamment de traitement automatique de la langue, d’analyse de réseaux sociaux – et un matériel divers – issu d’entretiens semi-directifs ; de bases de données web ; et d’un questionnaire – je montre que le travail de la donnée est encastré dans au moins trois niveaux d’inter-relations : les liens qui structurent son espace d’échange, des liens hiérarchiques inter-firmes, et les aspirations, stratégies et représentations qui font circuler les travailleurs des données. Ces trois niveaux d’encastrement sont profondément liés aux stratégies déployées par les acteurs pour garder le contrôle de leur localité de l’espace de production, et qui se traduisent par la mise en place de dynamiques d’offuscation, qui génèrent de l’incertitude en cascade. Ce manque de visibilité permet notamment aux entreprises innovantes d’invisibiliser le travail de la donnée nécessaire à la production et à la maintenance des algorithmes. Cette invisibilisation permet d’une part de maintenir un discours enchanté sur une technologie décrite comme « automatique », et d’autre part de minimiser le coût du travail qui entre dans la composition des modèles, via l’invisibilisation des travailleurs. En ré-encastrant l’IA dans ses dépendances, cette thèse participe à questionner les évolutions du travail liées au numérique, et la manière dont le secteur se construit.

Lira aussi : Le mythe de l’IA « magique » cache un travail humain colossal (La Croix)Derrière l’IA, des travailleurs précaires à Madagascar (The Conversation/La Tribune)