TALia, laboratoire commun avec onepoint, en intelligence artificielle sur le Traitement Automatique du Langage Naturel

Le 30 juin 2021, Télécom Paris, première grande école d’ingénieur sur le numérique, et onepoint, architecte des grandes transformations des entreprises et des acteurs publics, inauguraient TALia, un laboratoire de recherche dédié au traitement du langage naturel avec une ambition : humaniser les relations avec les machines.

TALia est un laboratoire commun qui associe les expertises métiers et scientifiques des collaborateurs de onepoint avec les capacités de recherche de Télécom Paris sur un sujet d’intérêt partagé : le Traitement Automatique du Langage Naturel. Cette discipline, également appelée TALN (ou NLP en anglais) se consacre aux interactions entre les machines et l’humain et s’attache à créer des solutions capables de comprendre le langage naturel. Les applications du TALN se retrouvent dans nos usages quotidiens : synthèse vocale, correction orthographique, prédiction des mots sur smartphone, jusqu’à l’analyse des opinions et des émotions.

Ce laboratoire axe ses travaux de recherche autour de trois enjeux fondamentaux :

  • Mettre l’Humain au centre de l’IA : le langage est le propre de l’Homme et a permis de faire civilisation. Aujourd’hui, interagir avec les machines par le langage est un défi majeur pour l’IA et porte à terme une immense ambition : humaniser nos relations avec les machines.
  • Conserver la souveraineté linguistique : l’enjeu est d’avoir l’autorité et la maîtrise des jeux de données utilisés pour entraîner les modèles de traitement automatique du langage. Conserver la souveraineté assure la maîtrise de notre chaine numérique et la défense de la langue française.
  • Transmettre des savoirs : la responsabilisation d’une société passe par celle de ses individus et par leur formation. Contribuer à la transmission d’un savoir contemporain comme celui du traitement automatique du langage permettra à Télécom Paris et onepoint d’être, à leur échelle, des acteurs de la démocratie.

Lors de son inauguration le 30 juin 2021, Tiphaine Viard et Thomas Bonald, les deux chercheurs de Télécom Paris pilotes du projet soulignent l’actualité du sujet : « Nos travaux autour du TAL trouveront des applications très concrètes, à l’heure où la régulation des réseaux sociaux s’invite à l’agenda politique, aussi bien au plan européen que national, que ce soit pour lutter contre la haine en ligne, limiter les fake news et aussi faire contrepoids au monopole des plateformes. Dès que l’on traite du langage, on touche à des enjeux de souveraineté, notamment parce que les biais linguistiques sont nombreux et l’anglais encore largement dominant, notamment sur les plateformes ».

L’ambition de ce laboratoire commun est de capitaliser sur les avancées scientifiques générées par la création de propriété intellectuelle (brevet, licences…) et le transfert de technologies, soit le passage à l’échelle des travaux de recherche réalisés sur le TAL, discipline en plein essor dont les domaines d’application intéressent d’ores et déjà les clients et partenaires de onepoint.

« Le partenariat avec Télécom Paris permettra à onepoint de développer une activité de recherche de haut niveau dans le domaine du TAL, à l’intersection des enjeux industriels et scientifiques : combinaison du Deep Learning, de la théorie des graphes, de l’IA symbolique, et de la linguistique. Nous serons ainsi en mesure de former les étudiants des filières scientifiques et techniques aux dernières avancées du TAL et d’apporter des réponses pragmatiques à nos clients soucieux de tirer parti de ces technologies émergentes, et ce dans la langue de Molière » expliquent Gontran Peubez, Partner et Pirmin Lemberger, directeur scientifique chez onepoint.

« Le laboratoire commun est une des formes les plus abouties de collaboration entre Télécom Paris et ses partenaires. Onepoint a compris que la recherche était le carburant de l’innovation et ose investir sur des temporalités longues et notamment dans la recherche » appuie Sylvain Lamblot, Directeur du Développement et des Partenariats de Télécom Paris.

Muriel Touaty, Partner éducation et innovation et Renaud Mignerey, pilote de programme R&D de l’institut onepoint, complètent : « TALia est une collaboration d’autant plus ambitieuse qu’elle est co-construite et co-dirigée par Télécom Paris et onepoint autour d’un sujet de recherche avec des ressources humaines, matérielles et budgétaires partagées. Onepoint étant déjà parrain de la promotion 2023 de Télécom Paris, TALia est l’occasion de renforcer nos liens et positionner nos activités comme trait d’union entre la recherche, l’innovation et l’éducation ».

Le laboratoire a programmé ses travaux sur un cycle de cinq ans et ambitionne d’accompagner quatre ou cinq thèses sur la thématique. Deux thèses CIFRE sont actuellement en cours avec Télécom Paris :

  • « Apprentissage de représentations de mots à partir de graphes », sous la supervision de Thomas Bonald, Matthieu Labeau (Télécom Paris) et Antoine Saillenfest (onepoint).
  • « Détection d’anomalies dans les graphes de documents », sous la supervision de Jean-Louis Dessalles, Matthieu Labeau (Télécom Paris) et Pirmin Lemberger (onepoint).

Un troisième sujet de recherche en collaboration avec Télécom Paris, en cours de recrutement, sous la supervision d’Antoine Saillenfest et Pirmin Lemberger (onepoint) concerne la classification automatique d’article Wikipédia en tirant profit des modèles prédictifs récents appellé système de neurone sur graphes (Graph Neural Networks). Onepoint est également engagé dans deux autres thèses CIFRE en collaboration avec l’université Paris-Cité et avec le groupe Borelli, dont un sujet sur la génération automatique de code Python à partir du langage naturel et un sujet d’adaptative learning « Recommendation of learning paths, resource design and representation ».

Très prolifique, le laboratoire anime également un séminaire tous les vendredis, de 9h30 à 11h, soit une cinquantaine depuis sa création.  Les sujets tournent autour du TAL/NLP, du machine learning, de la représentation des graphes et de l’IA en général.

Retour sur l’inauguration

Inauguration du laboratoire Talia

Regarder l’inauguration

 

  • Pas d’évènements prévus actuellement.No events currently scheduled.