Newsroom

Sievable : un seul moteur de recherche spécialisé grâce au machine learning

Romain Zimmer est diplômé de Télécom Paris et de l’ENS Paris-Saclay, co-fondateur de Sievable, un moteur de recherche collaboratif construit sur l’apprentissage machine, qui vise à centraliser toutes recherches spécialisées sur une seule et même plateforme. Il nous fait part de ce projet.

L’apprentissage machine, ou apprentissage statistique, est un champ d’étude de l’IA qui se fonde sur des approches mathématiques et statistiques pour donner aux ordinateurs la capacité d’« apprendre » à partir de données. (Wikipedia).

Pourquoi avez-vous créé Sievable ?

Romain Zimmer : Nous travaillons sur la recherche spécialisée sur Internet. Dès que nous avons des critères précis, nous mettons énormément de temps à trouver les références utiles recherchées. Exemple très simple : essayez de chercher sur Google “European startups founded after 2020 and building a search engine”, vous aurez de tout sauf ce qui vous importe : la liste des start-up qui correspondent à vos critères.

Les moteurs de recherche généralistes ne sont pas capables de traiter ce genre de recherches. Nous devons donc nous tourner vers des moteurs de recherche spécialisés. Mais il n’existe pas de moteurs de recherche spécialisés pour tous les domaines, il faut savoir lesquels utiliser et utiliser un moteur de recherche différent pour chaque domaine. De plus, les options de filtrage proposées par ces plateformes ne correspondent pas toujours à nos besoins.

Pouvoir faire très simplement de la recherche spécialisée sur n’importe quel domaine depuis un seul et même moteur de recherche.

En quoi cela consiste-t-il ?

Sievable (logotype)Nous développons une nouvelle technologie de recherche par filtre basée sur du machine learning afin de filtrer facilement n’importe quel contenu selon une infinité de critères. L’objectif sur le long terme est de pouvoir faire très simplement de la recherche spécialisée sur n’importe quel domaine depuis un seul et même moteur de recherche. Pour reprendre l’exemple précédent, notre moteur de recherche fournirait directement la liste des start-up à l’utilisateur.

Nous venons de lancer la beta de notre plateforme et créé notre propre token sur la blockchain solana. Tout le monde peut contribuer à entraîner notre moteur de recherche et recevoir des tokens en échange. Ces tokens peuvent ensuite être utilisés pour ajouter du contenu sur la plateforme.

En quoi votre formation à Télécom Paris a-t-elle été utile à cette création ?

Grâce à ma formation à Télécom, j’ai acquis énormément de connaissance en informatique, en mathématiques et plus largement à tout ce qui est lié au digital. Cette formation me permet d’avoir des bases solides et d’apprendre rapidement sur tous les sujets techniques sur lesquels nous travaillons : machine learning, ingénierie logicielle, devops, écosystèmes crypto…

Combien avez-vous d’utilisateurs ?

Nous venons seulement de lancer la plateforme et nous avons encore énormément de travail pour la rendre plus intéressante et facile à utiliser. Pour l’instant, nous travaillons avec un petit groupe de quelques dizaines de beta testeurs. Une de notre problématique principale est l’acquisition de contenu et de données d’entraînement pour notre moteur de recherche. Cela prend beaucoup de temps et nous explorons plusieurs approches pour accélérer le processus.

Quelles sont les perspectives de développement ?

La société n’est pas encore créée. Nous avons rejoint le Startup Studio de l’Inria à Paris en mai 2021 pour une une durée d’un an. Si nous parvenons à développer suffisamment la plateforme d’ici la fin du programme, nous pourrons effectuer une première levée de fonds, créer la société et rejoindre un incubateur. Sinon, retour à la case départ, mais en ayant appris énormément pendant cette année passionnante !

Bravo à Romain et toute l’équipe de Sievable, meilleurs vœux de réussite pour la suite !

Image d’entête source Rawpixel/Freepik