Va-t-on assister à l’émergence d’une mafia Kyutai ? Seulement deux ans après le lancement en grande pompe de ce laboratoire à but non-lucratif sous l’impulsion du trio Xavier Niel, Rodolphe Saadé et Eric Schmidt, Neil Zeghidour, l’un des cinq membres fondateurs de l’équipe scientifique de Kyutai, chapeaute le lancement de Gradium, une startup ambitieuse dans l’IA vocale.
Pour mettre sur orbite ce projet, qui va directement s’appuyer sur les travaux de Kyutai, le chercheur, passé par le laboratoire FAIR de Meta et Google DeepMind, a pu compter sur un soutien financier important d’entrée de jeu. Et pour cause, la jeune pousse française annonce aujourd’hui une levée de fonds d’amorçage de 60 millions d’euros menée par FirstMark Capital et Eurazeo. Parmi les investisseurs, on retrouve Xavier Niel, le fondateur d’Iliad, Rodolphe Saadé, le patron de l’armateur CMA CGM, et Eric Schmidt, l’ancien président de Google. A leurs côtés, Korelya Capital et Amplify Partners sont également de la partie.
«Ce n’est pas un divorce avec Kyutai»
Avec Gradium, l’objectif est de développer des modèles de langage audio, conçus pour offrir des interactions vocales naturelles, expressives, à très faible latence et à grande échelle, capables d’accomplir n’importe quelle tâche vocale. «Aujourd’hui, le potentiel de l’IA vocale reste largement inexploité : nous en sommes au stade où se trouvaient les chatbots avant les LLM. Les systèmes existants restent fragiles, coûteux et incapables de proposer des interactions réellement naturelles. Chez Gradium, notre objectif est de faire de la voix l’interface principale entre humains et machines», explique Neil Zeghidour, fondateur et CEO de la jeune pousse.
Finalement, la démarche de la société s’inscrit directement dans le sillage de ce qu’a réalisé Kyutai au cours des deux dernières années. Pour rappel, le laboratoire français a notamment lancé Moshi, une intelligence artificielle multimodale et générative vocale, et Hibiki, un modèle de traduction vocale en temps réel. «Ce n’est pas un divorce avec Kyutai. D’ailleurs, nous sommes dans les mêmes locaux. Il y a seulement un couloir qui nous sépare et Kyutai est un actionnaire de Gradium», précise Neil Zeghidour. Parmi les membres fondateurs du laboratoire, il est accompagné par Laurent Mazaré, passé par Google DeepMind et Jane Street, pour lancer ce projet. Olivier Teboul (Google Brain) et Alexandre Défossez (Meta) complètent l’équipe fondatrice.
«Il y avait clairement une opportunité commerciale, mais cela sortait de la mission de Kyutai»
Si les deux chercheurs de Kyutai ont estimé qu’il était temps de s’émanciper de leur structure initiale, c’est parce qu’ils sentaient qu’il existait un potentiel commercial colossal à exploiter. «Kyutai étant à but non-lucratif, c’était le meilleur contexte pour créer des innovations scientifiques importantes. Avec une petite équipe, on a réussi à avoir un impact disproportionné. Toute la communauté scientifique s’est emparée de nos travaux. Mais nous avons aussi vu une nouvelle forme d’intérêt de la part d’entreprises, notamment dans le gaming. Ces acteurs voyaient nos modèles open source mais souhaitaient une plus grande couverture de langues. Il y avait donc clairement une opportunité commerciale, mais cela sortait de la mission de Kyutai, qui est là avant tout pour faire avance la science», explique Neil Zeghidour. «On a vu des startups faire de grosses levées de fonds à partir de modèles open source. Mais ces modèles étaient bien moins avancés que si on les poussait jusqu’au bout. Or personne ne comprend aussi bien que nous nos modèles. Il y avait donc cette opportunité que ces modèles soient utilisées des milliards de fois et nous avons décidé de saisir cette opportunité», ajoute-t-il.
C’est donc dans ce contexte que Gradium a vu le jour en septembre dernier. Et Neil Zeghidour se montre plutôt satisfait de la phase de lancement de la société. «Nous avons eu nos premiers clients au bout de 6 semaines. C’est un record du monde pour une Foundation Model Company ! Nous avons déjà des clients dans les verticales gaming et support client. Le marché est en attente de vélocité par rapport à l’époque de création de Kyutai et la traction commerciale est déjà là», se réjouit le chercheur. Avant d’ajouter : «Pourquoi on a une cadence aussi soutenue ? On veut envoyer le message qu’on va être le leader de toutes les technologies vocales assez rapidement. L’objectif est vraiment d’avoir la meilleure technologie et que les gens puissent construire des produits qualitatifs autour de celle-ci.» Le ton est donné.
«D’autres spin-offs vont arriver»
Basée à Paris, l’entreprise aura aussi une emprise à San Francisco, dans la mesure où la bataille de l’IA vocale se joue surtout dans la Silicon Valley. Gradium ne veut pas juste capitaliser sur son ADN français pour faire la différence. «Ce qu’on se souhaite, c’est que notre clientèle soit globale dès le premier jour. Nous sommes inspirés par des entreprises comme Spotify, qui s’est imposé mondialement par la qualité de son produit. Nous ne voulons pas être choisis juste par que nous sommes français ou européens», indique Neil Zeghidour.
Si le chercheur bascule dans une autre dimension avec Gradium, lui-même passant d’un poste scientifique au costume de chef d’entreprise, il précise qu’une relation étroite perdurera avec la maison-mère. «Kyutai va bénéficier de la valorisation de Gradium. Mais en contrepartie, Kyutai n’a pas de relation exclusive avec Gradium», précise-t-il. Avant de conclure : «Kuyutai travaille sur plein de nouveaux projets autour de la 3D. D’autres spin-offs vont arriver.» La mafia Kyutai n’en est donc qu’à ses débuts. Affaire à suivre…