25 avril 2019
25 avril 2019
Temps de lecture : 5 minutes
5 min
7165

Avec « Le Voice lab » les acteurs français de la voix veulent lutter contre les géants du web

Ils ne sont qu'une trentaine, mais ils entendent bien lutter contre les géants du numérique dans leur secteur : celui de la voix. Ensemble ils disposent de suffisamment de données pour permettre de développer des solutions pertinentes... et plus éthiques.
Temps de lecture : 5 minutes
Partager
Ne passez pas à côté de l'économie de demain, recevez tous les jours à 7H30 la newsletter de Maddyness.

Une trentaine de startups et de laboratoires de recherche français et européens ont noué une alliance et créé le " Le Voice Lab ", pour permettre l'émergence d'une offre alternative aux géants technologiques américains et chinois en matière d'applications vocales. " Le Voice Lab " a vocation à devenir une place de marché où un industriel pourra trouver les différentes " briques " pour monter son assistant vocal en français. Parmi les participants figurent Qwant (le moteur de recherche francophone), Snips (les assistants vocaux locaux), Kwalys (les robots conversationnels et les assistants virtuels), ou encore CandyVoice (le traitement numérique de la voix).

" Notre initiative découle du constat que nous avons un fort besoin de données pour créer des modèles acoustiques et qu’aujourd’hui seuls les grands acteurs de la tech sont capables de créer ou d’acheter ces données, explique Yann Lechelle, COO de Snips. " Ce n’est qu’en nous rassemblant que nous serons à même d’être concurrentiels et d’offrir de vraies solutions ", poursuit l’entrepreneur qui ajoute que pour être pertinent dans ce secteur il faut être à même d’agréger des centaines de milliers d’heures de voix d’hommes, de femmes, d’enfants et d’accents différents. " Le Voice Lab " regrette par ailleurs que les grands groupes français aiment l’idée d’innover avec des startups, mais qu’ils " finissent trop souvent par travailler avec IBM ou Microsoft par manque de foi dans l’écosystème ". C’est donc pour changer cet état d’esprit et inspirer de la confiance qu’est né ce regroupement.

De l’éthique dans la voix

Yann Lechelle, avec Snips, la startup qui vend une technologie en marque blanche aux industriels qui veulent intégrer une interface vocale locale dans leurs solutions, milite également pour un business de la voix plus éthique. " Il est important de déconstruire le mythe selon lequel créer des assistants vocaux nécessite de faire de l’écoute en permanence, insiste-t-il, Il existe aujourd’hui suffisamment de données disponibles pour permettre de développer des modèles acoustiques performants ". Dès lors, comment expliquer que les géants du web poursuivent les écoutes et les enregistrements de leurs utilisateurs ? " C’est simplement leur modèle économique, répond Yann Lechelle, les Gafa monétisent la data qu’ils récupèrent, elle ne leur sert plus à développer leurs assistants vocaux. "

C’est donc en se positionnant de manière très différente que les " petits " acteurs du secteur pourront encore se faire une place au soleil. " Chez Snips on a choisi de nous baser sur une technologie embarquée. Nous ne collectons pas de data et nous ne fonctionnont pas sur le cloud ", explique le COO de la startup. D’ailleurs le récent scandale portant sur Alexa, l’assistant vocal d’Amazon avec lequel certains salariés avaient accès aux conversations privées des utilisateurs, semble rendre tout à fait pertinent le choix de Snips. " Cela valide notre positionnement, se félicite Yann Lechelle, nous ne collectons pas de data, nous profitons de la puissance de calcul embarquée dans les appareils électroniques pour que la voix soit directement interprétée en local. Nous n’avons même pas de serveurs sur lesquels nous pourrions stocker quelque donnée que ce soit. "

Reste que chez les géants du numérique - excepté Apple qui a fait le choix de vendre très cher sa technologie, mais de ne pas monétiser les données qu’il agrège - le cloud domine encore aujourd’hui de manière écrasante...

Le futur de la voix

Que ce soit à cause ou grâce aux Gafa, la technologie de la voix s’insère de plus en plus rapidement dans la vie de tous les jours. De la même manière qu’ils ont rendu les smartphones incontournables, les géants du web profitent de leur force de frappe phénoménale pour créer un besoin qui deviendra vite essentiel. " Les assistants vocaux arrivent en force qu’on le veuille ou non, confirme Yann Lechelle, il faut donc se préparer à entrer dans un monde post visuel. Il est impératif de se préoccuper de cet aspect stratégique dans les cinq ans ", enjoint l’entrepreneur de la voix qui assure que, dès 2023, 10 milliards d’assistants vocaux seront en circulation. Un chiffre d’autant plus impressionnant quand l’on sait qu’un seul assistant peut toucher toute une famille.

D’ici cinq ans donc, les smartphones, les téléviseurs, les postes de radios, les frigidaires et de manière générale toute la domotique devrait fonctionner par interactions avec la voix. Un sujet que les Français appréhendent tardivement pour la simple raison que les assistants vocaux ont mis du temps à apprendre la langue.

D’un point de vue plus business, Yann Lechelle assure que le secteur du retail sera très fortement impacté par l'avènement de ce nouvel usage. " Dans les boutiques par exemple, on s’adressera directement à un assistant vocal qui nous indiquera le rayon recherché. Il y aura également des usages plus avancés, on pourra avoir affaire à des humains ‘augmentés’, prévoit le COO de Snips, l’idée sera ici de libérer les mains des travailleurs. Quand dans un magasin de chaussures le client demandera sa taille dans un modèle précis à un vendeur, ce dernier pourra continuer à conseiller son interlocuteur pendant que l’assistant vocal vérifiera la disponibilité de la paire de chaussures et indiquera aux stocks de la faire venir en rayon ", détaille Yann Lechelle à valeur d’exemple. Ces pratiques vont selon lui devenir tellement répandues que les industriels devront faire le choix de s’approprier cette technologie en interne ou de risquer de devenir des satellites des Gafa en leurs donnant accès à toutes leurs données.

Si tout se passe comme le prédit le membre du " Voice Lab ", dans quelques années un jeune arrivant dans une entreprise pour son premier emploi se demandera avec étonnement pourquoi la salle de réunion n’est pas équipée d’une interface vocale commandant les volets roulants, le tableau interactif et la machine à café. Elle n’est pourtant pas loin l’époque où internet explorer était bloqué sur les ordinateurs professionnels…