L’année avait mal commencé pour la startup Yzr et ses deux fondateurs, Sébastien Garcin, anciennement chief data Officer de L’Oréal, et Jean-Philippe Poisson, entrepreneur dans l’innovation et le numérique. En pleine levée de fonds au moment de l’arrivée du coronavirus, leurs potentiels investisseurs ne leur donnent plus de nouvelles pendant plusieurs semaines. « En mars, il nous restait 4 mois de trésorerie, confie Jean-Philippe Poisson. Cette année a été un véritable ascenseur émotionnel » .
Cette histoire est désormais derrière eux. Aujourd’hui, ils annoncent une levée de fonds de 2 millions d’euros en seed, auprès d’entrepreneurs de The Galion Project et d’investisseurs renommés de la scène tech française que sont Anne-Laure Constanza (Envie de Fraise), Bertrand Diard (Talend), Frédéric Mazzella (Blablacar), Jean-Baptiste Rudelle (Critéo), Laurent Ritter (Voodoo), Arnaud Mauduit (Sekko Mono), Thibault Poutrel ou Sopromec Participations. Une belle revanche pour la jeune pousse qui s’imagine déjà aux Etats-Unis.
Remplacer le bon vieux tableau Excel
Startups, PME, grands groupes…les entreprises ont compris depuis quelques années déjà que la data est une ressource en or pour leur développement. Les solutions pour réussir à les récolter foisonnent mais une difficulté perdure : leur traitement. Selon une étude IDC réalisée en février 2019, les data scientist passeraient un tiers de leur temps à la seule préparation des données. La première étape, celle de la normalisation – comprendre l’homogénisation des données – est sans doute la plus chaotique car elle s’effectue souvent à la main, dans un tableau Excel. Les analystes sont chargées d’indiquer que telle appellation ou tel code correspond à tel·le autre. Les sociétés font face à deux enjeux : la normalisation interne et inter-entreprises des données.
Plutôt que d’essayer de créer des référentiels communs en amont, Yzr « envisage les données comme du texte que l’on analyserait à plat. Notre solution ne cherche pas à comprendre le sens de la donnée. Nous utilisons le machine learning pour analyser si deux mots se ressemblent » , détaille Sébastien Garcin. La solution, qui fonctionne depuis deux mois, prend la forme d’une API chargée de normaliser les données et d’une plateforme Saas, « ce qui la rend très légère à implémenter » .