Décryptage#Data
18 décembre 2015

Comment Bercy traque les fraudeurs avec ses algorithmes

Une cellule spécialisée de datamining a été constituée au sein du Ministère des finances pour détecter des déclarations suspectes. Une première en France, qui a pris un certain retard en la matière par rapport à ses voisins.


L’administration fiscale a longtemps été en retard sur les fraudeurs fiscaux. Bercy reconnaît lui-même qu’entre 60 et 80 milliards d’euros échappent chaque année au fisc, soit 15% et 25% des recettes fiscales brutes. Le gouvernement a mis les bouchées doubles et a réussi à récupérer 10,4 milliards d’euros en 2014, soit 900 millions de plus qu’en 2013.

Dans cette lutte, le big data constitue une arme redoutable. Une cellule datamining a été constituée en 2014 au sein de la Direction Générale des Finances Publiques, qui compte aujourd’hui dix experts informatiques chargés d’établir des algorithmes. Techniquement, des fichiers constitués de données très détaillées et potentiellement représentatives de types de fraude (par exemple un taux d’impayés important). Des traitements statistiques sont ensuite appliqués à ces données pour révéler des corrélations. Un « profil » est ainsi modélisé, puis appliqué à une large population attribuer un score de probabilité de fraude aux contribuables.

Un algorithme qui traite jusqu’à 1800 informations sur une entreprise

La grande force de ce système est de pouvoir traiter une immense masse de données, provenant d’autres administrations, d’organismes sociaux, ou de bases privées (états financiers standardisés, information sur les sociétés implantées à l’étranger, indicateurs financiers, données d’identification des personnes en lien avec ces entreprises). Plus de 1800 informations sur une même société peuvent ainsi être analysées. Les premières modélisations ont porté sur la fraude aux demandes de remboursements de crédits de TVA. « Aucune fraude n’est directement détectée via le datamining », met en garde le responsable de la cellule. « Mais il nous sert à orienter et préparer les contrôles fiscaux sur le terrain ». Les résultats se chiffrent déjà en « dizaines de millions d’euros« , selon lui.

Prometteur, mais loin d’être à la hauteurs des enjeux, comme l’a montré l’iFrap dans une comparaison avec les pratiques de nos voisins. En Belgique, un logiciel mis au point par SAS détectant notamment les incohérences déclaratives a permis de faire chuter de 85% la fraude au « carrousel » [qui consiste à obtenir un remboursement de TVA dans un pays alors qu’elle n’a pas été versée] en huit ans. En 2013, le fisc italien s’est doté d’un robot informatique permettant de reconstituer virtuellement les sommes dépensées et de les comparer à celles déclarées en ligne.

Toutes ces données sont bien sûr à manier avec précaution. En France, la Commission nationale de l’informatique et des libertés (CNIL) a donné son accord à la généralisation de l’outil de datamining pour les entreprises, en soulignant qu’il ne s’agit pas d’un outil de profilage permettant d’identifier directement les fraudeurs. On espère en tous cas que les ordinateurs des dix experts sont bien protégés.

Article écrit par Céline Deluzarche