La « souveraineté » était partout à Vivatech cette année. Illustration que le mot a rejoint la liste des points de passage obligés des acteurs mondiaux de la tech. La souveraineté fait partie de toutes les anticipations collectives et de toutes les prophéties. Elle est une pierre qui roule dans les bouches, parfois embarrassante, parfois rassurante, toujours omniprésente. Être souverain est devenu une valeur propre d’une technologie. Une valeur qui justifie parfois un premium de prix, d’autres fois assure davantage de résilience. Parfois les deux. Même si on ne sait pas bien ce que l’on désigne sous cet adjectif.   

Retour à un vieux concept 

La souveraineté est un concept téléologique. Désolé d'utiliser un mot assez inhabituel « téléologique ». Mais il est important d'en comprendre la portée : la souveraineté est un concept utilisé uniquement dans un but précis (telos). Lorsque le mot « souveraineté » a été inventé à la fin du XVIe siècle par Jean Bodin, le mot était destiné à mettre fin aux guerres de religion. L’idée était de reconnaître le monopole de la violence à l’Etat et de le mettre au service d’un vecteur, la loi, qui sait s’affranchir de l’arbitraire. 

La souveraineté est aujourd'hui définie par quatre éléments : 

  1. La capacité à définir et à mettre en œuvre 
  2. de manière autonome... 
  3. par les lois 
  4. afin de réduire la violence dans la société 

Le traité de Westphalie s'est appuyé sur la définition de la souveraineté de Jean Bodin pour pacifier l'Europe s'appuyait sur une maxime très basique : « cujus regio, ejus religio » (un prince, une religion). À l'époque, nous pourrions détourner cette maxime vers un « cujus regio, ejus techno » (un pays, un champion technologique). 

Pour décliner ce principe, peut le transposer à la technologie les 4 éléments de définition de la souveraineté de la façon suivante : 

  1. Être souverain, c'est avoir une technocratie efficace, c’est-à-dire des talents capables d’aller jusqu’à la frontière technologique,  
  2. pour maîtriser des produits et les positionner dans leur chaine de valeur
  3. en restant immune à l’égard des lois extraterritoriales 
  4. et en respectant un principe fondateur : “d’abord ne pas nuire” (primum non nocere

Où jouer dans la chaine de valeur ? 

A l'heure actuelle, pour être souverain au sens que je viens de définir, la clé est donc de maîtriser l'ensemble de la chaîne de valeur des modèles GenAI. Cette chaîne de valeur évolue très rapidement et les frontières sont floues entre ses segments : infrastructure, données, modèles et applications de cas d'utilisation. 7 tendances clés : 

  1. Le marché mondial des puces d’inférence est de plus en plus polarisé, principalement entre les États-Unis en tête et la Chine en tant que challenger. Le nombre croissant de restrictions à l'accès aux puces d'IA américaines exacerbe cette fragmentation. Les contrôles à l'exportation obligent de nombreux Etats à sécuriser rapidement les infrastructures afin de mettre en œuvre leurs stratégies de développement de l'IA.
  2. Un nouveau segment de marché émerge dans le monde des infrastructures: l'inference-as-a-service. Dans un article récent, nous avons montré qu'un agent d'IA peut consommer près de 2600 fois plus de puissance computationnelle qu'un agent conversationnel. Le coût de cette inférence (mesuré en coût par jeton) a été divisé par 90 % au cours des 18 derniers mois. C'est loin d'être suffisant pour répondre aux besoins émergents. Barclays prévoit que ce marché de l'inférence-as-a-service représentera 70 % du marché du cloud pour l'IA d'ici 2027. 
  3. Pour compléter la nouvelle génération de modèles d'IA génératives capables de développer des raisonnements itératifs et complexes (reasoning models) - o3, R1, Claude Sonnet 3.7 -, des architectures innovantes devront autoriser l’accès aux tâches de planification, c'est-à-dire amener le raisonnement à un horizon détaché du contexte. Une tâche typique pour tester ces modèles, et encore peu soutenue, est leur capacité à accompagner un client de bout en bout dans la planification de son voyage. 
  4. Sur ce segment, de nouvelles générations de semi-conducteurs sont déployées qui sont des alternatives aux cartes graphiques de Nvidia : le fameux ASIC pour « Application-Specific Integrated Circuits ». Et les avancées technologiques sont loin d'être épuisées. 
  5. De nouvelles méthodes d’ingénierie se sont imposées pour faire le post-entrainement des modèles d'IA. Les techniques de distillation avec l'utilisation de la génération de données synthétiques, mises en évidence dans la récente sortie du R1 de la startup chinoise DeepSeek, réduisent les barrières à l'entrée pour les nouveaux arrivants qui souhaitent former des modèles personnalisés affinés. Cette nouvelle ingénierie des modèles d’IA passe par la réalisation de petits modèles de langage (SML), l’adaptation aux usages des modèles de raisonnement et la réalisation de modèles spécifiques à une tâche donnée... 
  6. Les modèles open-source rattrapent les modèles propriétaires en termes de performances, offrant des alternatives crédibles aux consommateurs de modèles LLM et remettant en question la viabilité économique à long terme d'acteurs comme OpenAI avec leur modèle économique actuel. S'appuyer sur des solutions propriétaires, à travers l’émergence d’un champion national, n'est donc plus la seule voie vers la souveraineté.
  7. L'avenir de l'informatique quantique devrait autoriser des flux hybrides IA-HPC. Les unités de traitement quantiques (QPU) pourront renforcer le calcul classique. 

La révolution agentique ouvre une « course de la reine rouge » 

Pas un jour ne s'est écoulé au cours des 6 derniers mois sans qu'une annonce tonitruante ne soit faite sur l'IA agentique. Ce débordement crée un sentiment de perte de contrôle pour les États comme pour les entreprises. 

Dans leur grand livre The narrow corridor, Daron Acemoglu et James Robinson utilisent l'analogie avec Lewis Carroll « red queen race » pour décrire ce qui est actuellement en jeu. Cette course de la reine rouge vient de l'autre côté du miroir : Alice n'a aucune chance d’y attraper la reine ; au mieux, elle peut courir pour essayer de rester à l'écart ; mais elle doit le faire pour ne pas être distancée. Voici la meilleure métaphore à l’heure actuelle des enjeux de souveraineté de l’IA. 

La vague agentique est une course spectaculaire de reine rouge. Comme on l’a vu, il ne s'agit pas d'une rupture technologique unique, mais de plusieurs accélérations. Les « agents » sont des logiciels dotés d'une capacité d'action et d'une poursuite flexible d'un objectif. Ils existent depuis aussi longtemps que le logiciel existe. Mais les « actions » qui leur sont aujourd'hui accessibles sont d'une nature nouvelle. 3 dimensions caractérisent ces agents de nouvelle génération : la complexité des objectifs donnés ; la possibilité d'exploiter les données contextuelles et la longueur de l'horizon. Sur chacune des dimensions, la reine rouge va accélérer dans les mois à venir. 

Pour gagner la course, il faut se focaliser sur le franchissement des freins qui existent sur le chemin du déploiement de l'IA. Ces freins sont au cœur de chaque législation sur l’IA. Ils peuvent se résumer en autant de dilemmes que chaque législation doit appréhender : 

  1. Le dilemme entre la capacité d'hypercontextualisation dont les modèles ont besoin et la nécessaire protection de la vie privée ; 
  2. Celui qui met en balance l'exigence de sobriété environnementale des modèles et l'exigence de savoir les déployer en temps réel ; 
  3. Celui entre l'explosion de l'intelligence virtuelle et la sécurité apportée par l'expérience humaine basée sur des connaissances implicites. 

Le nœud central dans lequel se joue la souveraineté est le dilemme bien connu entre l'exploration et l'exploitation. Compte tenu de la hauteur de la vague, il est dans l'intérêt de tous d'explorer les solutions qui sont disponibles, sans forcément aller jusqu'à développer un produit évolutif et déployable. Résoudre ce dilemme entre l'exploration et l'instanciation est un problème classique pour la souveraineté. C'est le principal défi à venir. 

Explorer implique de créer des écosystèmes fluides avec la recherche, d’accepter l'incertitude, d’assumer l’échec rapide (fail fast), de forcer la collaboration en embrassant des objectifs si larges qu’ils dépassent les limites institutionnelles. 

Instancier signifie à l’inverse sélectionner les produits les plus apporteurs de valeur à l’échelle, sécuriser leur intégration de bout-en-bout, concevoir des produits durables, favoriser l'engagement et l'adoption 

Dans le temps agentique, pour être souverain, il faut être capable de combiner les deux : explorer ce qui est à la frontière et instancier ce qui vient de passer la frontière. 

Dans l'IA plus que dans tout autre domaine technologique, la célèbre citation d'Abraham Lincoln est forte : « la meilleure façon de prédire l'avenir est de le créer ».