La nervosité des marchés sur les valeurs technologiques vient nous rappeler l’interdépendance de la technologie et des réalités géopolitiques, dans un contexte où la politique Étasunienne n’a jamais été aussi imprévisible. Dans le cas particulier de l’IA, et notamment de l’IA générative, Etats-Unis et Chine se disputent le leadership, avec d’autres zones géographiques qui tentent de tirer leur épingle du jeu comme l’Europe, le Canada, le Moyen-Orient ou l’Asie du Sud-Est. La partie reste ouverte : contrairement aux étages plus amont de la chaîne de valeur, comme l’infrastructure cloud ou les composants hardware, pour lesquels le retard ne semble pas rattrapable, la situation est fondamentalement différente pour le software : plus faible barrière à l’entrée, cycles de développements plus courts, excellentes compétences dans nos pays. Le concept fourre-tout autour duquel la stratégie d’un Etat se dessine est celui de souveraineté, et fait référence à l’autonomie des organisations pour leurs choix technologiques. Mais, dans le contexte de l’IA générative, qu’entend-on précisément par souveraineté ?
La souveraineté technologique est la maîtrise de l’ensemble de la chaîne de valeur logicielle de l’IA générative. Cela commence par la fabrication de Large Language Models (LLM), avec ses différentes étapes : constitution de la base d’apprentissage, “tokenisation”, pré-entraînement, “alignement” et fine-tuning. Les couches applicatives des LLM permettent leur utilisation au-delà d’un simple chatbot : applications de type RAG (Retrieval-Augmented Generation), IA “agentique” permettant d’effectuer des tâches complexes en enchaînant plusieurs outils élémentaires, chacun pouvant faire appel à un ou plusieurs LLM. Enfin, il ne faut pas négliger les aspects relevant plus du software engineering et des pratiques “MLops / DevOps” pour l’optimisation des ressources matérielles des serveurs multi-GPU et l’automatisation de l’installation de logiciels complexes sur ces serveurs.
Pour les entreprises qui adoptent l’IA générative, la souveraineté liée à l’infrastructure de déploiement est un critère primordial, avec différents niveaux de sensibilité suivant les secteurs. Beaucoup a déjà été dit sur le phénomène de “Shadow AI” c’est-à-dire l’utilisation en entreprise d’outils d’IA générative non approuvés, sans garanties sur la confidentialité de l’information fournie à l’entrée des LLM (prompts ou documents entiers) - ceux-ci par défaut seront a minima vus par le fournisseur de technologie, voire même réutilisés dans les corpus d’entraînement. Pour une utilisation d’IA générative où les données restent privées par construction, il est possible de déployer des plateformes GenAI sur des clouds privés, avec des serveurs single tenant, ou on premises sur les serveurs gérés par l’entreprise - voire même en air grapped (serveurs isolés des réseaux). Les entreprises sont également sensibles à la localisation physique des serveurs et à l’origine de leur technologie - ce qui implique différentes dépendances par rapport aux lois à portée extraterritoriale de type Cloud Act.
La souveraineté économique a trait à la dépendance économique par rapport aux fournisseurs de services d’IA générative, alors que les utilisations sont en croissance exponentielle - avec des coûts suivant la même tendance. Avec des effets estimés parfois à des points entiers de PIB des pays les plus avancés d’ici quelques années, l’IA générative a un potentiel de transfert de ressources important : toute la valeur créée en Europe va-t-elle aller aux leaders américains ? Le besoin de souveraineté économique se fait aussi ressentir au niveau des entreprises individuelles, par exemple au niveau des variations de prix d’un service d’IA générative soit de la part d’acteurs en position de quasi-monopole, soit en conséquence de changements dans les réglementations comme les tarifs douaniers transfrontaliers, pour prendre un exemple ayant occupé l’actualité récente.
La souveraineté réglementaire s’entend sur le type de conformité à laquelle un service d’IA générative doit se conformer. Il peut s’agir de règles de conformité imposées aux fournisseurs de services GenAI par leurs clients (compliance) pour assurer la sécurité, la disponibilité, l’intégrité du traitement et la confidentialité des données, par exemple en adhérant à différentes normes (SOC2 par exemple). A ceci s'ajoutent les réglementations nationales et internationales, comme le récent EU AI act, mais également sur les données personnelles (RGPD), pour une protection accrue des droits et des libertés individuelles. En ces temps où on attend toujours la finalisation du “code of practice” qui doit détailler la mise en oeuvre du EU AI Act, et où l’on observe en parallèle une divergence entre les régulations Européenne et Étasunienne - ces derniers ayant plutôt tendance à déréguler -, il est essentiel que l’Europe s’appuie sur ses propres acteurs pour appuyer sa politique réglementaire et industrielle.
Enfin, la souveraineté culturelle d’une technologie LLM recoupe l’ensemble des règles qui influent sur le comportement du modèle, qu’elles soient explicites (choix des règles d’alignement par exemple, ou des thématiques permises et non permises par le modèle) ou implicites en découlant du choix de corpus d'entraînement. De façon la plus basique, si ce corpus contient bien moins de français que d’anglais américain, le modèle aura - au-delà des aspects purement linguistiques - tendance à simuler des façons de penser spécifiques des Etats-Unis, comme par exemple mentionner une consommation de carburant en miles par gallon ou des décisions juridiques de “common law”, ou plus simplement ne pas maîtriser les variétés régionales du français. Au-delà de ces questions de performance et de biais, il s’agit d’un élément important de “soft power” dont bénéficient les pays ayant facilement accès à de très grands corpus textuels dans leur langue - tout en garantissant une rémunération juste des ayants droits sur les contenus, le cas échéant.
On le voit, les différentes facettes de la souveraineté en IA permettent une interprétation large de ce concept. Ainsi, les annonces faites par Emmanuel Macron au moment du “Sommet pour l’Action sur l’IA” d’investissements de 109 Milliards peuvent s’entendre à ce prisme de la souveraineté - même si le plus grand campus Européen dédié à l’IA se construira autour d’un énorme datacenter financé par les Emirats Arabes Unis. Enfin, les incertitudes sur la politique des Etats-Unis laissent planer le doute sur la disponibilité mondiale à long terme de leurs plateformes d’IA générative. De manière préventive, il est essentiel que des entreprises européennes maîtrisent toute la chaîne de valeur software de l’IA générative, en synergie avec des centres de recherche universitaire. Il est tout aussi essentiel que le déploiement de cette IA pour les besoins de l’économie se fasse dans un cadre garantissant un très haut niveau de confiance, nécessaire à son acceptation. Comme l'annonçait récemment dans une tribune de plus de 300 organisations françaises - grands groupes, fournisseurs de solutions digitales, services publics, start-up - avec 33 recommandations en faveur de la souveraineté numérique européenne : « il est temps d'agir ».