Il y a trois ans, Elon Musk déclarait que les GPU étaient « bien plus difficiles à obtenir que de la drogue ». Depuis lors, le monde de la technologie s’est enfoncé encore davantage dans une obsession de la puissance de calcul brute, faisant des GPU l’une des ressources les plus convoitées de la planète. Et pourtant, l'industrie se concentre sur l'arbre sans voir la forêt qui se profile: à mesure que nous passons de l’entraînement des modèles à l’inférence, le facteur limitant n’est plus la puce, mais l'électricité qui l'alimente.

La demande explose, et ce n’est qu’un début

Une requête à un LLM consomme jusqu’à 10 fois plus d’électricité qu’une recherche sur Google. Les décideurs qui parlaient de FLOPS et de giga-octets il y a deux ans parlent désormais de mégawatts. La souveraineté technologique dépend, en grande partie, de la souveraineté énergétique. Et cette réalité s’accentue à mesure que l’instabilité géopolitique du Moyen-Orient à l’Oural plonge les marchés de l’énergie dans une incertitude structurelle.

Face à cela, le modèle traditionnel des hyperscalers montre ses limites en temps réel. Le cloud tel qu’il a été construit jusqu’à présent repose sur d’énormes datacenters centralisés, un modèle structurellement incapable de suivre le rythme des exigences de l’ère de l’inférence.

Les derniers raccordements se font sur des puissances de 100 à 200 MW selon RTE, illustrant une course à la puissance qu’ils ne peuvent pas gagner. Les hyperscalers sont confrontés à trois problèmes qui s’aggravent et auxquels ils ne peuvent pas remédier par des solutions techniques : des délais de construction qui se mesurent en années plutôt qu’en mois ; des coûts d’infrastructure qui montent en flèche à mesure que les composants matériels sont confrontés à des contraintes d’approvisionnement ; et une centralisation des données qui engendre de la latence, un risque en matière de souveraineté et une fragilité systémique en cas de crises liées au réseau, à la géopolitique ou au climat.

Un nouveau paradigme est en train d’émerger

Compte tenu des contraintes de coût, d’échelle et de consommation d’énergie, l’infrastructure de l’IA doit devenir modulaire et distribuée. La capacité de calcul doit être rapprochée de la source d'énergie primaire qui l'alimente, mais aussi de l'utilisateur qui l'utilise. Il ne s’agit pas d’une préférence architecturale. C’est une nécessité structurelle.

La solution réside dans l’intégration verticale de trois domaines qui, historiquement, ont chacun fonctionné de manière isolée les uns des autres : les infrastructures énergétiques, le matériel physique des centres de données et les logiciels cloud.

Fusionnez ces trois éléments, et vous obtenez ce dont l’ère de l’IA a véritablement besoin : une infrastructure pouvant être déployée en quelques mois plutôt qu’en plusieurs années, sur une alimentation électrique existante plutôt que sur des réseaux électriques dont la construction prend une décennie, avec une souveraineté des données intégrée dès le départ plutôt que rajoutée a posteriori par la réglementation.

Tout ceci n'est pas une simple théorie que nous explorerons. Nous avons réussi à intégrer ces trois domaines au sein d'une même entreprise: Antimatter. C’est l’entreprise que nous avons lancée aujourd’hui. Et nous conseillons à l’ensemble des acteurs de la tech de prendre en compte ce nouveau paradigme qui va révolutionner l’infrastructure, avec ou sans la participation des acteurs européens.

La prochaine bataille dans le secteur de l’IA ne sera pas remportée par l’entreprise disposant du plus grand nombre de GPU dans le plus grand datacenter

Elle sera remportée par l’entreprise qui aura identifié où se trouve l'énergie disponible, construit une infrastructure résiliente à proximité, et qui aura fourni de la puissance de calcul aux organisations qui ont besoin de souveraineté, résilience et efficacité 

Arrêtez donc de compter la puissance de calcul et les GPU. Commencez à compter les mégawatts. Et en France, c’est peut-être une véritable opportunité pour nous, grâce au secteur du nucléaire.

Le néo-cloud décentralisé n'est pas une simple option. C'est une nécessité vitale. Et il est déjà là. Reste à savoir si vous souhaitez participer à sa construction…

David Gurlé est un entrepreneur et un pionnier reconnu dans l’industrie technologique mondiale. Il a contribué à créer les moyens de communications en temps réel chez Microsoft et Skype, a fondé Perzo avant de le vendre à un consortium de quatorze banques mondiales pour une valorisation de 100 millions de dollars, et a fait de Symphony une plateforme de communications sécurisées d’une valeur de 1,8 milliard de dollars utilisée par pratiquement toutes les grandes institutions financières du monde. Il est cofondateur et PDG d'Antimatter — le premier néo-cloud full-stack au monde, combinant informatique distribuée, infrastructure hardware souveraine et gestion flexible de l'énergie au sein d'une plateforme intégrée.