Depuis l'émergence de l’IA générative, les investissements se concentrent sur les processeurs capables d’entraîner et de faire tourner les modèles. Mais une question devient de plus en plus centrale : où stocker les volumes gigantesques de données nécessaires à leur fonctionnement ?
Pour Nicolas Frapard, Senior Sales Director Europe chez WD (également connu sous le nom de Western Digital), le stockage reste aujourd’hui largement sous-estimé. “L'industrie aborde souvent l'IA sous l'angle de la performance et de la capacité de calcul. Mais l'IA est fondamentalement un système de données. Le calcul traite les données et est réutilisé, tandis que les données persistent et s'accumulent. Cela fait du stockage une infrastructure critique qui doit évoluer de manière durable et économiquement viable.”
À mesure que les entreprises passent des expérimentations aux déploiements à échelle industrielle, cette réalité devient difficile à ignorer. Chaque itération de modèle et chaque requête génèrent de nouvelles données qui doivent être conservées, gouvernées et rendues accessibles.
L’ère de l’accumulation permanente des données
L’IA générative a en effet profondément changé la nature des besoins en stockage. Les entreprises ne doivent plus seulement conserver leurs données historiques : elles doivent aussi gérer les données créées en continu par les modèles eux-mêmes, des journaux et métadonnées jusqu’aux résultats et données d’entraînement synthétiques.
“L'IA générative redéfinit les besoins de stockage, non seulement en termes d'échelle mais aussi en termes de complexité du cycle de vie", complète Nicolas Frapard. "L'enjeu clé est de savoir comment gérer, hiérarchiser, faire évoluer et réutiliser les données efficacement dans le temps.”
Pourtant, les entreprises continuent souvent de privilégier les investissements dans le calcul au détriment de leur infrastructure de données. "Aujourd'hui, les décisions d'investissement sont encore largement guidées par la performance car ils offrent des résultats immédiats et visibles. Le stockage vient souvent plus tard, alors même qu'il constitue le socle de tout le système.”
Le risque ? Construire des architectures performantes à court terme mais incapables d’absorber durablement la croissance des données. À grande échelle, la résilience, la gestion du cycle de vie et l'efficacité économique deviennent alors aussi critiques que la performance elle-même.
Pourquoi les disques durs de grande capacité restent essentiels
De ce point de vue, le disque dur reste au cœur de l’économie de l’IA. Selon IDC, environ 80% des données dans les environnements cloud résident encore sur des HDD. Une réalité qui s’explique par une question simple : le coût.
"Les HDD restent fondamentaux pour stocker de grands volumes de données de manière économique et à grande échelle. L'IA est en définitive un défi de données, et pas seulement une question de performance ou de coût. Si le coût par téraoctet reste un avantage, la véritable valeur des disques durs réside dans la manière dont ils contribuent à optimiser le coût total de possession à grande échelle."
WD souligne par ailleurs que le stockage Flash reste important pour les usages haute performance mais demeure plus coûteux pour le stockage de masse.. Les nouvelles générations de disques permettent également d'améliorer l'efficacité énergétique des infrastructures. Passer de 26 To à 32 To pour déployer un exaoctet de stockage peut ainsi conduire à 18,8 % de disques en moins, avec à la clé une baisse de la consommation électrique… et des besoins de refroidissement.
Un enjeu stratégique pour l’Europe
Pour Nicolas Frapard, la question du stockage dépasse largement le cadre technique. Elle touche aussi à la souveraineté numérique. "L'Europe dispose de solides capacités en matière d'innovation dans l'IA, mais un écart subsiste en matière d'infrastructures à grande échelle. Une part importante de la capacité de stockage reste concentrée en dehors de la région."
Selon WD, la maîtrise des infrastructures de données constitue un enjeu majeur pour permettre aux entreprises européennes de conserver, gouverner et exploiter leurs données localement, dans le respect des exigences réglementaires et des ambitions de souveraineté numérique. Et à mesure que les volumes explosent, la capacité à stocker, organiser et valoriser les données pourrait devenir un avantage concurrentiel aussi décisif que la puissance de calcul elle-même.