Le fondateur et PDG de NVIDIA, Jensen Huang, a publié un long article sur le blog officiel de l’entreprise, utilisant la métaphore du « gâteau à cinq couches » pour illustrer l’architecture complète de l’IA : énergie → puces → infrastructure → modèles → applications, qui en est encore à ses tout premiers stades.
(Précédemment : la puissance de calcul est reine ! Jensen Huang parle de la façon dont l’IA va restructurer la chaîne de valeur mondiale, et quand la robotique sera généralisée)
(Contexte supplémentaire : Jensen Huang affirme que l’énergie nucléaire est une « option privilégiée » pour alimenter les centres de calcul de l’IA ; les États-Unis prévoient de tripler le nombre de leurs centrales nucléaires)
Table des matières
Toggle
Jensen Huang ne prend pas souvent la plume lui-même, mais cette fois, il a écrit un article publié sur le blog officiel de NVIDIA, dans lequel il tente de répondre à une question que de plus en plus de gens se posent : qu’est-ce que l’IA exactement ? Pourquoi est-elle si importante ? À quoi ressemble sa vision d’ensemble ?
La réponse de Jensen Huang est une métaphore : un gâteau à cinq couches.
Dans son cadre conceptuel, l’IA n’est pas seulement une application intelligente, mais une infrastructure comme l’électricité ou Internet, qui transforme des matières premières en capacités intelligentes exploitables à grande échelle. « Chaque entreprise utilisera l’IA, chaque pays construira de l’IA. »
Jensen Huang commence par expliquer la différence essentielle entre l’IA et l’informatique traditionnelle. Le logiciel traditionnel est « préenregistré » : des algorithmes écrits par l’humain, que l’ordinateur exécute selon des instructions, avec toutes les règles fixées dès la phase de programmation.
L’IA bouleverse ce modèle. Elle permet pour la première fois à un ordinateur de traiter des informations non structurées : reconnaître des images, lire du texte, comprendre des sons, faire des raisonnements contextuels. Plus important encore, l’IA peut « générer de l’intelligence en temps réel » : chaque réponse est produite de façon entièrement nouvelle, dépendant du contexte fourni à l’instant, plutôt que d’une logique préprogrammée.
Selon lui, l’ampleur de cette transformation est comparable à celle de la révolution industrielle.
Première couche — Énergie (Energy)
La couche la plus basse du gâteau, souvent négligée. Jensen Huang souligne que l’énergie est la contrainte fondamentale qui détermine la quantité d’intelligence que tout système d’IA peut produire. Chaque mot généré (token) implique un flux électronique, une gestion thermique, une conversion d’énergie. Si l’énergie manque, les quatre couches supérieures sont limitées. Cela explique aussi pourquoi il a souvent déclaré que le nucléaire est une option « raisonnable » pour alimenter l’ère de l’IA.
Deuxième couche — Puces (Chips)
La tâche des puces est de convertir efficacement l’énergie en capacité de calcul. Les charges de travail de l’IA ont des caractéristiques spécifiques : besoins massifs en calcul parallèle, mémoire à haute bande passante, interconnexions rapides, très différentes des architectures CPU traditionnelles.
Les avancées technologiques dans cette couche déterminent directement la vitesse d’expansion de l’IA et le coût par unité d’intelligence.
Troisième couche — Infrastructure (Infrastructure)
Souvent appelée « usine d’IA » : terrains, alimentation électrique, systèmes de refroidissement, construction, réseaux, et systèmes de gestion coordonnant des dizaines de milliers de processeurs en simultané. Jensen Huang insiste sur le fait que la conception d’une « usine d’IA » vise à « fabriquer de l’intelligence », et non simplement à « stocker des données » comme dans un centre de données traditionnel. C’est une distinction qualitative fondamentale.
Quatrième couche — Modèles (Models)
Les modèles sont le vecteur de capacité de l’IA, couvrant des domaines variés : langage, biologie, chimie, physique, finance, médecine, monde réel. Jensen Huang met en avant plusieurs directions qu’il considère comme particulièrement révolutionnaires : l’IA pour les protéines, l’IA chimique, la simulation physique, la robotique et les systèmes autonomes.
Il souligne aussi l’importance des modèles open source, en citant DeepSeek-R1 comme exemple : la diffusion large de modèles open source accélère leur adoption, tout en augmentant la demande globale en puissance de calcul pour l’entraînement, en infrastructure, en puces et en énergie.
Cinquième couche — Applications (Applications)
Le sommet du gâteau, là où la valeur économique se concrétise réellement. Plateformes de découverte de médicaments, robots industriels, assistants juridiques, véhicules autonomes : ces applications concrétisent la capacité de l’IA, en se manifestant dans des machines ou des tâches spécifiques.
Jensen Huang admet que, au cours de l’année écoulée, la capacité des modèles a atteint pour la première fois un niveau permettant une utilisation à grande échelle : amélioration des capacités de raisonnement, réduction des hallucinations, meilleure capacité de déploiement. L’IA commence à montrer une adéquation réelle entre produits et marché dans des domaines comme la découverte de médicaments, la logistique, le service client, le développement logiciel et la fabrication.
Cependant, il estime que « beaucoup d’infrastructures ne sont pas encore en place, beaucoup de main-d’œuvre n’a pas encore été formée, et les opportunités ne sont pas encore réalisées. » Cela signifie que l’investissement actuel ne doit pas viser à rattraper, mais à poser les bases. Chaque couche du gâteau a encore un vaste espace à remplir.