Nouvelle ère de l'inférence IA ! Le LPU d'Nvidia propulse les actions A du PCB chinois

robot
Création du résumé en cours

Le 18 mars, le concept PCB du marché A a ouvert en hausse et a augmenté de 2,62 %, se classant en tête des secteurs en croissance. Parmi les actions composant le secteur, Jinlu Electronic a augmenté de plus de 10 %, Aohong Electronic, Aoshikang et Guanghe Technology ont atteint la limite supérieure, Jin’an Guoji et Hongxin Electronic ont augmenté de plus de 7 %, Pengding Holdings, Shudian Shares, Mankun Technology, Oat Technology, Dongwei Technology ont augmenté de plus de 6 %, et plusieurs autres actions comme Dazhu CNC, Aike Optoelectronics, Ultrasound Electronics, Sihui Fushi, Tianshan Electronics, Honghe Technology ont augmenté de plus de 5 %.

Concernant les actualités, récemment, la conférence GTC 2026 de Nvidia s’est ouverte à San Jose, en Californie, aux États-Unis. Le fondateur et PDG de Nvidia, Jensen Huang, est apparu vêtu de sa veste en cuir noire emblématique, présentant une puce apparemment compacte mais d’une grande importance stratégique — le Groq 3 Language Processing Unit (LPU).

« LPU » signifie « Language Processing Unit », ou unité de traitement du langage. Il s’agit d’une puce spécialisée pour l’accélération de l’inférence AI, basée sur Groq, récemment acquise par Nvidia l’année dernière, et conçue pour le décodage à faible latence et l’inférence interactive. Elle complète les GPU, qui se concentrent sur la formation et le calcul général, soutenant ensemble tout le processus de déploiement de l’IA.

Selon Jensen Huang, la vision future d’une collaboration entre GPU et LPU : Vera Rubin (composée de 72 GPU Rubin et 36 CPU Vera) sera responsable de la phase de « pré-remplissage » nécessitant des calculs massifs, tandis que le Groq LPU gérera la phase de « décodage » extrêmement sensible à la latence. Dans cette architecture hybride, le débit d’inférence et le rapport puissance-consommation du système peuvent être améliorés jusqu’à 35 fois.

Les rapports des courtiers en valeurs mobilières indiquent qu’avec l’avènement de l’ère des agents IA, la demande en inférence continuera de croître fortement. En 2026, la taille du marché mondial des puces IA devrait atteindre 280 milliards de dollars, dont 52 % pour les puces d’inférence, soit environ 145 milliards de dollars, avec un taux de croissance annuel composé supérieur à 50 %. La LPU, en termes d’efficacité énergétique, de rapport qualité-prix et de latence, surpassera nettement les GPU, et pourrait devenir la principale technologie dans le marché de l’inférence. On anticipe que la croissance progressive de la LPU, ainsi que sa commercialisation sous forme de systèmes architecturaux, apportera des opportunités liées aux PCB.

(Article source : Centre de recherche de Eastmoney)

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler