Los costos de la GPU Nvidia Blackwell se duplican, pero el gasto de inferencia por token cae 35 veces frente a Hopper

Según el análisis más reciente del blog de Nvidia, las GPU Blackwell cuestan casi el doble por hora frente a la generación Hopper, pero ofrecen 35 veces menos costos de inferencia por token. Usando DeepSeek-R1 como modelo de prueba, Blackwell (GB300 NVL72) se alquila a 2,65 USD por GPU por hora frente a los 1,41 USD de Hopper, pero el rendimiento de un solo GPU pasa de 90 a 6.000 tokens por segundo. Este salto de rendimiento de 65x reduce los costos por millón de tokens de 4,20 USD a 0,12 USD.

La cifra de 0,12 USD asume optimización completa del software, incluida la inferencia de baja precisión FP4 y la predicción de múltiples tokens (MTP). Sin MTP habilitado, los costos por millón de tokens alcanzan aproximadamente 2,35 USD, bajando a 0,11 USD con él activo, lo que demuestra un impacto de optimización de 21x atribuible solo a esa función.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

El 66,3% de los empleados estadounidenses con altos ingresos utiliza herramientas de IA en el trabajo, según muestra una encuesta de la Reserva Federal

Según una encuesta de la Reserva Federal, el 66,3% de los empleados de EE. UU. que ganan más de 200.000 USD al año han usado herramientas de IA en el trabajo en los últimos 12 meses a 1 de mayo. Entre los grupos de menor ingreso, las tasas de uso disminuyen significativamente: 51,6% para quienes ganan entre 100.000 y 200.000 USD, 40,2% para quienes ganan entre 50.000 y 100.000 USD,

GateNewsHace20m

xAI lanza la API de Grok 4.3 con una ventana de contexto de 1M tokens y a 1,25 dólares por cada millón de tokens de entrada

Según BlockBeats, xAI lanzó la API de Grok 4.3 el 1 de mayo. El nuevo modelo admite una ventana de contexto de 1 millón de tokens y ofrece funciones de entrada/salida de texto, capacidades multimodales y llamadas a herramientas. La API de Grok 4.3 tiene un precio de $1,25 por 1 millón de entradas

GateNewsHace32m

Los grandes gigantes tecnológicos de EE. UU. están a punto de gastar $700B en infraestructura de IA en 2026, superando ampliamente los 105.000 millones de dólares de China

Según South China Morning Post, gigantes tecnológicos de EE. UU. están a punto de gastar más de 700 mil millones de dólares en infraestructura de IA este año, superando con creces a sus pares chinos. Google, Microsoft, Meta y Amazon representan la mayor parte de ese total, mientras que Morgan Stanley estimó que los proveedores de nube chinos gastarían alrededor de 105 bill

GateNewsHace38m

Huawei espera que los ingresos de chips de IA para 2026 alcancen 12 mil millones de dólares, un 60% más que en 2025

Según Reuters, Huawei espera que sus ingresos por chips de IA para 2026 alcancen aproximadamente 12 mil millones de dólares, lo que representaría al menos un aumento del 60% frente a los 7,5 mil millones de dólares en 2025. La mayor parte de los pedidos de este año corresponden al procesador Ascend 950PR, que entró en producción en masa en marzo. La empresa planea lanzar un

GateNewshace1h

NVIDIA invierte en la startup sueca de legaltech de IA Legora; Jude Law es el embajador global de la marca

Nvidia realiza una ampliación de inversión en la Serie D en Legora por 50 millones de dólares, con lo que la financiación total de Legora alcanza los 600 millones de dólares y una valoración de 5.600 millones de dólares; participan Atlassian, Adams Street Partners e Insight Partners. Legora se centra en tecnología legal para IA y ofrece herramientas como revisión automatizada, análisis de contratos e investigación jurídica. El ARR supera los 100 millones de dólares y el número de empleados crece de 40 a 400. Jude Law se convierte en embajador global de la marca, y el lema publicitario es Law just got more attractive.

ChainNewsAbmediahace1h
Comentar
0/400
Sin comentarios