La gran apuesta de NVIDIA: El CPU Vera irrumpe en el escenario de los servidores
NVIDIA, empresa que es sinónimo de dominio en el sector de las GPU, está lanzando su ataque más directo hasta la fecha contra el lucrativo mercado de las CPU de alto rendimiento. El lanzamiento del CPU NVIDIA Vera, un procesador basado en arquitectura Arm que ha entrado en fase de producción total en el primer trimestre de 2026, no es solo un producto nuevo; es una declaración de guerra estratégica contra gigantes establecidos como Intel Xeon, AMD EPYC e incluso los chips Graviton de Amazon. La ambición de Jensen Huang de transformar a NVIDIA en un proveedor de CPU de primer nivel es bien conocida, y el CPU Vera representa la piedra angular de esa visión, impulsando a NVIDIA a convertirse en un "ecosistema de computación integral".
Nombrado en honor a la pionera astrónoma estadounidense Vera Florence Cooper Rubin, este chip ha sido diseñado específicamente para las crecientes demandas de la inteligencia artificial. Aunque anteriormente habíamos visto el CPU Grace de NVIDIA en los superchips Grace-Hopper estrechamente integrados, la disponibilidad del CPU Vera como una oferta independiente marca un cambio significativo, permitiendo una mayor flexibilidad en el diseño de infraestructuras de IA y centros de datos. Es un movimiento que provocó ondas de choque inmediatas en el mercado, haciendo que las acciones de Intel y AMD cayeran tras el anuncio.
Ingeniería para el centro de datos nativo de IA
En su esencia, el CPU Vera está diseñado para ser la unidad central de procesamiento en arquitecturas de centros de datos de IA de pila completa. Su directiva principal es el "razonamiento agéntico" (agentic reasoning), una función crítica para coordinar el vasto movimiento de datos, la asignación de memoria y los flujos de trabajo intrincados en sistemas acelerados por GPU, todo ello para garantizar que esas costosas unidades de procesamiento gráfico se utilicen al máximo. Este enfoque revela que NVIDIA comprende que incluso las GPU más potentes pueden verse limitadas por una orquestación ineficiente del CPU.
A continuación, analizamos por qué los aspectos destacados del CPU Vera son importantes, añadiendo una dosis de escepticismo saludable:
- Optimizado para la IA: NVIDIA afirma tener una alta eficiencia tanto para el entrenamiento como para la inferencia de IA, desde agentes de IA multimodales hasta tareas de razonamiento de contexto largo. Dada la herencia de NVIDIA en IA, esto no es sorprendente, pero las ganancias de eficiencia en el mundo real serán la prueba definitiva.
- Salto en el rendimiento: El anuncio de "el doble de rendimiento y eficiencia en el procesamiento de datos, compresión y CI/CD en comparación con la generación anterior del CPU NVIDIA Grace" es impresionante. El CPU Grace, con sus 72 núcleos Arm Neoverse V2, ya mostró una fuerte competitividad frente a Intel Xeon y AMD EPYC en algunos puntos de referencia, particularmente en eficiencia. Duplicar ese rendimiento con Vera, que cuenta con 88 núcleos personalizados "Olympus" Armv9.2, lo posiciona como un contendiente serio. Sin embargo, estaremos atentos a las pruebas de rendimiento independientes para ver cómo se traduce esto frente al rendimiento absoluto de los últimos buques insignia x86, especialmente considerando el calificativo de "generación anterior".
- Eficiencia energética: La "eficiencia energética líder en la industria" es crucial para los centros de datos a gran escala, donde el consumo de energía y los costos de refrigeración son enormes. Grace ya destacaba en este aspecto, ofreciendo a menudo "el doble de rendimiento por el mismo consumo de energía que la competencia". Si Vera mejora esto, podría representar un ahorro de costos importante para los hiperescaladores.
- Arquitectura monolítica: Un diseño de matriz monolítica unificada, según NVIDIA, maximiza el rendimiento, la eficiencia energética y la utilización de la GPU al evitar la comunicación entre chiplets. Esto contrasta con los diseños de chiplets predominantes de competidores como AMD e Intel, que ofrecen ventajas en el rendimiento de fabricación y flexibilidad al dividir chips grandes en piezas más pequeñas. Aunque los diseños monolíticos pueden ofrecer una menor latencia debido a la proximidad física, tradicionalmente conllevan mayores costos de fabricación para matrices muy grandes y complejas. La decisión de NVIDIA es audaz, apostando por la integración optimizada sobre la modularidad.
- Multihilo avanzado (NVIDIA Spatial Multithreading): La partición física de los recursos del núcleo para la optimización en tiempo de ejecución entre rendimiento y densidad es un enfoque intrigante. Esto podría permitir a los centros de datos ajustar la asignación de recursos según las demandas específicas de la carga de trabajo, una flexibilidad que siempre es bienvenida.
- Excelencia en cargas de trabajo limitadas por memoria: Vera está diseñado para tareas intensivas en memoria como los flujos de trabajo de IA agéntica, preparación de datos, gestión de caché KV y simulaciones de HPC. Este es un reconocimiento claro del cuello de botella de memoria que suelen enfrentar las cargas de trabajo modernas de IA y HPC.
- Interconexión de alta velocidad: El tejido de coherencia escalable de NVIDIA (SCF) de segunda generación con un ancho de banda de bisección de 3,4 TB/s y el NVLink-C2C de segunda generación que ofrece 1,8 TB/s de ancho de banda coherente son absolutamente críticos. Estas interconexiones garantizan un intercambio de datos fluido y a alta velocidad, abordando directamente un punto crítico en los sistemas altamente acelerados donde la transferencia de datos puede ser un obstáculo principal. El CPU Grace también utilizaba SCF, proporcionando 3,2 TB/s.
Aunque el CPU Vera es capaz de funcionar de forma independiente para una variedad de cargas de trabajo como analítica, nube, orquestación de sistemas, almacenamiento y HPC, su intención de diseño final es clara: la integración nativa con las GPU NVIDIA Rubin como parte de la plataforma más amplia NVIDIA Vera Rubin. Cuando se emparejan, el NVLink-C2C crea efectivamente un sistema de memoria unificada con aislamiento reforzado por hardware, una propuesta poderosa para sistemas de IA estrechamente acoplados.
CPU Vera: Especificaciones que exigen atención
Las especificaciones del CPU Vera dicen mucho sobre sus objetivos de diseño.
Los 88 núcleos personalizados Arm "Olympus" son una mejora significativa respecto a los 72 núcleos Arm Neoverse V2 de Grace. Emparejado con 1,5 TB de memoria LPDDR5X, que ofrece hasta 1,2 TB/s de ancho de banda, esta es una jugada clara para las cargas de trabajo de IA intensivas en memoria. La memoria LPDDR5X, especialmente en un formato SOCAMM (Small Outline Compression Attached Memory Module), es conocida por su alto ancho de banda y eficiencia energética superior en comparación con las DIMM DDR5 tradicionales, ofreciendo a menudo un ancho de banda 2,5 veces mayor y consumiendo significativamente menos energía. Esta elección subraya el enfoque de NVIDIA en el rendimiento por vatio, una métrica crítica en los centros de datos hambrientos de energía. Los impresionantes 227 mil millones de transistores también indican un diseño altamente complejo y potente, aunque nos preguntamos qué parte de este recuento se dedica puramente a la lógica del CPU frente a las interconexiones integradas y otras características que facilitan la sinergia con la GPU.
El soporte nativo para FP8 es una característica orientada al futuro, que atiende directamente a los requisitos de precisión de muchos modelos de IA modernos. Esto permite que ciertas cargas de trabajo de IA se ejecuten directamente en el CPU con una eficiencia mejorada.
El ecosistema: Adopción y la visión de la nube de IA de NVIDIA
El CPU Vera ya está en producción total y la adopción temprana es clave. CoreWeave destaca como uno de los primeros proveedores de nube y clientes en integrar sistemas basados en NVIDIA Rubin, incluido el CPU Vera, en su plataforma de nube de IA para la segunda mitad de 2026. La sustancial inversión de 2.000 millones de dólares de NVIDIA en CoreWeave consolida aún más esta asociación, sugiriendo una profunda alineación estratégica para acelerar el despliegue de infraestructura de IA. Este movimiento no se trata solo de vender chips; se trata de construir un ecosistema de nube de IA completo donde el hardware de NVIDIA sea la base.
Para despliegues a hiperescala, el NVIDIA DGX Vera Rubin NVL72 ofrece una solución de infraestructura de IA llave en mano. Este sistema a escala de rack, que integra 36 CPU NVIDIA Vera y 72 GPU NVIDIA Rubin con la colosal cifra de 75 TB de memoria rápida total, aspira a ofrecer un "rendimiento sin precedentes para las cargas de trabajo de IA más exigentes". Está claro que NVIDIA no solo vende CPU individuales; vende soluciones de pila completa estrechamente integradas.
Es importante reiterar que el CPU Vera está diseñado específicamente para infraestructuras de IA y centros de datos, no para PC de juegos o computación de consumo general a corto plazo. Aunque tomamos nota de los planes separados de NVIDIA para un CPU Arm para PC, con nombre en código N1X, basado en el "Superchip" GB10, Vera está firmemente orientado a la empresa. Esta distinción es crucial, ya que las demandas y optimizaciones para estos mercados son sumamente diferentes.
El mercado de CPU para servidores se está calentando. Los chips para servidores basados en Arm están ganando terreno, con previsiones de que representen alrededor del 9% de los ingresos por CPU en 2026 y potencialmente entre el 10% y el 12% para 2027, impulsados por proveedores de nube que buscan opciones eficientes en energía y costos. Dell'Oro Group informó que los CPU Arm capturaron una cuarta parte del mercado de servidores en el segundo trimestre de 2025, un salto significativo respecto al año anterior, impulsado en gran medida por las plataformas a escala de rack Grace-Blackwell de NVIDIA. Aunque el objetivo de Arm de alcanzar el 50% de cuota de mercado para finales de 2025 pueda ser ambicioso, la entrada de NVIDIA con el CPU Vera ciertamente añade un peso significativo al ecosistema Arm. Anticipamos una competencia feroz a medida que Intel y AMD respondan con sus propias innovaciones para mantener sus posiciones dominantes en x86. El CPU Vera es una declaración poderosa de NVIDIA, y estamos ansiosos por ver cómo redefine el panorama de la computación de IA.
Comentarios