Mijn bladwijzers

NVIDIA Vera-CPU onthuld: Een frontale aanval op de dominantie van Intel en AMD

NVIDIA Vera-CPU onthuld: Een frontale aanval op de dominantie van Intel en AMD
Topic Hubs
Samenvatting
Click to expand
Inhoudsopgave

NVIDIA zet alles op alles: De Vera-CPU bestormt de serverarena

NVIDIA, een bedrijf dat tot nu toe vooral bekendstond om zijn dominantie op de GPU-markt, opent nu de frontale aanval op de lucratieve markt voor krachtige CPU's. Met de lancering van de NVIDIA Vera-CPU, een op Arm-architectuur gebaseerde processor die sinds het eerste kwartaal van 2026 in volle productie is, zet het bedrijf een strategische stap. Dit is niet zomaar een nieuw product; het is een directe oorlogsverklaring aan gevestigde giganten zoals Intel (Xeon), AMD (EPYC) en zelfs de Graviton-chips van Amazon. De ambitie van topman Jensen Huang om van NVIDIA een toonaangevende CPU-leverancier te maken is geen geheim, en de Vera-CPU vormt de hoeksteen van die visie: NVIDIA moet transformeren tot een "allesomvattend computer-ecosysteem".

De chip is vernoemd naar de baanbrekende Amerikaanse astronoom Vera Florence Cooper Rubin en is specifiek ontwikkeld voor de steeds extremere eisen van kunstmatige intelligentie. Waar we eerder de Grace-CPU van NVIDIA zagen in nauw verbonden "Grace-Hopper Superchips", markeert de beschikbaarheid van de Vera-CPU als losstaand product een belangrijke koerswijziging. Dit biedt datacenters en AI-infrastructuren namelijk veel meer flexibiliteit in hun ontwerp. De impact van deze aankondiging was direct merkbaar op de beurs, waar de aandelen van concurrenten Intel en AMD een daling lieten zien.

Ontwikkeld voor het AI-native datacenter

In de kern is de Vera-CPU ontworpen als de centrale verwerkingseenheid voor volledige AI-architecturen in datacenters. De belangrijkste taak is "agentic reasoning" — een cruciale functie voor het coördineren van enorme datastromen, geheugentoewijzing en complexe workflows in systemen die door GPU's worden versneld. NVIDIA begrijpt als geen ander dat zelfs de krachtigste GPU's kunnen worden afgeremd door een inefficiënte CPU-aansturing.

Hier zijn de belangrijkste redenen waarom de Vera-CPU opvalt, waarbij we ook kritisch blijven kijken naar de claims:

  • Geoptimaliseerd voor AI: NVIDIA belooft een enorme efficiëntie voor zowel het trainen van AI als voor inferentie, variërend van multimodale AI-agenten tot taken waarbij langdurig redeneren nodig is. Gezien de achtergrond van NVIDIA is dit geen verrassing, maar de praktijk zal moeten uitwijzen hoe groot de winst werkelijk is.
  • Prestatiesprong: NVIDIA spreekt van een verdubbeling van de prestaties en efficiëntie bij gegevensverwerking en compressie vergeleken met de vorige generatie, de Grace-CPU. De Grace-CPU was met zijn 72 Arm Neoverse V2-kernen al een geduchte concurrent voor de x86-chips van Intel en AMD. Met 88 op maat gemaakte "Olympus" Armv9.2-kernen positioneert de Vera zich als een zwaargewicht. Onafhankelijke benchmarks moeten echter nog aantonen hoe dit zich verhoudt tot de absolute topprestaties van de nieuwste x86-vlaggenschepen.
  • Energie-efficiëntie: In enorme datacenters zijn stroomverbruik en koeling enorme kostenposten. De Grace-architectuur blonk hier al in uit en leverde vaak twee keer zoveel prestaties per watt als de concurrentie. Als de Vera dit verder verbetert, is dat een doorslaggevend argument voor grote cloudaanbieders.
  • Monolithische architectuur: In tegenstelling tot AMD en Intel, die vaak gebruikmaken van een "chiplet"-ontwerp (waarbij meerdere kleine chips worden samengevoegd), kiest NVIDIA voor één grote, monolithische chip. Volgens NVIDIA maximaliseert dit de doorvoer en energie-efficiëntie omdat de vertraging van communicatie tussen verschillende chiplets wordt geëlimineerd. Hoewel dit technisch superieur kan zijn, brengt het hogere productiekosten en risico's op productiefouten met zich mee bij zulke complexe ontwerpen.
  • Geavanceerde Multithreading (NVIDIA Spatial Multithreading): Een interessante innovatie is de mogelijkheid om kernbronnen fysiek te verdelen. Hierdoor kunnen datacenters de balans tussen pure rekenkracht en dichtheid optimaliseren op basis van de specifieke werklast van dat moment.
  • Focus op geheugenintensieve taken: De Vera is specifiek gebouwd voor taken waarbij het geheugen vaak de flessenhals is, zoals AI-pijplijnen, data-preparatie en HPC-simulaties (High-Performance Computing).
  • Supersnelle verbindingen: De tweede generatie van het NVIDIA Scalable Coherency Fabric (SCF) en NVLink-C2C zijn cruciaal. Deze zorgen voor een naadloze en razendsnelle gegevensuitwisseling tussen de CPU en GPU, waardoor een van de grootste knelpunten in moderne AI-systemen wordt weggenomen.

Hoewel de Vera-CPU zelfstandig kan werken voor cloud- en opslagtaken, is het uiteindelijke doel duidelijk: integratie met de nieuwe NVIDIA Rubin-GPU's. In die combinatie ontstaat een systeem met een gedeeld geheugen, wat essentieel is voor de meest complexe AI-modellen.

Vera-CPU: Specificaties die indruk maken

De technische specificaties van de Vera-CPU laten zien dat NVIDIA geen half werk levert.

De overstap naar 88 "Olympus"-kernen is een flinke verbetering ten opzichte van de 72 kernen in de vorige generatie. In combinatie met 1,5 TB aan LPDDR5X-geheugen richt NVIDIA zich hiermee vol op zware AI-werklasten. De keuze voor LPDDR5X in een SOCAMM-vormfactor is opvallend: het biedt een veel hogere bandbreedte en is aanzienlijk zuiniger dan het traditionele DDR5-geheugen. Dit onderstreept nogmaals de focus op prestaties per watt. Met maar liefst 227 miljard transistoren is het een van de meest complexe chips ooit gemaakt.

Het ecosysteem: Adoptie en NVIDIA's visie op de AI-cloud

De Vera-CPU is inmiddels in productie en de eerste klanten staan al in de rij. CoreWeave wordt genoemd als een van de eerste cloudaanbieders die systemen op basis van de NVIDIA Rubin-architectuur, inclusief de Vera-CPU, zal integreren in de tweede helft van 2026. NVIDIA heeft zelf 2 miljard dollar in CoreWeave geïnvesteerd, wat aangeeft dat deze samenwerking van groot strategisch belang is voor het bouwen van een wereldwijde AI-infrastructuur.

Voor grootschalige implementaties biedt NVIDIA de DGX Vera Rubin NVL72 aan. Dit is een compleet rack-systeem waarin 36 Vera-CPU's en 72 Rubin-GPU's worden gecombineerd met een duizelingwekkende 75 TB aan snel geheugen. Het is duidelijk dat NVIDIA niet alleen losse onderdelen wil verkopen, maar de complete motor van de toekomstige AI-wereld wil leveren.

Het is wel belangrijk om te benadrukken dat de Vera-CPU puur is ontwikkeld voor datacenters en AI-infrastructuur. Voorlopig zul je deze chip niet in je gaming-pc terugvinden. Hoewel NVIDIA werkt aan een eigen Arm-CPU voor consumenten (codenaam N1X), blijft de Vera het domein van de zakelijke markt.

De markt voor server-CPU's wordt hiermee interessanter dan ooit. Chips op basis van de Arm-architectuur winnen snel terrein en zullen naar verwachting in 2026 goed zijn voor ongeveer 9% van de omzet in deze sector. De intrede van NVIDIA met de Vera-CPU versnelt deze trend aanzienlijk. We verwachten dan ook een felle reactie van Intel en AMD om hun dominante positie te verdedigen. De Vera-CPU is een krachtig statement van NVIDIA, en het zal de manier waarop we over AI-computing denken ongetwijfeld veranderen.

Veelgestelde vragen

De Vera CPU biedt twee keer zoveel prestaties en efficiëntie bij gegevensverwerking, compressie en CI/CD-taken vergeleken met de vorige Grace-generatie. Deze verbetering wordt ondersteund door de op maat gemaakte Armv9.2-cores (in sommige rapporten "Olympus" genoemd), die 88 cores bieden vergeleken met de 72 cores in de Grace CPU.

De Vera CPU maakt deel uit van het Vera Rubin-platform van NVIDIA, dat officieel werd aangekondigd in 2024 voor een release in 2026. Sinds maart 2026 is de processor in volledige productie. CoreWeave zal naar verwachting een van de eerste providers zijn die deze systemen aanbiedt binnen zijn AI-cloudplatform, beginnend in de tweede helft van 2026.

De processor maakt gebruik van LPDDR5X-geheugen en ondersteunt een maximale capaciteit van 1,5 TB. Deze configuratie levert tot 1,2 TB/s aan bandbreedte met behoud van een hoge energie-efficiëntie, waarbij het geheugensubsysteem minder dan 50 watt verbruikt.

De Vera CPU heeft een geünificeerd monolithisch die-ontwerp, wat verschilt van de modulaire chiplet-architecturen die momenteel de voorkeur hebben van Intel en AMD voor hun serverprocessors. Deze aanpak met een enkele die is gericht op het maximaliseren van de energie-efficiëntie en doorvoer door de noodzaak voor communicatie tussen afzonderlijke silicium chiplets te elimineren.

Hoewel ontworpen voor nauwe integratie met Rubin-GPU's via NVLink-C2C, is de Vera CPU beschikbaar als een zelfstandig product voor taken zoals opslag, cloud-orkestratie en analyse. Het ondersteunt standaardinterfaces waaronder PCIe Gen6 en CXL 3.1 om compatibiliteit met diverse datacentrum-infrastructuren te garanderen.

De CPU is geoptimaliseerd voor "agentic reasoning", wat het coördineren van complexe gegevensverplaatsing en geheugentoewijzing over GPU-versnelde systemen omvat. Het bevat ook native FP8-ondersteuning om moderne AI-trainings- en inferentie-workloads indien nodig direct op de CPU te verwerken.

Reacties

Leesvoorkeuren
Lettergrootte
Vergelijkingstabel