Hardware

Kampfansage an Intel & AMD: NVIDIA startet Massenproduktion der Vera CPU

Januar 28, 2026 6 Min. Lesezeit

Topic Hubs

NVIDIA

Kurzzusammenfassung

Click to expand

Inhaltsverzeichnis

NVIDIAs mutiger Vorstoß: Die Vera CPU stürmt das Server-Segment
Engineering für das KI-native Rechenzentrum
Vera CPU: Spezifikationen, die aufhorchen lassen
Das Ökosystem: Adaption und NVIDIAs Vision der KI-Cloud

NVIDIAs mutiger Vorstoß: Die Vera CPU stürmt das Server-Segment

NVIDIA, ein Unternehmen, das bisher vor allem für seine Dominanz im GPU-Sektor bekannt war, bläst nun zum direkten Angriff auf den lukrativen Markt für Hochleistungs-CPUs. Mit dem Start der NVIDIA Vera CPU – einem Arm-basierten Prozessor, der sich seit dem ersten Quartal 2026 in der Massenproduktion befindet – liefert das Unternehmen mehr als nur ein neues Produkt ab. Es ist eine strategische Kampfansage an etablierte Giganten wie Intel (Xeon), AMD (EPYC) und sogar Amazons hauseigene Graviton-Chips. Jensen Huangs Ziel, NVIDIA zu einem führenden CPU-Anbieter zu machen, ist längst kein Geheimnis mehr. Die Vera CPU bildet das Fundament dieser Vision und transformiert NVIDIA endgültig zu einem „allumfassenden Computing-Ökosystem“.

Benannt nach der wegweisenden US-amerikanischen Astronomin Vera Florence Cooper Rubin, wurde dieser Chip gezielt für die explodierenden Anforderungen der Künstlichen Intelligenz entwickelt. Während die Grace-CPU bisher meist fest in Grace-Hopper-Superchips integriert war, signalisiert die Verfügbarkeit der Vera CPU als eigenständiges Produkt einen Paradigmenwechsel. Dies ermöglicht Rechenzentrumsbetreibern eine deutlich höhere Flexibilität bei der Gestaltung ihrer KI-Infrastruktur. Die Ankündigung sorgte prompt für Unruhe an der Börse und ließ die Aktienkurse von Intel und AMD zeitweise einknicken.

Engineering für das KI-native Rechenzentrum

Im Kern ist die Vera CPU darauf ausgelegt, als zentrale Steuereinheit in Full-Stack-KI-Architekturen zu fungieren. Ihre Hauptaufgabe liegt im sogenannten „Agentic Reasoning“ – einer kritischen Funktion zur Koordination riesiger Datenströme, der Speicherzuweisung und komplexer Workflows über GPU-beschleunigte Systeme hinweg. Das Ziel: sicherzustellen, dass die kostspieligen GPUs niemals im Leerlauf stehen. Dieser Fokus unterstreicht NVIDIAs Erkenntnis, dass selbst die stärksten Grafikprozessoren durch ineffiziente CPU-Orchestrierung ausgebremst werden können.

Hier sind die wichtigsten Highlights der Vera CPU, kombiniert mit einer gesunden Portion Skepsis:

Optimiert für KI: NVIDIA verspricht höchste Effizienz sowohl beim Training als auch bei der Inferenz, von multimodalen KI-Agenten bis hin zu Aufgaben mit langem Kontext. Angesichts der KI-Expertise von NVIDIA ist dies wenig überraschend, doch erst unabhängige Praxistests werden die tatsächlichen Effizienzgewinne belegen müssen.
Leistungssprung: Die Angabe einer „doppelten Performance und Effizienz in der Datenverarbeitung, Kompression und CI/CD im Vergleich zur NVIDIA Grace CPU“ ist beeindruckend. Bereits die Grace-CPU mit ihren 72 Arm Neoverse V2-Kernen war gegenüber x86-Konkurrenten konkurrenzfähig. Die Verdoppelung dieser Leistung durch 88 maßgeschneiderte „Olympus“ Armv9.2-Kerne positioniert Vera als ernsthaften Herausforderer. Wir werden genau beobachten, wie sich dies gegen die neuesten x86-Flaggschiffe schlägt.
Energieeffizienz: „Branchenführende Energieeffizienz“ ist das Schlagwort für Hyperscaler, bei denen Strom- und Kühlkosten massiv ins Gewicht fallen. Grace lieferte oft die doppelte Leistung im gleichen Energiebudget wie die Konkurrenz – Vera soll diesen Vorsprung weiter ausbauen.
Monolithische Architektur: NVIDIA setzt auf ein einheitliches, monolithisches Die-Design, um Durchsatz und Effizienz zu maximieren und die GPU-Auslastung durch Vermeidung von Cross-Chiplet-Kommunikation zu optimieren. Dies steht im Gegensatz zum Chiplet-Trend von AMD und Intel, der Vorteile bei der Fertigungsausbeute bietet. NVIDIA geht hier eine riskante Wette ein: Integration schlägt Modularität.
Advanced Multithreading (NVIDIA Spatial Multithreading): Die physische Partitionierung von Kern-Ressourcen zur Laufzeitoptimierung zwischen Performance und Dichte ist ein spannender Ansatz. Dies ermöglicht Rechenzentren eine feinjustierte Ressourcenverteilung je nach Arbeitslast.
Exzellenz bei speichergebundenen Workloads: Vera ist für speicherintensive Aufgaben wie Datenaufbereitung, KV-Cache-Management und HPC-Simulationen prädestiniert. Damit adressiert NVIDIA direkt den Speicher-Flaschenhals moderner KI-Anwendungen.
Hochgeschwindigkeits-Interconnects: Die zweite Generation der NVIDIA Scalable Coherency Fabric (SCF) mit 3,4 TB/s Bandbreite und NVLink-C2C mit 1,8 TB/s sind essenziell. Diese Verbindungen garantieren einen nahtlosen Datenaustausch und lösen das Problem des Datentransfers in hochgradig beschleunigten Systemen.

Obwohl die Vera CPU als Standalone-Lösung für Analytik, Cloud-Orchestrierung und Speicher fungieren kann, liegt ihre wahre Bestimmung in der Kopplung mit NVIDIA Rubin GPUs. In dieser Kombination schafft NVLink-C2C effektiv ein System mit einheitlichem Speicher und hardwareseitiger Isolierung – ein mächtiges Argument für KI-Systeme.

Vera CPU: Spezifikationen, die aufhorchen lassen

Die technischen Daten der Vera CPU unterstreichen die ambitionierten Ziele.

Die 88 spezialisierten „Olympus“-Kerne stellen ein deutliches Upgrade gegenüber den 72 Kernen der Grace-CPU dar. In Kombination mit bis zu 1,5 TB LPDDR5X-Speicher (im SOCAMM-Formfaktor) zielt NVIDIA direkt auf speicherintensive KI-Workloads ab. LPDDR5X bietet eine 2,5-mal höhere Bandbreite bei deutlich geringerem Stromverbrauch im Vergleich zu klassischem DDR5-Speicher. Die schiere Komplexität des Designs mit 227 Milliarden Transistoren verdeutlicht die Leistungsfähigkeit, wirft aber auch Fragen nach der Fertigungseffizienz auf.

Die native FP8-Unterstützung ist ein zukunftsorientiertes Feature, das direkt auf die Anforderungen moderner KI-Modelle zugeschnitten ist und die Effizienz bei CPU-basierten KI-Aufgaben massiv steigert.

Das Ökosystem: Adaption und NVIDIAs Vision der KI-Cloud

Die Vera CPU befindet sich bereits in der vollen Produktion. Ein entscheidender Faktor für den Erfolg wird die frühe Adaption durch Partner sein. CoreWeave wurde als einer der ersten Cloud-Anbieter vorgestellt, der Rubin-basierte Systeme inklusive der Vera CPU bis zur zweiten Jahreshälfte 2026 in seine Plattform integrieren wird. NVIDIAs Investition von 2 Milliarden US-Dollar in CoreWeave festigt diese Partnerschaft und zeigt, dass es hier um mehr als nur den Verkauf von Chips geht: NVIDIA baut ein komplettes KI-Cloud-Ökosystem auf, in dem ihre Hardware das Fundament bildet.

Für den Einsatz in großem Maßstab bietet die NVIDIA DGX Vera Rubin NVL72 eine schlüsselfertige Lösung. Dieses Rack-System integriert 36 Vera CPUs und 72 Rubin GPUs mit insgesamt 75 TB schnellem Speicher. Es ist offensichtlich, dass NVIDIA nicht nur CPUs verkauft, sondern hochintegrierte Full-Stack-Lösungen.

Wichtig ist der Hinweis, dass die Vera CPU rein für die Infrastruktur von Rechenzentren konzipiert ist – sie ist kurzfristig kein Produkt für Gaming-PCs oder Endverbraucher. Während NVIDIA separat an einer PC-CPU (Codename N1X) arbeitet, bleibt Vera fest im Enterprise-Sektor verankert.

Der Markt für Server-CPUs heizt sich spürbar auf. Arm-basierte Chips gewinnen an Boden und könnten bis 2027 einen Marktanteil von 10-12 % erreichen, da Cloud-Anbieter verstärkt auf Energieeffizienz setzen. Laut der Dell'Oro Group eroberten Arm-CPUs bereits im zweiten Quartal 2025 ein Viertel des Marktes, stark getrieben durch NVIDIAs Grace-Blackwell-Plattformen. Auch wenn das Ziel von 50 % Marktanteil bis Ende 2025 ehrgeizig bleibt, verleiht NVIDIA dem Arm-Ökosystem mit der Vera CPU massives Gewicht. Es steht ein harter Konkurrenzkampf mit den x86-Platzhirschen bevor, und wir sind gespannt, wie Vera die Landschaft des KI-Computings umgestalten wird.

Aktuelle Berichterstattung

Hintergrundlektüre

Guides & Reviews

Frühere Berichterstattung

AMD bestätigt Ryzen 9 9950X3D2: 16-Kern-Flaggschiff mit massivem Dual V-Cache offiziell

Hardware Mar 26 8 min

Intel Core Ultra 9 290K Plus gestrichen: Flaggschiff fehlt beim Desktop-Refresh

Hardware Mar 26 11 min

Razer Blade 16 (2026): High-End-Update mit Intel Panther Lake und RTX 5090

Hardware Mar 26 10 min

AMD und Intel: CPU-Preise steigen im April um bis zu 15 Prozent

Hardware Mar 26 9 min

Häufig gestellte Fragen

Die Vera CPU bietet die doppelte Leistung und Effizienz bei der Datenverarbeitung, Kompression und CI/CD-Aufgaben im Vergleich zur vorherigen Grace-Generation. Diese Verbesserung wird durch ihre maßgeschneiderten Armv9.2-Kerne (in einigen Berichten als „Olympus“ bezeichnet) unterstützt, die 88 Kerne bieten, verglichen mit den 72 Kernen der Grace CPU.

Die Vera CPU ist Teil von NVIDIAs Vera-Rubin-Plattform, die offiziell im Jahr 2024 für eine Veröffentlichung im Jahr 2026 angekündigt wurde. Seit März 2026 befindet sich der Prozessor in der Serienproduktion. Es wird erwartet, dass CoreWeave zu den ersten Anbietern gehört, die diese Systeme ab der zweiten Jahreshälfte 2026 in ihrer KI-Cloud-Plattform anbieten.

Der Prozessor verwendet LPDDR5X-Speicher und unterstützt eine maximale Kapazität von 1,5 TB. Diese Konfiguration liefert eine Bandbreite von bis zu 1,2 TB/s bei gleichzeitig hoher Energieeffizienz, wobei das Speicher-Subsystem weniger als 50 Watt verbraucht.

Die Vera CPU verfügt über ein einheitliches monolithisches Die-Design, das sich von den modularen Chiplet-Architekturen unterscheidet, die derzeit von Intel und AMD für ihre Serverprozessoren bevorzugt werden. Dieser Single-Die-Ansatz zielt darauf ab, die Energieeffizienz und den Durchsatz zu maximieren, indem die Kommunikation zwischen separaten Silizium-Chiplets überflüssig wird.

Obwohl sie für eine enge Integration mit Rubin-GPUs über NVLink-C2C konzipiert wurde, ist die Vera CPU als eigenständiges Produkt für Aufgaben wie Storage, Cloud-Orchestrierung und Analytik erhältlich. Sie unterstützt Standardschnittstellen wie PCIe Gen6 und CXL 3.1, um die Kompatibilität mit verschiedenen Rechenzentrumsinfrastrukturen zu gewährleisten.

Die CPU ist für „Agentic Reasoning“ optimiert, was die Koordination komplexer Datenbewegungen und Speicherzuweisungen in GPU-beschleunigten Systemen umfasst. Sie bietet zudem native FP8-Unterstützung, um moderne KI-Trainings- und Inferenz-Workloads bei Bedarf effizient direkt auf der CPU zu verarbeiten.

Kommentare

Leseeinstellungen

Schriftgröße

Meine Lesezeichen

Kampfansage an Intel & AMD: NVIDIA startet Massenproduktion der Vera CPU

NVIDIAs mutiger Vorstoß: Die Vera CPU stürmt das Server-Segment

Engineering für das KI-native Rechenzentrum

Vera CPU: Spezifikationen, die aufhorchen lassen

Das Ökosystem: Adaption und NVIDIAs Vision der KI-Cloud

Aktuelle Berichterstattung

Hintergrundlektüre

Guides & Reviews

Frühere Berichterstattung

Neueste Artikel

Elden Ring: Tarnished Edition – Preis und Details zur Switch-2-Version aufgetaucht

Google TurboQuant: Faktencheck zum angeblichen RAM-Preissturz

RTX 60-Serie: Leaks versprechen enorme Raytracing-Power mit Rubin-Architektur

Crimson Desert: So schaltet ihr das Weiße Bären-Mount in Pailune frei

PS5 Pro Preisschock: Sony erhöht Preise für PlayStation 5 massiv

More Articles

Nvidia macht Rückzieher: Warum der 100-Milliarden-Deal mit OpenAI schrumpft

SOCAMM2: AMD und Qualcomm planen die KI-Speicher-Revolution für 2026