Google’s TurboQuant jaagt beleggers schrik aan: De feiten over de vermeende RAM-crash

april 1, 2026 9 min lezen

Topic Hubs

Google DDR5

Samenvatting

Click to expand

Inhoudsopgave

Wat er werkelijk bewoog op de markt
De claims van TurboQuant en de zorgen van beleggers
De nuance: headline-cijfers zijn niet hetzelfde als de praktijk
Waarom de markt toch eerst verkocht
Waarom dit niet over desktop-DDR5 gaat
Het tegenargument: de vraag is al gereserveerd
Wat we nu in de gaten moeten houden

De kreet die deze week de ronde doet — "Google TurboQuant RAM price crash" — slaat de plank op twee cruciale punten volledig mis.

Ten eerste is TurboQuant geen RAM-product. Het betreft een compressie-algoritme van Google Research, aangekondigd op 24 maart 2026 via een blogpost en een wetenschappelijk paper, waarbij verdere details werden onthuld tijdens de AI at Scale-summit op 30 maart. Google omschrijft het als een methode om de KV-cache die gebruikt wordt bij de inferentie van grote taalmodellen (LLM's) te comprimeren, en breder als een techniek voor vector-kwantisatie bij geheugenintensieve workloads. Volgens Google zelf richt de techniek zich op een van de grootste knelpunten bij AI: de enorme geheugenoverhead, zeker naarmate context-vensters groter worden. De oorspronkelijke aankondiging is te vinden op het Google Research-blog, en diverse externe analyses, waaronder die van TechInformed, schetsen een vergelijkbaar beeld.

Ten tweede is er geen sprake van een prijsval bij DDR5-geheugen voor consumenten. Op 1 april vertoonden de Amerikaanse winkelprijzen voor DDR5 eerder een stabilisatie dan een instorting. Een 2x16GB DDR5-6000 CL30 kit kostte gemiddeld $529, wat slechts fractioneel lager is dan de range van $535–$550 die eind maart werd genoteerd. Dit komt overeen met bredere prijsindexen van Tom's Hardware en marktanalyses van DropReference.

Wat er wél gebeurde, was specifieker maar wel degelijk impactvol: aandelen van halfgeleiderfabrikanten in de geheugensector maakten een flinke duik na de aankondiging van Google en de daaropvolgende discussies.

Wat er werkelijk bewoog op de markt

De handelscijfers van eind maart laten een duidelijke marktreactie zien, ook al is de term "RAM-crash" feitelijk onjuist.

Micron werd het hardst getroffen tijdens de verkoopgolf in de VS. In twee dagen tijd kelderde het bedrijf met meer dan 14–15%, wat ruim $25 miljard aan marktwaarde liet verdampen. Deze daling zette door op 30 en 31 maart, waarbij de handel meerdere malen werd stilgelegd. Western Digital daalde met 11–13%, Seagate verloor ongeveer 9% en ook in Azië was de schade voelbaar: SK Hynix daalde met 6,2–6,4% op 26 maart, Samsung Electronics leverde zo’n 4,7% in en Kioxia zakte bijna 6%. CNBC vatte de regionale malaise goed samen door te rapporteren dat Zuid-Koreaanse geheugenfabrikanten en Kioxia onder druk kwamen te staan nadat Google's software-aankondiging beleggers angst aanjoeg over de toekomstige vraag naar hardwaregeheugen.

Hoewel dit niet bewijst dat TurboQuant de vraag naar geheugen daadwerkelijk zal doen krimpen, laat het wel zien dat handelaren het als een geloofwaardige bedreiging zagen — of in ieder geval als een reden om de hooggespannen verwachtingen te herijken.

De claims van TurboQuant en de zorgen van beleggers

De spectaculaire claims van Google zijn de reden dat dit nieuws zich zo snel verspreidde.

TurboQuant wordt gepresenteerd als een techniek die het geheugengebruik van de KV-cache met minstens een factor 6 verlaagt en in bepaalde workloads zorgt voor een versnelling tot 8x. Volgens het onderzoek combineert het systeem PolarQuant met Quantized Johnson-Lindenstrauss (QJL)-methoden. In de developer-community wordt de praktische kant benadrukt: de KV-cache kan worden teruggebracht naar ongeveer 3–4 bits per element zonder dat hertraining of fine-tuning nodig is, zoals beschreven in een samenvatting op Dev.to.

Dit is relevant omdat KV-cache een grote kostenpost is bij AI-inferentie. Als een model meer context kan onthouden met minder geheugen, kunnen exploitanten grotere workloads draaien op dezelfde hardware, meer sessies per GPU verwerken of de aanschaf van duurdere geheugenconfiguraties uitstellen. In theorie kan software-efficiëntie de vraag naar hardware van onderaf uithollen.

Dat is de theorie waar beleggers op anticipeerden door hun aandelen van de hand te doen.

De nuance: headline-cijfers zijn niet hetzelfde als de praktijk

Hier wordt de analyse wat genuanceerder, omdat de details er simpelweg toe doen.

De beschikbare onderzoeksteksten bevatten namelijk de nodige kanttekeningen:

Deze kanttekeningen wegen zwaarder dan de sensationele versie van het verhaal suggereert. Een labresultaat gericht op KV-cache compressie leidt niet automatisch tot een brede daling van de totale geheugenvraag. Het kan essentieel blijken voor specifieke inferentie-taken, maar nauwelijks relevant zijn voor andere, en het kan lastig blijken om het op grote schaal te implementeren zolang de tooling niet verbetert.

Sommige media vergeleken de situatie met de serie Silicon Valley en het fictieve Pied Piper, maar MakeMeTechie sloeg de spijker op de kop: vooralsnog gaat het om een resultaat in een laboratoriumfase.

Waarom de markt toch eerst verkocht

Ondanks alle onzekerheid was de uitverkoop op de beurs niet irrationeel. Het was snel, maar niet zonder logica.

Veel geheugenfabrikanten werden verhandeld op basis van het idee dat AI-training en -inferentie de sector in een langdurige groeicyclus zouden houden. TurboQuant raakte precies de zwakke plek in dat verhaal: wat als software de hoeveelheid benodigd geheugen per query of per model drastisch gaat verminderen?

Dit is ook hoe verschillende analisten het verwoordden.

Shawn Kim, analist bij Morgan Stanley, stelde dat hoewel TurboQuant het geheugengebruik per query kan verlagen, het ook de Jevons-paradox kan veroorzaken: doordat inferentie goedkoper wordt, kan het totale AI-gebruik zo hard stijgen dat de geaggregeerde vraag naar geheugen alsnog toeneemt. In die visie is TurboQuant op de lange termijn niet negatief voor de geheugensector, maar verschuift het enkel de kostenstructuur.

Andrew Rocha van Wells Fargo nam de zorgen directer serieus en stelde dat TurboQuant de kostencurve van AI-inferentie aanvalt. Dit roept de vraag op hoeveel geheugencapaciteit er op de lange termijn werkelijk nodig is als de systeemspecificaties omlaag kunnen.

Goldman Sachs-analist Peter Callahan beschreef de beweging eerder als een "sanity check" dan als paniek. Beleggers heroverwegen of de supercyclus in de geheugenmarkt standhoudt als er aanzienlijke efficiëntieslagen worden gemaakt via software.

Verschillende grootbanken verlaagden hun advies voor de geheugensector van Overweight naar Neutral, wijzend op een mogelijke structurele verschuiving in AI-investeringen van hardware-accumulatie naar software-optimalisatie.

Waarom dit niet over desktop-DDR5 gaat

Een belangrijke reden waarom de term "RAM-crash" misleidend is, is dat het verschillende markten op één hoop gooit.

TurboQuant wordt hoofdzakelijk besproken in de context van AI-inferentie, met name rondom de geheugendruk op GPU's en de KV-cache. De prestaties die in de documenten worden genoemd, verwijzen naar accelerators uit de NVIDIA H100- en B200-klasse. Dat is iets heel anders dan beweren dat normale DDR5-geheugenmodules voor je pc plotseling goedkoper moeten worden.

Zelfs als TurboQuant een succes wordt, zal het effect eerst zichtbaar zijn in de economie van serverparken, de benutting van accelerators en de planning van geheugenconfiguraties voor AI-systemen. De prijzen van consumenten-DDR5 hangen af van de pc-vraag, voorraden in de distributiekanalen, contractprijzen en de productiestrategie van leveranciers. Op dit moment is er simpelweg geen bewijs voor een crash in de winkel.

Het tegenargument: de vraag is al gereserveerd

Er is ook een praktische reden om de koersval niet als een voldongen feit voor de hele markt te zien.

Een woordvoerder van Micron liet weten dat de HBM4-capaciteit voor het hele jaar is uitverkocht via bindende contracten, inclusief de eerste overeenkomst met een looptijd van vijf jaar. Dit ontkracht de software-theorie niet, maar het suggereert wel dat de vraag op korte termijn ijzersterk blijft, vooral in de hoogwaardige segmenten van AI-geheugen.

Dit is het deel dat de markt vaak vergeet: een softwarematige doorbraak kan de vraagmodellen voor de lange termijn onder druk zetten, terwijl de huidige voorraad schaars, contractueel vastgelegd en duur blijft. Beide scenario's kunnen tegelijkertijd waar zijn.

Wat we nu in de gaten moeten houden

Om te bepalen of dit een blijvende trend in de geheugenmarkt is of slechts een scherpe overreactie, zijn de volgende zaken belangrijker dan sensationele koppen.

Ten eerste: de officiële implementatie. Op 1 april had Google nog geen officiële codebase of library vrijgegeven. Werk vanuit de community is waardevol, maar brede impact hangt af van eenvoudige implementatie en reproduceerbare benchmarks.

Ten tweede: onafhankelijke reproductie telt zwaarder dan claims in een blogpost. De getallen "6x" en "8x" vallen op, maar de echte vraag is wat er gebeurt onder standaard inferentie-instellingen, waarbij operators vaak al gebruikmaken van technieken met een lagere precisie.

Ten derde: kijk naar commentaren over HBM en accelerator-configuraties in plaats van naar de prijzen in de computerwinkel. Als TurboQuant de markt verandert, zal dat als eerste blijken uit de infrastructuurplannen voor AI-datacenters.

Ten slotte: verwar een beurscorrectie niet met een definitieve marktreset. Wat de markt overduidelijk heeft gedaan, is het risico inprijzen dat software de hardwarebehoefte kan temperen. Wat de markt nog niet heeft aangetoond, is een daadwerkelijke instorting van de RAM-prijzen of een bewezen daling in de vraag vanuit de praktijk.

Voorlopig is de conclusie helder: TurboQuant is belangrijk genoeg om te volgen, maar nog niet ver genoeg ontwikkeld om het debat over de geheugenmarkt te beslechten. Als de claims standhouden in productieomgevingen, komen geheugenleveranciers mogelijk onder druk te staan. Maar als de implementatie complex blijkt, of als goedkopere AI de vraag juist aanwakkert, dan kan de huidige verkoopgolf wel eens zwaar overdreven blijken te zijn. Het bewijs tot nu toe rechtvaardigt voorzichtigheid, maar zeker niet de term "RAM price crash."

Laatste Berichtgeving

Achtergrondlectuur

Eerdere Berichtgeving

Microsoft herstelt de koers: Waarom de agressieve AI-push in Windows 11 mislukte

News Feb 3 7 min

China geeft groen licht voor Nvidia H200: Een strategisch AI-compromis

News Jan 28 5 min

PlayStation 6 uitgesteld tot 2030? Waarom de AI-boom en de 'RAMpocalyps' roet in het eten gooien

News Jan 25 8 min

Nieuwe AI-regels op Steam: Wat de deadline van 16 januari betekent voor de game-industrie

News Jan 20 9 min

CES 2026: Hoe 'AI-washing' en loze beloftes het tech-vertrouwen slopen

News Jan 19 7 min

Veelgestelde vragen

Nee, TurboQuant is geen hardwareproduct. Het is een compressie-algoritme van Google Research dat op 24 maart 2026 werd gepresenteerd. Het is specifiek ontworpen voor de compressie van de KV-cache bij het gebruik van grote taalmodellen (LLM's). Meer in het algemeen wordt het omschreven als een vector-kwantiseringstechniek voor geheugenintensieve processen.

Nee, van een prijsval was geen sprake; de prijzen voor consumenten bleven eerder stabiel. Op 1 april kostte een gemiddelde 2x16GB DDR5-6000 CL30 kit zo'n $529. Dat is slechts een fractie lager dan de prijsrange van $535 tot $550 die we eind maart zagen — lang niet de dramatische crash waar online over gespeculeerd werd.

In de VS werd Micron het hardst getroffen met een daling van meer dan 14-15% in twee dagen tijd. Western Digital zakte met 11-13% en Seagate verloor ongeveer 9%. De verkoopgolf breidde zich ook uit naar Azië, waar SK Hynix 6,2-6,4% inleverde, Samsung Electronics met 4,7% daalde en Kioxia bijna 6% omlaag ging.

Google claimt dat TurboQuant het geheugengebruik van de KV-cache met minstens een factor zes verlaagt en in bepaalde gevallen de snelheid van attention-workloads tot acht keer verhoogt. Volgens analyses uit de community kan de KV-cache hiermee worden gecomprimeerd tot ongeveer 3 à 4 bits per element zonder dat hertraining van het model nodig is. Wel wordt opgemerkt dat die factor zes een theoretisch maximum kan zijn en dat de daadwerkelijke winst in de praktijk lager kan uitvallen, afhankelijk van de gekozen precisie.

Dat komt doordat de KV-cache een enorme kostenpost is bij AI-inferentie. TurboQuant zet vraagtekens bij de aanname dat de vraag naar geheugen altijd in hetzelfde tempo moet blijven groeien. Handelaren grepen het nieuws direct aan om de hooggespannen verwachtingen rond de vraag naar geheugenchips te herzien, ondanks dat de resultaten in de praktijk nog kunnen afwijken van de eerste spectaculaire cijfers.

Nee. Op 1 april 2026 had Google nog geen officiële open-source code, library of integratie voor productiemodellen vrijgegeven. Wel zijn er inmiddels al implementaties vanuit de community beschikbaar via projecten zoals llama.cpp en MLX.

Reacties

Leesvoorkeuren

Lettergrootte

Mijn bladwijzers

Google’s TurboQuant jaagt beleggers schrik aan: De feiten over de vermeende RAM-crash

Wat er werkelijk bewoog op de markt

De claims van TurboQuant en de zorgen van beleggers

De nuance: headline-cijfers zijn niet hetzelfde als de praktijk

Waarom de markt toch eerst verkocht

Waarom dit niet over desktop-DDR5 gaat

Het tegenargument: de vraag is al gereserveerd

Wat we nu in de gaten moeten houden

Laatste Berichtgeving

Achtergrondlectuur

Eerdere Berichtgeving

Laatste artikelen

Elden Ring: Tarnished Edition voor Switch 2 duikt op met fors prijskaartje

Lek onthult enorme Ray Tracing-boost voor NVIDIA RTX 60-serie

Zo ontgrendel je de White Bear mount in Crimson Desert: Stap-voor-stap gids

Sony gooit prijzen PS5 fors omhoog: PS5 Pro kost voortaan bijna 900 dollar

Crimson Desert-update 1.01.00: Nieuwe mounts en belangrijke verbeteringen

More Articles

xAI onder vuur: NAACP klaagt Elon Musk aan wegens illegale luchtvervuiling

Autodesk klaagt Google aan: Miljardenstrijd om AI-merknaam 'Flow'

AMD kiest voor marketingkanon: Kan Ariel Kelman de AI-strijd van NVIDIA winnen?