De kreet die deze week de ronde doet — "Google TurboQuant RAM price crash" — slaat de plank op twee cruciale punten volledig mis.
Ten eerste is TurboQuant geen RAM-product. Het betreft een compressie-algoritme van Google Research, aangekondigd op 24 maart 2026 via een blogpost en een wetenschappelijk paper, waarbij verdere details werden onthuld tijdens de AI at Scale-summit op 30 maart. Google omschrijft het als een methode om de KV-cache die gebruikt wordt bij de inferentie van grote taalmodellen (LLM's) te comprimeren, en breder als een techniek voor vector-kwantisatie bij geheugenintensieve workloads. Volgens Google zelf richt de techniek zich op een van de grootste knelpunten bij AI: de enorme geheugenoverhead, zeker naarmate context-vensters groter worden. De oorspronkelijke aankondiging is te vinden op het Google Research-blog, en diverse externe analyses, waaronder die van TechInformed, schetsen een vergelijkbaar beeld.
Ten tweede is er geen sprake van een prijsval bij DDR5-geheugen voor consumenten. Op 1 april vertoonden de Amerikaanse winkelprijzen voor DDR5 eerder een stabilisatie dan een instorting. Een 2x16GB DDR5-6000 CL30 kit kostte gemiddeld $529, wat slechts fractioneel lager is dan de range van $535–$550 die eind maart werd genoteerd. Dit komt overeen met bredere prijsindexen van Tom's Hardware en marktanalyses van DropReference.
Wat er wél gebeurde, was specifieker maar wel degelijk impactvol: aandelen van halfgeleiderfabrikanten in de geheugensector maakten een flinke duik na de aankondiging van Google en de daaropvolgende discussies.
Wat er werkelijk bewoog op de markt
De handelscijfers van eind maart laten een duidelijke marktreactie zien, ook al is de term "RAM-crash" feitelijk onjuist.
Micron werd het hardst getroffen tijdens de verkoopgolf in de VS. In twee dagen tijd kelderde het bedrijf met meer dan 14–15%, wat ruim $25 miljard aan marktwaarde liet verdampen. Deze daling zette door op 30 en 31 maart, waarbij de handel meerdere malen werd stilgelegd. Western Digital daalde met 11–13%, Seagate verloor ongeveer 9% en ook in Azië was de schade voelbaar: SK Hynix daalde met 6,2–6,4% op 26 maart, Samsung Electronics leverde zo’n 4,7% in en Kioxia zakte bijna 6%. CNBC vatte de regionale malaise goed samen door te rapporteren dat Zuid-Koreaanse geheugenfabrikanten en Kioxia onder druk kwamen te staan nadat Google's software-aankondiging beleggers angst aanjoeg over de toekomstige vraag naar hardwaregeheugen.
Hoewel dit niet bewijst dat TurboQuant de vraag naar geheugen daadwerkelijk zal doen krimpen, laat het wel zien dat handelaren het als een geloofwaardige bedreiging zagen — of in ieder geval als een reden om de hooggespannen verwachtingen te herijken.
De claims van TurboQuant en de zorgen van beleggers
De spectaculaire claims van Google zijn de reden dat dit nieuws zich zo snel verspreidde.
TurboQuant wordt gepresenteerd als een techniek die het geheugengebruik van de KV-cache met minstens een factor 6 verlaagt en in bepaalde workloads zorgt voor een versnelling tot 8x. Volgens het onderzoek combineert het systeem PolarQuant met Quantized Johnson-Lindenstrauss (QJL)-methoden. In de developer-community wordt de praktische kant benadrukt: de KV-cache kan worden teruggebracht naar ongeveer 3–4 bits per element zonder dat hertraining of fine-tuning nodig is, zoals beschreven in een samenvatting op Dev.to.
Dit is relevant omdat KV-cache een grote kostenpost is bij AI-inferentie. Als een model meer context kan onthouden met minder geheugen, kunnen exploitanten grotere workloads draaien op dezelfde hardware, meer sessies per GPU verwerken of de aanschaf van duurdere geheugenconfiguraties uitstellen. In theorie kan software-efficiëntie de vraag naar hardware van onderaf uithollen.
Dat is de theorie waar beleggers op anticipeerden door hun aandelen van de hand te doen.
De nuance: headline-cijfers zijn niet hetzelfde als de praktijk
Hier wordt de analyse wat genuanceerder, omdat de details er simpelweg toe doen.
De beschikbare onderzoeksteksten bevatten namelijk de nodige kanttekeningen:
Deze kanttekeningen wegen zwaarder dan de sensationele versie van het verhaal suggereert. Een labresultaat gericht op KV-cache compressie leidt niet automatisch tot een brede daling van de totale geheugenvraag. Het kan essentieel blijken voor specifieke inferentie-taken, maar nauwelijks relevant zijn voor andere, en het kan lastig blijken om het op grote schaal te implementeren zolang de tooling niet verbetert.
Sommige media vergeleken de situatie met de serie Silicon Valley en het fictieve Pied Piper, maar MakeMeTechie sloeg de spijker op de kop: vooralsnog gaat het om een resultaat in een laboratoriumfase.
Waarom de markt toch eerst verkocht
Ondanks alle onzekerheid was de uitverkoop op de beurs niet irrationeel. Het was snel, maar niet zonder logica.
Veel geheugenfabrikanten werden verhandeld op basis van het idee dat AI-training en -inferentie de sector in een langdurige groeicyclus zouden houden. TurboQuant raakte precies de zwakke plek in dat verhaal: wat als software de hoeveelheid benodigd geheugen per query of per model drastisch gaat verminderen?
Dit is ook hoe verschillende analisten het verwoordden.
Shawn Kim, analist bij Morgan Stanley, stelde dat hoewel TurboQuant het geheugengebruik per query kan verlagen, het ook de Jevons-paradox kan veroorzaken: doordat inferentie goedkoper wordt, kan het totale AI-gebruik zo hard stijgen dat de geaggregeerde vraag naar geheugen alsnog toeneemt. In die visie is TurboQuant op de lange termijn niet negatief voor de geheugensector, maar verschuift het enkel de kostenstructuur.
Andrew Rocha van Wells Fargo nam de zorgen directer serieus en stelde dat TurboQuant de kostencurve van AI-inferentie aanvalt. Dit roept de vraag op hoeveel geheugencapaciteit er op de lange termijn werkelijk nodig is als de systeemspecificaties omlaag kunnen.
Goldman Sachs-analist Peter Callahan beschreef de beweging eerder als een "sanity check" dan als paniek. Beleggers heroverwegen of de supercyclus in de geheugenmarkt standhoudt als er aanzienlijke efficiëntieslagen worden gemaakt via software.
Verschillende grootbanken verlaagden hun advies voor de geheugensector van Overweight naar Neutral, wijzend op een mogelijke structurele verschuiving in AI-investeringen van hardware-accumulatie naar software-optimalisatie.
Waarom dit niet over desktop-DDR5 gaat
Een belangrijke reden waarom de term "RAM-crash" misleidend is, is dat het verschillende markten op één hoop gooit.
TurboQuant wordt hoofdzakelijk besproken in de context van AI-inferentie, met name rondom de geheugendruk op GPU's en de KV-cache. De prestaties die in de documenten worden genoemd, verwijzen naar accelerators uit de NVIDIA H100- en B200-klasse. Dat is iets heel anders dan beweren dat normale DDR5-geheugenmodules voor je pc plotseling goedkoper moeten worden.
Zelfs als TurboQuant een succes wordt, zal het effect eerst zichtbaar zijn in de economie van serverparken, de benutting van accelerators en de planning van geheugenconfiguraties voor AI-systemen. De prijzen van consumenten-DDR5 hangen af van de pc-vraag, voorraden in de distributiekanalen, contractprijzen en de productiestrategie van leveranciers. Op dit moment is er simpelweg geen bewijs voor een crash in de winkel.
Het tegenargument: de vraag is al gereserveerd
Er is ook een praktische reden om de koersval niet als een voldongen feit voor de hele markt te zien.
Een woordvoerder van Micron liet weten dat de HBM4-capaciteit voor het hele jaar is uitverkocht via bindende contracten, inclusief de eerste overeenkomst met een looptijd van vijf jaar. Dit ontkracht de software-theorie niet, maar het suggereert wel dat de vraag op korte termijn ijzersterk blijft, vooral in de hoogwaardige segmenten van AI-geheugen.
Dit is het deel dat de markt vaak vergeet: een softwarematige doorbraak kan de vraagmodellen voor de lange termijn onder druk zetten, terwijl de huidige voorraad schaars, contractueel vastgelegd en duur blijft. Beide scenario's kunnen tegelijkertijd waar zijn.
Wat we nu in de gaten moeten houden
Om te bepalen of dit een blijvende trend in de geheugenmarkt is of slechts een scherpe overreactie, zijn de volgende zaken belangrijker dan sensationele koppen.
Ten eerste: de officiële implementatie. Op 1 april had Google nog geen officiële codebase of library vrijgegeven. Werk vanuit de community is waardevol, maar brede impact hangt af van eenvoudige implementatie en reproduceerbare benchmarks.
Ten tweede: onafhankelijke reproductie telt zwaarder dan claims in een blogpost. De getallen "6x" en "8x" vallen op, maar de echte vraag is wat er gebeurt onder standaard inferentie-instellingen, waarbij operators vaak al gebruikmaken van technieken met een lagere precisie.
Ten derde: kijk naar commentaren over HBM en accelerator-configuraties in plaats van naar de prijzen in de computerwinkel. Als TurboQuant de markt verandert, zal dat als eerste blijken uit de infrastructuurplannen voor AI-datacenters.
Ten slotte: verwar een beurscorrectie niet met een definitieve marktreset. Wat de markt overduidelijk heeft gedaan, is het risico inprijzen dat software de hardwarebehoefte kan temperen. Wat de markt nog niet heeft aangetoond, is een daadwerkelijke instorting van de RAM-prijzen of een bewezen daling in de vraag vanuit de praktijk.
Voorlopig is de conclusie helder: TurboQuant is belangrijk genoeg om te volgen, maar nog niet ver genoeg ontwikkeld om het debat over de geheugenmarkt te beslechten. Als de claims standhouden in productieomgevingen, komen geheugenleveranciers mogelijk onder druk te staan. Maar als de implementatie complex blijkt, of als goedkopere AI de vraag juist aanwakkert, dan kan de huidige verkoopgolf wel eens zwaar overdreven blijken te zijn. Het bewijs tot nu toe rechtvaardigt voorzichtigheid, maar zeker niet de term "RAM price crash."
Reacties