Google TPU 8t en 8i zijn er: Zo verandert het AI-chiplandschap

De AI-chip race is heviger dan ooit. Google heeft zijn nieuwste TPU's gelanceerd: de 8t voor training en de 8i voor inferentie. Ze herdefiniëren hoe we AI-modellen op schaal draaien.

Wat zijn TPU's eigenlijk?

Een TPU (Tensor Processing Unit) is een ASIC — een chip die speciaal is ontworpen voor machine learning workloads. Dit in tegenstelling tot NVIDIA GPU's die general purpose zijn.

Het voordeel? Extreme efficiëntie voor precies de taken waarvoor ze gebouwd zijn.

Scale Up vs. Scale Out: Twee strategieën

Scale Up (Verticaal schalen)

Je maakt één chip krachtiger. Meer transistors, meer geheugen, snellere verbindingen.

Voordelen:

Minder communicatie-overhead tussen chips
Lagere latency voor enkelvoudige taken
Eenvoudiger programmeermodel

Nadelen:

Fysieke grenzen aan wat één chip kan
Extreem hoge kosten per chip

Scale Out (Horizontaal schalen)

Je verbindt veel chips met elkaar via Google's nieuwe Virgo Network — met enorme doorvoer als resultaat.

Voordelen:

Bijna onbeperkte schaalbaarheid
Betere kosten-efficiëntie op grote schaal

Nadelen:

Netwerkcommunicatie introduceert latency
Complexer om te programmeren

De TPU 8t en 8i in detail

TPU 8t (Training)

De 8t is geoptimaliseerd voor het trainen van grote modellen. Bij training verwerk je enorme hoeveelheden data in batches en update je continu de modelgewichten. Dit vereist hoge geheugenbandbreedtes, efficiënte gradient berekeningen en snelle chip-tot-chip communicatie via het Virgo Network.

TPU 8i (Inferentie)

De 8i focust op het draaien van al-getrainde modellen voor eindgebruikers. Inferentie heeft andere eisen: lage latency, hoge throughput en energieefficiëntie want je draait 24/7.

Het Virgo Network verbindt meerdere 8i-chips en maakt extreem hoge throughput mogelijk — essentieel als je miljoenen gebruikers tegelijkertijd bedient.

Het Economische Speelveld

De vraagcurve voor AI is steil. Naarmate modellen beter worden en meer mensen ze gebruiken, exploderen de kosten voor compute. Dit creëert een vicieuze cirkel:

Betere modellen → meer gebruikers
Meer gebruikers → meer inferentie kosten
Meer kosten → druk op efficiency
Efficiency-druk → nieuwe hardware zoals de TPU 8i

Google's strategie is helder: door het Virgo Network en gespecialiseerde chips te combineren, kunnen ze tokens goedkoper serveren dan NVIDIA-gebaseerde oplossingen — zeker op eigen Cloud infrastructure.

Implicaties voor de AI-industrie

Toenemende verticale integratie: Google controleert steeds meer van de stack — van hardware tot model tot cloud service.
Druk op NVIDIA: Elke efficiënte TPU-deployment is een potentiële GPU-sale die NVIDIA misloopt.
Democratisering via cloud: Kleine bedrijven huren toegang tot Google's TPU-clusters.
Specialisatie wint: De trend van ASIC's over GPU's voor AI zet door.

Conclusie

Google's TPU 8t en 8i zijn meer dan nieuwe chips — ze zijn een strategische zet in de AI-hardware race. Met het Virgo Network als backbone en duidelijke scheiding tussen training en inferentie, positioneert Google zich als serieuze challenger voor NVIDIA's dominantie.

De economie van AI-tokens wordt steeds interessanter — en Google speelt slim mee.

Deze blogpost is gebaseerd op een video van Caleb Williams. Bekijk de originele video.