‘DeepSeek doet gevestigde AI-orde op zijn grondvesten trillen’

‘DeepSeek doet gevestigde AI-orde op zijn grondvesten trillen’

10 februari 2025 Consultancy.nl
‘DeepSeek doet gevestigde AI-orde op zijn grondvesten trillen’

De lancering van DeepSeek heeft de AI-wereld op zijn grondvesten doen trillen. Johan Traa, partner bij Boer & Croon, legt uit waarom de komst van de Chinese AI-pionier met recht kan worden gezien als een gamechanging moment voor de toekomst van kunstmatige intelligentie wereldwijd.

Terwijl Big Tech miljarden investeert in steeds grotere en duurdere AI-modellen en de Amerikaanse overheid met Project Stargate een strategische voorsprong op China dacht te kunnen behouden, komt het kleine DeepSeek uit het niets met krachtige AI-modellen. Ontwikkeld met een krap budget en zonder de modernste chips. En: open source.

Met deze aanpak is de muur doorbroken en kunnen universiteiten en ontwikkelaars hun eigen AI-omgeving opzetten. Met een hardwarebudget van minder dan €10.000 kunnen zij zelf verder ontwikkelen.

Nieuwe trainingsmethode

Een andere fundamentele verandering die DeepSeek heeft geïntroduceerd is de manier waarop AI-modellen worden getraind. Waar de meeste large language models vertrouwen op enorme hoeveelheden gelabelde data en supervised fine-tuning, heeft DeepSeek-R1 laten zien dat dit sterke redeneervermogen ook kan worden bereikt met een aanpak die puur gebaseerd is op reinforcement learning (RL).

‘DeepSeek doet gevestigde AI-orde op zijn grondvesten trillen’

Auteur Johan Traa is partner bij advieskantoor Boer & Croon

DeepSeek-R1-Zero is volledig getraind met RL en heeft een enorme sprong gemaakt in prestaties. Dit laat zien dat AI zelfstandig kan leren en generaliseren zonder afhankelijkheid van handmatig gelabelde datasets – een gamechanger die AI-ontwikkeling toegankelijker maakt voor partijen zonder gigantische datasets en annotatiecapaciteiten.

Slimmere en kleinere modellen

DeepSeek-R1 maakt gebruik van een chain of thought-benadering, waardoor AI stap-voor-stapredeneringen kan uitvoeren. Dat verbetert de probleemoplossende vaardigheden van modellen, met name op wiskundige en logische vraagstukken. Het model leert intern monologen te genereren die bijdragen aan een betere analyse en besluitvorming.

Daarnaast heeft DeepSeek bewezen dat grote modellen gedistilleerd kunnen worden naar kleinere modellen zonder significant prestatieverlies. Dit betekent dat krachtige AI-modellen niet per se enorme hardwarevereisten nodig hebben, waardoor ze breder toegankelijk worden

Lees ook: Henrik von Scheel and Paul Lalovich on DeepSeek’s rise and the future of AI.

Prestaties

Wat DeepSeek echt opmerkelijk maakt is dat hun modellen, ondanks hun relatief lage kosten, kunnen concurreren met de meest geavanceerde modellen van OpenAI en Google. DeepSeek-R1 scoort gelijkwaardig of zelfs beter op verschillende benchmarks, zoals wiskundige taken, codering en algemene kennis.

Daarnaast blinkt het model uit in creatief schrijven en complexe redeneertaken, wat bewijst dat een efficiëntere en democratischere AI-ontwikkeling niet ten koste hoeft te gaan van prestaties.

More on: Boer & Croon Management
Netherlands
Company profile
Boer & Croon Management is a Netherlands partner of Consultancy.org