7 vragen en antwoorden over DeepSeek
De Chinese chatbot DeepSeek doet de techwereld al een week opschudden. Vanwaar de opwinding? Wie zit er achter de nieuwe AI? En is het model echt open source? Antwoorden op de meest prangende vragen.
Vorige week zorgde een kunstmatige intelligentie (AI) uit China voor opschudding. Schijnbaar uit het niets katapulteerde DeepSeek naar de top van de app stores. Na de aanvankelijke paniek in Silicon Valley is het stof langzaam neergedaald en weten we meer. Tijd voor een recensie.
1. wat maakt DeepSeek speciaal
DeepSeek is een gratis AI-chatbot die vergelijkbaar is met bijvoorbeeld ChatGPT. Hij is beschikbaar als browserversie en als app. De bot is gebaseerd op DeepSeek R1 - een AI-model dat logisch "denken" ("reasoning engine") beheerst. Nieuwe versies van ChatGPT (OpenAI o1) en Google Gemini (Gemini 2.0 Flash Thinking) kunnen dit ook.
Volgens eigen informatie concurreert DeepSeek met de beste Amerikaanse modellen in verschillende benchmarks. De meningen van gebruikers en onafhankelijke experts zijn gemengd - afhankelijk van de toepassing levert DeepSeek of een andere AI waarschijnlijk de beste resultaten. Over het algemeen is de consensus echter dat de Chinese AI de gevestigde modellen kan bijbenen. Het is vooral sterk in technische taken zoals coderen.
2 Is DeepSeek R1 echt open source?
Ja. Je kunt het model downloaden en zelf lokaal uitvoeren. Maar DeepSeek R1 is alleen "Open Gewicht": De gegevens waaruit het zijn antwoorden genereert ("Weights") zijn openbaar toegankelijk. De onderliggende algoritmen en trainingsgegevens blijven echter achter slot en grendel. In een echt open source model zouden deze ook open zijn.
Het enige andere grote open-gewicht model is Llama van Meta. OpenAI, Google en Anthropic houden de broncodes van hun bots volledig voor zichzelf. Een groep op het Hugging Face platform probeert al een volledig open versie van DeepSeek te reproduceren. Open-gewicht en vooral open-source modellen kunnen dienen als bouwstenen voor nieuwe chatbots, waardoor ze makkelijker en goedkoper te ontwikkelen zijn.
3. Heeft DeepSeek gestolen van OpenAI?
Dit is een kwestie van perspectief. OpenAI en Microsoft hebben een onderzoek ingesteld. Ze hadden aanwijzingen dat DeepSeek eind 2024 via een ontwikkelaarsaccount grote hoeveelheden data heeft verkregen van ChatGPT. Deze gegevens werden vervolgens waarschijnlijk gebruikt om het eigen model van het bedrijf te trainen.
Deze techniek heet "distillatie" en is in strijd met de gebruiksvoorwaarden. Ontwikkelaars mogen de AI-modellen van OpenAI alleen via een interface in hun eigen applicaties integreren, maar mogen ze niet gebruiken om concurrerende producten te bouwen. Maar of dit überhaupt juridisch kan worden afgedwongen is een andere zaak.
De ironie is dat OpenAI, Google en co. zelf het hele internet hebben afgestruind zonder toestemming om hun modellen te trainen - en naar verluidt inbreuk hebben gemaakt op tonnen auteursrechten. De T in ChatGPT staat ook voor een "Transformer" model dat oorspronkelijk door Google is ontwikkeld. De sympathie voor Sam Altman is daarom zeer beperkt.
4. Hoe zit het met gegevensbescherming en censuur?
Volgens de eigen richtlijnen verzamelen de online versies van DeepSeek veel gebruikersgegevens. Onder andere:
- Emailadres, telefoonnummer, geboortedatum
- Chatgeschiedenis en alle invoer, inclusief "toetsaanslagpatronen"
- IP-adressen en technische informatie over je apparaat
Aan de ene kant gebruikt DeepSeek al deze informatie om de "veiligheid en stabiliteit" van zijn diensten te verbeteren. Aan de andere kant kunnen ze de gegevens ook delen met reclamepartners en deze "zo lang als nodig is" opslaan.
Andere chatbots verzamelen ook gegevens. De richtlijnen van OpenAI en Google lijken op elkaar. Het hoofdkantoor van DeepSeek in China roept echter extra zorgen op - of dat terecht of onterecht is, valt nog te bezien. Italië heeft daarom de app geblokkeerd, terwijl de Australische minister van Wetenschap Ed Husic ook tot voorzichtigheid maant.
Meer tastbaar is de inhoudelijke censuur van bepaalde thema's die in China als politiek gevoelig worden beschouwd. De bot blokkeert bijvoorbeeld vragen over het Plein van de Hemelse Vrede, Tibet of Xi Jinping, terwijl informatie over andere politieke figuren wel wordt verstrekt. De beperkingen kunnen met trucs worden omzeild, maar de antwoorden lijken politiek gekleurd.
Censuurbeschuldigingen worden niet alleen geuit tegen DeepSeek. Alle grote chatbots vermijden bepaalde thema's, zoals geweld en seksualiteit. En OpenAI is er ook van beschuldigd niet politiek neutraal te zijn.
5. Wie zit er achter DeepSeek?
Een ingenieur en ondernemer genaamd Liang Wenfeng. De Chinese tegenhanger van Sam Altman werd in 1985 geboren in Zhangjang en bezocht de gerenommeerde Zheijang Universiteit. In 2015 richtte hij met twee vrienden het hedgefonds High-Flyer op en verdiende een fortuin met AI-ondersteunde aandelenhandel. Op sommige momenten beheerde High-Flyer bijna 14 miljard US dollar.
In 2023 richtte Liang Wenfeng DeepSeek op met de winst van zijn hedgefonds. Hij stelde een team van jonge talenten samen en kocht op grote schaal AI-versnellers. De 40-jarige wordt gezien als een op technologie gerichte ideoloog. Hij wil de kloof van China met de VS dichten en zijn verklaarde doel is de ontwikkeling van Artificial General Intelligence (A.G.I.). Voor zover we kunnen zien heeft hij geen directe banden met de Chinese regering.
6. Waarom de eerste paniek op de aandelenmarkt?
Wall Street heeft de afgelopen twee jaar triljoenen Amerikaanse dollars geïnvesteerd in big tech in de hoop dat AI in de toekomst tot hoge winsten zal leiden. Dit lukt alleen als Microsoft, Google en co. hun chatbots uiteindelijk tegen een hoge prijs kunnen verkopen. DeepSeek daagt zowel dit businessmodel als de dominantie van de VS uit. De bekende durfkapitalist Marc Andreessen noemde R1 het "Spoetnik-moment van AI".
De grootste schok voor investeerders: DeepSeek rapporteert ontwikkelingskosten van slechts 5,6 miljoen dollar voor R1 en relatief weinig GPU-uren voor training. Tot nu toe was de conventionele wijsheid dat een goed model enorme hoeveelheden kapitaal, expertise, tijd en energie vereist. OpenAI's GPT-4o kostte meer dan 100 miljoen, terwijl Anthropic een bereik van 100 miljoen tot een miljard noemt voor een Claude trainingsmodel.
De Amerikaanse modellen vereisen de nieuwste H100 GPU's van Nvidia. In China zijn in theorie alleen oudere H800's beschikbaar vanwege een exportverbod. Er zijn echter indicaties dat DeepSeek via omwegen toch H100 versnellers heeft bemachtigd en ze in ieder geval heeft gebruikt voor het trainen van het model. De operatie draait naar verluidt op Huawei-chips
7. Is de opwinding terecht?
Analisten lopen hun mond hierover voorbij. Aan de ene kant kan DeepSeek de kosten van zijn model hebben verfraaid. En het lijkt op zijn minst gedeeltelijk gebaseerd op innovaties uit de VS. Aan de andere kant zijn onafhankelijke experts ook onder de indruk van de efficiëntie van DeepSeek. Dankzij slimme oplossingen haalt het model prestaties op het niveau van OpenAI o1 met aanzienlijk minder rekeninspanning.
De aflevering laat op zijn minst zien dat de marktleidende chatbots relatief eenvoudig te kopiëren zijn. Het valt nog te bezien of DeepSeek erin zal slagen om zich op de lange termijn aan de top te vestigen. Bovendien zijn de serverparken van OpenAI en co. niet opeens waardeloos. Ze blijven belangrijk voor het bevorderen van kunstmatige intelligentie. De aandelenkoersen van Amerikaanse bedrijven hadden zich vrijdag ook enigszins hersteld van hun crash.
De sterke reactie illustreert echter de nervositeit van beleggers. In de afgelopen jaren hebben de waarderingen van AI-gerelateerde bedrijven zich maar in één richting bewogen: omhoog. De gemiddelde koers-winstverhouding van Nvidia, Alphabet, Microsoft, Meta en Amazon is 38 - bijna twee keer zo hoog als het gemiddelde van de 500 grootste Amerikaanse bedrijven (S&P 500 Equal Weight). Afhankelijk van je standpunt zijn de dure techaandelen een investering in de toekomst of een kaartenhuis. De werkelijkheid zit er waarschijnlijk ergens tussenin.
Mijn vingerafdruk verandert vaak zo drastisch dat mijn MacBook hem niet meer herkent. De reden? Als ik me niet vastklamp aan een beeldscherm of camera, dan klamp ik me waarschijnlijk aan mijn vingertoppen vast aan een rotswand.