Achtergrond

Captcha's: ben ik misschien toch een robot?

22-6-2024

Vertaling: machinaal vertaald

Telt deze hoek nog steeds als verkeerslicht? Is dat een "I" of een "l"? Iedereen die internet gebruikt zal zichzelf deze en soortgelijke vragen hebben gesteld. De reden: captcha's. Waar gaan deze internetpuzzels eigenlijk over en waarom zijn ze soms zo moeilijk?

"Ik ben geen robot," staat er op het scherm voor me. Ik vink het vakje aan en er verschijnt een beeldpuzzel. "Selecteer alle vakjes met verkeerslichten," wordt me gevraagd. Hm ... Alleen de verkeerslichten of ook de paal waaraan ze vastzitten? En hoe zit het met het kleine stukje verkeerslicht dat voor mijn gevoel drie pixels van het veld in de linkerbovenhoek in beslag neemt?

Deze beeldpuzzels kunnen ook heel frustrerend zijn.
Bron: Google / Dayan Pfammatter

Ironisch eigenlijk: bijna elke dag moeten we bewijzen dat we geen robots zijn - aan robots! En wat ooit eenvoudige foto's en vervormde letters waren, zijn nu door AI gegenereerde afbeeldingen van dieren of letterlijke puzzels die we moeten onderscheiden en oplossen.

Maar waarom worden deze captcha's steeds moeilijker? En is er geen betere oplossing?

Wat is een captcha eigenlijk?

Captcha - of eigenlijk "CAPTCHA" - is een afkorting en staat voor "Cvolledig Ageautomatiseerd Ppublieke Ttest om Ccomputers en Hmensen Adeel te laten nemen". Met andere woorden, een geautomatiseerde Turingtest die je in het beste geval als persoon identificeert. Maar in het ergste geval maakt het je leven alleen maar moeilijk.

Je kunt waarschijnlijk al raden waarom dit nodig is op internet. Het doel van captcha's is om websites te beschermen tegen botaanvallen. En in het verleden waren beeldpuzzels en vervormde letters een relatief veilige methode om bots buiten te houden.

In het verleden bestond de captcha alleen uit onleesbare woorden.
Bron: reCaptcha / Dayan Pfammatter

Tien jaar geleden gaf Google in zijn eigen beveiligingsblog echter toe dat bots ook in staat waren om de toenmalige captcha's op te lossen - met een nauwkeurigheid van bijna 100 procent. Er was een nieuwe oplossing nodig.

Mens versus machine: een nek-aan-nek race

Terwijl we langzaam maar zeker gewend zijn geraakt aan stoplichten en motoren, zijn de AI-tools voor beeldherkenning ook verbeterd. Zelfs de lastigste puzzels kunnen nu door bots worden opgelost, zoals "MIT Technology Review" schrijft. En in het ergste geval schakelt de AI gewoon een echt persoon in om de captcha op te lossen. Dit is echt eerder gebeurd.

Voor moderne AI-tools zoals ChatGPT zijn captcha's kinderspel.
Bron: Unsplash / Solen Feyissa

Wat doen we als elke puzzel en elke taak in de captcha's ook door robots kan worden opgelost? Google zegt: "Dood aan puzzels!"

Wat de robots niet kunnen

Google's "reCaptchas" is waarschijnlijk de meest succesvolle oplossing voor het captcha-probleem tot nu toe. Deze worden gebruikt op vijf miljoen actieve websites en vormen ook veruit het grootste deel van de captcha's volgens "Spiegel". Je kunt deze herkennen aan het feit dat je alleen het vakje hoeft te selecteren, maar geen puzzel meer hoeft op te lossen.

De reCaptchas verifiëren je menselijkheid niet met lastige puzzels, maar met je gedrag. Google beschrijft dit in de Security Blog als volgt: "We hebben een geavanceerde risicoanalyse backend ontwikkeld voor reCcaptcha die actief rekening houdt met de volledige interactie van een gebruiker met de captcha - voor, tijdens en na - om te bepalen of die gebruiker menselijk is."

Google's reCaptcha maakt je leven zeker gemakkelijker, maar tegen welke prijs?
Bron: Google / Dayan Pfammatter

Concreet betekent dit dat de captcha je gedrag analyseert. Bijvoorbeeld, hoe je je muis naar het veld beweegt of wat je eerder deed in de browser wordt in een paar seconden geanalyseerd. Een bot zou de muis met een constante snelheid en in een rechte lijn hebben bewogen en niet eerder een pestorecept hebben gegoogled. Vervolgens wordt de waarschijnlijkheid berekend dat je een mens bent en geen robot.

In de meeste gevallen is dat het en ben je binnen. Alleen als de waarschijnlijkheid niet hoog genoeg is, moet je voor de zekerheid nog een puzzel oplossen.

"Maar captcha's trainen toch alleen AI?"

Nee. Er wordt al jaren gespeculeerd dat we AI-modellen leren wat stoplichten, verkeersborden en motoren zijn. Google heeft in het verleden zelf al toegegeven dat de gegevens van reCaptchas ook worden gebruikt om OCR-tekstherkenning en Google Street View te verbeteren.

Niet alleen wij mensen, ook Tesla's Autopilot moet verkeersborden kunnen herkennen.
Bron: Screenshot / Tesla

Toen de industrie van zelfrijdende auto's op gang kwam, verschenen er ook captcha's met stoplichten. Relevante XKCD. Maar hoewel aangenomen kan worden dat we de captcha's gebruiken om de huidige AI-modellen te trainen en Teslas te leren rijden, is deze aanname nooit bevestigd.

Moet ik nu wel of niet op de paal van het stoplicht klikken?

Captcha's zijn al sinds het begin van de jaren 2000 een belangrijk onderdeel van het internet. Uit een project uit 2006 bleek dat er dagelijks 200 miljoen captcha's worden opgelost. Met 10 seconden per puzzel is dat 150.000 uur, of meer dan 17 jaar (!) puzzelen per dag. Hoe deze cijfers er vandaag de dag uitzien is voor iedereen een raadsel.

Met nieuwe ontwikkelingen zoals Google's reCaptcha zou je in de toekomst echter steeds minder captcha's moeten oplossen. Bovendien worden er nu al technologieën ontwikkeld die de captcha mogelijk helemaal overbodig kunnen maken.

En tot die tijd: Nee. De mast telt niet als stoplicht.

Captcha's zijn meestal niet al te streng met je afbeeldingsselectie. Als je nog wat tijd te doden hebt en je captcha-vaardigheden wilt opfrissen, kun je de meest voorkomende captcha's om uit te proberen hier vinden.

51 mensen vinden dit artikel leuk

Dayan Pfammatter

Freelance Editor

pf.dayan@gmail.com

Zolang ik me kan herinneren ben ik gefascineerd door alles met knoppen, displays en luidsprekers. Als journalist gespecialiseerd in technologie en maatschappij schep ik orde in de jungle van tech-jargon en verwarrende spec sheets.

Deze artikelen kunnen je ook interesseren

Achtergrond
7 vragen en antwoorden over DeepSeek
van Samuel Buchmann
Achtergrond
Beproefd en getest: Wat kan Apple Intelligence?
van Florian Bodoky
Achtergrond
Waarom automatische herkenning van AI-inhoud niet werkt
van David Lee