Iedereen kent CAPTCHA plaatjes, alhoewel bijna niemand zich daar naar alle waarschijnlijkheid heel erg bewust van zal zijn. CAPTCHA plaatjes zijn afbeeldingen met een code bestaande uit cijfers en letters, die je vervolgens moet overtypen. CAPTCHA staat voor een afkorting die ook gelijk verklaart wat het doel is van deze plaatjes; Completely Automated Public Turingtest to tell Computers and Humans Apart.
Even een voorbeeldje?
Het doel is dus om te herkennen of je een echt mensje bent wat probeert een e-mail te sturen of een reactie te plaatsen op een website. En waarom willen we dat dan weer graag weten? Omdat er vreselijk veel gespamd wordt! Niet alleen via e-mail, maar juist ook in gastenboeken, reacties op Blogs, etc. etc. Nog steeds blijkt het uitermate interessant te zijn om grote hoeveelheden blauwe-pilletjes aan te bieden, en om massaal met vergrotingen van bepaalde lichaamsdelen te adverteren.
Deze vorm van spam gebeurd uiteraard niet door een stagiair die achter een computer wordt gezet om zo veel mogelijk websites af te gaan om een reacties achter te laten. Gaat een beetje traag namelijk. Een beetje stagiair van tegenwoordig is zowiezo alleen in staat om advertenties in MSN-taal te typen, dus daar krijg je onbegrijpelijke advertenties van.
Ttn oppompen? Check ff hier.
De boeven en schurken van internet zijn dus niet gek, en gebruiken voor het massaal verspreiden van hun boodschap automatische systemen. Deze systemen vullen automatisch de verschillende velden van een webformulier in met daarin links naar hun website. Gaat toch een stuk sneller als een stagiair zullen we maar zeggen. En dat is dus precies wat we met een CAPTCHA plaatje willen filteren, of een formulier door een automatisch systeem wordt ingevuld of niet.
Door iedere keer dat je het plaatje laadt een nieuwe code te genereren die overgetypt moet worden, weet je redelijk zeker dat het formulier door een persoon wordt ingevuld. Redelijk zeker… want uiteraard wordt er weer gebruik gemaakt van systemen die proberen te achterhalen wat er in een plaatje geschreven staat met automatische letter herkenning.
Om dat weer te voorkomen, wordt er in de CAPTCHA plaatjes niet alleen de code geschreven, maar wordt er bijvoorbeeld lijntjes door de code getrokken. Maar worden er ook verschillende lettertypes gebruikt, en verschillende formaten letters. Allemaal om de code niet door een automatisch systeem te kunnen laten lezen.
Nou kan het maken van de CAPTCHA plaatjes op een gegeven moment zo ingewikkeld worden dat het voor mensen ook niet meer lukt om nog een formulier te versturen. Zo kwam het op Steenderen.NET regelmatig voor dat iemand tot 3 keer toe een code moest intypen voordat het lukte om een reacties onder aan de blog te plaatsen.
Als het goed is, moet dat nu voorbij zijn! Het systeem voor het generen van het CAPTCHA plaatje heb ik volledig opnieuw geschreven met als doel om het plaatsen van berichten weer op normale manier mogelijk te maken. Wat ik nog even moet gaan ervaren is of het tè eenvoudig is geworden, waardoor SPAM toch weer de kop op gaat duiken.
Ik zou dus zeggen, probeer het uit en laat vooral weten wat jullie ervaringen zijn!