Posted By: Jovo () on 'CZinternet'
Title: reCaptcha reloaded
Date: Tue Jan 1 14:04:32 2013
Ahoj.
reCaptcha zacala pouzivat fotografie cisel domu, nejspise z
GooogleStreetWiew - fotografie schranek na dopisy, zdi domu, chodniky,...
Rozpoznavat texty knih,... ok. Kdyz si na web vyvesite informace sami, ok.
Ale tohle je podle me hodne pres caru. Sice to je nejspise legalni, ale
rozhodne to neni moralni - fotografovat cizi domy, bez povoleni a pak nutit
jine lidi, aby je rozpoznali? A pakl to propojit s ostatnimi databazemi a
nabizet lepsi reklamu - rozpoznavani tvari uz maji zmaknute. Budou data
prodavat i dalsim spolecnostem? A co vladam a vladnim agenturam? Doufam, ze
podobnou vec budou provozovat i na zakazku Cinske vlady.
Podle me se proste bez techto informaci muze Google i svet obejit.
Jak se branit? Bud nactete reCaptcha obrazek znovu a kdyz z nejakeho duvodu
nemuzete, zadejte spatne cislo! To zpusobi, ze takto rozpoznane informace
(navic armadou nedobrovolnych a neplacenych lidskych dekodovacu) budou
nespolehlive a stoupne cena za jejich presne ziskani - pri trose stesti ta
cena preroste prah, za kterou se jejich ziskavani jiz nevyplati.
Ale je tu hacek: Kdyz nebudou ziskana cisla uniformni (normalni rozlozeni),
je kazde takove sabotovani na prd - statisticka analyza si s tim poradi,
staci ten obrazek jen dat rozpoznat vice lidem. Premyslel jsem, jak se tomuto
branit tak, aby to nevyzadovalo prilis sofistikovany pristup.
Nejlepsi podle me bude, kdyz vsichni budeme zadavat mesic sveho narozeni
(1-12). To splnuje podminku, ze cisla domu zacinaji 1, nebudeme vsichni
zadavat to same (treba jednicku) a rozlozeni je temer normalni.
Jovo.
PS: Obrazky domu jsou pekny backdoor pro spammery - kdyz se jim podari OCRkem
rozpoznat kontrolni text, mohou a) rozpoznat cisla - to je trivialni uloha
nebo za b) poslat jakekoliv cislo - ani v jednom pripade nevzbudi takove
podezreni.