Le CAPTCHA

 

Pour Wikipédia, le CAPTCHA est : «une marque commerciale de l’université Carnegie-Mellon désignant une famille de tests de Turing permettant de différencier de manière automatisée un utilisateur humain d’un ordinateur. »

 Étudions de plus prêt cet élément que nous rencontrons tous les jours sur nos ordinateurs.

Avant le CAPTCHA, il y avait à partir de 1996 le LESTEEAK (L337SP34K) dont le but était de remplacer des lettres par des chiffres qui leur ressemblent.

Il existait des mots plus ou moins durs à déchiffrer mais l’idée de LEEDSPEAK fut abandonnée pour laisser place au CAPTCHA que nous connaissons actuellement.

La notion de CAPTCHA apparait vers 2000, le logiciel vérifie donc si l’utilisateur de l’ordinateur est un humain ou un robot par le biais de différentes vérifications qui ont quelques particularités.

Un robot sait lire de nos jours, c’est pour cela que le texte que doit recopier l’utilisateur se trouve dans une image, en effet il est plus compliqué pour un logiciel tentant de contourner le CAPTCHA de lire un texte qui se trouve dans une image

.

Le texte peut également être déformé tout en restant lisible pour l’humain. L’humain arrive à isoler les parties importantes de l’image contrairement au robot. Il faut cependant que le texte reste bien visible pour l’humain même si plus on déforme le texte moins des logiciels peuvent contourner la sécurité.

Pour permettre au malvoyant de passer cette sécurité, CAPTCHA ajoute une vérification audio qui se base sur l’écoute d’un enregistrement audio avec la voix ou le gain modifié.

C’est en 2007 que Google commence à réfléchir à un projet qui peut rendre encore plus utile le CAPTCHA. En effet en 2007, c’est plus de 200 millions de CAPTCHA résolus par jour.

En 2009, le projet de Google voit le jour : Re CAPTCHA

Le but de Re CAPTCHA est de déchiffrer des archives ou des livres numériques ou encore de passer d’une image à un texte et cela grâce aux utilisateurs. Google améliore alors le logiciel grâce à ces derniers.

On a toujours à cette époque les CAPTCHA avec du texte, mais cette fois-ci avec deux mots différents :

-un mot reconnu par Re CAPTCHA que l’utilisateur doit bien recopier pour passer la vérification

-un deuxième mot qui n’est pas encore connu par le logiciel, ici c’est l’utilisateur qui fait comprendre le mot à Re CAPTCHA (on peut écrire ce mot pas tout à fait juste et quand même passer la vérification).

C’est à partir du moment où le deuxième mot a été donné à plusieurs utilisateurs qu’il sera déchiffré par Re CAPTCHA et placé dans la base de données.

Ce procédé est mis en place par Google pour déchiffrer des Google books par exemple. De nombreux noms de rue ont été déchiffrés par Re CAPTCHA puis ajoutés à Google MAPS.

Malheureusement, cette première version de Re CAPTCHA a perdu de sa sécurité avec le temps. En effet, plusieurs logiciels arrivaient à contourner la vérification.  Il y a donc eu un nouveau système qui s’est mis en place.

« I’m not a robot » c’est ce nouveau système qui permet à Google d’empêcher un maximum de logiciel de contourner la sécurité Re CAPTCHA.

Le principe est simple, l’utilisateur doit cocher une case pour certifier qu’il n’est pas un robot, beaucoup de paramètres sont pris en compte comme le mouvement de la souris etc pour vérifier si l’utilisateur est bien un humain.

Il y a également maintenant un système de puzzle qui a vu le jour, pour encore renforcer la sécurité de Re CAPTCHA. Ce puzzle vient souvent après avoir coché la case « I’m not a robot ». Le Re CAPTCHA se souvient que l’utilisateur a réussi le puzzle grâce à son adresse IP, l’utilisateur n’aura donc qu’à cocher la case pour passer la vérification la prochaine fois.

 

 

Article rédigé par Aleister DENNI dans le cadre de la spécialité ISN