Ce n'est pas vraiment une excellente question pour stackexchange car Google garde ses algorithmes secrets, donc tout ce que nous pouvons vraiment faire est de deviner comment cela fonctionne, mais je crois comprendre que le nouveau système analysera votre activité sur l'ensemble de Google. services (et éventuellement d'autres sites sur lesquels Google a un certain contrôle, tels que les sites Web qui diffusent des annonces Google).
Ainsi, il est probable que les vérifications ne se limitent pas uniquement à la page qui comporte la case à cocher . Par exemple, s'ils détectent que votre ordinateur / adresse IP que vous utilisez a également été utilisé dans le passé pour faire des choses qu'un humain normal ferait - des choses comme vérifier Gmail, rechercher sur Google, télécharger des fichiers sur Drive, partager des photos, naviguer le Web, etc. - alors il peut être raisonnablement sûr que vous êtes un humain et vous permettre de sauter la vérification d'image. D'un autre côté, s'il ne peut pas associer votre ordinateur à une activité humaine antérieure, il serait plus suspect et vous donnerait la vérification de l'image. Bien que le comportement de la souris lorsqu'elle clique sur la case à cocher puisse être un facteur qu'il analyse, il y a certainement beaucoup plus à faire.
Encore une fois, nous ne savons pas avec certitude comment cela fonctionne. C'est juste ma meilleure estimation basée sur ce que peu de Google a dit:
Bien que la nouvelle API reCAPTCHA puisse sembler simple, il y a un haut degré de sophistication derrière cette modeste case à cocher. Les CAPTCHA se sont longtemps appuyés sur l'incapacité des robots à résoudre le texte déformé. Cependant, nos recherches récentes ont montré que la technologie d'intelligence artificielle d'aujourd'hui peut résoudre même la variante la plus difficile du texte déformé avec une précision de 99,8%. Ainsi, le texte déformé, en soi, n'est plus un test fiable.
Pour contrer cela, l'année dernière, nous avons développé un backend d'analyse avancée des risques pour reCAPTCHA qui considère activement l'engagement complet d'un utilisateur avec le CAPTCHA - avant, pendant et après - pour déterminer si cet utilisateur est un humain. Cela nous permet de moins nous fier à la saisie
texte déformé et, à son tour, offre une meilleure expérience aux utilisateurs. Nous en avons parlé dans notre article sur la Saint-Valentin plus tôt cette année.
Pour moi, le point sur "avant, pendant et après utilisation" est un indice fort qu'ils analysent le comportement de navigation précédent, mais mon interprétation pourrait être erronée.
Voici une citation de WIRED:
Au lieu de dépendre du test traditionnel des mots déformés, «reCaptcha» de Google examine les indices que chaque utilisateur fournit sans le vouloir: Les adresses IP et les cookies prouvent que l'utilisateur est le même humain amical dont se souvient Google ailleurs sur le Web. Et Shet dit que même les minuscules mouvements de la souris d'un utilisateur lorsqu'elle survole et s'approche d'une case à cocher peuvent aider à révéler un bot automatisé.
Il y a un autre fil sur stackoverflow qui en parle également: https://stackoverflow.com/questions/27286232/how-does-new-google-recaptcha-work
En ce qui concerne la vérification des images, vous ne pourrez pas les trouver images avec recherche d'image inversée, ou compilez une base de données d'entre eux. Il s'agit généralement de panneaux de signalisation aléatoires ou de numéros de maison capturés par les voitures Street View de Google, ou de mots de livres numérisés pour le projet Google Livres. Il y a un bon objectif derrière cela - Google utilise en fait ce que les gens tapent dans reCaptcha pour améliorer leurs propres bases de données et former des algorithmes OCR. reCaptcha donne la même image à un certain nombre d'utilisateurs, et s'ils sont tous d'accord sur ce qu'il dit, alors l'image devient des données d'entraînement pour l'IA de Google.
De wikipedia:
Le service reCAPTCHA fournit aux sites Web abonnés des images de mots que le logiciel de reconnaissance optique de caractères (OCR) n'a pas pu lire. Les sites Web abonnés (dont les finalités ne sont généralement pas liées au projet de numérisation du livre) présentent ces images que les humains peuvent déchiffrer sous forme de mots CAPTCHA, dans le cadre de leurs procédures normales de validation. Ils renvoient ensuite les résultats au reCAPTCHA
service, qui envoie les résultats aux projets de numérisation.
reCAPTCHA a travaillé sur la numérisation des archives du New York Times et des livres de Google Books. [3] En 2012, trente ans du New York Times avaient été numérisés et le projet prévoyait d'achever les années restantes d'ici la fin de 2013. Les archives maintenant achevées du New York Times peuvent être consultées dans les archives d'articles du New York Times, où plus de 13 millions d'articles au total ont été archivés, de 1851 à nos jours.