Come funzionano i CAPTCHA e perché sono così difficili?

che cosa è-captcha

Stai tentando di acquistare un articolo o accedere a un account. Inserisci le tue credenziali, ma prima di procedere, devi dimostrare di essere un essere umano. Spuntare la casella "Non sono un robot". Puoi vedere un'immagine sfocata con cifre oblique che devi decifrare. Questi sono CAPTCHA e, sebbene possano essere una seccatura, sono necessari.

Destra?

Cosa sono i CAPTCHA e come funzionano? In che cosa differiscono dai reCAPTCHA? E perché molti di loro sono così difficili?

Che cos'è CAPTCHA?

CAPTCHA è l'acronimo di Test di Turing pubblico completamente automatizzato per distinguere computer e esseri umani. Prendono il nome da Alan Turing, la geniale crittoanalisi che ha creato il test di Turing. Questo è un modo di esaminare il pensiero di una macchina, per verificare se il suo comportamento è indistinguibile da quello di un essere umano.

CAPTCHA di protezione spambot v3

Un test di Turing standard coinvolge una persona reale che giudica i soggetti. I CAPTCHA no: sono generalmente gestiti da un computer. Come tale, alcuni li chiamano "test di Turing inverso", mentre altri li conoscono come Human Interaction Proof (HIP).

I CAPTCHA sono stati creati per bloccare i bot dai siti Web di spamming. Qualsiasi esperto mago della tecnologia può creare un programma che registra automaticamente fino a milioni di account; I CAPTCHA sono progettati per impedire che ciò accada.

È perché i computer hanno difficoltà a decifrare il testo distorto, o almeno più difficile degli umani. La maggior parte dei CAPTCHA sono associati a diversi gradienti di colore sullo sfondo, per oscurare ulteriormente il messaggio.

Si discute su chi abbia creato i CAPTCHA, sebbene il termine sia stato coniato dalla Carnegie Mellon University, Pittsburgh, nel 2003.

Il team accademico ha ipotizzato che potrebbero essere utilizzati per proteggere e-mail, sondaggi online e altri servizi che richiedono la registrazione da bot dei motori di ricerca, worm e spambots e attacchi da dizionario. Sono anche utili nella lotta contro gli attacchi DDoS (Distributed Denial of Service) .

Come funzionano i CAPTCHA?

Il testo può essere davvero oscurato, ma spesso puoi ancora capire cosa significa. Più simboli sono distorti, più efficace è un CAPTCHA. Questo perché gli umani esibiscono pareidolia, un fenomeno in cui il nostro cervello cerca di dare un senso alla casualità. È la tua mente che cerca di assegnare l'ordine dal caos.

Pareidolia è il motivo per cui inferisci facce dove non dovrebbero essere: in nuvole, edifici, pareti rocciose, alberi, bevande, fiori e altro ancora.

Gli esempi più famosi di questa stranezza psicologica in genere riguardano sia la religione (con persone che affermano di vedere Gesù nel loro cibo) sia l'astronomia. Conoscerai Barnard 33 per il suo colloquialismo, la Nebulosa Testa di Cavallo, per le sue qualità equine; altri vedono un coniglio scolpito nei crateri della luna.

Questo è anche il motivo per cui puoi distinguere le parole in CAPTCHA anche quando sono barrate e piegate fuori forma. I nostri cervelli creano connessioni che i programmi per computer in genere non riescono.

Perché i CAPTCHA sono così difficili?

Luis von Ahn, ex membro del team CAPTCHA della Carnegie Mellon University, afferma che occorrono in media nove secondi per risolvere un CAPTCHA. Il 92 percento ha ragione. Ciò potrebbe farti sentire stupido per aver inserito la combinazione sbagliata, ma non dovrebbe. Ognuno fa parte di quel rimanente 8 percento di volta in volta.

In effetti, i tassi di fallimento aumentano dall'8% a quasi il 30% se il CAPTCHA fa distinzione tra maiuscole e minuscole.

Il problema con inferire informazioni è che possiamo facilmente dedurre informazioni errate . Un "io" può diventare un "1". È ancora più difficile quando il CAPTCHA non è composto da parole ma lettere casuali.

Fortunatamente, i servizi sanno che gli umani sono fallibili e non possono sempre leggere testi sfocati. La maggior parte dei CAPTCHA ti dà la possibilità di generarne uno nuovo, quindi se stai lottando, aggiornalo.

Il motivo principale per cui i CAPTCHA possono essere così difficili è per necessità. Con l'evoluzione dei CAPTCHA, anche gli attaccanti. L'intelligenza artificiale (AI) è in grado di leggere anche testi particolarmente distorti con una precisione stimata del 99%. I CAPTCHA hanno dovuto migliorare il loro gioco.

In particolare, Google ha notevolmente migliorato la tecnologia, ma torneremo su questo.

In che modo i programmi sconfiggono CAPTCHA? Sono craccati usando algoritmi che cercano forme particolari. Questi in genere convertono la casella di testo in scala di grigi, rimuovendo la distorsione offerta dagli artefatti di colore. Quindi si concentrano su schemi e li incrociano con lettere e numeri standard.

L'algoritmo prende, in effetti, ipotesi istruite quando si tratta di cifre che non sono state identificate.

CAPTCHA: Cosa potrebbe andare storto?

Ci sono numerosi problemi con i CAPTCHA, specialmente per le persone con disabilità. È particolarmente vero per le persone con problemi di vista o affetti da dislessia.

Sì, i CAPTCHA si sono sviluppati per combattere i robot in modo più efficace e facilitare gli esseri umani. In alcuni casi. Lo ha fatto in alcuni modi significativi. Il primo è attraverso la variazione della verifica. Un esempio ampiamente usato di questo è la sostituzione del testo con foto.

Potresti essere presentato con le immagini in una griglia e fare clic su ogni casella che mostra i segnali stradali. Funziona così bene perché i programmi soffrono di visione artificiale, vale a dire una difficoltà a comprendere i contenuti delle immagini digitali.

Alcune IA possono differenziare e comprendere cosa contiene una foto. Pensa alla tecnologia DeepFace di Facebook , in grado di riconoscere le caratteristiche del viso e suggerire i profili. Tuttavia, questi tipi di CAPTCHA rappresentano una sfida in più per i robot, un ulteriore ostacolo per gli attacchi di forza bruta e il loro genere.

Le immagini funzionano anche bene per chi utilizza smartphone e tablet: è molto più semplice toccare i quadratini giusti. Cioè, fintanto che quelle foto si caricano co
rrettamente!

Un altro adattamento è l'audio CAPTCHA, che legge il testo per coloro che lottano per distinguere le cifre. Questi sono spesso accompagnati da un suono di sottofondo. Ciò può causare ulteriori problemi agli spammer utilizzando il software di riconoscimento vocale.

L'altro importante modo in cui i CAPTCHA si sono evoluti è attraverso l'integrazione con Google e l'introduzione di reCAPTCHA. E no, non sono esattamente la stessa cosa …

CAPTCHA e reCAPTCHA: qual è la differenza?

La maggior parte dei CAPTCHA che vedi sono in realtà reCAPTCHA. Il secondo fa lo stesso lavoro del primo, ma lo supera anche promuovendo l'apprendimento automatico.

Inoltre, i reCAPTCHA vengono utilizzati per la digitalizzazione dei libri.

Sono stati sviluppati dallo stesso team della Carnegie Mellon University che ci ha dato il termine "CAPTCHA". Il software open source mirava a "preservare la letteratura decifrando una parola che non era leggibile dai computer". In effetti, ogni volta che decifri una parola trovata in un reCAPTCHA, viene utilizzata per l'apprendimento automatico. Stai aiutando il programma a comprendere le diverse forme e modelli di simboli.

CAPTCHA è una combinazione casuale; reCAPTCHA è costituito da parole mirate che i robot non sono stati in grado di analizzare in precedenza.

È stato rilasciato nel 2007 e acquisito da Google nel 2009. Molti considerano Google un enorme conglomerato di cui non ci si può fidare, ma i reCAPTCHA hanno fatto molto bene. Solo due anni dopo l'acquisizione, la tecnologia aveva digitalizzato interamente gli archivi di Google Libri e del New York Times. Entrambi sono preziosi repository di informazioni.

È ironico che la tecnologia possa ora comprendere efficacemente il testo, rendendo ridondanti i reCAPTCHA. Ecco perché Google ha spinto ulteriormente l'idea.

Ti sei mai chiesto cosa succede quando fai clic su "Non sono un robot" e procedi subito, senza decifrare nulla? Il nuovo reCAPCTHA di Google analizza la tua attività su tutto il sito, quindi ti assegna segretamente un punteggio di probabilità per determinare se sei umano o un bot.

In sostanza, è stato stabilito se le tue interazioni con il servizio sono più indicative di una persona reale o di un programma.

Facile per gli umani, difficile per i robot?

Man mano che i robot diventano più intelligenti, anche i sistemi di sicurezza devono avanzare. ReCAPTCHA è un'idea abbastanza solida. Per adesso.

Ma molti mettono in dubbio il potere detenuto da Google. L'intelligenza artificiale può riconoscere il comportamento umano. Fattore di tutte le cose che Google già conosce di te e questo è sicuramente motivo di preoccupazione.

Leggi l'articolo completo: come funzionano i CAPTCHA e perché sono così difficili?