Le illusioni ottiche potrebbero aiutarci a costruire la prossima generazione di IA

Guardi l’immagine di un cerchio nero su una griglia di punti circolari. Assomiglia a un buco bruciato in un pezzo di materiale a rete bianca, anche se in realtà è un’immagine piatta e fissa su uno schermo o un pezzo di carta. Ma il tuo cervello non lo comprende in quel modo. Come un’esperienza allucinatoria di basso livello, la tua mente va in tilt; percepire l’immagine statica come la bocca di un tunnel nero che si muove verso di te.

Rispondendo alla verosimiglianza dell’effetto, il corpo inizia a reagire inconsciamente: le pupille dell’occhio si dilatano per far entrare più luce, proprio come si adatterebbero se si stesse per immergersi nell’oscurità per garantire la migliore visione possibile.

L'illusione ottica del buco nero

L’effetto in questione è stato creato da Akiyoshi Kitaoka , uno psicologo della Ritsumeikan University di Kobe, in Giappone. È una delle dozzine di illusioni ottiche che ha creato in una lunga carriera. (“Mi piacciono tutti”, ha detto, rispondendo alla domanda di Digital Trend sul fatto che abbia un preferito.)

Questa nuova illusione è stata oggetto di una ricerca pubblicata di recente sulla rivista Frontiers in Human Neuroscience . Mentre il focus del documento è fermamente sulle risposte fisiologiche umane al nuovo effetto (che si scopre che circa l’86% di noi sperimenterà), l’argomento generale potrebbe anche avere molta rilevanza quando si tratta del futuro di intelligenza artificiale, come uno dei ricercatori non vedeva l’ora di spiegare a Digital Trends.

Un vantaggio evolutivo

un'illusione ottica conosciuta come la spirale di Fraser
A prima vista, potrebbe sembrare che questa immagine mostri una spirale che si snoda verso il centro. Ma prova a seguire una delle linee mentre sembra curva verso l’interno e ti renderai conto che non è affatto una spirale.

Qualcosa non va nel tuo cervello. Almeno, questa è una facile conclusione da trarre dal modo in cui il cervello umano percepisce le illusioni ottiche. Quale altra spiegazione c’è per un’immagine statica bidimensionale che il cervello percepisce come qualcosa di completamente diverso? Per molto tempo, la psicologia tradizionale ha calcolato esattamente questo.

“Inizialmente la gente pensava: ‘Ok, il nostro cervello non è perfetto… Non funziona sempre bene.’ È un fallimento, giusto?” ha affermato Bruno Laeng , professore presso il Dipartimento di Psicologia dell’Università di Oslo e primo autore del suddetto studio. “Le illusioni in quel caso erano interessanti perché avrebbero rivelato una sorta di imperfezione nel macchinario.”

Gli psicologi non li vedono più in questo modo. Semmai, ricerche come questa evidenziano come il sistema visivo non sia solo una semplice fotocamera. L’illusione ottica “Illusory Expanding Hole” chiarisce che l’occhio si adatta alla luce e all’oscurità percepite, anche immaginate, piuttosto che all’energia fisica.

Più significativamente, mostra che non registriamo semplicemente il mondo con i nostri sistemi visivi, ma eseguiamo invece una serie continua di esperimenti scientifici al fine di ottenere un leggero vantaggio evolutivo. L’obiettivo è analizzare i dati che ci vengono presentati e cercare di affrontare preventivamente i problemi prima che diventino, beh, problemi.

“Il cervello non ha modo di sapere cosa c’è [realmente] là fuori”, ha detto Laeng. “Quello che sta facendo è costruire una sorta di realtà virtuale di ciò che potrebbe essere là fuori. C’è un po’ di supposizioni. A questo proposito, puoi pensare al cervello come a una specie di macchina probabilistica. Puoi chiamarla una macchina bayesiana se vuoi. Sta usando alcune ipotesi precedenti e prova a testarle continuamente per vedere se funziona”.

Laeng fornisce l’esempio dei nostri occhi che effettuano regolazioni basate nient’altro che sull’impressione della luce del sole: anche quando questa viene avvistata attraverso la copertura nuvolosa o una volta sopra la testa di foglie. Nel caso in cui.

“Ciò che conta nell’evoluzione non è che sia vero [in quel momento], ma è probabile”, ha continuato. “Costringendo la pupilla, il tuo corpo si sta già adattando a una situazione che molto probabilmente si verificherà in un breve periodo di tempo. Quello che succede [se il sole esce improvvisamente] è che sei abbagliato. Abbagliato significa inabile temporaneamente. Ciò ha enormi conseguenze sia che tu sia una preda o che tu sia un predatore. Perdi una frazione di secondo in una situazione particolare e potresti non sopravvivere”.

Non è solo la luce e l’oscurità che i nostri sistemi visivi hanno bisogno di fare supposizioni. Pensa a una partita di tennis, in cui la pallina viaggia ad alta velocità. Se dovessimo basare il nostro comportamento interamente su ciò che il sistema visivo sta ricevendo in un dato momento, rimarremmo indietro rispetto alla realtà e non riusciremmo a restituire la palla. “Siamo in grado di percepire il presente anche se siamo davvero bloccati nel passato”, ha detto Laeng. “L’unico modo per farlo è prevedere il futuro. Suona un po’ come un gioco di parole, ma in poche parole è così”.

La visione artificiale sta migliorando

riconoscimento facciale
izusek/Getty Images

Quindi cosa c’entra questo con la visione artificiale? Potenzialmente tutto. Affinché un robot, ad esempio, sia in grado di funzionare efficacemente nel mondo reale, deve essere in grado di effettuare questo tipo di regolazioni al volo. I computer hanno un vantaggio quando si tratta della loro capacità di eseguire calcoli estremamente veloci. Quello che non hanno sono milioni di anni di evoluzione dalla loro parte.

Negli ultimi anni, la visione artificiale ha comunque fatto passi da gigante. Possono identificare volti o andature nei flussi video in tempo reale, potenzialmente anche in grandi folle di persone. Analoghi strumenti tecnologici e di classificazione delle immagini possono riconoscere anche la presenza di altri oggetti, mentre le innovazioni nella segmentazione degli oggetti consentono di comprendere meglio il contenuto di scene diverse. Sono stati compiuti progressi significativi anche quando si tratta di estrapolare immagini 3D da scene 2D, consentendo alle macchine di “leggere” informazioni tridimensionali, come la profondità, dalle scene. Ciò avvicina la moderna visione artificiale alla percezione dell’immagine umana.

Tuttavia, esiste ancora un abisso tra i migliori algoritmi di visione artificiale e i tipi di capacità basate sulla visione che la stragrande maggioranza degli esseri umani è in grado di svolgere fin dalla giovane età. Anche se non possiamo articolare esattamente come svolgiamo questi compiti basati sulla visione (per citare il poliedrico ungherese-britannico Michael Polanyi, “possiamo sapere più di quanto possiamo dire”), siamo comunque in grado di svolgere una serie impressionante di compiti che permetterci di sfruttare la nostra vista in una varietà di modi intelligenti.

Un test di Turing per la visione artificiale

Se ricercatori e ingegneri sperano di creare sistemi di visione artificiale che funzionino almeno alla pari con le capacità di elaborazione visiva del cervello del wetware, la costruzione di algoritmi in grado di comprendere le illusioni ottiche non è un cattivo punto di partenza. Per lo meno, potrebbe rivelarsi un buon modo per misurare il funzionamento dei sistemi di visione artificiale per il nostro cervello. Potrebbe non essere la risposta alla mitica Intelligenza Generale Artificiale , ma potrebbe essere la chiave per sbloccare la Visione Generale.

un'illusione ottica che inganna il tuo cervello facendogli vedere falsi colori
Che tu ci creda o no, ma tutte queste palline hanno la stessa tonalità di grigio e il tuo cervello le interpreta come se avessero colori diversi in base ai segnali contestuali delle linee colorate che le attraversano

“Se qualcuno sviluppasse, un giorno, un sistema visivo artificiale che commette gli stessi errori di percezione illusoria che facciamo noi, a questo punto sapresti che sta [ottenendo] una buona simulazione di come funziona il nostro cervello”, ha detto Laeng. «Sarebbe una sorta di test di Turing. Se hai una rete artificiale che è ingannata dall’illusione come siamo, allora [saremmo] molto vicini alla comprensione del calcolo sottostante del cervello stesso”.

Yi-Zhe Song , lettore di Computer Vision e Machine Learning presso il Center for Vision Speech and Signal Processing dell’Università del Surrey nel Regno Unito, è d’accordo con l’ipotesi. “Chiedere agli algoritmi di visione di comprendere le illusioni ottiche come un argomento generale è di grande valore per la comunità”, ha detto a Digital Trends. “Va oltre l’attuale obiettivo della comunità di chiedere alle macchine di [riconoscere], spingendo ulteriormente i limiti [e] chiedendo alle macchine di ragionare. Questa spinta [rappresenterebbe] un significativo passo avanti verso la “visione generale”, in cui è necessario soddisfare le interpretazioni soggettive dei concetti visivi”.

Usa la tua illusione

Ad oggi, ci sono state alcune ricerche limitate verso questo obiettivo, sebbene rimanga in una fase relativamente precoce. Nasim Nematzadeh, un ricercatore che ha conseguito un dottorato di ricerca. in Intelligenza Artificiale e Robotica-Modelli di visione di basso livello, è una persona che ha pubblicato lavori su questo argomento .

“Riteniamo che un’ulteriore esplorazione del ruolo di semplici modelli gaussiani nell’elaborazione retinica di basso livello e del kernel gaussiano nella fase iniziale [reti neurali profonde] e la sua previsione della perdita dell’illusione percettiva porteranno a tecniche di visione artificiale più accurate e modelli”, ha detto Nematzadeh a Digital Trends. “[Questo potrebbe] contribuire a modelli di livello superiore di elaborazione della profondità e del movimento e generalizzato alla comprensione computerizzata delle immagini naturali”.

Max Williams, un ricercatore di intelligenza artificiale che ha contribuito a compilare un set di dati di migliaia di immagini di illusioni ottiche per i sistemi di visione artificiale, esprime la relazione tra visione generale e illusioni ottiche in modo più succinto: “Le illusioni esistono perché i nostri occhi e il nostro cervello stanno eseguendo un lavoro disordinato e ad hoc processo per estrarre una scena visiva da un campo di luce altrimenti incomprensibile, creato da un mondo fisico da cui siamo quasi completamente isolati”, hanno detto a Digital Trends. “Non credo sia possibile rendere un sistema visivo sufficientemente espressivo da essere considerato una ‘percezione’ che sia anche esente da illusioni”.

Raggiungere la visione generale

Per essere chiari, ottenere una visione generale per l’IA a livello umano (o migliore) non significa semplicemente addestrarli a riconoscere le illusioni ottiche standard. Nessuna capacità iper-specifica di, ad esempio, decodificare le illusioni di Magic Eye con una precisione del 99,9% in 0,001 secondi sostituirà milioni di anni di evoluzione umana.

(È interessante notare che la visione artificiale ha già una sua versione di illusioni ottiche sotto forma di modelli contraddittori, che possono farli scambiare – come in un’illustrazione allarmante – una tartaruga giocattolo stampata in 3D per un fucile . Tuttavia, questi non producono il stessi benefici evolutivi delle illusioni ottiche che funzionano sugli esseri umani.)

Tuttavia, fare in modo che le macchine comprendano le illusioni ottiche umane e rispondano ad esse nel modo in cui le facciamo noi, potrebbe essere una ricerca molto utile.

E una cosa è certa: quando l’IA di Visione generale sarà raggiunta, cadrà per lo stesso tipo di illusioni ottiche che facciamo noi. Almeno, nel caso dell’Illusory Expanding Hole, l’86% di noi.