Be My Eyes integra la tecnologia di riconoscimento delle immagini di GPT-4 per assistere i non vedenti

Le persone ipovedenti hanno elogiato l’ultima innovazione di Be My Eyes, una startup danese, che ha integrato le funzionalità di riconoscimento delle immagini di GPT-4 in una rivoluzionaria funzionalità dell’app. Soprannominato “Virtual Volunteer”, lo strumento di riconoscimento degli oggetti è stato descritto come un cambiamento di vita per le persone con disabilità visive, in quanto può fornire risposte a qualsiasi domanda relativa a un’immagine inviata. La funzione consente agli utenti di acquisire immagini di oggetti di uso quotidiano, come gli ingredienti, e di ricevere immediatamente informazioni pertinenti, come le ricette.

Correlati: uno sguardo più da vicino al copilota AI di Microsoft

Be My Eyes integra la tecnologia di riconoscimento delle immagini di GPT-4 per assistere i non vedenti

Nel caso in cui preferiscano cenare fuori, possono utilizzare l’app per caricare un’immagine di una mappa e ricevere indicazioni per un ristorante nelle vicinanze. All’arrivo, possono utilizzare l’app per scattare una foto del menu e ascoltare le opzioni disponibili. Inoltre, se desiderano bruciare le calorie extra in palestra, possono comodamente utilizzare la fotocamera dello smartphone per individuare un tapis roulant.

Mike Buckley, CEO di Be My Eyes, afferma che mentre stiamo attualmente vivendo un ciclo di hype AI , diversi beta tester hanno espresso la loro convinzione che l’app stia cambiando la vita. Afferma inoltre che l’innovazione ha il potenziale per essere trasformativa nel dotare la comunità dei non vedenti di risorse senza pari per navigare meglio nel loro ambiente fisico, prendersi cura delle loro necessità quotidiane e ottenere una maggiore indipendenza.

La funzione Virtual Volunteer di Be My Eyes sfrutta la versione aggiornata del software di OpenAI. GPT-4 è considerato multimodale, il che significa che è in grado di analizzare input sia testuali che visivi. Be My Eyes desiderava provare la nuova funzionalità poiché le versioni precedenti del software avevano prestazioni inferiori. Sebbene i sistemi text-to-image esistano da tempo, la startup non si era mai convinta della loro efficacia. Secondo Buckley, gli strumenti disponibili sul mercato presentavano numerose carenze, da frequenti errori all’incapacità di conversare, che impedivano loro di soddisfare i bisogni della propria comunità.

Secondo Buckley, le capacità di riconoscimento delle immagini di GPT-4 sono superiori e sono ulteriormente potenziate dai livelli conversazionali e analitici alimentati da OpenAI, rendendo la funzionalità molto più preziosa e utile. In precedenza, Be My Eyes si affidava esclusivamente a volontari umani per supportare i propri utenti. Tuttavia, con la nuova funzionalità Virtual Volunteer, OpenAI afferma che è possibile raggiungere lo stesso livello di contesto e comprensione. Tuttavia, se un utente non riceve una risposta soddisfacente o semplicemente preferisce una connessione umana, può comunque rivolgersi a un volontario.

Correlati: Cloudflare annuncia lo strumento di rilevamento delle frodi basato sull’intelligenza artificiale

Nonostante gli incoraggianti risultati iniziali, Buckley sottolinea la necessità di un cauto lancio del servizio gratuito. Le opinioni e il feedback dei beta tester e della comunità più ampia saranno fondamentali per determinare il ritmo e la portata del rilascio. In definitiva, Buckley prevede che la piattaforma offrirà agli utenti sia supporto che opportunità. Be My Eyes prevede di aiutare le aziende a servire i propri clienti in modo più efficace, ponendo una maggiore enfasi sull’accessibilità.

Buckley ritiene che la tecnologia abbia il potenziale non solo per potenziare le persone non vedenti o ipovedenti, ma anche per fornire loro una piattaforma per mostrare le loro capacità al mondo. Ritiene che la tecnologia potrebbe essere un punto di svolta e consentire alla comunità dei non vedenti di sfruttare i propri talenti e abilità. Per Buckley, questa rappresenta una possibilità davvero interessante.