Finalmente il sigillo è tolto! Bing ha preso l’iniziativa in ChatGPT per supportare la funzione di riconoscimento delle immagini, non solo può comprendere i meme, scrivere pagine Web, ma anche “vedere un medico”

Ricordi le capacità multimodali menzionate da OpenAI quando ha rilasciato GPT-4 a marzo di quest’anno?

▲ GPT-4 risposta Demo, tradotta dalla macchina

GPT-4 supporta l’input di immagini e può comprendere meme, problemi di fisica e documenti. Una volta rilasciato, ha scioccato tutti. Questo è anche il più grande punto di aggiornamento di GPT-4 rispetto a GPT-3.5.

Sfortunatamente, OpenAI afferma che la funzione di input dell’immagine è ancora un’anteprima di ricerca e non è ancora disponibile al pubblico.

▲ Aggiunta un’icona di riconoscimento dell’immagine Immagine da: Reddit

Tuttavia, recentemente un netizen di Reddit ha scoperto che il suo account Bing Chat aveva tranquillamente aggiunto una voce per il caricamento di immagini.

Microsoft ha precedentemente rivelato che Bing Chat utilizza il modello GPT-4 e ha menzionato nel registro degli aggiornamenti del mese scorso che aggiungerà il supporto multimodale a Bing.Nel complesso, è probabile che Bing Chat venga gradualmente sviluppato per gli utenti Apri la mappa prova di funzione di riconoscimento.

Questo netizen ha fatto molti test su Bing Chat, vediamo quanto è potente Bing Chat con “occhi lunghi”.

La prima è la funzione più sorprendente di visualizzazione dei meme di GPT-4. GPT-4 non solo può comprendere il contenuto dell’immagine, ma anche analizzare le battute del meme come gli umani.

Ad esempio, in questo meme, GPT-4 può vedere che l’immagine vuole esprimere che è assurdo utilizzare l’interfaccia obsoleta a forma di VGA per caricare l’iPhone, ed è assurdo introdurre una risata.

▲ Tradotto dalla macchina

I netizen hanno caricato gli stessi meme su Bing Chat per i test ed è successa una cosa strana: Bing Chat non ha riconosciuto che si trattava di un’interfaccia VGA, quindi non è riuscita a “capire” lo scherzo, ma Bing Chat ha comunque decifrato le foto. , ha anche detto la marca del cavo e ha fornito informazioni più dettagliate.

Potrebbe trattarsi di un errore accidentale di Bing Chat o potrebbe essere che Microsoft abbia apportato ulteriori modifiche alle restrizioni nell’applicazione effettiva di GPT-4, determinando una deviazione nella risposta.

I netizen hanno caricato un altro fumetto meme sull’apprendimento automatico e questa volta Bing Chat è stato in grado di rispondere in modo più accurato al contenuto e alle battute nell’immagine.

Anche l’analisi di Bing Chat di un altro meme sullo stirare i vestiti in macchina è perfetta.

▲ La traduzione qui è sbagliata, il testo originale è: Diddy Kong, Pyra, Pikachu, Zero Suit Samus, Donkey Kong, Sonic the Hedgehog, Ness, Cloud Strife e Incineroar

Quanto è accurato il riconoscimento delle immagini di Bing Chat? Ha caricato un’immagine dei personaggi di “Nintendo Smash Bros.” Ci sono molti personaggi disposti sulla stessa immagine e ha chiesto a Bing Chat di riconoscere tutti i personaggi uno per uno.

Di conseguenza, Bing Chat ha riconosciuto 7 dei 12 caratteri e sembra che il problema bidimensionale sia ancora un po’ difficile.

Quando è stato rilasciato OpenAI, ha anche mostrato un caso di programmazione di una pagina Web scattando una foto a mano.Il netizen ha anche disegnato un’immagine a mano per testare Bing.

Saltiamo il lungo collegamento di codice e vediamo direttamente l’effetto di questa pagina in esecuzione. Si può vedere che il prototipo della pagina web di base è ancora costruito.

L’aggiunta della funzione di riconoscimento delle immagini aggiunge molti usi a Bing Chat. Dopotutto, molti contenuti (come formule e grafici) in realtà sono difficili da esprimere chiaramente a parole. In questo momento, basta lanciare un’immagine all’IA per ottenere la risposta.

Lascia che ti spieghi, ad esempio, il processo mediante il quale i cromosomi si incrociano durante la meiosi.

Lascia che giochi all’insegnante di biologia e analizzi come funziona la filtrazione del nefrone.

Può anche essere utilizzato come medico online per diagnosticare semplicemente le malattie della pelle.

In precedenza, ChatGPT è stato sviluppato per imparare le lingue straniere e praticare l’inglese orale grazie alle sue eccellenti capacità di comprensione del testo e di espressione.

Dopo aver aggiunto il riconoscimento visivo, Bing Chat può persino svolgere il ruolo di un insegnante di scuola media, superiore o persino universitaria per aiutare gli studenti a rispondere a complessi problemi matematici, fisici e chimici.Se la funzione di riconoscimento delle immagini può essere promossa in futuro, questo potrebbe risolvere il problema dell’educazione in una certa misura, il problema delle risorse squilibrate.

Gli utenti possono anche usarlo per la diagnosi medica di base, risparmiando i soldi e il tempo necessari per le cure mediche, riflettendo il valore dell’intelligenza artificiale per il pubblico in generale.

Naturalmente, sebbene Bing Chat sia in grado di comprendere fondamentalmente il contenuto del mondo reale, le sue risposte possono essere utilizzate solo come riferimento dopotutto e non possono essere considerate consigli professionali.

Pertanto, se la funzione di riconoscimento della mappa deve essere completamente aperta al pubblico, Microsoft deve eseguire molte restrizioni e debug per garantire che il pubblico non abbia problemi di sicurezza a causa della sfiducia nella risposta dell’IA.

A breve termine, il riconoscimento delle immagini di Bing Chat dovrebbe essere solo una funzione di test disponibile per un numero ristretto di utenti.Se sei interessato, puoi accedere immediatamente al tuo account Microsoft per vedere se ce n’è uno in più sulla barra della chat di Bing Icona immagine chat.

Attualmente Bing Chat è aperta a tutti gli account Microsoft, vieni ad aprire la blind box per vedere se hai ricevuto la qualifica del test ⬇

https://www.bing.com/new

 

Taglia la merda.

#Benvenuto a seguire l’account pubblico WeChat ufficiale di Aifaner: Aifaner (ID WeChat: ifanr), altri contenuti interessanti ti verranno presentati il ​​prima possibile.

Ai Faner | Link originale · Visualizza i commenti · Sina Weibo