Fino a che punto GPT-4 diventerà “Skynet”? L’ultima ricerca di Microsoft ha rivelato: ha iniziato a prendere forma

31 Marzo 2023

In molti film di fantascienza, vediamo spesso i personaggi di un sistema di intelligenza artificiale o di un robot intelligente che può pensare in modo indipendente ed eseguire compiti automaticamente.

Ad esempio, “2001: Odissea nello spazio” ha progettato un computer super intelligente HAL 9000 per gestire i compiti degli astronauti; “Terminator” ha modellato il sistema di intelligenza artificiale ad autoapprendimento Skynet, che mira a controllare le armi nucleari e i sistemi di difesa statunitensi per garantire che il paese Sicurezza.

Questi sistemi di intelligenza artificiale che possono pensare e ragionare come gli umani e hanno anche una vasta gamma di abilità e capacità cognitive sono chiamati AGI (Artificial General Intelligence).

L’intelligenza dell’AGI non si limita a campi o compiti specifici, ma anche al ragionamento, alla pianificazione, alla risoluzione di problemi, al pensiero astratto, alla comprensione di idee complesse, all’apprendimento rapido e alle capacità di apprendimento esperienziale, ecc.

Ad esempio, sebbene Alpha GO sia l’unico gioco al mondo, non è AGI, mentre Wall-E in “Robot Story” è più in linea con la definizione di AGI umano.

Il concetto di AGI esiste da decenni nel campo dell’intelligenza artificiale e molti ricercatori hanno cercato di realizzare AGI sviluppando nuovi algoritmi, modelli e metodi. Quanto siamo lontani dal raggiungimento dell’AGI?

Un documento recentemente pubblicato da Microsoft Research ha sottolineato che l’ultimo modello di linguaggio di grandi dimensioni GPT-4 di OpenAI ha già il prototipo di AGI.

Le ampie capacità di GPT-4 con molte capacità che coprono un’ampia gamma di domini e prestazioni a livello umano e soprattutto su un’ampia gamma di attività ci consentono di affermare con sicurezza che GPT-4 è un passo importante verso l’AGI.

La scintilla dell’intelligenza artificiale

Il testo completo di questo documento di Microsoft Research ha 154 pagine ed è pieno di domande di prova per i ricercatori su GPT-4.

▲ Immagine da: YouTube@AI spiegato

A causa della lunghezza del testo completo, il blogger di YouTube AI Explained ha selezionato e condensato il testo completo, seguiamo la sua prospettiva per comprendere intuitivamente le capacità di GPT-4.

Va notato che questi ricercatori di Microsoft sono stati esposti al modello nella fase iniziale di sviluppo di GPT-4 e hanno condotto esperimenti per circa 6 mesi.

Hanno usato la versione di sviluppo senza restrizioni, non la versione finale che ora viene elaborata con restrizioni di sicurezza, quindi le conclusioni proposte nell’articolo sono solo per il modello GPT-4 originale.

Andiamo al sodo. L’articolo sottolinea che un’importante nuova capacità di GPT-4 è la capacità di utilizzare correttamente gli strumenti con poche istruzioni o nessuna dimostrazione, come l’utilizzo di una calcolatrice, cosa non possibile con la versione GPT-3.5 di ChatGPT (di seguito denominata la vecchia versione di ChatGPT) è arrivata.

Suggerimenti: c’è un fiume che scorre da sinistra a destra, accanto al fiume c’è un deserto con piramidi, ci sono 4 pulsanti nella parte inferiore dello schermo, i colori sono verde, blu, marrone e rosso

I ricercatori hanno scoperto che GPT-4 può essere combinato con Stable Diffusion per produrre un’immagine dettagliata in base alle istruzioni del testo e disporre gli oggetti in base alle istruzioni del testo, il che migliora l’efficienza d’uso.

Una differenza importante tra gli esseri umani e gli altri animali è che gli esseri umani scopriranno e utilizzeranno strumenti, e ora l’IA si sta lentamente evolvendo in questa direzione.

I ricercatori hanno anche chiesto a GPT-4 di sostenere un finto esame per ingegneri del software su LeetCode.

Prendendo come campione i migliori risultati dei cinque esami, GPT-4 ha ottenuto rispettivamente l’86,4%, il 60% e il 14,3% nei tre livelli di esami facile, medio e difficile.

Il documento afferma modestamente che il livello di codifica di GPT-4 è vicino al livello umano, quindi che ne dici delle prestazioni umane?

Il database di LeetCode mostra che i punteggi medi degli esseri umani nei tre livelli di esame semplice, medio e difficile sono rispettivamente del 72,2%, 38,7% e 7%, ovvero i dati di persone che non sanno rispondere a una sola domanda.

Si può dire che GPT-4 è già migliore di molti ingegneri del software in termini di capacità di programmazione.

GPT-4 può non solo completare il normale lavoro di programmazione, ma anche essere competente per lo sviluppo di giochi 3D complessi.

Il documento menzionava che GPT-4 utilizzava JavaScript per generare una demo del gioco per evitare gli ostacoli in HTML nel caso di zero campioni.

Finché è leggermente ottimizzato su questa base, questa demo può essere completamente trasformata in un prodotto di gioco. E quando i ricercatori hanno testato una versione precedente di ChatGPT con gli stessi prompt, quest’ultima ha detto che non era possibile.

Per testare le sue capacità di ragionamento, i ricercatori gli hanno posto una domanda dalle Olimpiadi Matematiche Internazionali del 2022.

▲ Puoi anche sfidarlo~

Poiché il database GPT-4 viene aggiornato solo fino al 2021 (sebbene sia una versione di sviluppo, non è ancora connesso a Internet), la risposta a questa domanda non è nel suo database, quindi deve essere completata interamente dal ragionamento logico matematico .

GPT-4 ha risposto a una corretta logica di risoluzione dei problemi, ma c’era un errore nella risposta specifica. I ricercatori hanno affermato che si trattava di un errore di calcolo di base (come una persona che ha calcolato la moltiplicazione come divisione durante l’esame), mentre ChatGPT può solo genera una risposta logicamente incoerente e il livello è di gran lunga peggiore.

Quando vengono poste alcune domande difficili come “quante palline da golf possono essere posizionate in una piscina”, GPT-4 può anche rispondere in modo logico.

Quindi i ricercatori hanno scoperto che GPT-4 può chiamare le API di altre applicazioni per completare operazioni come il recupero di e-mail, calendari, coordinate, ecc. degli utenti, in modo da aiutare le persone a ordinare pasti, prenotare biglietti e rispondere a e-mail e altre attività di assistenza.

Ciò si è riflesso nelle funzioni del set di plug-in ChatGPT recentemente annunciato da OpenAI.Ciò che il modello GPT-4 può fare sicuramente non è solo la generazione di testo.Combinandosi con altre API dell’applicazione, può diventare un’esistenza simile a un sistema.

I ricercatori hanno anche scoperto una funzione che difficilmente noterai, ovvero GPT-4 può costruire un modello mentale umano.

I ricercatori hanno allestito una scena per questo e GPT-4 ha analizzato i processi psicologici delle persone nella scena e le azioni corrispondenti.

In altre parole, GPT-4 può interpretare la connessione tra comportamento umano e psicologia come gli umani, piuttosto che vedere semplicemente l’azione stessa, il che è un grande progresso per l’IA.

Un’altra cosa?

Questo documento è suddiviso in dieci capitoli, che introducono le capacità multimodali di GPT-4 (correlate al contenuto generato visivamente), la generazione e la comprensione delle capacità del codice, le capacità matematiche, le capacità di interazione con il mondo, le capacità di interazione con gli esseri umani, la discriminazione e GPT-4 limitazioni, impatto sociale, direzioni future.

Il testo completo interpreta appieno le capacità di GPT-4 in un modo per spogliare i bozzoli.Una volta rilasciato, ha ricevuto un’attenzione diffusa ed è diventato popolare.

È interessante notare che alcuni netizen hanno scoperto che l’autore aveva nascosto alcune informazioni nei commenti del codice sorgente LaTeX dell’articolo.

▲ A giudicare dalle note, DV-3 dovrebbe essere Davinci 3 (Da Vinci 3)

Ad esempio, il nome interno di GPT-4 è in realtà DV-3. Allo stesso tempo, è anche il “terzo autore” di questo articolo. Forse per questioni di privacy, questo è stato deliberatamente nascosto dall’autore.

I netizen hanno anche scoperto che l’autore non è molto chiaro sul costo effettivo di GPT-4 e sembra riferirsi erroneamente a GPT-4 come a un modello di testo semplice anziché a un modello multimodale.

Anche la parte del paper relativa ai contenuti tossici è stata cancellata quando è stata pubblicata, forse questo per evitare inutili ripercussioni negative su OpenAI.

In generale, se sei interessato a cosa può fare GPT-4, quali sono le attuali limitazioni o i progressi dell’IA, puoi saperne di più sul più potente modello di linguaggio di grandi dimensioni attraverso questo articolo.

L’indirizzo originale è qui: https://arxiv.org/pdf/2303.12712.pdf

Divertirsi.

Huang Zhijian

Taglia la merda.

Posta

#Benvenuti a prestare attenzione all’account pubblico WeChat ufficiale di Aifaner: Aifaner (ID WeChat: ifanr), altri contenuti interessanti ti verranno presentati il prima possibile.

Ai Faner | Link originale · Visualizza i commenti · Sina Weibo