GPT-4: tutto quello che devi sapere sul modello AI standard di ChatGPT

Le persone erano in soggezione quando è uscito ChatGPT , impressionate dalle sue capacità linguistiche naturali come chatbot AI originariamente alimentato dal modello linguistico di grandi dimensioni GPT-3.5. Ma quando è uscito l’attesissimo modello linguistico di grandi dimensioni GPT-4, ha fatto saltare il coperchio su ciò che pensavamo fosse possibile con l’intelligenza artificiale, con alcuni che lo chiamano i primi scorci di AGI (intelligenza artificiale generale) .

Cos'è GPT-4?

GPT-4 è il modello linguistico più recente creato da OpenAI in grado di generare testo simile al parlato umano. Avanza la tecnologia utilizzata da ChatGPT, che in precedenza era basata su GPT-3.5 ma da allora è stata aggiornata. GPT è l'acronimo di Generative Pre-trained Transformer, una tecnologia di deep learning che utilizza reti neurali artificiali per scrivere come un essere umano.

Secondo OpenAI, questo modello linguistico di prossima generazione è più avanzato di ChatGPT in tre aree chiave: creatività, input visivo e contesto più lungo. In termini di creatività, OpenAI afferma che GPT-4 è molto migliore sia nel creare che nel collaborare con gli utenti su progetti creativi. Esempi di questi includono musica, sceneggiature, scrittura tecnica e persino "apprendimento dello stile di scrittura di un utente".

Streaming live per sviluppatori GPT-4

Anche il contesto più lungo gioca un ruolo in questo. GPT-4 ora può elaborare fino a 128.000 token di testo dall'utente. Puoi anche semplicemente inviare a GPT-4 un collegamento Web e chiedergli di interagire con il testo di quella pagina. OpenAI afferma che ciò può essere utile per la creazione di contenuti di lunga durata, nonché per "conversazioni estese".

GPT-4 ora può anche ricevere immagini come base per l'interazione. Nell'esempio fornito sul sito web GPT-4, al chatbot viene data un'immagine di alcuni ingredienti da forno e gli viene chiesto cosa si può fare con essi. Al momento non è noto se anche il video possa essere utilizzato allo stesso modo.

Immagine utilizzata con il permesso del detentore del copyright

Infine, OpenAI afferma anche che GPT-4 è significativamente più sicuro da usare rispetto alla generazione precedente. Secondo quanto riferito, può produrre il 40% in più di risposte basate sui fatti nei test interni di OpenAI, mentre ha anche l'82% in meno di probabilità di "rispondere alle richieste di contenuti non consentiti".

OpenAI afferma di essere stato addestrato con il feedback umano per fare questi passi avanti, affermando di aver lavorato con "oltre 50 esperti per un feedback precoce in settori quali la sicurezza e la protezione dell'IA".

Nelle prime settimane dopo il lancio, gli utenti hanno pubblicato alcune delle cose straordinarie che hanno fatto con esso , tra cui l'invenzione di nuovi linguaggi, i dettagli su come fuggire nel mondo reale e la creazione di animazioni complesse per le app da zero. Apparentemente un utente ha fatto in modo che GPT-4 creasse una versione funzionante di Pong in soli sessanta secondi, utilizzando un mix di HTML e JavaScript.

Come utilizzare GPT-4

Bing Chat mostrato su un laptop.
Jacob Roach / Tendenze digitali

GPT-4 è disponibile per tutti gli utenti a ogni livello di abbonamento offerto da OpenAI. Gli utenti del livello gratuito avranno accesso limitato al modello GPT-4 completo (~80 chat in un periodo di 3 ore) prima di passare al più piccolo e meno potente GPT-4o mini fino al ripristino del timer di raffreddamento. Per ottenere un accesso aggiuntivo GPT-4, oltre a poter generare immagini con Dall-E, è necessario eseguire l'aggiornamento a ChatGPT Plus. Per passare all'abbonamento a pagamento da $ 20, basta fare clic su "Aggiorna a Plus" nella barra laterale di ChatGPT. Dopo aver inserito i dati della tua carta di credito, sarai in grado di alternare tra GPT-4 e le versioni precedenti di LLM.

Se non vuoi pagare, ci sono altri modi per avere un assaggio di quanto sia potente GPT-4. Prima di tutto, puoi provarlo come parte di Bing Chat di Microsoft. Microsoft ha rivelato di utilizzare GPT-4 in Bing Chat, che è completamente gratuito. Tuttavia, alcune funzionalità GPT-4 mancano in Bing Chat ed è chiaramente stata combinata con alcune tecnologie proprietarie di Microsoft. Ma avrai comunque accesso a quel LLM espanso (modello linguistico di grandi dimensioni) e all'intelligenza avanzata che ne deriva. Va notato che, sebbene Bing Chat sia gratuito, è limitato a 15 chat per sessione e 150 sessioni al giorno.

Ci sono anche molte altre applicazioni che attualmente utilizzano GPT-4 , come il sito di risposta alle domande, Quora.

Quando è stato rilasciato GPT-4?

Un laptop aperto sul sito Web ChatGPT.
Shutterstock

GPT-4 è stato annunciato ufficialmente il 13 marzo, come confermato in anticipo da Microsoft , ed è diventato disponibile per la prima volta agli utenti tramite un abbonamento ChatGPT-Plus e Microsoft Copilot. GPT-4 è stato reso disponibile anche come API “per consentire agli sviluppatori di creare applicazioni e servizi”. Alcune delle aziende che hanno già integrato GPT-4 includono Duolingo, Be My Eyes, Stripe e Khan Academy. La prima dimostrazione pubblica di GPT-4 è stata trasmessa in live streaming su YouTube, mostrando le sue nuove capacità.

Cos'è GPT-4o mini?

GPT-4o mini è l'iterazione più recente della linea di modelli GPT-4 di OpenAI. È una versione semplificata del modello GPT-4o più grande che è più adatto per attività semplici ma ad alto volume che traggono maggiore vantaggio da una velocità di inferenza rapida che dallo sfruttamento della potenza dell'intero modello.

GPT-4o mini è stato rilasciato nel luglio 2024 e ha sostituito GPT-3.5 come modello predefinito con cui gli utenti interagiscono in ChatGPT una volta raggiunto il limite di tre ore di query con GPT-4o . Secondo i dati di Artificial Analysis , 4o mini supera significativamente modelli piccoli di dimensioni simili come Gemini 1.5 Flash di Google e Claude 3 Haiku di Anthropic nel benchmark di ragionamento MMLU.

GPT-4 è migliore di GPT-3.5?

La versione gratuita di ChatGPT era originariamente basata sul modello GPT 3.5; tuttavia, a partire da luglio 2024, ChatGPT ora funziona su GPT-4o mini. Questa versione semplificata del modello GPT-4o più grande è molto migliore anche di GPT-3.5 Turbo. È in grado di comprendere e rispondere a un numero maggiore di input, dispone di maggiori garanzie, fornisce risposte più concise ed è meno costoso da gestire del 60% .

L'API GPT-4

Come accennato, GPT-4 è disponibile come API per gli sviluppatori che in passato hanno effettuato almeno un pagamento andato a buon fine a OpenAI. L'azienda offre diverse versioni di GPT-4 che gli sviluppatori possono utilizzare tramite la sua API, insieme ai modelli GPT-3.5 legacy. Dopo aver rilasciato GPT-4o mini , OpenAI ha notato che GPT-3.5 rimarrà disponibile per l'uso da parte degli sviluppatori, anche se alla fine verrà portato offline. La società non ha fissato una tempistica per quando ciò potrebbe effettivamente accadere.

L'API è principalmente focalizzata sugli sviluppatori che creano nuove app, ma ha causato confusione anche tra i consumatori. Plex ti consente di integrare ChatGPT nel lettore musicale Plexamp del servizio, che richiede una chiave API ChatGPT. Questo è un acquisto separato da ChatGPT Plus, quindi dovrai registrarti per un account sviluppatore per ottenere l'accesso API, se lo desideri.

GPT-4 sta peggiorando?

Per quanto GPT-4 abbia impressionato le persone al suo lancio, alcuni utenti hanno notato un degrado nelle sue risposte nei mesi successivi. È stato notato da figure importanti nella comunità degli sviluppatori ed è stato persino pubblicato direttamente sui forum di OpenAI. Tuttavia era tutto aneddotico e un dirigente di OpenAI si è persino rivolto a Twitter per dissuadere la premessa. Secondo OpenAI, è tutto nelle nostre teste.

Successivamente è stato pubblicato uno studio che ha dimostrato che, in effetti, vi era un peggioramento della qualità delle risposte con i futuri aggiornamenti del modello. Confrontando GPT-4 tra i mesi di marzo e giugno, i ricercatori sono stati in grado di accertare che GPT-4 è passato dal 97,6% di precisione al 2,4%.

Non è una prova schiacciante, ma sembra certamente che ciò che gli utenti notano non sia solo immaginato.

Dov'è l'input visivo in GPT-4?

Una delle funzionalità più attese di GPT-4 è l'input visivo, che consente a ChatGPT Plus di interagire con le immagini e non solo con il testo, rendendo il modello veramente multimodale. Caricare immagini affinché GPT-4 possa analizzarle e manipolarle è facile quanto caricare documenti: basta fare clic sull'icona della graffetta a sinistra della finestra contestuale, selezionare la fonte dell'immagine e allegare l'immagine al prompt.

Quali sono i limiti di GPT-4?

Discutendo delle nuove funzionalità di GPT-4, OpenAI rileva anche alcuni limiti del nuovo modello linguistico. Come le versioni precedenti di GPT, OpenAI afferma che l'ultimo modello presenta ancora problemi con "pregiudizi sociali, allucinazioni e suggerimenti contraddittori".

In altre parole, non è perfetto. Riceverà comunque risposte sbagliate e ci sono stati molti esempi mostrati online che ne dimostrano i limiti. Ma OpenAI afferma che queste sono tutte questioni su cui l’azienda sta lavorando e, in generale, GPT-4 è “meno creativo” con le risposte e quindi meno propenso a inventare fatti.

L'altra limitazione principale è che il modello GPT-4 è stato addestrato sui dati Internet fino a dicembre 2023 (GPT-4o e 4o mini interrotti nell'ottobre di quell'anno). Tuttavia, poiché GPT-4 è in grado di condurre ricerche sul web e non fare semplicemente affidamento sul suo set di dati pre-addestrati, può facilmente cercare e rintracciare fatti più recenti da Internet.

GPT-4o è l'ultima versione, ovviamente, e GPT-5 è ancora in arrivo.