Pesante al mattino! L’epico aggiornamento di ChatGPT di Google, il nuovo modello raggiunge GPT-4 e sovvertirà completamente la ricerca
Prima che inizi l’articolo, lascia che ti dica alcune fredde conoscenze: quest’anno è il quindicesimo anno in cui Google tiene la I/O Developer Conference.
Durante le conferenze I/O degli ultimi sette anni, i contenuti AI sono sempre stati una priorità assoluta per Google. Ad esempio, prima che ChatGPT diventasse popolare, Google aveva già dimostrato la serie LaMDA di modelli di generazione del linguaggio alla conferenza I/O, ma non ha aspettato l’occasione dell’incendio.
Oggi, lo scoppio di ChatGPT ha portato l’intelligenza artificiale al suo momento migliore, ma rende anche Google estremamente ansioso.
Dopo aver visto l’intera conferenza, Google ha menzionato la parola “AI” quasi 200 volte e ha quasi scritto AI in tutti i prodotti inclusi Gmail, ricerca, Pixel, ecc., desideroso di dimostrare a tutti che è ancora in prima linea nell’IA.
Se questa conferenza si fosse tenuta sei mesi fa, sarebbe stata estremamente entusiasmante: ufficio assistito dall’IA, ricerca dell’IA, programmazione dell’IA, ognuna delle quali è un’importante applicazione tecnica. È un peccato che Microsoft sia andata fino in fondo prima di questo.
Si può anche dire che la reazione del pubblico sia stata un po’ fredda. In effetti, ci sono stati solo due grandi applausi: la modalità oscura di Bard e il dock gratuito per il tablet Pixel.
Alla conferenza I/O di oggi, i nuovi prodotti e tecnologie rilasciati da Google sono come mettersi al passo con Microsoft e OpenAI, mettersi al passo con il futuro dell’IA che è stato preventivamente realizzato.
PaLM2, l’arma segreta di Google contro GPT-4
Il modello di linguaggio di grandi dimensioni è diventato il prodotto di punta nel circolo tecnologico. Ogni azienda spera di elaborare un modello auto-sviluppato che possa sfidare GPT a dimostrare la sua forza di ricerca scientifica e Google non fa eccezione.
Google ha rilasciato una nuova generazione del modello di linguaggio di grandi dimensioni PaLM2 per competere con GPT-4.
Secondo Google, hanno utilizzato un gran numero di set di dati matematici e scientifici per addestrare PaLM 2. Rispetto al modello PaLM dello scorso anno, PaLM 2 ha notevolmente migliorato le sue capacità di elaborazione multilingue, ragionamento e codifica.
Secondo il test ufficiale di Google, alcuni risultati di PaLM2 (come la matematica) sono migliori di GPT-4.
Google non ha rivelato la scala dei parametri specifici di PaLM 2, menzionando solo che PaLM 2 si basa sulle più recenti strutture informatiche JAX e TPU v4. Google ha ottimizzato l’algoritmo di PaLM 2, rendendolo di dimensioni inferiori rispetto a PaLM, ma con prestazioni complessive migliori e maggiore efficienza computazionale.
Supporto PALM 2 Più di 100 linguaggi diversi e più di 20 linguaggi di programmazione, inclusi JavaScript, Python, Prolog, Verilog, Fortran, ecc., Si può dire che sia un maestro delle lingue.
Non è sufficiente comprendere e generare testi convenzionali. PaLM 2, che supporta la multimodalità, può anche comprendere e generare contenuti audio e video. Google ha mostrato un modello chiamato Med-PaLM che è ottimizzato per il campo medico. Secondo X Analisi del film leggero delle lesioni dei pazienti, Google ha raggiunto il livello dei medici umani a questo proposito.
Il modello PaLM 2 può anche essere “suddiviso” in 4 versioni di diverse dimensioni e distribuito su vari dispositivi. Ad esempio, un modello Gecko relativamente piccolo può essere eseguito su uno smartphone, in modo che il terminale mobile possa avere anche un modello linguistico di grandi dimensioni.
Vale la pena ricordare che PaLM 2 è attualmente aperto per l’anteprima e Bard, il chat robot di Google, ha utilizzato il modello PaLM 2 per migliorare la sua capacità di risposta. I contenuti di Google hanno più di 70 team di prodotto che utilizzano PaLM 2 per creare prodotti. La maggior parte degli aggiornamenti di questa conferenza sono progettati sulla base del modello PaLM 2. Si può affermare che PaLM 2 è il motore principale dell’intelligenza artificiale completa di Google.
Oltre a PaLM 2, il CEO di Google Sundar Pichai ha anche leggermente rovinato la notizia del grande modello di prossima generazione Gemini (Gemini), che ha affermato essere progettato per essere multimodale, efficiente e costruito per l’innovazione futura. .
Gemini è un nuovo modello sviluppato congiuntamente dalla fusione di due importanti team di intelligenza artificiale, Google Brain e DeepMind. Dal nome, si può vedere che Gemini unirà i punti di forza dei due e dovrebbe essere tra i più potenti modelli di linguaggio di grandi dimensioni .
Bardo: aggiornamento multimodale, in grado di disegnare e leggere immagini
Ha un aspetto migliore, è più completo e può essere utilizzato da più persone.
Dopo meno di 2 mesi di aggiornamenti, Google ha migrato Bard al più potente modello di linguaggio di grandi dimensioni PalM2, un concorrente di ChatGPT e BingChat che è stato notevolmente aggiornato e più potente:
- Cancella la lista d’attesa e apri a più di 180 paesi e regioni;
- Aggiunta immagine domanda e risposta, il dialogo è più intuitivo;
- Integra Adobe Firefly per generare rapidamente immagini;
- Citazioni della fonte, modalità oscura, pulsante di esportazione del codice, aggiornamento di ulteriori dettagli.
Limitato britannico e americano, solo inglese, lista d’attesa, non è facile usare Bard con molte restrizioni. A partire da oggi, Bard annuncia ufficialmente la cancellazione della lista d’attesa e apre l’esperienza a più di 180 paesi e regioni.
Bard ora supporta anche il giapponese e il coreano e presto estenderà il supporto a 40 lingue, incluso il cinese.
In termini di funzionalità, Bard ha subito anche notevoli aggiornamenti, che possono essere riassunti in quattro parole come “sia immagini che testi”. Quando pone domande a Bard, non è più un robot che può solo rispondere ai testi in modo secco, ma può anche mostrarci risposte più ricche e intuitive sotto forma di immagini.
Allo stesso tempo, Google ha anche portato la capacità di Google Lens a Bard, in modo che quest’ultimo non solo possa rispondere alle immagini, ma anche comprendere le immagini e redigere contenuti in base alle informazioni sulle immagini. Ad esempio, potresti inviargli una foto di un cane e fargli scrivere didascalie basate sulla razza del cane.
Forse è perché la funzione dell’immagine di Vincent della porta accanto è troppo popolare. Google ha aggiunto questa funzione anche a Bard, ma collabora con Adobe Firefly. Integrando Bard di Firefly, è possibile generare immagini di alta qualità in linguaggio naturale. E con l’approvazione di Adobe, non è necessario preoccuparsi del copyright e della qualità delle immagini.
Adobe è solo l’inizio e Google lavorerà con Kayak, OpenTable, società di reclutamento zip, Khan Academy e altri partner per aggiungere ulteriori funzionalità a Bard.
Rispetto a ChatGPT, il posizionamento di Bard è più orientato verso BingChat, un motore di ricerca e uno strumento di produttività, che la prossima settimana aggiungerà una funzione di riferimento e visualizzerà la fonte del codice generato per garantire la precisione. Inoltre, è stata aggiunta la possibilità di esportare ed eseguire il codice per facilitare gli sviluppatori a lavorare in modo efficiente. A proposito, è stata aggiunta una modalità oscura, che ha suscitato applausi dalla scena.
Sebbene ci siano stati alcuni oolong nel suo debutto, Google ci ha comunque mostrato un Bardo in costante miglioramento. Peccato che “we’ll” sia la parola che abbiamo sentito di più nell’introduzione: dopo che tutte le funzioni rilasciate oggi saranno state implementate e lanciate, Bard sarà uno strumento sufficientemente completo e maturo.
Duet AI: gestisci le attività d’ufficio con l’IA
Arriva il concorrente Copilot.
Google ha introdotto un nuovo strumento, Duet AI, per il suo spazio di lavoro, che ci consente di vedere il ruolo che l’IA gioca nella suite per ufficio Google basata su cloud:
- Documentazione: riassumere il testo completo e scrivere automaticamente;
- Presentazione: diagramma di Vincent, miglioramento dell’efficienza;
- Tabelle: analizzare i dati, sviluppare strategie.
In Google Docs, puoi dire a Duet AI cosa vuoi creare e fare in modo che generi automaticamente articoli. Puoi anche lasciare che generi diversi stili di scrittura in base alle tue esigenze.
La funzione “ChatPDF” di “leggere” articoli e domande chiave non è stata lasciata indietro.
Queste funzionalità di generazione, espansione e regolazione del testo vengono utilizzate anche in Google Mail.
In termini di presentazioni, Duet AI funge da generatore di immagini, che può aiutarti a risparmiare tempo nella ricerca di immagini su Internet e ad arricchire le presentazioni con contenuti originali.
Nel modulo, Duet AI può organizzare automaticamente i dati in base alle tue domande per rendere i dati più standardizzati.
Queste funzionalità possono anche essere collegate ad altri servizi Google.Ad esempio, dopo aver creato un modulo in Bard, puoi generare un documento del modulo con un clic per un utilizzo successivo.
Duet AI ha anche aggiunto una serie di strumenti di sviluppo cloud di Google basati sull’apprendimento automatico, che possono fornire correzione degli errori di codice in tempo reale, generazione, ecc. e supportare più linguaggi di sviluppo come Go, Java, Javascript, Python e SQL.
Non dobbiamo aspettare che Bard passi, ora possiamo aspettare Duet AI.Se vuoi provare queste funzionalità, devi comunque iscriverti alla lista d’attesa e attendere che Google apra il test nella regione corrispondente.
In generale, Duet AI è meno sorprendente che vedere Copilot per la prima volta e la dimostrazione della funzione sembra essere più debole. Ma ci sono voluti meno di due mesi perché Bard riuscisse a recuperare il ritardo.
Ricerca Google: ridefinito, tutto
Le ricerche future potrebbero avere questo aspetto:
Spinta da PaLM 2, anche la ricerca Google ha introdotto un’innovazione ed è stato lanciato un nuovo motore di ricerca SGE (Search Generative Experience): non è più necessario dividere una grande domanda in più piccole domande e poi mettere insieme le risposte dopo ricerca , con la benedizione dell’IA generativa, puoi lasciare che la ricerca faccia un lavoro pesante.
Alla conferenza, Google ha evidenziato il miglioramento dell’IA generativa nello shopping: quando utilizzi Google per cercare un prodotto, vedrai la descrizione del prodotto, le recensioni, i prezzi e le immagini visualizzate.
Google, che ha più di 35 miliardi di schede di prodotti, si aggiorna costantemente a una velocità di 1,8 miliardi all’ora. Cercando e facendo acquisti su Google, puoi ottenere risultati più aggiornati e affidabili.
Google ritiene che la pubblicità sia una parte importante di Internet e continuerà a sostenere il proprio impegno per la trasparenza della pubblicità e per garantire che gli annunci e i risultati di ricerca siano distinti.
Google sta aprendo le iscrizioni a Search Labs oggi e aprendo l’accesso nelle prossime settimane, supportando l’app Google e il browser Chrome. Il link dell’applicazione è il seguente: labs.google.com/search
L’ansia dell’IA di Google può essere risolta solo con l’IA
Alcune persone dicono scherzosamente che l’I/O di Google di quest’anno dovrebbe chiamarsi Google AI/O. I gioielli di Microsoft e OpenAI sono davanti, e Google ha un momento un po’ meno sorprendente, ma questa è senza dubbio l’auto-rivoluzione più risoluta di Google negli ultimi anni.
Google, che afferma di essere AI-first, ha perso opportunità molte volte a causa della sua strategia eccessivamente cauta e conservatrice. Ora Google ha finalmente capito che deve agire in fretta, come hanno detto molti dirigenti Google, per essere “audace e responsabile”, e non può più esitare per paura di sbagliare.
Ovviamente, l’intelligenza artificiale non è una panacea e il Bardo aggiornato potrebbe non essere in grado di cambiare la tendenza alla sovversione della ricerca su Google. Ma non c’è dubbio che l’intelligenza artificiale rimodellerà la ricerca e rivoluzionerà questa interazione.
Bing, la cui quota è di gran lunga inferiore a quella di Google, ha raggiunto in pochi mesi più di 100 milioni di utenti attivi giornalieri attraverso i chatbot, e condotto più di 500 milioni di chat, di cui il 70% di utenti che provano la nuova funzione chat di Bing lo utilizzerà per le attività relative alla ricerca.
Quando il motore di ricerca più grande del mondo deciderà di abbandonare il fardello del passato e abbracciare pienamente questa tendenza, ciò che cambierà potrebbe non essere solo il futuro di Google, ma potrebbe anche sovvertire il meccanismo di funzionamento di Internet e cambiare l’interazione di miliardi di utenti .
Sta arrivando un mondo nuovo e più semplice.
#Benvenuti a prestare attenzione all’account pubblico WeChat ufficiale di Aifaner: Aifaner (ID WeChat: ifanr), altri contenuti interessanti ti verranno presentati il prima possibile.
Ai Faner | Link originale · Visualizza i commenti · Sina Weibo