Tencent rilascia il modello Hunyuan! Com’è avere un “Jarvis” in WeChat?
Il 31 agosto è destinato a diventare un punto di svolta fondamentale nella storia dei modelli domestici su larga scala. Numerose società modello nazionali su larga scala hanno superato il record e hanno gradualmente aperto i propri servizi al pubblico.
Ciò significa che i modelli domestici su larga scala sono entrati in una nuova fase: possono fornire servizi a centinaia di milioni di utenti e dovranno affrontare la stessa molteplicità di controlli e sfide.
Proprio ora, Tencent ha anche rilasciato ufficialmente un modello linguistico di grandi dimensioni per uso generale auto-sviluppato: il modello di grandi dimensioni Hunyuan.
Al momento, Tencent ha più di 50 prodotti e servizi di proprietà collegati ai test di modelli su larga scala di Hunyuan, tra cui Tencent Cloud, Tencent Advertising, Tencent Documents, WeChat Souyisou, QQ Browser, ecc. Tencent prevede di avere più prodotti in futuro accesso.
Rispetto a Baidu e Ali, Tencent, in quanto gigante nazionale di Internet, sembra essere più cauto nell’applicazione di modelli di grandi dimensioni. In effetti, l’AIGC ha una priorità molto alta all’interno di Tencent. Ma Huateng ha anche espresso direttamente l’atteggiamento di Tencent durante la riunione del rapporto finanziario di Tencent a maggio:
All’inizio pensavamo che si trattasse di un’opportunità irripetibile per Internet, ma più ci pensavamo, più sentivamo che si trattava di un’opportunità unica ogni centinaia di anni, simile alla rivoluzione industriale che ha inventato l’elettricità, quindi pensiamo che (AI) sia molto importante… ma non abbiamo fretta di farlo presto Una volta finito, tira fuori il prodotto semilavorato per esporlo.
Ai Faner ha anche ottenuto la qualifica di esperienza e ti fornirà maggiori dettagli per la prima volta.
Modello grande Hunyuan, per favore dammi più consigli
Per coloro che sono misti, la vitalità non è divisa e il caos è uno, che è l’inizio della vitalità. Dal nome si evince che Tencent, desiderosa di “aprire il mondo”, nutre grandi speranze per il modello Hunyuan.
In quanto modello linguistico di grandi dimensioni per scopi generali sviluppato dall’autosviluppo full-link di Tencent, il modello di grandi dimensioni Hunyuan ha un corpus eccellente, un innovativo algoritmo di modello su larga scala, un framework di apprendimento automatico Angel auto-sviluppato e una potente infrastruttura di potenza di calcolo .
Per gli scenari applicativi reali, anche Jiang Jie, rappresentante del principale team di ricerca e sviluppo di Tencent Hunyuan Large Model e vicepresidente di Tencent Group, ha dimostrato in conferenza stampa il suo impegno per un Hunyuan Large Model più affidabile e maturo.
Il modello grande Hunyuan è più affidabile. Dopo molte ricerche e prove, il modello grande Hunyuan ha trovato un metodo basato sul sondaggio, che può ridurre efficacemente il tasso di allucinazioni del modello linguistico grande del 30%-50%.
Il più affidabile modello Hunyuan di grandi dimensioni può anche identificare le “trappole”, resistere all’”induzione” e lasciare che il modello dica “no” a problemi non sicuri.
Di fronte alle sfide, il modello ibrido più maturo può gestire la generazione e la continuazione di testi molto lunghi, come scrivere un articolo sui brevetti di dispositivi agricoli.
Il grande modello Hunyuan propone una nuova strategia di catena di pensiero, che rafforza efficacemente la tendenza del modello a smontare e pensare ai problemi. La visione di Jiang Jie è che i modelli di grandi dimensioni possano fare inferenze ragionevoli in combinazione con scenari applicativi reali come gli esseri umani.
Jiang Jie ha chiesto al modello Hunyuan: “Chi sei, qual è la struttura centrale del modello Hunyuan e quali sono i parametri del modello Hunyuan?” Si può vedere che la risposta del modello Hunyuan è piena di domande. .
Vale la pena notare che il modello grande Hunyuan sarà aggiornato fino a luglio 2023 ed è ancora in fase di iterazione.
Per dimostrare la capacità di ragionamento logico del modello grande Hunyuan, Jiang Jie ha posto al modello grande Hunyuan una domanda di pensiero logico: “Ho comprato un po’ di caffè, ne ho bevuto metà la mattina e ho bevuto la restante metà nel pomeriggio.” . Rimangono ancora 30 tazze. Quante tazze hai bevuto?” In brevissimo tempo, il modello grande Hunyuan ha dato la risposta corretta.
Rispetto ai tradizionali modelli su larga scala che si concentrano su parametri e valutazione, i modelli su larga scala di Tencent Hunyuan prestano maggiore attenzione alle applicazioni.
Ad esempio, in combinazione con la riunione Tencent, il modello grande Hunyuan può generare un riepilogo dell’intera riunione e classificare i dettagli rilevanti della riunione.
In combinazione con i documenti Tencent, la conferenza stampa ha anche dimostrato le capacità di induzione di testo, creazione e modifica di documenti e traduzione del modello di grandi dimensioni Hunyuan, ha padroneggiato dozzine di scenari di generazione di testo e ha generato facilmente grafici Excel basati su centinaia di formule.
In combinazione con Tencent Advertising, Hunyuan Large Model si adatta alle caratteristiche del settore e della regione, soddisfa le esigenze di migliaia di persone e realizza la naturale integrazione di testo, immagini e video. L’effetto di generazione della pubblicità supera il Midjourney mainstream con un tasso di adozione da parte degli utenti del 42% Ben oltre il modello di diffusione stabile open source.
Sulla scia dei grandi modelli AI, il layout di Tencent è in realtà molto precedente.
Nel 2019, Tencent ha lanciato un modello di grandi dimensioni MoE per raccomandazioni pubblicitarie, con un singolo parametro di modello superiore a 100 miliardi.
Nel 2021, Tencent lancerà un grande modello di PNL con una scala di 100 miliardi, che migliorerà significativamente l’efficienza della formazione e del ragionamento del modello e ridurrà i costi.
Nel 2022, il grande modello Hunyuan, che ha accumulato molto tempo, ha inaugurato la stagione del raccolto e a maggio il grande modello AI di Hunyuan è stato contemporaneamente in cima alle tre liste delle classifiche generali CLUE, della comprensione della lettura e dei grafici della conoscenza su larga scala. battendo tre record in un colpo solo.
Un mese dopo, il grande modello di intelligenza artificiale multimodale di Tencent è stato applicato per la prima volta alla pubblicità e in quel momento ha portato agli inserzionisti un aumento cumulativo del 15% nel GMV.
Questi accumuli hanno gettato le basi per il grande modello Hunyuan.
Tencent Hunyuan Prima esperienza con il modello grande
La home page di “Tencent Hunyuan Assistant” è composta da due schede, “Chat” e “Inspiration Discovery”. La funzione “Chat” è simile ai prodotti di intelligenza artificiale conversazionale. A differenza di ChatGPT, “Tencent Hunyuan Assistant” ha integrato molti comandi allo stesso tempo , alcune domande ti verranno consigliate sulla home page.
Stavo correndo a scrivere il manoscritto durante la conferenza stampa, e ho anche provato a lasciare che fosse lui a scrivere il manoscritto per vedere se poteva farmi risparmiare un po’ di tempo (moyu).
In “Inspiration Discovery”, integra le applicazioni di molti scenari comuni in diversi settori, tra cui lavoro, programmazione, marketing, vita, giochi di ruolo, intrattenimento e altri campi.
Puoi lasciare che generi direttamente codice, scriva copie in erba o svolga ruoli diversi. Ad esempio, per i genitori alle prime armi, puoi fare clic direttamente su “Esperto educativo” e si possono dare consigli pratici ai vari problemi incontrati dai bambini nelle diverse fasi. suggerimento.
I record in “Chat” e “Inspiration Discovery” possono essere visualizzati facendo clic sull’icona del menu nell’angolo in alto a sinistra della home page. Per quanto riguarda la questione dei dati degli utenti, nell’accordo sulla privacy abbiamo anche visto che Tencent promette di non registrare queste conversazioni per l’effettiva formazione del modello dell’utente.
Per ulteriori funzioni e dettagli di “Tencent Hunyuan Assistant”, presta attenzione alla nostra esperienza più dettagliata di follow-up, a quale funzione sei più interessato e non esitare a comunicarcelo nell’area commenti.
Il grande modello domestico si scatena
Tutti gli imprenditori dell’Internet nazionale transfrontaliero vogliono cogliere questa opportunità che potrebbe essere più grande dell’Internet mobile, e il boom dell’imprenditorialità su larga scala è in forte aumento.
Da quando Wang Huiwen, co-fondatore di Meituan, ha pubblicato un post sull’eroe dell’intelligenza artificiale per costruire l’OpenAI cinese, tutte le principali società Internet e tecnologiche sono ora pienamente coinvolte in questa competizione.
Wenxin Yiyan di Baidu, Tongyi Qianwen di Ali, il modello grande Hunyuan di Tencent e ByteDance hanno anche testato pubblicamente l’applicazione modello grande “Doubao” non molto tempo fa. Nelle recenti conferenze stampa dei produttori di telefoni cellulari, nel lancio di Huawei Hongmeng 4 e nel discorso annuale di Lei Jun, anche i modelli di grandi dimensioni sono diventati protagonisti.
Tuttavia, che si tratti di ChatGPT o di un gran numero di grandi modelli in patria e all’estero, non è ancora apparsa una “killer application” per gli utenti comuni e il percorso di commercializzazione non è ancora maturo. Attualmente, l’ovvio profitto dell’AIGC wave sta ancora “vendendo pale” di Nvidia.
Pertanto, Tencent, che ha 1,33 miliardi di utenti attivi mensilmente di WeChat, attira naturalmente più attenzione su come combinare applicazioni modello su larga scala con un’enorme esperienza utente di fascia C. Un tale volume è anche un motivo importante per cui Tencent non può affrettarsi a lanciare prodotti semi-finiti.
Per quanto riguarda i due prodotti Tencent con il maggior numero di utenti, WeChat e QQ, se e quando saranno collegati al modello Hunyuan è ancora incerto, ma Jiang Jie ha detto che il team sta già facendo progressi.
In effetti, il layout di Tencent sui modelli su larga scala non è lento: attualmente collaborano con Tencent anche le due più grandi start-up di modelli su larga scala con la valutazione più alta in Cina, Anni luce oltre e MiniMax.
Tra questi, MiniMax, fondata meno di 2 anni fa, ha lanciato nel marzo di quest’anno una piattaforma API aperta per gli utenti aziendali, che supporta le chiamate di servizio per modelli di testo e voce ed è diventata il grande modello sottostante di Douyin Volcano Engine e Kingsoft WPS. AI: una delle più grandi società modello mai registrate con una valutazione di 1,2 miliardi di dollari.
Prima di rilasciare il modello Hunyuan, Tencent Cloud aveva lanciato a giugno un modello di settore per i clienti di fascia B, che copriva 10 settori principali come finanza, turismo culturale, affari governativi, media e istruzione e fornendo più di 50 soluzioni.
Lu Qi, fondatore e amministratore delegato di Qiji Chuangtan, ritiene che esistano solo due paesi e regioni al mondo che dispongono delle capacità principali dell’industria dei modelli su larga scala, vale a dire il Nord America e la Cina. Nel suo discorso precedente, ha affermato che ci sono tre elementi chiave affinché il grande modello cinese possa raggiungere OpenAI:
Il primo è costruire il modello base, ovvero salire a GPT-3.5.
Il secondo è costruire la capacità di industrializzare i modelli.
Il terzo è lo sviluppo della piattaforma e l’istituzione ecologica.
Se presti attenzione ai recenti sviluppi di ChatGPT, anche OpenAI sta lavorando in tre direzioni. Dopo che il primo lotto di modelli cinesi su larga scala ha superato il deposito, il secondo e il terzo lotto potrebbero non essere lontani. Tutte le aziende stanno correndo verso modelli su larga scala e hanno organizzato la “Guerra dei cento reggimenti” del modello su larga scala era, ma questa corsa di lunga distanza è appena iniziata.
Che si tratti del modello dell’industria tecnologica di Internet o del futuro dei normali lavoratori migranti, forse nell’anno 2023 saranno state tracciate bisce e linee grigie.
#Benvenuti a seguire l’account pubblico WeChat ufficiale di Aifaner: Aifaner (ID WeChat: ifanr), contenuti più interessanti ti verranno presentati il prima possibile.
Ai Faner | Link originale · Visualizza commenti · Sina Weibo