Abbiamo bisogno di più applicativi dell’intelligenza artificiale che non costruiscano grandi modelli

Tutto in AI, entro il 2024 questo nodo è quasi diventato il tema principale delle aziende tecnologiche di Internet.

Sembra che il mondo intero sia caduto nell'AI Fomo (AI fobia di perdere qualcosa). Le aziende tecnologiche hanno lanciato una corsa agli armamenti su larga scala per raggiungere OpenAI. Le persone comuni temono di essere sostituite dall'IA, quindi l'AI da 199 yuan ovviamente ha guadagnato un gran numero di fan.

Nella "battaglia di centinaia di modelli" che infuria in Cina, Kingsoft Office è considerato un valore anomalo. L'azienda, che detiene la maggiore quota di mercato nazionale di software per ufficio e un abbondante flusso di cassa, non ha investito nella concorrenza dei modelli di grandi dimensioni, ma è la prima in Cina a lanciare l'assistente d'ufficio intelligente WPS AI basato su modelli linguistici di grandi dimensioni.

Alla Kingsoft Office Productivity Conference di ieri, il CEO Zhang Qingyuan ha sottolineato ancora una volta che Kingsoft Office è un applicatore di modelli di grandi dimensioni ed è attualmente collegato a quasi tutti i modelli di grandi dimensioni tradizionali in Cina.

In questo modo Kingsoft Office, che è All in AI, dopo il passaggio dall'era dei PC a quella di Internet mobile negli ultimi 36 anni, vive il terzo nodo importante: i primi due nodi hanno influenzato l'andamento del mercato cinese dei software per ufficio. .

Negli anni '80, Qiu Bojun si chiuse per 14 mesi nella stanza 501 del Caiwuwei Hotel di Shenzhen, digitando 120.000 righe di codice assembly su un computer 386. Nel 1988 nacque WPS 1.0.

Nel 2002, Lei Jun, dipendente n. 6 di Kingsoft, ha incaricato più di 100 ingegneri di trascorrere tre anni riscrivendo più di 5 milioni di righe di codice WPS e ha lanciato WPS 2005, che è completamente compatibile con Microsoft Office.

▲ Lei Jun (a sinistra) e Qiu Bojun

Ora l'arrivo di modelli di grandi dimensioni ha cominciato a cambiare il modo in cui le applicazioni software vengono utilizzate e sviluppate. Zhang Qingyuan ritiene che in futuro anche la parola UI (User Interface) scomparirà. Kingsoft ha inoltre sospeso tutte le attività non legate all’intelligenza artificiale dallo scorso anno e ha avviato una trasformazione completa.

Ifaner aveva previsto all’inizio dell’anno nell’ifanRank che ci stiamo muovendo verso la “grande era delle applicazioni” fatta di strumentalità, universalizzazione e industrializzazione. Nel 2024 vedremo più applicazioni native dell’intelligenza artificiale che soddisfano le esigenze dei consumatori o delle aziende.

Il percorso dei modelli di grandi dimensioni si sta gradualmente saturando e ovviamente abbiamo bisogno di più aziende che si concentrino sull’implementazione di prodotti di intelligenza artificiale per trasformare le capacità dei modelli di grandi dimensioni in produttività e creatività del settore.

Il mito della produttività dell'intelligenza artificiale

Guardando indietro ai popolari strumenti di intelligenza artificiale dell'anno scorso, che si tratti di Copilot di Microsoft o Sora, che hanno iniziato ad arrivare sullo schermo durante il Festival di Primavera, ci sono spesso due parole ad alta frequenza che compaiono insieme ad essi: sovversione e sostituzione.

Sebbene questi strumenti di intelligenza artificiale siano progettati per migliorare la produttività, rispetto ai miglioramenti in termini di efficienza che possono apportare, quanti posti di lavoro possono essere sostituiti e quali settori vengono interrotti è sempre l’argomento più discusso e molte organizzazioni sono addirittura disposte a calcolare la percentuale precisa.

Qual è la natura dello strumento? Aiutaci a realizzare ciò che vogliamo fare più facilmente. Esistono due modi per migliorare la produttività: migliorare l'efficienza di un singolo passaggio, ridurre il numero di passaggi richiesti nel processo dell'attività o ottenere entrambi gli obiettivi contemporaneamente.

Numerosi strumenti di intelligenza artificiale guidati da modelli di grandi dimensioni hanno notevolmente abbreviato il processo dalla proposta dei requisiti alla realizzazione delle idee.

Dici solo una frase, lascia che l'intelligenza artificiale la delinei in pochi secondi e quindi generi più di 20 pagine di PPT.

Alcuni video che in passato richiedevano riprese e post-produzione ora vengono trasformati in un comando rapido.

Anche se si tratta di una foto casuale scattata con il cellulare, è possibile rimuovere passanti o detriti circondandola con il dito.

Zhang Qingyuan aveva predetto in un'intervista dell'anno scorso che tra circa un anno le persone sarebbero state in grado di utilizzare "100 yuan al mese per assumere un assistente d'ufficio a tutto tondo" per ottenere un nuovo controllo sui software per ufficio, compresi moduli, tabelle e calcoli complessi Le barre degli strumenti scompariranno tutte dai software per ufficio. Questo metodo di "abbonamento" cambierà radicalmente il modello di business dei software per ufficio.

Dietro a ciò c’è in realtà il fatto che l’intelligenza artificiale ha accelerato il processo di democratizzazione della potenza di calcolo.

Fu Zihao, product manager di WPS AI, ha fatto un'osservazione non molto tempo fa in una condivisione: l'emergere di modelli di grandi dimensioni non può essere paragonato all'emergere di Internet mobile. È più simile all'era della nascita del PC e della nascita della nuvola.

Man mano che i bisogni e gli scenari emergenti nella società umana diventano sempre più complessi, la potenza di calcolo del cervello non è più sufficiente e si inizia ad espandere la potenza di calcolo attraverso i computer. Ma la soglia per sfruttare appieno la potenza di calcolo del computer non è bassa: potrebbe essere necessario conoscere i linguaggi di programmazione e anche le tabelle Excel e PS di uso comune non sono facili da usare bene.

L’AIGC risolve il problema della soglia di potenza di calcolo: finché si utilizza il linguaggio naturale, il computer può comprendere la logica del pensiero e generare risultati, accorciando notevolmente la catena dall’idea al risultato.

Se capisci questa logica, la tua risposta alla recente intervista di Sam Altman su quanti lavori sostituirà l’intelligenza artificiale potrebbe avere più risonanza. Il modo in cui Altman la pensa non è la percentuale del lavoro che l’IA svolgerà, ma la percentuale del compito che l’IA svolgerà in un periodo di tempo.

Penso che questa sia una domanda più interessante, di impatto e importante rispetto a quanto lavoro può svolgere l’intelligenza artificiale, perché è uno strumento che può funzionare a livelli sempre più complessi, su scale temporali sempre più lunghe. Completare sempre più compiti e consentire alle persone di operare. in modo più flessibile. Quindi forse le persone saranno più produttive.

Questo pensiero non è prezioso solo per gli utenti, ma anche per gli sviluppatori di strumenti di intelligenza artificiale. Perché ciò di cui gli utenti hanno effettivamente bisogno non sono modelli con parametri sempre più ampi, ma strumenti che rendano più semplice realizzare le loro idee, proprio come una classica risposta di Steve Jobs:

Dobbiamo iniziare con l'esperienza dell'utente e poi tornare indietro allo sviluppo della tecnologia, invece di iniziare dalla tecnologia e poi provare a pensare a come vedere dove questa tecnologia può essere utilizzata?

Interazione copilota

Nell'articolo "Il primo anno del grande modello, il sistema operativo della civiltà umana sta subendo un importante aggiornamento", abbiamo menzionato che la prossima generazione della rivoluzionaria modalità di interazione uomo-computer potrebbe essere l'interfaccia utente naturale (NUI).

Il principio fondamentale della NUI è la semplicità prima di tutto. La complessità è nemica delle interfacce utente naturali. Ogni interazione dovrebbe essere autoesplicativa e non richiedere alcun manuale di istruzioni.

Copilot è la forma ideale di strumento AI secondo la logica interattiva NUI. La parola copilota deriva dal termine aviazione e si riferisce al copilota che assiste il pilota principale nell'utilizzo dell'aereo. Quando il pilota principale ha bisogno di riposarsi o gestire altri compiti, il copilota assume il controllo. I due sono congiuntamente responsabile del volo sicuro dell’aeromobile.

Penso che questa sia anche la descrizione più appropriata dell’interazione uomo-intelligenza artificiale. Microsoft definisce Copilot come: un'applicazione o un componente che utilizza la tecnologia di elaborazione del linguaggio naturale o modelli linguistici di grandi dimensioni per aiutare le persone a completare attività complesse o cognitive.

WPS AI considera anche l'interazione uomo-computer come una delle sue tre direzioni strategiche e chiama anche Copilot, un'interazione naturale basata su molteplici cicli di domande e risposte basate sul linguaggio naturale, che può essere profondamente integrato in vari scenari di documenti e collaborazione.

Ad esempio, la WPS AI Enterprise Edition lanciata ieri può fornire servizi digitali ai dipendenti con "sia arti liberali che scienze", come assistenti di lettura, assistenti di disegno, assistenti di presenza, analisi delle vendite, analisi dei contratti, ecc., raggiungendo vari scenari di ufficio sottili.

Tra questi, Copilot Pro può aiutare gli operatori a utilizzare il linguaggio naturale per guidare i prodotti BI ad analizzare i dati e può anche chiamare l'API WPS 365 e l'API di proprietà aziendale per risolvere le esigenze di automazione dell'ufficio.

I dati di GitHub mostrano che l'88% degli sviluppatori che utilizzano GitHub Copilot afferma di essere più produttivo, il 74% afferma di potersi concentrare su un lavoro più soddisfacente e il 77% afferma che ciò li ha aiutati a ridurre il tempo impiegato nella ricerca di informazioni o esempi.

Zhang Qingyuan ha una descrizione molto appropriata: l'interazione con il linguaggio naturale riduce notevolmente i costi di interazione dell'utente, il che significa che Photoshop può entrare direttamente nel mercato di strumenti come "Meitu Xiu Xiu".

Gli utenti possono realizzare funzioni complesse in Photoshop con la difficoltà interattiva di utilizzare Meitu Xiuxiu. Questa situazione si sta verificando in sempre più tipi di prodotti IA. Se presti attenzione agli aggiornamenti di WPS AI dello scorso anno, scoprirai anche che l'interfaccia utente viene costantemente semplificata e l'input in linguaggio naturale inizia a sostituire le funzioni di alcuni pulsanti originali.

Si può vedere che l'attuale suite di elaborazione dei documenti d'ufficio si è trasformata in un ufficio AI unico composto da "ufficio + collaborazione + AI". Un prodotto può svolgere in modo efficiente sempre più compiti, ma integra sempre meno moduli funzionali: questa sarà anche la tendenza degli strumenti di intelligenza artificiale.

L'innovazione tecnologica è essenzialmente l'evoluzione dell'interazione uomo-computer. Quando Copilot si svilupperà fino ad un certo punto, l'intera interfaccia interattiva potrebbe diventare addirittura una super applicazione. Non solo i pulsanti funzione verranno cancellati, ma molte applicazioni stesse potrebbero non averne più bisogno. esistere da solo.

Abbiamo bisogno di più aziende di intelligenza artificiale che non realizzino grandi modelli

Molti considerano i Big Model o l’AIGC come la quarta rivoluzione industriale: infatti, se una tecnologia può essere etichettata come rivoluzionaria, in realtà non si riferisce alla svolta tecnologica in sé, ma alla sua capacità di influenzare l’intera società imprenditoriale e cambiare gran parte della società. persone.stile di vita.

Che si tratti di vapore, elettricità o Internet, non c'è dubbio che soddisfi queste caratteristiche, ma che dire del modello grande? Almeno in questa fase non è assolutamente possibile raggiungere questo livello. Ciò di cui abbiamo bisogno è sfruttare le capacità di modelli di grandi dimensioni attraverso prodotti applicativi di intelligenza artificiale per avere un impatto sul lavoro e sulla vita delle persone.

▲ Ng Enda

L'informatico Andrew Ng ritiene inoltre che , essendo una nuova generazione di tecnologia di uso generale, l'intelligenza artificiale abbia maggiori opportunità di applicazione su larga scala .

Questo è il motivo per cui ho detto fin dall’inizio che abbiamo bisogno di più aziende di intelligenza artificiale che non creino modelli. I modelli di grandi dimensioni sono indispensabili come tecnologia di base, ma le aziende di intelligenza artificiale che si concentrano sulla soddisfazione delle diverse esigenze dei consumatori e delle varie transazioni commerciali hanno sicuramente bisogno di qualcosa di più per far sì che l’intelligenza artificiale esploda davvero a livello sociale.

Proprio come la tecnologia multi-touch, le applicazioni mature esistevano già più di 20 anni fa, quando venne lanciato sul mercato l'iPhone originale, ma solo Apple ha reso questa tecnologia una soluzione interattiva per quasi tutti gli smartphone successivi.

In questa ondata di intelligenza artificiale ci sono anche esploratori che non producono modelli di grandi dimensioni, ma sono determinati a utilizzarli, e Kingsoft Office è uno dei migliori.

La strategia di Kingsoft Office è molto pragmatica e si concentra sugli scenari di implementazione e ha raggiunto una cooperazione approfondita con quasi tutte le principali aziende nazionali di modelli di grandi dimensioni di intelligenza artificiale, tra cui MiniMax, Zhipu AI, SenseTime, Wenxinyiyan, Tongyi Large Model, ecc. .

Kingsoft svolge il ruolo di stazione di triage, responsabile di determinare tutti i problemi dell'utente e gli scenari da risolvere e quindi di chiamare il modello più appropriato per eseguire l'attività. Alcuni scenari di nicchia sono integrati dai piccoli modelli sviluppati internamente da Kingsoft Office per soddisfare le esigenze.

Ad esempio, SenseTime è eccellente nell'analisi dei dati e WPS AI lo utilizza per gestire scenari che richiedono un pensiero scientifico. Scene come testo e PPT vengono completate tramite modelli come Zhipu AI.

Il vantaggio di questo metodo applicativo di suddivisione di un modello di grandi dimensioni in parti è che può sfruttare appieno i punti di forza di ciascun modello e ottenere vantaggi complementari senza essere limitato dalle capacità di un determinato modello. Anche GPT-4 presenta dei difetti in alcuni scenari.

Alla conferenza stampa del WPS di ieri, Zhang Qingyuan ha menzionato un punto che mi ha colpito profondamente. Tutte le funzioni che ha visto oggi, ha affermato, possono essere sperimentate immediatamente e devono essere implementate negli scenari applicativi reali dei clienti.

Oltre alla continua involuzione dell’elaborazione di testi lunghi nelle chat, quali altre applicazioni più fantasiose ci sono per l’intelligenza artificiale? Vale la pena esplorare questo aspetto da parte di più persone: anche se le applicazioni di modelli di grandi dimensioni sono attualmente agli inizi, dovrebbero esserci più applicatori di intelligenza artificiale come Jinshan.

# Benvenuti a seguire l'account pubblico WeChat ufficiale di aifaner: aifaner (ID WeChat: ifanr). Contenuti più interessanti ti verranno forniti il ​​prima possibile.

Ai Faner | Link originale · Visualizza commenti · Sina Weibo