Il più grande aggiornamento di Apple quest’anno è in arrivo e la forma definitiva di AI Siri è più fantascientifica dell’anteprima di GPT-4o |
Siri è rimasta indietro.
Secondo il New York Report, questo è ciò che hanno pensato il capo del software Apple Craig Federighi e il dirigente dell'apprendimento automatico John Giannandrea dopo aver trascorso settimane a testare ChatGPT l'anno scorso, così hanno deciso di dare un importante restyling all'assistente vocale di 13 anni.
A meno di mezzo mese dalla WWDC Developers Conference, il giornalista tecnologico Mark Gurman ha portato le ultime notizie sulla versione AI di Siri. Sembra che questo assistente vocale, da sempre definito "ritardato artificialmente", farà davvero il suo debutto una grande svolta.
La cattiva notizia: alcune delle sue funzionalità più importanti potrebbero non arrivare quest'anno.
Nonostante ciò, Mark Gurman ha affermato che Apple considera ancora iOS 18 l’aggiornamento più importante della storia. L'Apple WWDC24 si terrà all'1:00 dell'11 giugno, ora di Pechino, APPSO ti fornirà gli ultimi resoconti all'Apple Park, quindi resta sintonizzato.
La tanto attesa ma promettente funzionalità “app di controllo”.
Secondo i rapporti, con il supporto dell'intelligenza artificiale, Siri sarà in grado di "controllare le applicazioni" e ottenere un controllo preciso delle funzioni dell'applicazione.
Ad esempio, chiedi a Siri di spostare i file da una cartella all'altra, oppure chiedi a Siri di aprire un articolo di notizie specifico, o addirittura chiedi a Siri di fornire un riepilogo dell'articolo.
Sebbene ora sia possibile utilizzare Siri per inviare messaggi di testo e persino WeChat, Siri, basato sulla revisione dell'intelligenza artificiale, andrà oltre e sarà in grado di analizzare come le persone utilizzano i propri dispositivi e apprendere operazioni sempre più automatiche. Apple prevede di supportare "centinaia" di comandi nelle app che sviluppa.
▲ La funzione WeChat di invio di Siri è stata implementata in iOS 10
Sembra davvero buono, ma Gurman ha detto che questa funzionalità sarà inizialmente limitata alle app sviluppate da Apple e non verrà lanciata quest'anno. Potrebbe essere necessario attendere fino al successivo aggiornamento di iOS 18 al più presto l'anno prossimo.
E c'è anche la notizia che i modelli più vecchi potrebbero essere dotati solo di iPhone 15 Pro A17 Pro e che i Mac superiori a M1 possono supportare più funzioni AI locali.
Inizialmente il nuovo Siri potrebbe essere in grado di comprendere ed eseguire solo un comando alla volta, ma in futuro si prevede che supporterà una serie di comandi, come la generazione di un riepilogo della registrazione della riunione registrata (un'altra funzionalità prevista lanciato in iOS 18) e quindi utilizzando l'e-mail. Quando lo invii ai colleghi, puoi anche aggiungere direttamente alcune istruzioni di testo e Siri può completare una serie di operazioni in una frase.
Si prevede inoltre che la nuova Siri sarà uguale alle altre funzioni AI di iOS 18. Ci sarà un sistema di giudizio per giudicare se l'attività AI può essere completata localmente sul dispositivo o deve essere eseguita nel cloud in base al potenza di calcolo richiesta.
Se vogliamo riassumere lo sviluppo di Siri negli ultimi 13 anni, "prendersi cura degli studenti ma non coltivarli" è probabilmente la frase più appropriata.
Alla conferenza di lancio dell'iPhone 4 nel 2011, Siri ha fatto la sua apparizione finale, scioccando il pubblico e il mondo. La dimostrazione di Siri in quel momento era così: puoi chiedergli che tempo fa in una certa città, o come sta andando un certo titolo, e puoi impostare un promemoria che apparirà automaticamente quando lasci l'azienda in una determinata città. frase. All'epoca era anche una caratteristica molto interessante e futuristica.
Di conseguenza, 13 anni dopo, le funzioni di cui sopra sembrano ancora essere gli scenari più utilizzati per Siri. Anche il controllo domestico e i comandi di scelta rapida che sono stati successivamente supportati sono ancora generalmente funzioni di attivazione e disattivazione. In effetti, Siri non ha mai raggiunto un livello qualitativo salto.
Anche di fronte alle sfide di altri assistenti vocali ritardatari come Google Assistant, Microsoft Cortana, Samsung Bixby, ecc., e persino lo Xiaomi domestico "Xiao Ai Classmate" sta diventando sempre più utile, Apple non ha ancora voluto fare progressi fino all'emergere di ChatGPT Renditi conto che Siri è al passo con i tempi.
▲ Xiao Ai ha già avuto accesso al modello grande l'anno scorso
Anche se Apple sembra introdurlo di tanto in tanto nelle conferenze stampa, Siri è diventato di nuovo più forte, può comprendere più istruzioni e può fare più cose. Ma in molti casi essere in grado di capire non significa che si possa fare, e poterlo fare non significa che si possa farlo bene.
Ad esempio, dì a Siri che voglio fare un selfie e Siri ti aiuterà ad aprire la fotocamera e quella frontale senza dire una parola, quindi non succederà più nulla. L'utente dovrà comunque allungare la mano e fare clic sull'otturatore. A volte, Siri passa automaticamente solo all'applicazione della fotocamera, ma non alla modalità frontale.
Se si tratta dell'assistente Bixby di Samsung, entrerà automaticamente nel conto alla rovescia per i selfie e l'intero processo non richiederà davvero alcun intervento da parte dell'utente.
La stessa applicazione fotocamera predefinita di Apple è dotata di una funzione di conto alla rovescia, quindi l'implementazione di questo processo non richiede molti fattori di intelligenza artificiale, ma Apple semplicemente non rende l'esperienza piacevole.
Il rivale di Siri sono le scorciatoie
Mi chiedo se hai mai utilizzato la funzione "Comandi di scelta rapida"?
Dopo che Apple ha acquisito Workflow, il suo prodotto è stato integrato nell'iPhone come "comando di scelta rapida" in iOS 12 e è stato lanciato anche sulla piattaforma Mac in macOS 12.
▲ I comandi di scelta rapida sono stati integrati nella catena ecologica di Apple
Questa funzione può realizzare molte funzioni iOS avanzate, come la registrazione con un clic su DingTalk, la produzione con un clic di LivePhoto e video in GIF e persino l'operazione automatica per ottenere "lo spegnimento automatico della sveglia durante le vacanze".
Ma questa funzionalità non è amichevole per gli utenti inesperti. Per creare un nuovo comando di scelta rapida, l'utente deve selezionare vari moduli operativi in un'interfaccia simile alla programmazione di script e collegarli con varie logiche come "se… allora" e "fintanto che… allora", come come "sveglia per le vacanze" "Questo tipo di comando di scelta rapida contiene una varietà di giudizi logici e operazioni automatizzate. Anche se gli utenti lo impostano secondo il tutorial, è facile commettere errori.
Sebbene Apple fornisca un "Centro di comando rapido" in cui è possibile ottenere direttamente script già pronti, i comandi di scelta rapida forniti sono semplici e raramente hanno funzioni che risolvono i punti critici degli utenti.
Questa funzione è simile al modulo "Good Lock" dei cellulari Samsung Galaxy, che fornisce funzioni di personalizzazione molto potenti, ma la soglia non è bassa.
Una delle abilità più importanti dei grandi modelli di intelligenza artificiale è la capacità di comprendere il linguaggio naturale e il pensiero logico. In altre parole, se l'utente dice all'IA del modello grande: "Sono assente dal lavoro, aiutami a fare il check-in", l'AI saprà che intendi eseguire le operazioni di "apri DingTalk" e "check-in" ," invece di dire che "non hai ascoltato." chiaro".
La Siri di oggi non è del tutto priva di questa capacità. Chiedere a Siri di ricordarti di comprare una torta di compleanno per la tua famiglia quando lasci l'azienda è una caratteristica che è stata dimostrata alla conferenza di iPhone 4s Dietro c'è anche un processo di comprensione della lingua dell'utente e di conversione in operazioni rilevanti.
▲ Molte delle funzioni introdotte alla conferenza stampa di Siri sono ancora oggi le principali capacità di Siri.
E Siri, con il supporto di grandi modelli di intelligenza artificiale, dovrebbe essere in grado di fare molto di più. Gli utenti descrivono le loro complesse esigenze in linguaggio naturale. Dopo che Siri lo capisce, lo converte nella logica dello script ed esegue da solo i passaggi corrispondenti. Questo è il vero comando "veloce" senza che l'utente debba affrontare una programmazione complicata.
▲ChatGPT mi ha insegnato come utilizzare le scorciatoie iOS per impostare le sveglie per le vacanze Sebbene la logica sia chiara, sembra poco utilizzabile.
Oltre a consentire agli utenti di personalizzare le operazioni in modo più naturale, puoi anche aspettarti che Siri diventi un assistente più "attivo".
Se usi iPhone abbastanza a lungo, scoprirai che a volte iPhone visualizzerà automaticamente dei suggerimenti. Ad esempio, quando un utente indossa un auricolare Bluetooth, si consiglia di attivare NetEase Cloud Music perché questo è il modello di utilizzo o quando si ricarica a tarda notte, il telefono riduce automaticamente la potenza di ricarica per mantenere la batteria, ma non funziona può comunque essere utilizzato prima di svegliarsi. È anche perché ho scoperto che si ha l'abitudine di caricarlo a lungo prima di andare a letto.
Questi sono i risultati dell’apprendimento automatico e sono anche le funzioni AI su cui Apple ha lavorato. Le persone moderne trascorrono ogni giorno molto tempo sui loro telefoni cellulari. È molto comune usare i telefoni cellulari per comprare, mangiare e lavorare. Naturalmente, i telefoni cellulari comprendono la tua esistenza meglio dei nematodi nello stomaco.
Immaginate la potente consapevolezza situazionale di Apple, unita alle più potenti capacità di funzionamento automatico dei telefoni cellulari, la versione AI di Siri può davvero trasformarsi in un vero "assistente personale", prevedendo le cose prima di lasciarle fare alle tue esigenze.
Ad esempio, attraverso i biglietti aerei che hai prenotato, ti aiuterà automaticamente a controllare il tempo dopo l'arrivo a destinazione e anche a impostare un allarme in anticipo. In base alle tue abitudini di viaggio e alle condizioni del traffico in tempo reale, ti aiuterà a chiamare a taxi in anticipo quando arrivi all'aeroporto in base al tempo di viaggio stimato. Apri automaticamente i tuoi biglietti aerei e utilizza l'app per effettuare il check-in. Quando arrivi in zona, ti aprirà i ristoranti consigliati di Dianping un assistente personale + guida turistica.
Se vogliamo realizzare questo insieme di operazioni senza intoppi, ovviamente ci penseremo, il che richiede sia agli sviluppatori che ad Apple di agire in entrambe le direzioni. Tuttavia, la velocità di sviluppo dell’intelligenza artificiale ha superato la nostra immaginazione. Forse in futuro l’intelligenza artificiale potrà imitare direttamente le operazioni umane.
Interfaccia utente che possiamo comprendere, anche l'intelligenza artificiale sta imparando
Sebbene il funzionamento intelligente del nuovo Siri supporterà solo le applicazioni Apple nella fase iniziale, preferisco credere che questo sia solo il punto di partenza o la metà del percorso AI Siri di Apple, non la fine.
Credo che l'obiettivo finale dell'intelligenza artificiale di Apple sia realizzare questo scenario: svegliarsi la mattina, svegliare Siri con "Siri", quindi lasciarlo aprire l'account pubblico WeChat "Aifan'er" e leggere ad alta voce l'ultimo articolo, senza dover usare le mani. Poi ascolta il resoconto mattutino di Ai Faner.
▲ Una custodia per iPhone di molti anni fa. L'idea è quella di personificare "Siri" e liberare le mani con la voce.
I "comandi di scelta rapida" possono supportare il funzionamento di app di terze parti, principalmente perché Apple ha aperto l'API, e i produttori di applicazioni di terze parti possono anche suddividere le operazioni nell'applicazione in moduli che possono essere eseguiti tramite comandi di scelta rapida.
Ma questo dipende dalla disponibilità del produttore dell'applicazione a fornire moduli e operazioni pertinenti. Ad esempio, se l'app Cainiao non apre l'operazione di visualizzazione del codice di ritiro, non importa quanto sia intelligente Siri, non sarà in grado di aprire il codice. App Cainiao per visualizzare autonomamente il codice di ritiro.
E se facessimo un ulteriore passo avanti e consentissimo all'intelligenza artificiale di capire direttamente cos'è un codice di ritiro e dove si trova nell'app, e di aprirla da sola dopo aver ricevuto le istruzioni?
Potrebbe sembrare un po’ troppo fantascientifico, ma l’industria sta già facendo tentativi simili.
Alla Microsoft Build 2024 Developers Conference della scorsa settimana, Microsoft ha realizzato un evento dal vivo: Copliot supportato da GPT-4o può visualizzare i contenuti sullo schermo in tempo reale e guidare i giocatori a giocare insieme a "Minecraft".
Nella dimostrazione, Copilot ha utilizzato un linguaggio molto fluido e naturale, anche con un pizzico di emozione, per guidare i giocatori a creare una spada nel gioco. In questo processo, Copilot può identificare gli oggetti nello zaino del gioco e informare il giocatore dei materiali mancanti, proprio come un "maestro" che lo guida attraverso il gioco.
Ciò dimostra che l'assistente AI non è più solo un robot di testo che "chiede e risponde", o può solo programmare ed elaborare dati in background, ma può davvero iniziare a comprendere l'interfaccia UI che noi esseri umani vediamo, e può anche sapere come lo gestiamo.
L'"hardware AI" Rabbit R1, popolare già da qualche tempo quest'anno, ha sostanzialmente abbandonato l'interfaccia operativa e ha completato l'utilizzo di vari servizi interamente tramite l'assistente vocale AI. La società Rabbit ha affermato di utilizzare un metodo chiamato ". La tecnologia del modello AI Large Action Model" (LAM) può imitare le operazioni umane sul server dopo aver compreso le istruzioni dell'utente e completare direttamente le istruzioni dell'utente nelle pagine Web e nelle applicazioni pertinenti.
▲ Rabbit R1 afferma di utilizzare la voce per ottenere operazioni multiapplicazione e multipiattaforma.
Sebbene le prestazioni di Rabbit R1 siano lontane dalla scena rappresentata, la visione in sé è molto bella. Le eccellenti prestazioni di robot come GPT-4o nella comprensione visiva fanno anche sentire le persone che il futuro dell'intelligenza artificiale che sostituisce gli umani non è davvero lontano. .
Essendo un'azienda di grande appeal tra gli sviluppatori, Apple non ha bisogno di imitare l'uso completo di "LAM" da parte della startup Rabbit. Può aprire interfacce pertinenti e fornire SDK per consentire ai principali sviluppatori di terze parti di utilizzarlo nelle loro applicazioni operazioni, offrendo un'esperienza operativa vocale più matura e stabile.
La ricerca relativa ad Apple mostra che hanno questa idea, insieme agli standard di progettazione dell'interfaccia utente delle applicazioni Apple, Siri può comprendere più facilmente tutto sullo schermo dell'iPhone.
▲ Apple sta studiando anche come far comprendere la UI ai modelli di grandi dimensioni
Sebbene la tecnologia sia inferiore all'uomo, la leadership di Apple nel numero di utenti e nella costruzione ecologica può diventare un vantaggio molto potente.
9to5Mac prevede e commenta i prossimi aggiornamenti Siri e AI di Apple:
al WWDC. Forse non vediamo nulla di particolarmente rivoluzionario, ma l’integrazione dell’intelligenza artificiale nei sistemi e nelle applicazioni utilizzati ogni giorno da milioni di persone è di per sé una rivoluzione.
Rispetto all'hardware di tendenza come Rabbit R1, gli smartphone che tutti hanno potrebbero essere il miglior supporto per l'intelligenza artificiale.
L'utente non ha bisogno di sapere che sta utilizzando le funzioni dell'intelligenza artificiale, ma quando chiede a Siri di aiutarlo a pianificare un programma di viaggio e prenotare i biglietti aerei, l'intelligenza artificiale ha già iniziato a cambiare profondamente la sua vita.
# Benvenuto per seguire l'account pubblico WeChat ufficiale di aifaner: aifaner (ID WeChat: ifanr) Ti verranno forniti contenuti più interessanti il prima possibile.
Ai Faner |. Link originale · Visualizza commenti · Sina Weibo