Il primo programmatore AI al mondo è qui! Beyond GPT-4 sta scuotendo la Silicon Valley, ma è ancora troppo presto per conquistare i code farmer

15 Marzo 2024

Le professioni che hanno dato vita all’intelligenza artificiale perderanno il lavoro a causa dell’intelligenza artificiale?

La start-up Cognition AI è stata fondata appena 2 mesi fa e da un giorno all'altro ha scatenato una tempesta in X a causa di uno dei loro tweet con decine di milioni di visualizzazioni:

Oggi siamo lieti di presentarvi Devin, il primo ingegnere del software AI.

Il team Cognition AI è fondamentalmente una medaglia d'oro alle Olimpiadi internazionali dell'informatica.

Il codice costituisce le fondamenta di Internet e i programmatori sono ancora una professione ben pagata con una soglia. Perché queste menti umane con il QI più alto si riuniscono e insegnano passo dopo passo all’intelligenza artificiale ad approfondire le aree in cui sono migliori?

Il primo programmatore AI vicino agli esseri umani, cosa c'è di così bello in lui?

La definizione di Devin di Cognition AI è: il primo ingegnere informatico AI completamente autonomo al mondo.

Mettiamo da parte le specifiche e vediamo cosa può fare Devin.

Devin non è ancora aperto all'uso e le applicazioni possono essere inviate solo tramite e-mail, quindi ciò che vediamo ora sono casi ufficiali e recensioni di alcuni sviluppatori di terze parti e personale del prodotto.

A partire dalla stessa Cognition AI, vogliono che Devin completi un compito: testare le prestazioni del modello linguistico di grandi dimensioni Llama su tre provider API.

Hanno inviato un messaggio scritto in linguaggio naturale, quindi hanno tolto le mani dalla tastiera e hanno lasciato tutto a Devin.

Devin ha prima creato un piano con passaggi chiari, quindi ha iniziato a scrivere codice come un programmatore umano.

Devin ha deciso di utilizzare un browser per aprire la documentazione dell'API, leggere e imparare come accedere a ciascuna API.

Durante il processo è apparso un bug inaspettato. Devin ha detto di non farsi prendere dal panico e che avrebbe risolto qualsiasi problema. Ha aggiunto un'istruzione print di debug e ha utilizzato le informazioni sull'errore nel registro per scoprire come risolvere il bug.

Alla fine, Devin ha creato e distribuito un sito Web visivo, che non solo ha completato il compito, ma i risultati sono stati piacevoli alla vista ed sono entrati nel cuore degli insegnanti di correzione.

Secondo il blog Cognition AI, Devin può anche completare compiti più complessi e ha capacità di super apprendimento e adattamento.

Invia a Devin un collegamento a un articolo che spiega come incorporare testo preciso nelle immagini AI tramite plug-in come ControlNet.

Originariamente si trattava di una tecnologia con cui Devin non aveva familiarità, ma leggendo e apprendendo da sola la conoscenza, produceva uno sfondo del computer con il nome inglese dell'utente.

A Devin è stato chiesto di realizzare un sito web interattivo e Devin si è preso la briga di modificarlo e migliorarlo in base alle esigenze dell'utente, migliorando la pagina di inizializzazione, accelerando il frame rate e rispondendo a finestre di diverse dimensioni.

Quindi, Devin ha implementato il sito Web sulla piattaforma di sviluppo web Netlify, risparmiando tempo, fatica e preoccupazioni, lasciando solo le parti divertenti e divertenti agli umani.

Oltre a caricare in battaglia, Devin è ottimo anche per la giungla.

Di fronte a un repository open source contenente diversi algoritmi che necessitavano di una manutenzione costante, Devin si è rivolto per aiutare a trovare e correggere i bug. Più esigenti dei programmatori.

Anche Devin ha un forte senso di autogestione e può addestrare e mettere a punto il proprio modello di intelligenza artificiale, mentre i programmatori umani possono metterlo da parte e tornare dopo un'ora per vedere come è andata.

▲ Questo programmatore ha lavorato davvero sull'intelligenza artificiale per un'ora.

Cognition AI voleva anche dimostrare che Devin non era un supporto per l'autopromozione, quindi hanno provato a prendere un ordine sulla piattaforma freelance Upwork per scrivere ed eseguire il debug del codice per eseguire il modello di visione artificiale, ma hanno lasciato che Devin lo completasse.

Devin ha impostato metodicamente il repository del codice, ha risolto i conflitti di versione, ha scaricato immagini da Internet per l'utilizzo nel modello, ha campionato i dati risultanti e ha scritto uno splendido rapporto, che era esattamente ciò che il finanziatore voleva.

Non solo, Cognition AI at X è orgogliosa di annunciare che Devin ha superato un colloquio di ingegneria con un'azienda di intelligenza artificiale leader del settore.

Se sei un nuovo programmatore e ti stai grattando la testa di fronte ai compiti del Gruppo A e ti senti impotente, potresti anche inviare i requisiti del compito a Devin e il maestro sarà al tuo fianco.

Dopo aver testato il mercato, si è scatenata una competizione tra pari: Cognition AI ha chiesto a Devin di condurre un test benchmark di codifica SWE-Bench per risolvere problemi reali di GitHub nei progetti open source.

Devin, specializzato in tecnologia, era completamente autosufficiente e ha risolto correttamente il 13,86% dei problemi dall'inizio alla fine.

A prima vista non sembra elevato: rispetto al miglior punteggio del modello precedente del 4,8% con assistenza, si tratta già di un enorme miglioramento e supera addirittura di gran lunga i suoi predecessori come GPT-4 e Claude2.

I pochi utenti che hanno utilizzato Devin finora ne hanno parlato molto bene.

Nei test reali condotti dai reporter di Bloomberg, Devin ha creato un sito web da zero in soli 5-10 minuti.

Negli stessi 5-10 minuti, Devin può creare ripetutamente un classico gioco di ping pong basato sul web.

Il motivo per cui dico ripetizione è perché durante questo processo, i giornalisti di Bloomberg hanno inserito più volte parole tempestive per migliorare l'aspetto del sito web, le caratteristiche fisiche del ping pong, ecc. Devin ha risposto a ogni richiesta.

L'informatico Silas Alberti ha scoperto che Devin era bravo a creare prototipi di progetti, correggere bug e visualizzare dati complessi in forma grafica.

Sente addirittura che Devin non può più essere definito un "assistente di programmazione", ma più come un assistente ingegnere del software che lavora in modo indipendente, aiutando le persone a completare le attività in modo autonomo e autonomo.

Anche Silas Alberti, uno studente di dottorato in machine learning presso l'Università di Stanford, ha iniziato con Devin. Due settimane fa lo ha utilizzato per creare un piccolo riepilogo di un sito Web SMS e lo ha implementato tramite Twilio. La valutazione dell'utilizzo è molto concreta:

Quasi come un collega umano! Quando Devin incontra un problema e io gli do un consiglio, è come gestire un ingegnere junior.

Dopo l'esperienza, il dottorando ha aumentato i suoi requisiti: diventare un ingegnere migliore in modo da poter gestire in futuro un team Devins.

Creato da un sognante team cinese, il superamento del codice non è la fine

L'intelligenza artificiale cognitiva dietro Devin è come una montagna che si alza dalla terra ed è stata fondata solo 2 mesi fa.

I 10 dipendenti non hanno nemmeno una sede fissa e viaggiano tra Airbnb nella Silicon Valley e uffici a New York.

Ma è stata proprio una società di questo tipo a raccogliere 21 milioni di dollari di investimenti e a diventare popolare da un giorno all’altro.

Il team di Cognition AI è attualmente composto da solo 10 persone, ci sono molti volti cinesi e la densità di talenti è troppo alta: esperienza lavorativa in grandi aziende come DeepMind e Waymo e 10 medaglie d'oro alle Olimpiadi internazionali dell'informatica. Ci sono tre fondatori principali.

Presso Cognition AI lavorano anche il CEO Scott Wu, 27 anni, e suo fratello Neal Wu, entrambi hanno partecipato a concorsi internazionali di programmazione sin da quando erano adolescenti e le loro capacità sono molto conosciute negli ambienti professionali, consentendo anche la National Programming statunitense. Squadra per superare la Cina e l'Europa dell'Est.

Steven Hao, Chief Technology Officer, ha lavorato come ingegnere senior presso Scale AI, una startup responsabile della formazione dei sistemi di intelligenza artificiale.

Il Chief Product Officer Walden Yan una volta ha studiato all'Università di Harvard ed è sospettato di aver abbandonato gli studi.

Scott Wu ritiene che l'esperienza alle Olimpiadi sia un vantaggio per la sua squadra.

Insegnare competenze di programmazione all’intelligenza artificiale è essenzialmente una complessa sfida algoritmica, che consente al sistema di prendere decisioni complesse e prevedere il percorso migliore da seguire, simile ai problemi che risolvono nelle competizioni.

Scott Wu lo ha anche espresso in un modo molto romantico: è come un gioco che hanno giocato nella loro testa per anni.

Tuttavia, prima di diventare una grande azienda, soffriva delle malattie delle grandi aziende: analogamente alla sempre più chiusa OpenAI, Cognition AI non rivela al pubblico dettagli tecnici, né rivela se costruisce un proprio modello o si basa su modelli già esistenti. Modelli.

In generale hanno semplicemente affermato di aver trovato un modo per combinare modelli linguistici di grandi dimensioni come GPT-4 con la tecnologia di apprendimento per rinforzo, offrendo a Devin diverse funzionalità.

Innanzitutto, Devin ha raggiunto progressi nel ragionamento e nella pianificazione a lungo termine: può pianificare ed eseguire compiti ingegneristici complessi che richiedono migliaia di decisioni, ricordare il contesto di ogni passaggio e apprendere e correggere continuamente gli errori.

Con le capacità di ragionamento, l’intelligenza artificiale può diventare più simile a quella umana. I grandi modelli linguistici che conosciamo sono spesso sistemi che prevedono la parola successiva di una frase o il successivo frammento di codice in base alla probabilità. Ma avere la capacità di ragionare significa che l’intelligenza artificiale è più vicina al modo in cui gli esseri umani pensano e risolvono i problemi.

Per quanto riguarda le capacità di pianificazione a lungo termine, queste determinano effettivamente quanto possa essere utile l’intelligenza artificiale. L'informatico Silas Alberti ha scoperto che la maggior parte degli assistenti di codifica deragliavano dopo quattro o cinque passaggi, ma lo stato di Devin era praticamente sempre online.

Bloomberg ha addirittura affermato che Devin può gestire continuamente centinaia o addirittura migliaia di attività mantenendo la coerenza: questo potrebbe essere il "multitasking" dell'intelligenza artificiale.

In secondo luogo, se vuoi fare bene il tuo lavoro, devi prima affinare i tuoi strumenti. Devin è dotato di tutti gli strumenti di sviluppo più comuni utilizzati dai programmatori umani, inclusa un'interfaccia a riga di comando, un editor di codice e un browser in un ambiente informatico sandbox.

Inoltre, Devin collabora attivamente con gli esseri umani, segnalando in tempo reale cosa intende fare, quali comandi e codici utilizzare e quanto è stato completato il compito, accetta con umiltà i feedback e ricorda a Devin con parole tempestive, e ascolterà i consigli e apportare modifiche.Lavorare con te per completare un progetto in base alle tue esigenze.

L'effetto dimostrativo di Devin è abbastanza sorprendente, ma il superamento del codice non è la fine di Cognition AI, ma un inizio.

Ciò che Cognition AI spera davvero di risolvere è il ragionamento sui problemi, avvicinando l’IA agli esseri umani e quindi realizzando possibilità più diversificate in una gamma più ampia di discipline.

Testi, immagini, video, codici, cos'altro non può imparare l'intelligenza artificiale?

Quando l’intelligenza artificiale fa di più, gli esseri umani hanno la responsabilità di supervisionare l’intelligenza artificiale affinché faccia di più

Non è solo un’idea di Cognition AI che i programmatori chiedano all’IA di fare il proprio lavoro per loro.

Nel giugno 2021 GitHub, Microsoft e OpenAI hanno lanciato l'assistente al codice AI "Copilot" basato su GPT-3.

Il mese scorso, una società chiamata Magic AI ha raccolto più di 100 milioni di dollari per progettare da zero i propri modelli e la tecnologia sottostante per creare “ingegneri software sovrumani”.

Quando GPT-3.5 divenne popolare per la prima volta, alcune persone pensarono:

Quando inserisci parole rapide, stai programmando un modello linguistico di grandi dimensioni.

Possiamo lasciare arbitrariamente che l’intelligenza artificiale generi un pezzo di testo o un’immagine, che può anche essere contata, ma allo stesso tempo, la programmazione reale è diventata più popolare grazie all’intelligenza artificiale, riportandoci a un argomento familiare: i posti di lavoro umani verranno derubati. andare?

Ottimisticamente, i programmatori di intelligenza artificiale possono liberare i programmatori da compiti noiosi e noiosi e fare cose più creative.

E anche i principianti che non sanno nulla di programmazione ma hanno un cervello possono anche creare i propri siti Web, servizi e applicazioni.

D’altra parte, i pessimisti potrebbero ritenere che i programmatori di intelligenza artificiale rendano i programmatori non più un settore ben pagato. Qualcuno nell'area commenti di Cognition AI ha pubblicato un'emoji pazzesca: come ingegnere del software, ho finito.

Anche Andrej Karpathy, membro del team fondatore di OpenAI e grande figura, ha espresso il suo punto di vista su X. L'automazione dell'ingegneria del software è simile al processo di sviluppo della guida autonoma:

1. Gli esseri umani scrivono manualmente il codice; 2. GitHub Copilot completa automaticamente alcune righe di codice; 3. ChatGPT scrive grandi blocchi di codice; 4. Le differenze nel codice stanno diventando sempre più grandi, come lo stile Cursor copilot++; 5…….

In questo processo, l’intelligenza artificiale fa di più e gli esseri umani fanno di meno, ma svolge comunque un ruolo di supervisione.

A causa dell'emergere di Devin, gli strumenti necessari agli sviluppatori per scrivere codice, inclusi terminali, browser, editor di codice, ecc., potrebbero cambiare notevolmente e il livello di astrazione della supervisione manuale diventerà sempre più elevato.

Tuttavia, non rallegratevi troppo presto: c’è ancora molto lavoro da fare in termini di intelligenza artificiale, interfaccia utente ed esperienza. Il modo in cui gli esseri umani supervisionano, come eseguono il debug degli errori, come guidano l’intelligenza artificiale e come utilizzano il linguaggio naturale per proporre comandi avanzati sono ancora in attesa di risposte.

François Chollet, il maestro del deep learning, ha una visione sempre più acuta: l'ingegneria del software non consiste nel copiare e incollare codice, ma nello sviluppare e utilizzare modelli mentali di problemi e le relative soluzioni. Devin non ha ancora raggiunto questo livello.

Una rivoluzione nell’ingegneria del software potrebbe essere proprio dietro l’angolo. Almeno per ora, l’intelligenza artificiale non può sostituire completamente l’uomo. Poiché l’accesso era troppo popolare, il sito web ufficiale di Cognition AI è rimasto inattivo per un po’ e sembra che l’intelligenza artificiale non sia ancora in grado di creare pagine web che non vadano in crash.

Allo stesso tempo, Cognition AI sta ancora reclutando ingegneri del software e ricercatori nel campo dell’apprendimento automatico. Si può vedere che in questo momento gli eccellenti programmatori umani sono più rari che mai e possono ancora fare grandi cose, contribuire all’intelligenza artificiale e lasciare dietro di sé molti altri della loro specie.

Zhang Chengchen

È tagliente come il gelo autunnale e può scongiurare disastri malvagi. E-mail di lavoro: [email protected]

E-mail 8

# Benvenuti a seguire l'account pubblico WeChat ufficiale di aifaner: aifaner (ID WeChat: ifanr). Contenuti più interessanti ti verranno forniti il prima possibile.

Ai Faner | Link originale · Visualizza commenti · Sina Weibo