OpenAI sta lavorando a uno strumento di creazione di modelli 3D rapido ed efficiente
È stato un anno incredibile per l’IA rivolta al consumatore e per OpenAI in particolare. Strumenti del calibro dello strumento DALL-E 2 text-to-image e il recente chatbot ChatGPT di Internet hanno conquistato i titoli dei giornali tutto l’anno. ChatGPT in particolare ha segnato un momento chiave in quanto uno strumento di generazione di testo AI incredibilmente potente ha incontrato l’infinita creatività di Internet e ha fatto impazzire tutti al punto che la maggior parte delle persone pensa che la rivoluzione dell’IA sia già ben avviata e che oggi viviamo nel mondo di domani . A questo proposito, potrebbe essere considerata una notizia entusiasmante che OpenAI abbia annunciato i dettagli sul suo ultimo strumento chiamato POINT-E.
POINT-E è in grado di produrre modelli 3D da prompt di testo nello stesso modo in cui DALL-E 2 è in grado di creare immagini. Lo strumento è ancora un work in progress, ma è il progresso che segna l’impressionante impresa qui. Normalmente, la creazione di modelli 3D in questo modo richiede che più GPU funzionino per ore, mentre POINT-E può svolgere la stessa attività in 1-2 minuti su una singola GPU. Il documento di ricerca che delinea il lavoro che sta andando nello sviluppo di POINT-E lo descrive come in calo:
“a corto dello stato dell’arte in termini di qualità del campione…”
Tuttavia, prosegue dicendo che:
“… è uno o due ordini di grandezza più veloce da campionare, offrendo un pratico compromesso per alcuni casi d’uso.”
Funziona creando prima un’immagine 2D del messaggio di testo e quindi costruendo una nuvola di punti 3D dell’immagine. È così che lo strumento è in grado di risparmiare così tanta potenza di elaborazione rispetto ad altri metodi. Inoltre, una seconda IA lavora anche sul problema per aiutare ad alleggerire il carico.
Come puoi vedere nelle immagini sopra, i modelli 3D che è in grado di creare sono ancora piuttosto rudimentali e si basano molto sul metodo della nuvola di punti 3D per riunire i modelli. Ci sono anche chiare lacune in alcuni dei modelli con, ad esempio, fiori con lacune nei loro steli o pezzi mancanti dalla tazza da caffè, dal cono stradale e dal corgi che indossa un cappello da Babbo Natale.
Ciò significa che per ora lo strumento non sarà troppo utile ma poiché OpenAI continua a perfezionare la tecnologia, potrebbe essere utile per un’ampia gamma di casi d’uso come lo sviluppo di piani per la stampa 3D, la progettazione di elementi per videogiochi e persino film , e altro ancora. Se sei interessato a controllare il codice del progetto, puoi trovarlo su GitHub .