Prova “Create Point” di Quark: uno strumento di creazione basato sull’intelligenza artificiale che comprende meglio gli elementi cinesi e la combinazione definitiva di Midjourney e Wan2.5

La tendenza delle foto generate dall'intelligenza artificiale è finalmente arrivata anche a noi lavoratori.

Il capo ha detto: "L'intelligenza artificiale è così avanzata ora, usala per creare un'immagine per me in cinque minuti". Sembra facile a dirsi, ma chiunque la usi capirà.

Sebbene immagini e video generati dall'intelligenza artificiale possano essere difficili da distinguere tra reali e falsi, le applicazioni pratiche presentano ancora numerosi problemi inaspettati. Alcuni strumenti di intelligenza artificiale, pur essendo potenti, spesso presentano interpretazioni errate dei contenuti e degli stili cinesi a causa delle limitazioni del materiale di formazione.

Fortunatamente, anche i produttori nazionali stanno lavorando sodo e la qualità delle immagini raw adatte ai contesti cinesi è in costante miglioramento. Durante l'Alibaba Cloud Conference , Quark ha anche lanciato una nuova piattaforma di creazione di immagini e video basata sull'intelligenza artificiale chiamata "Zaodian".

Oltre a offrire una migliore comprensione degli elementi e della tipografia cinesi, è anche il primo strumento di generazione di immagini in Cina a supportare il modello Midjourney V7. La generazione video utilizza il nuovo modello Wanxiang 2.5, che supporta quasi tutte le funzionalità del già popolare Veo3.

Ora puoi cliccare su "Crea punto" su Quark oppure visitare direttamente zaodian.quark.cn per provarlo.

Non dimenticare di richiedere un altro bonus: da oggi fino al 30 settembre, tutti gli utenti potranno provare gratuitamente per 7 giorni le funzionalità di generazione video di Tongyi Wanxiang Wan2.5.

Naturalmente, anche APPSO ha potuto sperimentare in prima persona cosa fosse effettivamente in grado di creare.

Uno strumento di generazione di foto che comprende meglio gli elementi cinesi

APPSO testa spesso strumenti di generazione di immagini basati sull'intelligenza artificiale, quindi mi capita spesso di comunicare con i miei colleghi designer in azienda, per sapere se gli strumenti di intelligenza artificiale stanno cambiando il loro modo di funzionare. Tuttavia, ricevo spesso più lamentele. L'ottimizzazione dell'intelligenza artificiale può essere definita una sanguinosa storia di chat tra server.

Se gli chiedi "sentimenti cavallereschi e teneri", ti darà un cavaliere medievale; se gli chiedi "atmosfera mondana", ti darà un camino.

Dopo molti sforzi, sono riuscito a creare un poster con il testo in cinese, ma mancavano alcune parti o era disposto in modo tale da sembrare masticato da un cane. Non era comunque adatto per alcune scene professionali.

Ciò che mi ha sorpreso di più della creazione di Quark questa volta è che ha catturato la sottigliezza e la concezione artistica del popolo cinese.

Ho provato a chiedergli di generare una "Fotografia di una bellezza sportiva orientale, con addominali in mostra" e l'immagine risultante mi ha sbalordito: la giovane donna aveva linee muscolari definite, ma la sua espressione era felice e naturale, la consistenza della sua pelle era delicata e reale e sembrava molto sofisticata.

In precedenza, molti volti asiatici generati dall'intelligenza artificiale erano sempre gli stessi, ma ora finalmente hanno un'anima .

Per quanto riguarda la composizione tipografica cinese, che mi dà più grattacapi, non ho più bisogno di "aprire una scatola cieca" come in passato .

Ad esempio, lascia che Quark Create Dots generi un "Poster dell'ufficio postale a tema autunnale". Non solo riflette gli elementi iconici dell'autunno e dell'ufficio postale, ma anche i livelli, i font e i layout dei diversi testi sono relativamente coordinati. Non c'è testo distorto né in caratteri grandi né in caratteri piccoli ed è altamente utilizzabile.

Di recente ho visto un film intitolato "Lychees of Chang'an", che era piuttosto bello. Volevo realizzare un poster per illustrare la mia recensione del film su WeChat Moments. Non solo il font a pennello è ben posizionato, ma l'intero layout combina elementi litchi e concetti artistici orientali, e la texture non è inferiore a quella del poster ufficiale del film.


Abbiamo anche provato a impaginare altri poster cinesi e la stabilità complessiva è stata buona. Non solo la scrittura era corretta, ma anche l'impaginazione era bella.

Che si tratti dello stile Art Déco della "Silver Age" o delle pennellate ruvide di "Old Banyan Tree", la sua comprensione del cinese è penetrata nel livello delle "pennellate" e della "concezione artistica".

Se hai una mente più creativa, usare materiali diversi per progettare i caratteri è solo questione di una frase.

La sua comprensione degli elementi dello stile tradizionale cinese è più di un semplice collage di elementi. Ad esempio, nelle due immagini di "Modelle di alta moda in costumi etnici" e "Le mura rosse della Città Proibita avvolte nella nebbia e nella pioggia", i dettagli dei motivi sui copricapi e sugli abiti delle minoranze etniche, così come il coordinamento del trucco delle modelle e lo sfondo della Città Proibita, sono tutti molto naturali.

Non si tratta solo di personaggi, ma anche di scatole regalo e gioielli dal design ricercato, con elementi cinesi. Oltre alle scatole regalo e ai gioielli stessi, anche gli oggetti coordinati esposti sono in stile cinese.

Ho scoperto che l'estetica e la comprensione dello "stile cinese" di Zaodian non si fermano ai simboli superficiali, e ciò è particolarmente evidente quando si creano illustrazioni in stile cinese.

Queste illustrazioni non solo ripristinano lo stile dell'abbigliamento e le immagini di buon auspicio, ma trasmettono anche la concezione artistica dei dipinti a inchiostro e dei murales di Dunhuang, e presentano meglio l'eleganza e il patrimonio dell'estetica tradizionale cinese.

Questo è molto importante, perché significa che non si tratta solo di un giocattolo interessante, ma ha il potenziale per diventare uno strumento di produttività in scenari più reali.

Potresti per favore non realizzare cose fantasiose e creare materiali pratici?

Ho scoperto che, oltre a essere un hobby, quando QuarkZaodian collega senza soluzione di continuità le sue capacità di progettazione cinese a vari scenari lavorativi, può davvero portare a termine i suoi compiti.

Pensavo che mi sarei strappato i capelli nel tentativo di progettare una confezione. Ora stiamo cercando di progettare una confezione di cibo per gatti. Basta dirgli di avere "illustrazioni cartoon piatte, un gatto persiano che salta per catturare un pesce e uno sfondo di spiaggia", e lui ti inventerà persino le orecchie di gatto, un'immagine della pancia di salmone e una bolla promozionale "naturale e biologica".

Ciò che è ancora più interessante è che può anche aiutarti a portare le periferiche del marchio dai disegni agli scaffali e aiutarti direttamente a creare un set di packaging del prodotto + progettazione delle periferiche.

Gli ho detto di creare un "set di quattro magneti da frigorifero a tema culturale e creativo dello Yunnan" e poi gli ho dato elementi come "Montagna innevata del drago di giada, chicchi di caffè, stufato di funghi selvatici e motivi di pavoni ed elefanti".

È stato prodotto un set di magneti da frigorifero in vetro smaltato colorato, in stile etnico, così raffinati da poter essere utilizzati per la prova colore.

Quindi sviluppa un set di "IP mostruose in stile cinese", che possono aiutarti a progettare una serie di prodotti come peluche, portachiavi, spille, ecc.


Creare un "marchio di caffè VI" non è un problema. Dalle borse, ai bicchieri di carta, ai menu, può aiutarti a progettare un set completo con uno stile minimalista in bianco e nero, che unisce elementi industriali e di tendenza.

Esistono ancora più modi per giocare con i prodotti turistici, culturali e creativi. Che si tratti di graziosi "adesivi a tema viaggio" o di "prodotti culturali e turistici di Fuzhou" come borse di tela, calendari da tavolo e ventagli rotondi, può aiutarti a generare rapidamente mood board e modelli di prodotto, rendendo estremamente facile implementare la tua creatività.

Vuoi aprire un piccolo negozio ma non sai come arredare e progettare? QuarkZaodian può anche essere un designer qualificato e gratuito.

Se vuoi aprire un "fast food" e dargli uno "stile cyberpunk", apparirà immediatamente un'enorme insegna al neon rossa aliena, creando un'atmosfera davvero suggestiva.


Che si tratti dell'atmosfera letteraria e confortevole di "Boutique Coffee" o del divertimento sognante e infantile di "Balloon Shop", può aiutarti a fare tutto con un solo clic, trasformando il tuo negozio in un punto di check-in popolare.

Dopo che il mio flusso di lavoro è stato completamente semplificato dall'intelligenza artificiale, ho iniziato a non accontentarmi più di essere abbastanza bravo e ho voluto raggiungere un livello di espressione artistica superiore. Così, ho rivolto la mia attenzione al leggendario…

La prima uscita nazionale di MJ ha aperto il mio gusto estetico

Quando ho scoperto che il sito web di Quark conteneva effettivamente un canale ufficiale di Midjourney, sono rimasto completamente scioccato. È la prima volta in Cina che esiste un canale ufficiale in grado di utilizzare direttamente l'ultima versione di Midjourney V7.

In passato, quando volevo usare MJ, ero scoraggiato dalla complicata procedura di abbonamento o frustrato dal prezzo elevato. Ora, Quark ha abbassato direttamente il prezzo.

Ciò che mi ha sorpreso ancora di più è che ha trasformato i misteriosi parametri di MJ in un "telecomando estetico" comprensibile a tutti. È possibile regolare "stilizzazione", "stranezza" e "diversità" per ottenere l'effetto desiderato.

Grazie a questi controlli precisi, ho la sensazione di non usare l'intelligenza artificiale, ma piuttosto di "co-creare" con un maestro dell'estetica di prim'ordine.

Sviluppatori e giocatori di videogiochi apprezzeranno sicuramente questa funzionalità. Ho provato a generare una "visione tridimensionale di un giovane eroe in stile cyberpunk" e ho ottenuto rapidamente un design completo del personaggio, frontale, laterale e posteriore. Persino gli elementi meccanici sui vestiti erano chiaramente visibili e la qualità era paragonabile a quella di una bozza professionale.

Devi costruire una scena? Chiedigli di disegnare "un edificio in rovina a forma di L nel deserto" e l'immagine risultante sarà un modello 3D isometrico con muri rotti, macerie sparse e una texture opaca in argilla, creando una scena davvero suggestiva che si adatta perfettamente alle esigenze del tuo gioco.


È anche un simulatore di stile artistico. Se voglio disegnare un'illustrazione "a mano", mi basta dire "stile Tony Dietrich" e apparirà una fantastica scena di strada di Madrid.

Anche i materiali in stile cinese presentano una diversa consistenza artistica in questa modalità.

Ho cercato di dipingere un "paese delle fate con il rosa e l'oro come colori principali e strati di montagne". Non solo ha dato vita alle nuvole che turbinano tra le montagne, ma ha anche combinato le due texture della "nebulosità delle macchie d'inchiostro" e della "squisitezza delle linee dorate". L'atmosfera fiabesca e magnifica può essere utilizzata direttamente come carta da parati.

Sentiti libero di sbizzarrirti un po', che si tratti degli "elegante robot cromati di Hajime Sorayama" o del "manga horror in bianco e nero di Junji Ito", e la tua creatività potrà spaziare liberamente tra vari stili artistici.

Con questa capacità di generare immagini artistiche ed esteticamente gradevoli come base, nella mia mente è nata un'idea più audace: e se queste immagini straordinarie potessero davvero "muoversi"?

Grande energia in vista, realizza alcuni successi

Alla conferenza Alibaba Cloud appena conclusa, Tongyi ha rilasciato l'ultimo modello Wanxiang 2.5 e anche il punto di produzione è stato rapidamente collegato.

In parole povere, il nuovo modello supporta nativamente la generazione sincrona di audio e video, e l'immagine e l'audio possono essere utilizzati per "eseguire". La durata del video è raddoppiata a 10 secondi e anche la comprensione di istruzioni complesse e texture a livello di filmato è notevolmente migliorata.

Ora puoi sperimentare queste nuove capacità direttamente nel tuo cantiere.

Ho provato a far generare alla modella un video di una ragazza che suona la chitarra. Non solo ha riprodotto fedelmente i movimenti delle labbra e ha sincronizzato i movimenti del pizzicare con il ritmo della musica, ma anche gli occhi e le microespressioni erano spettacolari.

Dietro a tutto questo c'è la tecnologia di "sincronizzazione audio-video" di Wanxiang 2.5, che fa sì che la generazione video non sia più una semplice "sincronizzazione labiale", ma una vera e propria espressione emozionale.

Vuoi dare vita ai tuoi personaggi preferiti? Prova questo: carica una foto e una clip audio per far parlare chiunque e qualsiasi cosa.

L'immagine può adattarsi in modo naturale a qualsiasi suono tu fornisca, che si tratti di voce umana, musica o effetti sonori, così la tua immaginazione creativa potrà spaziare più ampiamente.

La coerenza dei personaggi è il fondamento della narrazione video. Grazie al supporto di Wanxiang 2.5, Zaodian può ora generare video lunghi fino a 10 secondi alla volta.

Ad esempio, utilizzando la creazione di punti per generare il "vlog in prima persona", in passato molto popolare, il personaggio può camminare ed eseguire varie azioni mantenendo un'immagine stabile, il che significa che la storia può essere raccontata in modo più completo.

Inoltre, Zaodian ha una buona comprensione del linguaggio delle lenti e delle dinamiche complesse, e le immagini hanno la consistenza di un blockbuster.

Nel video qui sotto, la modella cammina con un abito metallizzato riflettente. La luce si riflette sul tessuto metallico e sulle bolle, creando un alone abbagliante, che rivela una texture estetica sognante e all'avanguardia.

Dai complessi movimenti della telecamera alle sottili performance dinamiche, con l'aiuto dell'intelligenza artificiale, il controllo che le persone comuni hanno sull'immagine può essere paragonabile a quello di un regista.

Nell'era dell'intelligenza artificiale, usare l'immaginazione per fare la differenza

Dopo averlo provato, ho la sensazione che Quark Maker sia più un partner creativo completo e pratico, che comprende le tue idee più strane, ti aiuta a risparmiare denaro e fatica e ispira la tua creatività illimitata.

Ma cosa ancora più importante, Quark, un assistente AI utilizzato da 200 milioni di persone, acquisisce una maggiore produttività visiva e una maggiore versatilità.

Che tu sia un utente comune che desidera "cambiare l'acconciatura" delle foto sul tuo cellulare e "modificare le foto con un clic" per pubblicarle su WeChat Moments; o un designer professionista che ha bisogno di trovare rapidamente ispirazione per il design del "packaging design" e delle "cartelli per negozi"; o anche un professionista del marketing del marchio e dell'industria dei videogiochi per film e televisione che desidera produrre "storyboard per film e televisione" e "video di livello cinematografico", puoi provare a trovare soluzioni pratiche ed economiche in QuarkZaodian.

Di fronte a lui, creare un "nero colorato" non è più una richiesta irragionevole da parte del cliente, ma uno slancio di ispirazione, un lavoro che può essere realmente messo in pratica.

APPSO ha sempre fatto della "creazione" il suo credo. Crediamo che l'intelligenza artificiale sia la migliore capacità di coniugare passione e creatività. Quando tutti potranno "usare l'immaginazione per fare la differenza", una nuova era creativa potrebbe essere appena iniziata.

#Benvenuti a seguire l'account pubblico ufficiale WeChat di iFaner: iFaner (ID WeChat: ifanr), dove vi verranno presentati contenuti ancora più interessanti il ​​prima possibile.

iFanr | Link originale · Visualizza commenti · Sina Weibo