notizia

È stato soprannominato il più forte quando è uscito per la prima volta, ma questa immagine AI sembra essere proprio questo. .

2024-08-14

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Tutti ricordano ancora Stable Diffusion, l'intelligenza artificiale per la generazione di immagini che un tempo era famosa come DALL·E e Midjourney.

sperimentatoIl capo è scappatoI membri principali dello sviluppo si dimettono, L'intelligenza artificiale per la stabilità, che in passato stimolava il mercato dell'intelligenza artificiale per immagini, è diventata un disastro internamente.

Negli ultimi mesi, a riguardoLa catena del capitale si spezza, cercando di vendersiLa notizia non è mai stata data.


Quando l'ex club si trovava in una situazione imbarazzante e cercava di trovare un modo per salvarsi, il gruppo di soci che se n'era andato all'inizio dell'anno era esattamente l'obiettivo.Diffusione stabileÈ stata fondata una nuova societàLaboratorio della Foresta Nera(Laboratorio della Foresta Nera).

Proprio all'inizio di questo mese, quando hanno annunciato la fondazione di una nuova società, hanno anche rilasciatotreDiagramma di Vincent modello FLUX.1 di diversi volumi.

C'è la tazza grande pro che si concentra sulla qualità dell'immagine; la tazza media che tiene conto sia della velocità che della qualità dell'immagine; e la tazza piccola schnell che è nota come "vortice di velocità".

Secondo il loro sito web ufficiale, FLUX della Dazhong Cup è diventata la caratteristica principale di tutte le immagini AI.L'esistenza più potente


Anche le varie funzionalità separate, come la qualità visiva, la variabilità delle dimensioni, la diversità dell'output, ecc., sono molto migliori rispetto ad altri modelli.


Non solo lo dice il funzionario, ma sulla bocca di molti netizen e media è arrivato anche il nuovo FLUXPugno a metà viaggio, calcio DALL·Eestensione.


La lettura dei commenti su Internet ha suscitato l'interesse di Shichao. FLUX è davvero così potente come dicono tutti Questa volta l'abbiamo portato noiA metà viaggio, combinalo conGrande tazza di FLUXMettili insieme e testali.

All'inizio, inizieremo con una normale domanda di prova per riscaldarci, chiedendo loro di disegnare un dipinto a inchiostro cinese.

I risultati sono abbastanza buoni e tutto il contenuto delle parole immediate come pescatori, montagne, canne, ecc. viene disegnato. Tuttavia, il sole dipinto qui a Midjourney è un po’ troppo grande e non sembra un tramonto.

Parole suggerite:

Stile di pittura a inchiostro cinese, un pescatore solitario in una tradizionale barca di legno va alla deriva dolcemente su un lago tranquillo al tramonto, stile di pittura a inchiostro cinese, i toni caldi del blu riflettono l'acqua calma, pennellate morbide catturano la tranquillità della sera, lontano Le montagne qui sono stagliarsi nella luce che cambia gradualmente, capanne tradizionali sulla riva, canne che ondeggiano nella brezza, risoluzione 8K, sensazione cinematografica, atmosfera nostalgica e pacifica

FLUX (a sinistra), Midjourney (a destra)


Gli amici che prestano attenzione all'intelligenza artificiale delle immagini dovrebbero saperlo"La generazione del testo è troppo scarsa"È qui che quasi tutta l’intelligenza artificiale fallisce. DALL·E ha già ottimizzato questa debolezza già una volta, ma occasionalmente commette ancora errori.

Ma questa volta si dice che FLUX sia già molto esperto in quest'area, quindi ho selezionato appositamente alcune parole rapide per generare testo e le ho lanciate a lui e Midjorney.

Per prima cosa abbiamo lasciato che ciascuno generasse una borsa con il marchio Prada, e le risposte finali sono state piuttosto buone, senza errori nel testo.

Anche l'effetto complessivo dell'immagine lo èOgnuno ha i suoi meriti, FLUX non solo ha scritto correttamente il testo, ma ha anche disegnato il LOGO a triangolo rovesciato di Prada, mentre quello di Midjourney sembra più fashion.

Suggerimento: una grande borsa bianca "Prada" con piccole figure costruite in ghiaccio e circondate da neve e ghiaccio, in stile come una pubblicità di moda, ispirata alle pubblicità delle riviste Prouce, alla fotografia ad alta risoluzione e al design tipografico ispirato alla pubblicità.

FLUX (a sinistra), Midjourney (a destra)


La prossima voltaAumenta la difficoltà, lascia che disegnino un'immagine retrò per le magliette a maniche corte e aggiungano due parole inglesi.

Nessuno dei due ha commesso grossi errori questa volta, ma in termini di effetto complessivo, Shichao ritiene personalmente che Midjourney sia migliore.

Suggerimento: il design di questa t-shirt di ispirazione retrò presenta un drag racer vintage con una bandiera a scacchi e il testo "Lagertha" e "Semper Fi" su uno sfondo monocromatico. Lagertha, che tiene in mano una bandiera, ha dei tatuaggi. Lo stile di quest'opera d'arte cattura le sue pose d'azione, mostrando la velocità e la potenza del potere vichingo. È un'illustrazione ad alto contrasto che mette in risalto il loro abbigliamento sportivo e la tipografia del testo in grassetto.

FLUX (a sinistra), Midjourney (a destra)


Guarda l'abilità di un modello di immagine, un problema classico"Pittore"Certamente non può essere aggirato.

La metà del viaggio è ancora un po' instabile. Le mani generate sono buone e cattive. Come l'immagine a destra, è inspiegabile se paragonate.mignolo in più

Entrambe le immagini sono state generate da Midjourney


Ad essere onesti, l'effetto di FLUX è piuttosto sorprendente, sia che si tratti di stile clip art o di stile realistico.Non ci sono quasi difetti sulle mani.

Entrambe le immagini sono state generate da FLUX


Finora, FLUX ha gestito abbastanza bene alcuni dettagli dell'immagine e problemi minori.

Naturalmente, in una certa misura, l'intelligenza artificiale delle immagini è anche uno strumento per aiutare tutti a realizzare la propria immaginazione, quindi Shichao ha perso un po' di piùParole di promemoria premurose

Parola suggerita: una giovane ragazza vestita di rosso siede accanto a un drago con denti e occhi enormi. Lei lo affrontò a testa alta, come se fossero amici o bravi poliziotti. Questa scena si svolge tra la neve e le rocce in montagna. La vita segreta dei lupi, girato nello stile di James Cameron, un film degli anni '70.

FLUX (a sinistra), Midjourney (a destra)


emm. . . Non è necessario che Shichao aiuti tutti a trarre conclusioni su chi è buono e chi è cattivo fondamentalmenteUno sguardo AIAl punto che, ripensando a Midjourney, sembrano davvero un po’ gli effetti speciali della vita reale.

Successivamente, Shichao ha dato a FLUX un suggerimento più semplice: "La distruzione della civiltà moderna" per vedere come fosse la sua immaginazione.

Di conseguenza, questa volta,Sia esso che Midjourney fallirono.

Solo guardando l'effetto dell'immagine, Midjourney sarà migliore. Cattura davvero l'atmosfera epica, ma guardandolo dalla parte anteriore e posteriore, questo edificio non ha nulla a che fare con la civiltà moderna. . .

FLUX (a sinistra), Midjourney (a destra)


È interessante notare che FLUX è piuttosto bravo a generare caricature esagerate di ritratti di celebrità. Come Musk e Jobs, quando è stato generato, i tratti del viso sono stati catturati accuratamente.

Entrambe le immagini sono state generate da FLUX


Dopo l'esperienza complessiva, Shichao ritiene che il vero livello di FLUX sia ancora buono.Per non parlare di un abbinamento perfetto, ma non molto peggio.

Dopotutto, è stato creato dal team originale di Stable Diffusion ed è quasi allo stesso livello di Midjourney.

Inoltre, quando all'inizio del mese la nuova società Foresta Nera ha lanciato FLUX, ha anche annunciato ufficialmente i progressi del finanziamento, che ormai sono stati completati.$ 31 milionifinanziamento.

Ancora più importante, sebbene tutti nella Foresta Nera abbiano lasciato Stability AI, hanno comunque ereditato la sua tradizionale virtù di open source. Sia il medio che il piccolo FLUX sono open source.

Ma non è ancora finita. Il lancio dell’intelligenza artificiale per immagini sembra essere solo una parte dei loro sforzi per recuperare terreno. Sul sito ufficiale hanno anche spiegato i prossimi passi.SOTA nell'intelligenza artificiale video


Detto questo, la commercializzazione dell’intelligenza artificiale per immagini è un argomento quasi in discussione.

Stability AI, l'ex proprietario della Foresta Nera, era nei guai a causa di problemi di commercializzazione. Per quanto riguarda lo stesso, ora è open source e ha un modello a pagamento, che è sostanzialmente lo stesso del precedente Stability AI.

Possiamo solo aspettare e vedere se in futuro ci saranno altre nuove mosse in termini di commercializzazione. Dopotutto, è appena uscito.

Non seguire il vecchio percorso di Stability AI e ricominciare da capo. . .

Scrivi un articolo:scoiattolo

modificare: Jiangjiang

Redattore d'arte:Xuanxuan

Immagini, fonti

FLUX, metà viaggio