notizia

Lo stato di Midjourney è instabile? Appare un altro cavallo di battaglia nel disegno dell'intelligenza artificiale, con test di prima mano di 4 prodotti

2024-08-25

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Cerchio AI, generazione di immagini di nuovo a libro aperto.

Una serie di sviluppi raccolti insieme:

21 agostoIdeogram lancia ufficialmente la versione 2.0, sostenendo di avere capacità di rendering del testo più potenti.

Esatto, è il progetto che è stato fondato nell'agosto dello scorso anno dai quattro grandi ragazzi di Google AI Painting che hanno lasciato collettivamente il lavoro per avviare un'impresa. Ha ricevuto investimenti da numerosi grandi ragazzi dell'IA.

Questa volta anche IdeogrammaSfida aperta a Flux, il funzionario ha affermato con sicurezza che la sua valutazione umana è significativamente migliore di Flux Pro.

Sapete, Flux è stato creato dal team originale di Stable Diffusion, ed è recentemente diventato popolare sulle principali reti per generare "foto" di discorsi TED che sembrano reali.

Inoltre, una settimana fa, Google ha rilasciato ufficialmenteImmagine 3, nelle valutazioni ufficiali, si afferma che abbia prestazioni migliori di DALL-E 3, Midjourney v6, Stable Diffusion 3 e altri modelli di disegno.

Forse a causa della stimolazione (doge), anche Midjourney è passato ed è stato lanciato direttamente a tutti gli utenti il ​​22 agosto.Versione web gratuita

C'è qualcosa di bello da guardare adesso!

Dato che tutti affermano di essere forti, potremmo anche portare tutti allo stesso tavolo e avere un PK faccia a faccia.

Chi è l'IA di disegno più forte?

Invitiamo prima i nostri 4 concorrenti (tutti utilizzando la versione web):

Concorrente n. 1: Ideogramma 2.0.Ci sono 10 punti gratuiti ogni giorno, 1 punto può generare 4 immagini e si possono generare un massimo di 40 immagini al giorno;

Giocatore n. 2: Flux.1.Black Forest fornisce ufficialmente una demo gratuita su Hugging Chat (seleziona la versione FLUX.1 Schnell);

Concorrente n. 3: Immagine 3.Utilizzo gratuito e illimitato su Image FX;

Giocatore n. 4: A metà viaggio.Durante il periodo di prova gratuita hai solo la possibilità di generare un totale di 25 immagini;

Ora entriamo ufficialmente nella fase competitiva.

Le scimmie nere si ribaltarono tutte

Innanzitutto, per testare queste IA straniereCapisci le parole rapide cinesi?, approfittiamo anche della popolarità delle migliori scimmie nere di oggi.

suggerimento: Il personaggio del gioco è una scimmia, che indossa un'armatura, una corona d'oro con piume di fenice sulla testa e tiene un cerchio d'oro in mano, in piedi su una scogliera.

Come previsto, è successo un incidente...

Credo che a prima vista tutti siano stati attratti dalla grande croce rossa al n. 3. Esatto, sotto la stessa parola immediata c'è solo Immagine 3Richiesta di creazione negata

Quando l’ho visto, la mia prima reazione è stata se le nostre immediate parole attivassero la protezione del copyright. Quindi ho prima cancellato il "personaggio del gioco" nella parola del prompt, ma il risultato è stato che non è stato possibile generare il promemoria.

È perché Google Imagen 3 non supporta il cinese? Quindi ho cambiato a caso la parola immediata con una più semplice, e questa volta c'era un'immagine.

È solo che il risultato è stato un grosso errore e sono state modificate diverse parole cinesi e alla fine erano tutte immagini di texture irrilevanti.

SembraGoogle Imagen 3 in effetti non è d'accordo con le parole rapide cinesi

Dopo che il numero 3 è stato eliminato dall'elenco, guardando gli altri, rimanevano soloNo. 1 Ideogram 2.0 offre le migliori prestazioni

N. 2 può ancora vedere l'ombra dei fumetti cinesi, ma N. 4 Midjourney si è completamente lasciato andare~ (il tema principale non è completamente correlato)

Infine, vorrei elogiare Ideogram 2.0 per aver colto con precisione tutti gli elementi chiave.

Anche se non è quello che voglio nel mio cuore (voglio Black Mythology), non c'è davvero niente di sbagliato nel ripristinare le parole tempestive.

È una persona reale o un'intelligenza artificiale? Sciocco, non riesco a capire la differenza

Successivamente, entra nella zona di comfort di ciascun giocatore——Generazione di ritratti

A quei tempi, Midjourney divenne popolare su Internet con una foto di una coppia sul tetto, ora Flux ha preso d'assalto Internet con una serie di immagini di discorsi TED...;

Chi è migliore? La risposta sarà rivelata presto.

prompt:Un giovane con capelli castani, che indossa una camicia a quadri color verde acqua e crema, immortalato con un obiettivo da 50 mm per un look vintage. Colori intensi, messa a fuoco nitida e un tocco di fascino retrò.

Un giovane dai capelli ramati, che indossa una camicia a scacchi verde acqua e crema, catturato con un obiettivo da 50 mm in stile retrò. I colori sono ricchi e la messa a fuoco è nitida con un pizzico di fascino vintage.

Osservando prima il n. 2 e il n. 4, è ovvio che Midjourney ha vinto!

Guardando i dettagli, n. 2Flux.1 è leggermente spento, ci sono altri due colori di vestiti, che sono particolarmente prominenti tra le camicie a quadri blu e verdi.

Inoltre all'inizio abbiamo scoperto anche Imagen 3Un piccolo highlight unico: Cerchia la parola chiave prima che inizi la generazione.

Con il lavoro svolto possiamo semplicemente testare le prestazioni di diversi giocatori.elementi chiave(Camicia a quadretti blu-verdi, obiettivo 50mm, ecc.).

Si può vedere che nel complesso diversi giocatori si sono comportati bene (tranne il n. 2), con un alto grado di recupero e tutti rivolti verso la telecamera.

Inoltre, se questi non fossero generati da me utilizzando l’intelligenza artificiale, non sarei in grado di distinguere immediatamente la differenza dalle persone reali. (Che si vergogna)

Infine, vorrei dire a bassa voce che il concorrente n. 4, Midjourney, ha l'aspetto migliore.

Grande difficoltà: testo visualizzato nell'immagine

Dopo aver ingannato tutti con successo, è ora di lasciare che l'IA soffra un po'——

Aggiungi testo alle immagini

Questa questione è sempre stata un problema di vecchia data ed è diventata anche uno degli standard per testare il livello di disegno dell'IA.

Senza ulteriori indugi, lasciamo che alcuni concorrenti realizzino uno squisito cartellone pubblicitario. Tutti i lettori, per favore portate il vostro ruolo di padre del Partito A.

prompt:Un cartello orizzontale in ottone con la scritta "Festive Season" in un'elegante grafia, circondato da pini e agrifogli su uno sfondo di legno scuro, con un primo piano sulle lettere dorate.

Un cartello orizzontale in ottone con la scritta "Festive Season" in caratteri eleganti è circondato da rami di pino e agrifoglio su uno sfondo di legno scuro, con un primo piano incentrato sulle lettere dorate.

Dopo una rapida occhiata, sono tutti abbastanza buoni? Sembra che abbiano ripristinato ad un livello elevato le parole immediate?

Tuttavia, una volta rivelati gli occhi acuti del padre del Partito A, N. 2 non può nasconderli.

Fai attenzione, numero 2Flux.1 taglia gli angoli, alla parola "Stagione" manca la lettera "S".

Ma ad eccezione del n. 2, gli altri sono abbastanza buoni. Sembra che varie società di intelligenza artificiale stiano andando bene.Funzione di rendering del testoSono stati fatti tutti gli sforzi.

Quindi il passo successivo è che ognuno abbia le proprie preferenze per i ravanelli e le verdure verdi e ognuno faccia una scelta in base alle preferenze personali. (Votato personalmente per Midjourney)

A proposito, No. 1 Ideogram ha promosso appositamente la funzione "rendering del testo" in questo aggiornamento del modello. Potresti provarla di più.

Fai riferimento a McDonald’s, il punto centrale della pubblicità basata sull’intelligenza artificiale

Recentemente, McDonald's ha assunto 11 bellezze IA per pubblicizzare le loro patatine fritte, cosa che le ha rese molto popolari~

In effetti, il principio è relativamente semplice: non è altro che usare l'intelligenza artificiale per generare immagini di diversi personaggi che promuovono le patatine fritte e poi unirle in un video.

Inaspettatamente, l’effetto è stato sorprendente solo su Twitter, il video in questione ha ricevuto quasi 10 milioni di visualizzazioni.

Dopo aver padroneggiato il codice patrimoniale, abbiamo iniziato ufficialmente a lavorare come cinesi.L’intelligenza artificiale aiuta gli agricoltoriDevi camminare su e giù~

prompt:Sullo sfondo di una metropoli in stile cyberpunk, una ragazza promuove prodotti agricoli biologici che ha in mano.

In uno sfondo urbano in stile cyberpunk, una ragazza promuove i prodotti biologici che ha tra le mani.

Molto bene, il giocatore n. 3 ha "fallito" di nuovo. Tuttavia, quest'onda è davvero sconcertante. Le parole immediate non sono né in cinese né nulla di ovviamente proibito...

Dopo l'eliminazione del n. 3, il concorrente n. 1 Ideogramma 2.0 ha portato la più ampia varietà di prodotti, tra cui cavolo cinese, pomodori, cavolo viola, ecc.

Ed è l'unico che ha scrittosegno di testoSono venuto qui per promuovere il cibo biologico e vedo che stanno lavorando molto duramente~

Inoltre, se guardi da vicino, puoi vedere che solo il n. 1 sta facendo del suo meglio per imitare la persona reale, mentre il n. 2 e il n. 4 sono completamenteScimmia a due spine

u1s1, se ti riferisci allo stile pubblicitario di Maimai, questa generazione a breve termine non ha ottenuto l'effetto desiderato. (Spero più vicino alla realtà)

Tuttavia, per fortuna, questi strumenti di intelligenza artificiale sono attualmente disponibili gratuitamente. Non è impossibile provarli più volte. L’attenzione è ancora sulla metodologia. 🐶

Non andartene di fretta, in realtà esiste un modo più affidabile per fare soldi——

Usa l'intelligenza artificiale per controllare facilmente le riprese in studiomanifesti aziendali, non sarebbe bello risparmiare su fotografi, location e post-produzione.

Un elegante tubetto di rossetto risplende su uno sfondo di raffinatezza, evidenziando il pigmento ricco e la scorrevolezza fluida. Evoca il lusso con una messa a fuoco nitida e un pizzico di brillantezza.

Un elegante tubetto di rossetto risplende su uno sfondo sofisticato, evidenziando il colore intenso e l'applicazione fluida. Evoca un senso di lusso con una messa a fuoco nitida e un tocco di brillantezza.

Mettiamoli alla prova tutti, se dovessi scegliere un rossetto per una donna intorno a te, quale sceglieresti? (Il test della morte sta arrivando)

Hehe, quindi qualcuno ha scelto il numero 4?

Sebbene il colore grigio del No. 4 Midjourney sembri molto esclusivo, il colore nero potrebbe essere un po' di nicchia. (Scegli attentamente)

A parte ciò, i prossimi migliori interpreti lo sonoImmagine 3, il tessuto di velluto sottostante esalta un senso di lusso e, cosa più importante, la texture del rossetto è molto reale.

In confronto, sia il n. 1 che il n. 2 sembrano un po' finti, con una "sensazione di plastica".

Pertanto, nel complesso, il giocatore n. 3 ha vinto questo round.

Riassumendo, nel complesso la prestazione dei quattro giocatori è stata molto buona. Sotto le parole cinesi, il giocatore del cavallo oscuro Ideogram 2.0 ha ottenuto i migliori risultati.

Chi è Ideogramma?

Nel febbraio di quest'anno, Ideogram ha lanciato la versione 1.0. In soli sei mesi si è evoluta di nuovo e ha lanciato la versione 2.0.

In effetti, Ideogram e Google sono strettamente correlati.

Fondata nell'agosto dello scorso anno, i primi quattro membri del team fondatore eranoAutore dell'articolo Imagen sulla ricerca sui grafici vincenziani di Google

Il CEO Mohammad Norouzi, coautore dell'articolo, ha ricevuto la borsa di studio Google ML PhD mentre studiava per un dottorato in informatica presso l'Università di Toronto.

Dopo la laurea, è entrato a far parte di Google Brain e ha lavorato per 7 anni, raggiungendo la posizione di ricercatore senior. La sua ricerca principale è stataGenera modello

Inoltre, è un membro originale del team di traduzione automatica neurale di Google e coautore del framework di apprendimento contrastivo autosupervisionato del team Hinton, SimCLR.

Direttore tecnico William Chan(Chen Junle), coautore dell'articolo, ha studiato all'Università di Waterloo e alla Carnegie Mellon University in Canada.

Quando è entrato in Google nel 2012, ha lavorato prima su progetti pubblicitari di machine learning, per poi passare a Google Brain per fare ricerche sulla PNL.

Il cofondatore Jonathan Ho, si è laureato alla UC Berkeley con un dottorato di ricerca, ha lavorato presso OpenAI per un anno e poi si è unito a Google.

Oltre ad essere uno dei principali contributori dell'articolo Imagen, ha anche gettato le basi per il modello di diffusione del denoising.《Modelli probabilistici di diffusione di denoising》Pieter Abbeel, uno dei coautori di questo articolo, è anche un investitore in Ideogram AI.

Co-fondatore Chitwan Saharia, coautore dell'articolo, si è laureato al Bombay Institute of Technology. È entrato in Google nel 2019, dove è principalmente responsabile della guida del lavoro del modello di diffusione da immagine a immagine.

Le altre tre persone del team fondatore,Shayaan AbdullahEra un ingegnere di machine learning presso Twitter. Ha lasciato il suo lavoro nell'aprile dello scorso anno e successivamente si è unito a Ideogram AI.

Giacobbe LuIngegnere informatico, ha lavorato in aziende come Amazon prima di unirsi a Ideogram;Jenny LeiSono uno stagista di ingegneria del software e ho lavorato presso Google prima di unirmi a Ideogram AI.

Si può vedere che Ideogram è composto dai migliori team di ricerca sul modello di diffusione e ha ricevuto favori capitali sin dal suo inizio.

Il round iniziale di Ideogram è stato finanziato daa16zEIndice VenturesHa guidato l'investimento per un importo di 16,5 milioni di dollari (all'epoca circa 120 milioni di RMB).

Ci sono anche investitori individuali come Andrej Karpathy, il guru dell'apprendimento di rinforzo Pieter Abbeel e il co-fondatore di GitHub Tom Preston-Werner.

Inoltre, nel febbraio di quest'anno, diverse fonti hanno riferito che Ideogram avevanuova tornata di finanziamenti

secondo quanto riferito, è stato sollevato con successo80 milioni di dollari(circa 5,7 miliardi di yuan) I finanziamenti di serie A, guidati da Andreessen Horowitz, e altri investitori partecipanti includono Index Ventures, Redpoint Ventures, Pear VC e SV Angel.

Sembra che Ideogram, che ha soldi e tecnologia, sia senza dubbio un cavallo oscuro nel campo della mappatura dell'IA.

Rotola, continua a rotolare.