uutiset

Onko Midjourneyn tila epävakaa? Toinen synkkä hevonen AI-piirustuksessa ilmestyy neljän tuotteen ensikäden testaamiseen

2024-08-25

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Tekoälyympyrä, avoimen kirjan kuvan luominen jälleen.

Sarja kehityssuuntia koottiin yhteen:

21. elokuutaIdeogram julkaisee virallisesti version 2.0, joka väittää omaavansa vahvemmat tekstintoisto-ominaisuudet.

Aivan oikein, se on projekti, jonka perustivat viime vuoden elokuussa Google AI Paintingin neljä suurta kaveria, jotka jättivät yhdessä työnsä perustaakseen yrityksen. Se on saanut sijoituksia useilta tekoälyn isoilta miehiltä.

Tällä kertaa myös IdeogrammiAvoin haaste Fluxille, virkamies totesi luottavaisesti, että sen inhimillinen arviointi on huomattavasti parempi kuin Flux Pro.

Tiedätkö, Fluxin loi alkuperäinen Stable Diffusion -tiimi, ja siitä on äskettäin tullut suosittu suurissa verkoissa luomaan "valokuvia" TED-puheista, jotka näyttävät todellisilta.

Lisäksi viikko sitten Google julkaisi virallisestiKuva 3Virallisissa arvioinneissa sen väitetään toimivan paremmin kuin DALL-E 3, Midjourney v6, Stable Diffusion 3 ja muut piirustusmallit.

Ehkä stimulaation (doge) vuoksi myös Midjourney siirtyi ja se julkaistiin suoraan kaikille käyttäjille 22. elokuuta.Ilmainen web-versio

Nyt on jotain hyvää katsottavaa!

Koska kaikki väittävät olevansa vahvoja, voisimme yhtä hyvin tuoda kaikki samaan pöytään ja saada kasvotusten PK:n.

Kuka on vahvin piirustus AI?

Kutsutaan ensin neljä kilpailijaamme (kaikki käyttävät verkkoversiota):

Kilpailija nro 1: Ideogrammi 2.0.Joka päivä on 10 pistettä ilmaiseksi, 1 piste voi tuottaa 4 kuvaa ja enintään 40 kuvaa päivässä;

Pelaaja nro 2: Flux.1.Black Forest tarjoaa virallisesti ilmaisen demon Hugging Chatissa (valitse FLUX.1 Schnell -versio);

Kilpailija nro 3: Kuva 3.Ilmainen ja rajoittamaton käyttö Image FX:ssä;

Pelaaja nro 4: Midjourney.Ilmaisen kokeilujakson aikana sinulla on vain mahdollisuus luoda yhteensä 25 kuvaa;

Nyt ollaan virallisesti kilpailuvaiheessa.

Kaikki mustat apinat kaatui

Ensinnäkin näiden ulkomaisten tekoälyn testaamiseksiYmmärrätkö kiinalaisia ​​kehotussanoja?, hyödynnetään myös nykyajan mustien huippuapinoiden suosiota.

kehote: Pelihahmo on apina, jolla on haarniska, päällään kultainen kruunu, jossa on Feeniksin höyhenet, ja jolla on kultainen vanne kädessään, seisoo kalliolla.

Kuten odotettiin, onnettomuus tapahtui...

Uskon, että suuri punainen risti numerossa 3 houkutteli kaikkia ensi silmäyksellä. Aivan oikein, saman kehotussanan alla on vain Imagen 3Rakennuspyyntö evätty

Kun näin tämän, ensimmäinen reaktioni oli, laukaisiko nopeat sanamme tekijänoikeussuojan. Joten poistin ensin "pelihahmon" kehotesanasta, mutta tuloksena oli, että muistutusta ei voitu luoda.

Onko syynä se, että Google Imagen 3 ei tue kiinaa? Joten vaihdoin satunnaisesti kehotussanan yksinkertaisemmaksi, ja tällä kertaa siinä oli kuva.

Tulos oli vain suuri virhe, ja useita kiinalaisia ​​kehotussanoja muutettiin, ja lopulta ne olivat kaikki merkityksettömiä tekstuurikuvia.

Näyttää siltäGoogle Imagen 3 ei todellakaan sovi kiinalaisten kehotteiden kanssa

Kun nro 3 epäonnistui luettelossa, muita katsoessa niitä oli vainNo. 1 Ideogrammi 2.0 toimii parhaiten

Nro 2 näkee edelleen kiinalaisen sarjakuvan varjon, mutta nro 4 Midjourney on päästänyt itsensä täysin irti~ (pääteema on täysin riippumaton)

Lopuksi haluan kiittää Ideogram 2.0:aa siitä, että se osui tarkasti kaikkiin avainelementteihin.

Vaikka se ei olekaan sitä, mitä sydämessäni haluan (haluan mustaa mytologiaa), nopean sanojen palauttamisessa ei todellakaan ole mitään väärää.

Onko se oikea henkilö vai tekoäly? Tyhmä, en osaa sanoa eroa

Siirry seuraavaksi jokaisen pelaajan mukavuusalueelle——Muotokuvan sukupolvi

Noihin aikoihin Midjourneysta tuli suosittu Internetissä kuvalla pariskunnasta katolla. Nyt Flux on jopa suosittu Internetissä TED-puhekuvien avulla.

Kuka on parempi? Vastaus paljastetaan pian.

kehote: Nuori mies, jolla on kastanjanruskeat hiukset, yllään ruskea ruskeansininen ja kermanvärinen paita, joka on kuvattu 50 mm:n objektiivilla vintage-ilmeen saamiseksi. Rikkaat värit, terävä tarkennus ja ripaus retro charmia.

Nuori mies, jolla on kastanjanruskeat hiukset, yllään sinivihreä ja kermanruskea paita, kuvattuna 50 mm:n objektiivilla retrotyyliin. Värit ovat täyteläisiä ja tarkennus on terävä, ja siinä on ripaus vintagea.

Kun tarkastellaan ensin numeroita 2 ja 4, on selvää, että Midjourney on voittanut!

Tarkasteltaessa yksityiskohtia, nro 2Flux.1 on hieman pois päältä, vaatteita on kaksi muuta väriä, mikä on erityisen näkyvää sinisten ja vihreiden ruudullisten paitojen joukossa.

Lisäksi löysimme alussa myös Imagen 3:nAinutlaatuinen pieni kohokohta: Ympyröi avainsana ennen kuin sukupolvi alkaa.

Sen tekemällä työllä voimme vain testata useiden pelaajien suorituskykyä.keskeiset elementit(Sinivihreä ruudullinen paita, 50mm linssi jne.).

Voidaan nähdä, että kokonaisuutena useat pelaajat suoriutuivat hyvin (paitsi nro 2), korkealla restaurointiasteella ja kaikki katsoivat kameraa kohti.

Lisäksi, jos en olisi itse luonut näitä tekoälyllä, en pystyisi heti erottamaan todellisista ihmisistä. (Häpeä)

Lopuksi haluan sanoa hiljaa, että kilpailija nro 4, Midjourney, näyttää parhaimmalta.

Suuri vaikeusaste: Kuvan näyttöteksti

Kun kaikki on onnistuneesti petetty, on aika antaa tekoälyn kärsiä hieman...

Lisää tekstiä kuviin

Tämä asia on aina ollut pitkäaikainen ongelma, ja siitä on tullut myös yksi AI-piirustuksen tason testausstandardeista.

Ilman pitkiä puheita, annetaan muutamien kilpailijoiden tehdä hieno mainostaulu. Kaikki lukijat, tuokaa oma roolinne puolueen A isänä.

kehote: Vaakasuora messinkikyltti, jossa lukee "Juhlakausi" tyylikkäällä käsikirjoituksella, männyn ja hollyn ympäröimänä tummalla puutaustalla. Lähikuvassa keskitytään kultaisiin kirjaimiin.

Vaakasuora messinkikyltti, jossa lukee tyylikkäällä tekstillä "Festive Season", on männynoksien ja hollyn ympäröimä tummaa puutaustaa vasten, ja lähikuvassa keskitytään kultaisiin kirjaimiin.

Nopealla vilkaisulla, ovatko ne kaikki melko hyviä. Näyttää siltä, ​​​​että ne ovat palauttaneet nopeat sanat?

Kuitenkin, kun Party A:n isän terävät silmät paljastuvat, nro 2 ei voi peittää niitä.

Huomio, numero 2Flux.1 leikatut kulmat, sanasta "Season" puuttuu kirjain "S".

Mutta lukuun ottamatta nro 2, muut ovat melko hyviä. Näyttää siltä, ​​​​että useat AI-yritykset voivat hyvin.Tekstin renderöintitoimintoKaikki ponnistelut on tehty.

Joten seuraava askel on, että jokaisella on omat mieltymyksensä retiisistä ja vihreistä vihanneksista, ja jokainen tekee valinnan henkilökohtaisten mieltymysten perusteella. (Henkilökohtaisesti äänestin Midjourneyn puolesta)

Muuten, No. 1 Ideogram on erityisesti edistänyt "tekstin renderöinti" -toimintoa tässä mallipäivityksessä. Voit kokeilla sitä enemmän.

Katso McDonald's, koko tekoälymainonnan pointti

Äskettäin McDonald's palkkasi 11 tekoälyn kaunottarea kutsumaan ranskalaisia ​​perunoita, mikä teki niistä erittäin suosittuja~

Itse asiassa periaate on suhteellisen yksinkertainen. Se on vain tekoälyn avulla luoda kuvia eri hahmoista, jotka mainostavat ranskalaisia ​​perunoita ja liittämällä ne sitten videoon.

Yllättäen vaikutus oli hämmästyttävä Pelkästään Twitterissä kyseinen video sai lähes 10 miljoonaa katselukertaa.

Varallisuuskoodin hallitsemisen jälkeen aloimme virallisesti työskennellä kiinalaisina.Tekoäly auttaa maanviljelijöitäSinun täytyy kävellä ylös ja alas~

kehote: Kyberpunk-tyylisen metropolin taustalla tyttö mainostaa käsissään luomumaataloustuotteita.

Kyberpunk-tyylisessä kaupunkitaustassa tyttö mainostaa käsissään olevia luomutuotteita.

Erittäin hyvä, pelaaja nro 3 "epäonnistui" taas. Tämä aalto on kuitenkin todella hämmentävä.

Kun numero 3 oli eliminoitu, kilpailija nro 1 Ideogrammi 2.0 toi suurimman valikoiman tavaroita, mukaan lukien kiinankaali, tomaatit, purppurikaali jne.

Ja se on ainoa, joka kirjoittiteksti merkkiTulin tänne mainostamaan luomuruokaa, ja näen, että he työskentelevät kovasti~

Lisäksi, jos katsot tarkasti, voit nähdä, että vain numero 1 yrittää parhaansa jäljitellä todellista henkilöä, kun taas numero 2 ja 4 ovat täysinkaksikärkinen apina

u1s1, jos viittaat Maiman mainostyyliin, tämä lyhytaikainen sukupolvi ei saavuttanut toivottua vaikutusta. (Toivottavasti lähempänä todellisuutta)

Onneksi nämä tekoälytyökalut ovat tällä hetkellä saatavilla ilmaiseksi. Ei ole mahdotonta kokeilla niitä useita kertoja. Painopiste on edelleen metodologiassa. 🐶

Älä lähde kiireessä, on olemassa luotettavampi tapa ansaita rahaa...

Käytä tekoälyä hallitaksesi studiokuvia helpostiliikejulisteita, eikö olisi mukavaa säästää rahaa valokuvaajiin, tapahtumapaikkoihin ja jälkituotantoon.

Tyylikäs huulipunaputki loistaa hienostuneen taustalla korostaen rikasta pigmenttiä ja tasaista liukumista. Tuo ylellisyys esiin terävällä tarkennuksella ja ripaus hohtoa.

Tyylikäs huulipunaputki loistaa hienostunutta taustaa vasten korostaen intensiivistä väriä ja tasaista levitystä. Herätä ylellisyyden tunne terävällä tarkennuksella ja ripaus hohtoa.

Testataan kaikkia, jos sinun pitäisi valita huulipuna ympärilläsi olevalle naiselle, minkä valitsisit? (Kuolemankoe on tulossa)

Hehe, onko kukaan valinnut nro 4?

Vaikka No. 4 Midjourneyn harmaa väri näyttää erittäin korkeatasoiselta, musta väri saattaa olla hieman niche. (Valitse huolellisesti)

Sen lisäksi seuraavaksi parhaat esiintyjät ovatKuva 3, alla oleva samettikangas tuo esiin ylellisyyden tunteen, ja mikä tärkeintä, huulipunan rakenne on hyvin todellinen.

Vertailun vuoksi sekä nro 1 että nro 2 näyttävät hieman väärennetyiltä, ​​ja niissä on "muovituntumaa".

Siksi pelaaja nro 3 voitti tämän kierroksen.

Yhteenvetona neljän pelaajan suorituskyky oli kaiken kaikkiaan erittäin hyvä. Kiinalaisten kehotussanojen alla Dark Horse -pelaaja Ideogram 2.0 suoriutui parhaiten.

Kuka on Ideogrammi?

Tämän vuoden helmikuussa Ideogram julkaisi version 1.0. Vain puolessa vuodessa se kehittyi uudelleen ja julkaisi version 2.0.

Itse asiassa Ideogram ja Google liittyvät läheisesti toisiinsa.

Viime vuoden elokuussa perustettu perustajatiimin neljä ensimmäistä jäsentä olivatGoogle Vincentin kaaviotutkimuksen Imagen-paperin kirjoittaja

Toimitusjohtaja Mohammad Norouzi, paperin toinen kirjoittaja, hän sai Google ML PhD -stipendin opiskellessaan tietojenkäsittelytieteen tohtoriksi Toronton yliopistossa.

Valmistuttuaan hän liittyi Google Brainiin ja työskenteli 7 vuotta, jolloin hän nousi vanhemman tutkijan tehtäväänLuo malli

Lisäksi hän on alkuperäinen Google Neural Machine Translation -tiimin jäsen ja Hinton-tiimin itseohjatun kontrastiivisen oppimiskehyksen SimCLR toinen kirjoittaja.

Teknologiajohtaja William Chan(Chen Junle), paperin toinen kirjoittaja, opiskeli Waterloon yliopistossa ja Carnegie Mellonin yliopistossa Kanadassa.

Kun hän liittyi Googleen vuonna 2012, hän työskenteli ensin koneoppimismainontaprojekteissa ja siirtyi sitten Google Brainiin tekemään NLP-tutkimusta.

Perustaja Jonathan Ho, valmistui UC Berkeleystä tohtoriksi, työskenteli OpenAI:ssa vuoden ja liittyi sitten Googleen.

Sen lisäksi, että hän oli Imagen-paperin keskeinen kirjoittaja, hän loi myös perustan meluhaihduttamismallille.《Diffuusio-todennäköisyysmallit》Pieter Abbeel, yksi tämän artikkelin kirjoittajista, on myös Ideogram AI -sijoittaja.

Toinen perustaja Chitwan Saharia, artikkelin toinen kirjoittaja, valmistui Bombay Institute of Technologysta kandidaatin tutkinnolla. Hän aloitti Googlen palveluksessa vuonna 2019, missä hän on pääosin vastuussa kuvasta kuvaksi -hajautusmallin työn johtamisesta.

Kolme muuta perustajatiimin henkilöä,Shayaan AbdullahHän oli koneoppimisen insinööri Twitterissä. Hän jätti työnsä viime vuoden huhtikuussa ja liittyi myöhemmin Ideogram AI:hen.

Jacob LuOhjelmistoinsinöörinä hän työskenteli Amazonin kaltaisissa yrityksissä ennen liittymistään Ideogrammiin;Jenny LeiOlen ohjelmistotekniikan harjoittelija ja harjoitteli Googlessa ennen Ideogram AI:hen tuloani.

Voidaan nähdä, että Ideogram koostuu huipputason diffuusiomallin tutkimusryhmistä ja on saanut pääomasuosituksia perustamisestaan ​​lähtien.

Ideogrammin siemenkierroksen rahoittia16zjaIndex VenturesJohti 16,5 miljoonan Yhdysvaltain dollarin (noin 120 miljoonan RMB:n tuolloin) investointia.

Mukana on myös yksittäisiä sijoittajia, kuten Andrej Karpathy, vahvistusoppimisguru Pieter Abbeel ja GitHubin perustaja Tom Preston-Werner.

Lisäksi tämän vuoden helmikuussa useat lähteet ilmoittivat, että Ideogramilla oliuusi rahoituskierros

kuulemma onnistuneesti kasvatettu80 miljoonaa dollaria(noin 5,7 miljardia yuania) A-sarjan rahoitus, jota johtaa Andreessen Horowitz ja muita osallistuvia sijoittajia ovat Index Ventures, Redpoint Ventures, Pear VC ja SV Angel.

Näyttää siltä, ​​että Ideogram, jolla on rahaa ja teknologiaa, on epäilemättä synkkä hevonen tekoälykartoituksen alalla.

Rullaa, jatka rullaamista.