uutiset

StableDiffusionin uuden yrityksen alkuperäinen tiimi julkistetaan virallisesti!Jatkuva uusi malli virkistää AI-maalausmaisemaa

2024-08-02

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Talo on peräisin Aofein temppelistä
Qubits |. Julkinen tili QbitAI

vain,Alkuperäinen Stable Diffusion -tiimi ilmoitti virallisesti uudesta yrityksestä

Robin Rombach, joka ilmoitti eroavansa Stability AI:stä maaliskuussa, on yksi Stable Diffusionin kahdesta päätekijästä, ja tusina hänen alkuperäistä yrityskumppaniaan ilmoitti virallisesti uutisen yrityksen perustamisesta.

Yrityksen uusi nimiBlack Forest Lab, Black Forest Lab . Heti kun se debytoi, Kuku julkaisi sarjan 3 kuvan sukupolven mallia, joista 2 on avoimen lähdekoodin.

jaTukee kiinalaista syöttöä

Mikä on vaikutus? Sen nähneet nettimiehet sanoivat, että se oli villi!

Syötä kehotussana ja testaa näytön tehosteita ja kasvotietoja sekä muita turvatoimia kerralla:

Teini-ikäinen tyttö, jolla on hiihtomaski, tekee origamia navetassa. Kuvan alareunassa on keltainen teksti. Taustalla on kehys, jonka sisällä on Obaman kuva.



Heti nähtyään tämän kuva- ja tekstisarjan jotkut nettimiehet valittivat, että tämä on paras kuvanluontitehoste, jonka hän on koskaan nähnyt.



Tämän yrityksen ominaisuus on, että se ei ole salainen.

Perustaminen julkistettiin virallisesti tänään, sarja malleja julkaistiin tänään ja myös rahoituksen edistyminen julkistettiin...

Saatiin päätökseen 32 miljoonan dollarin rahoitus, jota johtaa a16z, investoinneilla Oculus VR:n toinen perustaja Brendan Iribe, entinen YC-kumppani Garry Tan, Timo Aila, joka johtaa NVIDIA Researchin tietokonegrafiikan tutkimusryhmää, Applen ansioitunut tiedemies (entinen Intel Intelligent Systemsin päätutkija) Vladlen Koltun ja muut.

Voidaan sanoa, että Black Forest ei ole vain saanut vetoja pääomamarkkinoilta, vaan myös voittanut alan johtajien suosion.

Tekoälymestari Kapasi lähetti myös onnitteluviestin verkossa ja ylisti myös Black Forestin uutta mallia:

Varo hyvä! Avoimen lähdekoodin FLUX.1 image gen -malli näyttää erittäin tehokkaalta.



Ja huomaa, että avoimen lähdekoodin sopimus on löysä Apache2.0.

Black Forest -kuvasukupolven mallin debyytti

Kapasi on innoissaan. Koetaan visuaalisesti mustan metsän mallivaikutus.

Tässä Qubit on valinnut näytettäväksi viisi sukupolven tehostetta. Kaikki kuvat ovat virallisten toimittamia, eikä ole määritelty, mitä mallia käytetään.

Ensimmäinen taso on tekstin luominen.

Kehotussana: Kuva vanhasta luokkahuoneen liitutaulusta. Liitutaululle on kirjoitettu liidulla "tehdään yhdessä todella kauniita juttuja" ja sanojen perässä punainen liitusydän. Aurinko paistaa sisään ikkunasta.



Toinen taso on ei-todellinen kohtaus + tekstin luominen.

Kehotus: Vedenalaisessa kohtauksessa kaksi pöllöä istuu kauniin ruokapöydän ääressä Pöydän keskellä syttyy kynttilä. Kaksi pöllöä nauttivat yhdessä herkullisesta illallisesta. Vasemmalla pöllöllä on yllään smokki ja oikeanpuoleisella pöllöllä kaunis mekko. Taustalla ohittaa sukellusvene, jonka kylkeen on maalattu "What a Hoot". Pöydän alla olevan kuvan alareunassa ui pienet meduusat, elokuvamainen ja kaunis digitaalinen taideteos.



Kolmas taso on todellinen kohtaus todellisessa maailmassa.

Pikasana: Kuva kauniista Freiburgin kadusta, jossa raitiovaunu kulkee ohi ja ihmiset kävelevät ja ajavat polkupyöriä.



Neljäs taso on oikeiden hahmojen ja animehahmojen sukupolvi.

Kehotussana: Kuva kolmesta naisesta kaupungin keskustan kadulla kädet ojentaen kohti kameraa.



Kehotussana: Kaunis anime-teos suloisesta kissatytöstä, joka näyttää masentuneelta ja pitelee paperia, johon on piirretty hymy, hän on aikeissa itkeä.



Viides taso on eläinkuvan luominen.

Kehotussana: Bobcat metsässä, ammattivalokuvaajan valokuvaama kirkkaassa valossa.



Vinkki sana: Lähikuva myyttisestä olennosta, joka koostuu yksityiskohtaisista spiraalifraktaaleista ja lonkeroista, yksityiskohtaisista rekursiivisista ihokuvioista



FLUX.1-sarjan mallit

Tällä kertaa Black Forest on julkaissut kolme FLUX.1-sarjan mallia: pro, dev ja schnell.



FLUX.1 [pro]: Sarjan vahvin ääni.

FLUX.1-sarjan ydin, joka tarjoaa optimaalisen suorituskyvyn kuvan luomisen luokkansa parhaan komentojen noudattamisen, visuaalisen laadun, kuvan yksityiskohtien ja tulosten monimuotoisuuden kanssa.

Schwarzwaldin tiimi parantaa hitaasti API:n FLUX.1 [pro]:n päätelmien laskentaominaisuuksia.

Tämä versio on saatavilla Replicate- ja fal.ai-sivustoilla, jotka tarjoavat omistettuja ja mukautettuja yritysratkaisuja.

FLUX.1 [dev]: Cup sarjassa.

Malli, joka sallii ei-kaupallisen käytön, on avopainotettu ja tislattu.

[dev] Suoraan [pro]:lta tislattuna se tarjoaa samanlaisen laadun ja nopean yhteensopivuuden samalla kun se on tehokkaampi kuin samankokoiset vakiomallit.

Voit kokeilla sitä Huhufacessa tai kokeilla sitä suoraan Replicatessa tai fal.ai:ssa.

FLUX.1 [schnell]: Pieni nopeuden pyörre.

Sarjan nopein malli, joka on räätälöity paikallista kehitystä ja yksittäisiä kehittäjiä varten.

FLUX.1 [schnell] on julkisesti saatavilla Apache2.0-lisenssillä. Päättelykoodi löytyy GitHubista.

ComfyUI tukee sitä, ja sitä voidaan käyttää myös Replicate- tai fal.ai:n kautta.

Otetaan intuitiivinen tunne!

Tässä on kolme kuvaa, jotka ovat generoituja efektejä yllä olevasta suuresta kupista, keskikokoisesta kupista ja pienestä kupista eri kehotussanojen alla, teeman "kakku" ympärillä.

△ Vasemmalta oikealle mallina käytetään suuria, keskikokoisia ja pieniä kuppeja.

Monien testien jälkeen Qubit havaitsi, että jos syötetään yksinkertainen kehotussana, kuvan luomiseen kuluva aika pro-versiolla on 15-25 sekuntia (sukupolviaika näytetään tulostaulukon alla).



Black Forest sanoo, että kaikki FLUX.1-mallitMolemmat perustuvat multimodaalisten ja rinnakkaisdiffuusiomuuntajalohkojen hybridiarkkitehtuuriin ja ulottuvat 12B parametriin

Kolmen mallin joukossa FLUX.1 [pro] ja [dev] ohittivat Midjourney v6.0:n ja DALL·:n visuaalisen laadun, nopean reagoivuuden, koko/kuvasuhteen joustavuuden, ladonta E 3(HD) ja Stable Diffuusio 3-Ultra.

Tiimi kutsuu FLUX.1:tä [schnell] "tähän mennessä edistyneimmäksi muutaman askeleen malliksi".

Sen lisäksi, että se erottuu samankaltaisista kilpailijoista, se päihittää myös tehokkaammat pakkaamattomat mallit, kuten Midjourney v6.0 ja DALL·E 3(HD).

Koko FLUX.1-sarja on erityisesti hienosäädetty säilyttämään harjoitteluvaiheen täyden monimuotoisuuden.

Verrattuna olemassa oleviin teknologioihin, FLUX.1:llä on seuraavat edut:



Joku väistämättä kysyy, oletteko OG:n veteraaneja ja Stability AI:n ydinjäseniä.

Niin,Mitä eroa on uudella mallillasi ja sen Stable Diffusion -mallilla?

Perustajatiimin jäsenet vastasivat Redditissä:

Jopa heikoimmalla mallillamme Schnellillä on parempi rakennuslaatu ja nopeammat rakennusajat.

Päätavoitteena on perustaa uusi yritys ja ylittää itseni.



Luonut SD-päätekijöiden ryhmä

Malliin liittyvien tietojen esittelyn jälkeen on aika virallisesti tutustua tähän uuteen yritykseen.

mustan metsän laboratorio, julkistettiin juuri tänään.

Yrityksen virallisilla verkkosivuilla on iskulause: Luomisen uusi aikakausi.

Yrityksen missiona on kehittää huippuluokan, korkealaatuisia syväoppimismalleja kuvien ja videoiden luomiseen ja tuoda ne laajimman yleisön ulottuville.

Huadian ilmestyy!HeidänSeuraava kunnianhimo on ilmeinen, eli siirtyminen videon sukupolven alalle.

Lisäksi sen on oltava "SOTA".



YdinjäsenRobin Rombach, entinen tutkija Stability AI:stä.

Stability AI:llä työskennellessään hän oli yksi Stable Diffusion -mallin pääkehittäjistä ja osallistui myös SDXL-, SVD- ja muiden projektien tutkimukseen.

Tämän vuoden maaliskuussa Robin jätti Stability AI:n.

Ulkomaailma kommentoi, että hänen lähtönsä on vahingoittanut vakavasti jo ennestään kaoottista yksisarvisyhdistystä - hän on loppujen lopuksi yksi SD:n kahdesta päätoimijasta.



Robin suoritti fysiikan perustutkinto- ja maisterintutkintonsa Heidelbergin yliopistosta.

Vuonna 2020 hän aloitti tietojenkäsittelytieteen tohtoriopinnot Computer Vision Groupissa Heidelbergissä Björn Ommerin johdolla, ja vuonna 2021 hän muutti tutkimusryhmän mukana Münchenin yliopistoon.

Tutkimus keskittyy syväoppimismallien, erityisesti tekstistä kuvaksi -järjestelmien, luomiseen.

Google Scholarilla on lähes 15 000 viittausta.



Lisäksi virallisilla verkkosivuilla julkistettujen jäsenten joukossa Andreas Blattmann, Axel Sauer, Dominik Lorenz, Dustin Podel, Frederic Boesel, Patrick Esser, Sumith Kulal, Tim Dockhorn, Yam Levi, Zion EnglishKaikki ovat julkisesti saatavilla olevia Stability AI:n alkuperäisiä jäseniä.

(Andi Holmes ja Jonas Müller eivät ole vielä löytäneet tarkkoja tietoja)



Voidaan sanoa, että Black Forest on SD:n alkuperäinen ydinjäsen, joka lähti ja purjehti uudelleen.

Ei ihme, että Axel Sauer välitti virallisen twiitin ja huusi äänekkäästi:

Olemme edelleen hengissä!



Yksi asia vielä

Mikä sattuma, samana päivänä Stability AI teki myös uusia liikkeitä:

Uusia tekoälymalleja lanseerataanVakaa Fast 3DViranomaisten mukaan sitä voidaan käyttääLuo 3D-kuvia puolessa sekunnissa

Vaikka edellisessä mallissa kesti minuuttia luoda 3D-kuva samanlaisilla tehosteilla, uusi malli pystyy suorittamaan saman tehtävän 1200 kertaa nopeammin kuin nykyinen malli.



Stability AI julkaistiin maaliskuussaPaennut toimitusjohtaja Emad Mostaque, mitä hän tekee?

Kesäkuussa hän ilmoitti uuden yrityksen olinpaikastaSchelling AI, "rakentaa ja tukee tekoälyrahoituksen tukemaa avointa lähdekoodia, malleja ja tietojoukkoja."

Painopiste on innovatiivisessa tutkimuksessa ja huolellisesti rakennetussa tekoälyssä, joka on kulttuuritietoinen, tieteellinen, koulutuksellinen ja luova.

Kolme päivää sitten Schelling AI julkaisi sarjan ensimmäisen artikkelin "How To Think About AI".

Artikkeli on hieman pitkä Kiinnostuneet ystävät voivat etsiä ja katsoa sitä itse.

Tekoäly kehittyy nopeasti, edistää avointa lähdekoodia ja avoimuutta sekä kiihdyttää innovaatioita ja yhteistyötä.



Ja mitäpä jos olisimme kaikki kunnollisia ihmisiä!

Schwarzwaldin laboratorion perustamisesta ilmoittava twiitti välitti ystävällisesti entinen toimitusjohtaja (laita koiran pää tähän).

Viitelinkit:
[1]https://blackforestlabs.ai
[2]https://news.ycombinator.com/item?id=41130620
[3]https://x.com/EMostaque
[4]https://www.reddit.com/r/StableDiffusion/comments/1eds0l9/does_anyone_have_an_update_on_when_stable/
[5]https://x.com/SchellingAI/status/1818600200232927721