Fluxin hienosäätö on valloittanut koko internetin, ja ulkomaalaiset kaverit ovat muodostaneet joukkueen Marvel-sankareita!

2024-08-19

Uusi viisausraportti

Toimittaja: Toimitusosasto

[Johdatus uuteen viisauteen]Tekoälykartoituskuningas, joka valloittaa avoimen lähdekoodin maailman myrskyllä, on syntynyt! Puoli kuukautta julkaisunsa jälkeen Fluxista on tullut suosikkivaihtoehto Midjourneylle. Kehittäjät kaikilta elämänaloilta alkoivat hienosäätää LoRAa omilla valokuvillaan, jolloin yksi henkilö voi hallita useita tyylejä.

Midjourneyn jälkeen en ole koskaan nähnyt ihmisiä niin hulluina tekoälykuvaussovellukseen.

Fluxin ilmaantuminen tarkoittaa, että tekoälykuvan luominen on siirtynyt uuteen vaiheeseen.

Musk itse sanoi, ettei hän voinut enää erottaa totuutta valheesta.

Ensinnäkin realistinen valokuva TED-kaiuttimesta valloitti Internetin. Myöhemmin Flux-mallin integroinut Grok 2 mursi suojakaiteen rajoitukset ja tuli hulluksi nettilaisten keskuudessa.

Viime aikoina Flux-kehittäjät ovat myös alkaneet hienosäätää omia LoRA-mallejaan.

HuggingFace Lianchuang huudahti, että Flux on vallannut avoimen lähdekoodin tekoälymaailman.

Kehittäjä, joka hienosääsi sitä, sanoi: "Flux+LoRA kumoaa generatiivisen tekoälymarkkinan. Voit olla missä tahansa, pukeutua mitä tahansa, käyttää mitä tahansa vaatteita, joista pidät, ja luoda erilaisia versioita itsestäsi."

Tee itsestäsi esimerkiksi Superman.

Ota sisään vedettävä valo- ja varjomiekka ja muutu jediritariksi. Olkoon Voima kanssasi.

Ei vain, valokuvat jääveistoksia, pitelee kytkimiä pelikonsoleita, tonttujen korvat, muotinäytökset jne. ovat kaikki vain sanoja.

Näytä pyyhkäisemällä vasemmalle tai oikealle

Oman LoRA:n hienosäätö on nyt uusi leikkikalu monille kehittäjille.

Ei, koko verkko on tulvinut Flux+LoRA:lla.

Yksi henkilö voi muodostaa "kostajat"

Rundown AI:n perustaja Rowan Cheung käytti omia valokuviaan tietoina, käytti Fluxia LoRA-mallin kouluttamiseen ja liitti sen sitten Runwayn kanssa saadakseen sen liikkumaan.

Kuten alla näytetään, luodaan TED-kaiuttimen kaltainen kuva.

Videon tekemisen jälkeen kuvassa oleva henkilö todella heräsi henkiin ja näytti kaiuttimelta. Ainoa haittapuoli on, että oikeasta kädestä taakse on vain 2-3 sormea.

Toinen loi itsensä pelastaen maailman Supermanina.

Animaatiolla minusta tuli lopulta sankari Marvelissa.

Palaudu valokuvaksi muodikkaissa vaatteissa ja kävelyllä catwalkilla.

Yleisö molemmin puolin taputti innostuneesti, ja sitä pidettiin T-vaiheen catwalk-kokemuksena.

Lisäksi Rowan Cheung on myös luonut itsestään erilaisia tyylejä, jotka ovat sopusoinnussa kohtauksen kanssa ja joilla ei ole tottelemattomuuden tunnetta.

Näytä pyyhkäisemällä vasemmalle tai oikealle

Hän uskoo, että vaikka tekoälyn luoma grafiikka ei vieläkään voi korvata kokonaisia elokuvia/mainoksia, sillä on jo monia tärkeitä käyttötarkoituksia, erityisesti sisällöntuottajille.

Näistä tekoälykuvista valmistetaan esimerkiksi esikatseluita ja oheiskuvia uutisiin sekä lisämateriaalia (B-roll) lyhytelokuviin.

Luettuaan sen, nettimies Min Choi sanoi, että hän voisi muodostaa "Avengers".

Entinen Intelin teknologiajohtaja hienosääti myös omaa LoRA-malliaan A100:ssa, mikä maksoi hänelle 7 dollaria (noin 50 juania) 75 minuutissa.

Näytä pyyhkäisemällä vasemmalle tai oikealle

On myös kehittäjiä, jotka vain tekivät itsensä kauhuelokuviksi.

Näytä pyyhkäisemällä vasemmalle tai oikealle

Tekoälyn ja todellisuuden välillä ei voi tehdä eroa

Suosituin on "surrealismin" hienosäädetty versio - mielikuvituksen ja todellisuuden välistä rajaa on yhä vaikeampi erottaa.

Onko se oikea valokuva vai tekoälyn piirtämä henkilö?

Flux-Devin LoRA-harjoittelun jälkeen kohtauksen monimutkaisuuden ja realistisuuden suhteen on tapahtunut uskomatonta edistystä.

Mitä tahansa tyyliä voidaan hienosäätää

Lisäksi erilaisia hienosäätötyylejä on myös syntymässä.

pikselityyli

Kehittäjät käyttivät legendaarisen ZX Spectrumin tyyliä esimerkkinä pikselimäisen kuvasukupolven LoRA:n hienosäätämiseen.

Alla luodussa kuvassa on kuvia, kuten Dragon Ball Sun Wukong, Marvel Iron Man, Chuan Jianguo (näennäisesti) jne.

Näytä pyyhkäisemällä vasemmalle tai oikealle

animoituja doodleja

PS:n generatiivinen AI-tuotesuunnittelija Davis Brown hienosääti Fluxiin perustuvan half_illustration -mallin.

Sen tuottamat kuvat ovat osittain oikeiden valokuvien ja osittain animoitujen graffitien tyylisiä.

Ennen jokaista piirrosta sinun tarvitsee vain lisätä - TOK-tyyliin kehotteen alussa.

Kuvaa sitten haluttu tehoste yksityiskohtaisesti, ja elokuva voidaan valmistaa välittömästi.

Tulevaisuudessa minusta tuntuu, että minun ei tarvitse käyttää PS:ää, voin vain käyttää tekoälyä kuvien luomiseen.

kehotus: TOK-tyyliin, valokuvatoimituksellinen avantgardistinen dramaattinen toiminta-asento naisesta, jolla on lyhyet siniset hiukset 70-luvun pyöreät aurinkolasit, joka vetää silmälasit alas katsoen eteenpäin, Tokiossa suurilla marmorirakenteilla ja bonsaipuilla auringonlaskun aikaan eloisa kuvitettu takki. ympärillä kuvien kukkia, savua, liekkejä, jäätelöä, kimalteita, rock and rolla

kehote: TOK-tyylinen valokuvatoimituksellinen dramaattinen toiminta-asento, jossa henkilö lävistää silmät, tatuointeja kasvoilla, luova ämpärihattu, seisoo Tokiossa suurten marmorirakenteiden ja valkoisten purppurapuiden kanssa koripallokentällä, jossa on eloisa kuvitettu katu pukeudu pörröiseen vintage-takkiin, mustaan paitaan, taustalla tulivuori, jota ympäröivät kuvat savusta, liekeistä ja kukista, sumusta, huutomerkeistä, ulospäin ampuvista viivoista, kätyrihahmoista, perhosista

On muitakin graffitityylisiä kuvia.

Näytä pyyhkäisemällä vasemmalle tai oikealle

Jiugongge

Avoimen lähdekoodin tietojoukkoalusta LAION käyttää Flux-mallia mallin kouluttamiseen, joka pystyy luomaan 3x3 yhdeksän neliön ruudukkokuvia itsestään eri näkökulmista.

Tästä eteenpäin selfie riittää.

Näytä pyyhkäisemällä vasemmalle tai oikealle

eri ikäisiä

Flux+LoRA:n kautta voi nähdä ihmisen elämän ilmeen.

Näytä pyyhkäisemällä vasemmalle tai oikealle

Toinen esimerkki:

Näytä pyyhkäisemällä vasemmalle tai oikealle

Super pelattavuus

Tämän päivän päähenkilö, FLUX.1, käyttää uutta "flow matching" -tekniikkaa.

Vaikka aiemmat diffuusiomallit loivat kuvan poistamalla asteittain kohinaa satunnaisesta aloituspisteestä, virtaussovitus on suorempi ja oppii tarkat muutokset, joita tarvitaan kohinan muuttamiseksi todelliseksi kuvaksi.

Tämä ero lähestymistavassa johtaa ainutlaatuiseen estetiikkaan ja suuriin etuihin nopeuden ja hallinnan suhteen.

Teksti: Suurin osa niistä on saatavissa

Yksi tekstistä kuvaksi luomisen haasteista on tekstin tarkka muuntaminen visuaaliseksi esitykseksi. FLUX.1 hoitaa tämän melko hyvin, jopa monimutkaisissa kohtauksissa, kuten meemissä.

kehotus:

Tämä on hieno koirameemi vedenalainen Teksti: 'Ilmastonmuutos on hienoa' Tämä on "hieno koira" vedenalainen meemi. Teksti: "Ilmastonmuutos ei ole iso ongelma"

kehotus:

Kuuluisan näyttelijän meemi, joka tekee hauskoja kasvoja tekstillä "Kun unohdat rivit" omituisella fontilla Meemi kuuluisasta näyttelijästä, joka tekee hauskoja kasvoja tekstillä "Kun unohdat rivisi" omituisella fontilla

Sekä valo että rakenne ovat hyviä

FLUX.1 ymmärtää valoa, varjoa ja tekstuuria, jotta se tuottaa jatkuvasti korkealaatuisia kuvia.

kehotus:

Yksityiskohtainen kuva puutarhasta, jossa kukat on valmistettu herkästä lasista, joka heijastaa auringonvaloa kauniisti Yksityiskohtainen kuva puutarhasta, jossa kukat on valmistettu herkästä lasista, joka heijastaa auringonvaloa kauniisti

Tässä kuvassa painopiste ei ole vain lasin tekstuurissa, vaan myös siinä, miten valo taittuu ja siirtyy terälehtien läpi, mikä luo valovaikutelman.

kehotus:

Pöllöhöyhenet sulautuvat syksyn lehtiin tuulessa Pöllöhöyhenet sulautuvat syksyn lehtiin tuulessa

Taidetyyli: enemmän kuin jäljitelmä

FLUX.1 näyttää hallitsevan eri taiteellisten tyylien taustalla olevat periaatteet, mikä mahdollistaa luovien uudelleentulkintojen.

kehotus:

kuuluisan aaltomaalauksen akvarelli. kuuluisan aaltomaalauksen akvarelli

Tämä "akvarelli"-versio "The Great Wave off Kanagawa" ei ainoastaan tarkoita, että ikoniset aallot olivat osa mallin harjoitustietoja, vaan myös korostaa, kuinka "virtaus"-tekniikat likimääräiset maalin liikettä veden, paperin ja musteen läpi.

Sävellys: Tee kohtauksesta mielekäs

FLUX.1 loistaa monimutkaisten kohtausten rakentamisessa, kohteiden ja hahmojen sijoittamisessa realistisella ja visuaalisesti houkuttelevalla tavalla.

kehotus:

Realistinen kuva lumottu kirjastosta, jossa kirjat kelluvat ilmassa ja hyllyt on tehty ikivanhoista, kiertyneistä juurista Realistinen kuva lumottu kirjastosta, jossa kirjat kelluvat ilmassa ja hyllyt on tehty ikivanhoista, kiertyneistä juurista

"Flow": uusi visuaalinen kieli

FLUX.1:ssä käytetty virtaussovitustekniikka antaa kuvalle ainutlaatuisen orgaanisen liikkeen ja sujuvuuden tunteen, ikään kuin itse pikselit virtaisivat.

kehotus:

Koira, jolla on pyöriviä, Van Gogh -tyylisiä turkkikuvioita

Aina löytyy työkalu, joka voi auttaa sinua tekemään sen

Voimme tiivistää kuvan luomisprosessin seuraavasti: ota joitain syöttöpikseleitä, siirrä niitä hieman pois kohinasta kohti tekstinsyötön luomaa kuviota ja toista tätä prosessia, kunnes saavutat tietyn määrän vaiheita.

Hienosäätöprosessi ottaa jokaisen kuvan/huomautusparin tietojoukosta ja päivittää hieman sen sisäistä kartoitusta.

Voit opettaa mallille mitä tahansa tällä tavalla, kunhan se voidaan esittää kuva-otsikkoparilla: hahmo, asetus, väline, tyyli, genre.

Vasen: luotu käyttämällä alkuperäistä FLUX.1-mallia oikealla: luotu fofr/flux-bad-70s-food-mallilla käyttäen samoja vihjeitä ja siemeniä;

Koulutuksen aikana malli oppii yhdistämään nämä käsitteet tiettyihin tekstijonoihin. Sinun on lisättävä kehotteeseen tämä merkkijono aktivoidaksesi tämän yhteyden.

Haluat esimerkiksi hienosäätää "sarjakuvatyylisen supersankarin" mallin.

Ensinnäkin tietojoukoksi on kerättävä suuri määrä kuvia hahmoista, mukaan lukien mutta ei rajoittuen: erilaiset kohtaukset, puvut, valaistus ja ehkä jopa erilaiset taidetyylit

Valitse sitten lyhyt ja harvinainen sana tai ilmaus laukaiseksesi: jotain ainutlaatuista, joka ei ole ristiriidassa muiden käsitteiden tai säätöjen kanssa. Voit valita termejä, kuten "huono 70-luvun ruoka" tai "JELLOMOLD".

Harjoittelun jälkeen annat vain kehotteen, joka sisältää laukaisevan sanan, kuten "Scene of bad 1970-ruoasta juhlissa San Franciscossa", ja malli käyttää tiettyjä käsitteitä, jotka olet lisännyt hienosäädön aikana.

Se on niin yksinkertaista.

Periaatteen ymmärtämisen jälkeen voimme valita minkä tahansa työkalun mallin hienosäätämiseksi.

Vasen: luotu käyttämällä alkuperäistä FLUX.1-mallia oikealla: luotu fofr/flux-bad-70s-food-mallilla käyttäen samoja vihjeitä ja siemeniä;

Esimerkiksi Matt Wolfe-niminen kaveri nähtyään yllä olevan siistin sukupolven oli utelias ja kokeili sitä.

Tämän seurauksena hän kaatui...

Luotuja tekoälykuvia voidaan kutsua eroksi ostajan esityksen ja myyjän esityksen välillä.

Tämän hän loi--

Tämä on jonkun muun...

Nämä kaksi kuvaa ovat vertailukelpoisia. Ero on siinä, käytetäänkö LoRA-hienosäätöä vai ei.

Pikkuveli, joka oli innostunut, meni heti tekemään tutkimusta. Hän oli iloisesti yllättynyt huomatessaan, että LoRA-malli on hyvin pieni, vain 2-500 MB, ja se voidaan helposti yhdistää olemassa oleviin malleihin.

Vielä yllättävämpää on, että AI-malli voi parantaa kuvanlaatua, tuottaa ainutlaatuisen tyylin tai luoda erikoismerkkejä, kuten Mario tai Paavo, ilman lisälaskentatehoa tai kattavaa uudelleenkoulutusta.

Valitettavasti Glifissä, jota käytän helposti, LoRAa ei voi käyttää Fluxissa.

Hän havaitsi, että yksi tapa käyttää Fluxia on käyttää ComfyUI:ta.

Uskon, että tämä kuva on monelle tuttu.

Vaihtoehtoisesti voit käyttää alustoja, kuten Replicate, HuggingFace Spaces tai Fal AI.

Kokeiltuani sitä Fal-alustalla huomasin, että se maksaa 0,035 dollaria megapikseliltä. Siksi voit käyttää mallia 29 kertaa vain 1 dollarilla, mikä on melko kustannustehokasta.

Täältä ovat saatavilla FLUX.1 dev, Flux Realism LoRA, FLUX.1 pro jne.

Sanomatta sanaa pikkuveli valitsi Flux Realism LoRA:n.

Huolellisen virheenkorjauksen jälkeen asetin päättelyvaiheen kooksi 28 ja CFG:ksi 2.

Tuloksena olevat kuvat ovat upeita!

Jos siinä on puutteita, se on, että otsan ryppyjen valaistus on edelleen luonnotonta.

Seuraavaksi pikkuveli toi kuvan innoissaan Gen-3 Alphaan. Gen-3 Alpha loi videon antamansa kehotteen perusteella.

Tiettyä hetkeä lukuun ottamatta kädessäni oleva mikrofoni yhtäkkiä "kellui", eikä muussa videossa ollut mitään vikaa.

Kaveri yritti sitä uudelleen ja loi toisen videon.

Tällä kertaa mikrofoni vaikutti liian hiljaiselta, ikään kuin jäätyneeltä paikalleen.

Lisäksi pikkuveli liittyi trendiin muuttaa itseään kaikkialla Internetissä ja loi sarjan hauskoja kuvia.

Näytä pyyhkäisemällä vasemmalle tai oikealle

Lopuksi käytin Gen-3 Alphaa muuttaakseni sen videoksi, jolloin sain itseni ja Deadpoolin kävellä samassa elokuvan kohtauksessa.

Viitteet:

https://x.com/dr_cintas/status/1824480995317350401

https://x.com/Gorden_Sun/status/1824843049421484309

https://replicate.com/blog/fine-tune-flux

https://x.com/laion_ai/status/1824814210758459548

https://www.youtube.com/watch?v=_rjto4ix3rA

https://www.youtube.com/watch?v=rDu481JFwqM

uutiset

Fluxin hienosäätö on valloittanut koko internetin, ja ulkomaalaiset kaverit ovat muodostaneet joukkueen Marvel-sankareita!

Johdanto

Yhteystietoni