uutiset

Anna AI-videon astua "universaalin GC:n" aikakauteen, tämä kiinalainen yritys on juuri tehnyt sen

2024-07-24

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Talo on peräisin Aofein temppelistä
Qubits |. Julkinen tili QbitAI

Alempi kynnys, korkeampi laatu, enemmän logiikkaa ja pidempi kesto.

Nämä muutamat "päivitykset" tekivät debyyttinsä juuri tänä aamunaKotimainen tekoälyvideo uusi tuote PixVerse V2, lämpö nousi hetkessä.

Ja sen alkuperä on silmiinpistävä:

Tämän kappaleen katsotuimmalta kotimaisesta startup-tähtiyrityksestäAishi tekniikkaPelkästään tämän vuoden ensimmäisellä puoliskolla yhtiö sai päätökseen kaksi rahoituskierrosta.

Katsotaanpa suoraan Pixverse V2:n tärkeimmät "uudet ideat":

Mallitekniikka, ottaa käyttöön DiT (Diffusion+Transformer) -arkkitehtuurin ja käyttää alkuperäistä tekniikkaa monin tavoin parantaakseen merkittävästi sukupolven vaikutusta.

Esimerkiksi spatiotemporaalisen huomiomekanismin käyttöönotolla voidaan saada aikaan suurempi ja luonnollisempi videotuotanto.

Katsotaanpa alla iloisesti surffaavaa pientä alpakkaa, mikä on erittäin sopivaa, sillä LIama 3.1 julkaistiin ja saavutti huipulle tänään.



Videon määrä ja laatu, tukee jopa 5 peräkkäisen videosisällön luomista yhdellä napsautuksella.

Ja pääkuvan, kuvan tyylin ja kohtauselementtien johdonmukaisuus säilyy automaattisesti leikkeiden välillä.



Lisäksi virallinen käyttöönotto Aishi totesi myös, että uusi tuotePikasanakynnystä on leikattu jälleen voimakkaasti

Riippumatta siitä, oletko oppinut pikasanatekniikan vai et, kunhan ilmaiset kuvavaatimukset selkeästi ja ytimekkäästi, voit toteuttaa sen helposti.jaSama pätee Kiinan kontekstiin

Lisäksi useiden samalla kertaa luotujen videoiden tyyli, aihe ja kohtaus ovat yhdenmukaisia.

Tee nyt lyhyt videoSinun ei vain tarvitse ottaa kuvia itse, sinun ei tarvitse enää edes leikata niitä itse.

Luo se yhdellä napsautuksella ja lataa se suoraan eri alustoille jakamista varten, hanhityttö!



Sekä laatu että määrä on taattu, ja kynnys on yhä matalampi.

Tekoälyvideon luominen on ollut osallisena PixVersen, Runwayn ja Luman kaltaisten yritysten hämmennyksissä.Jokainen voi nauttia siitäaikakausi.

Luo jopa 5 videota jatkuvan luovuuden mahdollistamiseksi

Mutta odota!

Emme koskaan helposti sokaise eri yritysten julkaisemat demot.

Joten saatuaan tietää, että PixVerse V2 käynnistettiin tänä aamuna, Qubits käynnistettiin välittömästiIhmisen lihakoe.

Siirry PixVersen viralliselle verkkosivustolle ja siirry suoraan PixVerse V2:een vasemmassa valikkorivissä.

tällä hetkellä seTukee kahden sukupolven teksti-/kuva- ja videotilaa, todellisessa käytössä voit valita toisen kahdesta tai voit käyttää molempia yhdessä.

Tekstinsyöttökehotelaatikko, kuvia voi ladata klikkaamalla alla olevan kuvan keltaista laatikkoa.



Syöttöruudun oikeassa alakulmassa, harmaan laatikon valintaosassa, on myös5s/8s vaihtoehdot, voit valita luodun yksittäisen videoleikkeen pituuden omien tarpeidesi mukaan.

Vihreällä kehyksellä valittu kohtaus viittaa tiettyyn videoleikkeeseen, joka on luotava.

Itse asiassa, kuten virallisessa esittelyssä sanotaan, jopa 5 videota voidaan nyt lisätä luotavaksi, nimittäin Scene1-5.



Kaikkien kohtausleikkeiden kuvatyyli noudattaa kohtausta 1, vaikka muut myöhemmät kohtaukset lataavat viitekuvia, PixVerse viittaa Scene 1 -kuvatyyliin uudelleen piirrettäessä.

Lyhyesti sanottuna yritin parhaani pitääkseni viiden videon tyylin yhtenäisenä.

Lisäksi kunkin kohtauksen kehotussanat/kehotekuvat voidaan syöttää yksitellen.

Kun olet valmis, voit siirtyä sukupolven tilaan napsauttamalla tähtipainiketta syöttöruudun oikeassa alakulmassa.

Kokemukseni jälkeen huomasin, että riippumatta siitä, kuinka monta kohtausta täytyy luoda, jokainen sukupolvi maksaa 50 krediittiä (PixVerse V2:n laskentatehovaluutta).

Kokemuksen aikana panostuksesta kiinniYksinkertaisin mahdollinen kehotePeriaatteessa syöttämämme viisi kehotussanaa ovat seuraavat:

  1. Varhain aamulla pieni valkoinen kani pukeutui sängylle
  2. Pieni valkoinen kani käveli matkalla töihin ja ohitti puutarhan.
  3. Pieni valkoinen kani pitää kädessään kuppia höyryävää kahvia
  4. Pieni valkoinen kani pitää kahvia kädessään ja odottaa jonossa hissiä
  5. Resignoitunut pieni valkoinen kani hyppäsi ylös ja alas tiellä

Vaikka sukupolven jälkeen voit käyttää vaihtoehtoja hienosäätääksesi jokaista videota yksitellen (säädä kohdetta, kohtausta, toimintaa ja kameran liikettä), emme puuttuneet asiaan vaan keskittyimme alkuperäiseen makuun.



Syntyneet tulokset ovat seuraavat:

△ Ulkonäkö ja tuntuma huomioon ottaen tämän videon toistonopeus on vain 2,5-kertainen.

5 klipsiä on liitetty yhteen.Voit ladata täysversion suoraan,erittäin kätevä.

Se on vähän hassua Videolla Pia, pieni valkoinen kani, joka erosi, riisui työvaatteet riisumatta minkäänlaista luokan tunnetta.

Aloitettuani ja pelattuani tämän vaiheen olen kaltaiseni työntekijä, joka on tarkka budjettini suhteen, ja olen tehnyt upean löydön, ja minun on jaettava se kaikkien kanssa:

Jos haluat luoda vain yhden videoleikkeen kerrallaan, säädä suoraan PixVerse V2:n asetuksia ja poista se vain kohtauksesta 1, niin se on ok - me kutsumme sitä menetelmäksi 1.

Mutta on toinenkin tapa (Menetelmä 2) siirtyä toiseen PixVerse V2 -moodiin toisen sisäänkäynnin kautta.

Toimistossa kysyttyäsi, jos haluat luoda yhden videoleikkeen, kaikki pitävät jälkimmäisestä menetelmästä.

Miksi?

Ensinnäkin menetelmä 2 voi tehdä enemmän säätöjä parametrien, kuten videon mittasuhteen ja videon tyylin, perusteella Mitä enemmän tietoja haluat antaa, sitä todennäköisemmin malli ymmärtää sinua ja luodut videokuvat ovat todennäköisemmin mukana. linjassa sen kanssa, mitä haluat.

Toisaalta, abacus rätisi ja laski, menetelmä 1 kuluttaa 50 krediittiä yhdelle sukupolvelle, onko kyseessä 1 fragmentti tai 5 fragmenttia, tämä vähennetään, mutta menetelmä 2 maksaa vain 30 krediittiä yhdelle sukupolvelle.

Säästä rahaa, ystävät!



Ota nopeasti mieleesi pieni muistikirja ja kirjoita muistiin menetelmän 2 toimintaprosessi——

Napsauta vasemmanpuoleisesta valikkopalkista Text to Video ja valitse sitten Malli-kohdasta "PixVerse V2".

voidaan suorittaaVincent video.



Ja lisäämällä sanoihin, kuten "Anime" ja "Realistinen" kehotteen sanoihin, luotu sisältö voidaan muuttaa tyylillä.

Koko pointti on vaikea, sillä syntyy kohtauksia, joita ei ole todellisessa maailmassa. Kirjoita kehotussana:

Marshmallow Giant vaeltelee värikkään vaahtokarkkimetsän läpi.

Luo tuloksia:



Okei, okei, uskomatonta, en koskaan uskonut, että voisin todella saada niin abstraktin kuvauksen kuin "Marshmallow Giant"!

Sokea arvaus johtuu siitä, että PixVerse V2:n takana olevaa semanttista ymmärrystä on optimoitu merkittävästi.

Samanlaisia ​​menetelmiä voidaan myös kokeaTusheng-videotoiminto

Napsauta Image to Video -painiketta vasemmalla valikkopalkissa ja valitse "PixVerse V2" kohdassa "Model".



Pieni sääli, ettei aiemmin mainittua liikesivellintä voi käyttää PixVersen Tuxing-videoissa.

On huomattava, että Tusheng Video ei voi tällä hetkellä käyttää "maalaa ja siirrä" -liikesivellintä (tämä on uusi AI-videotoiminto, jonka Aishi lanseerasi viime kuussa).

Qubit kysyi PixVerse V2 -tiimiltä,Liikeharja on pian saatavilla myös V2-versiossa.

Runwayn ja PixVersen liikesiveltimiä on kehuttu aiemminkin, koska ne korvaavat nopean sanakuvauksen puutetta ja parantavat kuvan liikkeen ohjattavuutta.

Jos PixVerse V2 käynnistää tämän toiminnon, sen pelaaminen on mielestäni kaikille nautinnollisempaa ja hahmojen/objektien liikkeet videossa ovat paremmin fysiikan lakien mukaisia.



Koska ihmisten tai eläinten "katukäytävä" on aina ollut pakollinen vaihtoehto tekoälyvideoille esitelläkseen lihaksiaan (vaikka emme tiedä miksi), tällä kertaa kokeessamme PixVerse V2:n graafisen videotoiminnon meni suoraan intensiteettiin ja teki aAstronautin parkour kadulla

Anna kehotekuva:



Luo tuloksia:



Tämä tehtävä on vähän pinoamista, joka perustuu kuviin luomaan epärealistisen sisällön dynamiikkaa.

Enemmän tarvitaan, että mallin takana on vahvavisuaalinen ymmärtäminen

PixVerse V2 voi helposti voittaa tehosteen näkökulmasta, olipa kyseessä jatkuva videon luominen, tekstipohjainen video tai kuvapohjainen video.

Lopuksi haluan mainita, että riippumatta siitä, oletko Wensheng tai Tusheng, jokainen luotu 5s/8s-video maksaa 30 krediittiä.

Sukupolvinopeus on kuitenkin suhteellisen nopea ja laatu vakaa ja taattu. Itse asiassa 30 krediittien käyttäminen on mielestäni varsin kannattavaa.

DiT-pohjamuotin päivitystuki

Tekoälyvideoraidalla, joka tunnetaan tänä vuonna rullien kuninkaana, Ai Shi teki yhtäkkiä toisenlaisen liikkeen.

Kun kaikki Sora-pelaajat ympäri maailmaa pidentävät kestoa, parantavat kuvanlaatua ja vähentävät vaikeutta,Aishi leikkaa kynnystä villisti

Sen lisäksi, että kehotussanan ei tarvitse olla liian ammattimainen, se voi myös luoda (jopa) 5 videota kerrallaan, kukin 8 sekuntia.

Tyylin, aiheen ja kohtauksen johdonmukaisuus näiden 1–5 videoleikkeen välillä voidaan taata, ja kunkin videoleikkeen kehotussanojen välisen logiikan perusteella syntetisoidaan lopulta pitkä, noin 40 sekunnin video.

Sellainen, jolla on johdonmukainen juoni ja johdonmukainen sisältö.

Siinä sanotaan olevan "sujuvat liikkeet ja rikkaat yksityiskohdat", ja kuvanlaatu saavuttaa 1080p.



Toisin sanoen käyttäjät voivat miettiä mitä haluavat, kirjoittaa kehotussanoja ja odottaa videon luomista kestoltaan 10 sekuntia - 40 sekuntia.

Se ei voi vain toteuttaa "ajatusten siirtämistä videoon", ja leikkeet ovat yhtenäisiä ja luonnollisia, sillä se voi myös säästää aikaa ja vaivaa videon tuotantoprosessissa, ja luova tehokkuus on parantunut huomattavasti.

PixVerse V2:n julkaisun jälkeen jotkut verkkoyhteisöt alkoivat nopeasti käyttää sitä.

PixVerse V2:n ilmestyminen mahdollistaa sen, että monet ihmiset, jotka eivät ole koskaan käyttäneet tekoälyvideotyökaluja tai edes tehneet videoita, voivat käyttää sitä saavuttaakseen läpimurron luotujen teosten määrässä 0-5 ja teosten lukumäärässä 0-1.

AIGC-työkalujen käyttöoikeus on jälleen delegoitu

AIGC-työkalun käyttäjien laajentaminen piirin ulkopuolelle (ei enää rajoitu ammattikäyttäjiin) saavutetaan iteratiivisilla teknologiapäivityksillä.

PixVerse V2:n takana on Aishi TechnologyIteratiivisia päivityksiä itse kehitettyyn malliin, joka on DiT-arkkitehtuurin taustalla

Tämä on myös PixVersen ydintekniikka.

Tarkastellakseen aikaisempaa tilannetta Qubit kampasi läpi Aishi/Wang Changhun ulkoisen puheen julkista tietoa ja totesi, että yritys omaksui alussa Diffusion+Unet -arkkitehtuurin teknisen reitin, joka oli myös valtavirran AIGC-lähestymistapa ennen Soran tuloa. , mutta kun se meni pidemmälle, Unet on hieman riittämätön parametrien laajennuksella ja monimutkaisilla käskyillä.

Siksi Aishi alkoi kokeilla DiT-arkkitehtuuria hyvin varhain (ennen kuin Sora ilmestyi) ja noudatti skaalauslakia parantaakseen mallin suorituskykyä.

Auto kääntyi hyvin aikaisin, joten Soran ulkonäkö ei saanut Aishia yllättäen. Päinvastoin, koska se varmisti, että reitti oli oikea, Aishin nopeus kasvoi merkittävästi tänä vuonna.



Joten, mitkä ovat päivitykset PixVerse V2:n DiT-perusmalliin tällä kertaa?

Ensimmäinen kohta on diffuusio-avaruus-aika-mallinnus.

Aishi on luonut ainutlaatuisen spatiotemporaalisen huomion mallinnusmekanismin, joka on "järkevämpi" ja ylittää spatiotemporaalisen erottelun ja fullseq-arkkitehtuurin.

Tällä mekanismilla on parempi käsitys ajasta ja paikasta, ja se pystyy käsittelemään monimutkaisia ​​kohtauksia paremmin.

Toinen asia on tekstin ymmärtäminen.

PixVerse V2:n kykyä ymmärtää kehotteita on parannettu merkittävästi. Kulissien takana on multimodaalisen mallin käyttö, jolla voidaan paremmin kohdistaa teksti- ja videoinformaatio niin, että syntyneet tulokset ovat tekijän suunnitelmia.

kolmas, saavuttaakseen korkeamman laskentatehokkuuden, PixVerse V2 painottaa häviön perinteisen Flow-mallin perusteella, jotta malli voi konvergoida nopeammin ja paremmin.

Toinen kohtaPixVerse V2:n takana oleva T&K-tiimi on suunnitellut paremman 3D-VAE-mallin.

Spatiotemporaalinen huomiomekanismi otetaan käyttöön videon pakkauslaadun parantamiseksi. Jatkuvan oppimisen tekniikkaa käytetään myös videon pakkaus- ja rekonstruointitulosten parantamiseen.



"Yksinkertainen ja mielenkiintoinen" UGC-taipumus tekoälyn siunauksella

AIGC on yksinkertaisesti tämän vuoden tunnetuin aihe.

muttaMahdollisuus soveltaa AIGC:tä on itse asiassa vielä muutaman ihmisen käsissä., kuten ohjelmoijat, suunnittelijat ja muut ammattilaiset.

AIGC ei ole vielä astunut universaalin "GC:n" vaiheeseen, kuten UGC.

Se, mitä Aishi Technology on tehnyt tällaisessa tilanteessa perustamisensa jälkeen yli vuosi sitten, voidaan tiivistää seuraavasti:

  • Paranna jatkuvasti tekoälyteknologian ominaisuuksia
  • Laajenna verbin "G (Generated)" aiheryhmää
  • Kiinnitä huomiota laatutasoon "C (sisältö)".

Tämä ei heijastu vain PixVerse V2:ssa, vaan myös samaan tapaan jatkossa ---

Katsauksessa todettiin, että PixVerse V2:n julkaisu on itse asiassa kolmas kerta tänä vuonna, kun yritys on tehnyt muutoksia tekoälyvideotoimintoihin ja -tuotteisiin.

Tämän vuoden tammikuussa Aishi julkaisi virallisesti PixVersen verkkoversion, Vincentin videotuotteen, ja kuukausittaisten käyntien määrä ylitti nopeasti miljoonan.

Huhtikuussa julkaistiin itse kehitetyn videomallin pohjalta kehitetty C2V (Character to Video, role consistenss) -toiminto, jota voi käyttää nettisivuilla.

Poimimalla hahmon ominaisuuksia tarkasti ja upottamalla ne syvälle videon sukupolvimalliin, PixVerse voi lukita hahmoja ja aluksi ratkaista johdonmukaisuusongelman tekoälyvideon luomisessa.

Kesäkuussa julkaistiin Magic Brush -liikesivellin. Käytä sitä videoruudun tahraan ja ohjaa tarkasti videoelementtien liikettä ja suuntaa.

Tämä on myös ensimmäinen tekoälyvideon sukupolviyritys, joka on julkaissut samanlaisia ​​toimintoja Runwayn jälkeen.



Kolme kertaa puolen vuoden aikana ei ole harvinaista, mutta kahdella ensimmäisellä kerralla toiminta vaikutti hieman hillityltä.

Tämä voi liittyä start-up-yrityksen haluun keskittyä töidensä hiomiseen, tai se voi liittyä Wang Changhun ja muiden johtajien hillittyyn luonteeseen, emme tiedä.

Mutta ilmiö on se, että monet ihmiset tietävät, että Aishi Technology on kotimaisen tekoälyvideoraidan johtava pää, mutta he eivät välttämättä tiedä, miksi se on pää ja onko se helppokäyttöinen.

Nyt kun PixVerses V2 ilmestyy, niin nuoret kuin vanhat, ammattilaiset ja ei-ammattilaiset voivat kaikki käyttää sitä henkilökohtaisesti ja kokevat sen todella tehokkaaksi – tämä on yksi syistä, miksi PixVerse V2:sta tuli välitön hitti sen julkaisun jälkeen.

Ja kun tarkastellaan eri toimintoja, ei ole vaikeaa havaita, että nämä useat tuoteominaisuuksien päivitykset ovat kaikki keskittyneet yhteen päärunkoon:Tee tekoälyvideoiden luomisesta käytännöllisempää ja yksinkertaisempaa

Samalla on nähtävissä, että aiemmat tuoteominaisuudet painottuivat ammattilaisten käyttökokemukseen.

Tämä vahvistaa myös Wang Changhun edellistä puhetta.

Tekoälyn natiivivideon toivotaan integroituvan sisältöteollisuuden tuotanto- ja kulutuslinkkeihin.

Mutta PixVerse V2 on erilainen. Tämä tuotesukupolvi keskittyy siihen, kuinka tehdä tekoälyvideoiden luomisesta tavallisten ihmisten ulottuville.

Loppujen lopuksi, vaikka Magic Brush on helppokäyttöinen ja hyödyllinen, se edellyttää silti, että käyttäjä on luonut tekoälyvideon.

Videokehotteet ovat vaikeampia kuin tekstinluonti- ja tekstinluontikehotteet, ja ne ovat usein kompastuskivi tavallisille ihmisille tekoälyvideon luomisessa.

Se, mitä PixVerse V2 kaappaa, on upeaa——

Pyrimme alentamaan tekoälyvideon luomisen kustannuksia mahdollisimman paljon eri näkökohdista, kuten kehotteiden vaikeuden vähentämisestä, valinnaisesta hienosäädöstä, luodun sisällön rajojen laajentamisesta ja editoinnin poistamisesta myöhemmissä vaiheissa.

Mikä on tulos?

kaikki,Kaikilla on mahdollisuus ja kaikki voivat osallistua, voi muuttaa villin mielikuvituksesi näkyviksi videoteoksiksi.

Koska osallistumisen tunne on vahva, useammat ihmiset ja jopa kaikki voivat vapauttaa luovuutensa ja osallistua tekoälyvideon luomiseen.

Pitkässä juoksussa,Vähitellen muodostuu AI-aikakauden UGC-ekosysteemi, joka on yksinkertaisempi ja mielenkiintoisempi kuin UGC.

Olen nähnyt mielenkiintoisen meemikuvan ennenkin, ja uskon, että monet ystävät ovat myös nähneet sen:



"PixVerse on kunnia olla eturivissä, sijoitettuna yhteen tuon ajan parhaiden videosukupolven tuotteiden, kuten Runwayn, Pikan ja SVD:n kanssa. Se on myös ainoa kiinalainen yritys tässä kuvassa, jonka Wang Changhu itse piti aikoinaan." Vitsailee: "Mutta toisaalta meillä on jättiläinen edessämme ja meidän on vielä ylitettävä se."

On kiistatonta, että tekoälyvideo on multimodaalisen kappaleen painopiste AI 2.0 -aikakaudella, varsinkin sen jälkeen, kun Sora teki valtavia aaltoja.

Kaikkien jättiläisten, suurten valmistajien ja aloittavien yritysten täysi innostus kuvaa yhtä ongelmaa.

Tekoälyvideo laajentaa ja stimuloi markkinoiden potentiaalia, ja tekoälyn multimodaalisten suurten mallien vetämä innovaatio kasvaa.

Aishi voi esiintyä tässä meemikuvassa, ja se on ainoa kiinalainen yritys kuvassa.

Toisaalta Aishi Technologyn malliteknologia ja itse kehitettyjen pohjamuottien päällä kasvatetut tuotevaikutukset ovat todellakin tunnustettuja.

toisaalta,Riippumatta siitä, millä tekniikan aallolla ne ovat, startupit saavat maailmanlaajuista huomiota.

Etsintäsodan aikana Google käytti innovatiivista www-sivujen sijoitusalgoritmia PageRank varastaakseen Yahoon käyttäjiä ja jopa tavoitti myöhästyneet ja nousi hakumarkkinoiden johtajaksi tähän päivään asti.

Suuren kielimallin alkuaikoina, vaikka Transformer tuli Googlelta, GPT oli OpenAI:n aloite, pieni tutkimuslaitos (silloin), ja se johti vähitellen nykyiseen GPT-4o:han, josta tuli etsinnän kohde.

Nykyään OpenAI:n tavoittelijoiden ja kilpailijoiden joukossa on Google.

Milloin tahansa, jopa suurten yritysten ja jättiläisten piirityksen edessä, on aina tarinoita startupeista, jotka purkavat kipinöitä, jotka sytyttävät alan ja loistavat tähdet.

Mitä Aishi Technology kirjoittaa tekniikalla ja tuotteilla, on tekoälyvideoraita, joka on startup-yrityksen oma tarina.