2024 service trade fair｜shengshu technology ratkaisee epäjohdonmukaisuuden ongelman suurten videomallien luomisessa

2024-09-15

"kun syötämme ohjeen tekoälylle ja annamme sen luoda videon, itse asiassa keskeinen vetoomus on toivoa, että tekoäly auttaa meitä saamaan loppuun täydellisen tarinan. tämän tavoitteen saavuttamiseksi meidän on pidettävä ydinelementit yhtenäisinä ja hallittavissa, " sanoi äskettäin pidetyillä vuoden 2024 kiinan kansainvälisillä palvelukaupan messuilla (jäljempänä "palvelumessut"), shengshu technologyn puheenjohtaja ja toimitusjohtaja tang jiayu antoi ratkaisun: video-suuren mallin aiheviittausfunktio. vidu voi toteuttaa minkä tahansa aiheen hallinnan. tämän saavuttamiseksi teollisuus on kokeillut menetelmiä, kuten "ai luo ensin kuvat, sitten kuvat luovat videoita", mutta aiheviittaustoiminto ei vain vähennä työmäärää, vaan myös rikkoo videosisällön rajoituksia jaettujen kuvien avulla. tekniikan läpimurrot ovat antaneet enemmän tilaa mielikuvitukselle suurten videomallien kaupallistamisessa.

kun suurista kielimalleista tuli suosittuja, shenshu technology keskittyi multimodaaliseen raitaan ja lanseerasi wensheng video -ominaisuudet tammikuussa 2024. shengshu technologyn suunnitelman mukaan videoominaisuudet vaativat pidemmän keston ja suuremman johdonmukaisuuden kehittyäkseen, mutta soran debyytti on tuonut startupin suunnitelmat etuajassa.

vidu julkaistiin huhtikuun lopussa, ja se tukee 16 sekunnin teräväpiirtovideoiden luomista yhdellä napsautuksella. yksittäinen luotu video. heinäkuun lopussa vidu lanseerattiin virallisesti maailmanlaajuisesti, ja se avasi tuxing-videot, roolien yhdenmukaisuustoiminnot ja jopa 8 sekunnin videoiden luontiominaisuudet.

tällä kertaa tang jiayu keskittyi vidun uusimman toiminnon "subject reference" esittelyyn vuoden 2024 service trade fair -messuilla. ns. aiheviittauksen avulla käyttäjät voivat ladata kuvan mistä tahansa aiheesta, ja vidu voi lukita kohteen kuvan, vaihtaa mielivaltaisesti kohtauksia kuvaajien kautta ja tulostaa videon samalla aiheesta, jossa "mikä tahansa" on avainsana. on, olipa kyse sitten henkilöstä, olipa kyse eläimistä, hyödykkeistä, animaatiohahmoista tai fiktiivisistä aiheista, niiden johdonmukaisuus ja hallittavuus voidaan varmistaa videon luonnissa.

beijing business dailyn toimittaja sai tietää, että ennen tämän toiminnon käynnistämistä suuri videomalli ei ollut vailla ratkaisuja tämän tavoitteen saavuttamiseksi. ominaisuudet, kuten "tusheng video" ja "character consistency", voitiin myös saavuttaa.

esimerkkinä voidaan käyttää tekoälyn piirustustyökaluja, kuten midjourney, luodaksesi kuvat ensin tekoälystä ja sitten videoita, jotta voit luoda jaettuja kuvia kuvat videoleikkeiksi ja muokata ja syntetisoida niitä.

mutta ongelmana on, että ai-piirustuksen johdonmukaisuus ei ole täydellinen, ja se on usein ratkaistava toistuvilla muokkauksilla ja osittaisella uudelleenpiirtämisellä. vielä tärkeämpää on, että varsinainen videon tuotantoprosessi sisältää useita kohtauksia ja linssejä. kun tämä menetelmä käsittelee monikomponenttisia linssikohtauksia, piirtämisen työmäärä on valtava, mikä voi olla yli puolet koko prosessista ja myös lopullinen videosisältö. siitä puuttuu luovuus ja joustavuus, koska se luottaa liiallisesti jaettujen otosten kanssa.

vidun "aiheviittaus"-toiminto luo suoraan videomateriaalia "lähettämällä aiheen kuvan + syöttämällä kohtauksen kuvaajan". tämä menetelmä vähentää huomattavasti työmäärää ja rikkoo videosisällön rajoituksia jaettujen kuvien avulla, jolloin sisällöntuottajat voivat luoda monipuolista, joustavaa videosisältöä tekstikuvausten perusteella.

jakaessaan animaation lyhytelokuvan "summer gift" luovaa prosessia kiinan keskusradio- ja televisioaseman johtaja ja aigc-taiteilija shi yuxiang sanoi, että verrattuna peruskuvausvideotoimintoon "subject reference" -toiminto pääsee eroon. staattisten kuvien rajoituksista ja tuottaa kauniimpia kuvia. se on tarttuva ja ilmainen, mikä parantaa huomattavasti luomisen yhtenäisyyttä. samalla se auttoi häntä säästämään noin 70 % piirustustyöstään.

beijing business daily -toimittaja wei wei

raportti/palaute

uutiset

2024 service trade fair｜shengshu technology ratkaisee epäjohdonmukaisuuden ongelman suurten videomallien luomisessa

johdanto

yhteystietoni