sama kuva voi näkyä eri kohtauksissa! suuri videomalli vidu toivottaa suuret update

sama kuva voi näkyä eri kohtauksissa! suuri videomalli vidu toivottaa suuren päivityksen tervetulleeksi

2024-09-15

shengshu technologyn ja tsinghuan yliopiston yhdessä kehittämä alkuperäinen videomalli vidu sai 11. syyskuuta suuren päivityksen "aiheen johdonmukaisuus" -toiminnolla. tämä toiminto voi saavuttaa minkä tahansa aiheen johdonmukaisen sukupolven vakaampi ja hallittavampi. tämä ominaisuus on tällä hetkellä ilmainen käyttäjille.

aiheviittaustoiminto käynnistetään verkossa roolien johdonmukaisuusongelman ratkaisemiseksi

tällä hetkellä, olipa kyseessä vincent-kuvatoiminto tai vincent-videotoiminto, laajalti kritisoitu ongelma on kuvan tai videon kuvan johdonmukaisuus. samat kehotussanat ja sama iso malli luodaan kahdesti, ja luotu sisältö on erilainen taiteellisissa teoksissa päähenkilön kuva on epäjohdonmukainen, ja siitä on tullut myös yksi suurimmista eroista tekoälyn luomien välillä. töitä ja ihmisiä.

tämän ongelman ratkaisemiseksi teollisuus on yrittänyt omaksua menetelmän "ensin tekoäly luo kuvia, sitten kuvat videoita" käyttämällä tekoälytyökaluja, kuten midjourney, luomaan jaettuja kuvia, pitäen ensin kohteen yhtenäisenä kuvassa. tasolla ja muuntaa sitten nämä kuvat videoiksi ja muokata niitä.

mutta ongelmana on, että tekoälyn piirtämisen johdonmukaisuus ei ole täydellinen ja se on usein ratkaistava toistuvilla muokkauksilla ja osittaisella uudelleenpiirtämisellä. vielä tärkeämpää on, että varsinainen videon tuotantoprosessi sisältää useita kohtauksia ja linssejä. kun tämä menetelmä käsittelee monikomponenttisia linssikohtauksia, piirtämisen työmäärä on valtava, mikä voi olla yli puolet koko prosessista ja myös lopullinen videosisältö. siitä puuttuu luovuus ja joustavuus, koska se luottaa liiallisesti jaettujen otosten kanssa.

shengshu technologyn järjestämässä median avoimien ovien päivätapahtumassa 11. syyskuuta shengshu technology esitteli "subject reference" -toiminnon. tämän toiminnon avulla käyttäjät voivat ladata kuvan mistä tahansa aiheesta, ja vidu voi lukita aiheen kuvan ja kuvata sitä sinun kauttasi voi vaihtaa kohtauksia mielivaltaisesti ja lähettää videon samasta aiheesta.

tämä toiminto ei rajoitu yhteen kohteeseen, vaan se on suunnattu "mihin tahansa aiheeseen", olipa kyseessä sitten henkilö, eläin, hyödyke, animaatiohahmo tai fiktiivinen aihe, se voi varmistaa sen johdonmukaisuuden ja ohjattavuuden videoiden luonnissa video merkittävä innovaatio sukupolven alalla. vidu on myös maailman ensimmäinen suuri videomalli, joka tukee tätä ominaisuutta.

esimerkiksi, kun käytät "aiheviittausta" hahmoille, olivatpa he sitten oikeita ihmisiä tai kuvitteellisia hahmoja, vidu voi pitää heidän kuvansa yhtenäisinä eri ympäristöissä ja eri linsseissä. tang jiayu, rushengshu technologyn puheenjohtaja ja toimitusjohtaja, osoitti tapahtumapaikalla, että tarjoamalla kuvan chen xiaoxun näyttelemästä lin daiyusta eri kohtauksissa ja erilaisissa asuissa, kohtaus "lin daiyu juo kahvia" voidaan nähdä " sama lin daiyu".

tang jiayu, shengshu technologyn puheenjohtaja ja toimitusjohtaja, esitteli "aiheviittaus"-toimintoa paikan päällä. kuva: beijing news shell finance -toimittaja luo yidan

tekoälyvideon luomisen johdonmukaisuus parantaa suuresti täydellisen tekoälyn tarinan aikakautta.

tämän toiminnon perusteella kiinan keskusradio- ja televisioaseman johtaja ja aigc-taiteilija shi yuxiang (senhai fluorescence) loi lyhytelokuvan "kesälahja" jakaessaan luovaa prosessia, hän sanoi, että verrattuna tushengin perusvideotoimintoon "subject reference" -toiminto päästää eroon staattisten kuvien rajoituksista, ja luodut kuvat ovat houkuttelevampia ja vapaampia, mikä parantaa huomattavasti luomisen koherenssia. samalla se auttoi häntä säästämään noin 70 % kuvien tuotannon työmäärästä ja paransi merkittävästi tehokkuutta, mikä antoi hänelle mahdollisuuden keskittyä enemmän tarinan sisällön hiomiseen kuvamateriaalin luomisen sijaan. samalla johdonmukaisuus helpottaa jälkimuokkausta.

shi yuxiang, kiinan keskusradio- ja televisioaseman johtaja ja aigc:n taiteilija, esitteli "aiheviittaus" -toiminnolla luotua animaatiota paikan päällä. voidaan nähdä, että animaation päähenkilön kuva pysyy vakaana. kuva: beijing news shell finance -toimittaja luo yidan

tang jiayu sanoi, että uuden "subject reference" -toiminnon käynnistäminen edustaa alkua täydelliselle tekoälyn kerronnalle, ja myös tekoälyvideon luominen siirtyy kohti tehokkaampaa ja joustavampaa vaihetta. teet sitten lyhyitä videoita, animaatioita tai mainoksia, kerronnan taiteessa täydellinen kerrontajärjestelmä on orgaaninen yhdistelmä elementtejä, kuten "yhtenäinen aihe, yhtenäinen kohtaus, yhtenäinen tyyli".

siksi, jotta videomalli saavuttaisi kerronnan eheyden, sen on oltava täysin hallittavissa näillä ydinelementeillä. "body reference" -ominaisuus on tärkeä askel kohti johdonmukaisuutta vidulle, mutta se on vasta alkua. tulevaisuudessa vidu jatkaa tutkimista, kuinka tarkasti ohjata monimutkaisia elementtejä, kuten useiden aiheiden välistä vuorovaikutusta, yhtenäistä tyyliä ja vaihtuvien kohtausten vakaata vaihtamista korkeamman tason kerronnan tarpeisiin.

hän sanoi, että pidemmän aikavälin näkökulmasta katsottuna, kun kokonaisvaltainen hallittavuus on saavutettu, videontuotantoteollisuus käy läpi häiritsevän muutoksen. siihen mennessä hahmot, kohtaukset, tyylit ja jopa elementit, kuten linssin käyttö, valo- ja varjotehosteet, muunnetaan joustavasti säädettäviksi parametreiksi. käyttäjien tarvitsee vain liikuttaa sormiaan ja säätää parametreja saadakseen kuvateoksen valmiiksi, ja jokaisen teoksen takana on käyttäjän ainutlaatuinen tekoälyyn perustuva maailmankuva ja itseilmaisu.

beijing news shell finance -toimittaja luo yidan toimittaja wang jinyu oikoluku yang li

raportti/palaute

uutiset

sama kuva voi näkyä eri kohtauksissa! suuri videomalli vidu toivottaa suuren päivityksen tervetulleeksi

johdanto

yhteystietoni