uutiset

tang jiayu, shengshu technologyn toimitusjohtaja: videoiden tuotanto on vielä alkuvaiheessa, ja teknisiä pullonkauloja on voitettava.

2024-09-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

00:04
"käyttämällä tekoälyä kertovien elokuvien tekemiseen, romuttujen elokuvien suhde voi olla 50:1, eli syntyy 50 kuvaa, joista vain yksi voi olla sopiva tämäntyyppiseen kerronnan luomiseen 11. syyskuuta pekingin shengshussa." technology co., ltd. (jäljempänä shengshu technology) piti median avoimien ovien päivän tapahtuman, elokuvan ja television luoja teki yllä olevan lausunnon jakaessaan.
suuren mallin sukupolven teknologian kehittyessä yhä useammat elokuva- ja tv-tekijät alkavat käyttää tekoälyteknologiaa luomuksissaan.
"tekoälyn luomat videot ovat hallitsemattomia, ja kun elementtejä on liikaa, useita hahmoja ja tilakohtauksia ei voida ymmärtää", sanoi vicky, tekoälyelokuvien ja television luoja. monet ai-elokuvan ja television luojat kotimaassa ja ulkomailla sanoivat, että varsinaisessa luomisprosessissa yleinen ydinongelma on riittämätön hallittavuus tai johdonmukaisuuden puute, varsinkin kun kyseessä ovat monimutkaiset kohtaukset ja interaktiiviset kohtaukset.
vaikka ai-videomalli toimii hyvin seuraavien ohjeiden mukaan, tulosten tulokset ovat edelleen epävarmoja, ja tyydyttävän kuvan luominen voi kestää useita yrityksiä. lisäksi tekoälyn luomassa mallissa on edelleen rajoituksia kameran liikkeen, valo- ja varjotehosteiden sekä yksityiskohtien käsittelyn suhteen, mikä vaikeuttaa täydellisen ja hienon ohjauksen saavuttamista.
shengshu technology julkaisi tekoälyn luoman videomallin virallisesti 30. heinäkuuta auttaakseen luojia parantamaan tehokkuutta, yhtiö on äskettäin päivittänyt videomallin vidu-toiminnon ja julkaissut "subject reference" -toiminnon johdonmukaisuusongelman ratkaisemiseksi se voi tuottaa johdonmukaisesti minkä tahansa kohteen, mikä tekee videoiden luonnista vakaampaa ja hallittavampaa.
"subject reference" -toiminnon avulla käyttäjät voivat ladata kuvan mistä tahansa aiheesta. vidu voi lukita kohteen kuvan, vaihtaa mielivaltaisesti kohtauksia kuvaajien kautta ja lähettää videon samasta aiheesta.
syyskuun 11. päivänä the paper technologyn (www.thepaper.cn) toimittaja kirjautui shengshu technologyn virallisen verkkosivuston vidu-alustalle kokeillakseen videoiden luomista. latasi kolmiulotteisen kuvan amerikkalaisesta elokuvatähdestä leonardo dicapriosta ja syötti avainsanoja, kuten "sininen taivas", "viinilasi" ja "paahtoleipä";
syötä sanat: "sininen taivas", "viinilasi", "paahtoleipä" jne.
vidulla luotu kuva on seuraava:
00:04
lataa 2d-kuvakaappaus japanilaisen animen "youth" sankarittaresta ja kirjoita avainsanat, kuten "juoksu", "myöhään", "aamu" jne.
vidulla luotu kuva on seuraava:
00:04
tang jiayu, yksi shengshu technologyn perustajista ja toimitusjohtaja, sanoi haastattelussa, että vidun "subject reference" -toiminto on tällä hetkellä maailman ensimmäinen teknologia, jolla on johdonmukaiset tuotantoominaisuudet. shengshu technologyn ydintehtävänä on rakentaa multimodaalisia suuria malleja ai-videoiden sukupolvi on vielä alkuvaiheessa, ja teknisiä pullonkauloja on vielä purettava tulevaisuudessa. hän uskoo, että tekoälyvideotekniikka ei aina ole pienen ryhmän työkalu. tämän vuoden loppuun mennessä ai-videoteknologian arvioidaan olevan yleisön suosiossa ja käyttäjien on helppo käyttää sitä.
shengshu technology perustettiin maaliskuussa 2023. ydintiimin jäsenet ovat tsinghuan yliopiston tekoälyn tutkimusinstituutista. päätutkija zhu jun on tsinghuan yliopiston perustaja ja toimitusjohtaja tang jiayu tsinghuan yliopiston kielenkäsittelylaboratorio ja ruilai intelligencen entinen työntekijä, tencent youtu labin vanhempi tuotepäällikkö.
paperin toimittaja yu yan ja harjoittelija wang chun
(tämä artikkeli on the paperista. jos haluat lisätietoja, lataa "the paper" -sovellus)
raportti/palaute