per risolvere il problema della coerenza del modello di generazione video, la versione cinese di "sora" vidu rilascia la possibilità di "bloccare il soggetto con un'immagine"

2024-09-11

l'11 settembre, shengshu technology ha tenuto un evento di porte aperte ai media e ha rilasciato la funzione "coerenza del soggetto", che può ottenere una generazione coerente di qualsiasi soggetto, rendendo la generazione di video più stabile e controllabile. resta inteso che questa funzione è attualmente aperta agli utenti gratuitamente.

in precedenza, alla fine di aprile, è stato rilasciato al mondo vidu, un modello video originale su larga scala sviluppato congiuntamente da shengshu technology e tsinghua university. è stato lanciato ufficialmente alla fine di luglio ed è completamente aperto all'uso.

tang jiayu, ceo di shengshu technology, ha detto ai giornalisti dei media, inclusi quelli del "daily economic news", durante l'open day che la funzione "riferimento all'oggetto" ha lo scopo di risolvere i limiti "incontrollabili" del modello video. attualmente, i modelli video presentano limitazioni quali continuità debole e output casuale. una continuità debole significa che la coerenza del soggetto, della scena, dello stile, ecc. non può essere garantita ogni volta che viene generato un video, soprattutto quando sono coinvolte interazioni complesse. output casuale significa che i risultati di output sono relativamente casuali e richiedono tentativi continui per essere generati. non è possibile ottenere un controllo fine e accurato di dettagli come il movimento dello specchio e gli effetti di luce.

fonte foto di tang jiayu, ceo di shengshu technology: foto del giornalista del daily li shaoting

in precedenza, l'industria aveva tentato di adottare il metodo "prima l'intelligenza artificiale genera immagini, poi le immagini generano video", utilizzando strumenti di disegno ai per generare immagini divise, mantenendo prima il soggetto coerente a livello di immagine e quindi convertendo le immagini in video. clip, modificandoli e sintetizzandoli.

con la funzione "riferimento soggetto", gli utenti possono caricare un'immagine di qualsiasi soggetto per bloccare l'immagine del soggetto, cambiare scena arbitrariamente tramite descrittori e produrre un video con lo stesso soggetto. questa funzione non è limitata ad un singolo oggetto, ma è aperta a "qualsiasi soggetto", inclusi personaggi, animali, merci, personaggi di animazione, soggetti di fantasia, ecc.

notizie economiche quotidiane

segnalazione/feedback

notizia

per risolvere il problema della coerenza del modello di generazione video, la versione cinese di "sora" vidu rilascia la possibilità di "bloccare il soggetto con un'immagine"

introduzione

le mie informazioni di contatto