gambar yang sama dapat muncul dalam pemandangan berbeda! model video besar vidu menyambut update

gambar yang sama dapat muncul dalam pemandangan berbeda! model video besar vidu menyambut pembaruan besar

2024-09-15

pada tanggal 11 september, vidu, model video asli yang dikembangkan sendiri oleh shengshu technology dan universitas tsinghua, menerima pembaruan besar dengan fungsi "konsistensi subjek". fungsi ini dapat mencapai pembuatan subjek apa pun secara konsisten, menjadikan video tersebut generasinya lebih stabil dan terkendali. fitur ini saat ini terbuka untuk pengguna secara gratis.

fungsi referensi subjek diluncurkan secara online untuk memecahkan masalah konsistensi peran

saat ini, baik fungsi gambar vincent maupun fungsi video vincent, masalah yang banyak dikritik adalah konsistensi subjek gambar dalam gambar atau video. kata-kata cepat yang sama dan model besar yang sama dihasilkan dua kali, dan konten yang dihasilkan berbeda. dalam karya seni, hal ini akan menyebabkan citra protagonis menjadi tidak konsisten, dan ini juga menjadi salah satu perbedaan terbesar antara yang dihasilkan ai. karya dan manusia adalah satu.

untuk mengatasi masalah ini, industri telah mencoba mengadopsi metode "pertama ai menghasilkan gambar, kemudian gambar menghasilkan video", menggunakan alat menggambar ai seperti midjourney untuk menghasilkan gambar split-shot, pertama-tama menjaga subjek tetap konsisten pada gambar. level, lalu mengonversi gambar-gambar ini menjadi klip dan mengeditnya.

namun masalahnya adalah konsistensi gambar ai tidak sempurna dan seringkali perlu diselesaikan melalui modifikasi berulang dan menggambar ulang sebagian. lebih penting lagi, proses produksi video sebenarnya melibatkan banyak adegan dan lensa. ketika metode ini menangani adegan lensa multi-komponen, beban kerja menggambarnya sangat besar, yang dapat mencakup lebih dari setengah keseluruhan proses, dan konten video akhir juga. kurang kreativitas dan fleksibilitas karena terlalu bergantung pada pengambilan gambar terpisah.

pada acara hari terbuka media yang diadakan oleh shengshu technology pada tanggal 11 september, teknologi shengshu mendemonstrasikan fungsi "referensi subjek". fungsi ini memungkinkan pengguna mengunggah gambar subjek apa pun, dan vidu dapat mengunci gambar subjek dan mendeskripsikannya melalui anda dapat berpindah adegan secara sewenang-wenang dan mengeluarkan video dengan subjek yang sama.

fungsi ini tidak terbatas pada satu objek, tetapi berorientasi pada "subjek apa pun". baik itu orang, hewan, komoditas, karakter animasi, atau subjek fiksi, fungsi ini dapat memastikan konsistensi dan pengendaliannya dalam pembuatan video video sebuah inovasi besar di bidang pembangkitan. vidu juga merupakan model video besar pertama di dunia yang mendukung kemampuan ini.

misalnya, saat menggunakan "referensi subjek" untuk karakter, apakah itu orang nyata atau karakter fiksi, vidu dapat menjaga konsistensi gambarnya di lingkungan berbeda dan di bawah lensa berbeda. tang jiayu, ketua dan ceo rushengshu technology, menunjukkan dalam adegan tersebut bahwa dengan memberikan gambaran lin daiyu yang diperankan oleh chen xiaoxu, dalam adegan berbeda dan pakaian berbeda, adegan "lin daiyu minum kopi" dapat dilihat sebagai " sama lin daiyu".

tang jiayu, ketua dan ceo shengshu technology, mendemonstrasikan fungsi "referensi subjek" di lokasi. foto oleh reporter beijing news shell finance, luo yidan

koherensi pembuatan video ai akan sangat meningkatkan era narasi ai yang lengkap.

berdasarkan fungsi ini, direktur stasiun radio dan televisi pusat china dan artis aigc shi yuxiang (senhai fluorescence) membuat film pendek animasi "summer gift". saat berbagi proses kreatif, dia mengatakan bahwa dibandingkan dengan fungsi dasar video tusheng, " the fungsi "referensi subjek" menghilangkan batasan gambar statis, dan gambar yang dihasilkan lebih menarik dan bebas, sehingga sangat meningkatkan koherensi penciptaan. pada saat yang sama, hal ini membantunya menghemat sekitar 70% beban kerja produksi gambar dan meningkatkan efisiensi secara signifikan, memungkinkan dia untuk lebih fokus menyempurnakan konten cerita daripada menghasilkan materi gambar. pada saat yang sama, konsistensi membuat pasca-editing lebih mudah.

shi yuxiang, direktur stasiun radio dan televisi pusat china dan artis aigc, mendemonstrasikan animasi yang dibuat melalui fungsi "referensi subjek" di situs. terlihat bahwa gambar protagonis dalam animasi tetap stabil. foto oleh reporter beijing news shell finance, luo yidan

tang jiayu mengatakan bahwa peluncuran fungsi baru "referensi subjek" mewakili awal dari narasi ai yang lengkap, dan pembuatan video ai juga akan bergerak menuju tahap yang lebih efisien dan fleksibel. baik anda membuat video pendek, animasi, atau iklan, dalam seni narasi, sistem narasi yang lengkap adalah kombinasi organik dari elemen-elemen seperti "subjek yang konsisten, adegan yang konsisten, gaya yang konsisten".

oleh karena itu, agar model video dapat mencapai integritas narasi, model tersebut harus dapat dikontrol sepenuhnya pada elemen inti tersebut. fitur "referensi tubuh" merupakan langkah penting menuju konsistensi bagi vidu, namun ini hanyalah permulaan. di masa depan, vidu akan terus mengeksplorasi cara mengontrol elemen kompleks secara akurat seperti interaksi multi-subjek, gaya terpadu, dan pergantian adegan yang stabil untuk memenuhi kebutuhan narasi tingkat tinggi.

ia mengatakan bahwa dari perspektif jangka panjang, setelah pengendalian yang komprehensif tercapai, industri pembuatan video akan mengalami perubahan yang disruptif. pada saat itu, karakter, pemandangan, gaya, dan bahkan elemen seperti penggunaan lensa, efek cahaya dan bayangan, akan diubah menjadi parameter yang dapat disesuaikan secara fleksibel. pengguna hanya perlu menggerakkan jari dan menyesuaikan parameter untuk menyelesaikan pembuatan sebuah karya gambar, dan di balik setiap karya akan terdapat pandangan dunia dan ekspresi diri unik pengguna berdasarkan ai.

reporter beijing news shell finance luo yidan editor wang jinyu mengoreksi yang li

laporan/umpan balik

berita

gambar yang sama dapat muncul dalam pemandangan berbeda! model video besar vidu menyambut pembaruan besar

perkenalan

informasi kontak saya