berita

pameran dagang jasa 2024|teknologi shengshu memecahkan masalah inkonsistensi dalam pembuatan model video besar

2024-09-15

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

“saat kita memasukkan instruksi ke ai dan membiarkannya menghasilkan video, sebenarnya daya tarik utamanya adalah berharap bahwa ai akan membantu kita menyelesaikan narasi yang lengkap. untuk mencapai tujuan ini, kita perlu menjaga elemen inti tetap bersatu dan terkendali. " kata pada pameran perdagangan jasa internasional china 2024 yang baru-baru ini diadakan (selanjutnya disebut sebagai "pameran perdagangan jasa"), tang jiayu, ketua dan ceo teknologi shengshu, memberikan solusi: fungsi referensi subjek model besar video vidu dapat mewujudkan kendali atas subjek apa pun. untuk mencapai hal ini, industri telah mencoba metode seperti "ai menghasilkan gambar terlebih dahulu, kemudian gambar menghasilkan video", tetapi fungsi referensi subjek tidak hanya mengurangi beban kerja, tetapi juga mendobrak batasan konten video dengan gambar split-shot. terobosan teknologi telah memberikan ruang imajinasi yang lebih besar dalam komersialisasi model video besar.

ketika model bahasa besar menjadi populer, teknologi shenshu menargetkan jalur multi-modal dan meluncurkan kemampuan wensheng video pada januari 2024. menurut rencana shengshu technology, kemampuan video memerlukan durasi yang lebih lama dan konsistensi yang lebih tinggi untuk dikembangkan, namun debut sora telah membuat rencana startup tersebut lebih cepat dari jadwal.

vidu dirilis pada akhir april, mendukung pembuatan video definisi tinggi berdurasi 16 detik dengan satu klik. pada bulan juni, vidu mendukung pembuatan video berdurasi 32 detik dengan satu klik, sekaligus menghasilkan efek suara dan merekonstruksi video 4d dari sebuah video. video yang dihasilkan tunggal. pada akhir juli lalu, vidu resmi diluncurkan secara global, membuka video tuxing, fungsi konsistensi peran, dan kemampuan pembuatan video hingga 8 detik.

kali ini, tang jiayu fokus pada fungsi terbaru vidu “referensi subjek” di pameran dagang jasa 2024. apa yang disebut referensi subjek memungkinkan pengguna untuk mengunggah gambar subjek apa pun, dan vidu dapat mengunci gambar subjek, secara sewenang-wenang mengganti adegan melalui deskriptor, dan mengeluarkan video dengan subjek yang sama, di mana "apa saja" adalah kata kuncinya, itu yaitu, apakah itu manusia, apakah itu hewan, komoditas, karakter animasi, atau subjek fiksi, konsistensi dan pengendaliannya dalam pembuatan video dapat dipastikan.

seorang reporter dari beijing business daily mengetahui bahwa sebelum fungsi ini diluncurkan, model video besar bukannya tanpa solusi untuk mencapai tujuan ini. kemampuan seperti "video tusheng" dan "konsistensi karakter" juga dapat dicapai.

mengambil metode pembuatan gambar pertama dari ai dan kemudian menghasilkan video dari gambar sebagai contoh, anda dapat menggunakan alat menggambar ai seperti midjourney untuk menghasilkan gambar split-shot. pertama, pertahankan konsistensi subjek pada tingkat gambar, lalu konversikan gambar menjadi klip video dan mengedit serta mensintesisnya.

namun masalahnya adalah konsistensi gambar ai tidak sempurna dan seringkali perlu diselesaikan melalui modifikasi berulang dan menggambar ulang sebagian. lebih penting lagi, proses produksi video sebenarnya melibatkan banyak adegan dan lensa. ketika metode ini menangani adegan lensa multi-komponen, beban kerja menggambarnya sangat besar, yang dapat mencakup lebih dari setengah keseluruhan proses, dan konten video akhir juga. kurang kreativitas dan fleksibilitas karena terlalu bergantung pada pengambilan gambar terpisah.

fungsi "referensi subjek" vidu secara langsung menghasilkan materi video dengan "mengunggah gambar subjek + memasukkan deskriptor adegan". metode ini sangat mengurangi beban kerja dan mendobrak batasan konten video dengan gambar split-shot, sehingga memungkinkan pembuat konten membuat konten video yang kaya dan fleksibel berdasarkan deskripsi teks.

saat berbagi proses kreatif film pendek animasi "summer gift", shi yuxiang, direktur stasiun radio dan televisi pusat china dan artis aigc, mengatakan bahwa dibandingkan dengan fungsi dasar pengambilan gambar video, fungsi "referensi subjek" menghilangkannya. dari batasan gambar statis dan menghasilkan gambar yang lebih indah. ini menular dan gratis, sangat meningkatkan koherensi penciptaan. pada saat yang sama, ini membantunya menghemat sekitar 70% beban kerja menggambarnya.

reporter harian bisnis beijing, wei wei

laporan/umpan balik