новости

выставка услуг 2024 |технология shengshu решает проблему несогласованности при создании больших видеомоделей

2024-09-15

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

«когда мы вводим инструкцию в ии и позволяем ему генерировать видео, на самом деле, основной призыв состоит в том, чтобы надеяться, что ии поможет нам завершить полное повествование. чтобы достичь этой цели, нам необходимо сохранить основные элементы унифицированными и контролируемыми. «сказал: на недавно состоявшейся китайской международной ярмарке торговли услугами 2024 года (именуемой в дальнейшем «выставка услуг») тан цзяюй, председатель и генеральный директор shengshu technology, предложил решение: функцию предметной ссылки большой видеомодели. виду может реализовать контроль над любым предметом. чтобы добиться этого, в отрасли опробованы такие методы, как «ии сначала генерирует изображения, затем изображения генерируют видео», но функция предметной ссылки не только снижает рабочую нагрузку, но и снимает ограничения на видеоконтент посредством разделенных изображений. прорыв в технологии дал больше простора для фантазии при коммерциализации больших видеомоделей.

когда стали популярны большие языковые модели, компания shenshu technology сосредоточилась на мультимодальном подходе и в январе 2024 года запустила возможности wensheng video. согласно плану shengshu technology, развитие видеовозможностей требует большей продолжительности и большей последовательности, но дебют соры опередил планы стартапа.

vidu был выпущен в конце апреля и поддерживал создание 16-секундных видеороликов высокой четкости одним щелчком мыши. в июне он поддерживал создание 32-секундных видеороликов одним щелчком мыши, одновременно генерируя звуковые эффекты и реконструируя 4d-видео из видео. одно созданное видео. в конце июля vidu был официально запущен во всем мире, открыв видео tuxing, функции согласованности ролей и возможности создания видео продолжительностью до 8 секунд.

на этот раз тан цзяюй сосредоточился на последней функции виду «предметный справочник» на выставке услуг 2024 года. так называемая ссылка на предмет позволяет пользователям загружать изображение любого предмета, а виду может блокировать изображение предмета, произвольно переключать сцены с помощью дескрипторов и выводить видео с тем же предметом, где «любой» — ключевое слово, которое будь то человек, будь то животные, товары, анимационные персонажи или вымышленные предметы, можно обеспечить их последовательность и управляемость при создании видео.

репортер beijing business daily узнал, что до запуска этой функции в модели большого видео не было решений для достижения этой цели. также можно было реализовать такие возможности, как «tusheng video» и «последовательность символов».

взяв в качестве примера метод сначала создания изображений с помощью искусственного интеллекта, а затем создания видео из изображений, вы можете использовать инструменты рисования с искусственным интеллектом, такие как midjourney, для создания разделенных изображений. сначала сохраняйте единообразие объекта на уровне изображения, а затем преобразуйте их. изображения в видеоклипы, а также редактировать и синтезировать их.

но проблема в том, что согласованность рисования ии не идеальна, и ее часто приходится решать путем повторных модификаций и частичной перерисовки. что еще более важно, реальный процесс производства видео включает в себя множество сцен и объективов. когда этот метод обрабатывает сцены с многокомпонентными линзами, рабочая нагрузка по рисованию огромна, что может составлять более половины всего процесса, а также конечный видеоконтент. ему не хватает креативности и гибкости из-за чрезмерной уверенности в разделенных кадрах.

функция vidu «ссылка на предмет» напрямую генерирует видеоматериал путем «загрузки изображения объекта + ввода дескриптора сцены». этот метод значительно снижает рабочую нагрузку и снимает ограничения на видеоконтент с помощью разделенных изображений, позволяя создателям создавать насыщенный и гибкий видеоконтент на основе текстовых описаний.

рассказывая о творческом процессе создания короткометражного анимационного фильма «летний подарок», ши юйсян, директор центрального радио и телевидения китая и художник aigc, сказал, что по сравнению с базовой функцией фотосъемки видео функция «ссылка на предмет» исчезает. ограничений статических изображений и создает более красивые изображения. это заразительно и бесплатно, что значительно повышает согласованность творчества. в то же время это помогло ему сэкономить около 70% нагрузки на рисование.

репортер beijing business daily вэй вэй

отчет/отзыв