одно и то же изображение может появляться в разных сценах! большая видеомодель виду приветствует крупное обновление

одно и то же изображение может появляться в разных сценах! большая видеомодель vidu приветствует крупное обновление

2024-09-15

11 сентября vidu, оригинальная видеомодель собственной разработки, разработанная совместно shengshu technology и университетом цинхуа, получила серьезное обновление с функцией «согласованность предметов». эта функция позволяет добиться согласованной генерации любого предмета, делая видео генерацией. более стабильный и управляемый. в настоящее время эта функция доступна пользователям бесплатно.

функция предметной ссылки запускается онлайн для решения проблемы согласованности ролей.

в настоящее время, будь то функция изображения винсента или функция видео винсента, широко критикуемой проблемой является предметная последовательность изображения в изображении или видео. одни и те же подсказки и одна и та же большая модель генерируются дважды, а генерируемый контент разный. в художественных произведениях это приводит к тому, что образ главного героя становится непоследовательным, и это также стало одним из самых больших различий между сгенерированными ии. произведения и люди едины.

чтобы решить эту проблему, отрасль попыталась внедрить метод «сначала ии генерирует изображения, затем изображения генерируют видео», используя инструменты рисования ии, такие как midjourney, для создания разделенных изображений, сначала сохраняя согласованность объекта на изображении. уровень, а затем конвертировать эти изображения в видеоролики и редактировать их.

но проблема в том, что согласованность рисования ии не идеальна, и ее часто приходится решать путем повторных модификаций и частичной перерисовки. что еще более важно, реальный процесс производства видео включает в себя множество сцен и объективов. когда этот метод обрабатывает сцены с многокомпонентными линзами, рабочая нагрузка по рисованию огромна, что может составлять более половины всего процесса, а также конечный видеоконтент. ему не хватает креативности и гибкости из-за чрезмерной уверенности в разделенных кадрах.

на мероприятии дня открытых дверей, проведенном компанией shengshu technology 11 сентября, компания shengshu technology продемонстрировала функцию «справочник по теме». эта функция позволяет пользователям загружать изображение любого предмета, а виду может заблокировать изображение предмета и описать его через вас. может произвольно переключать сцены и выводить видео с тем же предметом.

эта функция не ограничивается одним объектом, а ориентирована на «любой предмет». будь то человек, животное, товар, анимационный персонаж или вымышленный объект, она может обеспечить его последовательность и управляемость при создании видео. видео крупная инновация в области генерации. vidu также является первой в мире большой видеомоделью, поддерживающей такую возможность.

например, используя «предметную ссылку» для персонажей, будь то реальные люди или вымышленные персонажи, виду может сохранять единообразие их изображений в разных средах и под разными объективами. тан цзяюй, председатель и генеральный директор компании rushengshu technology, показал на сцене, что, представив образ линь дайюй, которого играет чэнь сяосюй, в разных сценах и разных нарядах, сцена «линь дайюй, пьющая кофе», может рассматриваться как « тот же линь дайю».

тан цзяюй, председатель и генеральный директор shengshu technology, продемонстрировал на месте функцию «предметной ссылки». фото репортера beijing news shell finance ло иданя

последовательность создания видео с использованием ии значительно улучшит эпоху полноценного повествования с использованием ии.

на основе этой функции директор центрального радио и телевидения китая и художник aigc ши юйсян (senhai fluorescent) создал короткометражный анимационный фильм «летний подарок», рассказывая о творческом процессе, он сказал, что по сравнению с базовой видеофункцией tusheng «the». функция «справочник по теме» избавляет от ограничений статических изображений, а созданные изображения становятся более привлекательными и свободными, что значительно улучшает последовательность создания. в то же время это помогло ему сэкономить около 70% рабочей нагрузки по созданию изображений и значительно повысить эффективность, позволив ему больше сосредоточиться на доработке содержания истории, а не на создании иллюстративных материалов. в то же время последовательность упрощает постредактирование.

ши юйсян, директор центрального радио и телевидения китая и художник aigc, продемонстрировал на сайте анимацию, созданную с помощью функции «предметная ссылка». видно, что изображение главного героя в анимации остается стабильным. фото репортера beijing news shell finance ло иданя

тан цзяюй сказал, что запуск новой функции «предметной справки» представляет собой начало полноценного повествования об искусственном интеллекте, а создание видео с использованием искусственного интеллекта также перейдет на более эффективный и гибкий этап. независимо от того, снимаете ли вы короткие видеоролики, анимацию или рекламные ролики, в искусстве повествования полная повествовательная система представляет собой органическое сочетание таких элементов, как «последовательный сюжет, последовательная сцена, последовательный стиль».

следовательно, чтобы видеомодель могла достичь целостности повествования, она должна быть полностью управляемой по этим основным элементам. функция «body reference» — важный шаг на пути к единообразию для vidu, но это только начало. в будущем виду продолжит изучать способы точного управления сложными элементами, такими как взаимодействие нескольких субъектов, единый стиль и стабильное переключение меняющихся сцен для удовлетворения повествовательных потребностей более высокого уровня.

он сказал, что в долгосрочной перспективе, как только будет достигнута всеобъемлющая управляемость, индустрия создания видео претерпит разрушительные изменения. к тому времени персонажи, сцены, стили и даже такие элементы, как использование линз, эффекты света и тени, будут преобразованы в гибко настраиваемые параметры. пользователям нужно лишь двигать пальцами и настраивать параметры, чтобы завершить создание имиджевого произведения, и за каждой работой будет стоять уникальное мировоззрение и самовыражение пользователя, основанное на искусственном интеллекте.

репортер beijing news shell finance ло идань, редактор ван цзиньюй корректирует ян ли

отчет/отзыв

новости

одно и то же изображение может появляться в разных сценах! большая видеомодель vidu приветствует крупное обновление

введение

моя контактная информация