новости

Кто сможет превзойти Сору по практическому опыту развёртывания отечественных крупных моделей ИИ-видео?

2024-08-10

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Репортер новостей на обложке Сюн Инъин
В начале этого года американская компания OpenAI выпустила модель Sora для генерации ИИ-видео, которая прогремела как гром на земле, открыв новые возможности приложениям искусственного интеллекта. В то время многие пользователи сети сетовали на то, что разрыв между нами и зарубежными технологиями искусственного интеллекта становится все шире и шире.
Однако всего за полгода «отечественные соры», такие как Keling, PixVerse V2, Qingying и Vidu, были выпущены одна за другой и открыты для пользователей бесплатно.
Какая отечественная модель видео лучше? В то время как технологии продолжают совершать прорывы, кто сможет возглавить коммерциализацию?
В этом месяце будут выпущены 4 «отечественных» продукта Sora.
Реальный опыт репортера в тестировании
В то время как ценовая война между крупными отечественными производителями и крупными моделями ожесточена, некоторые компании сосредотачиваются на области генерации видео с помощью искусственного интеллекта и предпринимают секретные усилия. По неполным статистическим данным, на данный момент существует более 10 масштабных отечественных видеомоделей с искусственным интеллектом. Только в июле этого года в сети было выпущено 4 «отечественных Сора».
6 июля была официально запущена веб-страница Kuaishou Keling AI, предоставляющая функции видео Wensheng и видео Tusheng, которые могут генерировать видео длительностью до 10 секунд. Также были добавлены такие функции, как управление движением камеры и настройка первого и последнего кадров.
24 июля Aishi Technology официально выпустила PixVerse V2, которая одновременно будет открыта для всего мира. Эта модель может генерировать несколько видеоклипов одновременно и обеспечивать генерацию видео продолжительностью 8 секунд для одного клипа и 40 секунд для нескольких клипов.
Впоследствии один за другим также были выпущены Qingying, созданный компанией Zhipu AI Company, и Vidu, независимо разработанный Shengshu Technology. Среди них Qingying фокусируется на быстрой генерации в течение 30 секунд; Vidu добавляет генерацию видеоклипов в анимационном стиле в дополнение к обычному реалистичному стилю;
Крупномасштабные модели генерации видео вышеупомянутых четырех компаний в настоящее время открыты для тестирования. После быстрой регистрации по телефону, электронной почте и т. д. репортеры также получили реальный опыт.
Чтобы протестировать функцию «Изображение-видео», репортер загрузил одно и то же изображение розы, которая еще не расцвела, на четыре крупных модельных веб-сайта и ввел слово «цветок». И Цинъин, и Виду успешно создали анимированные розы. видео цветущих цветов. На видео, созданном PixVerse и Keling, видно, как качаются цветы, но нет динамического эффекта «цветения». Но когда репортер изменил слово на «медленно цветущий цветок», Келинг также успешно создал видео цветущей розы. Видно, что разные большие модели имеют различия в способности обрабатывать и понимать язык.
Скриншоты видео, созданные четырьмя отечественными большими моделями
Судя по скорости генерации видео, Виду показал самое быстрое время, создав 3-секундное видео менее чем за 1 минуту. Остальные три большие модели завершили создание видео за 5 минут. Хотя Qingying рекламирует «быструю генерацию за 30 секунд», возможно, потому, что слишком много людей пытаются это сделать, на странице генерации отображается «ожидается очередь в течение 3 минут».
Судя по отзывам пользователей социальных сетей, все основные модели имеют те или иные проблемы, такие как искажение символов и отсутствие изображений.
«Многие ждут и наблюдают, но немногие принимают меры».
Инвестиции в область больших моделей имеют тенденцию быть осторожными.
Когда в начале года родился Сора, в Интернете все еще звучали пессимистические голоса, полагавшие, что Китай сильно отстал от США в области искусственного интеллекта. Всего полгода спустя в Китае появилось несколько крупных видеомоделей с искусственным интеллектом, сравнивающих Sora.
Тяньянча показывает, что компания Zhipu AI, основанная в 2019 году, завершила финансирование серии C и в настоящее время оценивается более чем в 10 миллиардов долларов. Хотя Aishi Technology и Shengshu Technology были созданы только в 2023 году, они завершили три и четыре раунда финансирования соответственно. Означает ли это, что инвестиционные круги по-прежнему с большим энтузиазмом инвестируют в крупные модельные гоночные трассы?
«По сути, мы по-прежнему видим больше и инвестируем очень мало». Го Тао, ангел-инвестор и эксперт в области искусственного интеллекта, сказал, что в настоящее время крупнейшими инвесторами являются несколько крупных интернет-компаний, которые вложили значительные средства в несколько крупных моделей. проекты. С одной стороны, крупные производители могут найти некоторые сценарии применения больших видеомоделей в своем существующем бизнесе, с другой стороны, если эти крупные модели имеют определенную степень пересечения с собственным бизнесом компании, их можно использовать в качестве дополнения к ним; продуктовая линейка также может. Благодаря существующим экологическим ресурсам эти крупные модельные компании получат определенные возможности;
Компания Zhipu AI привлекла более 100 миллионов юаней в ходе нескольких раундов финансирования.
В целом отечественные инвестиционные институты по-прежнему консервативно и осторожно относятся к таким крупным моделям, как «Винсент Видео» и «Туш Видео». Основная причина этого заключается в том, что их коммерциализация сталкивается со многими проблемами.
По мнению Го Тао, будь то Сора или крупная отечественная модель, созданные видеоролики все же имеют определенные недостатки. Например, сгенерированные ИИ персонажи иногда имеют лишний палец, не могут попасть в корзину при броске и т. д. Это показывает, что большая модель недостаточно понимает пространственные взаимоотношения между объектами, а модель алгоритма также нуждается в дальнейшем совершенствовании.
Помимо технических проблем, которые еще предстоит решить, самой большой проблемой в коммерциализации крупных видеомоделей искусственного интеллекта является отсутствие зрелых сценариев применения.
«Например, Kuaishou сам по себе имеет платформу и контент, и, условно говоря, у него есть определенные сценарии применения. Многие компании, занимающиеся самостоятельными СМИ, могут использовать его», — сказал Го Тао, но для некоторых чисто технических компаний их все еще сложно найти. . Особенно хороший и жесткий сценарий спроса, при котором пользователи готовы платить.
Платформа ускоряет исследование коммерциализации
Ожидается, что рынок микрокороткометражных драм возьмет на себя лидерство по количеству поступлений.
Несмотря на то, что существуют проблемы с коммерциализацией, крупные модельные платформы в стране и за рубежом активно изучают и пытаются коммерциализировать.
Репортер отметил, что в настоящее время крупные отечественные видеомодели с искусственным интеллектом также начали платить потребителям. 24 июля в официальном сообщении Keling AI в WeChat сообщалось, что число пользователей, подавших заявки на получение разрешений, превысило 1 миллион. В тот же день одновременно была запущена система платного членства, включающая три категории членства: золотую, платиновую и бриллиантовую. Стоимость годового членства колеблется от более 500 до 5000 юаней.
PixVerse использует модель оплаты подписки, включая базовую версию, стандартную версию и неограниченную версию, при этом цена за единицу варьируется от 5 до 60 юаней.
Однако многие инсайдеры отрасли заявили, что в настоящее время крупные модели искусственного интеллекта имеют очень высокие затраты на вычислительную мощность и затраты на привлечение клиентов, платежные привычки пользователей еще не сформированы, а рыночная конкуренция чрезвычайно жесткая. Нелегко добиться прибыльности, полагаясь только на них. при оплате на стороне C.
По сообщениям СМИ, в июне этого года всемирно известный бренд детских игрушек «Toys R Us» в сотрудничестве с OpenAI использовал 1-минутный коммерческий фильм «Происхождение игрушек R Us», снятый Сорой. Фильм позволил Соре. генерировать осуществимую коммерческую рекламу. Далее демонстрируется сексуальность.
В июле официально стартовал первый отечественный оригинальный фэнтезийный микро-драма AIGC «Горы и моря. Странное зеркало: Рассекая волны». Драма состоит из 5 серий и длится 15 минут. В драме главный герой - мальчик. , фантастический Кунпэн, странный зверь и т. д. — все они созданы искусственным интеллектом.
Поскольку все больше и больше продюсерских компаний и платформ начинают исследовать путь интеграции «ИИ + микрокороткометражные драмы», большие модели видео с искусственным интеллектом могут стать первыми, которые будут коммерциализированы на рынке микрокороткометражных драм.
Отчет/Отзыв