Новости

«Келинг» Куайшоу неожиданно стал популярным, Байт стремился догнать его, а конкуренция на видеотреке AI Wensheng обострилась.

2024-07-31

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina



В феврале 2024 года появление Соры помешало многим крупным модельным компаниям провести хороший Весенний фестиваль.

«Гала-концерт Весеннего фестиваля все еще переигрывается, поэтому мы срочно организуем групповые обсуждения», — с энтузиазмом рассказал «City Circle» сотрудник ведущей компании в области искусственного интеллекта. Видя беспрепятственный опыт Соры, даже блоггеры, продающие курсы, спешат запускать онлайн-уроки и зарабатывать много денег.

Кто сможет «скопировать» отечественную версию Sora в кратчайшие сроки? Все больше людей сосредотачивают внимание на Alibaba, Baidu и «большой пятерке»? Но никто не думал, что победителем станет быстрый игрок с относительно «буддийской» техникой.

7 июня компания Kuaishou внезапно выпустила видеомодель Wensheng «Kling», которая поддерживает создание видео продолжительностью до 2 минут. Кроме того, по сравнению с Sora, которая все еще находится на стадии «будущего», Keling был открыт для испытаний, как только о нем было объявлено, и полученные результаты также впечатляют.

«Келинг — это тема, которая в последнее время обсуждается больше всего в отрасли», — рассказал City Circle человек из венчурной индустрии. По официальным данным, более 500 000 человек подали заявки на Keling в течение одного месяца с момента его запуска. Он был открыт для более чем 300 000 пользователей и создал более 7 миллионов коротких видеороликов.

Неожиданная популярность Кэ Линга неизбежно заставила Байта немного смутиться. В мае этого года Byte также открыла тест модели Wensheng Video «Jimeng», но эффект в популярном в настоящее время треке Wensheng Video еще не очевиден.

Внезапно будучи отброшенным противником, которого «проигнорировали», Байту нужно было наверстать упущенное. По данным TMTPost, ByteDance недавно установила большую модель искусственного интеллекта в качестве направления группы «P0 высшего уровня». Многие команды, такие как Douyin и Jianying, также усердно работают над разработкой приложений для видеомоделей искусственного интеллекта, о которых, как ожидается, будет объявлено в ближайшем будущем.

1. Это можно сделать быстро, грубо и яростно.

Многие разработчики рассказали «Сити», что запуск Keling и его выдающиеся характеристики стали сюрпризом для отрасли.

Недавно «Граница города» использовала в качестве ключевого слова абзац «черная кошка» и ввела ту же подсказку в Келин, Джимэн и «Цинъин», которую только что запустил Zhipu AI: «Улицы города в дождливый день пусты. Мимо проходит один человек, милый черный кот. У него зеленые глаза, желтый ошейник и колокольчик на шее, а на теле длинные черные волосы. Видео снято с точки зрения камеры, а вода на нем. земля отражает это. Фигура черной кошки».

Среди трех сгенерированных видеороликов, хотя в версии Keling не удалось добиться эффекта быстрого бега, в целом видеоролики соответствовали объективным правилам.

Напротив, в версии «Цзимэн» на земле не было воды, и черная кошка не двигалась вперед. Хотя в версии «Цинъин» накапливается вода, у черной кошки странная походка при ходьбе, а хвост также теряет рамки.

▲(Видео созданы Кэ Лин, Цзи Мэн и Цин Инь по порядку)

По данным «Silicon Star», Келингу потребовалось три месяца на создание; команда очень маленькая, всего более 20 человек. Руководителем является Ван Пэнфэй, нынешний руководитель Центра визуальной генерации и взаимодействия Куайшоу, большая часть которого занимается исследованиями. направления включают обработку изображений/видеосигналов, компьютерную фотографию и компьютерное зрение, уменьшение функции потерь, генерацию изображения и т. д.

Предшественник Keling произошел от незаметного проекта Puji, перезапущенного Kuaishou в октябре 2023 года. Это программное обеспечение, которое использует искусственный интеллект для создания смайликов Gif размером 2 секунды из статических изображений. В начале марта этого года компания Kuaishou провела небольшое внутреннее собрание, которое было подтверждено Гай Куном (Ю Юэ), старшим вице-президентом компании Kuaishou, и Пучи был быстро определен как продукт для предварительного расследования.

По словам «Silicon Star People», «при выполнении келинга на уровне исполнения существует согласие, что это быстро, грубо и жестоко».

Менее чем через месяц после запуска проекта Keling он получил поддержку со стороны основателя Kuaishou Чэн Исяо, который считал его стратегическим проектом для компании. Гай Кун также часто говорит: «Все карты компании предназначены для вас, и компания полностью это поддерживает».

Кэ Ран, предприниматель в области цифрового человеческого трека, проанализировал «Город»: «Успех Келинг во многом обусловлен материалом видеоданных, накопленным Куайшоу. Если посмотреть на страну, то единственная, кто может конкурировать с ней в этом аспекте, — это звук Douishu. ."

Но хотя пейзажи прекрасны, Байт кажется немного одиноким.

Хотя официально о «Цжимэне» было объявлено 9 мая, Цзимен также появился в короткометражном сериале AIGC «Саньсиндуй: Будущий апокалипсис» в качестве главного технического специалиста по искусственному интеллекту. Однако, будь то с точки зрения игры на стороне C или по сравнению с короткометражной драмой AIGC Куайшоу «Горы и моря», которая вышла на экраны 13 июля, голос Цзи Мэн не очень громкий.

17 июля на рынке появилась новость о том, что Byte объявит о развитии видеотехнологии Vincent, подобной Sora. Внешний мир также интерпретирует это как означающее, что Байт собирается догнать и конкурировать с Келингом.

Однако позже Байт заявил «City Circle», что эта новость не соответствует действительности. 17 июля «Городской круг» заметил, что мероприятие больше похоже на сессию обмена технологиями. Встречу в основном вел Фэн Цзяши, руководитель группы фундаментальных визуальных исследований большой модели Дубао, а вся сессия велась на английском языке учеными-исследователями Byte, институциональными учеными и т. д.

Похоже, что «большого шага» Byte, возможно, придется еще подождать некоторое время.

2. Байт еще не восстановился

Так почему же Байт пропустил праздник в треке Vincent Video, который был в самом разгаре в последнее время? Чем занят Байт в последнее время?

В определенной степени, возможно, потому, что по сравнению со ставкой Куайшоу на «Ке Лин» он может «победить десять навыков одним усилием». Макет крупномасштабной модели Byte более сложен, и в первой половине этого года наиболее важными противниками Byte станут Tencent и Alibaba.

Перед лицом больших моделей темп Byte больше не является «радикальным». В конце концов, именно Byte возглавил масштабную войну цен на модели в отрасли более 2 месяцев назад.

15 мая на конференции ByteDance «FORCE Motive Power Conference» компания Byte запустила сервис API, основанный на собственной разработанной модели кресла-мешка. В то же время Тан Дай, президент Volcano Engine, сделал один шаг и раскрыл последнюю цену «Doubao»: 0,0008 юаня/тысячу токенов, объявив, что это «минимальная цена» ниже, чем 99,3% в отрасли.

В то время «атака» Байта взяла на себя инициативу. По данным «рыночных кругов» из многих источников, ведущие игроки были не готовы к атаке Байта, хотя все стороны чувствовали себя беспомощными, но могли лишь пассивно следовать за ними;

В следующие несколько дней Alibaba Cloud, Baidu Wenxin Model и Tencent Cloud последовательно объявили, что они значительно снизят цены на свои входные токены и API для вывода больших моделей. Под этим влиянием вызовы C-стороны на создание крупномасштабных моделей голов теперь почти бесплатны, и отрасль начала переходить на следующий экологический уровень.

По словам основателя легальной компании, занимающейся приложениями искусственного интеллекта, после открытия сервиса API почти не прошло времени, и сотрудники отдела продаж Volcano Engine начали активно связываться с клиентами и продвигать продукты. Это также подтверждает циркулирующие на рынке слухи о том, что компания Byte отметила большую модель как стратегию самого высокого уровня.



▲(Тан Дай на конференции FOECE 2024 года. Источник/Volcano Engine)

В последнее время объем «ведущего продукта» компании Byte значительно вырос.

По данным Questmobile, по состоянию на июнь 2024 года среди отечественных приложений AIGC Apps Doubao, Tiangong, Kimi Smart Assistant и Cat Box добились впечатляющего роста, причем Doubao занимает первое место по трафику.



▲(Источник фото/QuestMobile)

По сравнению с Kuaishou, что сейчас больше беспокоит Байт, это полноценная экологическая конкуренция от базовых больших моделей до уровня приложений ИИ. Кроме того, учитывая, что Volcano Engine официально станет облаком только в 2021 году, он является самым «молодым» среди гигантских облачных поставщиков. Уже более трех лет Huoshan Cloud считается претендентом на облачном рынке. То, как Byte взаимодействует с базовой крупной моделью, уровнем приложений и облачным рынком, представляет собой комплексное предложение.

В последнее время, по сообщениям «Photon Planet», большое количество пользователей платформы Byte «Kouzi» ищут способы подключения созданных ими агентов и ботов к официальным аккаунтам или мини-программам WeChat, и дискуссии ведутся очень активно.

В декабре прошлого года Byte запустила платформу разработки приложений искусственного интеллекта «coze» за рубежом. В феврале этого года в сети была запущена отечественная версия «Кнопки». Большое количество торговцев Доуинь также надеются быстро сделать из него горшок с золотом.

Учитывая, что Tencent с опозданием выпустила платформу создания и распространения AI-агентов Tencent Yuanqi в мае этого года. На тот момент количество посещений Баттона достигло 2,33 миллиона раз. На данный момент Tencent Yuanqi еще не открыла экосистему серии WeChat, состоящую из мини-программ, официальных учетных записей и учетных записей подписки на обслуживание клиентов.

В конце концов, развитие ИИ все еще находится на ранней стадии. Byte, как и Tencent, по-прежнему приходится уделять много времени обучению пользователей. Конкуренция за права на распространение в эпоху искусственного интеллекта и получение преимущества на старте могут стать более важным уроком, который Byte должен усвоить, чтобы нацелиться на Tencent.

3. Нанесите удар позже, время еще есть

На отраслевом уровне в сегодняшнем Интернете нет недостатка в трафике контента, трафике электронной коммерции и байтах финансовых боеприпасов. Даже если Винсент Видео «на шаг отстает» в краткосрочной, в долгосрочной перспективе. у него все еще есть потенциал наверстать упущенное.

Использование активных рыночных стратегий для того, чтобы догнать отстающие позиции и энергично добиться чудес, также является специализацией Byte.

В последнее время, ориентируясь на Alibaba, Byte также работает над интеграцией больших моделей. На прошедшей 26 июня конференции по экосистеме DingTalk президент Е Цзюнь объявил, что в дополнение к Tongyi, принадлежащему Alibaba, в DingTalk также будут включены крупные модели сторонних производителей от других шести компаний. К ним относятся MiniMax, Dark Side of the Moon, Zhipu AI, Orion Star, Zero One Thing и Baichuan Intelligence, охватывающие почти все известные стартапы крупномасштабных моделей в Китае. Само собой разумеется, что необходимо «построить самую открытую экосистему искусственного интеллекта в Китае». ".

Подобно игровому процессу DingTalk, помимо поддержки собственного «Doubao», платформа Byte Kouzi также имеет доступ к основным внешним моделям, таким как Tongyi Qianwen, Dark Side of the Moon и MiniMax. 14 июня Коузи также запустил функцию «Квадрат модели», которая позволяет пользователям выбирать две анонимные модели и оценивать их на основе эффективности сгенерированного контента.



Кроме того, недавно была разоблачена компания Byte, и ее исследование «оборудования AI +» ускоряется, и она без колебаний привлекает таланты посредством приобретений.

По данным Tech Planet, PICO, дочерняя компания Byte, со второй половины прошлого года занимается разработкой нескольких носимых устройств, включая наушники и колонки, и эти устройства также будут оснащены искусственным интеллектом. Команда Byte Doubao также исследовала сочетание программного и аппаратного обеспечения крупномасштабных моделей. Комбинация программного и аппаратного обеспечения крупномасштабных моделей постепенно применялась к аппаратным устройствам, таким как обучающие машины, роботы-собаки и роботы.

Согласно другому сообщению 36Kr, за «линию D» аппаратного обеспечения Byte AI отвечает Ли Хаоцянь. Последний является основателем Oladance, бренда наушников OWS (Open Wearable Stereo), приобретенного Byte в марте этого года. Человек, отвечающий за «O Line», еще одну линию оборудования для искусственного интеллекта, также является основателем компании, приобретенной Byte. Он подчиняется Хонгу Динкуну, вице-президенту ByteDance Technology.

В направлении Vincent Video, учитывая недавнюю популярность трека, у преследователей, в том числе Byte, еще есть время.

Недавно разработчик рассказал «Городскому миру»: «В настоящее время я использую Keling для компоновки картинок и уменьшения загруженности рабочего процесса. Я еще не полностью использую его для творчества, поэтому особой зависимости от него у меня пока нет».

По мнению другого разработчика и блоггера AIGC, у Keling все еще есть много возможностей для оптимизации: «Опираясь на Keling Wensheng Video, мы не можем гарантировать согласованность IP-адреса виртуального человека. Обычно я использую Kelingtu для создания видео. Функция эквивалентна дать Ке Лину изображение, позволяющее ему создавать динамические видеоролики с разных точек зрения, а затем объединять их вместе, чтобы имитировать эффект перемещения камеры».

Член научно-исследовательской группы отечественного продукта для моделирования знакомств с искусственным интеллектом сказал: «На нынешнем рынке приложений для крупномасштабных моделей каждый пересекает реку, ощупывая камни. Как коммерциализировать это — вопрос, который слишком далек и слишком расплывчато, но несомненно то, что чем больше людей используют и играют в него, тем больше он может обеспечить оптимизацию и итерацию продукта».

(Ке Ран — псевдоним)

Автор | Донг Вэньшу

Редактировать | Ли Юань

Операции | Лю Шань