Новости

Старик, который не может дождаться Соры, бросается к Куайшоу Келингу.

2024-08-01

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Почему Kuaishou стал первым крупным производителем, запустившим видео с искусственным интеллектом? ‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

Текст | Чэнь Мэйси

Редактор | Директор

В первые дни, когда Open AI покорил мир в плане больших моделей, Куайшоу не был выдающейся фигурой. В то время Baidu придумала Wenxinyyan, Alibaba придумала Tongyi Qianwen, а Tencent предложила большую модель Hunyuan, догоняя друг друга, и скорость исследований, разработок и открытий была очень быстрой.

Куайшоу не было в первоначальном списке претендентов, и даже сейчас мало кто может назвать имя большой языковой модели Куайшоу: Руйи.

Ситуация в бою изменилась 6 июня этого года. Созданная Kuaishou видео-большая модель Keling открыла заявку на публичное бета-тестирование. В этот день также исполнилось 13 лет со дня основания Kuaishou. СМИ часто сравнивают Келинг с Сорой из Open AI, но с момента своего взрывного дебюта в феврале Сора не была открыта для публики. В результате на Keling начали стекаться любопытные китайские пользователи.

Десять дней спустя Кэлин «получила десятки тысяч заявлений». Эти данные получены от Ван Пэнфэя, который в тот день присутствовал на конференции в Чжиюане. На момент выступления он был главой Центра визуальной генерации и взаимодействия Куайшоу, а также фактически руководил Келингом. По состоянию на 19 июля число претендентов превысило миллион. Всего Келингу понадобилось больше месяца, чтобы увеличить количество заявок с десятков тысяч до миллионов. Среди прогресса крупных моделей в первом полугодии крупных производителей это самый привлекательный результат.


Картина, порожденная духом, слово-подсказка: Пчела в цветах.

Истории о переменах всегда популярны среди общественности. Однако тщательный анализ Келинга и крупного модельного бизнеса Куайшоу, стоящего за ним, покажет, что это не крутая драма, которая дремлет, а затем внезапно всплывает, и это не героический рассказ, в котором талантливый молодой человек возглавляет небольшую команду для нанесения удара. назад.

На основе изображения, созданного Келингом, дополнительно создается видео с подсказкой: летающие пчелы.

Почему Kuaishou стал первым крупным производителем, запустившим видео с искусственным интеллектом?Именно потребности бизнеса обеспечивают сильную мотивацию и высокий приоритет, именно накопление данных и технологий в форме продукта обеспечивает скорость итерации, а соответствие бизнес-сценариев приводит к появлению реальных клиентов.

Появление Кэ Линга – не случайное событие. На внутреннем рынке крупнейшим конкурентом Kuaishou в области AI-видео, скорее всего, станет компания ByteDance.


Когда есть спрос, есть мотивация.

Авторы — одно из важнейших звеньев в экосистеме контента Kuaishou. По официальным данным, опубликованным Kuaishou, в 2023 году 138 миллионов создателей впервые выпустят короткие видеоролики на Kuaishou, а видеоролики, выпущенные в течение года, получили на платформе более 1 триллиона лайков.

Наличие большого количества создателей контента означает, что Kuaishou должен взять на себя их потребности в инструментах для контента. В противном случае создатели, гоняющиеся за растущей производительностью, вскоре бросятся к другим инструментам и даже другим платформам. В этом также ценность Куайин для Куайшоу и сокращения до байта.

Таким образом, предыдущие инвестиции Kuaishou в большие языковые модели не были радикальными, но ей приходится стремиться к победе в конкуренции мультимодальных больших моделей.

До появления Keling в Kuaishou были интегрированы возможности крупных моделей Wenshengtu, разработанные Kuaishou. Результатом внутреннего тестирования стало то, что пользователи каждый месяц создавали в среднем более 500 миллионов изображений AI в области комментариев.


Изображение, созданное Келингом, слово-подсказка: Инопланетянин, стоящий на берегу реки Янцзы.

Сильная мотивация, вызванная спросом, безусловно, является необходимым условием появления Келинга, но Куайшоу не единственный, у кого есть такие условия. Если и есть какой-то другой важный фактор, повлиявший на появление Кэ Лина, то это, возможно, решимость.

Решимость в первую очередь исходит от высшего руководства Kuaishou.

Раньше движения Куайшоу на больших моделях всегда казались на полшага медленнее. Когда дело доходит до отечественных больших языковых моделей, каждый в первую очередь думает о Вэнь Синь И Янь и Тонг И Цянь Вэнь, когда дело доходит до приложений больших языковых моделей, Кими и Дубао являются наиболее популярными на рынке; В области винсентийской графики Ririxin 5.0 от SenseTime первым вырвался с внутреннего рынка. На следующее утро после его выпуска цена акций SenseTime Technology выросла более чем на 30%, и торги были временно приостановлены.

В предыдущей серии историй Куайшоу находился, казалось бы, в маргинальном положении. Видео больших моделей и их применение — самый важный узел в борьбе за популярность, а также важнейшая часть общего макета большой модели.

В предыдущем репортаже технологического СМИ Silicon Star технический специалист из команды Keling сказал: «Гай Кун часто говорит, что все карты компании предназначены для использования вами, и компания полностью поддерживает это, Гай Кун — это Ю Юэ». , старший вице-президент Kuaishou, а также исполнительный директор. Лицо, отвечающее за работу линии станции, а также лицо, отвечающее за линию социальных наук. После того как бывший технический директор Чэнь Динцзя ушел в отставку, Гай Кун стал одним из высших руководителей технологического направления Kuaishou.

Ван Пэнфэй и его команда могут проявить еще большую решимость.Одна деталь заключается в том, что, решив взять на себя управление проектом Келинг, Ван Пэнфэй передал первоначальную работу по решению бизнес-потребностей всех сторон другим людям, отвечающим того же уровня в команде Чжан Ди.Соответственно, другие члены команды Keling также передали первоначальный бизнес и полностью посвятили себя исследованиям и разработкам Keling. Работать сверхурочно по выходным — это нормально, чтобы не отставать от прогресса.

Видео, созданное на основе изображения, созданного Келингом, со словами-подсказками: Инопланетянин идет по воде, два инопланетянина дают пять.

«На самом деле, более чем за месяц до его официального выпуска результаты тестов Кэ Лина были не очень хорошими». Практикующий из крупной модельной индустрии рассказал Hedgehog Commune: «Лао Ван и другие борются вопреки всему. Далее следует это действительно «чудесные результаты огромной силы». Многие люди не ожидали такого эффекта».

Таким образом, решимость стала последней переменной.


Накопление приводит к скорости

Kuaishou, как и любая другая ведущая платформа для коротких видео, накопила опыт разработки видеороликов с использованием искусственного интеллекта в двух аспектах: контенте и технологиях.

Видео создаются пользователями, и после аннотирования и понимания платформой контент, который может быть распространен, отфильтровывается. Это внутренний маршрут бизнес-логики Kuaishou. Обработанный контент становится своего рода данными: от описания самого контента до популярности после распространения, Kuaishou освоил огромный объем данных контента.С точки зрения непрофессионала, у них обоих есть контент, и они знают, какой «хороший контент» хотят видеть пользователи.

Для обучения больших генеративных видеомоделей этот процесс подобен предварительной подготовке посуды.

Даже «повар» уже готовый.

Большинство основных членов научно-исследовательской группы проекта Keling — бывшие подчиненные Ван Пэнфэя еще с периода Y-tech. В начале года члены команды постепенно познакомились с актуальной информацией и материалами и начали работать над исследованиями и разработками Келинга.

Ранее команда Ван Пэнфэя в основном отвечала за удовлетворение потребностей в интеллектуальном создании пользовательского контента в рамках экосистемы создания Kuaishou и тесно сотрудничала с такими бизнес-подразделениями, как производство основной станции, Kuaiying и Yitian Camera. Формы продуктов включают украшение портретов, аудио- и видеоспецэффекты. , аватары прямых трансляций и т. д.

В 2021 году Ван Пэнфэй выступил с публичной речью в качестве «руководителя технологической платформы искусственного интеллекта отдела Y-tech» на Глобальной конференции по технологиям искусственного интеллекта.Среди случаев, о которых сообщалось в то время, был «спецэффект живой фотографии» - видеогеймплей Tusheng в эпоху до больших моделей. В то время библиотеки шаблонов Kuaishou и Kuaiying запустили специальный эффект «перемещение старых фотографий». После того, как пользователи загружают фотографию, персонажи на фотографии могут совершать такие движения, как улыбка, моргание и кивание, чтобы создать видеоэффект. По имеющимся данным, этот динамичный спецэффект использовали более 3,44 миллиона человек в Куайине.


Трогательные старые фотографии и видео, опубликованные пользователем сети Kuaishou @senyuhelu в 2021 году.

В 2021 году Ван Пэнфэй был очень уверен в развитии генеративных технологий и предположил, что «генеративные модели будут становиться все более мощными, генерируемый контент — более реалистичным, а процесс генерации — более стабильным и управляемым».

Три года спустя Келинг снова появился со своей работой «Оживление старых фотографий». Некоторые пользователи, обратившиеся за разрешением на ее использование, использовали функцию «Тушэн Видео», чтобы превратить фотографии умерших родственников в видео. По сравнению со «спецэффектами для живых фотографий» трехлетней давности, с помощью открытых инструкций пользователи могут заставлять персонажей на фотографиях выполнять более сложные действия. Именно это изменение вызвано новой технологией больших моделей.

Sora была выпущена в феврале этого года, и команда Kuaishou Keling начала формироваться в ближайшее время, но разработка и применение технологии мультимодальной генерации видео всегда входили в сферу деятельности Ван Пэнфэя и его команды. .

Вышеупомянутые практики выразили схожие взгляды с Hedgehog Commune: «Фактически появление Соры эквивалентно предоставлению каждому возможности определять технический маршрут или план в этом узле, но существует множество применений визуальных технологий, включая мультимодальные вещи. Это то, что они всегда делали».

Техническое накопление, необходимое Кэ Лину, происходит из этого. Повар наткнулся на приготовленное блюдо, а после того, как новый рецепт увидел весь мир, Куайшоу стала одной из команд, которые быстрее всех приготовили готовый продукт.

Но в то же время вышеупомянутые практики также занимают выжидательную позицию относительно того, сможет ли Келинг долгое время оставаться на лидирующих позициях в области технологий и продуктов. «Алгоритмы, используемые сейчас всеми, схожи. У каждой компании могут быть некоторые доработки, но разница все та же». производит продукты с аналогичным эффектом.

Таким образом, скорость — это лишь временное преимущество Kuaishou. Им необходимо по-настоящему превратить свое преимущество в стабильных клиентов в период ведущего окна.


Где есть сцена, там и клиенты

29 декабря 2020 года Kuaishou впервые официально объявила «фракция Kuaishou» корпоративной ценностью во внутреннем письме всем сотрудникам, заявив, что «одержимость клиентами» является основой ценностей Kuaishou.

Раньше, будь то в Kuaishou или других крупных интернет-компаниях, чаще всего упоминалось понятие «пользователи». По этой причине Куайшоу конкретно объяснил причины такого изменения словарного запаса. «Сложность бизнеса компании стала выше, расширяясь от «пользователей» к «клиентам». В число клиентов входят производители и потребители, клиенты B-стороны и пользователи C-стороны, внешние клиенты и внутренние клиенты. Нам необходимо улучшить наше понимание производителей и Клиенты B-стороны Чтобы улучшить понимание и осведомленность клиентов, нам также необходимо уделять особое внимание обслуживанию внутренних клиентов».

Оглядываясь назад, можно сказать, что 2024 год действительно стал важным переломным моментом в изменениях в структуре бизнеса Kuaishou. В 2020 году доля доходов от прямых трансляций в годовом доходе Kuaishou упала с 80,4% в предыдущем году до 56,5%, а доля доходов от услуг онлайн-маркетинга увеличилась с 19% до 37,2%. Прочие услуги, включая электронную коммерцию. доходов от услуг быстро выросла до 6,3% с 1% в предыдущем году.

Как пояснил сам Куайшоу, производители и потребители, клиенты B-стороны и пользователи C-стороны, внешние и внутренние клиенты — все они являются важными клиентами Kuaishou, а также станут целевыми клиентами большой модели Kuaishou.

Производители и потребители совместно создают основную бизнес-цепочку Куайшоу. Производители производят контент, а потребители потребляют контент.Ценность крупномасштабных модельных продуктов заключается в снижении порога производства и повышении качества контента.

Первое легко понять. Поскольку в настоящее время Keling может получить видео, введя текст или изображения, для людей, не имеющих условий съемки и производственных возможностей, порог производства значительно снижен.

Последнее на первый взгляд звучит немного нелогично — учитывая возможности моделирования и длину выходного сигнала современных видеопродуктов с искусственным интеллектом, как оно может быть лучше реальной съемки и профессионального производства с точки зрения качества? Однако на ведущих платформах, таких как Kuaishou и Douyin, большая часть из десятков миллионов коротких видеороликов, создаваемых каждый день, исходит от обычных пользователей. По мнению профессиональных производителей контента, «недостаточно сложной» технологии искусственного интеллекта достаточно, чтобы сделать обычных пользователей. ' Делайте случайные снимки, чтобы добавить материала и разнообразия.

Торговцы со стороны B также могут стать покупателями возможностей крупных моделей Kuaishou. Согласно данным, опубликованным Kuaishou на Всемирной конференции по искусственному интеллекту в этом году, ее доходы от рекламы в сфере искусственного интеллекта превысили 20 миллионов в день. Рекламные материалы, созданные с помощью искусственного интеллекта, позволяют снизить стоимость единицы товара до 0,47 юаня, сохранив при этом CTR на базовом уровне.


Келинг генерирует картинки и подсказки: рекламный материал яблочного сока, на белом столе стоит стакан яблочного сока, сбоку два красных яблока.

Для многих крупных моделей продуктов поиск сценариев посадки является сложной проблемой на протяжении всего жизненного цикла продукта, но у Kuaishou, очевидно, нет недостатка в сценариях.Как сказал Чжан Ди, вице-президент Kuaishou и руководитель отдела крупных моделей, успех Келинга обусловлен «извлечением реальной ценности из реальных сцен для удовлетворения реальных потребностей пользователей».

Проблема, с которой им придется столкнуться, заключается в том, как заставить пользователей стать часто используемыми большими моделями Kuaishou в текущем сценарии и быть готовыми продолжать платить за это, а также сначала реализовать коммерциализацию больших моделей в их собственной экосистеме.

25 июля Keling полностью открыла регистрацию. В тот же день Keling запустила свою систему членства и перешла на этап зарядки.

Согласно информации на официальном сайте Keling, пользователи, не являющиеся членами, могут получать 66 очков вдохновения при входе в систему каждый день. Согласно текущей «цене», можно бесплатно создать около 6 видеороликов или 330 изображений.

Существует две модели оплаты: одна — модель членства. Пользователи могут приобретать различные уровни членства на ежемесячной, ежеквартальной, полугодовой или годовой основе. Чем выше уровень, тем больше работ можно создать; модель пополнения счета, где пользователи могут. Если вы платите непосредственно за пополнение счета, стоимость производства каждого видео для пользователя составляет 1 юань, а стоимость производства каждого изображения — 2 цента.


Картинка, созданная Келингом, слово-подсказка: восход солнца, красивые облака и утреннее сияние на горизонте, солнце скрыто в облаках.

В системе ценообразования Келинга заслуживают внимания два момента.

Во-первых, Kuaishou не предоставляет вариант членства, который может генерировать неограниченное количество произведений, а это означает, что независимо от того, выбирают ли они режим пополнения счета или режим членства, пользователи фактически «платят деньги, чтобы купить время».Единственная разница — это цена за единицу каждого поколения, а также дифференцированные функции, такие как удаление водяных знаков, расширение видео и перемещение главного зеркала.

Стоимость создания видеороликов с использованием ИИ высока, и Kuaishou не предоставляет участников, которые могут создавать неограниченное количество раз. Kuaishou, очевидно, хочет избежать возможного контроля затрат и в определенной степени ограничить «серое» производство.

Во-вторых, ценность вдохновения в качестве «платежной валюты» Келинга эквивалентна по цене монетам Куай, используемым для вознаграждения якорей в экосистеме Куайшоу. За 1 юань юаня вы можете купить 10 быстрых монет или 10 очков вдохновения. Этот метод ценообразования может сохранить возможность открытия платежной системы в экосистеме Kuaishou в будущем.


Куайшоу далеко не единственный, у которого есть потребности, сценарии, клиенты, оборудование, данные, технологии и резервы талантов одновременно.

Вышеупомянутые инсайдеры отрасли прогнозируют, что в ближайшем будущем Byte сможет выпускать генеративные видеопродукты такого же уровня. До этого Kuaishou необходимо завершить накопление пользователей и контента в течение периода окна, чтобы контент ИИ мог эффективно работать в экосистеме Kuaishou. Лучше всего пройти путь коммерциализации и оставаться в позиции лидера в течение более длительного времени. .

На повестке дня стоят традиционные средства роста и операций. Официальный сайт Keling быстро запустил акцию со скидкой 50% для участников. В то же время пользователи могут получать 66 баллов вдохновения, входя в систему каждый день, чтобы уменьшить влияние модели оплаты на рост и удержание пользователей, чтобы все пользователи могли, по крайней мере, получить эту возможность. попробуйте без порога.

Кроме того, в работе сайта Kuaishou Keling не уделяет слишком много внимания таким понятиям, как генеративное видео, решения диффузионных моделей и распределенные обучающие кластеры. Вместо этого он использует «старые фотографии в видео», «охватывая вас сквозь время». и космос» и «воскрешение 40 лет назад». «Предыдущее фото» и другие методы игрового процесса, чтобы привлечь пользователей к тому, чтобы они начали использовать его первыми, чтобы снизить затраты на понимание пользователем.

Для обычных пользователей новый игровой процесс имеет тот же путь сложности, что и предыдущий игровой процесс со спецэффектами Куайин. Они понимают это как более мощный спецэффект. Независимо от того, слышали они о трех словах «большая модель» или нет, это им не мешает. Они становятся реальными пользователями продуктов крупных моделей.

Это первый шаг для Kuaishou и Byte к созданию видео с искусственным интеллектом, если пользователи сами по себе; это также серьезный кризис, с которым они столкнутся в эпоху искусственного интеллекта, если пользователей отвлекут новые продукты, которые уже перестали выпускаться;

Вместо того, чтобы говорить, что они борются за вход в эру ИИ-видео, лучше сказать, что они все защитники. Новая производительность создаст новые формы контента и, в конечном итоге, новые платформы. Эта история знакома и Чэн Исяо, и Чжан Имину.

Они должны быть первого уровня.

(Изображение на обложке создано Келингом.)


Контакты для сотрудничества со СМИ WeChat ID |ciweimeijiejun

Если вы хотите связаться с нами, вы можете ответить «присоединиться к группе» в фоновом режиме, чтобы присоединиться к сообществу.