소식

소라를 기다리지 못하는 노인은 콰이쇼우켈링으로 달려간다.

2024-08-01

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Kuaishou가 AI 비디오를 출시한 최초의 주요 제조업체인 이유는 무엇입니까? ‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

텍스트 | 첸 메이시

편집자 |

Open AI가 대형 모델로 전 세계를 휩쓸었던 초기에 Kuaishou는 눈부신 인물이 아니었습니다. 당시 Baidu는 Wenxinyiyan을, Alibaba는 Tongyi Qianwen을, Tencent는 Hunyuan 대형 모델을 내놓고 서로 따라잡았고 연구 개발 및 개방 속도가 매우 빨랐습니다.

Kuaishou는 초기 경쟁자 목록에 포함되지 않았으며 지금도 Kuaishou의 대규모 언어 모델 이름인 Ruyi를 언급할 수 있는 사람은 거의 없습니다.

올해 6월 6일 전투 상황이 바뀌었습니다. Kuaishou 비디오 생성 대형 모델 Keling이 공개 베타 애플리케이션을 오픈한 날이기도 했습니다. 언론에서는 종종 켈링을 Open AI의 소라(Sora)와 비교하지만, 지난 2월 폭발적인 데뷔 이후 소라는 대중에게 공개되지 않았다. 그 결과, 호기심 많은 중국 사용자들이 Keling으로 몰려들기 시작했습니다.

열흘 후 Keling은 "수만 건의 지원서를 받았습니다." 이 데이터는 그날 Zhiyuan 회의에 참석한 Wan Pengfei에서 나온 것입니다. 연설 당시 그의 직함은 Kuaishou Visual Generation and Interaction Center의 책임자였으며 실제 Keling의 책임자이기도 했습니다. 7월 19일 현재 지원자 수가 100만 명을 넘어섰습니다. 켈링이 올 상반기 대형 모델의 출원 건수를 수만 건에서 100만 건으로 늘리는 데 불과 한 달여가 걸렸다. 이는 가장 눈길을 끄는 성과다.


정신이 만들어낸 그림, 프롬프트 단어: 꽃 속의 벌

반전 이야기는 항상 대중에게 인기가 있습니다. 그러나 켈링과 그 뒤에 있는 콰이쇼우 대형 모델 사업을 주의 깊게 살펴보면, 이는 휴면 상태에 있다가 갑자기 등장하는 멋진 드라마도 아니고, 재능 있는 청년이 소규모 팀을 이끌고 파업에 나서는 영웅적인 서사가 아님을 알 수 있다. 뒤쪽에.

Keling이 생성한 이미지를 기반으로 다음과 같은 프롬프트 단어와 함께 비디오가 추가로 생성됩니다.

Kuaishou가 AI 비디오를 출시한 최초의 주요 제조업체인 이유는 무엇입니까?강한 동기와 높은 우선순위를 가져오는 것은 비즈니스 요구이고, 반복 속도를 가져오는 제품 형태의 데이터와 기술 축적이며, 실제 고객을 가져오는 것은 비즈니스 시나리오의 매칭입니다.

케링의 등장은 우연한 사건이 아니다. 국내적으로 AI 영상 분야에서 Kuaishou의 가장 큰 경쟁자는 ByteDance에서 나올 가능성이 높습니다.


수요가 있으면 동기가 생긴다

창작자는 Kuaishou 콘텐츠 생태계에서 가장 중요한 연결고리 중 하나입니다. Kuaishou가 발표한 공식 데이터에 따르면 2023년에는 Kuaishou에서 처음으로 짧은 동영상을 공개한 크리에이터가 1억 3,800만 명에 달할 것이며, 일년 내내 공개된 동영상은 플랫폼에서 1조 개 이상의 좋아요를 받았습니다.

콘텐츠 제작자 수가 많다는 것은 Kuaishou가 콘텐츠 도구에 대한 요구 사항을 대신해야 함을 의미합니다. 그렇지 않으면 새로운 생산성을 추구하는 제작자가 곧 다른 도구와 심지어 다른 플랫폼으로 달려갈 것입니다. 이는 Kuaiying에서 Kuaishou로, Cutting에서 Byte로의 가치이기도 합니다.

따라서 Kuaishou의 이전 대형 언어 모델에 대한 투자는 급진적이지 않았지만 다중 모드 대형 모델 경쟁에서 상위권을 위해 노력해야 합니다.

Keling 이전에는 Kuaishou가 자체 개발한 Wenshengtu 대형 모델 기능이 Kuaishou에 통합되었습니다. 내부 테스트 결과 사용자는 매달 댓글 영역에서 평균 5억 개 이상의 AI 이미지를 생성했습니다.


Keling이 생성한 사진, 프롬프트 단어: 양쯔강 옆에 서있는 외계인

수요가 가져오는 강력한 동기는 확실히 Keling의 출현에 필요한 조건이지만 Kuaishou만이 이러한 조건을 갖춘 것은 아닙니다. 커링의 등장에 영향을 미친 또 다른 중요한 요소가 있다면 그것은 바로 결단력일 것이다.

결정은 먼저 Kuaishou의 최고 경영진으로부터 나옵니다.

이전에는 대형 모델에 대한 Kuaishou의 움직임이 항상 반 단계 더 느리게 보였습니다. 국내 대형 언어 모델의 경우 누구나 먼저 Wen Xin Yi Yan과 Tong Yi Qian Wen을 떠올릴 것입니다. 대형 언어 모델 애플리케이션의 경우 Kimi와 Doubao가 시장에서 가장 인기가 있습니다. 빈센티안 그래픽 분야에서는 센스타임의 리릭신 5.0이 국내 최초로 출시됐다. 출시 다음날 오전 센스타임 테크놀로지의 주가가 30% 넘게 오르며 거래가 일시적으로 중단됐다.

이전 이야기 시리즈에서 Kuaishou는 겉보기에 주변적인 위치에 있었습니다. 비디오 대형 모델과 해당 응용 프로그램은 경쟁에서 가장 중요한 노드이자 전체 대형 모델 레이아웃에서 가장 중요한 부분입니다.

기술 매체인 Silicon Star의 이전 보도에서 Keling 팀의 한 기술자는 "Gai Kun이 자주 말하는 것은 회사의 모든 카드는 귀하가 사용할 수 있으며 회사는 Yu Yue입니다. "라고 말했습니다. Kuaishou의 수석 부사장이며 역 노선 사업 책임자이자 사회 과학 노선 책임자를 맡고 있습니다. 전 CTO Chen Dingjia가 사임한 후 Gai Kun은 Kuaishou 기술 라인의 최고 리더 중 한 명이 되었습니다.

Wan Pengfei와 그의 팀은 훨씬 더 큰 결심을 가지고 있을지도 모릅니다.한 가지 세부 사항은 Keling 프로젝트를 인수하기로 결정한 후 Wan Pengfei가 모든 당사자의 비즈니스 요구를 수행하는 원래 작업을 Zhang Di 팀의 동일한 수준을 담당하는 다른 사람들에게 넘겼다는 것입니다.이에 따라 Keling 팀의 다른 구성원들도 원래 사업을 넘겨받고 Keling의 연구 개발에 전념했습니다. 진행 상황을 따라잡기 위해 주말에도 초과 근무를 하는 것이 일반적입니다.

Keling이 생성한 사진을 기반으로 추가로 생성된 비디오, 프롬프트 단어: 물 속을 걷고 있는 외계인, 하이파이브하는 두 외계인

"사실 정식 출시를 한달여 앞두고 커링의 테스트 결과는 별로 좋지 않았다"고 대형 모델 업계 관계자는 "라오완 일행이 역경에 맞서 싸우고 있다"고 말했다. 정말 '강력한 기적의 결과'라고 생각한 사람이 많지 않았다.”

그래서 결심이 마지막 변수가 됐다.


축적이 속도를 부른다

Kuaishou 또는 선도적인 단편 비디오 플랫폼은 콘텐츠와 기술이라는 두 가지 측면에서 AI 비디오를 개발하는 경험을 축적했습니다.

동영상은 사용자가 제작하고 플랫폼에서 주석을 달고 이해한 후 배포할 수 있는 콘텐츠를 필터링합니다. 이는 Kuaishou의 비즈니스 논리에 내재된 경로입니다. 처리된 콘텐츠는 일종의 데이터가 됩니다. 콘텐츠 자체에 대한 설명부터 배포 후 인기까지, Kuaishou는 방대한 양의 콘텐츠 데이터를 마스터했습니다.평신도의 관점에서 보면 둘 다 콘텐츠를 가지고 있고 사용자가 보고 싶어하는 "좋은 콘텐츠"가 무엇인지 알고 있습니다.

대규모 생성 비디오 모델 학습의 경우 이 프로세스는 미리 요리를 준비하는 것과 같습니다.

"요리사"조차도 기성품입니다.

Keling 프로젝트팀의 핵심 R&D 구성원 대부분은 Wan Pengfei의 Y-tech 시대 부하 직원입니다. 연초에 팀원들은 관련 정보와 자료를 점차적으로 접하고 Keling의 연구 개발에 착수했습니다.

이전에 Wan Pengfei 팀은 주로 Kuaishou 크리에이티브 생태계에서 UGC 지능형 제작 요구 사항을 담당했으며 메인 스테이션 제작, Kuaiying 및 Yitian Camera와 같은 비즈니스 당사자와 긴밀히 협력했습니다. 제품 형태에는 인물 미화, 오디오 및 비디오 특수 효과가 포함됩니다. , 라이브 방송 아바타 등

2021년 Wan Pengfei는 글로벌 인공 지능 기술 컨퍼런스에서 "Y-tech 부서의 AI 기술 플랫폼 책임자"로서 공개 연설을 했습니다.당시 공유된 사례 중에는 빅 모델 이전 시대의 Tusheng 비디오 게임플레이인 '리빙 포토 특수 효과'가 있었습니다. 당시 Kuaishou와 Kuaiying의 템플릿 라이브러리는 "움직이는 오래된 사진" 특수 효과를 출시했습니다. 사용자가 사진을 업로드하면 사진 속 캐릭터가 미소 짓고, 눈을 깜박이고, 고개를 끄덕이는 등의 움직임을 만들어 비디오 효과를 만들 수 있습니다. 보고에 따르면 이 역동적인 특수 효과는 Kuaiying에서 344만 명 이상의 사람들이 사용했습니다.


Kuaishou 네티즌 @senyuhelu가 2021년에 공개한 감동적인 오래된 사진과 비디오

2021년 Wan Pengfei는 생성 기술 개발에 큰 자신감을 갖고 "생성 모델이 점점 더 강력해지고, 생성된 콘텐츠가 더욱 현실적이 되며, 생성 프로세스가 더욱 안정적이고 제어 가능해질 것"이라고 제안했습니다.

3년 후 Keling은 자신의 작품 "Reviving Old Photos"로 다시 한 번 등장했습니다. 사용 허가를 신청한 일부 사용자는 "Tusheng Video" 기능을 사용하여 사망한 친척의 사진을 비디오로 변환했습니다. 3년 전의 '살아있는 사진 특수 효과'와 비교하면 사용자는 공개 지침을 통해 사진 속 캐릭터를 더욱 복잡한 동작으로 만들 수 있습니다. 이것이 바로 새로운 대형 모델 기술이 가져온 변화입니다.

Sora는 올해 2월에 출시되었고 Kuaishou Keling 팀은 가까운 시기에 구성되기 시작했지만 다중 모드 기반 비디오 생성 기술의 개발 및 적용은 항상 Wan Pengfei와 그의 팀의 작업 범위 내에 있었습니다. .

위에서 언급한 실무자들은 Hedgehog Commune에 대해 유사한 견해를 표명했습니다. "사실 Sora의 출현은 모든 사람이 해당 노드에서 기술적 경로나 계획을 결정하도록 하는 것과 동일하지만 다중 모드를 포함하여 시각 기술의 응용이 많이 있습니다. 그게 그들이 항상 해왔던 일이에요.”

Ke Ling에게 필요한 기술 축적은 여기에서 비롯됩니다. 요리사는 준비된 요리를 발견했고, 새로운 요리법이 전 세계에 공개된 후 Kuaishou는 완성된 제품을 가장 빠르게 만드는 팀 중 하나가 되었습니다.

그러나 동시에 위에서 언급한 실무자들도 Keling이 오랫동안 기술과 제품 분야에서 선두 위치를 유지할 수 있을지 관망하는 태도를 가지고 있습니다. "현재 모든 사람이 사용하는 알고리즘은 비슷합니다. 각 회사마다 약간의 미세 조정이 있을 수 있지만 차이점은 여전히 ​​동일합니다." 비슷한 효과를 내는 제품을 생산합니다.

따라서 속도는 Kuaishou의 일시적인 장점일 뿐이며 선도 기간 동안 자신의 장점을 안정적인 고객으로 전환해야 합니다.


장면이 있는 곳에 손님이 있다

2020년 12월 29일, Kuaishou는 "고객에 대한 집착"이 Kuaishou 가치의 핵심임을 밝히며 전 직원에게 보낸 내부 서한을 통해 처음으로 "Kuaishou 파벌"을 기업 가치로 공식 발표했습니다.

이전에는 Kuaishou에서든 다른 주요 인터넷 회사에서든 '사용자'라는 개념이 더 자주 언급되었습니다. 이러한 이유로 Kuaishou는 이러한 어휘 변경 이유를 구체적으로 설명했습니다. "회사의 비즈니스 복잡성은 더욱 높아져 '사용자'에서 '고객'으로 확장되었습니다. 고객에는 생산자와 소비자, B측 고객과 C측 사용자, 외부 고객과 내부 고객이 포함됩니다. 생산자와 소비자에 대한 이해를 강화해야 합니다. B사이드 고객에 대한 고객의 이해와 인식을 높이기 위해서는 내부 고객에게도 서비스 인식을 강조해야 합니다.”

2024년을 돌이켜보면 그야말로 Kuaishou의 사업 구조 변화에 중요한 분수령이었습니다. 2020년 Kuaishou의 연간 매출 중 라이브 방송 매출 비중은 전년도 80.4%에서 56.5%로 감소했고, 온라인 마케팅 서비스 매출 비중은 19%에서 37.2%로 증가했습니다. 서비스 매출 비중은 전년 1%에서 6.3%로 빠르게 상승했다.

Kuaishou 자체가 설명했듯이 생산자와 소비자, B측 고객과 C측 사용자, 외부 고객과 내부 고객은 모두 Kuaishou의 중요한 고객이며 Kuaishou 대형 모델의 대상 고객이 될 것입니다.

생산자와 소비자가 공동으로 Kuaishou의 가장 기본적인 비즈니스 체인을 구축합니다. 생산자는 콘텐츠를 생산하고 소비자는 콘텐츠를 소비합니다.대형모델 상품의 가치는 제작 문턱을 낮추면서 콘텐츠 품질을 높이는 데 있다.

전자는 이해하기 쉽습니다. 현재 Keling이 달성할 수 있는 것처럼, 촬영 조건과 제작 능력이 없는 사람들의 경우 텍스트나 사진을 입력하여 비디오를 얻을 수 있습니다.

후자는 처음에는 약간 반직관적으로 들립니다. 현재 AI 비디오 제품의 시뮬레이션 기능과 출력 길이를 고려할 때 품질 측면에서 실제 촬영 및 전문 제작보다 어떻게 더 나을 수 있습니까? 하지만 Kuaishou와 Douyin과 같은 주요 플랫폼에서는 매일 제작되는 수천만 개의 짧은 동영상의 대부분이 전문 콘텐츠 제작자의 눈에 '충분히 정교하지 않은' AI 기술만으로도 일반 사용자를 사로잡기에 충분합니다. ' 소재와 풍성함을 더하려면 무작위로 촬영하세요.

B면 판매자는 Kuaishou의 대형 모델 역량의 고객이 될 수도 있습니다. Kuaishou가 올해 세계인공지능회의에서 발표한 자료에 따르면 AI 광고 수익은 하루 2천만 건을 넘어섰습니다. AI로 생성된 광고 자료는 CTR을 기준으로 유지하면서 항목당 비용을 0.47위안으로 줄일 수 있습니다.


Keling은 그림과 프롬프트 단어를 생성합니다. 사과 주스 광고 자료, 흰색 테이블에 사과 주스 한 잔이 있고 측면에 빨간 사과 두 개가 있습니다.

많은 대형 모델 제품의 경우 제품 수명 주기 전반에 걸쳐 착륙 시나리오를 찾는 것이 어려운 문제이지만 Kuaishou에는 분명히 시나리오가 부족하지 않습니다.Kuaishou의 부사장이자 대형 모델 책임자인 Zhang Di는 Keling의 성공은 "사용자의 실제 요구 사항을 충족하기 위해 실제 장면에서 실제 가치를 창출하는 것"에서 비롯된다고 말했습니다.

그들이 직면해야 할 문제는 현재 시나리오에서 어떻게 사용자를 Kuaishou 대형 모델의 고빈도 사용자로 만들고 지속적으로 비용을 지불할 의향을 갖게 하며 먼저 자신의 생태계 내에서 대형 모델의 상용화를 실현할 수 있는지입니다.

7월 25일 Keling은 등록을 완전히 개시했으며 같은 날 Keling은 멤버십 시스템을 출시하고 충전 단계에 들어갔습니다.

Keling 공식 홈페이지 정보에 따르면, 비회원 사용자는 매일 로그인 시 66개의 영감 포인트를 받을 수 있으며, 현재 '가격' 기준으로 약 6개의 동영상 또는 330개의 사진을 무료로 생성할 수 있습니다.

두 가지 결제 모델이 있는데, 하나는 멤버십 모델이며, 사용자는 월별, 분기별, 반기별 또는 1년 단위로 다양한 멤버십을 구매할 수 있습니다. 사용자가 직접 결제하여 충전할 경우 사용자의 동영상 제작비는 1위안, 사진 1장 제작비는 2센트입니다.


Keling이 생성한 그림, 프롬프트 단어: 일출, 수평선에 아름다운 구름과 아침 빛이 있고, 태양이 구름 속에 숨겨져 있습니다.

Keling의 가격 책정 시스템과 관련하여 주목할 만한 두 가지 사항이 있습니다.

첫째, Kuaishou는 무제한 작품을 생성할 수 있는 멤버십 옵션을 제공하지 않습니다. 즉, 재충전 모드를 선택하든 멤버십 모드를 선택하든 사용자는 실제로 "시간을 구매하기 위해 돈을 지불"한다는 의미입니다.차이점은 세대별 단가뿐 아니라 워터마크 제거, 영상 확장, 마스터 미러 이동 등 차별화된 기능뿐이다.

AI 영상을 생성하는 데 드는 비용은 높으며 Kuaishou는 무제한으로 생성할 수 있는 회원을 제공하지 않습니다. Kuaishou는 분명히 가능한 비용 통제를 피하고 회색 생산을 어느 정도 억제하고 싶어합니다.

둘째, Keling의 "지불 통화"로서의 영감 가치는 Kuaishou 생태계의 앵커에게 보상하는 데 사용되는 Kuai 코인과 가격이 동일합니다. 1위안으로 퀵 코인 10개 또는 영감 포인트 10개를 구매할 수 있습니다. 이러한 가격 책정 방법은 향후 Kuaishou 생태계 내에서 결제 시스템을 개방할 가능성을 보존할 수 있습니다.


Kuaishou는 요구 사항, 시나리오, 고객, 장비, 데이터, 기술 및 인재 보유량을 동시에 갖춘 유일한 회사가 아닙니다.

위에서 언급한 업계 관계자들은 가까운 미래에 Byte가 동일한 수준의 생성적 비디오 제품을 생산할 수 있을 것이라고 예측합니다. 그 전에 Kuaishou는 창구 기간 내에 사용자 축적과 콘텐츠 축적을 완료해야 AI 콘텐츠가 Kuaishou 생태계 내에서 효과적으로 작동할 수 있으며 상용화 경로를 통과하여 선두 주자 위치에 앉을 수 있는 것이 가장 좋습니다. 더 오랜 시간.

기존의 성장 및 운영 수단이 의제에 있습니다. Keling의 공식 웹사이트는 회원을 위한 50% 할인 이벤트를 신속하게 시작했습니다. 동시에 사용자는 매일 로그인하여 66개의 영감 포인트를 얻을 수 있어 결제 모델이 사용자 성장 및 유지에 미치는 영향을 줄여 모든 사용자가 최소한 한계점 없이 시도해 보세요.

또한 Keling은 Kuaishou 사이트 운영에 있어서 생성 비디오, 확산 모델 솔루션, 분산 학습 클러스터 등의 개념을 너무 강조하지 않고 "오래된 사진을 비디오로" 사용하여 "당신을 포용합니다. 시간과 공간', '40년 전 부활', '이전 사진' 등의 게임 플레이 방법을 통해 사용자가 먼저 사용하도록 유도하여 사용자의 이해 비용을 줄입니다.

일반 사용자의 경우 새로운 게임 플레이는 이전 Kuaiying 특수 효과 게임 플레이와 동일한 난이도를 가지고 있습니다. 그들은 "대형 모델"이라는 세 단어를 들어본 적이 있든 없든 이를 방해하지 않습니다. .대형모델 제품의 실제 사용자가 됩니다.

사용자가 자신의 것이라면 이는 Kuaishou와 Byte가 AI 동영상을 만드는 궁극적인 첫 번째 단계이며, 사용자가 새로운 단속적인 제품에 매력을 느낀다면 AI 시대에 직면한 궁극적인 위기이기도 합니다.

AI 영상시대 진입을 놓고 경쟁하고 있다기보다는 모두가 수비수라고 보는 편이 낫다. 새로운 생산성은 새로운 콘텐츠 형식과 궁극적으로 새로운 플랫폼을 창출할 것입니다. 이 이야기는 Cheng Yixiao와 Zhang Yiming 모두에게 친숙합니다.

그들은 첫 번째 계층이어야 합니다.

(Keling이 생성한 표지 이미지)


미디어 협력 연락처 WeChat ID |ciweimeijiejun

우리와 소통하고 싶다면 백그라운드에서 "그룹 가입"이라고 답장하여 커뮤니티에 가입할 수 있습니다.