Nachricht

Der alte Mann, der nicht auf Sora warten kann, eilt zu Kuaishou Keling

2024-08-01

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Warum ist Kuaishou der erste große Hersteller, der KI-Videos auf den Markt bringt? ‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

Text |. Chen Meixi

Herausgeber |. Regisseur

In den frühen Tagen, als Open AI in Bezug auf große Modelle die Welt im Sturm eroberte, war Kuaishou keine schillernde Figur. Zu dieser Zeit entwickelte Baidu Wenxiniyan, Alibaba Tongyi Qianwen und Tencent das große Modell Hunyuan.

Kuaishou stand zunächst nicht auf der Kandidatenliste, und selbst jetzt können nur wenige Menschen den Namen von Kuaishous großem Sprachmodell nennen: Ruyi.

Die Kampfsituation änderte sich am 6. Juni dieses Jahres, als das große Kuaishou-Video die Bewerbungen für die öffentliche Beta öffnete. An diesem Tag jährte sich Kuaishou auch zum 13. Mal. Die Medien vergleichen Keling oft mit Sora von Open AI, aber seit seinem explosiven Debüt im Februar war Sora nicht mehr für die Öffentlichkeit zugänglich. Infolgedessen strömten neugierige chinesische Benutzer zu Keling.

Zehn Tage später hat Keling „Zehntausende Bewerbungen erhalten“. Diese Daten stammen von Wan Pengfei, der an diesem Tag an der Zhiyuan-Konferenz teilnahm. Zum Zeitpunkt der Rede war sein Titel Leiter des Kuaishou Visual Generation and Interaction Center und er war auch der tatsächliche Verantwortliche von Keling. Am 19. Juli lag die Zahl der Bewerber bei über einer Million. Keling brauchte nur mehr als einen Monat, um die Zahl der Anträge von Zehntausenden auf eine Million zu steigern. Unter den Fortschritten großer Modelle im ersten Halbjahr ist dies die auffälligste Leistung.


Das vom Geist erzeugte Bild, das prompte Wort: Biene in den Blumen

Geschichten über Turnarounds erfreuen sich in der Öffentlichkeit immer großer Beliebtheit. Eine sorgfältige Bestandsaufnahme von Keling und dem dahinter stehenden großen Modelgeschäft von Kuaishou zeigt jedoch, dass es sich hierbei weder um ein cooles Drama handelt, das schlummert und dann plötzlich auftaucht, noch um eine heroische Erzählung, in der ein talentierter junger Mann ein kleines Team zum Streik anführt zurück.

Basierend auf dem von Keling generierten Bild wird außerdem ein Video mit dem Aufforderungswort „Bienen fliegen herum“ generiert

Warum ist Kuaishou der erste große Hersteller, der KI-Videos auf den Markt bringt?Es sind Geschäftsanforderungen, die starke Motivation und hohe Priorität mit sich bringen, es ist die Anhäufung von Daten und Technologie in Produktform, die die Iterationsgeschwindigkeit erhöht, und es ist die Abstimmung von Geschäftsszenarien, die echte Kunden hervorbringt.

Das Erscheinen von Ke Ling ist kein Zufall. Im Inland wird Kuaishous größter Rivale im Bereich KI-Video höchstwahrscheinlich von ByteDance kommen.


Wenn es Nachfrage gibt, gibt es Motivation

Ersteller sind eines der wichtigsten Bindeglieder im Content-Ökosystem von Kuaishou. Nach offiziellen von Kuaishou veröffentlichten Daten wird es im Jahr 2023 138 Millionen YouTuber geben, die zum ersten Mal Kurzvideos auf Kuaishou veröffentlicht haben, und die im Laufe des Jahres veröffentlichten Videos erhielten mehr als 1 Billion Likes auf der Plattform.

Da es eine große Anzahl von Content-Erstellern gibt, muss Kuaishou deren Bedarf an Content-Tools decken. Andernfalls werden sich Creator, die auf der Suche nach neuer Produktivität sind, bald auf andere Tools und sogar andere Plattformen stürzen. Dies ist auch der Wert von Kuaiying zu Kuaishou und Cutting to Byte.

Daher war Kuaishous bisherige Investition in große Sprachmodelle nicht radikal, aber es muss im Wettbewerb multimodaler großer Modelle nach oben streben.

Vor Keling war Kuaishous selbst entwickelte Wenshengtu-Großmodellfunktion in Kuaishou integriert worden. Das Ergebnis interner Tests war, dass Benutzer jeden Monat durchschnittlich mehr als 500 Millionen KI-Bilder im Kommentarbereich generierten.


Das von Keling erzeugte Bild, das prompte Wort: Außerirdischer steht am Jangtsekiang

Die durch die Nachfrage hervorgerufene starke Motivation ist sicherlich eine notwendige Voraussetzung für die Entstehung von Keling, aber Kuaishou ist nicht der Einzige mit diesen Bedingungen. Wenn es einen anderen wichtigen Faktor gibt, der die Entstehung von Ke Ling beeinflusst hat, dann könnte es Entschlossenheit sein.

Die Entschlossenheit kommt zunächst von Kuaishous Top-Management.

Bisher schienen Kuaishous Bewegungen bei großen Modellen immer einen halben Schritt langsamer zu sein. Wenn es um inländische große Sprachmodelle geht, denkt jeder zuerst an Wen Xin Yi Yan und Tong Yi Qian Wen; wenn es um große Sprachmodellanwendungen geht, sind Kimi und Doubao die beliebtesten auf dem Markt. Im Bereich der vinzentinischen Grafiken war Ririxin 5.0 von SenseTime der erste, der den heimischen Markt durchbrach. Am Morgen nach seiner Veröffentlichung stieg der Aktienkurs von SenseTime Technology um mehr als 30 %, und der Handel wurde vorübergehend eingestellt.

In der vorherigen Geschichtenreihe befand sich Kuaishou in einer scheinbar marginalen Position. Video-Großmodelle und ihre Anwendungen sind der wichtigste Knotenpunkt im Wettbewerb und der wichtigste Teil des gesamten Großmodell-Layouts.

In einem früheren Bericht des Technologiemediums Silicon Star sagte ein Techniker des Keling-Teams: „Gai Kun sagt oft, dass alle Karten des Unternehmens für Sie bestimmt sind und das Unternehmen Yu Yue voll und ganz unterstützt.“ Er ist der leitende Vizepräsident von Kuaishou und fungiert als Geschäftsführer. Er ist für das Stationsliniengeschäft und auch für die sozialwissenschaftliche Linie verantwortlich. Nach dem Rücktritt des ehemaligen CTO Chen Dingjia wurde Gai Kun einer der führenden Köpfe der Technologiesparte von Kuaishou.

Wan Pengfei und sein Team könnten sogar noch entschlossener sein.Ein Detail ist, dass Wan Pengfei nach der Entscheidung, das Keling-Projekt zu übernehmen, die ursprüngliche Aufgabe, die Geschäftsanforderungen aller Parteien zu erfüllen, an andere Verantwortliche auf derselben Ebene im Team von Zhang Di übergab.Dementsprechend haben auch andere Mitglieder des Keling-Teams das ursprüngliche Geschäft übergeben und sich voll und ganz der Forschung und Entwicklung von Keling gewidmet. Es ist normal, am Wochenende Überstunden zu machen, um mit den Fortschritten Schritt zu halten.

Ein weiter erstelltes Video, das auf dem von Keling erstellten Bild basiert, mit den Worten: Alien läuft im Wasser, zwei Aliens klatschen ab

„Tatsächlich waren die Testergebnisse von Ke Ling mehr als einen Monat vor der offiziellen Veröffentlichung nicht sehr gut.“ Ein Praktiker in der großen Modellindustrie sagte zu Hedgehog Commune: „Lao Wan und die anderen kämpfen gegen alle Widrigkeiten. Was folgt ist.“ wirklich 'wundersame Ergebnisse mit großer Kraft'. Viele Menschen hatten am Ende nicht mit einer solchen Wirkung gerechnet.“

So wurde die Entschlossenheit zur letzten Variablen.


Akkumulation führt zu Geschwindigkeit

Kuaishou oder jede führende Kurzvideoplattform hat Erfahrung in der Entwicklung von KI-Videos in zwei Aspekten: Inhalt und Technologie.

Videos werden von Benutzern produziert, und nachdem sie von der Plattform kommentiert und verstanden wurden, werden die Inhalte, die verbreitet werden können, herausgefiltert. Dies ist der inhärente Weg in Kuaishous Geschäftslogik. Der verarbeitete Inhalt wird zu einer Art Daten. Von der Beschreibung des Inhalts selbst bis zur Popularität nach der Verbreitung beherrscht Kuaishou eine riesige Menge an Inhaltsdaten.Laienhaft ausgedrückt: Beide verfügen über Inhalte und wissen, welche „guten Inhalte“ Nutzer gerne sehen.

Für das Training großer generativer Videomodelle ähnelt dieser Prozess der Zubereitung der Gerichte im Voraus.

Sogar der „Koch“ ist fertig.

Die meisten der wichtigsten F&E-Mitglieder des Keling-Projektteams sind Wan Pengfeis alte Untergebene aus der Y-Tech-Zeit. Zu Beginn des Jahres kamen die Teammitglieder nach und nach mit relevanten Informationen und Materialien in Kontakt und begannen, an der Forschung und Entwicklung von Keling zu arbeiten.

Zuvor war das Team von Wan Pengfei hauptsächlich für die Umsetzung der intelligenten UGC-Erstellungsanforderungen im Rahmen des kreativen Ökosystems von Kuaishou verantwortlich und arbeitete eng mit Unternehmen wie der Hauptstationsproduktion, Kuaiying und Yitian Camera zusammen. Die Produktformen umfassen Porträtverschönerung sowie Audio- und Videospezialeffekte , Live-Avatare usw.

Im Jahr 2021 hielt Wan Pengfei eine öffentliche Rede als „Leiter der KI-Technologieplattform der Y-Tech-Abteilung“ auf der Global Artificial Intelligence Technology Conference.Zu den damals geteilten Fällen gehörte der „Living Photo Special Effect“ – ein Tusheng-Video-Gameplay in der Ära vor den großen Modellen. Damals starteten die Vorlagenbibliotheken von Kuaishou und Kuaiying den Spezialeffekt „Alte Fotos bewegen“. Nachdem Benutzer ein Foto hochgeladen haben, können die Charaktere auf dem Foto Bewegungen wie Lächeln, Blinzeln und Nicken ausführen, um einen Videoeffekt zu erzeugen. Berichten zufolge wurde dieser dynamische Spezialeffekt von mehr als 3,44 Millionen Menschen in Kuaiying genutzt.


Die bewegenden alten Fotos und Videos, die 2021 vom Kuaishou-Netizen @senyuhelu veröffentlicht wurden

Im Jahr 2021 zeigte sich Wan Pengfei sehr zuversichtlich in Bezug auf die Entwicklung der generativen Technologie und schlug vor, dass „generative Modelle immer leistungsfähiger, die generierten Inhalte realistischer und der Generierungsprozess stabiler und kontrollierbarer werden“.

Drei Jahre später trat Keling erneut mit seinem Werk „Reviving Old Photos“ in Erscheinung. Einige Nutzer, die eine Nutzungserlaubnis beantragten, nutzten die Funktion „Tusheng Video“, um Fotos verstorbener Angehöriger in Videos umzuwandeln. Im Vergleich zu den „Live-Foto-Spezialeffekten“ vor drei Jahren können Benutzer durch offene Anweisungen die Charaktere in den Fotos zu komplexeren Aktionen veranlassen. Dies ist genau die Änderung, die durch die neue Großmodelltechnologie bewirkt wird.

Sora wurde im Februar dieses Jahres veröffentlicht und das Kuaishou Keling-Team begann sich zu einem knappen Zeitpunkt zu bilden, aber die Entwicklung und Anwendung multimodaler Videogenerierungstechnologie lag schon immer im Arbeitsbereich von Wan Pengfei und seinem Team .

Die oben genannten Praktizierenden äußerten ähnliche Ansichten gegenüber Hedgehog Commune: „Tatsächlich ist die Entstehung von Sora gleichbedeutend damit, dass jeder die technische Route oder den technischen Plan an diesem Knotenpunkt bestimmen kann, aber es gibt viele Anwendungen visueller Technologie, einschließlich multimodaler Dinge.“ Das haben sie schon immer getan.“

Daraus ergibt sich die technische Anhäufung, die Ke Ling benötigt. Der Koch stieß auf das zubereitete Gericht, und nachdem ein neues Rezept auf der ganzen Welt bekannt wurde, wurde Kuaishou zu einem der Teams, die das fertige Produkt am schnellsten zubereiteten.

Gleichzeitig haben die oben genannten Praktiker aber auch eine abwartende Haltung, ob Keling auf lange Sicht eine führende Position in Technologie und Produkten einnehmen kann. „Die Algorithmen, die jetzt von allen verwendet werden, sind vielleicht etwas feiner abgestimmt, aber der Unterschied ist immer noch derselbe, bei Karten, Daten und ähnlichen Algorithmen ist es nur eine Frage der Zeit, bis jedes Unternehmen kommt.“ stellt Produkte mit ähnlicher Wirkung her.

Daher ist Geschwindigkeit nur ein vorübergehender Vorteil von Kuaishou. Sie müssen ihren Vorteil in der Hauptfensterperiode wirklich in stabile Kunden umwandeln.


Wo eine Szene ist, sind Kunden

Am 29. Dezember 2020 veröffentlichte Kuaishou in einem internen Brief an alle Mitarbeiter erstmals offiziell die „Kuaishou-Fraktion“ als Unternehmenswert und erklärte, dass „Kundenbesessenheit“ der Kern der Werte von Kuaishou sei.

Früher wurde sowohl bei Kuaishou als auch bei anderen großen Internetunternehmen häufiger der Begriff „Benutzer“ verwendet. Aus diesem Grund erläuterte Kuaishou ausdrücklich die Gründe für diese Wortschatzänderung. „Die Geschäftskomplexität des Unternehmens ist höher geworden und hat sich von ‚Benutzern‘ zu ‚Kunden‘ ausgeweitet. Zu den Kunden zählen Produzenten und Verbraucher, B-Seiten-Kunden und C-Seiten-Benutzer, externe Kunden und interne Kunden. Wir müssen unser Verständnis von Produzenten und Kunden stärken Um das Kundenverständnis und -bewusstsein zu verbessern, müssen wir auch das Servicebewusstsein gegenüber internen Kunden hervorheben.“

Rückblickend auf das Jahr 2024 war es tatsächlich ein wichtiger Wendepunkt in den Veränderungen in der Geschäftsstruktur von Kuaishous. Im Jahr 2020 sank der Anteil der Einnahmen aus Live-Übertragungen am Jahresumsatz von Kuaishou von 80,4 % im Vorjahr auf 56,5 %, und der Anteil der Einnahmen aus Online-Marketingdienstleistungen stieg von 19 % auf 37,2 % Der Anteil am Serviceumsatz stieg von 1 % im Vorjahr schnell auf 6,3 %.

Wie Kuaishou selbst erklärt hat, sind Produzenten und Verbraucher, B-Seite-Kunden und C-Seite-Benutzer, externe Kunden und interne Kunden allesamt wichtige Kunden von Kuaishou und werden auch die Zielkunden des großen Modells von Kuaishou.

Produzenten und Verbraucher bilden gemeinsam die grundlegendste Geschäftskette von Kuaishou. Produzenten produzieren Inhalte und Verbraucher konsumieren Inhalte.Der Wert großer Modellprodukte liegt in der Senkung der Produktionsschwelle bei gleichzeitiger Verbesserung der Inhaltsqualität.

Ersteres ist leicht zu verstehen, da Keling derzeit ein Video durch Eingabe von Text oder Bildern erstellen kann. Für Personen ohne Aufnahmebedingungen und Produktionsfähigkeiten wurde die Produktionsschwelle erheblich gesenkt.

Letzteres klingt zunächst etwas kontraintuitiv – wie kann es angesichts der Simulationsmöglichkeiten und Ausgabelänge aktueller KI-Videoprodukte qualitativ besser sein als echte Dreharbeiten und professionelle Produktion? Auf führenden Plattformen wie Kuaishou und Douyin stammen jedoch die meisten der zig Millionen täglich produzierten Kurzvideos von normalen Benutzern. In den Augen professioneller Content-Produzenten reicht die „nicht ausgereifte“ KI-Technologie aus, um normale Benutzer zu erstellen „Machen Sie zufällige Aufnahmen, um Material und Fülle hinzuzufügen.

B-Side-Händler können auch Kunden der großen Modellkapazitäten von Kuaishou werden. Nach Angaben von Kuaishou, die dieses Jahr auf der Weltkonferenz für künstliche Intelligenz veröffentlicht wurden, belaufen sich die Einnahmen aus KI-Werbung auf über 20 Millionen pro Tag. KI-generierte Werbematerialien können die Kosten pro Artikel auf 0,47 Yuan senken und gleichzeitig die CTR auf dem Basiswert halten.


Keling generiert Bilder, prompte Worte: Werbematerial für Apfelsaft, auf dem weißen Tisch steht ein Glas Apfelsaft, daneben zwei rote Äpfel

Für viele Produkte mit großen Modellen ist das Auffinden von Landungsszenarien während des gesamten Produktlebenszyklus ein schwieriges Problem, aber in Kuaishou mangelt es offensichtlich nicht an Szenarien.Wie Zhang Di, Vizepräsident von Kuaishou und Leiter von Großmodellen, sagte, beruht Kelings Erfolg darauf, „in realen Szenen echten Wert zu schöpfen, um die tatsächlichen Bedürfnisse der Benutzer zu erfüllen“.

Das Problem, dem sie sich stellen müssen, besteht darin, wie man Benutzer dazu bringen kann, im aktuellen Szenario Hochfrequenznutzer der großen Modelle von Kuaishou zu werden und bereit zu sein, weiterhin dafür zu zahlen, und zunächst die Kommerzialisierung großer Modelle innerhalb ihres eigenen Ökosystems zu realisieren.

Am 25. Juli öffnete Keling die Registrierung vollständig. Am selben Tag startete Keling sein Mitgliedschaftssystem und trat in die Ladephase ein.

Laut Angaben auf der offiziellen Website von Keling können Nicht-Mitglieder bei täglicher Anmeldung 66 Inspirationspunkte erhalten, entsprechend dem aktuellen „Preis“ können etwa 6 Videos oder 330 Bilder kostenlos generiert werden.

Es gibt zwei Zahlungsmodelle. Benutzer können unterschiedliche Mitgliedschaftsstufen auf monatlicher, vierteljährlicher, halbjähriger oder einjähriger Basis erwerben Beim Auflademodell, bei dem Benutzer direkt für das Aufladen bezahlen können, betragen die Produktionskosten des Benutzers für jedes Video 1 Yuan und die Produktionskosten für jedes Bild 2 Cent.


Das von Keling erzeugte Bild, das prompte Wort: Sonnenaufgang, es gibt wunderschöne Wolken und Morgenlicht am Horizont, die Sonne ist in den Wolken verborgen

Beim Preissystem von Keling sind zwei Punkte zu beachten.

Erstens bietet Kuaishou keine Mitgliedschaftsoption an, die unbegrenzte Werke generieren kann, was bedeutet, dass Benutzer unabhängig davon, ob sie den Auflademodus oder den Mitgliedschaftsmodus wählen, tatsächlich „Geld bezahlen, um Zeiten zu kaufen“.Der einzige Unterschied besteht im Stückpreis jeder Generation sowie in differenzierten Funktionen wie Wasserzeichenentfernung, Videoverlängerung und Master-Spiegelbewegung.

Die Kosten für die Erstellung von KI-Videos sind hoch, und Kuaishou stellt keine Mitglieder zur Verfügung, die unbegrenzte Zeiten generieren können. Kuaishou möchte offensichtlich eine mögliche Kostenkontrolle vermeiden und die Grauproduktion bis zu einem gewissen Grad eindämmen.

Zweitens entspricht der Inspirationswert als Kelings „Zahlungswährung“ preislich den Kuai-Münzen, die zur Belohnung von Ankern im Kuaishou-Ökosystem verwendet werden. Mit 1 Yuan RMB können Sie 10 Schnellmünzen oder 10 Inspirationspunkte kaufen. Diese Preisgestaltungsmethode kann die Möglichkeit einer künftigen Öffnung des Zahlungssystems innerhalb des Kuaishou-Ökosystems wahren.


Kuaishou ist bei weitem nicht das Einzige, das gleichzeitig über Bedürfnisse, Szenarien, Kunden, Ausrüstung, Daten, Technologie und Talentreserven verfügt.

Die oben genannten Brancheninsider gehen davon aus, dass Byte in naher Zukunft in der Lage sein wird, generative Videoprodukte auf demselben Niveau zu produzieren. Zuvor muss Kuaishou die Benutzerakkumulation und die Inhaltsakkumulation innerhalb des Fensterzeitraums abschließen, damit KI-Inhalte effektiv im Kuaishou-Ökosystem funktionieren können. Es ist am besten, den Kommerzialisierungspfad zu durchlaufen und an der Spitze zu stehen eine längere Zeit.

Konventionelle Wachstums- und Betriebsformen stehen auf der Tagesordnung. Auf der offiziellen Website von Keling wurde schnell eine 50-prozentige Rabattaktion für Mitglieder gestartet. Gleichzeitig können Benutzer durch tägliches Anmelden 66 Inspirationspunkte erhalten, um die Auswirkungen des Zahlungsmodells auf das Benutzerwachstum und die Benutzerbindung zu verringern, sodass alle Benutzer dies tun können Probieren Sie es ohne Schwelle aus.

Darüber hinaus legt Keling beim Betrieb der Kuaishou-Site nicht zu viel Wert auf Konzepte wie generatives Video, Diffusionsmodelllösungen und verteilte Trainingscluster, sondern verwendet „alte Fotos, um Videos zu werden“ und „umarmt Sie“. Zeit und Raum“ und „Auferstehung vor 40 Jahren“. „Vorheriges Foto“ und andere Spielmethoden, um Benutzer dazu zu bewegen, es zuerst zu verwenden, um so die Verständniskosten des Benutzers zu senken.

Für normale Benutzer hat das neue Gameplay den gleichen Schwierigkeitsgrad wie das bisherige Kuaiying-Spezialeffekt-Gameplay. Sie verstehen es als einen stärkeren Spezialeffekt, egal ob sie von den drei Wörtern „großes Modell“ gehört haben oder nicht . Sie werden zu tatsächlichen Nutzern großer Modellprodukte.

Dies ist für Kuaishou und Byte der ultimative erste Schritt, KI-Videos zu erstellen. Wenn die Nutzer ihre eigenen sind, ist es auch die ultimative Krise im KI-Zeitalter, wenn Nutzer von neuen diskontinuierlichen Produkten abgezogen werden.

Anstatt zu sagen, dass sie um den Eintritt in die KI-Video-Ära konkurrieren, ist es besser zu sagen, dass sie alle Verteidiger sind. Neue Produktivität wird neue Inhaltsformen und letztendlich neue Plattformen schaffen. Diese Geschichte ist sowohl Cheng Yixiao als auch Zhang Yiming bekannt.

Sie müssen die erste Stufe sein.

(Titelbild erstellt von Keling.)


Medienkooperation Kontakt WeChat ID |ciweimeijiejun

Wenn Sie mit uns kommunizieren möchten, können Sie im Hintergrund auf „Der Gruppe beitreten“ antworten, um der Community beizutreten.