Nachricht

Kuaishous „Keling“ wurde unerwartet populär, Byte wollte unbedingt aufholen und die Konkurrenz auf dem AI Wensheng-Videotrack verschärfte sich

2024-07-31

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina



Im Februar 2024 verhinderte das Aufkommen von Sora, dass viele große Modellunternehmen ein gutes Frühlingsfest veranstalten konnten.

„Die Frühlingsfest-Gala wird immer noch wiederholt, daher organisieren wir dringend Gruppendiskussionen“, sagte ein Mitarbeiter eines führenden KI-Unternehmens eifrig gegenüber „City Circle“. Angesichts der reibungslosen Erfahrung von Sora beeilen sich sogar Blogger, die Kurse verkaufen, mit der Einführung von Online-Tutorials und verdienen viel Geld.

Wer kann die inländische Version von Sora am schnellsten „kopieren“? Immer mehr Menschen konzentrieren sich auf Alibaba, Baidu und die „Big Five“. Aber niemand hätte gedacht, dass der Gewinner ein schneller Spieler mit relativ „Buddha-ähnlicher“ technischer Leistung sein würde.

Am 7. Juni brachte Kuaishou plötzlich das Wensheng-Videomodell „Kling“ auf den Markt, das die Videoerzeugung von bis zu 2 Minuten unterstützen kann. Darüber hinaus wurde Keling im Vergleich zu Sora, das sich noch im „Zukunftsstadium“ befindet, sofort nach der Ankündigung zum Testen freigegeben, und auch die erzielten Ergebnisse sind bemerkenswert.

„Keling ist das Thema, das in der Branche in letzter Zeit am meisten diskutiert wurde“, sagte eine Person aus der Risikokapitalbranche gegenüber City Circle. Nach offiziellen Angaben haben sich innerhalb eines Monats nach seiner Einführung mehr als 500.000 Menschen für Keling beworben. Es wurde für mehr als 300.000 Benutzer geöffnet und hat mehr als 7 Millionen Kurzvideos generiert.

Ke Lings unerwartete Popularität brachte Byte unweigerlich ein wenig in Verlegenheit. Im Mai dieses Jahres eröffnete Byte auch den Test des Wensheng Video-Modells „Jimeng“, der Effekt ist jedoch im derzeit beliebten Wensheng Video-Track noch nicht offensichtlich.

Plötzlich wurde Byte von einem „ignorierten“ Gegner weggeworfen und musste aufholen. Laut TMTPost hat ByteDance kürzlich das KI-Großmodell als „P0-Höchstniveau“-Richtung der Gruppe festgelegt. Viele Teams wie Douyin und Jianying arbeiten ebenfalls hart an der Entwicklung von KI-Videomodellanwendungen, die voraussichtlich in naher Zukunft angekündigt werden.

1. Es kann schnell, grob und heftig durchgeführt werden.

Viele Entwickler sagten gegenüber „City“, dass Kelings Einführung und herausragende Leistung eine Überraschung in der Branche seien.

Kürzlich verwendete „City Boundary“ einen Absatz von „schwarze Katze“ als Schlüsselwort und gab in Keling, Jimeng und „Qingying“ dieselbe Eingabeaufforderung ein, die gerade von Zhipu AI gestartet wurde: „An einem regnerischen Tag sind die Straßen der Stadt leer.“ Eine Person, eine süße schwarze Katze, läuft vorbei. Sie hat grüne Augen, ein gelbes Halsband und eine Glocke am Hals und lange schwarze Haare am Körper Der Boden spiegelt es wider.

Unter den drei generierten Videos gelang es der Keling-Version zwar nicht, den Effekt des schnellen Laufens zu erzielen, die Videos entsprachen jedoch im Allgemeinen den objektiven Regeln.

Im Gegensatz dazu gab es in der „Jimeng“-Version kein Wasser auf dem Boden und die schwarze Katze bewegte sich nicht vorwärts. Obwohl sich in der „Qingying“-Version Wasser ansammelt, hat die schwarze Katze beim Gehen einen seltsamen Gang und auch der Schwanz verliert Rahmen.

▲(Die Videos werden der Reihe nach von Ke Ling, Ji Meng und Qing Ying erstellt)

Laut „Silicon Star“ brauchte Keling drei Monate für den Aufbau; das Team ist mit nur mehr als 20 Leuten sehr klein. Der Leiter ist Wan Pengfei, der derzeitige Leiter von Kuaishous Visual Generation and Interaction Center, von denen die meisten seine Forschung betreiben Zu den Richtungen gehören Bild-/Videosignalverarbeitung, Computerfotografie und Computer Vision, Verlustfunktionsreduzierung, Visionsgenerierung usw.

Der Vorgänger von Keling stammt aus einem unauffälligen Projekt „Puji“, das Kuaishou im Oktober 2023 neu gestartet hat. Hierbei handelt es sich um eine Tool-Software, die mithilfe von KI 2s-Gif-Emoticons aus statischen Bildern generiert. Anfang März dieses Jahres hielt Kuaishou ein kleines internes Treffen ab. Die Idee von Wan Pengfei wurde von Gai Kun (Yu Yue), dem leitenden Vizepräsidenten von Kuaishou, bestätigt, und Puchi war schnell entschlossen, ein Produkt für eine Voruntersuchung zu sein.

Laut „Silicon Star People“ besteht „bei Keling auf der Ausführungsebene Einigkeit darüber, dass es schnell, rau und heftig ist.“

Weniger als einen Monat nach dem Start des Keling-Projekts erhielt es Unterstützung vom Kuaishou-Gründer Cheng Yixiao, der es als strategisches Projekt für das Unternehmen betrachtete. Gai Kun sagt auch oft: „Alle Karten des Unternehmens stehen Ihnen zur Verfügung und das Unternehmen unterstützt dies voll und ganz.“

Ke Ran, ein Unternehmer auf der digitalen menschlichen Spur, analysierte „City“: „Kelings Erfolg ist größtenteils auf das von Kuaishou gesammelte Videodatenmaterial zurückzuführen. Wenn man sich das Land ansieht, ist Douishu-Sound der einzige, der in dieser Hinsicht mithalten kann.“ ."

Doch obwohl die Landschaft wunderschön ist, wirkt Byte ein wenig einsam.

Obwohl „Jimeng“ am 9. Mai offiziell angekündigt wurde, trat Jimeng am 17. Juni auch als wichtigster technischer KI-Unterstützer in der AIGC-Kurzserie „Sanxingdui: Future Apocalypse“ auf. Allerdings ist Ji Mengs Stimme nicht sehr laut, sei es hinsichtlich ihrer Leistung auf der C-Seite oder im Vergleich zu Kuaishous AIGC-Kurzdrama „Mountains and Seas“, das am 13. Juli in die Kinos kam.

Am 17. Juli gab es die Nachricht auf dem Markt, dass Byte den Fortschritt der Sora-ähnlichen Vincent-Videotechnologie bekannt geben wird. Die Außenwelt interpretiert dies auch so, dass Byte Keling einholen und direkt mit ihm konkurrieren wird.

Allerdings erklärte Byte später gegenüber „City Circle“, dass die Nachricht nicht korrekt sei. Am 17. Juli bemerkte „City Circle“, dass die Veranstaltung eher einer Technologie-Sharing-Sitzung ähnelte. Gastgeber des Treffens war hauptsächlich Feng Jiashi, der Leiter des grundlegenden visuellen Forschungsteams des Doubao-Großmodells, und die gesamte Sitzung wurde von Byte-Forschungswissenschaftlern, institutionellen Wissenschaftlern usw. auf Englisch geteilt.

Es scheint, dass Bytes „großer Schritt“ noch einige Zeit warten muss.

2. Byte wurde noch nicht wiederhergestellt

Warum hat Byte also das Fest im Vincent-Video-Track verpasst, das in letzter Zeit in vollem Gange war? Womit ist Byte in letzter Zeit beschäftigt?

Bis zu einem gewissen Grad, vielleicht weil es im Vergleich zu Kuaishous Wetten auf „Ke Ling“ „zehn Fähigkeiten mit einer Anstrengung besiegen“ kann. Das groß angelegte Modelllayout von Byte ist komplizierter – und in der ersten Hälfte dieses Jahres sind Bytes wichtigere Gegner Tencent und Alibaba.

Angesichts großer Vorbilder ist Bytes Tempo nicht mehr „radikal“. Schließlich war es Byte, das vor mehr als zwei Monaten die Führung übernahm und einen großen Modellpreiskampf in der Branche auslöste.

Am 15. Mai stellte Byte auf der „FORCE Motive Power Conference“ von ByteDance einen API-Dienst vor, der auf seinem selbst entwickelten Sitzsackmodell basiert. Gleichzeitig machte Tan Dai, Präsident von Volcano Engine, einen Schritt und enthüllte den neuesten Preis von „Doubao“: 0,0008 Yuan/Tausend Token, und gab bekannt, dass dies der „Mindestpreis“ sei, der unter 99,3 % der Branche liege.

Damals hatte Bytes „Angriff“ die Führung übernommen. Laut „Marktkreisen“ aus vielen Quellen waren führende Akteure auf Bytes Angriff unvorbereitet; obwohl sich alle Parteien hilflos fühlten, konnten sie nur passiv folgen.

In den nächsten Tagen gaben Alibaba Cloud, Baidu Wenxin Model und Tencent Cloud nacheinander bekannt, dass sie die Preise ihrer großen Modellinferenz-Eingabetokens und APIs deutlich senken würden. Unter diesem Einfluss sind C-Seiten-Aufrufe für großformatige Kopfmodelle mittlerweile fast kostenlos, und die Industrie hat begonnen, sich auf die nächste ökologische Ebene zu bewegen.

Laut dem Gründer eines legalen KI-Anwendungsunternehmens gab es nach der Eröffnung des API-Dienstes fast keine Zeitverzögerung und die Vertriebsmitarbeiter von Volcano Engine begannen, aktiv mit Kunden in Kontakt zu treten und Produkte zu bewerben. Dies bestätigt auch die im Markt kursierenden Spekulationen, dass Byte das große Modell als Strategie auf höchstem Niveau markiert hat.



▲(Tan Dai auf der „FOECE-Konferenz“ 2024. Quelle/Volcano Engine)

In letzter Zeit sind die Sitzsäcke von Byte als „Leitprodukt“ deutlich gewachsen.

Laut Daten von Questmobile haben Doubao, Tiangong, Kimi Smart Assistant und Cat Box mit Stand Juni 2024 unter den inländischen AIGC-Apps ein beeindruckendes Wachstum erzielt – wobei Doubao beim Traffic an erster Stelle steht.



▲(Fotoquelle/QuestMobile)

Im Vergleich zu Kuaishou ist Byte derzeit möglicherweise mehr besorgt über den vollständigen ökologischen Wettbewerb von einfachen großen Modellen bis zur KI-Anwendungsschicht. Wenn man außerdem bedenkt, dass die Volcano Engine erst 2021 offiziell zur Cloud wird, ist sie die „jüngste“ unter den riesigen Cloud-Anbietern. Seit mehr als drei Jahren gilt Huoshan Cloud als Herausforderer auf dem Cloud-Markt. Wie Byte mit dem grundlegenden Großmodell-, Anwendungsschicht- und Cloud-Markt zusammenarbeitet, ist ein umfassendes Angebot.

Kürzlich berichtete „Photon Planet“, dass eine große Anzahl von Nutzern der „Kouzi“-Plattform von Byte nach Möglichkeiten suchen, ihre erstellten Agenten und Bots mit offiziellen WeChat-Konten oder Miniprogrammen zu verbinden, und die Diskussionen sind sehr aktiv.

Im Dezember letzten Jahres startete Byte im Ausland die KI-Anwendungsentwicklungsplattform „coze“. Im Februar dieses Jahres wurde die inländische Version von „Button“ online gestellt. Auch viele Douyin-Händler hoffen, daraus schnell einen Topf voll Gold machen zu können.

In Anbetracht dessen, dass Tencent im Mai dieses Jahres die Plattform zur Erstellung und Verbreitung von KI-Agenten „Tencent Yuanqi“ verspätet veröffentlicht hat. Zu diesem Zeitpunkt hatte die Zahl der Besuche bei Button 2,33 Millionen Mal erreicht. Bisher hat Tencent Yuanqi das Ökosystem der WeChat-Serie mit Miniprogrammen, offiziellen Konten und Kundendienst-Abonnementkonten noch nicht geöffnet.

Schließlich steckt die KI-Entwicklung noch in den Kinderschuhen. Byte muss wie Tencent noch viel Zeit in die Schulung der Benutzer investieren. Im KI-Zeitalter um Vertriebsrechte zu konkurrieren und sich einen Vorsprung zu verschaffen, könnte eine größere Lektion sein, die Byte tun muss, um Tencent ins Visier zu nehmen.

3. Später zuschlagen, es ist noch Zeit

Auf Branchenebene mangelt es im heutigen Internet nicht an Content-Traffic, E-Commerce-Traffic und Bytes an Finanzmunition. Auch wenn Vincent Video kurzfristig „einen Schritt hinterherhinkt“, ist das auf lange Sicht kein Mangel. Es besteht immer noch Potenzial, aufzuholen.

Die Spezialität von Byte ist es auch, aktive Marktstrategien zu nutzen, um hinterherhinkende Positionen einzuholen und energisch Wunder zu vollbringen.

Mit Blick auf Alibaba arbeitet Byte kürzlich auch an der Integration großer Modelle. Auf der DingTalk Ecosystem Conference, die gerade am 26. Juni stattfand, kündigte Präsident Ye Jun an, dass neben Alibabas eigenem Tongyi auch große Drittmodelle der anderen sechs Unternehmen in DingTalk aufgenommen werden. Dazu gehören MiniMax, Dark Side of the Moon, Zhipu AI, Orion Star, Zero One Thing und Baichuan Intelligence, die fast alle bekannten großen Modell-Startups in China abdecken. Es ist selbstverständlich, „Chinas offenstes KI-Ökosystem aufzubauen“. ".

Ähnlich wie das Gameplay von DingTalk unterstützt die Kouzi-Plattform von Byte nicht nur ihr eigenes „Doubao“, sondern auch Zugriff auf wichtige externe Modelle wie Tongyi Qianwen, Dark Side of the Moon und MiniMax. Am 14. Juni startete Kouzi außerdem die Funktion „Model Square“, mit der Benutzer zwei anonyme Models auswählen und diese anhand der Leistung der generierten Inhalte bewerten können.



Darüber hinaus wurde Byte kürzlich entlarvt und seine Erforschung von „KI + Hardware“ beschleunigt sich, und es scheut sich nicht, Talente durch Akquisitionen zu rekrutieren.

Laut „Tech Planet“ entwickelt PICO, eine Tochtergesellschaft von Byte, seit der zweiten Hälfte des vergangenen Jahres mehrere tragbare Geräte, darunter Kopfhörer und Lautsprecher, und diese Geräte werden auch mit KI ausgestattet sein. Das Team von Byte Doubao hat auch die Kombination von Software und Hardware für Großmodelle untersucht. Die Kombination von Software und Hardware für Großmodelle wurde schrittweise auf Hardwaregeräte wie Lernmaschinen, Roboterhunde und Roboter angewendet.

Einem anderen Bericht von 36Kr zufolge ist Li Haoqian für die „D-Linie“ der Byte AI-Hardware verantwortlich. Letzterer ist der Gründer von Oladance, der OWS-Kopfhörermarke (Open Wearable Stereo), die Byte im März dieses Jahres übernommen hat. Der Verantwortliche der „O Line“, einer weiteren KI-Hardwarelinie, ist auch Gründer des von Byte übernommenen Unternehmens. Er berichtet an Hong Dingkun, Vizepräsident von ByteDance Technology.

In Richtung Vincent Video haben die Verfolger, darunter auch Byte, angesichts der jüngsten Popularität des Titels noch Zeit.

Kürzlich sagte ein Entwickler zu „City World“: „Derzeit verwende ich Keling, um Bilder zu komponieren und den Arbeitsaufwand des Workflows zu reduzieren. Ich nutze es noch nicht vollständig zum Erstellen, daher bin ich noch nicht sehr darauf angewiesen.“

In den Augen eines anderen Entwicklers und Kurzvideo-AIGC-Bloggers hat Keling noch viel Raum für Optimierung: „Wenn man sich auf Keling Wensheng Video verlässt, kann die Konsistenz der virtuellen menschlichen IP nicht garantiert werden. Normalerweise verwende ich Kelingtu, um Videos zu produzieren. Die Funktion ist gleichwertig.“ um Ke Ling ein Bild zu geben, das es ihm ermöglicht, dynamische Videos aus verschiedenen Perspektiven zu erstellen und sie dann zusammenzufügen, um den Effekt der Bewegung der Kamera zu simulieren.

Ein Mitglied des Forschungs- und Entwicklungsteams eines inländischen KI-Simulations-Dating-Produkts sagte: „Auf dem aktuellen Markt für groß angelegte Modellanwendungen überquert jeder den Fluss, indem er die Steine ​​ertastet. Wie man es kommerzialisiert, ist eine zu weit entfernte Frage.“ vage. Aber es ist sicher, je mehr Leute es nutzen und spielen, desto mehr kann es die Optimierung und Iteration des Produkts gewährleisten.“

(Ke Ran ist ein Pseudonym)

Autor | Dong Wenshu

Bearbeiten | Li Yuan

Operationen | Liu Shan