nouvelles

Le vieil homme qui ne peut pas attendre Sora se précipite vers Kuaishou Keling

2024-08-01

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Pourquoi Kuaishou est-il le premier grand fabricant à lancer des vidéos IA ? ‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

Texte | Chen Meixi

Rédacteur | Réalisateur

Au début, lorsque l’Open AI a pris d’assaut le monde en termes de grands modèles, Kuaishou n’était pas une figure éblouissante. À cette époque, Baidu a proposé Wenxinyiyan, Alibaba a proposé Tongyi Qianwen et Tencent a proposé le grand modèle Hunyuan, se rattrapant, et la vitesse de recherche, de développement et d'ouverture a été très rapide.

Kuaishou ne figurait pas sur la liste initiale des prétendants, et même aujourd’hui, peu de gens peuvent citer le nom du grand modèle linguistique de Kuaishou : Ruyi.

La situation de combat a changé le 6 juin de cette année. Le grand modèle Keling généré par la vidéo de Kuaishou a ouvert les candidatures pour la version bêta publique. Ce jour-là, c'était aussi le 13e anniversaire de Kuaishou. Les médias comparent souvent Keling à Sora d'Open AI, mais depuis ses débuts explosifs en février, Sora n'a pas été ouvert au public. En conséquence, les utilisateurs chinois curieux ont commencé à affluer vers Keling.

Dix jours plus tard, Keling « a (reçu) des dizaines de milliers de candidatures ». Ces données proviennent de Wan Pengfei, qui a assisté à la conférence de Zhiyuan ce jour-là. Au moment du discours, son titre était celui de chef du Centre de génération visuelle et d'interaction de Kuaishou, et il était également le véritable responsable de Keling. Au 19 juillet, le nombre de candidats dépassait le million. Il n'a fallu que plus d'un mois à Keling pour faire passer le nombre d'applications de dizaines de milliers à des millions. Parmi les progrès des grands modèles au premier semestre par les grands fabricants, c'est la performance la plus accrocheuse.


L'image générée par l'esprit, le mot d'invite : Abeille dans les fleurs

Les histoires de revirements sont toujours populaires auprès du public. Cependant, un inventaire minutieux de Keling et de la grande entreprise de mannequins Kuaishou qui la sous-tend révélera qu'il ne s'agit pas d'un drame cool qui sommeille puis émerge soudainement, ni d'un récit héroïque dans lequel un jeune homme talentueux mène une petite équipe pour frapper. dos.

Une vidéo est en outre générée sur la base de l'image générée par Keling, avec le mot d'invite : des abeilles volent autour.

Pourquoi Kuaishou est-il le premier grand fabricant à lancer des vidéos IA ?Ce sont les besoins de l’entreprise qui apportent une forte motivation et une haute priorité, c’est l’accumulation de données et de technologies sous forme de produit qui apporte une vitesse d’itération, et c’est la mise en adéquation des scénarios commerciaux qui amène de vrais clients.

L’apparition de Ke Ling n’est pas un événement accidentel. Au niveau national, le plus grand rival de Kuaishou dans le domaine de la vidéo IA viendra très probablement de ByteDance.


Quand il y a de la demande, il y a de la motivation

Les créateurs sont l'un des maillons les plus importants de l'écosystème de contenu de Kuaishou. Selon les données officielles publiées par Kuaishou, en 2023, 138 millions de créateurs auront publié de courtes vidéos sur Kuaishou pour la première fois, et les vidéos publiées tout au long de l'année ont reçu plus de 1 000 milliards de likes sur la plateforme.

Avoir un grand nombre de créateurs de contenu signifie que Kuaishou doit prendre en charge leurs besoins en outils de contenu, sinon les créateurs à la recherche d'une productivité émergente se précipiteront bientôt vers d'autres outils et même d'autres plateformes. C'est aussi la valeur de Kuaiying to Kuaishou et Cutting to Byte.

Par conséquent, l’investissement précédent de Kuaishou dans les grands modèles linguistiques n’était pas radical, mais il doit viser les niveaux supérieurs dans la concurrence des grands modèles multimodaux.

Avant Keling, la capacité de grand modèle Wenshengtu développée par Kuaishou avait été intégrée à Kuaishou. Le résultat des tests internes était que les utilisateurs généraient en moyenne plus de 500 millions d'images d'IA dans la zone de commentaires chaque mois.


L'image générée par Keling, le mot d'invite : Alien debout au bord du fleuve Yangtze

La forte motivation apportée par la demande est certes une condition nécessaire à l’émergence de Keling, mais Kuaishou n’est pas le seul à réunir ces conditions. S’il existe un autre facteur important qui a influencé l’émergence de Ke Ling, c’est peut-être la détermination.

La détermination vient d’abord de la haute direction de Kuaishou.

Auparavant, les mouvements de Kuaishou sur les grands modèles semblaient toujours un demi-pas plus lents. Lorsqu'il s'agit de grands modèles de langage nationaux, tout le monde pensera d'abord à Wen Xin Yi Yan et Tong Yi Qian Wen ; lorsqu'il s'agit d'applications de grands modèles de langage, Kimi et Doubao sont les plus populaires du marché. Dans le domaine des graphiques vincentiens, Ririxin 5.0 de SenseTime a été le premier à sortir du marché intérieur. Le lendemain de sa sortie, le cours de l'action de SenseTime Technology a augmenté de plus de 30 % et la négociation a été temporairement suspendue.

Dans la série d’histoires précédente, Kuaishou était dans une position apparemment marginale. Les grands modèles vidéo et leurs applications constituent le nœud le plus incontournable dans la bataille pour la popularité, et constituent également la partie la plus importante de la disposition globale des grands modèles.

Dans un précédent rapport du média technologique Silicon Star, un technicien de l'équipe Keling a déclaré : « Ce que Gai Kun dit souvent, c'est que toutes les cartes de l'entreprise sont à votre disposition, et l'entreprise la soutient pleinement, c'est Yu Yue. , vice-président senior de Kuaishou, et est le directeur général. La personne en charge des activités de la ligne de station et également la personne en charge de la ligne des sciences sociales. Après la démission de l'ancien CTO Chen Dingjia, Gai Kun est devenu l'un des principaux dirigeants de la ligne technologique de Kuaishou.

Wan Pengfei et son équipe pourraient avoir une détermination encore plus grande.Un détail est qu'après avoir décidé de reprendre le projet Keling, Wan Pengfei a confié le travail initial consistant à répondre aux besoins commerciaux de toutes les parties à d'autres personnes responsables du même niveau dans l'équipe de Zhang Di.En conséquence, d'autres membres de l'équipe de Keling ont également cédé l'activité d'origine et se sont entièrement consacrés à la recherche et au développement de Keling. Il est normal de faire des heures supplémentaires le week-end pour rattraper les progrès.

Une vidéo générée en outre sur la base de l'image générée par Keling, avec des mots rapides : Alien marchant dans l'eau, deux extraterrestres se félicitant

"En fait, plus d'un mois avant sa sortie officielle, les résultats des tests de Ke Ling n'étaient pas très bons." Un pratiquant de la grande industrie du mannequin a déclaré à Hedgehog Commune : "Lao Wan et les autres se battent contre toute attente. Ce qui suit C'est vraiment « des résultats miraculeux avec une grande force ». Beaucoup de gens ne s'attendaient finalement pas à un tel effet.

La détermination est donc devenue la dernière variable.


L’accumulation mène à la vitesse

Kuaishou, ou toute autre plate-forme vidéo courte de premier plan, a accumulé de l'expérience dans le développement de vidéos d'IA sous deux aspects, le contenu et la technologie.

Les vidéos sont produites par les utilisateurs, et après avoir été annotées et comprises par la plateforme, le contenu pouvant être diffusé est filtré. C'est la voie inhérente à la logique métier de Kuaishou. Le contenu traité devient une sorte de données. De la description du contenu lui-même à la popularité après distribution, Kuaishou maîtrise une quantité massive de données de contenu.En termes simples, ils ont tous deux du contenu et savent quel « bon contenu » les utilisateurs aiment voir.

Pour la formation de grands modèles vidéo génératifs, ce processus revient à préparer les plats à l’avance.

Même le « cuisinier » est tout fait.

La plupart des principaux membres R&D de l'équipe du projet Keling sont d'anciens subordonnés de Wan Pengfei de la période Y-tech. Au début de l'année, les membres de l'équipe sont progressivement entrés en contact avec des informations et des documents pertinents et ont commencé à travailler sur la recherche et le développement de Keling.

Auparavant, l'équipe de Wan Pengfei était principalement chargée de répondre aux besoins de création intelligente UGC dans le cadre de l'écosystème de création Kuaishou et travaillait en étroite collaboration avec des acteurs commerciaux tels que la production de la station principale, Kuaiying et Yitian Camera. Les formes de produits incluent l'embellissement des portraits, les effets spéciaux audio et vidéo. , avatars de diffusion en direct, etc.

En 2021, Wan Pengfei a prononcé un discours public en tant que « chef de la plate-forme technologique d'IA du département Y-tech » lors de la conférence mondiale sur les technologies d'intelligence artificielle.Parmi les cas partagés à cette époque figurait « l'effet spécial photo vivante » - un gameplay vidéo Tusheng à l'époque pré-grand modèle. À cette époque, les bibliothèques de modèles de Kuaishou et Kuaiying ont lancé l'effet spécial « déplacer de vieilles photos ». Une fois que les utilisateurs ont téléchargé une photo, les personnages de la photo peuvent effectuer des mouvements tels que sourire, cligner des yeux et hocher la tête pour former un effet vidéo. Selon les rapports, cet effet spécial dynamique a été utilisé par plus de 3,44 millions de personnes à Kuaiying.


Les vieilles photos et vidéos émouvantes publiées par les internautes de Kuaishou @senyuhelu en 2021

En 2021, Wan Pengfei était très confiant dans le développement de la technologie générative et a proposé que « les modèles génératifs deviendront de plus en plus puissants, le contenu généré sera plus réaliste et le processus de génération sera plus stable et contrôlable ».

Trois ans plus tard, Keling a de nouveau fait une apparition avec son œuvre « Reviving Old Photos ». Certains utilisateurs qui ont demandé l'autorisation de l'utiliser ont utilisé la fonction « Tusheng Video » pour transformer les photos de proches décédés en vidéos. Par rapport aux « effets spéciaux de photos vivantes » d'il y a trois ans, grâce à des instructions ouvertes, les utilisateurs peuvent faire en sorte que les personnages des photos accomplissent des actions plus complexes. C'est exactement le changement apporté par la nouvelle technologie des grands modèles.

Sora est sorti en février de cette année et l'équipe Kuaishou Keling a commencé à se former à un moment proche, mais le développement et l'application de la technologie de génération vidéo multimodale ont toujours fait partie du travail de Wan Pengfei et de son équipe. .

Les praticiens mentionnés ci-dessus ont exprimé des points de vue similaires à ceux de Hedgehog Commune : « En fait, l'émergence de Sora équivaut à laisser chacun déterminer l'itinéraire technique ou le plan à ce nœud, mais il existe de nombreuses applications de la technologie visuelle, y compris les choses multimodales. C'est ce qu'ils ont toujours fait.

L'accumulation technique dont Ke Ling a besoin vient de là. Le cuisinier est tombé sur le plat préparé, et après qu'une nouvelle recette ait été vue dans le monde entier, Kuaishou est devenu l'une des équipes qui ont préparé le produit fini le plus rapidement.

Mais dans le même temps, les praticiens mentionnés ci-dessus ont également une attitude attentiste quant à savoir si Keling peut occuper pendant longtemps une position de leader en matière de technologie et de produits. "Les algorithmes utilisés par tout le monde sont désormais similaires. Chaque entreprise peut être peaufinée, mais la différence est toujours la même. Selon lui, avec les cartes, les données et les algorithmes similaires, ce n'est qu'une question de temps pour chaque entreprise." fabrique des produits ayant des effets similaires.

Par conséquent, la rapidité n’est qu’un avantage temporaire de Kuaishou. Ils doivent véritablement transformer leur avantage en clients stables pendant la période de référence.


Là où il y a une scène, il y a des clients

Le 29 décembre 2020, Kuaishou a officiellement publié pour la première fois la « faction Kuaishou » comme valeur d'entreprise dans une lettre interne à tous les employés, affirmant que « l'obsession des clients » est au cœur des valeurs de Kuaishou.

Auparavant, que ce soit au sein de Kuaishou ou d'autres grandes sociétés Internet, le concept le plus souvent évoqué était « les utilisateurs ». Pour cette raison, Kuaishou a spécifiquement expliqué les raisons de ce changement de vocabulaire. « La complexité commerciale de l'entreprise est devenue plus grande, passant des « utilisateurs » aux « clients ». Les clients comprennent les producteurs et les consommateurs, les clients du côté B et les utilisateurs du côté C, les clients externes et les clients internes. Nous devons renforcer notre compréhension des producteurs et des clients. Clients côté B. Pour améliorer la compréhension et la sensibilisation des clients, nous devons également mettre l’accent sur la sensibilisation au service auprès des clients internes.

En regardant en arrière, 2024 a en effet constitué un tournant important dans les changements intervenus dans la structure commerciale de Kuaishou. En 2020, parmi les revenus annuels de Kuaishou, la proportion des revenus de diffusion en direct est passée de 80,4 % l'année précédente à 56,5 %, et la proportion des revenus des services de marketing en ligne a augmenté de 19 % à 37,2 %. du chiffre d'affaires des services a rapidement grimpé à 6,3 %, contre 1 % l'année précédente.

Comme Kuaishou lui-même l'a expliqué, les producteurs et les consommateurs, les clients du côté B et les utilisateurs du côté C, les clients externes et les clients internes sont tous des clients importants de Kuaishou et deviendront également les clients cibles du grand modèle de Kuaishou.

Les producteurs et les consommateurs construisent conjointement la chaîne commerciale la plus élémentaire de Kuaishou. Les producteurs produisent du contenu et les consommateurs consomment du contenu.L'intérêt des produits de modélisation à grande échelle réside dans l'abaissement du seuil de production et l'amélioration de la qualité du contenu.

Le premier est facile à comprendre : comme Keling peut actuellement le faire, vous pouvez obtenir une vidéo en saisissant du texte ou des images. Pour les personnes sans conditions de tournage ni capacités de production, le seuil de production a été considérablement abaissé.

Ce dernier point semble un peu contre-intuitif au premier abord : avec les capacités de simulation et la durée de sortie des produits vidéo IA actuels, comment peut-il être meilleur que le tournage réel et la production professionnelle en termes de qualité ? Cependant, sur des plateformes leaders telles que Kuaishou et Douyin, la plupart des dizaines de millions de courtes vidéos produites chaque jour proviennent d'utilisateurs ordinaires. Aux yeux des producteurs de contenu professionnels, la technologie d'IA « pas assez sophistiquée » suffit à faire des utilisateurs ordinaires. ' Prenez des photos aléatoires pour ajouter de la matière et de la richesse.

Les commerçants de la face B peuvent également devenir clients des capacités des grands modèles de Kuaishou. Selon les données publiées par Kuaishou lors de la Conférence mondiale sur l'intelligence artificielle cette année, ses revenus publicitaires en matière d'IA ont dépassé les 20 millions par jour. Les supports publicitaires générés par l'IA peuvent réduire le coût par article à 0,47 yuan tout en maintenant le CTR au niveau de base.


Keling génère des images, des mots rapides : du matériel publicitaire pour le jus de pomme, il y a un verre de jus de pomme sur la table blanche, avec deux pommes rouges sur le côté

Pour de nombreux produits de grande taille, trouver des scénarios d'atterrissage est un problème difficile tout au long du cycle de vie du produit, mais Kuaishou ne manque évidemment pas de scénarios.Comme l'a déclaré Zhang Di, vice-président de Kuaishou et responsable des grands modèles, le succès de Keling vient de « l'exploitation d'une valeur réelle dans des scènes réelles pour répondre aux besoins réels des utilisateurs ».

Le problème auquel ils doivent faire face est de savoir comment faire en sorte que les utilisateurs deviennent des utilisateurs à haute fréquence des grands modèles de Kuaishou dans le scénario actuel, et soient prêts à continuer à payer pour cela, et à réaliser d'abord la commercialisation des grands modèles au sein de leur propre écosystème.

Le 25 juillet, Keling a complètement ouvert les inscriptions. Le même jour, Keling a lancé son système d'adhésion et est entré dans la phase de facturation.

Selon les informations publiées sur le site officiel de Keling, les utilisateurs non membres peuvent recevoir 66 points d'inspiration lorsqu'ils se connectent chaque jour. Selon le « prix » actuel, environ 6 vidéos ou 330 images peuvent être générées gratuitement.

Il existe deux modèles de paiement. L'un est le modèle d'adhésion. Les utilisateurs peuvent acheter différents niveaux d'adhésion sur une base mensuelle, trimestrielle, semestrielle ou annuelle. Plus le niveau est élevé, plus le second est susceptible d'être généré. le modèle de recharge, où les utilisateurs peuvent payer directement pour recharger, le coût de production de l'utilisateur pour chaque vidéo est de 1 yuan et le coût de production pour chaque image est de 2 cents.


L'image générée par Keling, le mot d'invite : lever du soleil, il y a de beaux nuages ​​et une lueur matinale à l'horizon, le soleil est caché dans les nuages

Il y a deux points dignes d’attention concernant le système de tarification de Keling.

Premièrement, Kuaishou ne propose pas d'option d'adhésion permettant de générer des œuvres illimitées, ce qui signifie que peu importe qu'ils choisissent le mode de recharge ou le mode d'adhésion, les utilisateurs « paient de l'argent pour acheter du temps ».La seule différence réside dans le prix unitaire de chaque génération, ainsi que dans les fonctions différenciées telles que la suppression des filigranes, l'extension vidéo et le mouvement du miroir principal.

Le coût de génération de vidéos IA est élevé et Kuaishou ne propose pas de membres capables de générer un temps illimité. Kuaishou veut évidemment éviter un éventuel contrôle des coûts et freiner dans une certaine mesure la production grise.

Deuxièmement, la valeur d'inspiration en tant que « monnaie de paiement » de Keling est équivalente en termes de prix aux pièces de monnaie Kuai utilisées pour récompenser les points d'ancrage de l'écosystème Kuaishou. Avec 1 yuan de RMB, vous pouvez acheter 10 pièces rapides ou 10 points d'inspiration. Cette méthode de tarification peut préserver la possibilité d'ouvrir le système de paiement au sein de l'écosystème Kuaishou à l'avenir.


Kuaishou est loin d'être le seul à disposer à la fois de besoins, de scénarios, de clients, d'équipements, de données, de technologies et de réserves de talents.

Les initiés de l'industrie mentionnés ci-dessus prédisent que dans un avenir proche, Byte sera en mesure de produire des produits vidéo génératifs du même niveau. Avant cela, Kuaishou doit terminer l'accumulation d'utilisateurs et l'accumulation de contenu dans la période de fenêtre, afin que le contenu de l'IA puisse fonctionner efficacement au sein de l'écosystème de Kuaishou. Il est préférable de suivre le chemin de la commercialisation et de rester en tête pendant plus longtemps. .

Les moyens de croissance et d’exploitation conventionnels sont à l’ordre du jour. Le site officiel de Keling a rapidement lancé un événement de réduction de 50 % pour les membres. Dans le même temps, les utilisateurs peuvent obtenir 66 points d'inspiration en se connectant chaque jour afin de réduire l'impact du modèle de paiement sur la croissance et la fidélisation des utilisateurs, afin que tous les utilisateurs puissent au moins le faire. essayez-le sans aucun seuil.

En outre, dans le fonctionnement du site de Kuaishou, Keling n'accorde pas trop d'importance à des concepts tels que la vidéo générative, les solutions de modèles de diffusion et les clusters de formation distribués, mais utilise plutôt « de vieilles photos en vidéos », « vous accompagnant à travers le temps ». et l'espace" et "résurrection il y a 40 ans". "Photo précédente" et d'autres méthodes de jeu pour inciter les utilisateurs à commencer à l'utiliser en premier, afin de réduire le coût de compréhension de l'utilisateur.

Pour les utilisateurs ordinaires, le nouveau gameplay a le même chemin de difficulté que le précédent gameplay d'effets spéciaux de Kuaiying. Ils le comprennent comme un effet spécial plus puissant ou non, cela ne les gêne pas. Ils deviennent de véritables utilisateurs de produits grands modèles.

C'est la première étape ultime pour Kuaishou et Byte pour créer des vidéos sur l'IA, si les utilisateurs sont les leurs ; c'est aussi la crise ultime à laquelle ils sont confrontés à l'ère de l'IA, si les utilisateurs sont attirés par de nouveaux produits discontinus.

Plutôt que de dire qu’ils se disputent l’entrée dans l’ère de la vidéo IA, mieux vaut dire qu’ils sont tous des défenseurs. La nouvelle productivité créera de nouvelles formes de contenu et, à terme, de nouvelles plateformes. Cette histoire est familière à Cheng Yixiao et Zhang Yiming.

Ils doivent être du premier niveau.

(Image de couverture générée par Keling.)


Contact pour la coopération avec les médias WeChat ID |ciweimeijiejun

Si vous souhaitez communiquer avec nous, vous pouvez répondre « rejoindre le groupe » en arrière-plan pour rejoindre la communauté.