nouvelles

Conversation avec Wu Xinhong : Meitu AI cherche d'abord à aider les utilisateurs à gagner de l'argent, et la période de fenêtre d'application n'est que de 2 ans

2024-08-06

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Les cheveux blancs de Lei Gang viennent du temple Aofei
Qubits | Compte public QbitAI

Dans la vague de l’IA générative, les acteurs de la scène constituent un groupe facile à ignorer, mais ils sont souvent les premiers à en récolter les bénéfices de manière discrète.

Cela est vrai à l'étranger pour Microsoft et Adobe ; au niveau national, Meitu (HK.1357) montre également cette tendance.

En tant qu'entreprise qui a fréquemment produit des produits à succès et "Meitu" est utilisé comme nom et verbe, Meitu montre un nouveau look dans la vague de l'IA.

Il existe des modèles, et il s'agissait du premier lot de modèles vidéo à grande échelle livrés en Chine. Après la naissance de Sora, il a été le premier à mettre à niveau et à mettre à jour l'architecture DiT ;

Il existe des applications, et pas moins de 6 produits ont été lancés rien que lors du Festival de l'image de cette année ;

Il est performant, le nombre d'utilisateurs VIP dans le monde dépasse les 10 millions et les revenus d'une seule application d'IA dépassent les 100 millions en 2023, s'appuyant sur l'IA pour réaliser des bénéfices à grande échelle.

Mais ces changements sont tous des phénomènes après le résultat final. Comment l’IA rafraîchit-elle de belles images ? Où Meitu espère-t-il aller à l’ère de l’IA ? Tous confrontés à répondre à des questions.

etWu Xinhong——Le fondateur, actuel président-directeur général de Meitu, il fait sa part.



Dans le dernier dialogue de Qubit, Wu Xinhong a confirmé les changements apportés par Meitu aux opportunités de l’IA et a partagé les connaissances acquises grâce à la mise en œuvre de l’IA.

Il a parlé à plusieurs reprises du rôle et du positionnement de Meitu dans l’IA, ainsi que de son point de départ et de sa destination finale : créer des produits grâce à l’IA pour aider les utilisateurs à gagner de l’argent.

À l'ère de l'IA, « Meitu » peut avoir de nouvelles connotations, représentant la productivité, la réduction des coûts et l'efficacité, et les utilisateurs gagnant de l'argent grâce à de belles images.

Conversation avec Wu Xinhong

"Meitu a toujours été une société d'applications, tout comme l'ère de l'IA."

qubit: Meitu a transmis les changements à l'ère de l'IA, mais le monde extérieur se demande également constamment : quels sont les avantages de Meitu dans la pratique de l'IA ?

Wu Xinhong: Tout d'abord, Meitu a toujours été une société d'applications Lorsque nous avons sorti la première version de Meitu Xiuxiu en 2008, nous étions encore à l'ère des applications PC. Nous sommes rapidement entrés dans les applications mobiles et maintenant dans les applications d'IA.

Essentiellement, Meitu est une entreprise douée pour les applications d’IA. Vous pouvez atterrir dans ces scènes verticales et monétiser rapidement. Par conséquent, de nombreuses personnes entraîneront Meitu vers cette grande entreprise modèle pour comparer, c'est-à-dire pourquoi devriez-vous comparer avec OpenAI.Nous n'avions pas l'intention de lui faire concurrence., dont beaucoup de nouvelles grandes entreprises modèles en Chine, car elles ne sont pas essentiellement sur la même dimension, car chacun a ses propres atouts.

qubit: Mais vous avez également développé vous-même de grands modèles ?

Wu Xinhong : Le grand modèle auto-développé par Meitu vise principalement à rendre nos applications d'IA plus compétitives, par exemple en recherchant des effets plus extrêmes, notamment une intégration profonde avec les produits, etc. Ce n'est donc pas du tout un malentendu. Beaucoup de gens peuvent penser que Meitu n'est bon à rien, mais j'ai initialement créé des applications, mais l'ère entière est en train de changer, de l'Internet sur PC, de l'Internet mobile à l'ère actuelle de l'IA. Je dis simplement que dans chaque cas, un changement technologique majeur est nécessaire pour mettre en œuvre des applications et les monétiser.

Beaucoup de gens peuvent penser à l'AGI lorsqu'ils parlent de grands modèles, de création de grands modèles généraux, mais en fait, nous créons de grands modèles verticaux pour les pistes d'imagerie et de conception. Nous pensons que le grand modèle à usage général se dirige définitivement vers l’objectif de l’AGI et pourrait devenir à l’avenir un assistant IA doté d’un super cerveau.

Nous faisons des choses verticales, telles que la génération et les applications d'images et de vidéos. À l'avenir, nous aurons une relation synergique avec le grand modèle général, car nous savons que le grand modèle général ne peut pas former toutes les capacités dans un seul modèle, ce qui signifie qu'il a des coûts de formation et d'inférence extrêmement élevés, et il deviendra également très lent lors de la fourniture réelle de services de production. Par conséquent, il y a une forte probabilité qu'il s'agisse d'un grand modèle à usage général similaire au cerveau et au contrôle central, puis qu'il fasse appel aux ressources sociales et utilise divers outils pour accomplir des tâches.

qubit: De nombreuses entreprises qui positionnent des applications et des produits choisiront de ne pas développer elles-mêmes de grands modèles et investiront encore moins.

Wu Xinhong : Tout d'abord, si une API prête à l'emploi est disponible, nous y accéderons également. Nous sommes une entreprise qui reste extrêmement ouverte à la coopération. Ensuite, Sora n'a pas d'API ouverte, et d'autres fabricants nationaux ne l'ont pas encore ouverte avant l'auto-recherche, et ces produits doivent être optimisés dès les premiers stades de la contrôlabilité, du coût et d'autres problèmes. Nous ne pourrons peut-être pas attendre, car en tant que branche importante des applications de l'IA, en particulier de l'imagerie, la vidéo est déjà une entreprise avec de nombreux scénarios d'application, nous ne pouvons donc le faire que nous-mêmes d'abord, mais à l'avenir, s'il y en a un qui convient. , comme la vidéo Nous envisagerons également d’accéder à l’API du modèle. On peut même dire qu'un produit offrira le choix entre lui-même et plusieurs modèles, donnant aux utilisateurs le droit de comparer.

Y compris Adobe. En fait, son logiciel de montage vidéo PR a déjà annoncé qu'il pouvait être connecté à des modèles tels que Runway, Pika et Sora. En fait, en tant qu'application ou outil, nous y sommes extrêmement ouverts, mais c'est maintenant le cas. Sinon, nous devons le faire nous-mêmes.

De plus, pourquoi devons-nous développer nous-mêmes de grands modèles ? Comme mentionné tout à l'heure, l'effet, la confiance dans le produit et de nombreuses connaissances sous-jacentes peuvent soutenir la compétitivité de votre produit. Car en effet, à l’ère de l’IA générative,profondeur de la connaissanceCela reste assez crucial.

qubit: Ce n'est qu'en le faisant vous-même que vous pourrez connaître le savoir-faire qu'il contient ?

Wu Xinhong: Si vous ne faites pas le côté modèle vous-même et que vous utilisez simplement quelques API en général, vos connaissances ne seront peut-être pas très approfondies. Vous devrez traverser des épreuves et des coups pour développer progressivement vos connaissances, améliorant ainsi votre compétitivité.

"Nous n'avons pas besoin de chercher des clous avec un marteau, la période d'application de l'IA n'est que de 2 ans."

qubit: Pouvoir être le premier à proposer un grand modèle vidéo est aussi le reflet de l'accumulation de capacités d'IA et de compétitivité.

Wu Xinhong : Meitu est une société d'applications, mais beaucoup de ces applications sont pilotées par l'IA, nous avons donc en fait une équipe visuelle d'IA très compétente et très importante au milieu et au back-end. En termes de capacités de talents, nous pensons qu'elle a toujours été la meilleure. en Chine Oui, c’est juste qu’il n’y a pas eu beaucoup d’exposition ou de publicité sur ses capacités en matière d’IA auparavant. Donc, du point de vue de la génération vidéo, nous nous sentons capables de le faire. Tout le monde a également constaté que les membres d'une équipe nationale ont commencé à réussir.Nous sommes désormais sur la bonne voie.Ce n'est qu'une question de temps, nous pensons que nous avons la capacité de bien le faire.

qubit: Il existe des applications et des scénarios, et c'est aussi une garantie que les talents de l'IA peuvent être mis à profit ?

Wu Xinhong : Meitu a de nombreuses très bonnes applications, ce qui n'est pas nécessairement la même chose que d'exiger une entreprise d'IA. Parce que de nombreuses entreprises peuvent avoir un marteau, je cherche des clous. Mais nous y sommes déjà,Nous savons réellement quelles sont les demandes des utilisateurs et quel effet nous devons obtenir.Tant que nous travaillons dur dans cette direction avec la technologie de l’IA, nous pouvons obtenir les résultats souhaités par les utilisateurs. . Tout cela n’est qu’une question de temps, et je pense que c’est le premier point, et le plus important.

deuxième,Nos capacités techniques sont également de premier ordre dans le pays. . Nous avons également remporté de nombreux prix au niveau international et participé à certaines compétitions. Il n'est donc pas difficile de remporter certains honneurs. Par conséquent, qu'il s'agisse d'une comparaison horizontale ou verticale, l'équipe est en fait assez confiante. . Grâce à une technologie d’IA de pointe, nous pouvons faire ce que d’autres peuvent faire.

qubit : En fait, ce qui m'intéresse le plus, c'est la prise de vue et MOKI, qui semble ouvrir une nouvelle fenêtre pour de belles images. Par exemple, MOKI est un workflow de courts métrages d'IA spécialement créé pour les créateurs de vidéos, tandis que le tournage commence par la diffusion orale de la scène d'apport de marchandises, ce qui peut aider les agriculteurs à créer des vidéos d'apport de marchandises en moins d'une demi-heure.

Wu Xinhong : Oui, nous explorons actuellement plusieurs voies pour la mise en œuvre de modèles vidéo d’IA à grande échelle. Qu'il s'agisse de tournage ou de MOKI, c'est une idée de résolution de problèmes que nous avons donnée.

imageCommencer à tirer Après son lancement l’année dernière, il est devenu en un an la référence pour les produits similaires. En effet, il a exploré le flux de travail de l'IA relativement tôt, c'est-à-dire comment le construire et comment utiliser plusieurs produits séparément jusqu'à ce qu'un seul produit puisse répondre à tous les besoins.



MOKI C'est également lorsque nous effectuions une formation sur des modèles vidéo à grande échelle et la vérification de divers courts métrages d'IA que nous avons découvert un gros problème. En fait, il n'existe aucun moyen de transformer les matériaux générés par le modèle vidéo à grande échelle en un film. ou une histoire en un seul clic. Mais nous disposons en réalité de toutes les capacités techniques nécessaires pour réaliser des courts métrages sur l’IA, alors pourquoi ne pas les combiner en un seul produit ?

Par conséquent, ce flux de travail d’IA est utilisé pour résoudre certains des problèmes actuels dans différents scénarios verticaux.



qubit: Lorsque nous avons commencé à filmer ce produit, notre ciblage était aussi précis que la diffusion de bouche à oreille. Cela reflète votre capacité à explorer les points faibles et les définitions dans le développement et l'application de produits.

Wu Xinhong: Oui, en fait, faire une demande, c'est essentiellement créer un service. Si vous voulez bien servir vos clients, vous devez constamment recueillir leurs commentaires.Nous aimons particulièrement les commentaires négatifs . Ce ne sont que les plaintes de l’utilisateur. Plus il gronde, plus nous pensons que cela a de la valeur, car cela peut nous aider à optimiser rapidement le produit.

nous pensons,La période fenêtre pour les applications d’IA ne devrait être que de deux ans , et puis un an s'est écoulé. Il ne reste donc plus beaucoup de période de bonus aux développeurs. La période fenêtre se termine progressivement et le morceau est progressivement saturé. Après saturation, tout le monde va effectivement s'arrêter. Pour les différentes expériences que vous venez de mentionner, nous continuerons à optimiser de manière itérative en fonction des données. D’une manière générale, elle se trouve encore dans une phase relativement étendue de croissance barbare. Étant donné que les applications actuelles de l’IA dans différents domaines sont en réalité loin d’être saturées, tout le monde va donc d’abord prendre une position approximative et rapide.

qubit: Il m'a été difficile de télécharger de nouvelles applications depuis un certain temps, à cause de l'IA, j'en ai à nouveau téléchargé beaucoup pour en faire l'expérience. Cela semble être un nouveau cycle ?

Wu Xinhong : Dans le futur, les plus forts survivront progressivement. Parce que de nombreuses personnes démarrent désormais des applications d'IA à partir d'un seul point, mais elles sont facilement couvertes par des produits plus puissants et des entreprises plus grandes. Peut-être que ces produits ou entreprises n'ont pas l'intention de l'attaquer, mais il est vrai qu'ils le couvriront naturellement. Ainsi, lorsque nous créons cette application d'IA, nous devons vraiment être profondément impliqués dans une industrie, un scénario vertical, et la rendre très approfondie. Cette profondeur inclut vos produits et technologies dans des scénarios verticaux, et vos produits et technologies doivent être suffisamment bons. et puis votre cognition, parce que vous y consacrez énormément de temps chaque jour, et vos connaissances doivent être plus profondes que celles des autres. Je pense que cela risque de devenir une concurrence de plus en plus féroce et de continuer à prendre pied, car il y en a trop. les dividendes affluent maintenant, mais ils ne combinent pas nécessairement certains de leurs propres avantages. Il peut y avoir beaucoup de gens qui suivent la tendance, mais ils n'ont pas nécessairement de réels avantages.

qubit: Il s’agit plutôt de rattraper la tendance et l’enthousiasme.

Wu Xinhong: C'est encore assez facile à atteindre, donc nous avons toujours un fort sentiment de limites maintenant. La piste de nos images et de nos designs est déjà suffisamment grande. Nous devons même continuer à être plus verticaux et plus profonds sur cette piste pour tenir notre route. position, sinon, une fois impatient, il est facile d'étendre son territoire et d'être impacté.

"Que cela puisse aider les utilisateurs à gagner de l'argent est le principal critère pour créer de nouveaux produits."

qubit: Est-il clair maintenant que vous ne voulez pas le faire ou avez-vous un sentiment de limite ?

Wu Xinhong: Alors maintenant, nous soulignonsRéutilisation des capacitésPar exemple, les capacités de génération de modèles de niveau le plus bas, y compris les capacités de milieu de gamme, doivent être réutilisées dans différents produits pour éviter de nécessiter de nombreux développements personnalisés pour chaque produit.

Nous affinons les points communs forts du produit, c'est-à-dire les capacités dont il dispose, comme le module de plate-forme intermédiaire. Nous attachons également une grande importance aux effets d'échelle. Lorsque nous effectuons ces investissements, nous devons obtenir de meilleurs revenus en servant un plus grand nombre d'utilisateurs, afin de pouvoir avoir certains avantages dans la concurrence. Parce que toute industrie est impliquée dans une concurrence basée sur des économies d’échelle.

Donc, en résumé, nous affinons de forts points communs, réutilisons la technologie sous-jacente et les capacités de milieu de gamme et créons des effets d'échelle en termes de revenus et d'échelle des utilisateurs. En combinaison avec les scénarios verticaux mentionnés tout à l'heure, nous devons pénétrer en profondeur.

C'est notre perception actuelle des limites ou notre compréhension de la compétitivité future.

qubit: Les limites véhiculent la stabilité, mais elles représentent également un plafond visible, et beaucoup de gens préfèrent ne pas exprimer de plafond.

Wu Xinhong : Nous sommes une entreprise qui n'aime pas peindre des gâteaux. Le studio de conception photo et les cas d'application de prise de vue mentionnés dans la conférence de presse ont tous été apportés par des vendeurs de commerce électronique de Yiwu et des villageois du village de Leshui, et ils étaient bien réels. Nous n’avons pas peur que les gens pensent FAIBLE, car c’est ce dont le public a besoin. Nous sommes une entreprise qui crée des produits et fournit de bons services au public. Parce que les valeurs de l'entreprise sont d'être véridiques et pragmatiques, et de gagner grâce à un travail acharné, ce que nous présentons est ce que nous pensons dans notre cœur.

Maintenant, lorsque nous nous demandons s'il faut créer un produit, la première chose est de savoir s'il peut aider les utilisateurs à gagner de l'argent. C'est le principe : aider les utilisateurs à gagner de l'argent, ils seront alors prêts à payer, et nous pourrons alors gagner de l'argent. Il est très réaliste de dire que je pense que de nombreux utilisateurs ont désormais un besoin urgent de gagner de l'argent, c'est donc la considération la plus fondamentale lorsque nous décidons de créer un produit.

qubit: Est-ce que cela sera différent de vos premiers Meitu Xiuxiu et Meipai bien connus ? Dans le passé, ils visaient davantage à répondre aux besoins des utilisateurs et même aux besoins de divertissement interactif, mais maintenant ce sont tous des outils de productivité ?

Wu Xinhong:parce queL’IA générative est naturellement plus proche de l’industrie, par exemple, Meitu Yunxiu aide les studios photo à gagner de l'argent, commence à filmer pour aider les diffuseurs de bouche à oreille, et Meitu Design Studio aide les petits et micro-vendeurs de commerce électronique. Cela les aide à gagner de l'argent réel et à améliorer leur efficacité, et cela peut en effet. aider l’industrie à réduire ses coûts et à améliorer son efficacité.

Deuxièmement, il y a des coûts de serviceBien sûr, beaucoup d’entre elles sont encore dans le cloud. Bien sûr, l’utilisation de ce type de puissance de calcul finale peut effectivement réduire les coûts à l’avenir, mais au moins actuellement, de nombreuses applications d’IA doivent couvrir leurs coûts de production par le biais d’abonnements et d’achats uniques. .

Par conséquent, il convient naturellement comme outil de productivité, qui peut aider l'industrie à réduire les coûts et à améliorer l'efficacité, et peut également couvrir ces coûts par le biais d'un abonnement.

La combinaison de l’IA générative et des outils de productivité est également un choix inévitable , vous devez au moins faire tourner l’ensemble de votre modèle économique, ce qu’on appelle le volant de croissance. Ce n’est que si vous pouvez gagner de l’argent que vous pourrez rembourser votre investissement dans la production et la recherche. En ce qui concerne les investissements dans la production et la recherche, ils seront également plus importants, à l’instar des grands modèles évoqués tout à l’heure ou de nos investissements dans le renforcement de la Chine.

"Dites adieu à la mentalité de vente à chaud, rivalisez pour la productivité et la valeur sans vous arrêter"

qubit :Pensez-vous que le monde extérieur a une juste perception que votre IA vous apporte des changements ? Le haut et le bas des belles images sont rafraîchis par l’IA générative.

Wu Xinhong : Pour être honnête, nous n’avons pas besoin de parler d’équité à longueur de journée. Vous devez me connaître objectivement, mais vraiment créer un produit solide, obtenir une bonne croissance des utilisateurs et des revenus, et les gens changeront naturellement leur perception de vous après avoir vu les résultats. En fait, beaucoup de gens pensent que Meitu est l'entreprise qui sera la plus durement touchée à l'ère de l'IA.

qubit :Ouais? Quelqu'un vous a dit ça ?

Wu Xinhong : Par exemple, après les débuts de l'IA d'Apple, je me demande pourquoi les utilisateurs Apple auront besoin de vos produits Meitu à l'avenir ? Mais il s’agit d’un problème de profondeur, car la profondeur de l’assistant IA est en réalité limitée et les liens sont relativement peu profonds. Alors si vous souhaitez approfondir, vous pouvez avoir une relation complémentaire.

nous disonsAgent IA , il fait appel à divers outils et capacités pour accomplir des tâches spécifiques, plutôt que de pouvoir tout gérer seul. Je pense donc que cela nécessite que tous les acteurs du secteur grandissent ensemble et que les utilisateurs établissent progressivement des attentes relativement objectives concernant l’IA dans son utilisation réelle.

qubit: Pensez-vous qu’il y aura un moment ou une période où tout le monde se rendra compte que les produits d’IA de Meitu commencent à exploser ?

Wu Xinhong:nousChoisir de créer des outils de productivité à l’ère de l’IA générative est un choix à long terme.Parce que les outils de productivité ne sont pas çaMode , cela ne signifie pas que vous pouvez devenir un succès tous les jours et devenir un succès instantané. Mais il s'agit en effet d'une chose précieuse à long terme, nous continuons donc à y accumuler des capacités et à itérer des produits. Peut-être qu'à mesure que les utilisateurs s'accumulent et que les capacités du produit s'améliorent, il atteindra progressivement un stade de mieux en mieux.Cela ne signifie donc pas nécessairement qu’un jour cela va vraiment exploser et changer complètement.L’eau courante ne rivalise pas pour la première place, mais elle rivalise avec le débit. . Nous n’avons pas nécessairement envie de le saisir à ce moment-là et de dire que nous sommes les premiers.

Comme le modèle vidéo, ses capacités seront progressivement alignées au cours de l'année prochaine. Pour être honnête, le modèle image sera bien en avance sur Midjourney au début, mais il n'y aura pas beaucoup d'écart de capacités par la suite. est Ou comment implémenter l’application et comment la monétiser. Nous gardons donc un profil bas et faisons avancer les choses, et nous ne pouvons pas délibérément parler de la façon dont nous voulons être le leader de l'industrie. En fait, cela n'est pas important.

qubit: Maintenant vous avez l'esprit très apaisé. Les belles images ont été mises en valeur. Ressentez-vous un sentiment de disparité maintenant ?

Wu Xinhong: Non, je suis dans un bon état d'esprit maintenant.Nous voulons vraiment aider les utilisateurs à créer de la valeur , nous pensons que c’est la bonne chose, mais que c’est une démarche à relativement long terme. Encore une fois, puisque vous avez choisi d'être un outil de productivité à l'ère de l'IA générative, vous devez être capable de supporter des premières étapes continues, relativement longues, et vous devez rompre avec la pensée inertielle passée consistant à fabriquer des produits finaux C et des succès chauds.

Parce qu'il s'agit essentiellement d'une relation entre deux choses, nous recherchons maintenant le bon secteur, le bon scénario d'utilisation et le bon groupe d'utilisateurs cible, et continuons à renforcer ce produit et à bien les servir. Nous ne nous lancerons pas dans autre chose et nous ne saisirons pas forcément toutes les opportunités qui se présentent à nous. Faites simplement de notre mieux.

Qu’il s’agisse de démarrer une séance photo ou un studio de design photo, sous ce concept. Ils se développent tous très bien et les revenus des utilisateurs augmentent rapidement. C’est la valeur, la vraie valeur.