nouvelles

Conversation avec Huoshan Tandai : Aujourd'hui, l'industrie facture sur la base de jetons, mais ce modèle ne sera pas le seul à l'avenir.

2024-08-06

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Texte|Anita Tang

Éditeur|Su Jianxun

Source de couverture | Fourni par l'entreprise

L’émergence est un phénomène clé dans la vague de l’IA générative : lorsque l’échelle du modèle atteint un point critique, l’IA fera preuve d’une sagesse semblable à celle de l’humain et pourra comprendre, apprendre et même créer. L'« émergence » se produit également dans le monde réel : la civilisation basée sur le silicium est sur le point d'éclater. Les entrepreneurs et les créateurs dans le domaine de l'IA utilisent leur sagesse et leur cerveau pour éclairer le long voyage vers la réalisation de l'AGI. A la transition entre l'ancienne et la nouvelle productivité, "Smart Emergence" lance une nouvelle rubrique "Emergence de 36 personnes". Nous enregistrerons la nouvelle réflexion à ce stade à travers des conversations avec des personnalités clés de l'industrie.

Le moteur Volcano en 2024 a changé par rapport à son profil bas précédent et apparaît désormais à un rythme rapide sur le marché des grands modèles.

Il n'y a pas si longtemps, en mai, Huoshan vient de tenir une conférence de presse accrocheuse, qui a abaissé d'un seul coup le prix du modèle au « prix plancher ». Le prix du modèle principal de Doubao, le Doubao Pro-32k, a été réduit à 0,0008 yuans/millier de jetons, soit une baisse moyenne du secteur de 99,3 % sur un an. Pendant un certain temps, l’ensemble de l’industrie était en émoi, et les fabricants ont emboîté le pas.

Mais deux mois plus tard, Volcano Engine, qui avait « renversé la situation » en matière de prix, n'était plus disposé à parler davantage de prix. "Maintenant, avec 1 milliard de jetons coûtant seulement 1 000 yuans, cela n'a plus beaucoup de sens de baisser le prix. Ce qui compte, c'est de savoir dans quelle mesure la capacité du modèle est améliorée au même prix." a déclaré à "Intelligent Emergence".

Dans une certaine mesure, la "grande semaine de promotion" orageuse de mai - en plus de Huoshan, Alibaba, Tencent, iFlytek et d'autres grands et petits fabricants ont annoncé des baisses de prix pour les grands modèles, ce qui est un symbole de l'entrée du secteur des grands modèles dans un nouvelle étape. Le consensus derrière cela est que, même si les grands modèles sont déjà éblouissants, le nouveau gâteau de l'IA qu'ils apportent est encore trop petit : la puissance de calcul est trop chère et les utilisateurs ne sont pas incités à innover. Les fabricants pourraient donc tout aussi bien partager les bénéfices.

L'effet est également immédiat. L’utilisation quotidienne moyenne des jetons de Doubao Big Model dépasse désormais les 500 milliards. Avant la baisse des prix, ce chiffre était de 120 milliards.

Par rapport à des termes tels que guerre des prix et revenus, Tan Dai se préoccupe davantage du nombre d'utilisateurs qu'il a attiré et du nombre de choses qu'il a faites avec de grands modèles. « Nous ne regardons pas trop les revenus à court terme, mais plutôt le nombre de clients avec lesquels nous avons établi une coopération plus approfondie et le nombre de problèmes que nous les avons aidés à résoudre. Les résultats suivront naturellement », a-t-il déclaré.

Les gens ont tendance à prédire l’avenir en suivant le chemin du passé. Les grands modèles et le cloud computing sont tous deux considérés comme des entreprises ayant des modèles similaires : des investissements techniques importants et des recherches et développements en ingénierie au début, mais l'effet Matthew est extrêmement élevé dans un stade ultérieur. Mais le principe est que l'échelle des activités doit atteindre une très grande échelle avant de pouvoir réellement produire des effets d'échelle.

Les grands modèles de cette année évoluent dans cette voie : les fabricants baissent les prix les uns après les autres, rendant la puissance de calcul des grands modèles plus inclusive et devenant une infrastructure comme l'eau, l'électricité et le charbon.

Tan Dai estime qu'à l'avenir, la mise en œuvre de grands modèles sera plus rapide que le cloud computing. Des produits tels que ChatGPT ont déjà fait savoir au monde que l’IA est l’avenir, contrairement au cloud computing qui a fait l’objet d’un long « sermon ». Mais pour permettre à chacun d’innover sans soucis, la baisse des prix n’est qu’une première étape.

L’explosion des applications d’IA nécessite un investissement continu pour surmonter diverses difficultés techniques des modèles : illusions de contrôle, textes longs, etc. "Je ne pense pas que les développeurs soient inquiets. Il est trop tôt pour parler de Killer App maintenant." Il a déclaré que le grand modèle actuel est encore dans l'ère "Big Brother", "il faudra de nombreuses années avant que l'iPhone n'apparaisse".

En 2021, Huoshan est officiellement entré sur le marché du cloud. Il n'est désormais complet que depuis trois ans et constitue toujours une nouvelle force sur le marché du cloud computing. Par conséquent, l'IA n'est pas seulement un ticket pour une nouvelle ère pour le Volcano Engine, mais aussi une opportunité de dépasser dans les virages - c'est aussi la raison pour laquelle le Volcano Engine investit massivement dans l'IA. En 2023, 70 % des grandes entreprises modèles nationales utiliseront les services de puissance de calcul de Volcano Engine ; et cette année, le MaaS (Model as a Service) sera le prochain champ de bataille.

Ce qui suit est une transcription de la conversation entre « Intelligence Emergence » et Tan Dai, compilée et éditée :

Après que le prix ait "renversé la table"

« Émergence du renseignement » : La chose dont on a le plus parlé récemment à propos de Huoshan est que vous êtes le premier parmi les grands fabricants à lancer une vague de baisses de prix. Les gens disent que vous avez « renversé la situation ». Quelle était la pensée derrière cela ?

Tan-Dai :Notre principale préoccupation est de créer un écosystème d’applications.

« Émergence du renseignement » : Était-ce une décision difficile pour vous de réduire le prix ? Depuis combien de temps y penses-tu ?

Tan-Dai : Pas difficile du tout. Après son lancement officiel en août de l'année dernière, le coût a dû être particulièrement élevé. Depuis lors, nous procédons à l'optimisation technique et l'avons largement utilisée en interne. Après environ un an d'optimisation technique, nous avons commencé à envisager des réductions de prix.

« Émergence du renseignement » :Pourquoi cette décision n’est-elle pas difficile ?

Tan-Dai : Nous nous demandons quelle est la chose la plus importante dans cette affaire ? Autrement dit, nous voulons rendre l’écosystème des affaires prospère.

Il y a plusieurs seuils derrière cela. La première est la capacité des modèles à fabriquer des poufs. Lors de notre conférence 515, tout le monde a constaté que lorsque nous avons introduit le grand modèle, nous n'avons pas mentionné notre propre ensemble d'évaluation, ni les résultats de l'évaluation.

Parce que je pense que tout le monde peut l’utiliser. Quant à l'évaluation, il existe de nombreuses évaluations tierces, notamment Zhiyuan, OpenCompass, etc., et elles disent toutes que le pouf est très efficace.

La deuxième est que le coût est trop élevé, il faut donc d'abord baisser le prix et en faire un prix durable. Parce que nous sommes une entreprise To B, si la tarification ne peut pas soutenir le bénéfice brut ou le profit à long terme, elle ne sera pas viable.

Le troisième est l'aspect pratique de la mise en œuvre, y compris les plug-ins, les boîtiers, etc., qui nécessitent la mise en place de beaucoup de choses. Nous réduisons les coûts grâce à l'optimisation de l'ingénierie. C'est ce que Huoshan, un fournisseur de cloud, doit faire.

« Émergence du renseignement » :Comment le volcan a-t-il pu réduire le prix à un prix aussi bas ?

Tan-Dai :En optimisant continuellement la structure de notre modèle et l'ingénierie d'inférence, nous pouvons réduire les coûts et reverser ce dividende à l'industrie.

En tant que service, les grands modèles doivent être à plus grande échelle et moins coûteux. À grande échelle, vous pouvez avoir des charges différentes et effectuer des planifications échelonnées et mixtes. Il en va de même pour le cloud computing, ce qui le rend moins cher.

Deuxièmement, lorsque l’échelle est suffisamment grande, avec un peu d’optimisation, les bénéfices seront suffisamment importants, et ce n’est qu’alors qu’il pourra y avoir suffisamment de budget pour constituer une bonne équipe technique.

« Émergence du renseignement » : Il s’agit d’un processus qui se renforce mutuellement. Premièrement, c’est moins cher et l’échelle est plus grande. Ensuite, vous pouvez optimiser et les avantages seront plus importants.

Tan-Dai : Cela est également dû à l'augmentation des appels vers l'application Doubao. Tout le monde peut voir à partir des données tierces précédentes que les produits d'IA et l'application Doubao se sont classés en premier. Au sein de Douyin, plus de 50 scénarios et secteurs d'activité sont largement utilisés, et il y a également de nombreux clients invités de l'extérieur, ce qui a soutenu l'échelle.

Après l'annonce de la réduction de prix le 15 mai, notre échelle d'appels a augmenté plus rapidement et nous avons alors constaté davantage de points pouvant être optimisés.

« Émergence du renseignement » :Après l’annonce officielle de la réduction des prix, quel a été l’effet ?

Tan-Dai : Tout d’abord, tout le monde n’a plus le fardeau d’innover dans le domaine de l’IA, et l’échelle croît rapidement. De nombreuses startups utilisent plus d’un milliard de jetons chaque jour. Combien coûte actuellement un milliard de jetons ? Seulement 1 000 yuans. Par rapport à la sortie du modèle le 15 mai, l'utilisation quotidienne moyenne des jetons par client a augmenté de 20 à 30 fois.

Et il existe de nombreux scénarios d’utilisation auxquels nous n’avions pas pensé. Regardons le volume d'appels quotidien initial de Doubao, qui était de plus de 120 milliards de jetons. Après la réduction des prix, il a maintenant dépassé 500 milliards de jetons.

Deuxièmement, lorsque nous avons annoncé la réduction des prix, certains ont dit que le prix n'était pas important, mais petit à petit, de nombreux fabricants ont commencé à emboîter le pas.

« Émergence du renseignement » : Votre modèle principal Beanbao Pro 128k est au prix de 0,005 yuans/millier de jetons, soit 95,8 % de moins que le prix de l'industrie, tandis que le modèle 32k est au prix de 0,0008 yuans/millier de jetons, soit une baisse de 99,3 %. Ce prix peut être qualifié de « prix plancher ». Comment a-t-il été déterminé ?

Tan-Dai : Nous avons d’abord fixé un objectif, et nous devons distribuer les dividendes à un prix durable. Ce n’est pas une perte, mais je n’ai pas besoin d’en gagner trop. Au départ, je pensais qu’il s’agissait d’une baisse de 90 % par rapport à la moyenne du secteur, mais je ne m’attendais pas à ce que la comparaison ultérieure montre une baisse de 99 %.

« Émergence du renseignement » :Y aura-t-il une possibilité de baisse des prix à l’avenir ?

Tan-Dai : De ce point de vue, le prix n’est plus le goulot d’étranglement. Une fois qu'il est tombé à un niveau aussi bas, peu importe à quel point il baisse encore, le gain pour les utilisateurs sera en réalité faible. Ce qui est plus important maintenant, c'est qu'au même prix, il est plus significatif d'améliorer les capacités du modèle.

« Émergence du renseignement » : Est-ce un peu comme la précédente vague d’innovation en matière d’IA en matière de CV (reconnaissance visuelle) ? Il est important d’augmenter la précision de 70 % à 90 %, mais au final, passer de 95 % à 98 % ne signifie en réalité pas grand-chose, et les clients peuvent l’accepter.

Tan-Dai : Il ne pourra peut-être pas faire 98 %. Mais il faut regarder la situation à l'envers. Auparavant, il s'agissait d'un mauvais cas de 5 % (résultat non conforme aux attentes), mais il est désormais de 2 % et l'effet a doublé.

« Émergence du renseignement » : Il y a également de nombreux commentaires dans l'industrie selon lesquels une guerre des prix a commencé en Chine, ce qui est préjudiciable à l'industrie. Parce que la formation de grands modèles coûte cher, personne ne peut gagner de l’argent.

Tan-Dai : Je ne suis pas d'accord avec ce point de vue. D'un point de vue industriel, cela a permis à l'IA chinoise de prospérer, ce qui est une bonne chose.

Il en va de même pour le cloud computing : le cloud est entré plus tôt dans une guerre des prix, ce qui est une bonne chose. La transformation numérique des entreprises est devenue plus facile et les coûts ont été réduits. Nous ne pouvons pas l'envisager du point de vue d'une seule entreprise.

« Émergence du renseignement » :Dans le passé, dans le contexte d’Internet, la « guerre des prix » avait une connotation trop péjorative.

Tan-Dai : Je pense qu'il y a une différence. Dans le passé, le modèle économique de To C Internet était différent. La laine vient du porc. Mais dans la guerre des prix To B, l’entreprise elle-même compte sur cela pour facturer, et si elle continue à proposer ce prix, tout le monde en bénéficiera en fin de compte.

« Émergence du renseignement » : C'est définitivement une bonne nouvelle pour les développeurs. Mais qu’en est-il en interne ? Certains camarades de classe commerciaux de Cloud Factory nous ont dit qu'ils n'étaient aucunement motivés à vendre de l'IA, car l'IA ne peut pas se vendre à un prix élevé. Comment considérer cette question ?

Tan-Dai : C'est une très bonne question. J'ai l'impression qu'il n'y a rien à perdre pour nous.

Tout d'abord, Huoshan est une plate-forme cloud, et les clients ne veulent pas seulement un grand modèle, ils veulent en fait une solution complète, qui comprend de grands modèles, des cloud et des produits de données.

Le revenu unitaire du grand modèle lui-même a diminué, mais en aidant les clients à résoudre davantage de problèmes grâce au grand modèle, vous aurez plus d'opportunités de faire davantage d'affaires avec eux à l'avenir. Si le grand modèle est prêt, les clients nous diront même : non, mon architecture informatique doit être reconstruite, et nous le ferons ensuite à partir de volcans.

« Émergence du renseignement » : Comment comprendre la reconstruction de l’architecture informatique ? Où sont les espaces et les opportunités présents ?

Tan-Dai :Dans le passé, de nombreux aspects des dépenses informatiques n'étaient pas résolus par le cloud, mais par la superposition de fonctions logicielles. Tout était réalisé par la main-d'œuvre et de nombreux éléments ne pouvaient pas être convertis en puissance de calcul.

Mais avec le grand modèle, de nombreux scénarios, que ce soit en utilisant Copilot ou Autopilot, de nombreux scénarios d'IA peuvent être servis par le grand modèle, et la couche inférieure du grand modèle est le cloud. Des marchés auparavant inaccessibles au cloud sont désormais devenus des marchés accessibles.

« Émergence du renseignement » : Dans quelle mesure les clients reconnaissent-ils l’IA aujourd’hui ? Lorsque le cloud computing est apparu pour la première fois, de nombreux utilisateurs d'entreprise ont assimilé le cloud computing au concept « avancé » et ont ensuite opté pour la numérisation. Les grands modèles ont-ils maintenant obtenu un tel effet ?

Tan-Dai :Les entreprises ne prétendent pas qu’après avoir adopté l’IA, tous les environnements informatiques seront immédiatement supprimés par l’IA. Ce n’est absolument pas possible. Au lieu de cela, elles identifient d’abord certains scénarios dans lesquels l’IA peut être utilisée pour améliorer l’efficacité.

Par exemple, nous avons vu que pour certains clients, une fois le modèle appelé en volume, les services amont et aval s'effondrent. Ils vont transformer ces architectures basées sur le cloud natif pour supporter la charge.

« Émergence du renseignement » :Dans quelle mesure ces cas se répercuteront-ils sur les revenus ?

Tan-Dai : Ce n’est pas uniquement une question de revenus, et nous ne sommes pas trop concentrés sur le court terme pour le moment. Nous examinons également le nombre de clients avec lesquels nous avons établi une coopération plus approfondie dans le cadre de cette affaire et le nombre de problèmes que nous les avons aidés à résoudre. En fin de compte, les résultats viendront naturellement.

« Émergence du renseignement » :Si vous ne vous concentrez pas sur les revenus à court terme, quel indicateur valorisez-vous le plus actuellement ?

Tan-Dai : Le nombre de jetons utilisés par les entreprises, mais je ne pense pas que ce sera uniquement ce modèle à l'avenir. J'ai connu autrefois un ami qui écrivait des romans, mais qui a ensuite « abandonné l'écriture et commencé à écrire de la poésie ». Je demande, pourquoi as-tu fait ce choix ? Il a dit qu'écrire de la poésie se paye au trait, et écrire des romans se paie au mot - le prix est différent pour les mêmes 100 mots.

Le modèle économique du grand modèle va certainement changer, et le modèle économique final est un modèle plus de bout en bout. Par exemple, s’il y a un Agent, vous le paierez autant que le nombre de problèmes qu’il vous aide à résoudre. Pour les mêmes 100 mots, celui qui le produira sera différent. Il s’agit d’un modèle économique plus avancé.

Les applications d'IA n'ont pas explosé, mais l'essentiel reste un problème de capacités de modèle

« Émergence du renseignement » : En ce début d’année, l’industrie discute désormais d’un terme très ancien : Killer App. Tout le monde se demande pourquoi il n’y a pas encore eu d’application géniale. En tant qu'important fournisseur d'infrastructures, Huoshan, que pensez-vous de la période actuelle d'application de l'IA ?

Tan-Dai : Je pense qu'il existe en fait une application Killer maintenant, et ChatGPT en est une. Quel que soit le nombre d'utilisateurs et les revenus, il est plus rapide que tous les produits Internet, TikTok et Douyin, c'est déjà un signal fort.

En parlant maintenant de Killer App, je pense que je regarde toujours cette question du point de vue To C. Les grands modèles fonctionneront certainement très rapidement dans les scénarios côté C, car la zone d'essai est très large, comme les applications de chat et de compagnonnage émotionnel, maintenant ils fonctionnent tous très rapidement.

Deuxièmement, nous ne devons pas nous limiter à Killer App, car il existe de nombreux scénarios de productivité du côté de l’entreprise, comme le service client IA. Dans ces scénarios, le concept de Killer App ne s'applique pas et nous n'en discutons pas avec des indicateurs tels que DAU.

Les services d'entreprise ne parlent pas de Killer App. L'ERP (logiciel de système de gestion d'entreprise) est une application qui tue. Chaque entreprise doit l'avoir, mais personne ne parle de ce concept.

« Émergence du renseignement » : Globalement, hormis ChatGPT qui a atteint le niveau de Killer App, les autres produits sont loin derrière. Par exemple, la camaraderie émotionnelle et la création d'amitiés restent concentrées sur un groupe de personnes relativement restreint et le degré d'homogénéité est encore élevé.

Tan-Dai : Je pense que cela dépend du temps. Par exemple, à l'ère du PC, l'application Killer était un moteur de recherche, mais les moteurs de recherche ne sont apparus que très tard. Dans le passé, ils étaient tous des portails et des sites de commerce électronique. Mais après que ces sites Web se soient multipliés, les moteurs de recherche sont réapparus.

Y compris lorsque l'Internet mobile commençait à peine, des applications comme Douyin et Meituan ne sont sorties que plusieurs années plus tard.

« Émergence du renseignement » : Vous venez du milieu du cloud computing. Par rapport au cloud computing, que pensez-vous de cette vague de vulgarisation de la technologie de l’IA ? Est-ce que cela suivra le même chemin que la popularité du cloud computing ?

Tan-Dai : Le cloud computing est assez compliqué à comprendre même si vous êtes un technicien, et il ne faut pas une seule personne pour le mettre en place facilement. J'ai travaillé chez Alibaba de 2010 à 2011. À cette époque, AWS était probablement le seul au monde à avoir compris ce qu'était le cloud, et Google ne l'avait pas non plus compris.

Mais l’IA est différente. En tant qu’individu, vous pouvez facilement expérimenter ses fonctions et savoir rapidement si elle est bonne ou mauvaise. Si vous voulez savoir ce qu’est l’IA, prenez simplement un pouf. De ce point de vue, ce n’est pas comme le cloud computing, qui nécessite une évangélisation trop compliquée.

« Émergence du renseignement » :Une telle voie de vulgarisation affectera-t-elle la prise de décision et la logique d’achat du business To B ?

Tan-Dai : Chaque entreprise est inerte et les activités To B vont devenir plus lentes. Mais au moins lorsque vous comprendrez si le produit est bon ou non, l'expérience client changera.

Un grand changement apporté par l'IA est qu'elle rend les activités To B visibles et accessibles, et le temps de POC (vérification du prototype) sera beaucoup plus court. Dans le passé, la prise de décision et l'utilisation étaient séparées. Les décideurs faisaient des choix, mais les utilisateurs penseraient que c'était nul.

Mais l’IA a considérablement atténué ces écarts. Dans le passé, les clients devaient regarder des PPT, faire des tournées et réaliser des interviews. Au final, les décideurs ne pouvaient que regarder la démo, et l'expérience n'était pas si complète. Désormais, lorsque je parle à un client, celui-ci nous parle du pouf que j'utilise habituellement. S'il souhaite ajuster quelque chose dans la démo, il peut le modifier en arrière-plan et il sera ajusté immédiatement. Vous pouvez même le faire vous-même avant les ventes, et il n'est pas nécessaire de revenir avant les ventes pour que la R&D apporte des modifications.

C'est pourquoi nos poufs To C et To B sont tous deux de la même marque, tous deux des poufs.

« Émergence du renseignement » :En ce qui concerne les grands modèles nationaux, pensez-vous qu’il y a une grande différence maintenant ?

Tan-Dai :La différence de prix est énorme.

« Émergence du renseignement » :Est-ce que tout le monde n’a pas beaucoup chuté ?

Tan-Dai : En fait, les fabricants nationaux n'ont pas suivi à fond.Notre modèle principal, qui est le plus puissant, a également été réduit à 0,0008 yuans/millier de jetons. Cependant, la plupart des fabricants ne réduisent pas le modèle le plus puissant, mais abaissent le deuxième modèle le plus puissant, ou le réduisent. a Les petits modèles sont gratuits. Si vous regardez combien coûtent les principaux modèles de certains fabricants concurrents, ils seront au moins des dizaines de fois différents du prix des poufs.

L’utilisation de modèles open source pour mesurer les coûts est également plus coûteuse que l’utilisation de poufs. Si vous utilisez le logiciel open source Llama pour le faire, vous devez effectuer l'optimisation technique vous-même, et il n'y a aucun avantage d'échelle. Avec le même effet, réaliser soi-même une optimisation technique coûte plusieurs fois plus cher que d’utiliser directement le cloud.

« Émergence du renseignement » :Outre le prix, quelles sont les autres différences ?

Tan-Dai : Le modèle évolue encore rapidement et de nombreuses capacités n'ont pas encore été développées. Il y aura encore de nombreuses différences à l'avenir, et elles s'amélioreront de plus en plus. Mais si l’on regarde le monde, il n’y a peut-être que trois ou quatre entreprises qui se portent très bien, du moins pas autant que les dix entreprises chinoises.

« Émergence du renseignement » :Dans quels secteurs les clients de Huoshan sont-ils actuellement concentrés ?

Tan-Dai : Il existe dans des milliers d’industries. Les fabricants de téléphones mobiles qui réussissent relativement bien incluent Samsung, Xiaomi, OPPO, Vivo et Honor. Nous travaillons aussi beaucoup avec les constructeurs automobiles, et ce sont tous de très grandes entreprises. Il existe également quelques cas dans les banques financières.

Mais l'angle d'entrée sera différent. Par exemple, dans les téléphones mobiles et les voitures, nous réalisons un scénario d’interaction homme-machine relativement complet. Mais pour de nombreuses grandes entreprises publiques ou banques, elles peuvent d’abord s’essayer à partir d’un petit point.

L’avantage de faire de l’IA est donc que l’on peut démarrer petit à petit, et qu’il n’est pas nécessaire de couper le cœur du système dès le début.

« Émergence du renseignement » : Les profils clients de chaque plateforme grand modèle sont-ils très différents ? De nombreuses entreprises qui construisent de grands modèles sont des fournisseurs de cloud, et les groupes de clients des fournisseurs de cloud présentent également des différences sectorielles.

Tan-Dai : Il y a une différence lorsque l'échelle commerciale du grand modèle est petite, mais il n'y a pas de différence lorsque l'échelle est grande. Il y a certainement plus de clients de petite et moyenne taille à l'heure actuelle, mais si l'on regarde la répartition par secteur, il n'y a pas nécessairement de différence particulièrement grande.

« Émergence du renseignement » :Du côté C et du côté B, de quel côté pensez-vous que le grand modèle montera en premier ?

Tan-Dai : Notre volume actuel est à peu près le même, mais l'effet Matthew du côté C est très fort. Peut-être que les quelques principaux clients ont contribué beaucoup en DAU. Cette logique s’applique à la face C, même lorsqu’il ne s’agit pas d’IA, mais le développement de la face B s’inscrit dans la très longue durée.

« Émergence du renseignement » : Ce que les grands modèles peuvent faire maintenant est relativement simple. Par exemple, tout le monde a le sentiment que la définition d'agent n'est même pas alignée. Pourquoi l’exécution de grands modèles ne peut-elle désormais se limiter qu’à des scénarios aussi simples ?

Tan-Dai :La capacité du modèle n'est pas assez forte.

« Émergence du renseignement » :Quels sont les points clés à franchir ?

Tan-Dai : Il y en a plusieurs. La capacité du modèle doit être forte et l'intelligence doit être forte. N'était-ce pas l'examen d'entrée à l'université il y a quelque temps ? Doubao a finalement « réussi » le cours d'arts libéraux, mais il n'a pas encore été admis à l'Université Tsinghua et à l'Université de Pékin, et il n'a même pas réussi le cours de sciences. évident, et son niveau n'est pas suffisant. Mais pas de problème, nous avons suffisamment confiance.

Deuxièmement, de nombreux problèmes complexes restent encore à résoudre, comme celui de la mémoire à long terme. Cela nécessite certainement une certaine innovation dans la structure du modèle, et la multimodalité doit être meilleure. Les coûts doivent également être contrôlés. Après avoir ajouté ces capacités, il n’est pas acceptable de trop augmenter les coûts.

Je pense qu'il est encore très tôt pour les grands modèles. La révolution des communications mobiles dure depuis 30 ou 40 ans. Depuis les années 1970 et 1980, l’histoire du développement de l’IA est plus longue que cela. Nous n’y travaillons que depuis deux ans. Lorsque nous utilisions encore des téléphones portables dans les années 1990, pouvions-nous penser à l’iPhone actuel ? Ce sont des changements survenus au cours des dernières décennies.

« Émergence du renseignement » :Le volume d’affaires actuel de Huoshan Model, qu’il s’agisse du nombre de clients ou des revenus, répond-il à vos attentes ?

Tan-Dai : Je pense que ça va et répond aux attentes. Nous espérons voir un écosystème prospère et nous avons désormais effectivement obtenu les résultats souhaités. Et ce n’est pas seulement nous qui montons, nous voyons que nos amis montent aussi.

« Émergence du renseignement » :Avez-vous une estimation du montant en tête ?

Tan-Dai : Par exemple, il existe un objectif pour le nombre total de jetons, qui est à la fois total et hiérarchisé. Par exemple, le nombre d'utilisateurs dont le nombre de jetons dépasse un certain niveau doit atteindre un certain niveau. Nous espérons que les clients formeront une distribution en forme de fuseau ou en forme d'entonnoir. Si le nombre total de jetons est très élevé, mais qu’il n’y a que dix clients avec plus de 100 millions de jetons, ce n’est pas sain non plus.

« Émergence du renseignement » :A quoi ça ressemble maintenant ?

Tan-Dai :Il n'a pas encore la forme d'une pyramide inversée et la taille de l'utilisateur peut être un peu plus épaisse.

« Émergence du renseignement » : Évidemment, après la baisse des prix des grands modèles, l’IA est devenue plus inclusive et peut faire plus de choses. Pensez-vous qu’il existe aujourd’hui une tendance claire parmi les premiers utilisateurs à devenir une « entreprise individuelle » ?

Tan-Dai : Aujourd’hui, il y a moins de « sociétés unipersonnelles » et davantage de « sociétés de dix personnes ». Je vois à l’étranger que beaucoup de choses peuvent être faites avec seulement deux ou trois personnes.

Nous avions l’habitude de plaisanter en disant qu’il suffisait d’un programmeur pour démarrer une entreprise, mais maintenant nous n’en avons plus besoin. Certains utilisateurs que nous avons interrogés ont déclaré que comme je n'ai pas de code, cette démo ne peut pas du tout être utilisée pour la vérification de prototypes (POC), mais c'est désormais possible. Il s'agit d'une percée de 0 à 1. À l’avenir, si le grand modèle est meilleur, l’IA pourra peut-être tout résoudre de 0 à 100.

OpenAI a initialement eu une discussion sur le moment où une entreprise licorne avec une seule personne dans l'entreprise (évaluée à plus d'un milliard de dollars américains) émergerait, et si cela prendrait cinq ans ou plus.

Dans ce cas, il ne faut pas se limiter à Killer App, car de nombreuses idées de startups visent à résoudre des problèmes très verticaux.

C'est un menteur de prêcher que « l'utilisation de l'IA aidera votre entreprise à se développer »

« Émergence du renseignement » :Vous concentrez-vous désormais davantage sur le côté technologique ou sur le côté client ?

Tan-Dai : presque. A court terme, les deux camps sont indissociables. L'IA n'est pas aussi mature que le cloud computing. L'amélioration du modèle d'IA, l'amélioration des produits et la manière dont les clients l'utilisent nécessitent un processus de feedback. Vous ne pouvez pas simplement rester assis au bureau et regarder.

« Émergence du renseignement » :Sur quels aspects des besoins ou des doutes actuels des clients se concentrent le plus ?

Tan-Dai :Il existe de nombreuses façons inattendues.

Par exemple, dans le domaine de l’éducation, certaines personnes pensaient : je peux simplement résoudre le problème à votre place. Mais dans de nombreux scénarios, les clients ont désormais besoin que vous jouiez le rôle d'un enseignant et que vous me disiez comment procéder, au lieu de simplement me dire quelle est la réponse. Cela nécessite plus que de simples capacités de modèle.

« Émergence du renseignement » :Pensez-vous qu'il s'agit d'un problème au niveau du produit ?

Tan-Dai :Vous pouvez y voir un problème de produit ou de demande, mais derrière cela se cachent également des problèmes techniques.

« Émergence du renseignement » : Du côté des clients, y aura-t-il désormais davantage de scénarios « Must have » ? Par exemple, les entreprises pensent désormais que l’IA est superflue ou envisagent peut-être de réduire les coûts et d’augmenter l’efficacité.

Tan-Dai : Tout le monde est déjà d’accord sur le fait que l’IA est la prochaine grande nouveauté, elle ne la manquera donc certainement pas. Désormais, nous n’avons plus besoin d’éduquer les entreprises sur le fait qu’elles doivent utiliser l’IA, mais il faut discuter avec elles des scénarios appropriés pour l’utilisation de l’IA. Parfois, les gens sous-estiment les capacités de l’IA, et parfois ils les surestiment.

« Émergence du renseignement » :Par conséquent, par rapport à l’ère précédente de numérisation, l’IA a apporté une nouvelle mise à niveau au concept de numérisation.

Tan-Dai : Peut être. Dans le passé, lors de la numérisation, une étape très importante consistait à transformer des données non structurées en données structurées et à faire comprendre aux gens les données structurées. Désormais, l’IA a tout résolu pour lui et le seuil de la numérisation a été abaissé.

« Émergence du renseignement » : Les entreprises voient-elles l’IA et la digitalisation sous le même angle ? Dans le passé, lorsque les entreprises passaient au numérique, le patron pensait que cela pourrait améliorer un peu l’efficacité, mais beaucoup considéraient encore cela comme un coût. Lorsque les entreprises se demandent si la numérisation va se développer, sa contribution est en réalité très faible. L’IA peut-elle changer cette situation ?

Tan-Dai : Je pense qu'il s'agit d'un processus décisionnel dans différentes dimensions. La technologie vise simplement à améliorer l'entreprise. D’une part, le patron veut voir mon modèle économique et, d’autre part, comment améliorer l’efficacité de mon entreprise grâce à la numérisation.

Supposons qu’un détaillant me demande : comment assurer la croissance de son entreprise ? Mon premier point n'est certainement pas de lui dire que vous souhaitez vous lancer dans l'IA, je dis définitivement : vous démarrez le e-commerce Douyin. Parlons ensuite des domaines dans lesquels nous pouvons vous aider à améliorer votre efficacité grâce à l’IA. Si vous dites dès le début « vous pouvez grandir avec l’IA », je pense que c’est un menteur.

« Émergence du renseignement » : J'ai un ami qui avait du mal à vendre des nuages ​​à Huoshan, mais il est parti vers 2022. Après avoir vu le grand modèle, il a estimé que cela offrait au volcan une opportunité particulièrement intéressante. Qu'en penses-tu?

Tan-Dai : Nous ne lancerons le cloud qu’à la fin de 2021. Bien sûr, ce sera difficile de le faire la première année, qui est la plus difficile. Il peut simplement s’y tenir pendant une autre année. En fait, notre croissance a été assez rapide au cours des dernières années et nous sommes les plus rapides du secteur.

Je pense que le temps fait les héros. S’il n’y a pas de nouveaux clients et pas de nouveaux scénarios pour les clients, même si vous faites de votre mieux, à quoi ça sert ? L'âge d'or précédent du cloud computing était dû à l'essor de l'Internet mobile et à la maturité progressive de la numérisation dans tous les domaines. C'est la loi naturelle du développement de l'industrie.

Mais la prochaine ère est celle de l’IA. J'ai l'impression que tous les dix ans ou plus, un nouveau point va émerger, et nous devons saisir ce nouveau point pour maintenir notre leadership technologique.

« Émergence du renseignement » :Pensez-vous que les développeurs avec lesquels vous entrez en contact actuellement sont anxieux ?

Tan-Dai : Personnellement, j’ai l’impression que personne n’est particulièrement anxieux. pourquoi ? Vous voyez, les modèles actuels sont plutôt bons et les prix sont si bas, alors essayez-en plus et il n'y a pas de quoi s'inquiéter. Il se peut que les investisseurs soient plus inquiets. (rire)

« Émergence du renseignement » :Certains développeurs sont inquiets car même si les modèles sont bon marché maintenant, ils étaient plutôt bons au début et pouvaient encore gagner de l'argent, mais une fois qu'ils commenceront à étendre leur échelle et à investir dans le trafic, le retour sur investissement ne sera plus correct et les véritables utilisateurs retenus sera rare.

Tan-Dai : Je pense que c'est un problème de trafic, pas un problème d'IA. Si vous n’utilisez pas l’IA, vous aurez toujours tort si vous utilisez d’autres choses. Par exemple, les jeux courts sont très populaires. Certains jeux courts peuvent rapporter de l’argent, tandis que d’autres ne le peuvent pas. C’est normal.

« Émergence du renseignement » :Quel est le scénario d’application d’IA le plus intéressant que vous ayez vu récemment ?

Tan-Dai : Il y en a pas mal, par exemple certains enfants utilisent des poufs pour apprendre directement l'anglais. Une autre de nos entreprises clientes souhaitait utiliser un modèle à grande échelle. Il a donc organisé un hackathon d'IA au sein de l'entreprise. Les employés ont développé plus de 100 produits en fonction des besoins commerciaux qu'ils rencontraient habituellement, et peut-être que deux ou trois d'entre eux ont réussi.

Nous coopérons désormais avec certains constructeurs automobiles, qui invitent même leurs utilisateurs à participer à l'ensemble de la conception. Lorsque les utilisateurs participent à la conception, ils peuvent mieux comprendre leurs propres problèmes.

« Émergence du renseignement » :Pour les entreprises que vous servez, dans quelle mesure le rapport entre la puissance de calcul de formation et d’inférence a-t-il changé aujourd’hui ?

Tan-Dai : Il y aura encore plus de formation. Mais l’inférence augmente désormais très rapidement, des dizaines de fois plus que l’année dernière, tandis que la formation a augmenté moins de deux fois. Nous avions initialement prévu que l’inférence dépasserait la formation d’ici 2025, et cela semble être le cas désormais.

« Émergence du renseignement » :Quand pensez-vous que les applications d’IA vont exploser ?

Tan-Dai : Tout d’abord, cette année n’est pas une grande explosion, mais c’est certainement une petite explosion. Mais je pense qu’il y aura une grande explosion l’année prochaine. Même d’un point de vue mondial, l’application de l’IA n’en est qu’à ses débuts. À l’avenir, des prix plus abordables garantiront des effets de modèle idéaux. Ce n’est que lorsque les applications de l’IA prospéreront et que les réactions chimiques continueront à se produire que l’écosystème pourra être construit.

« Émergence du renseignement » :Depuis 2023, vous soulignez que vous ne réaliserez pas de grands modèles de base. Le ferez-vous à l’avenir ?

Tan-Dai : Plus jamais. Le grand modèle Doubao est développé par une équipe dédiée chez ByteDance. Huoshan n'a pas besoin de créer le modèle lui-même, tant que le cloud et le MaaS sont bien réalisés.

Les gens qui font du cloud computing et ceux qui font de grands modèles sont définitivement complètement différents. Les principaux fabricants mondiaux font tous leur travail séparément. Le modèle d'Amazon est Claude, et le cloud est créé par AWS ; Google Cloud et Gemini ne sont pas créés par le même groupe de personnes.

Chez Huoshan, nous nous concentrons sur la bonne gestion du cloud, mais le MaaS est une partie très importante du cloud. Pour que MaaS réussisse, notre service MaaS fournira le meilleur modèle à nos clients. Cela n'a jamais changé.

Bienvenue dans le groupe

Bienvenue pour communiquer