le discours interne de robin li exposé : en discutant de trois malentendus cognitifs majeurs concernant les grands modèles, l'écart entre les modèles va se creuser à l'avenir

le discours interne de robin li exposé : en discutant de trois malentendus cognitifs majeurs concernant les grands modèles, l'écart entre les modèles deviendra plus large à l'avenir

2024-09-16

"le monde extérieur a beaucoup de malentendus à propos des grands modèles", selon des médias récents, un discours interne de robin li a été révélé. dans une récente communication avec les employés, robin li a évoqué trois malentendus à propos des grands modèles, concernant la concurrence des grands modèles, l'efficacité des modèles open source et les agents intelligents.s'orienterattendez les sujets brûlants.

robin li a déclaré que l'écart entre les grands modèles pourrait devenir de plus en plus grand à l'avenir. il a déclaré que le plafond des grands modèles est très élevé et que la situation est encore loin d'être idéale. par conséquent, le modèle doit continuer à itérer, à se mettre à jour et à se mettre à niveau rapidement ; il doit pouvoir investir en continu pendant plusieurs années ou plus ; dix ans pour répondre en permanence aux besoins des utilisateurs et réduire les coûts.

voici le contenu du discours interne

question : certaines personnes pensent qu'il n'y a pas de barrières entre les capacités des grands modèles ?

robin li :je ne suis pas d'accord avec cette affirmation. je pense que le monde extérieur a beaucoup de malentendus à propos des grands modèles. chaque fois qu'un nouveau modèle sort, ils veulent absolument dire à quel point il est bon et le suivre à chaque fois.à titre de comparaison avec gpt-4o, je prends des ensembles de tests ou fais des listes et dis que mon score est presque le même que celui-ci, voire le dépasse dans certains éléments individuels, mais cela ne prouve pas que ces modèles nouvellement publiés sont les plus avancés. avec openal par rapport au modèle, il n'y a pas un si grand écart.

l'écart entre les modèles est multidimensionnel. une dimension est la capacité, qu'il s'agisse de l'écart dans les capacités de base telles que la capacité de compréhension, la capacité de génération, la capacité de raisonnement logique ou la capacité de mémoire ;，si vous souhaitez avoir cette capacité ou répondre à ces questions, combien cela vous coûtera-t-il ? certains modèles peuvent avoir des vitesses d'inférence très lentes. bien qu'ils obtiennent le même effet, leur expérience n'est en réalité pas aussi bonne que celle des modèles les plus avancés. et pour l'ensemble de testsur-ajustement, chaque modèle qui veut prouver ses capacités ira au classement. lors du classement, il doit deviner ce que les autres testent, quelles questions je peux utiliser et quelles techniques je peux réussir, donc à partir du classement. ou des ensembles de tests à première vue, vous pensez que les capacités sont très proches, mais dans l'application réelle, il existe encore un écart évident.

une partie du battage médiatique auto-médiatique, associée à la motivation pour la publicité lors de la sortie de chaque nouveau modèle, donne à tout le monde l'impression que la différence de capacités entre les modèles est relativement faible. en fait, ce n'est pas le cas. dans le processus d'utilisation réel, je n'autorise pas notre personnel technique à établir des classements. ce qui mesure réellement les capacités du grand modèle wenxin, c'est de savoir si vous pouvez répondre aux besoins des utilisateurs dans des scénarios d'application spécifiques et si vous pouvez générer des gains de valeur. ce qui nous tient vraiment à cœur.

nous devons voir que, d'une part, il existe un écart relativement évident entre les capacités des modèles et, d'autre part, le plafond est très élevé. ce que vous faites aujourd'hui est encore loin de ce que vous voulez réellement faire et du niveau souhaité. état idéal, donc le modèle il doit également être itéré, mis à jour et mis à niveau continuellement et rapidement.même si vous voyez que l’écart n’est pas si grand aujourd’hui, verrez-vous si l’écart s’est creusé dans une autre année ? qui peut continuer à investir dans ce sens pendant plusieurs années, voire plus de dix ans, pour qu'il puisse répondre toujours plus aux besoins des utilisateurs, répondre aux scénarios, et répondre aux besoins d'amélioration de l'efficacité ou de réduction des coûts ?l’écart entre les différents modèles ne se réduit pas de plus en plus, mais va s’élargir de plus en plus. cependant, lorsqu’ils ne connaissent pas les besoins réels, ils peuvent penser qu’il suffit presque de répondre aux questions du test.

soi-disant leaderdouze ou 18 mois de retard, je ne pense pas que cela importe tellement. chacune de nos entreprises évolue dans un environnement de marché totalement concurrentiel. quelle que soit la direction que vous prenez, il y aura de nombreux concurrents. si vous pouvez toujours vous assurer d'avoir 12 à 18 mois d'avance sur vos concurrents, vous serez invincible. pensez que 12 à 18 personnes sont devant vous. un mois, c'est très court,même si vous pouvez garantir que vous serez toujours en avance sur vos concurrents6 mois, puis gagne, votre part de marché pourrait être70 %, alors que l’adversaire ne peut détenir qu’une part de 20 %, voire 10 %.

q : certaines personnes disent que le modèle open source comble l’écart avec le modèle fermé. cela détruira-t-il le modèle économique des grandes entreprises du modèle fermé ?

robin li :cette question est fortement liée à la question précédente. je viens de dire qu'en plus des capacités ou des effets, un modèle doit également être efficace. en termes d'efficacité, les modèles open source ne sont pas bons. pour être précis, le modèle fermé devrait être appelé un modèle commercial. un modèle commercial est un modèle dans lequel d'innombrables utilisateurs ou clients partagent les mêmes ressources et partagent les coûts de r&d, les ressources machines et les ressources de raisonnement.gpu, et le modèle open source vous oblige à déployer un ensemble de choses vous-même. quel est le taux d'utilisation du gpu après le déploiement ? notrewenxin grand modèle3.5、4peu importe .0, le taux d'utilisation est supérieur à 90 %. combien de personnes utilisent un modèle open source que vous déployez ? nous disons au public que le modèle wenxin est appelé plus de 600 millions de fois par jour et que le nombre de jetons générés chaque jour dépasse les mille milliards. quel modèle open source peut indiquer combien d'appels il effectue par jour et combien de jetons il génère ? comment le coût sera-t-il partagé si personne ne l’utilise ? comment comparer le coût de l’inférence avec celui des modèles commerciaux ?

avant l’ère du grand modèle, tout le monde était habitué à l’open source, c’est-à-dire gratuit et peu coûteux. a cette époque, pour les produits commerciaux sur le marché, il fallait payer pour chaque version, comme l'achat d'une installation informatiquewindows, microsoft devra peut-être facturer beaucoup d'argent, mais vous n'êtes pas obligé de dépenser cet argent si vous utilisez linux. puisque linux est open source, tous les programmeurs peuvent voir le code. si quelque chose n'est pas bien fait, je peux le mettre à jour. après la mise à jour, je peux m'enregistrer. tout le monde ajoute de l'huile sur les flammes et vous pouvez continuer à progresser sur les épaules. de géants. mais ces choses ne sont pas vraies à l’ère des grands modèles. à l’ère des grands modèles, les gens parlent souvent du prix élevé des gpu, et la puissance de calcul est un facteur clé qui détermine le succès ou l’échec des grands modèles.le modèle open source vous offre-t-il de la puissance de calcul ? s’il ne vous donne pas de puissance de calcul, comment pouvez-vous l’utiliser efficacement ? le modèle open source ne peut pas résoudre ce problème.

dans le passé, vous aviez déjà payé pour la puissance de calcul lorsque vous achetiez un ordinateur, mais ce n'est pas le cas pour l'inférence sur grands modèles. cette inférence est en réalité très coûteuse. par conséquent, la valeur des grands modèles open source réside dans les domaines de l'enseignement et de la recherche. si vous voulez comprendre le fonctionnement des grands modèles, si vous ne connaissez pas le code source, il y aura certainement un inconvénient. dans ce domaine, lorsque vous recherchez l'efficacité, lorsque vous recherchez le coût le plus bas, le modèle open source n'a aucun avantage.

demander:comment les applications d’ia vont-elles évoluer ? pourquoi mettre l’accent sur le renseignement ?

robin li: le processus de développement de grands modèles doit passer par ces étapes. au début, les gens sont aidés, et finalement, quand quelque chose sort, les gens doivent passer le contrôle final. nous sommes sûrs que son effet est là.ok, il ne sera diffusé que s'il est bon à tous égards. c'est l'étape du copilote ; plus loin se trouve l'intelligence de l'agent. le monde extérieur a différentes définitions de l'agent. la chose la plus importante est qu'il a un certain degré. d'autonomie. , avec la capacité d'utiliser des outils de manière indépendante, de réfléchir, d'évoluer, etc.; si ce degré d'automatisation va plus loin, il deviendra ce qu'on appelle un al worker, capable d'effectuer une variété de travaux mentaux et physiques comme un être humain, et tous les aspects du travail peuvent être réalisés de manière indépendante. il doit y avoir un tel processus.

l'opinion selon laquelle « les agents intelligents constituent la direction de développement la plus importante des grands modèles » n'est en réalité pas consensuelle. lors de la conférence baidu create, nous avons lancé trois produits, agentbuilder, appbuilder et modelbuilder et appbuilder, qui concernent tous deux les agents. l'un a un seuil plus bas et l'autre a des fonctions plus puissantes. après que nous l'ayons expliqué, certaines personnes ont finalement commencé à comprendre que cette chose est effectivement intéressante, peut produire de la valeur et peut être réalisée avec un seuil relativement bas que tout le monde juge utilisable. depuis lors, la popularité des agents intelligents a progressivement augmenté et de nombreuses personnes ont commencé à être optimistes quant à l'orientation du développement des agents intelligents.mais à l'heure actuelle, l'intelligence ne fait pas consensus. peu d'entreprises comme baidu considèrent l'intelligence comme la stratégie la plus importante et l'orientation de développement la plus importante des grands modèles.

pourquoi accordons-nous autant d’importance aux agents ? parce que le seuil pour les agents intelligents est en effet très bas. l'année dernière, nous avons dit que nous devrions déployer des applications et que tout le monde devrait créer des applications. en fait, beaucoup de gens disent encore qu'ils ne savent pas comment le faire. si cette direction est réalisable.quelles capacités dois-je utiliser ?il existe d'innombrables incertitudes quant à la capacité de générer de la valeur dans ce scénario, et tout le monde ne sait pas comment passer du modèle à l'application.mais l'agent fournit un moyen très direct, très efficace et très simple. il est très pratique de construire un agent au-dessus du modèle., c'est pourquoi des dizaines de milliers de nouveaux agents sont créés chaque semaine sur la plateforme wenxin.

en termes d'agents, nous avons déjà vu la tendance et disposons de conditions préalables relativement bonnes. en plus des fortes capacités du modèle lui-même, nous disposons également de bons canaux de distribution. celui de baiduapp, en particulier la recherche baidu, ades milliards de personneslors de l'utilisation, les utilisateurs nous expriment activement leurs besoins, quel agent intelligent peut mieux répondre à ses questions et répondre à ses besoins. il s'agit d'un processus de correspondance naturel, nous sommes donc les mieux à même d'aider ces développeurs à les diffuser.

rapport/commentaires

nouvelles

le discours interne de robin li exposé : en discutant de trois malentendus cognitifs majeurs concernant les grands modèles, l'écart entre les modèles deviendra plus large à l'avenir

introduction

mes coordonnées