2024-08-16
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Texte | Wang Zhiyuan
Récemment, un ami m'a fait part de ses commentaires :KimiLa publicité est vraiment féroce.
Vous pouvez le voir en écoutant NetEase Music ou en parcourant bilibili. On dit que le produit est destiné aux utilisateurs ordinaires. Cela ne fait aucun doute. Cependant, nous ne sommes qu’à la mi-août et certaines des actions de Kimi font que les gens se sentent un peu différents.
Quelle est la différence ?
D’une part, le 2 août, la maison mère de Kimiface cachée de la lune(Moonshot AI) a annoncé la sortie officielle de l'API de niveau entreprise de Kimi. Ce modèle au niveau de l'entreprise offre une protection de sécurité des données plus forte et une vitesse de traitement plus rapide que la version utilisateur ordinaire, et peut aider les entreprises à gérer des tâches complexes et de grandes quantités de données.
Immédiatement après, ils ont annoncé qu'ils réduiraient le coût de la technologie de mise en cache contextuelle de la plate-forme ouverte Kimi de 10 yuans par million de jetons à 5 yuans par minute. J'ai appris que cette baisse de prix est en version bêta publique sur la plateforme ouverte depuis le 1er juillet.
Après avoir lu ceci, vous serez peut-être curieux de savoir ce qu'est exactement le cache ?
En termes simples, sa fonction est de stocker à l'avance du texte ou des données qui peuvent être utilisées de manière répétée et fréquemment interrogées, améliorant ainsi l'efficacité du raisonnement du modèle sans augmenter les coûts.
Par conséquent, ces actions me font me demander si l’IA a trouvé une voie efficace dans le domaine B2B ? Après une série de recherches, je pense : oui.
Parlons d’abord d’un consensus industriel :L’application de l’IA est sans aucun doute la clé du succès du modèle.
Cette année, lors de la Conférence mondiale sur l'intelligence artificielle, le PDG de Baidu, Robin Li, a présenté certains de ses points de vue sur l'application des grands modèles. Il a déclaré : Bien que le développement côté C soit important, les scénarios d'application côté B sont ceux où les grands modèles peuvent obtenir de meilleurs résultats.
Il estime qu'à l'ère de l'IA, les applications qui peuvent profondément affecter les industries et améliorer considérablement l'efficacité sont plus précieuses. Il prévoit que dans les domaines des soins médicaux, de la finance, de l'éducation, de la fabrication, des transports et de l'agriculture, des applications seront développées sur cette base. sur leurs caractéristiques respectives et leurs ressources de données. Les agents intelligents personnalisés atteindront des millions dans le futur, formant un immense écosystème.
Cette année, Baidu a remporté 17 projets dans divers domaines tels que les soins médicaux, la finance, l'énergie, la protection de l'environnement et les transports, couvrant de grandes entreprises publiques et des entreprises leaders du secteur, et les montants étaient également très considérables.
Robin Li estime évidemment que les applications d’IA doivent être rapidement mises en œuvre sur des agents intelligents.
Ne disons pas si cela relèvera des spécificités du corps intelligent. Il y a tellement de documents d'appel d'offres qui doivent être livrés un par un, si quelque chose n'est pas terminé dans un an et demi, le client ne sera certainement pas d'accord.
Voyons ce qu'en pense Yang Zhilin, le fondateur de Moonshot AI.
En juin, lors d'une conversation entre le fondateur de Geek Park, Zhang Peng, et Yang Zhilin, Yang a mentionné qu'ils n'avaient pas complètement exclu la face B, mais qu'ils se concentraient principalement sur la face C. Son produit Kimi a atteint un trafic et une utilisation record dans le domaine de l'IA.
Malgré cela, les utilisateurs rencontrent souvent des problèmes dus à une puissance de calcul insuffisante aux heures de pointe. Pour faire face à cette situation, ils ont pris plusieurs mesures pour réduire les coûts d'exploitation et accroître l'efficacité.
L'un d'eux consiste à optimiser les performances d'inférence du modèle grâce à la technologie de mise en cache. Cette technologie permet à Kimi de répondre plus rapidement lors du traitement de requêtes complexes et réduit le besoin de calculs répétés.
Cette amélioration améliore non seulement la vitesse de réponse et l'efficacité du traitement du système, mais garantit également la cohérence et l'exactitude de la génération de dialogues ou de textes ; cela semblera être un problème à l'avenir face à la possibilité de faire des affaires côté B et un grand nombre de traitements centralisés des demandes de données est particulièrement important.
Par conséquent, Yang Zhilin estime que si vous souhaitez passer du côté B, vous devez d'abord résoudre le problème de la puissance de calcul, et garantir la stabilité de la puissance de calcul est la base.
D'un autre côté, je pense que faire du business C-end n'est pas si sexy que ça. Cela utilise principalement la publicité pour obtenir des conversions, à long terme, ce n'est pas si accrocheur.
J'ai appris de nombreux praticiens de la publicité qu'à partir du premier semestre 2024, le coût de conversion par habitant continuera d'augmenter. Le coût de conversion de chaque utilisateur de Kimi PC atteindra essentiellement 40 yuans/personne. Je n'ai pas vérifié officiellement ces données.
Cependant, si l'on considère la tendance générale, le coût croissant de la concurrence sur le marché de l'IA dans les scénarios C-end poussera sans aucun doute de nombreuses entreprises d'IA à réévaluer leurs stratégies de marché.
Par conséquent, bien que le marché du côté C ait un grand potentiel, les scénarios d'application du côté B sont les domaines clés pour obtenir l'impact profond et les résultats efficaces des grands modèles. Après tout, ce n'est qu'en réalisant une réelle réduction des coûts et une amélioration de l'efficacité pour les entreprises. promouvoir le progrès de l'industrie et même de l'ensemble de l'industrie.
Puisque le consensus est correct. Alors, comment les agents, l’IA ou les grands (petits) modèles peuvent-ils entrer efficacement dans le domaine B2B ?La première façon est d’être en amont du côté B.
Qu'est-ce que ça veut dire?
Le côté B en amont est la source de la chaîne d’approvisionnement. Par exemple : supposons qu'il existe une entreprise pharmaceutique qui a des besoins et des scénarios d'application pour l'utilisation de l'IA, mais qu'il est difficile de pénétrer dans une grande entreprise modèle. Que dois-je faire ?
À l'heure actuelle, vous constatez que l'entreprise pharmaceutique utilise une sorte de logiciel SaaS. La grande entreprise modèle d'IA peut envisager de coopérer avec le fournisseur de logiciels, de cette manière, l'IA peut être ajoutée aux produits logiciels existants, et l'entreprise pharmaceutique peut le faire. utilisez le logiciel en même temps, passez en douceur à l’utilisation de l’IA.
C’est la façon de penser de nombreux hommes d’affaires traditionnels de la face B.
En fait, les logiciels B2B disposent de plusieurs formes de déploiement. Premièrement, le déploiement localisé, où le logiciel est installé sur le propre serveur ou appareil du client, donnant ainsi au client le contrôle des données et de la sécurité.
Cette méthode nécessite des mises à niveau régulières, ce qui est fastidieux et coûteux à maintenir. Par exemple, dans le passé, de grands constructeurs tels que Mercedes-Benz et BMW utilisaient des systèmes CRM traditionnels pour un déploiement local afin de gérer les agents.
Cependant, le déploiement localisé est confronté à de nombreux défis lors de la mise en œuvre de l'intégration de l'IA, en particulier des modèles pré-entraînés ; une fois ces modèles installés, ils peuvent répondre aux demandes des clients même lorsqu'ils ne sont pas connectés à Internet.
Même si de nombreuses entreprises ToB souhaitent tenter leur chance, la complexité des opérations réelles est très élevée. Par exemple, les groupes pharmaceutiques ou les hôpitaux ont d’énormes besoins en matière de gestion de données. Une fois que le logiciel doit être mis à jour pour intégrer de nouvelles fonctions d’IA, l’ensemble du processus sera extrêmement compliqué.
De plus, les porteurs de projet doivent expliquer à leurs patrons pourquoi ils doivent dépenser beaucoup d’argent pour introduire des fonctions d’IA.
Par exemple:
Dépensez 20 millions pour construire un modèle. Cela semble génial, nous avons des capacités d'IA, mais la situation réelle peut faire croire aux gens qu'il ne s'agit que d'un système de questions et réponses sur les connaissances de l'IA. Vu sous cet angle, on a toujours l’impression que ce n’est pas une bonne affaire.
Un autre point est que, même si une entreprise introduit un modèle, que se passera-t-il si les salariés ne peuvent plus l’utiliser ? Alors cet argent ne serait-il pas gaspillé ?Aucun calcul n’est approprié pour cela. Bien entendu, certaines entreprises ne disposent même pas de base de connaissances et il n’est pas nécessaire d’introduire des capacités d’IA.
Le modèle SaaS, comme autre forme, permet aux utilisateurs de payer des frais via des abonnements, tels que des outils de collaboration tels que Feishu. Dans le cadre de ce modèle, les entreprises SaaS peuvent intégrer directement les fonctions d'IA et ont même la possibilité de contourner les petites entreprises modèles et d'acheter des services directement auprès des grandes entreprises modèles pour transformer les processus.
Parmi toutes ces formes, le modèle SaaS est le plus simple à intégrer les fonctions d'IA, car les fournisseurs de services peuvent mettre à jour et maintenir les fonctions d'IA de manière uniforme sur le back-end, et les clients n'ont pas à se soucier des détails techniques.
Par conséquent, d’un point de vue descendant, les entreprises qui fournissent des solutions d’IA peuvent remporter certaines commandes, mais le processus permettant de véritablement assurer le succès des clients peut s’avérer assez difficile, et les efforts et les gains ne sont souvent pas proportionnels.
Alors, existe-t-il une nouvelle solution ? avoir. Regardons cela de bas en haut.
Nous devons établir une nouvelle compréhension :
L'utilisation de l'IA dans l'entreprise a en fait trouvé une avancée majeure. Elle nous aide principalement à améliorer l'efficacité des choses. L'IA est généralement utilisée pour améliorer les processus de travail existants plutôt que de les redémarrer complètement.
Qu’est-ce qu’un bon départ ?
Autrement dit, repenser complètement le processus de quelque chose à partir de zéro, sans s'appuyer sur des structures et des plans existants ; dans le contexte du flux de travail ou de la gestion de projet, cela signifie abandonner les anciennes méthodes et systèmes et adopter des méthodes complètement nouvelles pour résoudre le problème ou exécuter. une tâche.
Par exemple, une entreprise utilisait à l’origine un système de gestion de la relation client (CRM) très traditionnel. Au fil du temps et de la croissance de l'entreprise, ce système ne parvenait plus à répondre aux besoins de l'entreprise.
L'entreprise a décidé de ne pas modifier ou mettre à niveau l'ancien système, mais de développer un nouveau système CRM à partir de zéro. Ce nouveau système utilisera la dernière pile technologique, concevra des fonctions plus conformes aux processus commerciaux modernes et pourra mieux intégrer les dernières. Outils d'analyse de données.
Ceci est un exemple de « départ propre ». Mais tu sais quoi ?L’IA bouleverse le processus de réingénierie des processus. La plupart du temps, l’IA gère des tâches avec lesquelles les humains sont déjà familiers et il n’est pas nécessaire de réinventer la roue.
Qu'est-ce que ça veut dire?
Lorsqu'une entreprise commence à utiliser des modèles d'IA, ces modèles doivent être étroitement intégrés au flux de travail de l'entreprise. Par exemple, certaines entreprises souhaitent utiliser des grands modèles avancés dans le domaine médical ou éducatif, mais ce processus peut rencontrer de nombreuses difficultés.
Étant donné que les activités et les processus de chaque entreprise sont uniques, tout comme les données requises par l'IA, un grand modèle général peut ne pas convenir. Il est souvent difficile d'appliquer véritablement ces concepts généraux dans une entreprise.
ce qu'il faut faire?A cette époque, il serait plus facile d'avoir un petit modèle et un assistant.
Par exemple:
Les comptables des petites et moyennes entreprises utilisent généralement des logiciels tels que Kingdee, UFIDA et Chanjet. Il y a déjà beaucoup de données stockées dans ces logiciels ; pour les opérateurs, ils souhaitent simplement utiliser la puissance de l’IA pour trouver rapidement une donnée ou tirer une conclusion, sans avoir à apporter de modifications majeures au logiciel d’origine.
Par conséquent, un bon moyen d’appliquer l’IA aux scénarios d’entreprise (ToB) consiste à décomposer les processus métier complexes en plusieurs petites tâches ou petites scènes spécifiques, puis à utiliser l’IA pour aider à améliorer chaque petite scène.
Nous constatons également que des entreprises comme MicrosoftOpenAILes investisseurs, ainsi que Salesforce, leader du secteur du CRM, n'ont pas utilisé l'IA pour développer de nouveaux produits.
Bien qu'ils continuent d'étiqueter les produits avec de nouvelles fonctionnalités, ils utilisent en fait de grands modèles pour assister et améliorer les processus commerciaux ou les fonctions de produits existants.
En d’autres termes, ils transforment un petit modèle en un assistant, ou une amélioration, capable de mieux s’intégrer et d’optimiser les systèmes existants plutôt que de les remplacer complètement.
Cela ressemble un peu aux plug-ins que de nombreuses sociétés d’IA ont récemment réalisés côté PC. Il vous suffit de faire glisser doucement la souris ou d'appuyer sur une touche de raccourci, et l'IA apparaîtra pour vous aider. Leur fonction principale est de nous aider à prendre de meilleures décisions.
Si vous n’y croyez pas, vous pouvez aussi y réfléchir : qu’est-ce que les entreprises ToB ont vraiment besoin de l’IA ?
Selon les recherches de Zhiyuan, ils utilisent principalement les données pour aider à prendre des décisions en matière d’opérations, de gestion, de prise de décision et de marketing.Alors, pour les entreprises d’IA, comment peuvent-elles être à la fois pratiques et rentables ? La clé est de parvenir à une réplication rapide et de couvrir plusieurs scénarios à un coût très faible.
Comment copier ?
Une solution consiste à encapsuler l’IA dans un agent intelligent capable d’appeler des données locales.C'est pourquoi Kimi Chat réduira le coût de mise en cache du cache, car la sauvegarde du texte local fréquemment utilisé peut contribuer à améliorer la précision de l'assistant.
Mais une question se pose ici : comment le rendre à la fois précis, polyvalent et peu coûteux ?
À cet égard, nous pouvons définir la « haute précision » comme ceci :Tant que l'entreprise est utilisable et que la précision est suffisamment élevée, même si une erreur se produit occasionnellement, les utilisateurs peuvent l'identifier et expliquer pourquoi elle se produit.
« Low cost » signifie que le coût initial du projet doit être faible, qu'il peut être déployé sur une seule machine et qu'il doit être simple à utiliser et à maintenir.De nos jours, le coût matériel de nombreux grands modèles est très élevé. Si l'entreprise n'est pas sûre du montant qu'elle peut gagner, elle ne sera certainement pas disposée à investir trop.
L’avantage des grands modèles est qu’ils résolvent le problème de polyvalence des premiers algorithmes d’IA.
En théorie, un modèle peut gérer tous les scénarios ; en pratique, nous devons l’affiner. Par conséquent, nous définissons « haute polyvalence » comme étant capable de mettre en œuvre des outils et de l'automatisation, de sorte qu'ils puissent être répliqués à grande échelle et mis en œuvre à faible coût.
Un grand modèle à l'échelle de 100 millions a atteint une précision de plus de 95 %. Ensuite, nous avons dérivé un petit modèle de ce grand modèle et l'avons encapsulé dans un assistant, résolvant ainsi le problème de l'utilisation de l'entrée.
Imaginez qu'une grande entreprise modèle dispose d'une solution de grand modèle super puissante qui agit comme un modèle parent, répondant aux besoins généraux de l'ensemble de l'entreprise.
Ce grand modèle est particulièrement puissant et peut gérer des analyses de données complexes et donner des informations très précises. Il est particulièrement adapté aux entreprises côté B qui nécessitent de grandes quantités de ressources informatiques et un traitement de données à grande échelle. Mais en fait, toutes les entreprises de la face B n’ont pas besoin d’un système aussi énorme.
Pour un plus grand nombre de petites et moyennes entreprises, un modèle plus petit et plus ciblé suffira. Nous pouvons le considérer comme un « sous-modèle » d’un modèle plus vaste.
Ces petits modèles héritent des fonctionnalités de base des modèles plus grands, mais sont optimisés et réglés pour mieux répondre aux besoins spécifiques de l'entreprise et aux environnements d'exploitation à petite échelle.
Les petits modèles n'ont pas besoin d'autant de puissance de calcul que les grands modèles, mais se concentrent sur des tâches spécifiques et peuvent être ajustés en fonction de différents besoins, comme générer des rapports d'analyse intelligents ou effectuer une analyse intelligente.
Cela permet aux petites entreprises disposant de ressources limitées d’utiliser l’IA pour améliorer l’efficacité du travail et la qualité de la prise de décision.
Par conséquent, le petit modèle est comme l'essence extraite du grand modèle, il n'a besoin que des capacités de base de connaissances de base, la clé est d'en faire un petit assistant et de l'intégrer dans l'outil pour l'utiliser.
Ne pensez jamais que cela signifie que votre logique est correcte. D’après les recherches de Zhiyuan, les produits d’IA ont déjà été mis en œuvre dans les entreprises du côté B ; par conséquent, pour TOB, les scénarios d’application d’IA sont des agents et des plug-ins.
Cela présente également l’avantage d’être facile à réaliser sans avoir à investir des coûts élevés.
TOB AI ne suit pas l’ancienne voie.
Si les petits modèles sont le point clé du TOB, alors en faire des agents et des assistants intelligents est le maillon clé pour connecter le dernier kilomètre du TOB.Après tout, l’approche ascendante est centrée sur les personnes et les tâches, et non sur les logiciels.