Lorsque les grands modèles pénètrent dans l'industrie, les scénarios sont la clé de la mise en œuvre

Lorsque les grands modèles pénètrent dans l'industrie, les scénarios sont la clé de la mise en œuvre | ToB Industry Observation

2024-08-02

"En tant que technologie, les grands modèles doivent être véritablement utilisés par l'industrie et résoudre les problèmes pratiques de l'industrie avant de pouvoir exercer leur véritable valeur." Edge and Channel Data Center Division, s'est entretenu avec Cela a été souligné à plusieurs reprises dans la communication avec TMTpost Media APP.

Cela fait presque 2 ans que ChatGPT est sorti. En moins de 2 ans, les grands modèles d'IA pénètrent dans tous les domaines à une vitesse sans précédent. D'autant plus que cette année, les grands fabricants de modèles et les entreprises du groupe A ont déplacé leur attention de la taille des paramètres du modèle vers la manière dont les grands modèles résolvent les problèmes de l'industrie, en essayant de trouver un ou plusieurs grands modèles capables de résoudre leurs propres scénarios de mise en œuvre dans l'industrie. .

Du généraliste à l’industriel, les scénarios sont la clé de la mise en œuvre de grands modèles

Si la concurrence des grands modèles des grands constructeurs est divisée en deux moitiés, dans la première moitié, les grands constructeurs lancent les grands modèles généralistes l'un après l'autre et démontrent leur force en améliorant continuellement les paramètres des modèles dans la seconde moitié, quand l'IA est grande ; les modèles sont acceptés par davantage d'industries. Lorsque les entreprises secondaires y prêtent attention, de plus en plus de modèles à petits paramètres émergent et les scénarios d'application industrielle sont naturellement devenus le centre d'intérêt des entreprises de la partie A et des grands fournisseurs de modèles de la partie B. La mise en œuvre d'applications finales est devenue. la question est de savoir si de grands modèles peuvent réellement être réalisés à ce stade. La clé de la « monétisation » du côté de l’industrie.

À cet égard, Guo Wei a déclaré à TMTpost Media APP qu'Intel estime qu'à mesure que la technologie des grands modèles d'IA pénètre progressivement dans l'industrie, les modèles passeront progressivement des grands modèles généraux aux grands modèles spécifiques à l'industrie. Le modèle va certainement changer. « Dans le même temps, le modèle industriel combinera des connaissances plus spécifiques à l'industrie et se concentrera sur un ou plusieurs scénarios spécifiques.

Par coïncidence, Cao Peng, président du comité technique du groupe JD et président de la division JD Cloud, a également déclaré publiquement lors du JD Cloud Summit récemment que « les grands modèles généraux s'appuient sur la puissance de calcul pour se développer, tandis que les grands modèles industriels s'appuient sur les affaires ». sont déjà plus de 35. JD.com dispose de son propre personnel de livraison, de plus de 200 000 commerçants, de plus de 30 000 médecins, de plus de 20 000 opérations d'approvisionnement et de vente et de plus de 10 000 personnels de R&D. Il utilise de grandes applications basées sur des modèles dans plus de 100. Scénarios d'IA sur JD.com.

Le « Livre blanc sur l'économie numérique mondiale 2024 » montre que le nombre de grands modèles d'intelligence artificielle dans le monde a atteint 1 328, dont 36 % en Chine. D'un autre côté, les données d'IDC montrent que l'IA générative en Chine représentera 4,6 % de l'investissement total sur le marché de l'IA en 2022. Avec le développement rapide de la technologie de l'IA générative, la proportion des investissements dans l'IA générative atteindra 33,0 % en 2027, l'échelle d'investissement dépassera 13 milliards de dollars américains et le taux de croissance composé (TCAC) sur cinq ans sera de 86,2 %.

De toute évidence, le grand modèle ressemble à l'ère précédente du cloud computing. En termes de technologie uniquement, la Chine est peut-être encore légèrement en retard sur le premier niveau mondial, mais lorsque nous nous concentrons sur les scénarios, la Chine a de riches scénarios d'application, et ceux-ci scénarios C'est la clé pour véritablement « voler dans les maisons des gens ordinaires » avec de grands modèles d'IA.

Du cloud à la périphérie, comment mieux utiliser les grands modèles ?

À mesure que les grands modèles passent progressivement des grands paramètres des grands modèles généraux aux petits paramètres des modèles spécifiques à l'industrie, les grands modèles montrent également une tendance à passer du cloud au côté appareil. Les données d'IDC montrent que d'ici 2026, 80 % des entreprises mondiales utiliseront l'IA générative et que 50 % des déploiements Edge mondiaux incluront l'IA.

À cet égard, Sachin Katti, vice-président senior et directeur général de la division Network and Edge d'Intel, a déclaré un jour que l'avenir de l'intelligence artificielle reposera sur un écosystème ouvert et que l'application de l'intelligence artificielle passe des centres de données à l'informatique de pointe.

De plus, Chen Wei, vice-président d'Intel Corporation et directeur général de la division Réseau et périphérie Chine, a également déclaré à TMTpost Media APP qu'à en juger par les tendances de développement de cette année, les clients d'Intel exploreront seuls la mise en œuvre de modèles de périphérie à grande échelle cette année. "Cette année, c'est complètement différent. Cette année, on peut dire que plus de la moitié des clients explorent des solutions de mise en œuvre basées sur des modèles de grande taille, et il existe de nombreux cas pratiques." Wei a en outre souligné.

À mesure que les grands modèles évoluent vers la périphérie, les entreprises doivent prendre en compte de nombreux facteurs lors du déploiement, tels que les exigences de latence, l'aspect pratique, l'optimisation ajustable des microdonnées et les exigences en matière de sécurité des informations.

Cependant, le déploiement de modèles à grande échelle en périphérie en est encore aux premiers stades de développement, et il existe actuellement de nombreux modèles de déploiement visibles sur le marché « Grâce à l'observation d'Intel, nous constatons que de nombreux clients créent des solutions matérielles et logicielles basées sur ces modèles. modèles courants à grande échelle. L'optimisation des performances est un modèle qui se développe rapidement », a déclaré Chen Wei face à la question soulevée par Titanium Media APP sur la façon de mieux appliquer les grands modèles côté client.

En parlant des tendances et des perspectives de mise en œuvre des grands modèles chinois dans l'industrie, Guo Wei a déclaré à TMTpost Media APP que depuis cette année, de plus en plus d'utilisateurs de l'industrie ont mis en œuvre de nombreux grands modèles de l'industrie : « L'année dernière, il s'agissait probablement davantage de raconter des histoires. "Cette année, nous avons vu de plus en plus de cas de mise en œuvre dans l'industrie, et ce sont tous des scénarios qui peuvent résoudre efficacement les problèmes de l'industrie", a déclaré Guo Wei.

À en juger par les applications actuelles, les paramètres du modèle du côté final sont beaucoup plus petits que les paramètres des grands modèles généraux. Actuellement, les paramètres du modèle du côté final se situent pour la plupart entre 7B et 10B. À l'heure actuelle, la compression du modèle devient une tâche très difficile. . Quelque chose d’important et de difficile. Le modèle courant actuel consiste à injecter des connaissances spécifiques à l’industrie dans les données tout en les compressant, ce qui est communément appelé la solution technique d’élagage progressif.

À cet égard, le responsable technique concerné de JD Cloud a déclaré à Titanium Media APP qu'en prenant comme exemple le scénario du véhicule logistique sans pilote, grâce à la réduction de l'ampleur et à la recherche de réseaux neuronaux, il est possible de compresser environ deux fois le nombre de paramètres sans réduire le modèle lui-même, il peut également réduire la latence d’environ deux fois.

Dans le même temps, Guo Wei a partagé son analyse et son jugement sur les perspectives de développement de modèles industriels à grande échelle par la Chine avec Titanium Media APP. Il a souligné que la Chine pourrait se développer plus rapidement sous trois aspects.

Premièrement, le développement du modèle lui-même dans des applications industrielles. Comme mentionné précédemment, « en termes de technologie seule, la Chine est peut-être encore loin du premier niveau mondial, mais la Chine dispose de riches scénarios d'application. En termes de mise en œuvre industrielle, en particulier en combinaison avec les applications, selon Guo Wei, la Chine. Peut aller plus vite, "L'une des caractéristiques distinctives du marché chinois est le développement rapide des applications et la capacité d'explorer rapidement des moyens efficaces pour résoudre les problèmes de l'industrie."

Deuxièmement, la capacité de raisonnement du modèle est améliorée. Lorsque les grands modèles sont véritablement appliqués dans l'industrie, il ne suffit pas de s'appuyer uniquement sur la formation des modèles. Pour véritablement résoudre les problèmes de l'industrie, il est particulièrement important d'améliorer les capacités de raisonnement des modèles. Selon Guo Wei, les capacités de raisonnement des modèles seront également nécessaires. des améliorations significatives cette année.

Troisièmement, selon Guo Wei, lors de la mise en œuvre de grands modèles dans l'industrie, il est nécessaire de coordonner la répartition de la puissance de calcul entre le cloud, le côté appareil et la périphérie : « S'il ne s'agit que de quelques applications standard de grands modèles verticaux, les grands modèles peuvent être principalement déployés dans le cloud. Mais en raison de la nécessité d'une mise en œuvre industrielle, la puissance de calcul de l'IA sera inévitablement distribuée vers la périphérie et vers le terminal », a déclaré Guo Wei à TMTpost Media APP.

De nombreuses scènes ont été implémentées

Comme l'a dit Guo Wei, depuis cette année, de nombreux scénarios d'application de grands modèles industriels ont été déployés du côté des appareils.

En termes d'éducation, seewo a lancé conjointement une solution « IA + éducation » basée sur la technologie Intel. Avec l'aide des processeurs Intel® Core™ Ultra, seewo peut compléter le fonctionnement de grands modèles d'enseignement de l'IA localement sans recourir aux ressources du cloud computing. améliorant ainsi la vitesse de réponse et la stabilité du système et garantissant une expérience fluide pendant le processus d'enseignement.

Dans le secteur de la vente au détail, Tous Les Jours a créé des solutions de magasins intelligents grâce à la technologie Edge Computing. Cette solution peut utiliser l'équipement de collecte audio et vidéo existant dans le magasin et, grâce à la plate-forme de gestion d'intégration et d'optimisation des données, en fonction des besoins et des caractéristiques des différents magasins, créer pour eux un ensemble de modèles de magasins intelligents numériques exclusifs, fournissant une présentation des produits. et les services du magasin, l'hygiène du magasin, les normes des employés, les informations sur la foule et les flux de clients ont amélioré les capacités de gestion différenciées des opérations du magasin Tous Les Jours, amélioré l'efficacité de la gestion, réduit le coût des inspections manuelles des magasins et renforcé la mise en œuvre des normes des employés. . , accélérant le développement intelligent de l’industrie de la boulangerie.

En termes de santé médicale, JD Health a lancé le grand modèle médical « Jingyi Qianxun » basé sur le grand modèle JD Yanxi, qui intègre un grand nombre de directives de pratique clinique, de littérature médicale et de connaissances d'experts, et peut rapidement achever la migration de divers scénarios dans le domaine médical et de la santé et de l'apprentissage. Sur la base du modèle à grande échelle « Beijing Medical Qianxun », elle a lancé une série de solutions pour les médecins en exercice, notamment des cliniques cloud, un suivi post-diagnostic, une consultation conjointe d'experts, une recherche scientifique clinique, l'incubation de marques IP de médecins, « intelligent des outils « doctor assistant », etc. qui non seulement optimisent l’efficacité et la qualité du diagnostic et du traitement en ligne des médecins, mais améliorent également la sécurité du cabinet.

En termes de sécurité, de nombreux fournisseurs de sécurité, notamment 360, Qi'anxin, Tencent Cloud, Sangfor, etc., ont lancé des produits à grande échelle dans le secteur de la sécurité basés sur les capacités de grands modèles, ou ont intégré les capacités des grands modèles d'IA dans leurs versions originales. systèmes de sécurité. Parmi les produits, face aux défis de sécurité de plus en plus graves posés par l'IA à l'ère de l'IA, nous avons atteint l'objectif de « vaincre l'IA avec l'IA ».

En termes de travail de bureau, de nombreux fabricants ont proposé le concept d'AIPC et se concentrent sur les assistants bureautiques IA. Dans le scénario AI Chatbot, de grands modèles peuvent être rapidement déployés sur les PC Intel Core Ultra AI, et les utilisateurs peuvent utiliser en douceur les puissants. texte de grands modèles. Capacités de création, de programmation, de calcul mathématique et de raisonnement logique, et profitez d'une expérience interactive intelligente localisée pratique et sûre ;

En termes de traitement des documents, les utilisateurs peuvent utiliser AI PC pour traiter efficacement les e-mails, former des données, générer automatiquement des documents de travail et améliorer l'efficacité du travail. Ils peuvent également rédiger rapidement des documents contractuels et utiliser l'IA pour analyser intelligemment les cas de litige, fournissant ainsi une rédaction professionnelle de documents. capacités.

Ce qui précède ne représente que quelques scénarios dans lesquels les applications de grands modèles d’IA sont actuellement populaires. En outre, les grands modèles industriels sont également largement utilisés dans de nombreux domaines tels que la finance, la fabrication et l’exploration. L’ère où diverses industries exploitent les capacités des grands modèles d’IA pour responsabiliser les entreprises a commencé.

Les données restent un sujet incontournable

Comme nous le savons tous, les données sont le « nutriment » du développement rapide des grands modèles. Qu'il s'agisse d'un grand modèle général ou d'un grand modèle industriel, si vous souhaitez réaliser une valeur réelle et réduire les « illusions », les données sont un sujet qui doit être discuté.

En ce qui concerne l'industrie, les grands modèles industriels nécessitent une grande quantité de données spécifiques à l'industrie. Pour les entreprises qui souhaitent utiliser de grands modèles industriels pour réduire les coûts et augmenter l'efficacité, et passer de la numérisation à l'intelligence numérique, cette partie est très importante. importantes pour leurs données. Les capacités de gouvernance imposent des exigences plus élevées. Du point de vue actuel des applications industrielles, les données originales de l'entreprise ne suffisent pas pour former un modèle industriel complet au niveau de l'entreprise. La principale solution actuelle consiste à utiliser des données synthétiques. Ensuite, d'une part, les entreprises doivent améliorer la qualité de leurs propres données, d'autre part, la manière de sélectionner d'excellentes données synthétiques est également devenue une question épineuse à laquelle les entreprises doivent faire face.

D'un autre côté, la différence entre les grands modèles industriels et les grands modèles généraux réside dans le fait que la plupart des grands modèles industriels doivent être déployés côté appareil ou côté périphérie. Gartner prédit que d’ici 2025, plus de 50 % des données gérées par les entreprises seront créées et traitées en dehors du data center ou du cloud.

En d’autres termes, d’ici 2025, la quantité de données côté appareil dépassera 50 %. Dans ce processus, à mesure que la quantité de données en périphérie augmente, la bande passante de transmission des données constitue également un défi majeur auquel les entreprises doivent faire face. « Bien que la Chine soit le leader mondial dans la construction de bande passante de transmission pour l'ensemble de l'infrastructure, Un grand nombre de données sont générées à la périphérie, cela peut encore provoquer des tempêtes sur le réseau, et nous devons encore optimiser davantage les stratégies de gestion du réseau et de transmission de données », a déclaré Guo Wei à Titanium Media APP.

En regardant vers l'avenir, Sachin Katti a déclaré à TMTpost Media APP que si l'IA conduit les données à améliorer la qualité, ces données aideront à leur tour l'IA à s'améliorer, créant ainsi un cercle vertueux.

De toute évidence, les grands modèles sont entrés dans une période de développement rapide dans l'industrie.Au cours de ce processus, les entreprises doivent suivre le principe « basé sur les données, le scénario est roi » afin de permettre une meilleure mise en œuvre des grands modèles dans l'industrie.(Cet article a été publié pour la première fois sur Titanium Media APP, auteur | Zhang Shenyu, éditeur | Gai Hongda)

nouvelles

Lorsque les grands modèles pénètrent dans l'industrie, les scénarios sont la clé de la mise en œuvre | ToB Industry Observation

Introduction

mes coordonnées