2024-09-25
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
texte | zhao yanqiu et zhou xiangyue
editeur | niu hui
le modèle à grande échelle mis en œuvre par les entreprises publiques centrales entre dans une nouvelle étape. lors d'une conférence en septembre, un haut responsable de l'industrie a déclaré à digital intelligence frontier que la mise en œuvre de grands modèles n'est plus limitée à un certain secteur, mais s'est développée dans tous les domaines de la vie. a également fait un grand pas en avant.
selon les observations de l'industrie, certaines grandes entreprises publiques ont pris l'initiative d'achever la mise en œuvre pilote initiale de grands modèles et ont commencé à s'orienter progressivement vers des scénarios plus fondamentaux. "depuis mai de cette année, alors que la guerre des prix pour les grands modèles continue de fermenter, la mise en œuvre de grands modèles s'est encore accélérée. un certain nombre de scénarios ont commencé à être explorés et reproduits à grande échelle, et au niveau financier, le retour sur investissement a été amélioré. est devenu positif."xie guangjun, vice-président de baidu, a déclaré à digital intelligence frontline.
au cours du second semestre de cette année, la mise en œuvre de grands modèles progressera à nouveau.en seulement deux mois et demi, le nombre d'offres gagnantes liées aux modèles à grande échelle accessibles au public sur le marché a dépassé le nombre total d'offres gagnantes au cours des six premiers mois de l'année.. les projets gagnants en un seul mois ont également franchi des centaines d'étapes. les grands modèles accélèrent leur plein épanouissement dans tous les horizons. parmi eux, les secteurs de l’énergie, de la finance, de l’éducation, d’internet et d’autres secteurs sont particulièrement actifs.
sous la vague d’évolutions technologiques rapides, les échanges industriels s’accélèrent. ces derniers mois, diverses grandes et petites conférences sur l'ia ont vu le jour à divers endroits, et baidu organiserait la baidu cloud intelligence conference 2024 le 25 septembre. d’autres échanges et collisions technologiques sont à venir.
01
les entreprises publiques centrales ont fait un nouveau grand pas en avant
2024,china southern power grid a finalisé le recrutement et l'acquisition de plusieurs grands projets liés aux modèles, tels que "projet technologique clé du centre de formation de base en ia du système de distribution principal du réseau électrique du sud de la chine - recherche et application de la technologie de grand modèle nlp du système électrique", "recherche et développement 2024 du china southern grid research institute sur la formation à la sécurité et l'ensemble des fonctions d'inférence conception de grands modèles de l'industrie de l'énergie électrique, développement de composants, etc. les équipes concernées travaillent avec baidu intelligent cloud pour une innovation conjointe.
dans le secteur financier, une grande banque publique n'a lancé que l'année dernière un projet pilote à petite échelle avec des milliers de personnes dans les scénarios d'assistant de service client et d'assistant de comptoir. cette année, ces fonctions ont été officiellement lancées dans plusieurs grands centres de service client. à travers le pays et promus aux employés de première ligne à travers le pays. l'activité quotidienne des grands modèles atteint des dizaines de milliers.
dans le domaine automobile, une personne de l'institut de recherche geely a déclaré franchement lors d'une récente conférence : « maintenant que les constructeurs automobiles se lancent dans la vente de voitures, ils sont gênés de vendre leurs produits parce qu'ils n'ont pas de grands modèles sur leurs voitures. » les grands modèles déploient des cockpits intelligents et une conduite autonome, tout en renforçant le marketing numérique, les opérations des utilisateurs et d'autres scénarios. récemment, ils ont commencé à responsabiliser toutes les entreprises sous geely.
sur le marché des affaires gouvernementales, les gouvernements locaux ont élaboré des plans modèles à grande échelle basés sur les industries locales. "construisez d'abord le centre de calcul intelligent,de la fin de cette année au premier trimestre de l'année prochaine, le centre de calcul intelligent sera mis en œuvre à grande échelle, puis la combinaison de grands modèles et d'industries locales commencera.. " un responsable gouvernemental a parlé des progrès du marché. la science, l'éducation, la culture et la santé ont commencé à mettre en œuvre l'application. " certains hôpitaux tertiaires ont même investi des dizaines de millions dans des scénarios d'essai. « une source médicale a déclaré que les doyens se concentrent sur des scénarios tels que la génération de cas, la gestion des personnes, des biens et la recherche scientifique qui sont étroitement liés aux niveaux de service, de gestion et de recherche scientifique.
le port, canal majeur du commerce d'import et d'export, a également été exploré et aménagé. « nous avons constaté que de nombreux clients ont intégré de grands modèles dans leurs plans informatiques pour les trois prochaines années. » hu wei, directeur général de baidu intelligent cloud logistics and transportation solutions, a déclaré à digital intelligence frontline que, contrairement aux précédentes séries de changements technologiques, ce cycle est en cours. « il y a moins de gens qui attendent et regardent, mais plus de gens essaient. »
par exemple, le port du shandong, qui se classe au premier rang mondial en termes de débit de marchandises, a achevé l'exploration pilote de modèles à grande échelle de questions et réponses intelligentes et de questions et réponses intelligentes, et ces deux fonctions ont été lancées pour tous les employés.
dans l'industrie chimique, sinochem information et baidu smart cloud travaillent ensemble pour explorer l'utilisation de grands modèles pour la recherche et le développement de nouveaux matériaux. l'assistant de connaissances « hua xiaoyi » peut poser des questions en langage naturel et récupérer des connaissances professionnelles telles que celles-ci et y répondre. que les caractéristiques moléculaires et les voies de synthèse moléculaire. actuellement, l’efficacité de la recherche de molécules spécifiques a été multipliée par plus de 5 et l’efficacité des travaux de recherche et développement a été considérablement améliorée.
cet enthousiasme se reflète également dans le marché des enchères. les données publiques montrent quede janvier à août de cette année, le nombre de projets modèles nationaux gagnants à grande échelle a atteint cinq fois le nombre de toute l'année 2023, et le montant des projets gagnants a doublé par rapport à l'année dernière.. parmi eux, les fabricants de modèles à grosse tête dominent toujours dans la prise de commandes. baidu se classe premier pour quatre indicateurs clés : le nombre de projets modèles à grande échelle gagnants, le nombre d'offres gagnantes, les secteurs couverts et le nombre d'entreprises publiques centrales couvertes.
cependant, selon les statistiques incomplètes de data intelligence frontline,du 1er juillet au 15 septembre, en seulement deux mois et demi, le nombre total d'offres gagnantes liées aux grands modèles était d'au moins 286., rattrapant avec succès le nombre total de projets au cours des six premiers mois de l'année.
parmi les acheteurs, ce sont les opérateurs, l'énergie, l'éducation, les affaires gouvernementales, la finance, etc. qui passent toujours le plus grand nombre de commandes. un signe clair est que certaines entreprises ont présenté des demandes de plus en plus segmentées, et les achats tels que la collecte et la gouvernance des données, la sécurité des grands modèles et la culture des talents ont tous augmenté de manière significative.
par exemple, china southern power grid a finalisé l'appel d'offres pour au moins 15 grands projets liés au modèle en deux mois et demi, de juillet à la mi-septembre. state grid a également finalisé l'appel d'offres pour plusieurs grands projets liés au modèle au troisième trimestre.
li chao, directeur général de baidu intelligent cloud energy power industry, a déclaré à digital intelligence frontline que dès septembre de l'année dernière, china southern power grid avait publié un modèle à grande échelle indépendant et contrôlable - « big watt ». parmi eux, la plate-forme à grand modèle baidu intelligent cloud qianfan fournit un support technique pour les scénarios de répartition de l'énergie. au troisième trimestre de cette année, china southern network a finalisé la sélection de grands modèles linguistiques pour le département commercial principal de china southern network, et baidu a été sélectionné avec succès en tant que fournisseur de services techniques.
02
les grandes entreprises mettent l’accent sur « suivre le courant »
presque toutes les entreprises qui ont été les premières à franchir le pas vers les grands modèles lors de ce cycle avaient une expérience dans les petits modèles. par exemple, icbc a mis en place un projet vers 2021 et souhaite utiliser un « modèle plus large » pour créer des applications métier telles que l'ocr. "après l'arrivée de chatgpt, ils ont profité de la situation et ont mis en place un grand projet modèle", a déclaré un financier à digital intelligence frontline.
le marché de la sécurité de la production est soumis à une supervision politique et constitue presque un résultat net pour les entreprises publiques centrales. auparavant, longyuan electric power, la plus grande société d'énergie éolienne secondaire du national energy group, avait adopté une solution de sécurité traditionnelle de petit modèle pour gérer plus de 200 parcs éoliens et plus de 10 000 éoliennes, formant ainsi un site de production complet allant de la surveillance de la sécurité, à l'analyse, alarmes au traitement en boucle fermée. au deuxième trimestre de cette année, baidu a remporté l'appel d'offres pour une version améliorée du projet, qui combinera la généralisation du grand modèle de cv, une reconnaissance plus précise des fonctionnalités et la capacité du grand modèle de langage à rendre les informations précédemment collectées vraiment utile.
qu'est-ce que les petits modèles ne pouvaient pas faire auparavant, mais qu'est-ce que les grands modèles peuvent désormais apporter de la valeur ? hu wei a donné un exemple. la planification dans le port, la planification du personnel, les postes d'amarrage, les aires de stockage, etc. avaient tous été réalisés séparément à l'aide de petits modèles dans le passé, et les résultats étaient bons.en fait, il s’agit d’un problème d’algorithme mathématique, et le petit modèle est très approprié.. cependant, lorsque ceux-ci sont combinés pour une « planification intégrée », les petits modèles ne peuvent pas permettre une informatique collaborative à grande échelle et une planification coordonnée entre les ensembles de données et les appareils. "nous espérons notamment pouvoir résoudre de grands modèles. le défi est l'agrégation des données dans le port, qui prend du temps."
dans l'industrie industrielle, le taux de reconnaissance des petits modèles cv traditionnels est relativement faible lorsqu'on rencontre de petits échantillons. à l'aide de grands modèles cv, le taux de reconnaissance de petits échantillons de données peut être amélioré.
de nombreuses entreprises manquent également de plateformes de gestion des connaissances, de précipitation et d’application. désormais, avec l'aide de grands modèles et de récupération de connaissances, les entreprises peuvent créer des capacités de plate-forme de gestion des connaissances pour accomplir les tâches consistant à rendre explicites les connaissances tacites, à structurer les connaissances explicites, à corréler les connaissances structurelles et à fluidifier les connaissances associées.
de nombreuses entreprises organisent régulièrement des réunions de production et d’exploitation, et il est très difficile d’aligner les données. à l'aide de grands modèles linguistiques, nous pouvons résumer et extraire les résultats plus rapidement et avec plus de précision, ainsi que réaliser une analyse préliminaire, ce qui est d'une très grande valeur pour les utilisateurs.
03
pour entrer dans le cœur de métier, il faut trouver les « mains et les pieds »
li chao a observé qu'au cours des deux dernières années, l'application des grands modèles en était encore à ses balbutiements, concentrée dans des scénarios d'assistance tels que le bureau et le service client. cela est totalement incompatible avec les attentes de la direction des entreprises publiques centrales avec des investissements de dizaines de millions, de centaines de millions, voire de dizaines de milliards. désormais, les grands modèles doivent s’impliquer profondément dans le cœur de métier de l’entreprise.
« dans le secteur de l'énergie,nous investissons dans une seule direction : l'optimisation de la simulation. ", a déclaré li chao. dans l'industrie, il existe un grand nombre de tâches de travail liées aux mécanismes et aux calculs scientifiques, qui ne peuvent pas être effectuées par de grands modèles de langage ou de grands modèles de cv. " si ces problèmes ne sont pas résolus, l'avenir que nous imaginons sera être basé sur le big data. il est impossible de mettre en œuvre le modèle en tant que centre de capacités pour fournir un service d'agent complet. « li chao a déclaré qu 'à l' avenir, les grands modèles devraient être combinés avec de petits modèles dans les domaines professionnels pour pénétrer profondément dans les scénarios d 'activité de base des clients.
"au cours des dernières années, nous avons jeté certaines bases dans cette direction." li chao a déclaré que baidu fournit un moteur d'optimisation de simulation et travaille avec des partenaires industriels pour entrer dans des scénarios de répartition du réseau électrique, de raffinage du pétrole et de la pétrochimie et d'exploration pétrolière et gazière. explorer la répartition du réseau électrique et la stabilité du réseau électrique. des projets réels liés au modèle de mécanisme, tels que l'analyse de l'état, l'optimisation du fonctionnement des îlots d'énergie aérienne pétrolière et pétrochimique, la désulfuration et la dénitrification, etc., ont été mis en œuvre. en septembre de cette année, baidu a également participé à l'appel d'offres pour la répartition intelligente du réseau national de pipelines.
« ce sont des orientations de production fondamentales qui préoccupent beaucoup les clients.ces directions sont les « mains et les pieds » indispensables lors de l'utilisation future de grands modèles comme centre de planification pour créer des services d'agents intelligents dans leur ensemble.. li chao a déclaré qu'ils consacreraient des efforts particuliers à la planification de ces « mains et pieds ». le grand modèle est le cerveau. ce n'est qu'avec ces « mains et pieds (api professionnelle) » que les services de scène de base pourront être véritablement réalisés.
"au port, nous utilisons d'abord des questions et des réponses pour permettre aux clients de voir que le grand modèle d'origine est fiable, puis nous l'intégrons progressivement au système commercial de base. hu wei a déclaré : " chez shandong port group, nous planifions déjà la phase suivante. . , approfondira davantage les scénarios commerciaux.le port est une plaque tournante de transport complexe. le cœur de son activité est l'expédition de marchandises, de personnes, de camions, de portiques, etc.. auparavant, le système tos (terminal operating system) introduit par le port intégrait progressivement des algorithmes d'ia. les grands modèles peuvent résoudre davantage le problème d’un accès accru aux métadonnées.
à mesure que les grands modèles évoluent vers des systèmes de base de production,l'une des principales capacités de la compétition mondiale des grands modèles est le raisonnement logique.. « lors des tests effectués sur les sites des clients, nous avons constaté que le raisonnement logique des problèmes complexes entre les différents grands modèles est très différent. de plus, les ressources vidéo générées par un grand nombre de caméras déployées dans le port n'étaient pas réellement utilisées. » une direction consiste désormais à utiliser ces ressources matérielles et images originales,utiliser de grands modèles multimodaux pour l'intégration afin d'obtenir une meilleure collaboration mondiale. "c'est une direction que nous explorons."
04
74 % des charges de travail d'ia sont dans le cloud
la mise en œuvre de grands modèles est une ingénierie de système complexe, à mesure que les entreprises entrent dans la zone des eaux profondes, certaines portes et voies de mise en œuvre s'accélèrent.
"lorsque nous nous connectons avec les clients, la première chose que nous faisons est de les aider à comprendre les limites du grand modèle." qui sont trop loin des attentes des clients, ils ont désormais pratiquement tous les projets,tous passeront par un processus complet de « consultation légère + mise en œuvre ».
sur la construction d’une puissance de calcul intelligente, montrent les données idc,74 % des charges de travail d'ia sont dans le cloud. mais le paradigme technologique actuel de l’informatique intelligente a changé. à l'ère du cloud cpu, tout le monde se préoccupe avant tout de la flexibilité et de la rentabilité ultime, tandis que le cloud gpu consiste à savoir s'il peut utiliser la puissance de calcul d'un grand cluster. de tels clusters sont non seulement coûteux, mais présentent également certains seuils techniques. les fournisseurs de cloud restent donc un acteur majeur.
outre la puissance de calcul, l’importance des données continue d’émerger. selon les statistiques incomplètes de data intelligence frontier, au troisième trimestre 2024, l'achat, la collecte, la gestion et autres achats de données augmentent considérablement.
au niveau des données, par exemple, les données des clients du port sont stockées sur les serveurs de chaque société de terminaux. huawei recommande aux clients de constituer une équipe de données dédiée.
lorsqu’il s’agit de données, des problèmes plus profonds se posent. "de nos jours, lorsque l'industrie parle de grands modèles, il est nécessaire de parler de données, mais franchement, beaucoup d'entre elles ne sont que des paroles vides de sens."un initié de l'industrie a dit franchement.
"l'ère des grands modèles,comment préparer les données, comment les gérer et comment appliquer différentes données aux différentes étapes de la formation de grands modèles ? la plupart des gens essaient encore de comprendre aveuglément l'éléphant ?. "li chao a déclaré que baidu avait également rencontré de nombreux pièges dans ce processus.
par exemple, lors de la formation d'un modèle industriel basé sur un modèle général, il existe un guide technique expliquant comment les données doivent être mises en correspondance. si vous nourrissez trop peu un grand modèle, l'effet ne sera pas évident ; si vous le nourrissez trop, le modèle ne convergera pas facilement, et cela peut même entraîner une baisse des capacités générales du modèle... ces écueils ont été résolus plus tard, formant un ensemble d'outils et la méthodologie est exportée vers le monde extérieur via la plateforme qianfan et une équipe de service technique dédiée.
il est également facile de constater des écarts entre la technologie des grands modèles et les applications., de nombreuses "unités d'utilisateurs ne comprennent pas l'ia, et les unités d'ia ne comprennent pas l'industrie". li chao a déclaré que afin de combler l'écart, en plus de doter les architectes de solutions d'une expérience industrielle, ils se concentreront également sur la sélection des partenaires. "nous ne choisissons essentiellement que deux types de partenaires dans le secteur de l'énergie, l'un est l'unité industrielle du client et l'autre est la société qui fournit des services d'externalisation humaine dans l'entreprise industrielle du client, a déclaré à digital intelligence frontline que leurs caractéristiques communes sont." qu'ils étaient tous deux profondément impliqués et comprenaient l'activité du client, ainsi que le secteur informatique.
de plus, lors de la mise en œuvre de grands modèles dans des scènes spécifiques,de nombreux travaux d'ingénierie restent à réaliser. par exemple, les grands modèles sont habitués à produire des réponses sous la forme de « score total et total », et les réponses sont différentes à chaque fois. cependant, certains clients sont plus habitués à la méthode « premier score puis total », et espèrent que cela sera le cas. la réponse peut être "reproduite". "même des changements mineurs dans l'ordre des mots et la grammaire sont inacceptables pour certains dirigeants portuaires", a déclaré hu wei. cela les oblige à effectuer de nombreux travaux d'ingénierie pour garantir que le résultat du grand modèle réponde aux attentes des clients.
d 'après la situation globale de la mise en œuvre de l' entreprise, la dimension de la demande des clients est de 360 degrés. il est intéressant de noter que toutes les entreprises cloud passent actuellement de partenaires cloud à des partenaires stratégiques de transformation de l'ia, et mettent à niveau leurs capacités techniques globales autour de l'infrastructure d'ia, des modèles d'algorithmes, des données, de l'optimisation du déploiement et de la personnalisation.
05
facteur humain
un cio d'une entreprise technologique a rencontré beaucoup de résistance dans la construction et la promotion de l'application de grands modèles : les employés et les départements de première ligne n'ont pas coopéré, même si le leader le disait, cela ne servait à rien.après que l'entreprise a installé l'assistant de code, l'efficacité globale a augmenté de 1/3. "bien que l'on parle rarement de réduction des effectifs, cela signifie que les personnes qui écrivent du code seront transférées vers le front-end ou le back-end du développement. les employés de première ligne craignent d'être licenciés, et certains départements commerciaux ont des territoires." sensibilisation. ce sont de vrais problèmes.
dans de nombreuses grandes entreprises des secteurs traditionnels,la plus grande résistance vient de l’inertie du travail. de nombreux employés de première ligne sont de vieux maîtres. désormais, s'ils ont la possibilité de faire appel à des assistants de maintenance des équipements, ils diront : « si quelque chose arrive, autant l'essayer moi-même, ou je peux appeler lao zhang et les trois. d'entre nous travaillerons ensemble pour le reste de notre vie. »
“le grand modèle est un projet phare. " un spécialiste du secteur financier a observé qu'il faut promouvoir la promotion de haut en bas. les hauts dirigeants soutiennent publiquement les projets de référence. " parfois, ne pas s'opposer est aussi une sorte de soutien. "
« faites intervenir le département commercial dès le début et participez à la construction, à l'adoption finale et à la promotion. » a déclaré jin jianhua, fondateur et pdg d'ianalysis. comme les assistants de maintenance, le groupe peut avoir les idées du groupe, les filiales peuvent avoir les idées des filiales, et les salariés de première ligne peuvent avoir les idées des salariés de première ligne. comment aligner les attentes de chacun en matière de revenus ?c'est une question d'équilibre. par exemple, certaines constructions de cartes de connaissances sont réalisées par des experts chevronnés issus d’entreprises secondaires, permettant à chacun d’avancer vers un objectif commun.
les entreprises doivent également divulguer régulièrement le statut opérationnel et les revenus commerciaux des projets de référence et offrir publiquement des incitations. "par exemple, donnez des points aux employés, reliez-les à certains systèmes et échangez-les contre des cadeaux", a observé hu wei. "nous allons directement le lier aux performances et aux primes", a déclaré un dsi d'une entreprise technologique. "même si c'est un peu simple et grossier, cela a un effet. cela nécessite la coopération de la direction et la mobilisation des ressources rh."
la rétention pour la première fois est également importante. il est nécessaire de trouver des moyens d'améliorer la première expérience de connexion des employés après la révision et l'itération. par exemple, si l'entrée est suffisamment claire et que ce qui n'était pas autorisé auparavant est désormais exact, les employés de l'entreprise continueront à l'utiliser.
du point de vue du département commercial, nous pouvons concevoir des histoires contagieuses et graphiques, et laisser certains maîtres anciens s'exprimer à partir de leur propre expérience, qui peut être contagieuse. l’activité quotidienne du projet, l’activité mensuelle et d’autres données sont tout aussi importantes. ce sontcultiver la culture ia d’une entreprise。
la vague de débarquement de grands modèles continue de déferler. dans ce contexte rapide, les acteurs de tous les horizons de la chaîne industrielle continuent d'augmenter leurs investissements, poussant davantage d'entreprises à franchir le pas de l'intelligence numérique.
baidu marquera également le début de grands mouvements dans un avenir proche, qui auront lieu le 25 septembre.conférence baidu cloud intelligence 2024. d'ici là, la plate-forme baidu intelligent cloud qianfan inaugurera de nouvelles mises à niveau des outils de développement d'applications, des grands modèles et des chaînes d'outils. les trois principaux produits d'application d'ia : baidu intelligent cloud keyue, wenxin quick code·baidu comate et baidu xiling digital people le feront. sera également complètement mis à niveau, et plusieurs sous-forums tels que la finance intelligente, l'industrie intelligente, les transports intelligents, les affaires gouvernementales intelligentes, les voitures intelligentes et l'intelligence incorporée seront organisés simultanément pour réaliser davantage d'échanges et de collisions techniques.