nouvelles

Quel est le débat sur les sources ouvertes et fermées des grands modèles ?

2024-08-14

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina




Les différends ne peuvent pas nier la valeur marchande de l'autre. Les deux besoins du marché coexisteront pendant longtemps.



Texte | Wu Junyu Xu Wenpu

Editeur|Xie Lilong

Depuis cette année, les entrepreneurs, les investisseurs et les entrepreneurs du secteur de l'IA (intelligence artificielle) en Chine et aux États-Unis ont simultanément lancé un débat : si les grands modèles doivent être open source ou fermés.
En Chine, la figure au centre de la controverse est le fondateur de Baidu, Robin Li. En avril de cette année, il a déclaré publiquement : « Tout le monde utilisait l'open source et pensait que l'open source était bon marché. En fait, dans les scénarios de modèles à grande échelle, l'open source est le plus cher. Le modèle open source deviendra de plus en plus arriéré. " Ce point de vue ne manque pas d'opposition. Les opposants incluent Zhou Jingren, CTO (Chief Technology Officer) d'Alibaba Cloud,Renseignements de BaichuanLe PDG Wang Xiaochuan et le PDG de Cheetah Mobile Fu Sheng. En mai de cette année, Zhou Jingren a déclaré sans détour dans une interview aux médias : « Il ne fait aucun doute que l'open source contribue à la technologie et à l'écologie mondiales. Cela a été prouvé à de nombreuses reprises dans le monde, et il n'est plus nécessaire d'en discuter.
Aux États-Unis, le débat est encore plus houleux. Le fondateur de Tesla, Musk, a déjà poursuivi des startups d'IAOpenAI. Musk était l'un des principaux fondateurs et investisseurs d'OpenAI en 2015. Il estime qu'OpenAI, dirigé par l'actuel PDG Altman, a violé son engagement de « fonctionner comme une organisation à but non lucratif et de rendre l'IA open source et open source ». Deux investisseurs célèbres de la Silicon Valley, Andreessen, le fondateur d'a16z, et Kosla, le fondateur de Kleiner Perkins Caufield & Byers, ont eu de nombreuses confrontations sur les réseaux sociaux. Le premier estime que le modèle fermé conduira au monopole des géants et sapera la recherche universitaire. Ce dernier estime que les grands modèles sont des armes économiques et ne doivent pas être open source.


L'Open Source est un modèle de développement logiciel : le code source est publié gratuitement et survit grâce aux dons de la communauté. Les développeurs peuvent librement télécharger, modifier, distribuer, signaler les bogues logiciels (défauts ou erreurs logiciels) et faire des suggestions d'optimisation. Cette innovation collective va accélérer l’itération logicielle.Les modèles open source font référence à des modèles dont l'utilisation est gratuite et dont les détails techniques ont été publiés, tels que les paramètres du modèle ; les modèles à code source fermé font référence à des modèles qui nécessitent un paiement et ne publient pas de détails techniques.Comprenez simplement que l'open source est gratuit, mais vous devez acheter et cuisiner votre propre nourriture ; le source fermée est payant, ce qui équivaut à aller manger au restaurant, et vous pouvez obtenir de meilleurs services.
Les grands modèles doivent-ils être open source ou fermés ? Les intérêts commerciaux, les opinions techniques et d'autres facteurs ont été mélangés, de sorte que de nombreux faits ont été confus - mais il y a quelques faits certains derrière ce débat.
Premièrement, différentes stratégies commerciales permettent aux entreprises de choisir différentes voies techniques.Des entreprises telles que Baidu et OpenAI qui espèrent commercialiser rapidement de grandes entreprises modèles ont choisi le source fermée sur Alibaba Cloud, Meta et d'autres sociétés ;informatique en nuageOu encore les entreprises ayant une activité publicitaire rentable choisissent l’open source pour agrandir le gâteau.
Deuxièmement, les exigences du marché en matière d'open source et de source fermée coexisteront pendant longtemps et il est impossible de simplement juger laquelle est la meilleure.Les modèles open source et fermé ont leurs propres scénarios applicables, et le modèle à choisir est lié à la demande du marché. Cela ne change pas selon la volonté du fabricant du modèle.
Troisièmement, il existe des différences essentielles entre les modèles open source et les logiciels open source.Les logiciels open source publient le code source et la plupart des détails techniques. Le modèle open source ressemble davantage à une boîte noire technique gratuite : les paramètres du modèle sont ouverts, mais le code source, les données de formation, le processus de formation et d'autres détails techniques sont rarement ouverts.

En outre, la bataille entre les sources ouvertes et fermées dans l’industrie chinoise de l’IA porte davantage sur la concurrence commerciale.L'open source n'a pas de frontières, ce concept est généralement reconnu. Cependant, dans le contexte d'une concurrence accrue entre la Chine et les États-Unis dans le secteur de l'IA, l'opposition de l'industrie américaine à l'open source devient de plus en plus forte.

Qui est open source et qui est fermé ?
Le développement de grands modèles en est encore à ses débuts et nécessite encore des essais et des erreurs.Open source et source fermée ne sont pas distincts. Lorsque les entreprises sont confrontées à la question à choix multiples entre l’open source et le fermé, elles empruntent trois voies différentes.

Le plus extrême est de ne faire que des modèles open source. Il y a relativement peu d’entreprises qui empruntent cette voie, et Meta est l’une des rares. L’avantage est que cela attirera davantage d’utilisateurs. Le problème est qu’il n’existe pas de modèle de profit et que seules les grandes entreprises peuvent se le permettre.
Llama 3, propriété de Meta, est le modèle open source avec le plus d'utilisateurs au monde. L'activité principale de Meta concerne les médias sociaux (tels que Facebook, Instagram), avec un bénéfice net en 2023 atteignant 39 milliards de dollars. Meta a envie d'explorer de nouvelles activités, mais il n'y a aucune pression pour gagner de l'argent grâce à des modèles. Par conséquent, il ne peut utiliser que le modèle open source et ne peut pas prendre en compte les problèmes de rentabilité pour le moment.
Une voie intermédiaire est open source et fermée en parallèle, ce qui est très flexible. Les entreprises peuvent non seulement obtenir des utilisateurs grâce à l'open source, mais également obtenir des revenus grâce à des sources fermées. Cela donne non seulement une marge de choix aux développeurs, mais permet également aux entreprises elles-mêmes d'avoir une marge d'erreur.
Les entreprises qui choisissent cette voie incluent Microsoft, Google, Alibaba Cloud, Tencent Cloud, ainsi que des startups d'IA telles que Mistral Al, Zhipu AI et Baichuan Intelligence. Une pratique courante dans la parallélisation de l'open source et du fermé consiste à utiliser des modèles open source gratuits pour attirer les utilisateurs et les guider vers l'utilisation de modèles fermés de plus grande taille et offrant de meilleures performances. Par exemple, le principal modèle commercial de Microsoft est la série GPT-4 d'OpenAI, mais il a également open source le petit modèle Phi-3 Mini ; Alibaba Cloud a open source plus de dix modèles avec des paramètres allant de 500 millions à 110 milliards, et a également fourni un modèle fermé. Fondation source. Grands modèles, modèles industriels ; Google a ouvert la série de petits modèles Gemma et fournit également la série Gemini de grands modèles de base à source fermée. Des startups telles que Mistral Al ont des modèles open source avec des performances rétrogrades dans la génération précédente ; et a guidé les utilisateurs à payer pour utiliser des modèles offrant de meilleures performances dans cette génération.
Le problème avec l’open source et le fermé est que la commercialisation implique parfois des efforts concurrents. Certains clients ont utilisé des modèles open source gratuits et n’utiliseront plus de modèles fermés payants. Les modélistes perdront ainsi une partie de leurs revenus.
Un technicien d'un fournisseur chinois de services de logiciels d'IA a déclaré à Caijing en juillet de cette année qu'il avait récemment utilisé le modèle open source Tongyi Qianwen (Qwen2) d'Alibaba Cloud pour la formation secondaire et le réglage fin afin de servir un bureau de tourisme de la ville locale. Cette commande dépasse les 10 millions de yuans, et ils en sont les bénéficiaires, mais Alibaba Cloud n'a aucun revenu. "Caijing" s'est renseigné sur l'accord de licence de Qwen2 sur Github (la plus grande plateforme d'hébergement de code au monde). L'accord indique "Aucune demande d'utilisation commerciale requise". En d’autres termes, il n’est pas nécessaire de payer pour une utilisation commerciale une fois Qwen2 formé et affiné.
La valeur à long terme de l’open source est d’agrandir le gâteau du marché modèle. Un responsable d'Alibaba Cloud a déclaré à Caijing qu'il est normal que les utilisateurs modifient des modèles open source à des fins commerciales, et que vous devez vous y préparer lorsque vous utilisez l'open source. Même si Alibaba Cloud n’a pas encore mangé tout le gâteau, il a fait grossir le gâteau de l’industrie. À long terme, cela finira par en bénéficier. Les réactions chimiques ne se produiront que lorsque les grands modèles seront largement utilisés par différents clients tels que les gouvernements, les grandes et moyennes entreprises et les développeurs. Les grandes industries modèles doivent établir une écologie et former un volant de croissance. Cette tendance est visible dans ModelScope, une communauté open source d’IA appartenant à Alibaba Cloud. En juillet de cette année, la communauté Moda comptait plus de 5,6 millions de développeurs, plus de 5 500 modèles de haute qualité et des milliers d'ensembles de données, ce qui en fait la plus grande communauté de modèles open source en Chine.
Une vision plus optimiste est que l’open source et le fermé peuvent même former une relation en amont et en aval. L'open source se situe en amont de la technologie, responsable de la participation de la communauté, de l'itération technologique, de l'attraction des clients et de la garantie que la technologie est en avance sur ses pairs. La source fermée est en aval et est responsable de la réalisation commerciale.
Lanzhou Technology est une grande start-up modèle en Chine. Li Jingmei, partenaire et co-PDG de Lanzhou Technology, a déclaré à Caijing que l'open source est à la fois une stratégie technique et une stratégie commerciale. Cela peut avoir un impact sur la communauté des développeurs ainsi que sur le psychisme de l’équipe technique des clients potentiels. Open source et source fermée ne sont pas contradictoires. Le cycle de commentaires des clients pour les modèles fermés est relativement long, mais les développeurs communautaires de modèles open source donneront rapidement leurs commentaires. Cela peut aider les entreprises à itérer rapidement leurs produits.
Un planificateur stratégique en IA d'une grande entreprise technologique chinoise estime que pour les principaux fournisseurs de cloud tels qu'Alibaba Cloud, il est préférable d'être en parallèle open source et fermé plutôt que d'être uniquement fermé. Les revenus d'Alibaba Cloud proviennent principalement des quatre composantes majeures du cloud public (informatique, stockage, réseau, base de données). Le modèle open source gratuit favorisera la consommation de données commerciales des clients, stimulant ainsi les ventes des produits cloud de base mentionnés ci-dessus.
Créer uniquement des modèles fermés est une approche simple, directe et logique. Les grandes entreprises qui empruntent cette voie estiment que si les grands modèles doivent être commercialisés, ils doivent être de source fermée, sinon la boucle commerciale ne peut pas être bouclée.
Les startups d'IA OpenAI (ses modèles de la série GPT-4), Amazon (investi dans la startup d'IA Anthropic, qui comprend les modèles de la série Claude 3.5), Huawei (grand modèle Pangu), Baidu (grand modèle Wenxin) et d'autres sociétés ont choisi cela route. Les entreprises utilisant de grands modèles paient souvent par appel API (interface de programmation d'application), ce qui revient à payer l'eau, l'électricité et le gaz en fonction de leur consommation. Le modèle économique du modèle source fermée est théoriquement le plus sain. Les taux de croissance des revenus de Microsoft Azure, Amazon AWS et Google Cloud ont augmenté d'environ 5 points de pourcentage au cours de l'année écoulée, et leurs niveaux de bénéfices ont également légèrement augmenté. On pense que cela est dû à l’attraction d’un grand modèle.
Mais en Chine, il est difficile pour le modèle fermé d’être réellement rentable à court terme. En mai de cette année, le marché chinois des modèles a lancé une guerre des prix. Le but de la réduction des prix est de stimuler la demande des clients et d’élargir la taille du marché. Les services cloud de ByteDance, Volcano Engine, Alibaba Cloud, Tencent Cloud et Baidu Smart Cloud, ont successivement réduit le prix des appels de grands modèles de plus de 90 %. La marge bénéficiaire brute des appels de grands modèles est passée de plus de 60 % à moins de 0 %.
Un responsable du secteur des grands modèles d'un fournisseur de cloud chinois estime que les appels aux grands modèles sont entrés dans « l'ère du profit brut négatif ». Plus vous l’utiliserez, plus vos pertes seront importantes. La différence est que les grandes entreprises comme Alibaba, ByteDance et Baidu peuvent se permettre de perdre de l’argent, mais pas les petites et moyennes entreprises et les startups.

Lui et un dirigeant d'une grande start-up modèle ont exprimé un point de vue similaire : différentes entreprises ont des gènes différents et des stratégies commerciales modèles différentes. Le cloud est le cœur de métier d'Alibaba Cloud, et l'objectif ultime des modèles open source est de vendre davantage de cloud. Volcano Engine est soutenu par ByteDance et les activités publicitaires de la société mère peuvent être transfusées. La part de marché du cloud computing de Volcano Engine est bien inférieure à celle d'Alibaba Cloud. « Il est pieds nus et n'a pas peur de porter des chaussures », et il espère conquérir davantage de parts de marché grâce à la guerre des prix. L'IA est l'activité principale de Baidu. Baidu espère gagner de l'argent grâce aux grands modèles, c'est pourquoi il met l'accent sur la valeur des modèles fermés.

Quel est l'argument ? Quel est le consensus ?
Le débat chinois sur les grands modèles open source et fermé se concentre sur plusieurs points : premièrement, existe-t-il une différence entre les modèles open source et les logiciels open source ? Deuxièmement, lequel est le plus fort, le modèle open source ou le modèle fermé ? Troisièmement, lequel est le plus cher : le modèle open source ou le modèle fermé ?
Le premier débat est : existe-t-il une différence entre les modèles open source et les logiciels open source ? La réponse est qu'il y a une grande différence. La grande majorité des modèles open source ne sont pas entièrement open source. Ils ressemblent davantage à des boîtes noires dont l’utilisation est gratuite qu’à des boîtes transparentes comme les logiciels open source.
Les logiciels open source publieront le code source et les développeurs pourront maîtriser la plupart des détails techniques du logiciel via le code source. La logique fondamentale des logiciels open source gratuits est que les développeurs de toute la société peuvent aider les fabricants de logiciels à détecter les bogues des produits et à fournir des suggestions d'optimisation. Le développement social peut non seulement réduire les coûts de recherche et de développement de logiciels, mais également accélérer l’itération des logiciels. Le système d'exploitation mobile Android et le logiciel de base de données MySQL ont tous deux connu du succès de cette manière.
La complexité des modèles open source dépasse de loin celle des logiciels open source. Les projets open source incluent le code source, les poids des paramètres, la structure du modèle, les données de formation, le processus de formation, etc. Deux chercheurs de l'Université Radboud aux Pays-Bas, Lisenfeld et Dingemans, ont publié en mars de cette année un article comparant le degré d'open source dans les modèles open source. L'article montre que les modèles open source les plus performants ne proposent généralement que des pondérations de paramètres open source. Une explication est que, pour garantir les performances de leurs modèles, les constructeurs de modèles ne peuvent pas révéler toutes les « recettes ». Prenons l'exemple du modèle open source le plus puissant au monde, Llama3. Ses poids de paramètres et sa structure de modèle ne sont que partiellement open source. Le code source, les données de formation et le processus de formation ne sont pas open source.


Il n’y a aucun doute sur la valeur du concept open source pour l’écologie industrielle.Xin Zhou, directeur général de Baidu Smart Cloud AI et de la plateforme de grands modèles, a déclaré à Caijing en juillet de cette année que les modèles open source enrichiraient les applications de modèles et les modèles industriels. Mais il s’oppose à l’amalgame entre le modèle open source et les logiciels open source.Parce qu'il existe une différence essentielle entre les deux : le modèle open source ne peut pas compter sur la participation des développeurs sociaux pour améliorer les performances des produits et réduire les coûts de R&D comme les logiciels open source. Le modèle de base ne peut être amélioré que par la propre formation du fabricant du modèle. Le réglage fin et l'optimisation de l'inférence du modèle open source ne sont pas aussi bons que le modèle commercial. Il a des exigences techniques élevées pour les développeurs et le coût d'utilisation réel n'est pas aussi bon. faible.
Le deuxième débat est de savoir lequel est le plus fort, le modèle open source ou le modèle fermé ? Le fait est que les modèles fermés fonctionnent généralement mieux que les modèles open source, mais l’écart de performances entre les modèles open source et fermés se réduit.


Le Centre de recherche sur les modèles fondamentaux (CRFM) de l'Université de Stanford effectue depuis longtemps des classements mondiaux de tests sur de grands modèles. Au 24 juillet, le classement des tests de compréhension du langage multi-tâches à grande échelle (MMLU) publié montre que parmi les dix modèles les plus performants, seul Llama3.1 est un modèle open source, y compris Claude3.5 (investi par Amazon), GPT. -4o (investi par Microsoft) et Gemini1. 5 Pro (auto-développé par Google) et d'autres sont des modèles fermés.
Li Jingmei estime que le modèle fermé de la même entreprise doit avoir de meilleures performances que le modèle open source. Cependant, en comparaison horizontale dans l'industrie, les modèles fermés ne sont pas nécessairement meilleurs que les modèles open source. Étant donné que les grands modèles sont itérés tous les 6 à 12 mois, certains modèles open source peuvent évoluer plus rapidement.


Les classements des organismes d'évaluation illustrent cette tendance. L'organisation LMSYS (Large Model System Research Organization) a été lancée par l'Université de Californie à Berkeley. L'organisation évaluera et classera également pendant longtemps les performances des modèles mondiaux. Llama3.1 de Meta et Qwen2 d'Alibaba Cloud s'améliorent rapidement dans le classement de cette évaluation. Llama3.1 surpasse même la plupart des modèles fermés.
Un responsable du secteur des grands modèles d'un fournisseur de cloud chinois a analysé qu'il existe deux raisons pour lesquelles l'écart de performances entre les modèles open source et les modèles fermés s'est réduit au cours de l'année écoulée, les grands modèles de base sont généralement entrés dans une période de goulot d'étranglement. amélioration des performances. Le modèle open source attire un grand nombre de développeurs. Bien qu'ils ne puissent pas améliorer directement les performances des modèles via le retour de code, ils améliorent le niveau global de recherche sur les modèles, ce qui aide indirectement les modèles open source à améliorer les performances des modèles.
Le troisième débat est : modèle open source ou modèle fermé, lequel est le plus cher ? La conclusion est que la performance est le facteur décisif. Les coûts d'utilisation du modèle sont directement liés aux performances du modèle. Plus les performances sont élevées, plus le coût d’utilisation à long terme est faible, car moins d’appels sont nécessaires pour accomplir la tâche.
Les modèles open source sont gratuits et donnent souvent l’impression d’être moins chers et moins coûteux. Xin Zhou a expliqué que l'application de grands modèles est une solution complète comprenant « technologie + service » et que l'entreprise doit calculer le « grand livre ». En plus de fournir des modèles et des chaînes d'outils complets, les fabricants de modèles fermés proposent également des formations et des services techniques pour aider les entreprises à démarrer rapidement. Le modèle open source semble être gratuit, mais pour obtenir le même effet que le modèle fermé, il nécessite beaucoup d'investissements ultérieurs en main-d'œuvre, en argent et en temps, et le coût global est encore plus élevé.

À long terme, le coût de l’inférence est le facteur décisif dans le coût d’application des modèles open source et fermé. Les modèles fermés avec la même ampleur de paramètres fonctionnent généralement mieux que les modèles open source et ont des coûts globaux inférieurs. Xin Zhou a calculé que si une entreprise déploie gratuitement un modèle open source, le déploiement d'un modèle fermé coûte 500 000 yuans. Au stade de l’investissement initial, le modèle open source est moins cher. Au stade ultérieur de l'utilisation, si les performances globales du modèle fermé sont 20 % supérieures à celles du modèle open source, le modèle fermé peut économiser des dizaines de milliers de yuans par jour dans certaines entreprises à grand volume. . En fin de compte, le coût d’utilisation à long terme doit être bien inférieur à celui du modèle open source.

Qui utilise le modèle open source ? Qui utilise le modèle source fermée ?
Le modèle open source est-il meilleur ou le modèle fermé ? Cette question n'est pas tranchée par les fabricants de modèles du côté de l'offre, mais par les entreprises clientes du côté de la demande.
En public, les guerres de mots des entreprises se poursuivent. Cependant, de nombreux techniciens des fournisseurs de cloud ont déclaré à Caijing que ces arguments ne peuvent pas nier la valeur marchande de chacun. Ces deux besoins vont cohabiter longtemps. Vu sous un autre angle, une guerre des mots facilite l’augmentation conjointe de la visibilité du marché.
En fait, la plupart des entreprises clientes ne se soucient pas de savoir si le modèle doit être open source. Xin Zhou a conclu qu'après avoir communiqué avec de nombreuses grandes entreprises clientes, il a découvert que l'utilisation ou non d'un modèle par le chef du service informatique dépend de nombreux facteurs. Le classement par ordre de priorité est généralement le suivant : l'effet, les performances, le prix et la sécurité. L'open source ou le fermé n'est pas un facteur décisif.
Dans la « boîte à outils » de la plupart des entreprises, les modèles open source et les modèles fermés sont complémentaires. La mise en œuvre de grands modèles par les grandes entreprises est généralement divisée en différentes étapes.
Dans un premier temps, le service informatique triera les performances et les caractéristiques des modèles open source et fermés du marché. Différents modèles présentent des avantages différents. Certains ont de fortes capacités de prononciation linguistique et d'autres ont de fortes capacités de statistiques de données. Tests POC (preuve de concept) gratuits de modèles open source à un stade précoce pour vérifier les effets commerciaux.
À moyen terme, nous commencerons par la première phase de projets dans des scénarios commerciaux peu difficiles et avec des résultats rapides, tels que le marketing, le service client et la base de connaissances. Non seulement vous devez acheter un modèle open source, mais vous devez également former et affiner votre propre modèle open source. Laissez les modèles internes et externes « faire la course », comparez les effets et les coûts des différents modèles et changez d'utilisation à tout moment.
Dans une étape ultérieure, sur la base des résultats de la mise en œuvre, nous planifierons progressivement les projets de deuxième et troisième phases dans des scénarios commerciaux difficiles et lents à produire des résultats. À l'heure actuelle, il est même souvent nécessaire de dépenser des dizaines de millions de yuans pour établir un ensemble de grands modèles de base indépendants et contrôlables ou de grands modèles industriels.
Le modèle open source est gratuit, mais il ne peut pas être utilisé directement, cela demande du temps et des efforts, et personne n'est responsable des détails. Le modèle fermé peut obtenir directement des produits matures et fournir des services complets avant, pendant et après la vente. Pour comprendre simplement, le modèle open source revient à acheter de la nourriture et à cuisiner soi-même, tandis que le modèle open source revient à dépenser de l'argent pour manger dans un restaurant.
Le point de vue de Xin Zhou est que le modèle open source convient à la recherche universitaire, à certaines petites et moyennes entreprises disposant de budgets informatiques extrêmement limités et à certaines grandes entreprises pour des projets d'auto-recherche internes indépendants et contrôlables, mais ce n'est pas le cas. adapté aux projets commerciaux externes à grande échelle. Dans certains projets commerciaux sérieux qui coûtent des millions ou des dizaines de millions de dollars, le modèle fermé reste le meilleur choix.
Le modèle open source n’est pas un repas gratuit. Il existe de nombreux coûts cachés pour les grandes entreprises utilisant le modèle open source. Par exemple, achat de puissance de calcul, adaptation de logiciels, etc. Un directeur technique d'un fournisseur chinois de services de marketing intelligent à l'étranger a déclaré à Caijing en juillet de cette année que son entreprise dépendait fortement des services cloud et dépensait plus de 80 millions de yuans en recherche et développement chaque année. Au cours des deux dernières années, la société a utilisé plus de dix modèles fermés en même temps, mais il n'existe aucun modèle open source parmi eux. Selon lui, le modèle open source nécessite du temps et de la main d’œuvre. La plupart des modèles open source ne peuvent pas être utilisés immédiatement, personne ne connaît les détails et ne peuvent être considérés que comme des « jouets ». Il a tendance à gérer plus d'une douzaine de modèles fermés et à basculer entre eux à tout moment en fonction du prix et des performances. C'est le plus rentable.
Le directeur informatique d'une grande banque commerciale par actions estime que le fait que le modèle open source ne puisse pas être utilisé de manière prête à l'emploi n'est pas un gros problème. Il a déclaré à Caijing en décembre 2023 que son équipe utilisait également Alibaba (modèle open source Tongyi), Meta (modèle open source Llama), Baidu (série Wenxin) et Zhipu (série GLM) pour les applications d'audit de rapports de conformité de recherche en libre-service. Le modèle open source convient à ces petits projets, car il permet des tests POC gratuits et peut être modifié selon les besoins. Son équipe informatique compte des dizaines de personnes, ainsi qu'une société de services informatiques externalisée, disposant de suffisamment d'effectifs pour faire face à ces problèmes. Mais il estime également que dans les projets à grande échelle d'une valeur d'un million ou dix millions de yuans, le modèle de source fermée est plus approprié. Parce que le modèle fermé est stable et fiable, vous pouvez également trouver une entreprise modèle qui se charge d’en prendre soin.

Il en coûte des dizaines de millions de yuans pour former complètement un ensemble de modèles industriels à l'aide de modèles open source, et cela nécessite également l'achat de puces d'IA pour construire une salle informatique auto-construite. Les techniciens des fournisseurs de services de logiciels d'IA mentionnés ci-dessus ont conclu que le modèle open source convient à certaines entreprises publiques centrales qui ont des exigences élevées en matière de sécurité, d'autonomie et de contrôle des données, et qui ne sont pas si sensibles aux coûts. Ils utiliseront des modèles open source pour former leurs propres modèles industriels. Parce que le « modèle open source + cloud privé » répond aux exigences de sécurité des données et de contrôlabilité indépendante de nombreuses entreprises centrales et publiques.

Quel est l’avenir ?
Le débat entre les sources ouvertes et fermées des grands modèles sur le marché chinois est une question purement commerciale. Cependant, sur le marché international, le différend entre les grands modèles de sources ouvertes et fermées implique davantage de facteurs tels que les intérêts antitrust et nationaux.
Après la guerre des prix en mai de cette année, les grands modèles chinois sont entrés dans « l'ère des bénéfices bruts négatifs ». Les modèles open source et fermés sont tous deux confrontés à un problème : les grands modèles ne peuvent pas réaliser de bénéfices directs.
"La compétition à élimination directe sur le marché des grands modèles a commencé." Un responsable des activités de grands modèles d'un fournisseur chinois de cloud a analysé que le bénéfice brut négatif des appels de grands modèles signifie que plus il y a d'appels à court terme, plus les pertes pour les fournisseurs de cloud sont plus importantes. Les fournisseurs de cloud chinois parient qu'une fois le prix des appels grand modèle réduit de 90 %, le nombre d'appels grand modèle augmentera de façon exponentielle au cours des deux prochaines années. À long terme, les coûts de puissance de calcul des fournisseurs de cloud seront dilués à mesure que la demande des clients augmente, et ils seront toujours en mesure de réaliser des bénéfices positifs à la fin. Même si ce pari ne se réalise pas, un groupe de constructeurs de modèles mourra dans la guerre des prix et les constructeurs survivants ramasseront les morceaux.
De nombreux acteurs de l'industrie ont exprimé le même point de vue à l'égard de Caijing. Cette série d'éliminations durera un à deux ans et seules trois à cinq entreprises modèles de base pourront continuer à survivre.
An Xiaopeng, membre du comité exécutif de China Informatization Baihui et directeur du centre de recherche sur les technologies intelligentes Alibaba Cloud, a déclaré à Caijing en juillet de cette année qu'il n'y avait pas de guerre de centaines de modèles en Chine, ni même de guerre de dix modèles. Les grands modèles nécessitent un investissement continu, ont une capacité de 10 000 voire 100 000 cartes et nécessitent des retours commerciaux. De nombreuses entreprises ne disposent pas de telles capacités. À l'avenir, il n'y aura que trois ou cinq fabricants de modèles de base sur le marché chinois.
À qui profite la guerre des prix ? Qui aura le dernier mot ? Les planificateurs stratégiques de l'IA des principales entreprises technologiques chinoises mentionnés ci-dessus estiment que dans cette guerre des prix, le moteur Volcano d'Alibaba Cloud et ByteDance a le plus de sang. Alibaba Cloud peut gagner de l'argent grâce au cloud, et Volcano Engine exploite l'activité publicitaire de ByteDance comme une transfusion sanguine. Dans une guerre des prix, Baidu n’est pas aussi bon qu’Alibaba et ByteDance. Cependant, le grand modèle Wenxin de Baidu dispose d'une technologie solide et aura un groupe de clients prêts à payer pour cette technologie. Cela aidera Baidu à survivre à la guerre des prix. Il a en outre expliqué que ces grandes startups modèles sur le marché chinois seront confrontées à des tests sévères au cours des deux prochaines années. Les grandes startups de modèles peuvent choisir de devenir des sociétés de développement de modèles basées sur des projets ou de passer à des modèles industriels verticaux.
La concurrence globale sur le grand marché chinois des modèles est bien plus importante que la concurrence locale entre les modèles open source et fermés. L’orientation de la concurrence mondiale déterminera directement le résultat de la concurrence locale.
Un responsable d'Alibaba Cloud a déclaré sans ambages que les modèles open source et fermés ont leurs propres avantages, et qu'Alibaba Cloud espère rendre l'IA plus inclusive. Qu'il s'agisse d'open source ou de source fermée, l'objectif principal est de donner plus de choix aux développeurs. Alibaba Cloud a choisi de marcher sur deux jambes : open source et fermé. Il propose à la fois des modèles open source pleine grandeur et entièrement modaux et des modèles fermés. Une autre personne en charge du secteur des grands modèles d'un fournisseur de cloud chinois estime que l'open source n'a pas de modèle économique. Sur le marché modèle chinois, seules les grandes entreprises ou un très petit nombre de startups capables de lever des fonds de manière durable peuvent insister sur l’open source. En fin de compte, il ne restera peut-être qu’un ou deux modèles open source sur le marché chinois.
Les fabricants de modèles forment une nouvelle génération de modèles presque tous les 6 à 12 mois. Sur le marché chinois des modèles, à mesure que la pression pour réaliser des bénéfices augmente, les modèles open source pourraient devenir de plus en plus « stratégiques » - les entreprises auront tendance à proposer des modèles open source dotés d'une technologie arriérée et de paramètres plus petits par rapport à la génération précédente, et inciteront les utilisateurs à payer pour utiliser les mises à jour et les paramètres technologiques.
La concurrence entre les modèles open source et fermés ne s’arrêtera pas de si tôt. Certaines entreprises peuvent même gérer simultanément des logiciels open source et fermés.Dans l'industrie informatique, cela n'est pas sans précédent. La base de données est née il y a plus de 60 ans, et la première base de données open source est née il y a plus de 50 ans. Le marché des bases de données est actuellement actif avec différentes bases de données fermées et open source, et de nouvelles marques de bases de données continuent d'émerger sans cesse. Le géant des bases de données Oracle possède même à la fois une base de données SGBDR fermée et une base de données MySQL open source.
De nombreux techniciens des fournisseurs de cloud pensent que les modèles open source et les modèles fermés coexisteront pendant longtemps. Le marché des grands modèles va progressivement se développer face à la concurrence de différentes filières techniques.

Éditeur|Zhang Yufei