moitié eau de mer, moitié feu, où est le chemin pour les puces d'ia domestiques

moitié eau de mer, moitié feu, où est la voie pour les puces d'ia domestiques ?

2024-09-21

aperçu

les puces ia sont également appelées accélérateurs ia ou cartes informatiques. selon l'architecture technique, elles peuvent être divisées en unités de traitement graphique à usage général (gpgpu), unités centrales de traitement (cpu), puces intégrées spécifiques à une application (asic) et terrain. -réseaux de portes programmables (fpga). dans le développement de l’intelligence artificielle, les chercheurs ont découvert que le calcul parallèle peut effectuer une formation efficace de modèles et traiter des données complexes à grande échelle. le gpgpu a des performances de calcul parallèle plus élevées que les autres puces et convient aux applications gourmandes en calcul, il est donc devenu le courant dominant des puces informatiques.

selon la classification fonctionnelle, les puces ia peuvent être divisées en deux types : les cartes de formation et les cartes d'inférence. les cartes de formation, également appelées grandes cartes, ont généralement une puissance de calcul et une bande passante mémoire plus élevées pour prendre en charge une grande quantité de calculs et de traitement de données pendant le processus de formation. les cartes d'inférence, également appelées petites cartes, ont des paramètres inférieurs et doivent uniquement répondre aux exigences d'inférence ; . de manière générale, les cartes de formation peuvent être utilisées comme cartes de raisonnement, mais les cartes de raisonnement ne peuvent pas être utilisées comme cartes de formation. pour faire simple, la formation de grands modèles nécessite un grand nombre de cartes de formation pour former un cluster de cartes graphiques, tandis que pour les applications, des cartes d'inférence sont nécessaires pour exécuter le modèle ia pour les calculs.

cette vague d'intelligence artificielle a été lancée par chatgpt et utilise de grands modèles de langage et des applications d'ia générative comme point d'entrée. depuis sa sortie par google en 2017, transformer a été largement utilisé dans le traitement du langage naturel, la vision par ordinateur, la conduite autonome et d'autres domaines, en plus d'apporter des produits populaires côté c comme chatgpt. les entreprises technologiques chinoises et étrangères continuent d'augmenter leurs investissements dans des domaines connexes, notamment google, meta, microsoft, bytedance, baidu et d'autres géants et start-ups technologiques nationaux et étrangers, qui espèrent tous obtenir une part du gâteau. les entreprises technologiques investissent également constamment dans les talents, la technologie et la disposition des ressources. selon les données prévisionnelles de bloomberg intelligence, d'ici 2032, la proportion de l'ia générative dans les dépenses globales en matériel informatique, logiciels, services, publicité, jeux, etc. pourrait passer du niveau actuel de moins de 1 % à 12 %.

graphique 1 : chiffre d'affaires mondial de l'ia générative et prévisions de 2020 à 2032e (unité : 1 milliard de dollars)

source des données : bloomberg intelligence, tri des données lai mi

en 2018, openai a lancé le modèle de langage génératif de pré-formation gpt-1 de première génération, qui compte 117 millions de paramètres. le nombre de paramètres gpt-4 publiés en 2023 sera d'environ 1 800 milliards. l’augmentation du nombre de paramètres de plus de 10 000 fois en 5 ans a entraîné une augmentation exponentielle des besoins en puissance de calcul des grands modèles. openai estime que depuis 2012, les besoins mondiaux en puissance de calcul pour la formation des modèles d’ia ont doublé tous les 3 à 4 mois. surtout après 2023, le développement de l'ia bat son plein. les fabricants nationaux et étrangers ont augmenté leurs investissements dans l'ia générative, et la « bataille de centaines de modèles » a repris, ce qui a également provoqué une pénurie à long terme de la demande de puissance de calcul. .

graphique 2 : échelle et prévisions de la puissance de calcul intelligente de la chine de 2019 à 2026e (unité : 100 millions de yuans)

source des données : idc, tri des données lai mi

dans le contexte de la recherche sur les algorithmes et de l'open source de certains modèles, les grands modèles nationaux ont fait des progrès rapides, et de nombreux grands modèles nationaux d'ia affirment que leurs capacités individuelles ont rattrapé gpt-4. pour l’instant, le plus grand écart entre les capacités nationales d’ia et celles étrangères réside principalement dans les puces d’ia. pour des raisons bien connues, non seulement les entreprises technologiques nationales sont incapables d'acheter des puces d'ia avancées, mais même avec une solution complète, il est devenu très difficile de fabriquer elles-mêmes des puces d'ia. dans ce contexte, les puces d’ia nationales présentent un énorme potentiel de croissance.

les puces ia sont un jeu où le gagnant remporte tout. le monopole de nvidia sur les puces ia suffit à décourager la plupart des concurrents. l'institut de recherche laimi estime que la difficulté des puces ia se reflète principalement dans trois aspects, à savoir les performances d'une seule carte/performances de cluster, l'écologie/flexibilité et la difficulté de fabrication/rentabilité. en combinant ces trois aspects, nvidia possède la force la plus complète, elle a donc atteint plus de 90 % de part de marché sur le marché des puces ia.

comment se déroulent les progrès des entreprises et des industries nationales ? nous avons compté les paramètres spécifiques des sociétés de puces d'ia nationales et étrangères concernées, et nous pouvons voir qu'il existe toujours un écart dans les performances des cartes uniques entre les puces d'ia nationales et les puces d'ia étrangères, mais l'écart le plus important vient de wanka internet et de l'environnement ; construction côté formation. dans l’ensemble, les puces d’ia nationales ont encore un long chemin à parcourir à long terme.

graphique 3 :fabricants, produits et caractéristiques techniques de puces ia nationales et étrangères

source des données : informations publiques, tri des données lai mi

les puces d'ia nationales sont principalement concentrées sur le côté inférence. cet aspect est en concurrence.nvidiad’un autre côté, avec le développement et la vulgarisation de la technologie de l’ia, la demande de l’industrie en puces d’ia hautes performances et à faible consommation augmente. cependant, il existe également des fabricants de puces côté formation qui élaborent des plans. lors du global ai chip summit 2024, biren technology a annoncé pour la première fois sa solution de formation collaborative gpu hétérogène indépendante et originale, hgct. , il prend en charge la formation mixte de trois gpu hétérogènes ou plus sur le même grand modèle de plate-forme. moore thread a annoncé son cluster intelligent wanka kuae (kuae) basé sur mtt s4000 pour la formation et les tests. des fabricants tels que huawei, cambrian et haiguang information ont également pris des mesures similaires.

il est extrêmement difficile de démarrer une entreprise de puces ia. le laimi research institute estime que la première difficulté lors du démarrage d’une entreprise de puces ia est de résoudre les problèmes de conception et de fabrication des puces. en raison de restrictions étrangères, les outils de conception associés ont été contrôlés. cependant, le problème de fabrication est un problème plus réaliste. la dernière puce ai de nvidia utilise le processus 4nm. actuellement, seul tsmc dispose des capacités de fabrication, tandis que les capacités de fabrication de puces de la chine continentale sont légèrement insuffisantes.

le deuxième concerne les problèmes de marché. nvidia reste actuellement la solution de puces d'ia la plus rentable. les entreprises nationales d'ia achètent des puces d'ia nationales pour des raisons subjectives ou objectives de substitution nationale. d'un autre côté, elles espèrent également utiliser des produits plus performants. répondre à leurs propres besoins (par exemple, des fabricants tels que bytedance conçoivent leurs propres puces ia en fonction de la demande). d’une part, les grands modèles accélèrent le développement des puces ia et, d’autre part, ils élargissent également l’écart entre les fabricants de puces. les fabricants nationaux de puces d'ia doivent réfléchir aux besoins spécifiques que leurs produits peuvent répondre aux besoins des clients avant que ceux-ci ne soient prêts à payer des primes élevées.

le troisième est la rentabilité. pour des raisons bien connues, les cycles de recherche et de développement de puces ia sont longs, intensifs et coûteux, et ces investissements sont souvent difficiles à rentabiliser à court terme. il est donc extrêmement important d’acquérir la capacité hématopoïétique. dans la dynamique actuelle du marché primaire, il est extrêmement improbable de s'appuyer uniquement sur le marché du capital-risque pour les transfusions sanguines. le flux de trésorerie positif des entreprises de puces ia mérite également d'être testé.

actualités en matière d'investissement et de financement

le marché des puces ia a connu une forte dynamique de croissance ces dernières années. la taille du marché mondial des puces d’ia devrait atteindre 71,252 milliards de dollars américains en 2024, soit une augmentation de 33 % sur un an, et devrait encore croître pour atteindre 91,955 milliards de dollars américains en 2025. sur le marché chinois, la taille du marché des puces d'ia atteindra 120,6 milliards de yuans en 2023, soit une augmentation de 41,9 % sur un an, et devrait atteindre 141,2 milliards de yuans en 2024. selon les données de laimi, les puces ia sont également l'une des pistes les plus actives cette année. les cycles de financement en sont encore à leurs débuts, mais certains projets phares ont été reconnus par le marché et le capital augmente constamment. les lecteurs intéressés peuvent se connecter à la plateforme rime pevc pour obtenir des dossiers de financement complets, des projets investis et une analyse approfondie des données de la piste des puces ia.

source des données :venez trouver des données

perspectives

alors que la révolution des grands modèles balaie le monde, la demande de puissance de calcul atteint de nouveaux sommets, entraînant l’itération et l’évolution des puces d’ia cloud, de périphérie et latérales. sous les trois nuages d'une croissance explosive des données, de l'approche des limites physiques de la technologie et d'une situation internationale complexe et volatile, de nombreuses entreprises de puces d'ia avancent sous pression de manière discrète et pragmatique, se préparant activement aux opportunités de l'ère apportée. par la vague de l’ia générative.

comme l’a dit elon musk : seules les matières premières constituent la seule limitation, et chaque aspect de la fabrication peut être complètement réinventé. l'énorme potentiel de l'ia va certainement créer un marché de plusieurs milliards. le « blocage » n'est que temporaire. avec la percée des processus avancés et des investissements en capital, la distance entre nous et l'ia étrangère se rétrécit plutôt qu'elle ne s'accroît. l'espace pour la substitution nationale est immense et les sociétés liées ouvriront également la voie à des opportunités de croissance rapide.

la réflexion en fin de partie nécessite de verrouiller le gagnant. le monde futur nécessitera une puissance de calcul infinie, mais, compte tenu du paysage concurrentiel du marché américain, il n’y aura peut-être que quelques gagnants. en raison de la nature gagnant-gagnant des puces d’ia, nous pensons que les entreprises nationales de puces d’ia doivent disposer d’une force technique, de capacités de canalisation et de capacités de financement pour gagner. ces capacités posent d’énormes défis aux startups, mais elles créent également des barrières industrielles.

source : rimedata lai mi data auteur : lai mi research institute

nouvelles

moitié eau de mer, moitié feu, où est la voie pour les puces d'ia domestiques ?

introduction

mes coordonnées