nouvelles

Qui planifie la puce du centre de calcul intelligent ?

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Texte : Perspective de l'industrie des semi-conducteurs

Les industries liées à la « puissance de calcul » ont continué à prospérer récemment, et la construction de centres informatiques intelligents fleurit également partout.

À l'aube de 2024, le centre informatique intelligent de Wuchang, le centre informatique intelligent mobile de Chine (Qingdao), le centre informatique intelligent de la Data Valley de Chine méridionale, le centre informatique d'intelligence artificielle de Zhengzhou, le centre informatique intelligent Broad Data de Shenzhen Qianhai, etc.

Selon des statistiques incomplètes, plus de 30 villes à travers le pays construisent ou proposent de construire des centres informatiques intelligents, avec un investissement dépassant les 10 milliards de yuans.

Qu’est-ce qu’un centre de calcul intelligent exactement ? À quoi sert principalement le centre de calcul intelligent ? Quelles sont les caractéristiques des centres de calcul intelligents ?

Qu'est-ce qu'un centre de calcul intelligent ?

Selon la définition du « Plan d'action pour le développement de haute qualité des infrastructures informatiques », les centres de calcul intelligents font référence à l'utilisation de ressources informatiques hétérogènes à grande échelle, notamment la puissance de calcul générale (CPU) et la puissance de calcul intelligente (GPU, FPGA, ASIC, etc.), principalement des installations qui fournissent la puissance de calcul, les données et les algorithmes requis pour les applications d'intelligence artificielle (telles que le développement de modèles d'apprentissage profond en intelligence artificielle, la formation de modèles, l'inférence de modèles et d'autres scénarios).

On peut également dire qu'un centre de calcul intelligent est un centre de données axé sur les tâches informatiques d'intelligence artificielle.

Les centres de données comprennent généralement trois catégories. Outre les centres de calcul intelligents, les deux autres sont des centres de calcul généraux axés sur les tâches informatiques générales et des centres de calcul intensif axés sur les tâches de calcul intensif.


2023 est une année charnière pour le développement de l'intelligence artificielle. La technologie AIGC a fait des progrès révolutionnaires. De nouvelles activités telles que la formation de grands modèles et les applications de grands modèles émergent rapidement. En tant que vecteur de puissance de calcul intelligente, les centres de données ont également évolué à partir des données. salles informatiques aux centres informatiques généraux, développés au stade actuel du centre de calcul intensif et du centre informatique intelligent.

Quelle est la différence entre un centre de calcul intelligent et un centre de données généraliste ?

Les centres de calcul intelligents, généralement étroitement liés au cloud computing, mettent l'accent sur la flexibilité du contrôle des ressources et de la gestion de l'infrastructure. Dans un environnement cloud, le fournisseur du centre de données est responsable de la maintenance du matériel et de certains outils logiciels, tandis que le client est propriétaire des données. En revanche, les centres de données locaux traditionnels obligent les entreprises à gérer et à entretenir elles-mêmes toutes les ressources de données.

Les différences essentielles conduisent à de grandes différences entre les deux modèles en termes d'investissement en capital, de déploiement de ressources et de sécurité.

En termes d'investissement en capital, les clients des centres de calcul intelligents peuvent choisir un modèle de service qui leur convient, comme le cloud public, le cloud privé ou le cloud hybride, sans coûts matériels et logiciels importants, tandis que les clients des centres de données traditionnels doivent investir beaucoup d'argent ; pour acheter et entretenir les serveurs, les équipements de réseau et de stockage dont vous avez besoin.

En termes de déploiement des ressources et de sécurité, les clients du centre informatique intelligent peuvent accéder et gérer à distance leurs données et applications via Internet à tout moment et en tout lieu, tout en bénéficiant des garanties de sécurité professionnelles fournies par les fournisseurs de centres de données, tels que. pare-feu, cryptage, sauvegarde et restauration, etc. tandis que les clients des centres de données traditionnels sont limités par les bureaux/emplacements désignés et doivent protéger et gérer eux-mêmes les données.

Un centre de calcul intelligent est simplement un centre de calcul de données qui sert spécifiquement l'intelligence artificielle et peut fournir la puissance de calcul dédiée requise pour les calculs de l'intelligence artificielle. Par rapport aux centres de données traditionnels, les centres de calcul intelligents peuvent répondre à des besoins plus ciblés, disposer de volumes de calcul plus importants et de vitesses de calcul plus rapides, et fournir une informatique IA pour divers scénarios industriels verticaux tels que l'inférence de formation sur de grands modèles, la conduite autonome et la force AIGC.

Quels types de puces sont nécessaires pour l’informatique intelligente IA ?

En termes de sélection du matériel, l'architecture matérielle des centres informatiques intelligents est également différente de celle des centres de données traditionnels.

Quels types de puces informatiques sont nécessaires pour l’informatique intelligente de l’IA ?

L'architecture matérielle des centres de données traditionnels est relativement simple et comprend principalement des serveurs, des périphériques de stockage et des périphériques réseau. Par rapport à cette architecture matérielle, le centre informatique intelligent sera plus flexible et différents nœuds informatiques seront sélectionnés pour différents scénarios d'application.

Le serveur informatique intelligent est le matériel informatique principal du centre informatique intelligent. Il adopte généralement l'architecture informatique hétérogène de « CPU+GPU », « CPU+NPU » ou « CPU+TPU » pour tirer pleinement parti des performances, du coût et du coût. performances des différentes puces informatiques. Avantages en matière de consommation d’énergie.

Les GPU, NPU et TPU possèdent un grand nombre de cœurs et sont bons en calcul parallèle. Les algorithmes d’IA impliquent un grand nombre de tâches d’opération matricielles simples et nécessitent de puissantes capacités de calcul parallèle.

Les serveurs à usage général traditionnels utilisent le processeur comme puce principale pour prendre en charge l'informatique générale de base telle que le cloud computing et l'informatique de pointe.

Quels types de puces mémoire sont nécessaires pour l’informatique intelligente IA ?

Non seulement les puces de puissance de calcul sont différentes, mais l'informatique intelligente IA a également des exigences plus élevées en matière de puces de mémoire.

Le premier est le dosage. La capacité DRAM des serveurs informatiques intelligents est généralement 8 fois supérieure à celle des serveurs ordinaires, et la capacité NAND est 3 fois supérieure à celle des serveurs ordinaires. Même son circuit imprimé PCB comporte beaucoup plus de couches qu’un serveur traditionnel.

Cela signifie également que les serveurs informatiques intelligents doivent déployer davantage de puces mémoire pour atteindre les performances requises.

À mesure que la demande augmente, une série de problèmes de goulots d’étranglement font également surface.

D'une part, l'architecture traditionnelle de von Neumann nécessite que les données soient chargées en mémoire, ce qui entraîne une faible efficacité de traitement des données, une latence élevée et une consommation d'énergie élevée. D'autre part, le problème du mur de mémoire entraîne une croissance beaucoup plus rapide des performances du processeur ; que la vitesse de la mémoire. En conséquence, une grande quantité de données doit être transférée entre le SSD et la mémoire. De plus, les limitations de capacité et de bande passante du SSD monté sur le CPU sont également devenues des goulots d'étranglement en termes de performances.

Face à des problèmes tels que le « mur de stockage » et le « mur de consommation d'énergie », l'architecture de stockage informatique dans l'architecture informatique traditionnelle doit être mise à niveau de toute urgence. Ce n'est qu'en intégrant organiquement le stockage et l'informatique qu'elle pourra correspondre à l'énorme quantité de données à l'ère de l'informatique intelligente. avec son énorme potentiel d’amélioration de l’efficacité énergétique.

En réponse à cette série de problèmes, des puces de stockage et de calcul intégrées peuvent constituer une bonne réponse.

En plus des différentes puces, afin de tirer pleinement parti des performances et d'assurer un fonctionnement stable, le serveur AI a également été conçu avec une architecture, une dissipation thermique, une topologie et d'autres aspects améliorés.

Qui dispose ces jetons ?

La disposition des puces de puissance de calcul

Du côté des GPU, les GPU sont bons pour le calcul massivement parallèle. Huawei, Tianshu Zhixin, Moore Thread, Sugon, Suiyuan Technology, Nvidia, Intel, AMD, etc. ont tous lancé des puces associées. Par exemple, Huawei a lancé la série Ascend de puces IA, Ascend 910 et Ascend 310. Ces puces sont spécialement conçues pour la formation et le raisonnement de l'IA, et offrent des performances élevées et une faible consommation d'énergie. La série Ascend a été largement utilisée dans les centres de données, les services cloud, l'informatique de pointe et d'autres domaines, fournissant une puissance de calcul puissante aux centres informatiques intelligents.

NVIDIA a lancé un certain nombre de produits GPU pour la formation et l'inférence de l'IA, tels que A100, H100, etc. Intel a également lancé un certain nombre de puces IA, telles que la série de puces Gaudi de Habana Labs, dans le but de concurrencer Nvidia. AMD a également fait des projets dans le domaine des puces IA et a lancé des produits GPU et APU de la série MI.

En termes de FPGA, CPU+FPGA allie flexibilité et hautes performances pour s'adapter aux changements rapides des algorithmes. Xilinx et Intel sont les principaux acteurs du marché. Les produits associés comprennent : les séries de produits VIRTEX, KINTEX, ARTIX, SPARTAN de Xilinx et la série de produits Agilex d'Intel incluent Fudan Microelectronics, Unisoc Microelectronics et Anlu Technology wait.

En termes d'ASIC, CPU+ASIC fournit un calcul personnalisé hautes performances pour répondre à des besoins spécifiques. Des géants étrangers comme Google, Intel et NVIDIA ont successivement lancé des puces ASIC. Des fabricants nationaux tels que Cambrian, Huawei HiSilicon et Horizon ont également lancé des puces ASIC accélérées par des réseaux neuronaux profonds.

En termes de NPU, NPU est un processeur spécialement conçu pour les scénarios d'intelligence artificielle et d'apprentissage automatique. Différent du CPU et du GPU, le NPU a été spécifiquement optimisé dans sa structure matérielle et se concentre sur l'exécution de tâches informatiques liées à l'IA telles que l'inférence de réseau neuronal. La combinaison de la polyvalence du CPU et de la spécificité du NPU permet à l'ensemble du système de répondre de manière flexible à divers scénarios d'application d'IA et de s'adapter rapidement aux changements d'algorithmes et de modèles.

Il existe actuellement sur le marché de nombreux NPU ou puces produits en série équipés de modules NPU. Les plus connus incluent les NPU Qualcomm Hexagon et la série Ascend de Huawei. Il convient de noter que tous les grands fabricants ont des conceptions uniques dans la conception des cœurs de calcul des puces. . Stratégie.

En termes de TPU, le TPU est une puce développée par Google spécifiquement pour accélérer la puissance de calcul des réseaux neuronaux profonds. Elle est davantage axée sur le traitement de tâches d'apprentissage en profondeur à grande échelle et possède une puissance de calcul plus élevée et une latence plus faible. Le TPU est également une puce ASIC.

En termes de DPU, DPU est spécialement conçu pour les tâches de traitement de données et dispose d'une structure matérielle hautement optimisée adaptée aux besoins informatiques dans des domaines spécifiques. Contrairement au CPU utilisé pour le calcul général et au GPU utilisé pour le calcul accéléré, le DPU est la troisième puce principale du centre de données. Les produits DPU des trois géants internationaux NVIDIA, Broadcom et Intel occupent la majeure partie du marché intérieur. De nombreux fabricants tels que Xilinx, Marvell, Pensando, Fungible, Amazon et Microsoft ont également produit des DPU ou des produits d'architecture similaire au cours des 2 dernières années. 5 années. . Les fabricants nationaux incluent Zhongke Yushu, Xinqiyuan, Yunbao Intelligence, Dayu Zhixin, Alibaba Cloud, etc.

Où sont passées les puces informatiques nationales ?

Lors de la conférence 2024 du réseau informatique mobile de Pékin, le nœud de Pékin du centre informatique mobile de Chine a été officiellement mis en service, marquant une nouvelle étape dans la construction du centre informatique intelligent de mon pays. En tant que premier centre informatique intelligent intégré de formation et de promotion à grande échelle de Pékin, le projet couvre une superficie d'environ 57 000 mètres carrés, déploie près de 4 000 cartes accélératrices d'IA, a un taux de localisation de 33 % des puces d'IA et dispose d'un système informatique intelligent. échelle de puissance supérieure à 1 000P.

Zhen Yanan, directeur technique de Beijing Beilong Super Cloud Computing Co., Ltd., l'entité opérationnelle du Beijing Super Cloud Computing Center, a récemment déclaré qu'elle « greffait » actuellement de grands modèles nationaux avec des puces nationales, et cela ne prend qu'environ 15 jours. traverser. Il estime que le partage de la puissance de calcul sera une tendance majeure dans l'industrie et que les ressources informatiques GPU haut de gamme nécessiteront les efforts de toutes les parties.

Ces dernières années, la structure du marché des puces de puissance de calcul d'intelligence artificielle chinoise a été principalement dominée par NVIDIA, qui représente plus de 80 % des parts de marché.

Zhen Yanan a déclaré : « Nous sommes également très préoccupés par le développement des puces nationales. Il est entendu que les grands modèles nationaux auto-développés et même certains grands modèles open source sont constamment transplantés sur des puces nationales. les modèles ont Il peut être exécuté, et ce qui doit être rattrapé, ce sont principalement les hautes performances telles que le GPU ".

"L'ensemble de la localisation est hiérarchique. Les puces appartiennent à la couche matérielle. De plus, il y a l'écosystème logiciel. Pour les puces nationales, le cadre et l'écosystème nécessitent un certain cycle de culture. Zhen Yanan a demandé à la partie finale de l'application de donner." assez de confiance dans les puces nationales.

Disposition de la puce mémoire

Les centres de calcul intelligents doivent avoir une capacité élevée, une fiabilité élevée, une disponibilité élevée et d'autres caractéristiques en termes de stockage. Les périphériques de stockage utilisent généralement des disques durs ou des disques SSD hautes performances et sont équipés d'une architecture de stockage redondante pour garantir la sécurité et l'accessibilité des données. Samsung, Micron, SK Hynix, etc. proposent des puces associées qui sont largement utilisées dans les centres de données, le cloud computing et d'autres domaines pour fournir des solutions de stockage hautes performances aux centres informatiques intelligents.

Les fabricants nationaux ont également réalisé un développement rapide en rattrapant les technologies DRAM et NAND ces dernières années.

En plus des puces de mémoire traditionnelles, les centres informatiques intelligents ont également besoin des nouvelles puces intégrées de stockage-stockage-informatique mentionnées ci-dessus pour jouer un rôle plus important.

À en juger par l'histoire du développement du stockage et de l'informatique intégrés, depuis 2017, de grands fabricants tels que NVIDIA, Microsoft et Samsung ont proposé des prototypes de stockage et d'informatique intégrés. La même année, des sociétés nationales de stockage et de puces informatiques intégrées ont commencé à émerger.

La demande des grands fabricants pour une architecture de stockage et de calcul intégrée est pratique et rapide à mettre en œuvre. En tant que technologie la plus proche de la mise en œuvre technique, l'informatique proche de la mémoire est devenue le premier choix des grands fabricants. Les grands fabricants dotés d’écosystèmes riches tels que Tesla et Samsung, ainsi que les fabricants de puces traditionnels tels qu’Intel et IBM, déploient tous l’informatique proche de la mémoire.

Les start-ups nationales se concentrent sur l’informatique en mémoire qui ne nécessite pas de technologie de processus avancée. Parmi elles, des startups telles que Zhicun Technology, Yizhu Technology et Jiutian Ruixin parient toutes sur le PIM, le CIM et d'autres voies technologiques qui intègrent plus étroitement le stockage et l'informatique avec le « stockage » et l'« informatique ». Yizhu Technology, Qianxin Technology, etc. se concentrent sur les scénarios d'IA à grande puissance de calcul tels que les calculs de grands modèles et la conduite autonome ; Shanyi, Xinyi Technology, Pingxin Technology, Zhicun Technology, etc. se concentrent sur l'Internet des objets, les appareils portables et les maisons intelligentes ; . Scénarios tels que la puissance de calcul marginale.

Yizhu Technology s'engage à concevoir des puces IA haute puissance en utilisant une architecture de stockage et de calcul intégrée. Pour la première fois, elle combine le memristor ReRAM avec une architecture de stockage et de calcul intégrée, grâce à une idée de conception de puce entièrement numérique, elle fournit une meilleure solution. sur la structure industrielle actuelle. Les puces d'IA à grande puissance de calcul avec une rentabilité, un rapport d'efficacité énergétique plus élevé et une plus grande marge de développement de la puissance de calcul ont emprunté une nouvelle voie de développement.

Qianxin Technology se concentre sur la recherche et le développement de puces informatiques intégrées de stockage et de calcul de grande puissance et de solutions informatiques pour les domaines de l'intelligence artificielle et du calcul scientifique. En 2019, elle a été la première à proposer une architecture de produit technologique intégrée de stockage et de calcul reconfigurable. Par rapport à d'autres entreprises en termes de débit informatique, les puces d'IA traditionnelles peuvent être améliorées de 10 à 40 fois. À l'heure actuelle, la puce intégrée de stockage et de calcul reconfigurable (prototype) de Qianxin Technology a été essayée ou mise en œuvre dans le cloud computing, la perception de la conduite autonome, la classification d'images, la reconnaissance de plaques d'immatriculation et d'autres domaines ; a été le premier en Chine à réussir les tests internes des principales sociétés Internet.

Le plan de Zhicun Technology est de repenser la mémoire, d'utiliser les caractéristiques physiques des cellules de stockage de la mémoire Flash, de transformer la matrice de stockage et de repenser les circuits périphériques afin qu'elle puisse accueillir plus de données, et en même temps de stocker les opérateurs dans la mémoire, de sorte que chaque L'unité peut effectuer des opérations de simulation et produire directement les résultats de l'opération pour atteindre l'objectif d'intégration du stockage et du calcul.

L'informatique intelligente représente plus de 30 % de l'échelle et la construction de puissance de calcul bat son plein

Début juillet, le centre informatique du sud-ouest de Tianfu Intelligence a été officiellement mis en service à Chengdu, dans le Sichuan. Selon certaines informations, le centre utilisera la puissance de calcul pour soutenir la création par Chengdu d'une industrie centrale d'intelligence artificielle de 100 milliards de dollars et favoriser l'innovation en matière d'intelligence artificielle dans des domaines tels que la fabrication industrielle, les sciences naturelles, la biomédecine et les expériences de simulation de recherche scientifique.

Il ne s'agit pas d'un cas isolé. Au cours du mois dernier, le projet de centre informatique intelligent vert de Yinchuan a démarré de manière intensive ; Beijing Mobile a construit le premier centre informatique intelligent intégré de formation et de promotion à grande échelle à Pékin pour prendre en charge des dizaines de milliards et des centaines de milliards de formation et de raisonnement de grands modèles avec haute complexité et exigences informatiques élevées ; Zhengzhou Le centre informatique d'intelligence artificielle a commencé la construction, avec un investissement total de plus de 1,6 milliard de yuans... La nouvelle infrastructure numérique représentée par le centre informatique intelligent accélère sa construction et sa mise en œuvre.

Les données publiées par le Bureau national des statistiques le 15 juillet ont montré qu'à la fin du mois de mai, 460 000 stations de base 5G avaient été construites dans tout le pays ; plus de 10 centres informatiques intelligents dotés de clusters informatiques hautes performances étaient prévus et une puissance de calcul intelligente était prévue. représentaient plus de 30 % de la puissance de calcul totale.

Selon les statistiques incomplètes du China IDC Circle, au 23 mai 2024, il existe 283 centres informatiques intelligents en Chine continentale, couvrant toutes les provinces, régions autonomes et municipalités de Chine continentale. Parmi eux, il y a 140 projets de centres informatiques intelligents avec des statistiques d'investissement, pour un investissement total de 436,434 milliards de yuans. Il existe 177 projets de centres de calcul intelligents avec des statistiques planifiées sur l'échelle de puissance de calcul, et l'échelle de puissance de calcul totale atteint 369 300 PFlops.

Ces « centres informatiques intelligents » ont des normes et des échelles différentes. L'échelle de puissance de calcul est généralement de 50P, 100P, 500P, 1000P, et certains atteignent même plus de 12000P. Bien que la vague de l'IA ait apporté de larges perspectives de développement aux centres informatiques intelligents, l'offre et la demande L'inadéquation, les prix élevés et la duplication de la construction sont toujours des problèmes auxquels est confrontée la construction de la puissance de calcul de mon pays.

Dans le même temps, de nombreux endroits ont également mis en place des plans spéciaux visant à clarifier les objectifs de construction au cours des prochaines années et à améliorer les mesures de soutien en termes de technologie, d'application et de financement. Par exemple, le Jiangsu a publié un plan spécial pour le développement de l'infrastructure provinciale de puissance de calcul, proposant que d'ici 2030, la puissance de calcul totale utilisée dans la province dépassera 50EFLOPS (EFLOPS fait référence à 10 milliards d'opérations à virgule flottante par seconde) et des technologies intelligentes. la puissance de calcul représentera plus de 45 % ; le Gansu propose de fournir un soutien politique à la nouvelle infrastructure de réseau informatique en termes d'utilisation des terres, de construction d'installations de soutien municipales, d'introduction de talents et de financement.

"Le développement explosif d'applications telles que les grands modèles d'intelligence artificielle a conduit à une augmentation de la demande de puissance de calcul intelligente." Shan Zhiguang, directeur du Département de l'informatisation et du développement industriel du Centre national d'information, a déclaré que l'informatique intelligente s'est développée rapidement. et est devenu celui qui connaît la croissance la plus rapide dans la structure de puissance de calcul de mon pays. Parmi eux, les grands modèles sont les plus grands demandeurs de puissance de calcul intelligente, représentant près de 60 % de la demande. On s’attend à ce que d’ici 2027, le taux de croissance annuel composé de la puissance de calcul intelligente de la Chine atteigne 33,9 %.