nouvelles

cinq questions sur la situation actuelle des centres de calcul intelligents ia|enquête sur l'industrie

2024-10-02

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

financial associated press, 2 octobre (reporter fu jing)l'échelle des paramètres des grands modèles continue d'augmenter, ce qui impose des exigences plus élevées à l'infrastructure de puissance de calcul de l'ia. l'industrie informatique de l'ia est actuellement en plein essor et la construction de centres de calcul intelligents s'accélère. les dernières données montrent qu'en juin de cette année, le nombre total de racks de centres de puissance de calcul utilisés dans tout le pays dépassait 8,3 millions de racks standard, avec une échelle de puissance de calcul de 246 eflops (fp32) et un taux de croissance d'une année sur l'autre de informatique intelligente dépassant 65 %.

quel est le prix et la pénurie des cartes informatiques du côté de l’offre à ce stade ? l’offre correspond-elle à la demande ? les centaines de centres informatiques intelligents du pays fonctionnent-ils à pleine capacité ? quand le coût de construction d’un centre de calcul intelligent sera-t-il remboursé ? comment la puissance de calcul de l’intelligence artificielle peut-elle permettre un développement de haute qualité ? en se concentrant sur les cinq questions fondamentales, les journalistes du financial associated press ont interviewé de nombreuses personnalités du secteur.

selon un journaliste du financial associated press, la pénurie précédente de puissance de calcul de l'ia s'est atténuée, mais l'offre et la demande ne correspondent pas complètement, ce qui entraîne de faibles taux d'utilisation de certains centres de calcul intelligents. bien que les gouvernements locaux et les entreprises envisagent souvent de créer des centres de calcul intelligents, le nombre qui peut réellement être utilisé pourrait être inférieur aux prévisions. certains praticiens prédisent que certains centres de calcul intelligents seront capables de « recouvrer leurs coûts » d'ici trois à quatre ans environ. dans le même temps, le développement de haute qualité de la puissance de calcul est également apprécié par l'industrie.

le prix calculé de la carte est proche de la ligne de coût du vendeur

« l'offre limitée de puissance de calcul est en effet un phénomène relativement courant ces dernières années. de nombreuses personnes se précipitent pour acheter des produits dotés d'une bonne puissance de calcul et d'une bonne adaptabilité écologique. du point de vue des utilisateurs, ils espèrent bien sûr que la puissance de calcul intelligente pourra mieux prendre en charge. applications." du point de vue d'un fournisseur de serveurs informatiques, zhang dong, scientifique en chef d'inspur yunhai, a déclaré dans une interview avec un journaliste de financial associated press.

zhang dong a déclaré aux journalistes que la pénurie d'informatique intelligente est cyclique.

quelle est la situation actuelle du côté de l’offre ? zhang yazhou, président du shanghai liuchi technology group et directeur général de shanghai runliuchi technology co., ltd., une filiale de hengrun co., ltd. (603985.sh), a déclaré aux journalistes du financial associated press : « il existe une offre de puissance de calcul sur le marché cette année, contrairement à l'année dernière où il y avait une pénurie. très bien, les prix actuels des diverses cartes informatiques sont proches de la ligne de coûts des vendeurs. maintenant, de nombreuses personnes sont impliquées dans divers projets dans l'industrie. et il y a aussi de nombreux intermédiaires. tous ceux qui fabriquaient autrefois des ordinateurs et des équipements, ainsi que l'industrie de la communication tic, sont impliqués. mais en réalité, peu d'entre eux réussissent réellement.

récemment, certains acteurs transfrontaliers de l'informatique intelligente en actions a ont révélé des pressions, tels que : lotus purple star, une filiale de lotus holdings (600186.sh), a signé des contrats de services de puissance de calcul.il peut exister un risque que le recouvrement effectif des coûts de passation des marchés prenne plus de temps que prévu ou ne soit pas recouvrable., en août de cette année, lotus purple star est toujours en perte et il y a une incertitude quant à sa capacité à réaliser des bénéfices tout au long de l'année ; altron engine, une filiale en propriété exclusive d'oya holdings (300949.sz), a négocié avec son fournisseur runxin supply chain pour signer le « plan de calcul ». conformément à l'« accord complémentaire au contrat d'approvisionnement en serveurs power », le nombre initialement prévu de 128 serveurs de calcul hautes performances équipés de puces gpu nvidia intégrées a été modifié à 8.

selon l'observation de zhang yazhou, de juin à août de cette année, les prix des terminaux gpu ont continué de baisser. « les projets de l'année dernière ont tous été digérés au premier semestre de cette année. les projets réalisés cette année se trouvent dans deux situations principales : premièrement, la recherche et le développement des entreprises ont réellement besoin de puissance de calcul, qui est principalement concentrée dans les grandes sociétés internet. , certaines régions ont reçu des subventions et des quotas énergétiques en attendant de soutenir la construction d'un centre informatique intelligent.

il est entendu que le marché n'a connu qu'une vague de « produits de balayage » en septembre, « principalement en raison de la saison hors pointe et de l'environnement international, mais en fait, il n'y a pas beaucoup de ressources ponctuelles sur le marché ».

le journaliste a également appris d'un initié de l'industrie que "le prix de la 4090 est passé de plus de 13 000 à 16 700". cependant, il est dit que l'augmentation des prix est principalement due à la demande relativement forte pour cette carte graphique en "noir". mythe : wukong". puissant.

en outre, zhang yazhou a déclaré que le marché présente toujours un phénomène de fragmentation de l'alimentation informatique : certains fournisseurs « ne peuvent avoir que 5 ou 10 serveurs, et les plus grands en ont 64 ou plus de 100 serveurs, et il y a fondamentalement très peu de gros volumes ». ceux-ci. nous pouvons entreprendre des commandes lâches auprès des laboratoires et des écoles.

l’offre et la demande ne correspondent pas exactement

plusieurs praticiens ont déclaré aux journalistes du financial associated press que l'atténuation de la pénurie d'approvisionnement ne signifie pas que la demande d'informatique intelligente est inférieure aux prévisions. zhang yazhou a déclaré que la demande d'informatique intelligente est croissante et que de nouvelles demandes sont constamment générées, mais que la demande actuelle est devenue plus rationnelle.

fan congming, président exécutif de l'association de l'industrie de l'intelligence artificielle de shenzhen, a parlé de la situation actuelle des différents types de parties à la demande dans une interview avec un journaliste de l'associated press : les grandes entreprises et les universités de recherche scientifique disposent de ressources de puissance de calcul suffisantes, tandis que les grandes entreprises et les universités de recherche scientifique disposent de ressources de puissance de calcul suffisantes. des modèles verticaux industriels à grande échelle sont actuellement développés en grande quantité, et les petites, moyennes et micro-entreprises manquent de puissance de calcul.

il convient de noter que la construction de centres de calcul intelligents bat son plein et que les projets d'appels d'offres associés se multiplient de mois en mois.

précédemment rapporté par digital intelligence frontier, selon des statistiques incomplètes, au cours des seuls 7 premiers mois de cette année, plus de 140 appels d'offres pour des projets liés aux centres de calcul intelligents ont été publiés, dont au moins 24 projets axés sur tous les aspects de la construction. tels que les infrastructures civiles et les infrastructures informatiques. le montant de l'offre gagnante a dépassé 100 millions de yuans ; plus de 40 projets gagnants connexes ont été annoncés au niveau national en juillet ;

guo liang, ingénieur en chef de l'institut de recherche sur le cloud computing et le big data de l'académie chinoise des technologies de l'information et des communications, a déclaré dans une interview avec un journaliste de l'associated press of finance lors de la « 2024 china computing power conference » qui vient de se terminer : « de nombreux centres de calcul intelligents ont été construits à travers le pays. selon des statistiques complètes, il devrait y en avoir plus de 200, mais 90 % d'entre eux ont une puissance de calcul inférieure à 1 000p, ce qui signifie que ces centres de puissance de calcul sont d'une utilité limitée pour la formation de grands modèles. , et leur efficacité d’utilisation future est discutable.

"la demande en puissance de calcul est énorme, mais les types existants ne peuvent pas répondre aux besoins des utilisateurs. tant en termes d'adaptation que de rentabilité, ils ne peuvent pas répondre aux attentes des clients." presse associée.

zhang yazhou estime également qu'il existe actuellement une situation dans laquelle l'offre de puissance de calcul et la demande ne correspondent pas complètement. « les demandeurs du côté b recherchent généralement des unités qu'ils connaissent. il peut y avoir des dizaines de personnes qui viennent se renseigner sur un. en fait, ils ne peuvent contacter le côté projet. » les transactions ne sont possibles que si la relation de coopération est bonne ou si la force globale est relativement reconnue, et cela ne signifie pas nécessairement que la transaction est au prix le plus bas.

la puissance de calcul inutilisée est-elle courante ?

un journaliste de l'associated press a noté qu'à ce stade, la question de savoir si les équipements de puissance de calcul fonctionnent à pleine capacité est devenue le centre d'attention du marché.

« maintenant, une grande partie de la puissance de calcul a été absorbée, mais il existe effectivement une petite quantité de puissance de calcul inutilisée dans l'industrie. par exemple, il peut y avoir un millier de machines disponibles sur le marché, mais il peut y avoir des centaines de machines inactives. ", a déclaré zhang yazhou au journaliste de l'associated press.

selon l'observation de guo liang, la puissance de calcul inutilisée n'est pas un phénomène courant. « notre équipe soutient des travaux connexes dans de nombreuses provinces et villes. dans un avenir proche, à notre connaissance, le taux d'utilisation du centre de puissance de calcul du ningxia est encore très élevé. ".

il est désormais plus courant de vendre en ligne de la puissance informatique en mongolie intérieure, au tibet et au xinjiang pour la louer en temps partagé à bas prix. cela entraînera de faibles taux d'utilisation des centres informatiques intelligents construits dans le guangdong et ailleurs." fan congming a déclaré aux journalistes.

parlant du centre de calcul intelligent du ningxia, guo liang a analysé que même si le prix global de l'électricité local n'est actuellement pas subventionné, il présente néanmoins des avantages : le centre de calcul intelligent local a une plus grande puissance de calcul et est plus utile pour la formation de grands modèles. "de plus, pour l'informatique intelligente, les exigences de performances pour la transmission réseau ne sont pas si strictes et les données peuvent être entièrement traitées hors ligne. il s'agit d'un meilleur scénario d'application pour les centres informatiques intelligents du centre et de l'ouest de mon pays."

« à en juger par le degré de digestion de la puissance de calcul au début de la construction, les grandes entreprises devraient représenter 80 %, les universités de recherche scientifique devraient représenter environ 30 à 40 % et le degré de digestion de la puissance de calcul pour la construction orientée vers le marché devrait être environ la moitié", a déclaré fan congming aux journalistes.

selon l'observation de fan congming, des entreprises de premier plan telles que byte, tencent, huawei et baidu « forment en permanence de grands modèles. plus la quantité de données est importante, plus la demande de puissance de calcul est élevée, et il n'y a presque pas de puissance de calcul inutilisée ». la puissance de calcul des universités de recherche scientifique « a été construite « grande, moins utilisée », puissance de calcul relativement plus inutilisée ; la puissance de calcul inutilisée dans les petites et moyennes entreprises est relativement courante. en raison d'un positionnement peu clair, d'un emplacement éloigné et d'un prix élevé, la puissance de calcul absorbée au début de la construction n'est pas suffisante. "

du yunlong estime que l'inactivité de la puissance de calcul dépend principalement de plusieurs aspects : la mobilisation de la puissance de calcul par les logiciels de couche supérieure, la méthode d'interconnexion entre le matériel, l'adaptation des installations matérielles aux scénarios d'application et les coûts de déploiement des utilisateurs.

début septembre, sha kaibo, vice-président de tencent cloud, a également évoqué le phénomène selon lequel même si le centre de calcul intelligent dispose de ressources matérielles, il manque toujours de capacités logicielles de support, de clients finaux réels ou de scénarios d'application dans une interview avec un journaliste de financial associated. presse.

zhang yazhou a déclaré que les raisons de la puissance de calcul inutilisée sont complexes et liées aux performances de diverses cartes informatiques intelligentes, au fonctionnement des parties au projet et aux capacités de service technique des produits réseau. l'objectif principal de l'industrie est de savoir s'il existe réellement. produits du côté de l'application.

combien d’années faudra-t-il pour amortir le coût de construction d’un centre de calcul intelligent ?

la puissance de calcul inutilisée a entraîné des coûts excessifs dans certains centres de calcul intelligents, ce qui constitue l'une des préoccupations courantes du secteur.

à cet égard, fan congming estime que le prix de fourniture des centres informatiques intelligents est trop élevé et que les utilisateurs ne peuvent pas se le permettre, ce qui entraîne une continuité informatique insuffisante dans les centres informatiques intelligents et des coûts excessifs.

parlant du fonctionnement du centre de calcul intelligent, guo liang a déclaré aux journalistes de financial associated press lors de la « 2024 china computing power conference » : « récemment, vous verrez souvent des informations sur la plate-forme de planification de la puissance de calcul à diverses occasions, mais qu'en sera-t-il ? quel sera l'effet après sa construction ? comme ? il est entendu que certains endroits ont investi des dizaines de millions pour construire des plates-formes, mais en raison de problèmes tels que les concepts de conception et les caractéristiques fonctionnelles, elles n'ont pas été bien utilisées dans le fonctionnement global de notre pays. un centre informatique intelligent est particulièrement important.

il a ajouté : « pour l'informatique intelligente, même les investissements gouvernementaux ont besoin de retours, sans parler des entreprises. aujourd'hui, l'industrie est effectivement dans une situation de conflits entre héros, mais il n'y a pas de rôle unifié. bien sûr, nous travaillons également dur. cette fois la china computing service platform (henan) lancée lors de la computing power conference est une solution que nous avons lancée.

(photographié par un journaliste de financial associated press lors de la china computing power conference 2024)

concernant la façon dont les centres informatiques intelligents équilibrent les coûts et les performances, fan congming a déclaré à un journaliste de l'associated press : « la période de récupération de l'investissement en puissance de calcul est généralement d'environ cinq ans, car le marché de la puissance de calcul évolue très rapidement et d'autres coûts tels que les factures d'électricité et les opérations doivent être ajoutées. si c’est possible, s’il est utilisé par un grand fabricant, je pense que le temps de retour sur investissement sera d’environ trois à quatre ans.

du yunlong estime que les opérateurs de centres informatiques intelligents devraient formuler des plans à long terme pour réduire les coûts d'utilisation des utilisateurs finaux, cultiver les habitudes d'utilisation et reprendre les tarifs à l'avenir, se concentrer sur la culture des cas d'application et étendre progressivement la couverture industrielle.

quelle est l’explication du passage de la « quantité » à la « qualité » ?

objectivement parlant, le développement de la puissance de calcul de la chine a encore un long chemin à parcourir.

le « china computing power development report (2024) » publié par la china computing power conference 2024 montre qu'à la fin de l'année dernière, le marché mondial de l'informatique intelligente avait connu une croissance de plus de 130 % sur un an, tandis que les chinois le marché de l'informatique intelligente a connu une croissance de plus de 60 % sur un an.

un journaliste de l'associated press a remarqué qu'au milieu du boom de la construction de puissance de calcul, certains praticiens partageaient de nombreuses « pensées froides » lors des conférences mentionnées ci-dessus et se concentraient sur une puissance de calcul de haute qualité.

le premier système d'évaluation de la puissance de calcul de haute qualité du secteur, « rapport sur le système d'évaluation du développement de haute qualité de la puissance de calcul de l'intelligence artificielle » publié par inspur information (000977.sz) et l'académie des technologies de l'information et des communications, a déclaré que la puissance de calcul de haute qualité est basée sur la dernière théorie de l'intelligence artificielle et utilise une architecture informatique avancée de l'intelligence artificielle, des capacités informatiques de haut niveau combinées à des algorithmes et à la profondeur des données.

un journaliste d'associated press a appris d'inspur information que l'écart entre les performances mesurées et les performances théoriques du cluster de puissance de calcul actuel est trop grand. les performances réelles de certaines puissances de calcul sont inférieures à 10 % des performances théoriques. les données publiques montrent que le taux d'utilisation moyen des gpu des centres de calcul intelligents en mode traditionnel est inférieur à 30 %.

zhang dong estime que l'attention portée à la puissance de calcul ne peut pas se concentrer uniquement sur les puces. « de nombreux endroits achètent de la puissance de calcul, nomment les marques de puces et construisent un centre de calcul à grande échelle. il faut examiner la perspective du système et réfléchir de manière globale à la manière de répondre aux besoins de l’application.

guo liang a également déclaré : « actuellement, nous n'avons pas beaucoup de choix au niveau des puces. mais l'intégration de l'informatique et du réseau est un point chaud. l'objectif est d'étendre un serveur ia des 8 cartes actuelles à 32 cartes ou 512 cartes. cela sera bénéfique pour les capacités des clusters informatiques intelligents, y compris le déploiement, le lancement, l’exploitation et la maintenance des clusters.

les journalistes d'associated press ont appris lors de plusieurs entretiens que la mise en œuvre de l'informatique intelligente à grande échelle n'est en aucun cas un simple empilement d'échelles et de quantités. sa complexité augmente de façon exponentielle, ce qui impose des exigences élevées en matière de force technique, d'avantages en matière de ressources et de collaboration industrielle. capacités des opérateurs de construction informatique intelligente.

quant à la façon dont le centre informatique intelligent peut passer de la « quantité » à la « qualité », guo liang a déclaré : « la construction d'un centre informatique intelligent nécessite une « avancée modérée » ainsi qu'une analyse et une prévision globales basées sur les besoins locaux réels.

(fu jing, journaliste à financial associated press)
rapport/commentaires