nouvelles

Investissement dans la construction de CITIC : les investissements dans les tendances mondiales de l'industrie de l'IA dépendent de la puissance de calcul. L'IA de bout en bout ouvre davantage de possibilités.

2024-07-18

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Zhitong Finance APP a appris que CITIC Construction Investment a publié un rapport de recherche indiquant que la puissance de calcul reste la force motrice fondamentale pour l'itération continue de grands modèles. Il existe trois axes principaux d'investissement dans la puissance de calcul. Le premier concerne les changements progressifs, tels que les connexions en cuivre, le refroidissement liquide, etc. ; le deuxième concerne les changements de partage, tels que le stockage, les PCB, l'alimentation électrique, etc. ; Il s'agit de savoir si la croissance des performances de Nvidia dépasse les attentes. Dans une certaine mesure, cela détermine la fourchette de valorisation de l'ensemble de la chaîne industrielle de la puissance de calcul.

CITIC Construction Investment a souligné que la tendance générale est que l’IA se déplace vers le côté terminal. Le système d'exploitation IA natif d'Apple et les applications créées par Apple Intelligence ouvrent la voie, et l'assistant IA côté PC de Microsoft accélère également, en prêtant attention à la vague de remplacement de bout en côté et à la mise à niveau de la DRAM, de l'informatique de confidentialité, de l'acoustique, de la batterie, de la chaleur. dissipation, et Arm PC et d’autres opportunités d’investissement.

Avec l'amélioration des capacités nationales des grands modèles, la baisse des prix d'appel et le soutien politique, CITIC Construction Investment estime que davantage d'applications d'IA seront progressivement mises en œuvre. Les robots de discussion côté C, les images Vincent et les applications vidéo Vincent sont progressivement acceptés. L’IA côté B a également commencé à être mise en œuvre dans les domaines de la finance, de l’industrie, de l’armée, des soins médicaux, de l’éducation et dans d’autres domaines.

Les principales opinions de CITIC Construction Investment sont les suivantes :

Dans l’attente de la seconde moitié des investissements dans l’IA, nous pensons qu’il existe deux principales orientations d’investissement :Le premier concerne les tendances industrielles mondiales, dont le cœur est la puissance de calcul ; le deuxième est la stimulation de la demande intérieure autour des politiques nationales, en particulier la combinaison de l’IA avec les industries du côté G et du côté B.

Il existe trois logiques d’investissement dans le domaine de la puissance de calcul : Premièrement, en se concentrant sur l'investissement dans des changements progressifs, le changement le plus important au cours du second semestre est le développement et la transition de la forme de serveur AI des 8 dernières cartes vers les armoires NVIDIA NVL36 et 72. L'intégration du coffret est plus élevée et constitue la principale. choix de nombreux grands fabricants. Parmi eux, les connexions en cuivre et le refroidissement liquide sont de nouveaux ajouts. Ils entreront dans une période de commandes intensives au second semestre de cette année et commenceront à catalyser les performances à partir du quatrième trimestre. part. Avec le débordement de commandes des principales entreprises, l'ensemble de la chaîne industrielle affiche un degré élevé de prospérité, la part de certaines entreprises a augmenté, en se concentrant sur le stockage, les PCB, l'alimentation électrique et d'autres secteurs, les fluctuations de valorisation ; le système mondial d'évaluation de la puissance de calcul de l'IA fait référence à NVIDIA, si la croissance des performances de NVIDIA dépasse les attentes, dans une certaine mesure, détermine l'ensemble de la chaîne d'évaluation de la chaîne industrielle de la puissance de calcul, basée sur le rythme d'expansion de TSMC Cowos, s'accélérera dans la seconde moitié du Nous sommes optimistes quant aux performances de Nvidia au second semestre, et sommes donc également optimistes quant au passage de l'ensemble du secteur à la valorisation de l'année prochaine. Dans le même temps, lors du Symposium européen sur la technologie en avril, TSMC a annoncé qu'il augmenterait la capacité de production de CoWoS à un taux de croissance annuel composé (TCAC) de plus de 60 % jusqu'en 2026 au moins. On peut voir que TSMC est optimiste quant à la demande globale d’IA.

La valeur des connexions en cuivre a considérablement augmenté et le volume augmentera au second semestre : 1) Croissance significative de l'utilisation : par rapport aux anciens serveurs à 8 cartes, qui utilisaient principalement des câbles PCIE, cette fois l'armoire NVL36/72 utilise des câbles PCIE non seulement dans le plateau informatique, mais également entre les plateaux informatiques, entre la puce de commutation et le fond de panier, et entre la puce de commutation et le fond de panier. Des câbles en cuivre haute vitesse sont utilisés pour connecter les ports d'E/S du panneau avant, et des connexions en cuivre haute vitesse peuvent également être utilisées pour interconnecter différentes armoires. 2) La chaîne industrielle ; commencera à augmenter en volume au second semestre : selon TrendForce, la nouvelle plateforme Blackwell entrera sur le marché au troisième trimestre, à partir du quatrième trimestre augmentera le volume. Pour l'année prochaine, la série Blackwell deviendra le principal produit de vente de NVIDIA et se présentera principalement sous la forme d'armoires. Pour les fabricants chinois, la principale opportunité pour les connexions en cuivre vient du débordement de commandes d'Amphénol. Compte tenu du volume global des expéditions d'armoires NVL36 et NVL72 l'année prochaine (l'équivalent NVL72 devrait être de 40 000 à 50 000 unités), seuls les câbles en cuivre à haut débit. dans les armoires Le marché à lui seul atteint 4,8 à 6 milliards de RMB Si l'on considère l'extérieur du comptoir, la taille du marché sera encore plus grande.

La demande de mémoire cloud est élevée : 1) La demande en centres de puissance de calcul est importante : la valeur de la mémoire vidéo représente une proportion élevée. La demande totale de HBM3e et LPDDR5x dans une armoire NVL72 est d'environ 207 400 dollars américains, soit environ 7 % de la valeur du NVL72. armoire ; 2) Demande d'équipement côté extrémité : à long terme, la demande d'équipement côté extrémité continuera d'augmenter et la mémoire du téléphone mobile AI de nouvelle génération est. devrait augmenter à 12-16 Go. Le cœur des opportunités d'investissement dans cette chaîne industrielle est constitué de deux points : 1) la part de HBM3e et les changements dans les fournisseurs de DRAM de 8 Go de téléphones mobiles Apple et de DRAM de nouvelle génération, en se concentrant sur Micron 2) Actuellement, pour les principaux fabricants de stockage, l'accent est mis sur ; conversion, et à l'avenir L'équilibre entre l'offre et la demande de stockage pourrait être rompu, ce qui entraînerait une poursuite de la hausse des prix du stockage.

Nouvelle mise à niveau de la solution d'alimentation : Le serveur adopte une conception intégrée en rack et utilise une alimentation externe unifiée pour optimiser davantage la gestion de l'alimentation et améliorer les performances globales et la fiabilité du système. Le NVL72 nécessite 6 étagères d'alimentation et une seule armoire nécessite une alimentation d'environ 200 kW. Le module DrMOS est l'unité d'alimentation spécifique du GPU, et la demande de modules DrMOS pour les puces de la série B continue d'augmenter. Les principaux fournisseurs sont Delta et Lite-On, et nous sommes attentifs aux progrès des fournisseurs continentaux.

Application complète du refroidissement liquide : À l'heure actuelle, le refroidissement liquide repose principalement sur des plaques de refroidissement et des types à immersion. Par rapport au refroidissement par air traditionnel, le refroidissement liquide présente trois avantages dans le contexte de l'augmentation de l'intensité de la puissance de calcul : 1) Les armoires de refroidissement liquide ont une limite supérieure de consommation d'énergie plus élevée et peuvent transporter 20 KW Les serveurs IA ci-dessus fonctionnent ; 2) la valeur PUE de la salle informatique refroidie par liquide est plus proche de 1, répondant aux dernières exigences politiques 3) la même exigence de puissance de calcul dans un contexte de faible PUE consomme moins d'énergie ; l'avantage à long terme en matière de coûts d'exploitation est significatif. Dans l’ensemble, l’augmentation du taux de pénétration du refroidissement liquide est une tendance inévitable à l’ère de la puissance de calcul très intensive.

Principales tendances d’investissement du côté de l’IA : Le premier est l'augmentation de la DRAM : pour un modèle avec 3 milliards de paramètres, l'utilisation de la mémoire calculée avec la précision Int 4 est d'environ 1,4 Go. Il est difficile pour une DRAM de 6 Go de prendre en charge de gros modèles d'IA. Actuellement, les seuls modèles pouvant prendre en charge ce grand modèle final sont les téléphones mobiles Apple équipés de 8 Go de DRAM. Nous pensons que si Apple met ultérieurement à niveau son modèle de bout en bout à 7 milliards de paramètres, l'utilisation de la mémoire atteindra 3 Go et il sera très difficile de prendre en charge les modèles existants de 8 Go à l'avenir, avec chaque génération de mises à niveau de téléphones mobiles. , la mise à niveau de la DRAM d'Apple sera encore plus importante. Côté Android, parmi la dernière série Pixel 8 de Google, seul le Pixel 8 Pro prend en charge l'exécution du grand modèle AI Gemini car il est équipé de 12 Go de DRAM. Le deuxième concerne les questions de sécurité et de confidentialité informatique : à l'avenir, les téléphones mobiles AIPC ou AI constitueront une base de connaissances locale. Il est crucial d'assurer la sécurité des informations personnelles. À l'avenir, les puces et les algorithmes de sécurité terminaux le seront également. mis à niveau. De plus, Apple Intelligence analysera si les requêtes envoyées par les utilisateurs peuvent être exécutées sur l'appareil. Si une puissance de calcul plus élevée est nécessaire, le cloud computing privé peut être utilisé pour envoyer uniquement les données liées aux tâches aux serveurs utilisant des puces Apple. À l'avenir, l'usine construira son propre centre de raisonnement cloud pour les services de téléphonie mobile. Le troisième est la mise à niveau de l'acoustique : l'interaction vocale sera une entrée importante dans l'ère de l'IA, et un point très important en fin de compte est la mise à niveau des dispositifs acoustiques. Quatrièmement, la batterie et la dissipation thermique ont considérablement changé : à mesure que la puissance de calcul de la puce d'extrémité augmente, la consommation d'énergie augmente, la batterie devient plus grande et les matériaux de dissipation thermique changent également. Le cinquième est de prêter attention aux changements dans la demande d'équipements d'inspection par vision industrielle provoqués par les nouveaux changements apportés au matériel de l'iPhone 17. Sixièmement, Arm PC : Avec plusieurs facteurs, notamment des capacités d’IA plus fortes, une durée de vie de la batterie plus longue, le support clé de Microsoft et l’accent mis par Qualcomm sur la création de puces PC, les principaux fabricants ont commencé à se concentrer sur le lancement d’Arm PC.

Tesla mène la révolution de bout en bout de la conduite autonome : Tesla FSD Beta V12.3 est la première version FSD à utiliser un réseau neuronal de bout en bout. Selon les dernières données de sécurité divulguées par Tesla, une fois la fonction FSD activée, les véhicules Tesla ne peuvent apparaître que tous les 5,39 millions de miles parcourus. Un accident est bien inférieur à la moyenne nationale d'un accident tous les 670 000 milles parcourus. Par rapport aux algorithmes précédents, les grands modèles présentent quatre caractéristiques et avantages importants : 1) Basé sur les données : dans le passé, la conduite autonome était définie par des règles écrites, mais elle est désormais pilotée par des données à chaque fois que vous regardez 1 à 1,5 million de clips vidéo. , l'effet sera évident Amélioration ; 2) Limite supérieure élevée : La capacité d'émergence des grands modèles se reflète actuellement également dans la conduite autonome, ce qui signifie que l'augmentation du nombre de paramètres peut résoudre certains comportements de conduite difficiles à résoudre dans la conduite autonome. processus dans le passé ; 3) La vitesse d'itération est accélérée : dans le passé, Tesla itère l'algorithme FSD presque toutes les deux semaines et met à jour la version tous les 2-3 jours à l'ère des grands modèles. 4) L'expérience de conduite est proche de celle-là ; des humains : la conduite autonome définie par des règles dans le passé était très rigide, mais l'expérience actuelle s'apparente davantage à la conduite humaine Feel, réduisant ainsi le nombre de reprises. Tesla a également annoncé une série de données pour FSD12.3. Le kilométrage moyen de prise de contrôle est passé de 116 milles à 286 milles, et la proportion de déplacements des utilisateurs sans prise de contrôle a augmenté de 47 % dans FSD V11.4 à 72 %. amélioré, les capacités de conduite assistée des voitures particulières ont été encore améliorées, en se concentrant sur Desay SV. Cependant, pour la conduite autonome de niveau L4, le kilométrage moyen de Tesla est encore loin derrière celui des humains. À l'heure actuelle, il n'est pas possible de réaliser pleinement la conduite autonome en s'appuyant uniquement sur l'intelligence d'un seul véhicule, et il faut prêter attention à la construction. de Chelu Cloud domestique.

Les applications d’IA permettent à des milliers d’industries : Un autre champ de bataille majeur pour l'application de grands modèles est celui de l'application industrielle. Le 26 mai, lors d'un symposium d'entreprises et d'experts organisé dans la province du Shandong, l'utilisation de la technologie pour transformer les industries traditionnelles a été soulignée. Deuxièmement, les bons du Trésor à très long terme seront également massivement investis dans des domaines tels que « l'autonomie et l'autonomie grâce à la science et à la technologie ». Dans le même temps, les « grandes lignes du plan stratégique pour l'expansion de la demande intérieure (2022-2035) » : mettre fermement en œuvre la stratégie d'expansion de la demande intérieure et cultiver un système complet de demande intérieure. Il se concentre également sur la promotion de l'intégration profonde de la 5G, de l'intelligence artificielle, du big data et d'autres technologies avec les transports et la logistique, l'énergie, la protection écologique de l'environnement, la conservation de l'eau, les interventions d'urgence, les services publics, etc., pour contribuer à améliorer les capacités de gouvernance des secteurs concernés. les industries. Nous pensons que l’IA commence à être mise en œuvre dans les domaines de la finance, de l’industrie, de l’éducation, des transports, de l’armée, de la médecine et dans d’autres domaines. Côté financier, les grands modèles sont progressivement devenus de meilleurs assistants de recherche en investissement, des humains virtuels de gestion de patrimoine, des bases de connaissances financières, etc. Du côté industriel, les grands modèles ont commencé à fournir une interaction homme-machine, des échantillons de génération AIGC, etc. dans la CAO et d'autres logiciels, en se concentrant sur la technologie de contrôle central. Dans le domaine des robots, l'intelligence des robots après avoir été connectés à de grands modèles a rapidement augmenté et ils ont commencé à remplacer les humains dans l'accomplissement de tâches simples dans les usines et autres scènes. Dans le domaine militaire, la société étrangère Palantir a utilisé avec succès de grands modèles comme assistants sur le champ de bataille. Dans le domaine de l’éducation, l’IA devient progressivement un enseignant virtuel dans davantage de matières. Dans le domaine des transports, la collaboration voiture-route-cloud impose des exigences plus élevées en matière d'infrastructure. Tout en permettant une gestion intelligente du trafic, elle peut réduire efficacement le coût des véhicules à conduite intelligente. Dans le domaine médical, dans le passé, l'IA elle-même a eu des applications relativement approfondies (modèles traditionnels) dans des domaines tels que l'imagerie médicale et la recherche et le développement de nouveaux médicaments. L'émergence de modèles génératifs a encore approfondi le développement de l'IA dans les domaines ci-dessus. Cependant, dans l'ensemble, l'orientation de la recherche et du développement à l'étranger est plus biaisée pour les produits pharmaceutiques, l'orientation nationale de la recherche et du développement est davantage axée sur la gestion de la santé, et les orientations d'application des deux sont différentes en fonction de l'efficacité du grand modèle.

avertissement de risque

La récession économique nord-américaine devrait s'aggraver progressivement et il existe une grande incertitude dans l'environnement macroéconomique. Les changements dans l'environnement international affectent la chaîne d'approvisionnement et les pénuries de puces à l'étranger peuvent affecter la production et la livraison normales des entreprises concernées, ainsi que leurs expéditions. sont inférieurs aux prévisions ; informatisation et numérisation La demande et les dépenses en capital sont inférieures aux prévisions ; la concurrence sur le marché s'est intensifiée, entraînant une baisse rapide des marges bénéficiaires brutes ; les fluctuations des taux affectent les bénéfices de change et les marges bénéficiaires brutes des entreprises orientées vers l'exportation ; les itérations de mise à jour des algorithmes des grands modèles ne sont pas aussi efficaces que prévu et peuvent affecter l'évolution et l'expansion des grands modèles, ce qui à son tour affectera leur commercialisation ; et l’intelligence industrielle n’est pas celle attendue.