Nachricht

CITIC-Bauinvestitionen: Globale Investitionen in die KI-Branche hängen von der Rechenleistung ab. Endseitige KI eröffnet mehr Möglichkeiten

2024-07-18

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Zhitong Finance APP erfuhr, dass CITIC Construction Investment einen Forschungsbericht veröffentlicht hat, in dem es heißt, dass Rechenleistung immer noch die grundlegende treibende Kraft für die kontinuierliche Iteration großer Modelle ist. Bei der ersten Investition geht es um inkrementelle Änderungen, wie z. B. Kupferverbindungen, Flüssigkeitskühlung usw.; bei der zweiten handelt es sich um Anteilsänderungen, wie z. B. Speicher, PCB, Stromversorgung usw.; Es geht darum, ob das Leistungswachstum von Nvidia die Erwartungen übertrifft. Es bestimmt in gewissem Maße die Bewertungsspanne der gesamten Rechenleistungsbranche.

CITIC Construction Investment wies darauf hin, dass der allgemeine Trend besteht, dass sich die KI in Richtung Terminal verlagert. Apples natives KI-Betriebssystem und die von Apple Intelligence erstellten Anwendungen sind wegweisend, und auch der PC-seitige KI-Assistent von Microsoft beschleunigt sich, wobei er auf die Welle des End-to-Side-Austauschs und die Aufrüstung von DRAM, Privacy Computing, Akustik, Akku und Hitze achtet Verlustleistung und Arm PC und andere Investitionsmöglichkeiten.

CITIC Construction Investment geht davon aus, dass mit der Verbesserung der Fähigkeiten inländischer Großmodelle, dem Rückgang der Anrufpreise und der politischen Unterstützung nach und nach mehr KI-Anwendungen implementiert werden. C-seitige Chatroboter, Vincent-Bilder und Vincent-Videoanwendungen werden nach und nach akzeptiert. B-seitige KI wird auch in den Bereichen Finanzen, Industrie, Militär, medizinische Versorgung, Bildung und anderen Bereichen eingesetzt.

Die wichtigsten Ansichten von CITIC Construction Investment sind wie folgt:

Mit Blick auf die zweite Hälfte der KI-Investitionen glauben wir, dass es zwei Hauptinvestitionsrichtungen gibt:Das erste sind globale Branchentrends, deren Kern die Rechenleistung ist; das zweite ist die Stimulierung der Inlandsnachfrage rund um die Inlandspolitik, insbesondere die Kombination von KI mit G-Side- und B-Side-Industrien.

Im Bereich Rechenleistung gibt es drei Investitionslogiken: Erstens konzentriert man sich auf Investitionen in inkrementelle Änderungen. Die wichtigste Änderung in der zweiten Jahreshälfte ist die Entwicklung und Umstellung der KI-Serverform von den bisherigen 8-Karten auf NVIDIA NVL36- und 72-Gehäuse. Die Gehäuseintegration ist höher und die wichtigste Die Auswahl vieler großer Hersteller ist neu. Sie werden in der zweiten Jahreshälfte in eine Phase intensiver Bestellungen eintreten und sich ab dem vierten Quartal auf die Entwicklung konzentrieren Mit dem Überfluss an Bestellungen von führenden Unternehmen zeigt die gesamte Industriekette einen hohen Grad an Wohlstand, der sich auf Speicher, Leiterplatten, Stromversorgung und andere Sektoren konzentriert Das globale Bewertungssystem für KI-Rechenleistung bezieht sich auf NVIDIA. Ob das Leistungswachstum von NVIDIA die Erwartungen übertrifft, bestimmt bis zu einem gewissen Grad die gesamte Bewertungsspanne der Rechenleistungsindustriekette, basierend auf dem Cowos-Expansionstempo von TSMC, wird sich in der zweiten Hälfte des Jahres beschleunigen Wir sind optimistisch, was die Leistung von Nvidia in der zweiten Jahreshälfte angeht, und sind daher auch optimistisch, was die Umstellung der gesamten Branche auf die Bewertung des nächsten Jahres angeht. Gleichzeitig gab TSMC auf dem Europäischen Technologiesymposium im April bekannt, dass es die CoWoS-Produktionskapazität bis mindestens 2026 mit einer durchschnittlichen jährlichen Wachstumsrate (CAGR) von mehr als 60 % erweitern wird. Es zeigt sich, dass TSMC hinsichtlich der Gesamtnachfrage nach KI optimistisch ist.

Der Wert von Kupferanschlüssen ist deutlich gestiegen und das Volumen wird in der zweiten Jahreshälfte zunehmen: 1) Erheblicher Anstieg der Nutzung: Im Vergleich zu früheren 8-Karten-Servern, die hauptsächlich PCIE-Kabel verwendeten, verwendet das NVL36/72-Gehäuse dieses Mal PCIE-Kabel nicht nur im Computerfach, sondern auch zwischen den Computerfächern und zwischen dem Switching-Chip und der Rückwandplatine sowie zwischen dem Switching-Chip und der Rückwandplatine werden Hochgeschwindigkeits-Kupferkabel verwendet, um die I/O-Ports auf der Vorderseite zu verbinden, und Hochgeschwindigkeits-Kupferverbindungen können auch zur Verbindung verschiedener Schränke verwendet werden. 2) Die Industriekette In der zweiten Jahreshälfte wird das Volumen steigen: Laut TrendForce wird die neue Plattform Blackwell im dritten Quartal auf den Markt kommen und ab dem vierten Quartal das Volumen erhöhen. Mit Blick auf das nächste Jahr wird die Blackwell-Serie das Hauptverkaufsprodukt von NVIDIA werden und hauptsächlich in Form von Gehäusen erhältlich sein. Für chinesische Hersteller ergibt sich die größte Chance für Kupferverbindungen aus dem Überfluss an Bestellungen von Amphenol. Wenn man bedenkt, dass es im nächsten Jahr nur Hochgeschwindigkeits-Kupferkabel geben wird (entsprechende NVL72-Schränke werden voraussichtlich 40.000 bis 50.000 Einheiten betragen). in den Schränken Allein der Markt erreicht RMB 4,8-6 Milliarden.

Der Cloud-Speicherbedarf ist auf hohem Niveau: 1) Der Bedarf an Rechenleistungszentren ist groß: Der Wert des Videospeichers macht einen hohen Anteil aus. Der Gesamtbedarf für HBM3e und LPDDR5x in einem NVL72-Gehäuse beträgt etwa 207.400 US-Dollar, was etwa 7 % des Wertes des NVL72 ausmacht Schrank; 2) Nachfrage nach Endgeräten: Langfristig wird die Nachfrage nach Endgeräten weiter zunehmen, und der Speicher wird weiter zunehmen voraussichtlich auf 12-16 GB ansteigen. Der Kern der Investitionsmöglichkeiten in dieser Industriekette besteht aus zwei Punkten: 1) HBM3e-Anteil und Änderungen bei Apple-Mobiltelefon-8-GB-DRAM- und DRAM-Anbietern der nächsten Generation mit Schwerpunkt auf Micron. 2) Derzeit liegt der Schwerpunkt bei großen Speicherherstellern auf; Umstellung und in Zukunft könnte das Gleichgewicht zwischen Speicherangebot und -nachfrage gestört werden, was zu einem weiteren Anstieg der Speicherpreise führen würde.

Neues Upgrade der Stromversorgungslösung: Der Server verfügt über ein Rack-integriertes Design und nutzt eine externe einheitliche Stromversorgung, um das Energiemanagement weiter zu optimieren und die Gesamtleistung und Zuverlässigkeit des Systems zu verbessern. NVL72 erfordert 6 Stromeinschübe und ein einzelner Schrank erfordert eine Stromversorgung von etwa 200 kW. Das DrMOS-Modul ist die spezifische Stromversorgungseinheit der GPU, und die Nachfrage nach DrMOS-Modulen für Chips der B-Serie steigt weiter. Die Hauptlieferanten sind Delta und Lite-On, und wir achten auf die Fortschritte der Lieferanten auf dem Festland.

Umfassende Anwendung der Flüssigkeitskühlung: Derzeit basiert die Flüssigkeitskühlung hauptsächlich auf Kühlplatten und Tauchtypen. Im Vergleich zur herkömmlichen Luftkühlung hat die Flüssigkeitskühlung im Zusammenhang mit der zunehmenden Rechenleistungsintensität drei Vorteile: 1) Flüssigkeitskühlschränke haben eine höhere Leistungsaufnahmeobergrenze und können tragen 20 KW Die oben genannten KI-Server laufen; 2) der PUE-Wert des flüssigkeitsgekühlten Computerraums liegt näher bei 1, was den neuesten Richtlinienanforderungen entspricht; 3) der gleiche Rechenleistungsbedarf verbraucht bei niedrigem PUE weniger Strom; Der langfristige Betriebskostenvorteil ist erheblich. Insgesamt ist die Steigerung der Durchdringungsrate der Flüssigkeitskühlung im Zeitalter hochintensiver Rechenleistung ein unvermeidlicher Trend.

Wichtigste Investitionstrends auf der KI-Seite: Der erste ist die Erhöhung des DRAM: Bei einem Modell mit 3 Milliarden Parametern beträgt die mit Int 4-Präzision berechnete Speichernutzung etwa 1,4 GB. Für 6 GB DRAM ist es schwierig, große KI-Modelle zu unterstützen. Derzeit sind die einzigen Modelle, die dieses große End-Side-Modell unterstützen können, Apple-Mobiltelefone, die mit 8 GB DRAM ausgestattet sind. Wir glauben, dass, wenn Apple sein End-to-End-Modell später auf 7 Milliarden Parameter aktualisiert, die Speichernutzung 3 GB erreichen wird und es in Zukunft mit jeder Generation von Mobiltelefon-Upgrades sehr schwierig sein wird, die bestehenden 8-GB-Modelle zu unterstützen , Apples DRAM-Upgrade wird noch schneller sein. Auf der Android-Seite unterstützt von Googles neuester Pixel-8-Serie nur das Pixel 8 Pro den Betrieb des AI-Großmodells Gemini, da es mit 12 GB DRAM ausgestattet ist. Der zweite Punkt betrifft Sicherheitsfragen und Datenschutz-Computing: Künftig werden AIPC- oder KI-Mobiltelefone eine lokale Wissensbasis bilden. In Zukunft werden auch endseitige Sicherheitschips und Algorithmen von entscheidender Bedeutung sein aufgewertet. Darüber hinaus analysiert Apple Intelligence, ob von Benutzern gesendete Anfragen auf dem Gerät ausgeführt werden können. Bei einigen Mobiltelefonen kann privates Cloud-Computing verwendet werden, um nur aufgabenbezogene Daten an Server zu senden Künftig wird die Fabrik ein eigenes Cloud-Argumentationszentrum für Mobilfunkdienste aufbauen. Der dritte Punkt ist die Aufrüstung der Akustik: Die Sprachinteraktion wird ein wichtiger Einstieg in die KI-Ära sein, und ein sehr wichtiger Punkt am Ende ist die Aufrüstung akustischer Geräte. Viertens haben sich die Batterie und die Wärmeableitung erheblich verändert: Mit zunehmender Rechenleistung des endseitigen Chips steigt der Stromverbrauch, die Batterie wird größer und auch die Wärmeableitungsmaterialien ändern sich. Die fünfte besteht darin, auf die veränderte Nachfrage nach Inspektionsgeräten für die maschinelle Bildverarbeitung zu achten, die durch die neuen Änderungen in der iPhone 17-Hardware verursacht werden. Sechstens, Arm PC: Aufgrund mehrerer Faktoren, darunter stärkere KI-Fähigkeiten, längere Akkulaufzeit, Microsofts wichtiger Support und Qualcomms Fokus auf die Entwicklung von PC-Chips, haben große Hersteller begonnen, sich auf die Einführung von Arm PC zu konzentrieren.

Tesla führt die End-to-End-Revolution im autonomen Fahren an: Tesla FSD Beta V12.3 ist die erste FSD-Version, die ein durchgängiges neuronales Netzwerk verwendet. Den neuesten von Tesla veröffentlichten Sicherheitsdaten zufolge dürfen Tesla-Fahrzeuge nach Aktivierung der FSD-Funktion nur alle 5,39 Millionen gefahrenen Meilen auftreten . Ein Unfall liegt weit unter dem nationalen Durchschnitt von einem Unfall pro 670.000 gefahrenen Meilen. Im Vergleich zu früheren Algorithmen weisen große Modelle vier wichtige Merkmale und Vorteile auf: 1) Datengesteuert: In der Vergangenheit wurde autonomes Fahren durch das Schreiben von Regeln definiert, aber jetzt wird es durch Daten gesteuert. Jedes Mal, wenn Sie 1–1,5 Millionen Videoclips ansehen , der Effekt wird offensichtlich sein Verbesserung; 2) Hohe Obergrenze: Die Emergenzfähigkeit großer Modelle spiegelt sich derzeit auch im autonomen Fahren wider, was bedeutet, dass eine Erhöhung der Anzahl von Parametern einige Fahrverhaltensweisen lösen kann, die beim autonomen Fahren schwer zu lösen waren Prozess in der Vergangenheit; 3) Die Iterationsgeschwindigkeit wird beschleunigt: In der Vergangenheit iteriert Tesla den FSD-Algorithmus fast alle zwei Wochen und aktualisiert die Version im Zeitalter der großen Modelle alle 2-3 Tage von Menschen: Autonomes Fahren war in der Vergangenheit sehr starr, aber das aktuelle Fahrerlebnis ähnelt eher dem menschlichen Fahrgefühl, wodurch die Anzahl der Übernahmen verringert wird. Tesla gab außerdem eine Reihe von Daten für FSD12.3 bekannt. Die durchschnittliche Übernahmekilometerzahl stieg von 116 Meilen auf 286 Meilen, und der Anteil der Benutzerfahrten ohne Übernahme stieg von 47 % in FSD V11.4. Der Effekt war erheblich verbessert, die assistierten Fahrfähigkeiten von Personenkraftwagen wurden weiter verbessert, wobei der Schwerpunkt auf Desay SV liegt. Beim autonomen Fahren auf L4-Niveau liegt die durchschnittliche Übernahmeleistung von Tesla jedoch immer noch weit hinter der des Menschen. Derzeit ist es nicht möglich, autonomes Fahren allein durch die Intelligenz eines einzelnen Fahrzeugs vollständig zu realisieren, und der Konstruktion muss Aufmerksamkeit geschenkt werden der heimischen Chelu Cloud.

KI-Anwendungen unterstützen Tausende von Branchen: Ein weiteres wichtiges Schlachtfeld für die Anwendung großer Modelle ist die Anwendung in der Industrie. Am 26. Mai wurde auf einem Symposium von Unternehmen und Experten in der Provinz Shandong der Einsatz von Technologie zur Transformation traditioneller Industrien hervorgehoben. Zweitens werden auch extrem langfristige Staatsanleihen stark in Bereiche wie „Eigenständigkeit und Eigenständigkeit durch Wissenschaft und Technologie“ investiert. Gleichzeitig lautet der „Entwurf des strategischen Plans zur Ausweitung der Inlandsnachfrage (2022–2035)“: Die Strategie zur Ausweitung der Inlandsnachfrage konsequent umsetzen und ein vollständiges Inlandsnachfragesystem kultivieren. Der Schwerpunkt liegt auch auf der Förderung der umfassenden Integration von 5G, künstlicher Intelligenz, Big Data und anderen Technologien mit Transport und Logistik, Energie, ökologischem Umweltschutz, Wasserschutz, Notfallmaßnahmen, öffentlichen Diensten usw., um die Governance-Fähigkeiten der damit verbundenen Technologien zu verbessern Branchen. Wir glauben, dass die Einführung von KI in den Bereichen Finanzen, Industrie, Bildung, Transport, Militär, Medizin und anderen Bereichen beginnt. Auf der Finanzseite haben sich große Modelle nach und nach zu besseren Assistenten für die Anlageforschung, virtuellen Menschen für die Vermögensverwaltung, Finanzwissensdatenbanken usw. entwickelt. Auf der industriellen Seite haben große Modelle damit begonnen, Mensch-Computer-Interaktion, AIGC-Generierungsmuster usw. in CAD und anderer Software bereitzustellen, wobei der Schwerpunkt auf zentraler Steuerungstechnologie liegt. Im Bereich der Roboter hat die Intelligenz von Robotern nach der Verbindung mit großen Modellen rapide zugenommen und sie haben begonnen, Menschen bei der Erledigung einfacher Aufgaben in Fabriken und anderen Szenen zu ersetzen. Im militärischen Bereich hat das ausländische Unternehmen Palantir erfolgreich große Modelle als Gefechtsfeldassistenten auf dem Schlachtfeld eingesetzt. Im Bildungsbereich wird KI nach und nach in immer mehr Fächern zum virtuellen Lehrer. Im Transportbereich stellt die Zusammenarbeit zwischen Auto, Straße und Cloud höhere Anforderungen an die Infrastruktur. Sie ermöglicht zwar ein intelligentes Verkehrsmanagement, kann aber gleichzeitig die Kosten für intelligent fahrende Fahrzeuge effektiv senken. Im medizinischen Bereich hatte die KI selbst in der Vergangenheit relativ tiefgreifende Anwendungen (traditionelle Modelle) in Bereichen wie der medizinischen Bildgebung und der Forschung und Entwicklung neuer Arzneimittel. Das Aufkommen generativer Modelle hat die Entwicklung der KI in den oben genannten Bereichen weiter vertieft Insgesamt ist die Ausrichtung der Forschung und Entwicklung im Ausland jedoch eher auf das Gesundheitsmanagement ausgerichtet, und die Anwendungsrichtungen der beiden sind je nach Wirksamkeit des großen Modells unterschiedlich.

Risikowarnung

Es wird erwartet, dass sich die wirtschaftliche Rezession in Nordamerika allmählich verschlimmert, und es besteht große Unsicherheit im makroökonomischen Umfeld. Veränderungen im internationalen Umfeld wirken sich auf die Lieferkette aus, und die Expansion von Chips ins Ausland kann sich auf die normale Produktion und Lieferung relevanter Unternehmen sowie auf die Lieferungen von Unternehmen auswirken sind geringer als erwartet; die Nachfrage und die Investitionsausgaben sind geringer als erwartet; der Wettbewerb auf dem Markt hat sich verschärft, was zu einem raschen Rückgang der Bruttogewinnmargen geführt hat; Wechselkursschwankungen wirken sich auf die Wechselkurserträge und Bruttogewinnmargen exportorientierter Unternehmen aus. Die Aktualisierung von großen Modellalgorithmen ist möglicherweise nicht so effektiv wie erwartet und die industrielle Intelligenz ist nicht wie erwartet.