fünf fragen zur aktuellen situation von ki-intelligenten rechenzentren

fünf fragen zur aktuellen situation von ki-intelligenten rechenzentren｜branchenumfrage

2024-10-02

financial associated press, 2. oktober (reporter fu jing)die parameterskala großer modelle nimmt weiter zu und stellt höhere anforderungen an die ki-rechenleistungsinfrastruktur. die ki-computerbranche boomt derzeit und der bau intelligenter rechenzentren beschleunigt sich. die neuesten daten zeigen, dass die gesamtzahl der landesweit im einsatz befindlichen rechenzentrums-racks im juni dieses jahres 8,3 millionen standard-racks übersteigt, mit einer rechenleistungsskala von 246 eflops (fp32) und einer jährlichen wachstumsrate von smart computing über 65 %.

wie hoch sind derzeit der preis und der mangel an angebotsseitigen computerkarten? stimmt die angebotsseite mit der nachfrageseite überein? sind alle hunderte intelligenter rechenzentren im ganzen land voll ausgelastet? wann sind die kosten für den bau eines intelligenten rechenzentrums amortisiert? wie kann die rechenleistung künstlicher intelligenz eine qualitativ hochwertige entwicklung erreichen? reporter der financial associated press konzentrierten sich auf die fünf kernthemen und interviewten viele branchenvertreter.

laut einem reporter der financial associated press hat sich die bisherige angebotsknappheit bei ki-rechenleistung verringert, angebot und nachfrage stimmen jedoch nicht vollständig überein, was zu einer geringen auslastung einiger intelligenter rechenzentren führt. obwohl pläne für intelligente rechenzentren bei kommunalverwaltungen und unternehmen weit verbreitet sind, könnte die zahl der tatsächlich in betrieb befindlichen rechenzentren geringer ausfallen als erwartet. einige praktiker gehen davon aus, dass einige intelligente rechenzentren ihre kosten in etwa drei bis vier jahren „erholen“ können. gleichzeitig wird die qualitativ hochwertige entwicklung der rechenleistung auch von der industrie geschätzt.

der berechnete kartenpreis liegt nahe an der kostenlinie des verkäufers

„das knappe angebot an rechenleistung ist in den letzten jahren tatsächlich ein relativ häufiges phänomen. viele menschen beeilen sich, produkte mit guter rechenleistung und guter ökologischer anpassungsfähigkeit zu kaufen. aus sicht der benutzer hoffen sie natürlich, dass intelligente rechenleistung sie besser unterstützen kann.“ „aus der sicht eines computerserverlieferanten sagte zhang dong, chefwissenschaftler von inspur yunhai, in einem interview mit einem reporter der financial associated press.

zhang dong sagte reportern, dass das knappe angebot an intelligenten computern zyklisch sei.

wie ist die aktuelle situation auf der angebotsseite? zhang yazhou, vorsitzender der shanghai liuchi technology group und general manager von shanghai runliuchi technology co., ltd., einer tochtergesellschaft von hengrun co., ltd. (603985.sh), sagte reportern der financial associated press: „es gibt einen vorrat im gegensatz zum letzten jahr, als es einen mangel an rechenleistung gab, liegen die aktuellen preise verschiedener computerkarten in der nähe der kostengrenze der verkäufer. jetzt sind viele menschen an verschiedenen projekten in der branche beteiligt. und es gibt auch viele zwischenhändler, die früher computer und geräte hergestellt haben, und die ikt-kommunikationsindustrie sind tatsächlich beteiligt.

kürzlich haben einige grenzüberschreitende a-share-intelligent-computing-akteure druck gezeigt, wie zum beispiel: lotus purple star, eine tochtergesellschaft von lotus holdings (600186.sh), hat einige verträge über rechenleistungsdienstleistungen unterzeichnet.es besteht das risiko, dass die tatsächliche deckung der beschaffungskosten länger als erwartet dauert oder nicht erstattungsfähig ist.seit august dieses jahres befindet sich lotus purple star immer noch in einem verlustzustand und es besteht unsicherheit darüber, ob altron engine, eine hundertprozentige tochtergesellschaft von oya holdings (300949.sz), das ganze jahr über gewinne erzielen kann mit seinem lieferanten runxin supply chain den „berechnungsplan“ unterzeichnet. gemäß der „ergänzungsvereinbarung zum stromserver-beschaffungsvertrag“ wurde die ursprünglich geplante anzahl von 128 hochleistungsrechnerservern mit eingebetteten nvidia-gpu-chips auf 8 geändert.

laut zhang yazhous beobachtung sanken die preise für gpu-terminals von juni bis august dieses jahres weiter. „die projekte des letzten jahres wurden alle in der ersten hälfte dieses jahres verdaut. es gibt zwei hauptsituationen für die projekte, die dieses jahr durchgeführt werden: erstens benötigt die unternehmensforschung und -entwicklung wirklich rechenleistung, die hauptsächlich in großen internetunternehmen konzentriert ist. zweitens.“ einige regionen haben subventionen und energiekontingente erhalten und warten auf die unterstützung des baus eines intelligenten rechenzentrums.“

es wird davon ausgegangen, dass der markt im september nur eine welle von „umfassenden waren“ erlebte, „hauptsächlich beeinflusst durch die nebensaison und das internationale umfeld, aber tatsächlich gibt es nicht viele spot-ressourcen auf dem markt.“

von einem brancheninsider erfuhr der reporter außerdem, dass „der preis der 4090 zuvor von über 13.000 auf 16.700 gestiegen ist“, allerdings soll der preisanstieg vor allem auf die relativ hohe nachfrage nach dieser grafikkarte in „schwarz“ zurückzuführen sein mythos: wukong". kraftvoll.

darüber hinaus sagte zhang yazhou, dass der markt immer noch das phänomen der fragmentierten rechenleistungsversorgung habe: einige anbieter „verfügen möglicherweise nur über 5 oder 10 server, und größere anbieter haben 64 oder mehr als 100 server, und es gibt grundsätzlich nur sehr wenige großvolumige.“ solche lieferanten können einige einzelaufträge von laboren und schulen entgegennehmen.“

angebot und nachfrage stimmen nicht genau überein

mehrere praktizierende sagten reportern der financial associated press, dass die linderung der angebotsknappheit nicht bedeute, dass die nachfrage nach intelligenter datenverarbeitung geringer sei als erwartet. zhang yazhou sagte, dass die nachfrage nach intelligentem computing wächst und ständig neue anforderungen entstehen, die aktuelle nachfrageseite jedoch rationaler geworden sei.

fan congming, vorstandsvorsitzender der shenzhen artificial intelligence industry association, sprach in einem interview mit einem reporter der associated press über die aktuelle situation verschiedener arten von nachfrageparteien: führende unternehmen und wissenschaftliche forschungsuniversitäten verfügen über ausreichende rechenleistungsressourcen, während große- derzeit werden maßstabsgetreue industrielle vertikalmodelle in großen mengen entwickelt, und kleinen, mittleren und kleinstunternehmen mangelt es an rechenleistung.

bemerkenswert ist, dass der bau intelligenter rechenzentren in vollem gange ist und die zahl der entsprechenden ausschreibungen von monat zu monat zunimmt.

wie digital intelligence frontier zuvor berichtete, wurden unvollständigen statistiken zufolge allein in den ersten sieben monaten dieses jahres mehr als 140 ausschreibungen für projekte im zusammenhang mit intelligenten rechenzentren veröffentlicht, darunter mindestens 24 projekte, die sich auf alle aspekte des bauwesens konzentrierten im juli wurden im inland mehr als 40 erfolgreiche ausschreibungsprojekte bekannt gegeben.

guo liang, chefingenieur des cloud computing and big data research institute der china academy of information and communications technology, sagte in einem interview mit einem reporter der associated press of finance während der gerade zu ende gegangenen „china computing power conference 2024“: „im ganzen land wurden viele intelligente rechenzentren gebaut. vollständigen statistiken zufolge sollten es mehr als 200 sein, aber 90 % von ihnen haben eine rechenleistung unter 1000p, was bedeutet, dass diese rechenleistungszentren für das training großer modelle nur begrenzt geeignet sind.“ , und ihre zukünftige nutzungseffizienz ist fraglich.“

„der bedarf an rechenleistung ist enorm, aber die vorhandenen typen können die bedürfnisse der benutzer nicht erfüllen. sowohl in bezug auf die anpassung als auch auf die kosteneffizienz können sie die erwartungen der kunden nicht erfüllen, sagte du yunlong, analyst bei idc china, einem reporter der financial associated press.

zhang yazhou glaubt auch, dass es derzeit eine situation gibt, in der die angebotsseite und die nachfrageseite der rechenleistung nicht vollständig übereinstimmen. „nachfragesteller auf der b-seite suchen im allgemeinen nach einheiten, mit denen sie vertraut sind.“ tatsächlich können sie nur dann mit der projektseite in kontakt treten.“ transaktionen sind nur möglich, wenn die zusammenarbeit gut ist oder die gesamtstärke relativ anerkannt ist, und das bedeutet nicht unbedingt, dass die transaktion zum niedrigsten preis erfolgt.“

ist ungenutzte rechenleistung üblich?

ein reporter von associated press stellte fest, dass in diesem stadium die frage, ob rechenleistungsgeräte mit voller kapazität arbeiten, in den fokus der marktaufmerksamkeit gerückt sei.

„jetzt wurde viel rechenleistung absorbiert, aber es gibt tatsächlich eine kleine menge an ungenutzter rechenleistung in der branche. beispielsweise kann es einen vorrat von tausend maschinen auf dem markt geben, aber es können hunderte von maschinen im leerlauf sein.“ .“, sagte zhang yazhou gegenüber reportern der associated press.

laut guo liangs beobachtung ist ungenutzte rechenleistung kein alltägliches phänomen. „unser team unterstützt entsprechende arbeiten in vielen provinzen und städten. soweit wir wissen, ist die auslastung des rechenleistungszentrums von ningxia in naher zukunft immer noch sehr hoch.“ ."

“mittlerweile ist es in der inneren mongolei, in tibet und xinjiang üblicher, rechenleistung online für time-sharing-leasing zu niedrigen preisen zu verkaufen. dies wird zu einer geringen auslastung der in guangdong und anderen orten errichteten intelligenten rechenzentren führen." fan congming sagte reportern.

in bezug auf das ningxia intelligent computing center analysierte guo liang, dass der lokale gesamtstrompreis zwar derzeit nicht subventioniert wird, das lokale intelligente rechenzentrum jedoch über eine größere rechenleistung verfügt und für die schulung großer modelle nützlicher ist. „außerdem sind für intelligentes rechnen die leistungsanforderungen für die netzwerkübertragung nicht so hoch und daten können vollständig offline verarbeitet werden. dies ist ein besseres anwendungsszenario für intelligente rechenzentren in der mitte und im westen meines landes.“

„gemessen am grad der verarbeitung von rechenleistung im frühen bauwesen sollten führende unternehmen 80 % ausmachen, wissenschaftliche forschungsuniversitäten sollten etwa 30 bis 40 % ausmachen und der grad der verarbeitung von rechenleistung für marktorientiertes bauen sollte es sein.“ etwa die hälfte“, sagte fan congming gegenüber reportern.

laut der beobachtung von fan congming trainieren führende unternehmen wie byte, tencent, huawei und baidu „kontinuierlich große modelle. je größer die datenmenge, desto größer der bedarf an rechenleistung, und es gibt fast keine ungenutzte rechenleistung.“ die rechenleistung wissenschaftlicher forschungsuniversitäten ist „groß, weniger genutzt“, relativ mehr ungenutzte rechenleistung; ungenutzte rechenleistung ist in kleinen und mittleren unternehmen relativ häufig. aufgrund der unklaren positionierung, der abgelegenen lage und des hohen preises reichte die rechenleistungsaufbereitung in der frühen bauphase nicht aus. "

du yunlong glaubt, dass die frage, ob rechenleistung ungenutzt bleibt, hauptsächlich von mehreren aspekten abhängt: der mobilisierung von rechenleistung durch software der oberen schicht, der verbindungsmethode zwischen hardware, der anpassung von hardwareeinrichtungen an anwendungsszenarien und den kosten für die benutzerbereitstellung.

anfang september sprach tencent cloud-vizepräsident sha kaibo in einem interview mit einem reporter der financial associated auch über das phänomen, dass das intelligente rechenzentrum zwar über hardware-ressourcen verfügt, ihm aber dennoch unterstützende software-fähigkeiten, tatsächliche endkunden oder anwendungsszenarien fehlen drücken.

zhang yazhou sagte, dass die gründe für die ungenutzte rechenleistung komplex seien und mit der leistung verschiedener smart-computing-karten, dem betrieb von projektparteien und den technischen servicefähigkeiten von netzwerkprodukten zusammenhängen produkte auf der anwendungsseite heraus.

wie viele jahre wird es dauern, bis sich die kosten für den bau eines intelligenten rechenzentrums amortisiert haben?

ungenutzte rechenleistung hat in einigen intelligenten rechenzentren zu überhöhten kosten geführt, was eines der häufigsten probleme in der branche ist.

in diesem zusammenhang ist fan congming der ansicht, dass die bereitstellungspreise für intelligente rechenzentren zu hoch sind und die benutzer sie sich nicht leisten können, was zu einer unzureichenden kontinuität der datenverarbeitung in den intelligenten rechenzentren und zu hohen kosten führt.

als guo liang über den betrieb des intelligenten rechenzentrums sprach, sagte er reportern der financial associated press während der „china computing power conference 2024“: „in letzter zeit werden sie bei verschiedenen gelegenheiten oft informationen über die rechenleistungsplanungsplattform sehen, aber was wird?“ wie wird es sich auswirken, nachdem es gebaut wurde? es versteht sich, dass einige orte dutzende millionen in den bau von plattformen investiert haben, diese jedoch aufgrund von problemen wie designkonzepten und funktionsmerkmalen nicht gut genutzt wurden „intelligentes rechenzentrum ist besonders wichtig.“

er sagte weiter: „für smart computing brauchen sogar staatliche investitionen rendite, geschweige denn unternehmen.“ jetzt befindet sich die branche tatsächlich in einer situation des streits unter helden, aber es gibt keine einheitliche rolle. natürlich arbeiten wir auch hart. dieses mal.“ die auf der computing power conference vorgestellte china computing service platform (henan) ist eine lösung, die wir eingeführt haben.“

(fotografiert von einem reporter der financial associated press auf der china computing power conference 2024)

fan congming erklärte einem reporter von associated press, wie intelligente rechenzentren kosten und leistung in einklang bringen: „die amortisationszeit für investitionen in rechenleistung beträgt im allgemeinen etwa fünf jahre, da sich der markt für rechenleistung so schnell verändert und andere kosten wie stromrechnungen hinzukommen.“ wenn es von einem großen hersteller genutzt wird, denke ich, dass die amortisationszeit etwa drei bis vier jahre betragen wird.“

du yunlong ist der ansicht, dass betreiber intelligenter rechenzentren langfristige pläne formulieren sollten, um die nutzungskosten für endbenutzer zu senken, nutzungsgewohnheiten zu pflegen und sich in zukunft wieder auf die pflege von anwendungsfällen zu konzentrieren und die branchenabdeckung schrittweise auszuweiten.

was ist die erklärung für den wechsel von „quantität“ zu „qualität“?

objektiv gesehen hat chinas entwicklung der rechenleistung noch einen langen weg vor sich.

der von der china computing power conference 2024 veröffentlichte „china computing power development report (2024)“ zeigt, dass der globale markt für intelligente computer bis ende letzten jahres im vergleich zum vorjahr um mehr als 130 % gewachsen ist, während der chinesische der markt für intelligente computer sei im vergleich zum vorjahr um mehr als 60 % gewachsen.

ein reporter der associated press bemerkte, dass inmitten des booms beim bau von rechenleistung einige praktiker auf den oben genannten konferenzen viele „kalte gedanken“ äußerten und sich auf hochwertige rechenleistung konzentrierten.

das branchenweit erste hochwertige bewertungssystem für rechenleistung „artificial intelligence computing power high-quality development evaluation system report“, veröffentlicht von inspur information (000977.sz) und der academy of information and communications technology, gab an, dass hochwertige rechenleistung darauf basiert die neueste theorie der künstlichen intelligenz und nutzt eine fortschrittliche computerarchitektur für künstliche intelligenz, high-level-computing-fähigkeiten kombiniert mit algorithmen und datentiefe.

ein reporter von associated press erfuhr von inspur information, dass die lücke zwischen der gemessenen leistung und der theoretischen leistung des aktuellen rechenleistungsclusters zu groß ist. die tatsächliche leistung einiger rechenleistungen beträgt weniger als 10 % der theoretischen leistung. öffentliche daten zeigen, dass die durchschnittliche gpu-auslastungsrate intelligenter rechenzentren im herkömmlichen modus weniger als 30 % beträgt.

zhang dong glaubt, dass sich die aufmerksamkeit auf die rechenleistung nicht nur auf chips konzentrieren kann. „viele orte kaufen rechenleistung, nennen die marken von chips und bauen ein großes rechenzentrum. wir haben immer noch keinen sinn.“ wir müssen die systemperspektive umfassend betrachten und darüber nachdenken, wie die anwendungsanforderungen erfüllt werden können.“

guo liang sagte auch: „derzeit haben wir auf chipebene nicht viele möglichkeiten. aber die integration von computer und netzwerk ist ein hotspot. der zweck besteht darin, einen ki-server von derzeit 8 karten auf 32 karten oder 512 zu erweitern.“ karten dies wird sich positiv auf die fähigkeiten intelligenter computing-cluster auswirken, einschließlich der cluster-bereitstellung, des starts sowie des betriebs und der wartung.“

reporter von associated press erfuhren aus mehreren interviews, dass die implementierung von intelligentem computing im großen maßstab keineswegs eine einfache kombination von maßstäben und mengen ist. ihre komplexität nimmt exponentiell zu, was hohe anforderungen an die technische stärke, ressourcenvorteile und industrielle zusammenarbeit stellt fähigkeiten intelligenter computerbaubetreiber.

zur frage, wie das intelligente rechenzentrum von „quantität“ zu „qualität“ übergehen kann, sagte guo liang: „der bau eines intelligenten rechenzentrums erfordert einen ‚moderaten fortschritt‘ und eine umfassende analyse und vorhersage auf der grundlage der tatsächlichen lokalen bedürfnisse.“

(financial associated press-reporter fu jing)

bericht/feedback

nachricht

fünf fragen zur aktuellen situation von ki-intelligenten rechenzentren｜branchenumfrage

(fotografiert von einem reporter der financial associated press auf der china computing power conference 2024)

einführung

meine kontaktdaten