notizia

Chi sta progettando il chip del centro di calcolo intelligente?

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Testo: Prospettiva dell'industria dei semiconduttori

Le industrie legate alla “potenza di calcolo” hanno continuato a crescere recentemente, e anche la costruzione di centri di calcolo intelligenti sta fiorendo ovunque.

Entrando nel 2024, il Wuchang Intelligent Computing Center, il China Mobile Intelligent Computing Center (Qingdao), il South China Data Valley Intelligent Computing Center, il Zhengzhou Artificial Intelligence Computing Center, il Broad Data Shenzhen Qianhai Intelligent Computing Center, ecc. hanno iniziato la costruzione o sono stati messi in produzione.

Secondo statistiche incomplete, attualmente sono più di 30 le città in tutto il Paese che stanno costruendo o proponendo di costruire centri di calcolo intelligenti, con un investimento che supera i 10 miliardi di yuan.

Cos’è esattamente un centro di calcolo intelligente? A cosa serve principalmente il centro di calcolo intelligente? Quali sono le caratteristiche dei centri di calcolo intelligenti?

Cos’è un centro di calcolo intelligente?

Secondo la definizione del "Piano d'azione per lo sviluppo di alta qualità delle infrastrutture informatiche", i centri di calcolo intelligenti si riferiscono all'uso di risorse di calcolo eterogenee su larga scala, compresa la potenza di calcolo generale (CPU) e la potenza di calcolo intelligente (GPU, FPGA, ASIC, ecc.), principalmente strutture che forniscono la potenza di calcolo, i dati e gli algoritmi necessari per le applicazioni di intelligenza artificiale (come lo sviluppo di modelli di deep learning di intelligenza artificiale, l'addestramento di modelli, l'inferenza di modelli e altri scenari).

Si può anche dire che un centro di calcolo intelligente è un data center che si concentra su attività di calcolo dell'intelligenza artificiale.

I data center solitamente comprendono tre categorie, oltre ai centri di calcolo intelligenti, le altre due sono centri di calcolo generali che si concentrano su attività informatiche generali e centri di supercalcolo che si concentrano su attività di supercalcolo.


Il 2023 è un anno di svolta importante per lo sviluppo dell’intelligenza artificiale. La tecnologia AIGC ha fatto progressi rivoluzionari. Nuove attività come la formazione di modelli di grandi dimensioni e l’applicazione di modelli di grandi dimensioni stanno rapidamente emergendo Come vettori di potenza di calcolo intelligente, anche i data center si sono evoluti dai dati sale computer a centri di calcolo generali, sviluppati fino allo stadio attuale di centro di supercalcolo e centro di calcolo intelligente.

Qual è la differenza tra un centro di calcolo intelligente e un data center generale?

I centri di calcolo intelligenti, solitamente strettamente legati al cloud computing, enfatizzano la flessibilità del controllo delle risorse e della gestione dell’infrastruttura. In un ambiente cloud, il fornitore del data center è responsabile della manutenzione dell'hardware e di alcuni strumenti software, mentre il cliente possiede i dati. Al contrario, i tradizionali data center locali richiedono alle aziende di gestire e mantenere autonomamente tutte le risorse dati.

Le differenze essenziali portano a grandi differenze tra i due modelli in termini di investimento di capitale, distribuzione delle risorse e sicurezza.

In termini di investimento di capitale, i clienti dei centri di calcolo intelligenti possono scegliere un modello di servizio adatto a loro, come il cloud pubblico, il cloud privato o il cloud ibrido, senza grandi costi hardware e software, mentre i clienti dei data center tradizionali devono investire molto denaro per acquistare e mantenere i server, le apparecchiature di rete e di archiviazione di cui hai bisogno.

In termini di distribuzione delle risorse e sicurezza, i clienti del centro di calcolo intelligente possono accedere e gestire da remoto i propri dati e applicazioni tramite Internet sempre e ovunque. Allo stesso tempo, possono anche usufruire delle garanzie di sicurezza professionali fornite dai fornitori di data center, ad esempio firewall, crittografia, backup e ripristino, ecc.; mentre i clienti dei data center tradizionali sono limitati da uffici/luoghi designati e devono proteggere e gestire i dati da soli.

Un centro di calcolo intelligente è semplicemente un centro di calcolo dati che serve specificamente l’intelligenza artificiale e può fornire la potenza di calcolo dedicata necessaria per i calcoli dell’intelligenza artificiale. Rispetto ai data center tradizionali, i centri di elaborazione intelligenti possono soddisfare esigenze più mirate, avere volumi di elaborazione più grandi e velocità di elaborazione più elevate e fornire elaborazione AI per vari scenari di settore verticale come l’inferenza di addestramento di modelli di grandi dimensioni, la guida autonoma e la forza AIGC.

Che tipo di chip sono necessari per l’informatica intelligente basata sull’intelligenza artificiale?

Anche in termini di selezione dell’hardware, l’architettura hardware dei centri di calcolo intelligenti è diversa da quella dei data center tradizionali.

Che tipo di chip informatici sono necessari per l'elaborazione intelligente dell'intelligenza artificiale?

L'architettura hardware dei data center tradizionali è relativamente semplice e comprende principalmente server, dispositivi di archiviazione e dispositivi di rete. Rispetto a questa architettura hardware, il centro di calcolo intelligente sarà più flessibile e verranno selezionati diversi nodi di calcolo per diversi scenari applicativi.

Il server informatico intelligente è l'hardware informatico principale del centro informatico intelligente. Solitamente adotta l'architettura informatica eterogenea di "CPU+GPU", "CPU+NPU" o "CPU+TPU" per sfruttare al meglio le prestazioni, i costi e i vantaggi. prestazioni di diversi chip informatici. Vantaggi nel consumo energetico.

GPU, NPU e TPU hanno un gran numero di core e sono bravi nel calcolo parallelo. Gli algoritmi di intelligenza artificiale coinvolgono un gran numero di semplici attività operative sulle matrici e richiedono potenti capacità di calcolo parallelo.

I server tradizionali per scopi generici utilizzano la CPU come chip principale per supportare l'elaborazione di base per scopi generici come il cloud computing e l'edge computing.

Che tipo di chip di memoria sono necessari per l'elaborazione intelligente basata sull'intelligenza artificiale?

Non solo i chip di potenza di calcolo sono diversi, ma l’elaborazione intelligente basata sull’intelligenza artificiale ha anche requisiti più elevati per i chip di memoria.

Il primo è il dosaggio. La capacità DRAM dei server informatici intelligenti è solitamente 8 volte quella dei server ordinari e la capacità NAND è 3 volte quella dei server ordinari. Anche il suo circuito stampato PCB ha un numero significativamente maggiore di strati rispetto a un server tradizionale.

Ciò significa anche che i server informatici intelligenti devono implementare più chip di memoria per ottenere le prestazioni richieste.

Con l’aumento della domanda emergono anche una serie di problemi legati ai colli di bottiglia.

Da un lato, la tradizionale architettura di von Neumann richiede che i dati vengano caricati in memoria, con conseguente bassa efficienza di elaborazione dei dati, elevata latenza e elevato consumo energetico, dall'altro, il problema del muro di memoria fa sì che le prestazioni del processore crescano molto più velocemente; rispetto alla velocità della memoria. Di conseguenza, è necessario trasferire una grande quantità di dati tra l'SSD e la memoria, inoltre, anche le limitazioni di capacità e larghezza di banda dell'SSD montato sulla CPU sono diventate dei colli di bottiglia in termini di prestazioni;

Di fronte a problemi come il "muro di archiviazione" e il "muro del consumo energetico", l'architettura di archiviazione informatica nell'architettura informatica tradizionale deve essere aggiornata con urgenza. Solo integrando organicamente archiviazione e elaborazione può eguagliare l'enorme quantità di dati nell'era dell'informatica intelligente con il suo enorme potenziale di miglioramento dell’efficienza energetica.

In risposta a questa serie di problemi, i chip integrati di memorizzazione e calcolo potrebbero essere una buona risposta.

Oltre a diversi chip, per dare il massimo alle prestazioni e garantire un funzionamento stabile, il server AI è stato progettato anche con architettura, dissipazione del calore, topologia e altri aspetti migliorati.

Chi sta disponendo questi chip?

Il layout dei chip di potenza di calcolo

Dal punto di vista GPU, le GPU sono brave nel calcolo massivo in parallelo. Huawei, Tianshu Zhixin, Moore Thread, Sugon, Suiyuan Technology, Nvidia, Intel, AMD, ecc. hanno tutti lanciato chip correlati. Ad esempio, Huawei ha lanciato la serie Ascend di chip AI, Ascend 910 e Ascend 310. Questi chip sono appositamente progettati per l'addestramento e il ragionamento tramite AI e presentano prestazioni elevate e basso consumo energetico. La serie Ascend è stata ampiamente utilizzata nei data center, nei servizi cloud, nell'edge computing e in altri campi, fornendo un potente supporto di potenza di calcolo per i centri di calcolo intelligenti.

NVIDIA ha lanciato una serie di prodotti GPU per l'addestramento e l'inferenza dell'intelligenza artificiale, come A100, H100, ecc. Intel ha anche lanciato una serie di prodotti chip AI, come la serie di chip Gaudi di Habana Labs, con l'obiettivo di competere con Nvidia. AMD ha anche fatto piani nel campo dei chip AI e ha lanciato prodotti GPU e APU della serie MI.

In termini di FPGA, CPU+FPGA combina flessibilità e prestazioni elevate per adattarsi ai rapidi cambiamenti negli algoritmi. Xilinx e Intel sono i principali attori sul mercato. I prodotti correlati includono: le serie di prodotti VIRTEX, KINTEX, ARTIX, SPARTAN di Xilinx e le serie di prodotti Agilex di Intel tra cui Fudan Microelectronics, Unisoc Microelectronics e Anlu Technology wait.

In termini di ASIC, CPU+ASIC fornisce elaborazione personalizzata ad alte prestazioni per soddisfare esigenze specifiche. Giganti stranieri come Google, Intel e NVIDIA hanno successivamente rilasciato chip ASIC. Anche produttori nazionali come Cambrian, Huawei HiSilicon e Horizon hanno lanciato chip ASIC accelerati da reti neurali profonde.

In termini di NPU, NPU è un processore appositamente progettato per scenari di intelligenza artificiale e apprendimento automatico. Diversamente da CPU e GPU, NPU è stata specificamente ottimizzata nella struttura hardware e si concentra sull'esecuzione di attività di calcolo legate all'intelligenza artificiale come l'inferenza della rete neurale. La combinazione tra la versatilità della CPU e la specificità della NPU consente all'intero sistema di rispondere in modo flessibile a vari scenari applicativi di intelligenza artificiale e di adattarsi rapidamente ai cambiamenti negli algoritmi e nei modelli.

Attualmente sul mercato esistono molte NPU o chip dotati di moduli NPU prodotti in serie. Tra i più noti figurano la serie NPU Hexagon di Qualcomm e la serie Ascend di Huawei. Vale la pena notare che tutti i principali produttori hanno design unici nella progettazione dei core dei chip computing Strategia.

In termini di TPU, il TPU è un chip sviluppato da Google appositamente per accelerare la potenza di calcolo delle reti neurali profonde. È più focalizzato sull'elaborazione di attività di deep learning su larga scala e ha una potenza di calcolo maggiore e una latenza inferiore. Il TPU è anche un chip ASIC.

In termini di DPU, DPU è appositamente progettato per attività di elaborazione dati e dispone di una struttura hardware altamente ottimizzata adatta alle esigenze informatiche in campi specifici. A differenza della CPU utilizzata per l'elaborazione generale e della GPU utilizzata per l'elaborazione accelerata, la DPU è il terzo chip principale nel data center. I prodotti DPU dei tre giganti internazionali NVIDIA, Broadcom e Intel occupano la maggior parte del mercato interno. Molti produttori come Xilinx, Marvell, Pensando, Funtable, Amazon e Microsoft hanno prodotto DPU o prodotti con architettura simile in passato. 5 anni. . I produttori nazionali includono Zhongke Yushu, Xinqiyuan, Yunbao Intelligence, Dayu Zhixin, Alibaba Cloud, ecc.

Dove sono finiti i chip informatici domestici?

Alla conferenza della rete mobile di calcolo di Pechino del 2024, il nodo di Pechino del China Mobile Computing Center è stato ufficialmente messo in funzione, segnando una nuova fase nella costruzione del centro di calcolo intelligente del mio paese. Essendo il primo centro di elaborazione intelligente integrato di formazione e promozione su larga scala di Pechino, il progetto copre un'area di circa 57.000 metri quadrati, distribuisce quasi 4.000 schede acceleratrici AI, ha un tasso di localizzazione del 33% dei chip AI e dispone di un sistema di elaborazione intelligente scala di potenza di oltre 1.000P.

Zhen Yanan, CTO di Beijing Beilong Super Cloud Computing Co., Ltd., l'entità operativa del Beijing Super Cloud Computing Center, ha recentemente affermato che attualmente sta "innestando" modelli domestici di grandi dimensioni con chip domestici e ci vogliono solo circa 15 giorni correre attraverso. È convinto che la condivisione della potenza di calcolo costituirà una tendenza importante nel settore e che le risorse di elaborazione GPU di fascia alta richiederanno l'impegno di tutte le parti.

Negli ultimi anni, la struttura del mercato dei chip di potenza di calcolo dell'intelligenza artificiale cinese è stata dominata principalmente da NVIDIA, che rappresenta oltre l'80% della quota di mercato.

Zhen Yanan ha dichiarato: "Siamo anche molto preoccupati per lo sviluppo di chip domestici. Resta inteso che i grandi modelli nazionali autosviluppati e persino alcuni grandi modelli open source vengono costantemente trapiantati nei chip domestici. Ora, dal punto di vista dell'uso dei chip, alcuni i modelli possono essere eseguiti e ciò che deve essere raggiunto sono principalmente le prestazioni elevate come la GPU ".

"L'intera localizzazione è gerarchica. I chip appartengono allo strato hardware. Inoltre, c'è l'ecosistema software. Per i chip domestici, sia la struttura che l'ecosistema richiedono un certo ciclo di coltivazione." Zhen Yanan ha invitato la parte finale dell'applicazione a dare abbastanza fiducia nei chip nazionali.

Disposizione del chip di memoria

I centri di calcolo intelligenti devono avere elevata capacità, elevata affidabilità, elevata disponibilità e altre caratteristiche in termini di archiviazione. I dispositivi di archiviazione utilizzano solitamente dischi rigidi ad alte prestazioni o unità a stato solido e sono dotati di un'architettura di archiviazione ridondante per garantire la sicurezza e l'accessibilità dei dati. Samsung, Micron, SK Hynix, ecc. hanno chip correlati ampiamente utilizzati nei data center, nel cloud computing e in altri campi per fornire soluzioni di archiviazione ad alte prestazioni per centri di calcolo intelligenti.

Negli ultimi anni i produttori nazionali hanno anche raggiunto un rapido sviluppo nel mettersi al passo con la tecnologia DRAM e NAND.

Oltre ai tradizionali chip di memoria, i centri di calcolo intelligenti necessitano anche dei nuovi chip integrati storage-storage-computing menzionati sopra per svolgere un ruolo maggiore.

A giudicare dalla storia dello sviluppo dello storage e dell'elaborazione integrati, dal 2017, i principali produttori come NVIDIA, Microsoft e Samsung hanno proposto prototipi di storage e elaborazione integrati. Nello stesso anno, hanno iniziato ad emergere società nazionali di storage e elaborazione integrati.

La richiesta dei principali produttori di un'architettura integrata di storage ed elaborazione sia pratica e rapida da implementare Essendo la tecnologia più vicina all'implementazione ingegneristica, il Near-Memory Computing è diventato la prima scelta dei principali produttori. I principali produttori con ecosistemi ricchi come Tesla e Samsung, così come i tradizionali produttori di chip come Intel e IBM, stanno tutti implementando il Near-Memory Computing.

Le start-up nazionali si stanno concentrando sull’in-memory computing che non richiede tecnologie di processo avanzate. Tra questi, startup come Zhicun Technology, Yizhu Technology e Jiutian Ruixin scommettono tutte su PIM, CIM e altri percorsi tecnologici che integrano storage e computing più strettamente con "storage" e "computing". La tecnologia Yizhu, la tecnologia Qianxin, ecc. si concentrano su scenari di grande potenza di calcolo dell'intelligenza artificiale come calcoli di modelli di grandi dimensioni e guida autonoma. Shanyi, tecnologia Xinyi, tecnologia Pingxin, tecnologia Zhicun, ecc. si concentrano su Internet delle cose, dispositivi indossabili e case intelligenti; Scenari come potenza di calcolo marginale.

Yizhu Technology è impegnata nella progettazione di chip AI ad alta potenza utilizzando un'architettura di archiviazione e calcolo integrata. Per la prima volta, combina la ReRAM memristor con un'architettura di archiviazione e calcolo integrata. Attraverso un'idea di progettazione di chip completamente digitale, fornisce una soluzione migliore sull'attuale struttura industriale. I grandi chip di potenza di calcolo dell'intelligenza artificiale con un rapporto costo-efficacia, un rapporto di efficienza energetica più elevato e un maggiore spazio per lo sviluppo della potenza di calcolo hanno intrapreso una nuova strada nello sviluppo.

Qianxin Technology si concentra sulla ricerca e sullo sviluppo di chip informatici integrati per l'archiviazione di grande potenza di calcolo e soluzioni informatiche per i settori dell'intelligenza artificiale e dell'informatica scientifica. Nel 2019, è stata la prima a proporre un'architettura di prodotto con tecnologia integrata di archiviazione e calcolo riconfigurabile. Rispetto ad altre aziende in termini di produttività, i chip AI tradizionali possono essere migliorati da 10 a 40 volte. Allo stato attuale, il chip (prototipo) integrato di archiviazione e calcolo riconfigurabile di Qianxin Technology è stato provato o implementato nel cloud computing, nella percezione della guida autonoma, nella classificazione delle immagini, nel riconoscimento delle targhe e in altri campi anche il suo prototipo di prodotto di chip integrato di archiviazione e elaborazione di grande potenza di calcolo; è stato il primo in Cina a superare i test interni delle principali società Internet.

Il piano di Zhicun Technology è quello di riprogettare la memoria, utilizzare le caratteristiche fisiche delle celle di memoria Flash, trasformare l'array di archiviazione e riprogettare i circuiti periferici in modo che possano ospitare più dati e allo stesso tempo memorizzare gli operatori nella memoria, in modo che ciascuno L'unità può eseguire operazioni di simulazione e produrre direttamente i risultati dell'operazione per raggiungere lo scopo di integrare archiviazione e calcolo.

L’informatica intelligente rappresenta oltre il 30% della scala e la costruzione della potenza di calcolo è in pieno svolgimento

All'inizio di luglio, il Tianfu Intelligence Southwest Computing Center è stato ufficialmente messo in funzione a Chengdu, nel Sichuan. Secondo i rapporti, il centro utilizzerà la potenza di calcolo per supportare la creazione di Chengdu di un settore centrale dell’intelligenza artificiale da 100 miliardi di livelli e potenziare l’innovazione dell’intelligenza artificiale in campi quali la produzione industriale, le scienze naturali, la biomedicina e gli esperimenti di simulazione della ricerca scientifica.

Questo non è un caso isolato. Il mese scorso, il progetto Yinchuan Green Intelligent Computing Center è iniziato intensamente. Beijing Mobile ha costruito il primo centro di calcolo intelligente integrato di formazione e promozione su larga scala a Pechino per supportare decine di miliardi e centinaia di miliardi di formazione e ragionamento su grandi modelli; elevata complessità ed elevati requisiti informatici; Zhengzhou Il centro di calcolo dell'intelligenza artificiale ha iniziato la costruzione, con un investimento totale di oltre 1,6 miliardi di yuan... La nuova infrastruttura digitale rappresentata dal centro di calcolo intelligente sta accelerando la sua costruzione e implementazione.

I dati diffusi dall’Ufficio nazionale di statistica il 15 luglio hanno mostrato che alla fine di maggio erano state costruite 460.000 stazioni base 5G in tutto il paese; erano stati pianificati più di 10 centri di calcolo intelligenti con cluster di computer ad alte prestazioni e potenza di calcolo intelligente; rappresentavano più del 30% della potenza di calcolo totale.

Secondo le statistiche incomplete del China IDC Circle, al 23 maggio 2024, ci sono 283 centri di calcolo intelligenti nella Cina continentale, che coprono tutte le province, regioni autonome e comuni della Cina continentale. Tra questi, ci sono 140 progetti di centri di calcolo intelligenti con statistiche sugli investimenti, per un investimento totale di 436,434 miliardi di yuan. Esistono 177 progetti di centri di calcolo intelligenti con statistiche pianificate sulla scala della potenza di calcolo e la scala della potenza di calcolo totale raggiunge 369.300 PFlop.

Questi "centri di calcolo intelligenti" hanno standard e scale diversi. La scala della potenza di calcolo è generalmente 50P, 100P, 500P, 1000P e alcuni raggiungono addirittura più di 12000P. Sebbene l'ondata di intelligenza artificiale abbia portato ampie prospettive di sviluppo ai centri di calcolo intelligenti, il disallineamento tra domanda e offerta, prezzi elevati e duplicazione delle costruzioni sono ancora i problemi affrontati dalla costruzione della potenza di calcolo del mio paese.

Allo stesso tempo, molti luoghi hanno anche introdotto piani speciali per chiarire gli obiettivi di costruzione nei prossimi anni e migliorare le misure di sostegno in termini di tecnologia, applicazione e finanziamento. Ad esempio, Jiangsu ha pubblicato un piano speciale per lo sviluppo delle infrastrutture provinciali per la potenza di calcolo, proponendo che entro il 2030 la potenza di calcolo totale in uso nella provincia superi i 50EFLOPS (EFLOPS si riferisce a 10 miliardi di operazioni in virgola mobile al secondo) e sistemi intelligenti la potenza di calcolo rappresenterà oltre il 45%; il Gansu propone di fornire sostegno politico per la nuova infrastruttura di rete informatica in termini di utilizzo del territorio, costruzione di strutture di supporto municipali, introduzione di talenti e finanziamenti.

"Lo sviluppo esplosivo di applicazioni come i modelli di intelligenza artificiale di grandi dimensioni ha portato a un aumento della domanda di potenza di calcolo intelligente, direttore del Dipartimento di informatizzazione e sviluppo industriale del Centro nazionale di informazione, ha affermato che l'informatica intelligente si è sviluppata rapidamente." ed è diventato quello in più rapida crescita nella struttura della potenza di calcolo del mio paese. Tra questi, i modelli di grandi dimensioni sono il maggiore richiedente di potenza di calcolo intelligente, rappresentando quasi il 60% della domanda. Si prevede che entro il 2027 il tasso di crescita annuo composto della potenza di calcolo intelligente della Cina raggiungerà il 33,9%.