notizia

La spada punta a 32 Tbps!Intel rivela la roadmap per l'integrazione della fotonica del silicio e i chip OCI gettano le basi per la futura infrastruttura IA

2024-08-01

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Xinxi ha riferito il 31 luglio che la Conferenza sulle comunicazioni in fibra ottica (OFC) è riconosciuta come l'evento internazionale di più alto livello e più grande nel campo delle comunicazioni ottiche nel mondo ed è un punto di riferimento per lo sviluppo di tecnologie di comunicazione ottica all'avanguardia. Alla conferenza sulle comunicazioni in fibra ottica di quest'anno, il team Silicon Photonics Integrated Solutions (IPS) di Intel ha condiviso i progressi rivoluzionari compiuti nella promozione dell'innovazione nella tecnologia di interconnessione a larghezza di banda elevata:Die OCI (Optical Computing Interconnect) leader del settore e completamente integrato, integrato con CPU Intel per eseguire dati reali

Per i data center e le applicazioni di calcolo ad alte prestazioni (HPC), il core OCI creato da Intel realizza un co-pacchetto I/O ottico e può supportare 64 canali da 32 Gbps in una direzione su fibra ottica fino a 100 metri, che dovrebbe soddisfare i requisiti crescente domanda di infrastrutture IA. Crescente domanda di larghezza di banda maggiore, minore consumo energetico e maggiore distanza di trasmissione.

Intel non ha rivelato le dimensioni esatte dei pellet OCI, ma le foto recentemente pubblicate mostrano i pellet OCI rispetto alla gomma all'estremità di una matita standard n. 2.

Per quanto riguarda i dettagli più tecnici dei chip core OCI, Song Jiqiang, vicepresidente dell'Intel Research Institute e direttore dell'Intel China Research Institute, ha recentemente avuto scambi approfonditi con i media core e altri media.Song Jiqiang ha condiviso la futura tabella di marcia dell'innovazione di Intel per l'integrazione fotonica del silicio Aumentando la velocità di linea, il numero di lunghezze d'onda per fibra, il numero di fibre e la modalità di polarizzazione, si prevede di espandere le prestazioni delle future generazioni di core OCI e creare un'innovazione. larghezza di banda fino a32 cucchiai al secondodispositivo.

Intel fornisce chip OCI a vari clienti interni ed esterni. Le specifiche applicazioni dei clienti e i requisiti dei prodotti determineranno la sequenza e la tempistica di questi piani di espansione.

1. Elettricità sostituita dalla luce al silicio ≈ bicicletta trasformata in motocicletta

Con l’accelerazione dello sviluppo dell’intelligenza artificiale generativa, i modelli di grandi dimensioni richiedono un’elevata densità di elaborazione, ampia capacità di memoria e larghezza di banda e sono difficili da implementare in un singolo nodo server, quindi sono necessarie connessioni tra rack. I grandi cluster di elaborazione implicano distanze di trasmissione più lunghe e requisiti di larghezza di banda I/O più elevati.

Song Jiqiang ha affermato che le applicazioni AI hanno raggiunto un nuovo livello in termini di rapporto memoria/calcolo e che l'accesso alla memoria è spesso richiesto. Pertanto, i canali di memoria e i ritardi influenzeranno il modo in cui fornire servizi applicativi su larga scala in futuro. Ciò richiede l’esplorazione di alcuni nuovi metodi,Aumentando la potenza di calcolo e la densità di archiviazione, riduce il consumo energetico e le dimensioni, collocando così più elaborazione e archiviazione (chip) in uno spazio limitato.

In passato, gli I/O elettrici utilizzavano fili di rame per completare l'interconnessione tra i chip. La velocità del filo di rame è abbastanza veloce e il consumo energetico è basso, ma la distanza di trasmissione effettiva è molto limitataCirca 1 metro

Se costruisci un cluster nell'intero data center, dovrai affrontare anche i problemi legati all'ampia area del cluster, ai cavi lunghi e all'elevato consumo energetico per la trasmissione a lunga distanza, rendendo difficile ottenere sia un'elevata potenza di calcolo che un risparmio energetico. Ci sono molti nodi server posizionati in un data center ed esiste un limite massimo alla potenza che può essere fornita. Oltre ai chip, ci sono anche I/O e altri posti che consumano energia nel rack assegnato a ciascun chip è molto limitato.

Secondo Song Jiqiang, negli ultimi 20-30 anni, l’I/O nell’intero settore informatico ha richiesto sempre più potenza. Se si utilizza la tecnologia attuale e si utilizza la scala attuale per crescere, consumerà tutta l’energia fornita al rack. Di conseguenza, non c'è abbastanza elettricità per eseguire operazioni di lettura e scrittura nei chip di calcolo e di archiviazioneÈ necessario utilizzare nuove soluzioni tecniche per sopprimere la potenza utilizzata nella parte I/O.

Intel paragona l'I/O elettrico tradizionale a una carrozza trainata da cavalli, con velocità e distanza di trasmissione limitate;Entro 100 metriPer ottenere una maggiore densità e una trasmissione dei dati più flessibile, il metodo di integrazione fotonica del silicio è come una motocicletta leggera, veloce, flessibile, efficace e a risparmio energetico;Più di 100 metriPer la trasmissione a lunga distanza, utilizzare un ricetrasmettitore ottico collegabile è come sostituire un'auto con una capacità maggiore e una velocità sufficientemente elevata.

I/O ottici e ricetrasmettitori ottici collegabili lo sonoInterconnessione fotonica del silicioLa soluzione presenta il vantaggio di un basso consumo energetico ed è adatta per la trasmissione su lunghe distanze.

Ricetrasmettitore ottico collegabileLa soluzione è relativamente matura e può essere collegata direttamente all'interfaccia del circuito elettronico integrato (EIC), che può aumentare la distanza di trasmissione. Tuttavia, è di dimensioni maggiori e di solito richiede serializzatore e deserializzatore ad alta velocità (SerDes) o elaborazione del segnale digitale. (DSP). Pertanto, la funzionalità è limitata, il consumo è maggiore, la densità di larghezza di banda è inferiore e il ritardo è più lungo.

E utilizzandoIntegrazione della fotonica del silicioLa tecnologia I/O ottica può raggiungere una larghezza di banda multi-Tbps con basso consumo energetico, elevata densità di larghezza di banda, bassa latenza e distanza di trasmissione più lunga per soddisfare le esigenze di espansione dell'intelligenza artificiale.

Particelle del nucleo OCI(o qualsiasi soluzione I/O ottica) co-sigillata con CPU, GPU o SoC può ottimizzare e migliorare la densità della larghezza di banda I/O, l'efficienza energetica totale, la latenza e i costi, nonché attraverso nuove architetture che supportano la disaggregazione delle risorse come HBM o pool di memoria CXL) per ottenere un utilizzo più efficiente delle risorse.

In futuro, Intel fornirà diverse soluzioni per diverse distanze di trasmissione, inclusi il co-packaging optoelettronico OCI e soluzioni collegabili.

due,Confezionato insieme alla CPU,In che modo il chip Intel OCI apporta efficienza energetica?

Il die Intel OCI è un dispositivo I/O ottico a livello fisico completo, che include un circuito integrato fotonico in silicio (PIC) con laser multiplexing a divisione di lunghezza d'onda densa su chip e amplificatori ottici a semiconduttore e un EIC per il controllo del PIC e la connessione all'host .

La funzione dell'EIC è più vicina al modo in cui vengono utilizzati i segnali specifici e alle parti ad esso collegate. Diventerà uno strato di conversione e adattamento in un protocollo. Il PIC riguarda più la risoluzione del problema della trasmissione stabile della luce, l'aggiornamento e l'invio di segnali e l'evoluzione sostenibile, ad esempio come completare una buona conversione tra mezzi dielettrici e ottici.

L'EIC utilizza nodi di processo CMOS standard, mentre il PIC utilizza il processo di produzione della fotonica del silicio di Intel basato su wafer di silicio da 300 mm. Di solito l'EIC utilizza un processo relativamente avanzato per essere vicino o allineato al chip principale da supportare, mentre il PIC utilizza un processo più maturo.

Poiché non esiste un metodo collegabile, tali componenti informatici stessi hanno una potenza inferiore, pur aumentando la larghezza di banda ed estendendo la distanza di trasmissione, possono effettivamente migliorare l’integrazione delle interconnessioni ottiche in silicio, migliorando così le prestazioni e il consumo energetico e contribuendo ad aumentare la densità dei cluster.

Il chip OCI completamente integrato di Intel consente velocità di trasmissione dati bidirezionale fino a4 cucchiai al secondoe compatibile conPCIe di quinta generazione, supporto unidirezionale64 corsie da 32 Gbps(Song Jiqiang ha detto che questo è sufficiente negli attuali data center), con una distanza di trasmissione fino a100 metri(A causa dei ritardi di trasmissione, la distanza potrebbe essere limitata a decine di metri nelle applicazioni reali).

Utilizza 8 coppie di fibre ottiche, ciascuna con 8 lunghezze d'onda di multiplexing a divisione di lunghezza d'onda densa (DWDM) e il consumo energetico è solo5pJ per bit(picojoule), consumo energetico del solo modulo ricetrasmettitore ottico collegabile1/3

Secondo Song Jiqiang, Intel è fiduciosa che, attraverso vari miglioramenti nella progettazione di dispositivi e imballaggi, nei processi di produzione e nell'espansione della larghezza di banda, ridurrà l'efficienza energetica fino al 10% nelle generazioni successive di prodotti.3,5 PJ per bitil seguente.

Alla conferenza sulle comunicazioni in fibra ottica del 2024, Intel ha condotto una dimostrazione dal vivo del collegamento ottico, mostrando l'interconnessione di trasmettitore e ricevitore tra due piattaforme CPU di data center tramite ponticelli in fibra monomodale (SMF).

La CPU genera e misura il tasso di errore di bit. Due CPU del data center si inviano e ricevono dati tra loro. Un core OCI e una CPU sono assemblati insieme. Il core OCI converte tutti i segnali I/O elettrici dalla CPU in luce, attraverso fibre ottiche, trasmesse avanti e indietro tra nodi o sistemi.

Come mostrato nella figura, su entrambi i lati del sistema sono presenti segnali elettrici che vengono trasformati in luce tramite chip di conversione fotoelettrica. Il trasmettitore ha uno spettro totale di 1,6 THz, incluse 8 lunghezze d'onda spaziate a 200 GHz su una singola fibra, e un diagramma a occhio del trasmettitore da 32 Gbps indica una forte qualità del segnale.

La parte colorata è luce, e colori diversi rappresentano luce di diverse lunghezze d'onda, con intervalli di frequenza sufficienti in modo che non interferiscano tra loro durante la modulazione e la demodulazione. Queste luci possono essere combinate insieme e trasmesse su una fibra ottica, ovvero più bande possono essere "multiplexate" su una fibra ottica, il che è la stessa cosa del multiplexing a divisione di frequenza nel campo delle comunicazioni wireless.

Poiché la larghezza di banda della luce è molto ampia, è possibile selezionare una larghezza di banda relativamente stabile e suddividerla in molte bande d'onda diverse, che appaiono all'occhio umano come luce di diversi colori. Si tratta infatti di bande di frequenze diverse, ed il segnale da trasmettere può essere modulato stabilmente su ciascuna banda. Dopo la modulazione fotoelettrica, il segnale viene trasmesso attraverso la fibra ottica.

Song Jiqiang ha condiviso la tabella di marcia per l'evoluzione delle prestazioni dei chip Intel OCI. Esistono tre direzioni principali per l'iterazione della tecnologia:Il numero di lunghezze d'onda delle onde luminose, la velocità di trasmissione delle fibre ottiche e il numero di fibre ottiche.

Una fibra ottica può essere divisa in diverse bande per la trasmissione. Attualmente, 8 bande possono garantire una trasmissione stabile. La velocità di trasmissione dei dati debuggata alla luce di ciascuna banda è di 32 Gbps senza influenzarsi a vicenda è 8. giusto. Moltiplicata per tre, la velocità di trasmissione dati unidirezionale raggiunge 2 Tbps e la velocità bidirezionale è 4 Tbps.

In futuro, se la banda a 8 bande rimane invariata e la velocità di trasmissione in fibra viene aumentata a 64 Gbps, la velocità di trasmissione dati unidirezionale verrà raddoppiata a 4 Tbps. Successivamente, se diventa a 16 band, la velocità di trasmissione verrà aumentata a 8 Tbps. Può continuare ad evolversi in futuro e aumentare gradualmente la larghezza di banda.

3. In futuro potrà anche essere integrato con GPU multipleSmantellamento dei vantaggi differenziali

Rispetto alle soluzioni separate e plug-in,Quando il chip OCI e la CPU sono co-sigillati insieme, la gestione termica deve essere considerata nel suo insieme e la densità e la frequenza di trasmissione del segnale devono essere garantite a livello di packaging. . L'attuale tecnologia di Intel è già in grado di soddisfare queste esigenze.

In futuro, i chip OCI potranno essere utilizzati per implementare le comunicazioni e potranno anche essere integrati con chip informatici come CPU, GPU e IPU.Attraverso l'integrazione della fotonica del silicio e una tecnologia di packaging avanzata, Intel può ottenere chip I/O a densità più elevata e quindi combinarli con altre xPU per formare in futuro molti tipi diversi di chip di elaborazione e interconnessione basati sui chip, con prospettive applicative promettenti.

Song Jiqiang ha inoltre spiegato che la sfida della successiva integrazione con altri tipi di chip non è a livello tecnico, ma a livello di implementazione, ciò a cui bisogna prestare attenzione èdensità di larghezza di banda , ad esempio, quando la distanza tra le interfacce fotoelettriche è limitata, come inserire queste interfacce di conversione fotoelettrica? La densità di larghezza di banda ottenibile è sufficiente entro un determinato intervallo di dimensioni?

Secondo lui, per rendere il chip OCI più flessibile e ridurre il carico di lavoro durante il processo di integrazione,In genere si prenderebbe in considerazione l'utilizzo di un'interfaccia elettrica tra l'xPU host e l'I/O che sia stata standardizzata attraverso un robusto ecosistema IP, come UCIe, PCIe, Ethernet, ecc.

Ha parlato anche dei vantaggi differenziali della soluzione Intel.

Innanzitutto, Intel può produrre in serie laser altamente integrati a livello di wafer, con rendimento e affidabilità più elevati e un costo totale inferiore. Solo dopo aver trasformato la teoria in produzione ad alto rendimento si potranno formare capacità di industrializzazione.

Le soluzioni laser esterne esistenti richiedono l’uso di fibre ottiche specializzate, che sono costose e non hanno casi di implementazione su larga scala.Il vantaggio dei laser su chip è che possono essere trasmessi utilizzando normali fibre ottiche. Poiché non è richiesta alcuna sorgente di luce esterna, non è necessario che le fibre mantengano la polarizzazione.(PMF, una speciale fibra ottica necessaria per collegare sorgenti luminose esterne a circuiti integrati fotonici passivi in ​​silicio).

Quando si realizza un trasmettitore laser, è relativamente semplice realizzare un dispositivo separato. Esiste una soglia tecnica per realizzare un laser su un wafer. Diversi tipi di semiconduttori devono essere ben legati a livello del wafer e quindi il circuito di controllo può essere formato attraverso il processo di produzione del semiconduttore. I dispositivi ottici tra cui sorgenti luminose, modulatori, amplificatori, guide d'onda ottiche, rilevatori, ecc. devono essere implementati a livello di wafer.

In secondo luogo, Intel dispone di piattaforme e dispositivi collaudati e ad alto volume con affidabilità leader del settore.

I chip Intel OCI sono costruiti su una piattaforma di integrazione fotonica del silicio interna e collaudata in produzione che ha fornito oltre il 100% delle applicazioni di connettività nei data center su vasta scala dal 2015.8 milioniModuli ricetrasmettitori ottici (inclusi più di8 milioniCircuiti integrati di fotonica del silicio e oltre32 milioniLaser integrato), utilizzato per applicazioni che richiedono velocità di trasmissione di 100 Gbps, 200 Gbps e 400 Gbps.

La sua affidabilità è stata verificata su milioni di dispositivi e i dati mostrano che il tasso di guasto della base temporale (FIT) del laser è inferiore a0.1, il che equivale a dire che un guasto può verificarsi solo una volta ogni 10 miliardi di ore.

Inoltre, la realizzazione dei circuiti fotonici e CMOS su due chip separati (circuito integrato fotonico al silicio e circuito integrato elettronico) garantisce scalabilità e ottimizzazione delle prestazioni, senza i compromessi e i compromessi necessari per combinare due tecnologie molto diverse su un unico chip.

L'accumulo di pacchetti, sistemi e piattaforme avanzati consente inoltre a Intel di ottimizzare le soluzioni I/O ottiche.Intel sta investendo nella ricerca e nello sviluppo di nuovi nodi del processo di produzione della fotonica del silicio per ottenere miglioramenti prestazionali dei dispositivi, maggiore densità, migliore accoppiamento e maggiori vantaggi economici. Continuerà inoltre a migliorare le prestazioni e i costi dei laser su chip e dei ricetrasmettitori ottici e affidabilità.

Conclusione: passaggio dal prototipo tecnologico alla soluzione di commercializzazione

Nel campo della fotonica del silicio, Intel Research Institute è profondamente coinvolto nella fotonica del silicio da oltre 25 anni ed è pioniere e leader nell'integrazione della fotonica del silicio. Intel è la prima nel settore a sviluppare e fornire dispositivi di connettività fotonica in silicio in grandi quantità a grandi fornitori di servizi cloud e sta collaborando con i clienti per trasformare i prototipi della tecnologia dei chip OCI in soluzioni commerciali scalabili.

In termini di costi, Intel ritiene che nel tempo e con l'aumento dei volumi, il costo totale di interconnessione per bit per l'I/O ottico diventerà paragonabile all'I/O elettrico a livello di sistema. Prestazioni I/O ottiche più potenti aiutano anche a migliorare le prestazioni a livello di sistema.

Per raggiungere questo obiettivo, Intel sta attualmente sviluppando un nodo del processo di produzione fotonica del silicio di seconda generazione, che dovrebbe ridurre l'area del chip di oltre il 40% e il consumo energetico di oltre il 15%, migliorando così i vantaggi economici e l'efficienza dell'accoppiamento ottico. la potenza del laser, ecc. fa progressi.