nouvelles

L'épée pointe vers 32Tbps !Intel révèle une feuille de route pour l'intégration de la photonique sur silicium et les puces OCI jettent les bases de la future infrastructure d'IA

2024-08-01

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Xinxi a rapporté le 31 juillet que la Conférence sur les communications par fibre optique (OFC) est reconnue comme l'événement international le plus exigeant et le plus important dans le domaine des communications optiques au monde, et qu'elle constitue le moteur du développement de technologies de communications optiques de pointe. Lors de la conférence sur les communications par fibre optique de cette année, l'équipe Intel Silicon Photonics Integrated Solutions (IPS) a partagé ses progrès révolutionnaires dans la promotion de l'innovation dans la technologie d'interconnexion à large bande passante -Matrice OCI (Optical Computing Interconnect) entièrement intégrée et leader du secteur, livrée avec des processeurs Intel pour exécuter des données réelles

Pour les centres de données et les applications de calcul haute performance (HPC), le cœur OCI créé par Intel réalise un co-package d'E/S optiques et peut prendre en charge 64 canaux à 32 Gbit/s dans une direction sur des fibres optiques jusqu'à 100 mètres de long. la demande croissante d’infrastructures d’IA. Demande croissante de bande passante plus élevée, de consommation d’énergie réduite et de distance de transmission plus longue.

Intel n'a pas divulgué les dimensions exactes des pastilles OCI, mais des photos récemment publiées montrent les pastilles OCI comparées à la gomme au bout d'un crayon standard n°2.

Concernant des détails plus techniques sur les puces principales OCI, Song Jiqiang, vice-président de l'Intel Research Institute et directeur de l'Intel China Research Institute, a récemment eu des échanges approfondis avec les principaux médias et d'autres médias.Song Jiqiang a partagé la future feuille de route d'innovation d'Intel pour l'intégration photonique sur silicium. En augmentant le débit de ligne, le nombre de longueurs d'onde par fibre, le nombre de fibres et le mode de polarisation, il est prévu d'étendre les performances des futures générations de cœurs OCI et de créer un réseau. bande passante allant jusqu'à32 Tbit/sappareil.

Intel fournit des puces OCI à divers clients internes et externes. Les applications spécifiques des clients et les exigences des produits détermineront la séquence et le calendrier de ces programmes d'expansion.

1. L'électricité remplacée par la lumière au silicium ≈ vélo transformé en moto

À mesure que le développement de l'IA générative s'accélère, les grands modèles nécessitent une densité de calcul élevée, une capacité de mémoire et une bande passante importantes, et sont difficiles à déployer sur un seul nœud de serveur, des connexions entre racks sont donc nécessaires. Les grands clusters informatiques signifient des distances de transmission plus longues et des besoins en bande passante d'E/S plus élevés.

Song Jiqiang a déclaré que les applications d'IA ont atteint un nouveau niveau en termes de taux de stockage et de calcul, et que l'accès à la mémoire est souvent nécessaire. Par conséquent, les canaux mémoire et les retards affecteront la manière de fournir des services d'application à grande échelle à l'avenir. Cela nécessite d'explorer de nouvelles méthodes,Tout en augmentant la puissance de calcul et la densité de stockage, il réduit la consommation d'énergie et la taille, plaçant ainsi plus de calcul et de stockage (puces) dans un espace limité.

Dans le passé, les E/S électriques utilisaient des fils de cuivre pour compléter l'interconnexion entre les puces. La vitesse du fil de cuivre est suffisamment rapide et la consommation d'énergie est faible, mais la distance de transmission effective est très limitée, aussi courte que.Environ 1 mètre

Si vous construisez un cluster dans l'ensemble du centre de données, vous serez également confronté aux problèmes d'une grande zone de cluster, de longs câbles et d'une consommation d'énergie élevée pour la transmission longue distance, ce qui rend difficile l'obtention d'une puissance de calcul élevée et d'économies d'énergie. Il existe de nombreux nœuds de serveur placés dans un centre de données, et il existe une limite supérieure à la puissance pouvant être fournie. En plus des puces, il existe également des E/S et d'autres endroits qui consomment de l'énergie dans le rack. la consommation allouée à chaque puce est très limitée.

Selon Song Jiqiang, au cours des 20 à 30 dernières années, les E/S dans l'ensemble du secteur informatique ont nécessité de plus en plus d'énergie. Si la technologie actuelle est utilisée et que l'échelle actuelle est utilisée pour croître, elle consommera toute l'énergie fournie. Au rack, il n'y a donc pas assez d'électricité pour effectuer les opérations de lecture et d'écriture dans les puces de calcul et de stockage, doncDe nouvelles solutions techniques doivent être utilisées pour supprimer la puissance utilisée dans la partie E/S.

Intel compare les E/S électriques traditionnelles à une calèche, avec une vitesse et une distance de transmission limitées ;Dans un rayon de 100 mètresPour obtenir une transmission de données plus dense et plus flexible, la méthode d'intégration photonique au silicium est comme une moto légère, rapide, flexible, efficace et économe en énergie ;Plus de 100 mètresPour la transmission longue distance, utiliser un émetteur-récepteur optique enfichable revient à remplacer une voiture avec une plus grande capacité et une vitesse suffisamment rapide.

Les E/S optiques et les émetteurs-récepteurs optiques enfichables sontInterconnexion photonique au siliciumLa solution présente l’avantage d’une faible consommation d’énergie et convient à la transmission sur de plus longues distances.

Émetteur-récepteur optique enfichableLa solution est relativement mature et peut être directement connectée à l'interface du circuit intégré électronique (EIC), ce qui peut augmenter la distance de transmission. Cependant, elle est plus grande et nécessite généralement un sérialiseur et un désérialiseur à grande vitesse (SerDes) ou un traitement du signal numérique. (DSP) La fonctionnalité est donc limitée. La consommation est plus élevée, la densité de bande passante est plus faible et le délai est plus long.

Et en utilisantIntégration photonique sur siliciumTechnologie, les E/S optiques peuvent atteindre une bande passante de plusieurs Tbps avec une faible consommation d'énergie, une densité de bande passante élevée, une faible latence et une distance de transmission plus longue pour répondre aux besoins d'expansion de l'IA.

Particules centrales OCI(ou toute solution d'E/S optique) co-scellée avec le CPU, le GPU ou le SoC peut optimiser et améliorer la densité de bande passante d'E/S, l'efficacité énergétique totale, la latence et le coût, ainsi que grâce à de nouvelles architectures prenant en charge la désagrégation des ressources telles que HBM. ou pool de mémoire CXL) pour obtenir une utilisation plus efficace des ressources.

À l'avenir, Intel proposera différentes solutions pour différentes distances de transmission, notamment des solutions de co-packaging optoélectroniques OCI et enfichables.

deux,Emballé conjointement avec le CPU,Comment la puce Intel OCI apporte-t-elle l’efficacité énergétique ?

La puce Intel OCI est un dispositif d'E/S optique à couche physique complet, comprenant un circuit intégré photonique (PIC) sur silicium avec des lasers de multiplexage par répartition en longueur d'onde dense sur puce et des amplificateurs optiques à semi-conducteurs, ainsi qu'un EIC pour contrôler le PIC et se connecter à l'hôte. .

La fonction de l'EIC est plus proche de la manière dont des signaux spécifiques sont utilisés et des parties qui y sont connectées. Elle deviendra une couche de conversion et d'adaptation dans un protocole. Le PIC vise davantage à résoudre le problème de la transmission stable de la lumière, de la mise à niveau et de l'envoi de signaux, ainsi que de l'évolution durable, comme la manière de réaliser une bonne conversion entre les supports diélectriques et optiques.

EIC utilise des nœuds de processus CMOS standard et PIC utilise le processus de fabrication photonique sur silicium d'Intel basé sur des tranches de silicium de 300 mm. Habituellement, EIC utilise un processus relativement avancé pour être proche ou aligné sur la puce principale à prendre en charge, tandis que PIC utilise un processus plus mature.

Puisqu'il n'existe pas de méthode enfichable, ces composants informatiques eux-mêmes ont une consommation moindre. Tout en augmentant la bande passante et en étendant la distance de transmission, ils peuvent améliorer efficacement l'intégration des interconnexions optiques en silicium, améliorant ainsi les performances et la consommation d'énergie, et contribuant à augmenter la densité des clusters.

La puce OCI entièrement intégrée d'Intel permet des vitesses de transmission de données bidirectionnelles allant jusqu'à4 Tbps, et compatible avecPCIe 5ème génération, assistance à sens unique64 voies de 32 Gbit/s(Song Jiqiang a déclaré que cela était suffisant dans les centres de données actuels), avec une distance de transmission allant jusqu'à100 mètres(En raison des délais de transmission, la distance peut être limitée à des dizaines de mètres dans les applications réelles).

Il utilise 8 paires de fibres optiques, chacune avec 8 longueurs d'onde de multiplexage par répartition en longueur d'onde dense (DWDM), et la consommation d'énergie est seulement5pJ par bit(picojoules), seule consommation électrique du module émetteur-récepteur optique enfichable1/3

Selon Song Jiqiang, Intel est convaincu que grâce à diverses améliorations dans la conception des appareils et des emballages, dans les processus de fabrication et dans l'expansion de la bande passante, l'efficacité énergétique sera réduite à 10 % dans les générations suivantes de produits.3,5PJ par bitce qui suit.

Lors de la conférence sur les communications par fibre optique de 2024, Intel a réalisé une démonstration de liaison optique en direct, montrant l'interconnexion de l'émetteur et du récepteur entre deux plates-formes CPU de centre de données via des cavaliers à fibre monomode (SMF).

Le CPU génère et mesure le taux d'erreur sur les bits. Deux processeurs de centre de données s'envoient et reçoivent des données. Un cœur OCI et un processeur sont regroupés conjointement. Le cœur OCI convertit tous les signaux d'E/S électriques du processeur en lumière, via des fibres optiques, transmises. allers-retours entre les nœuds ou les systèmes.

Comme le montre la figure, il existe des signaux électriques dans les hôtes du système des deux côtés, qui sont transformés en lumière grâce à des puces de conversion photoélectrique. L'émetteur a un spectre total de 1,6 THz, dont 8 longueurs d'onde espacées de 200 GHz sur une seule fibre, et un diagramme oculaire de l'émetteur de 32 Gbit/s indique une forte qualité de signal.

La partie colorée est de la lumière et différentes couleurs représentent une lumière de différentes longueurs d'onde, avec des intervalles de fréquence suffisants pour qu'elles n'interfèrent pas les unes avec les autres pendant la modulation et la démodulation. Ces lumières peuvent être combinées et transmises sur une seule fibre optique, c'est-à-dire que plusieurs bandes peuvent être « multiplexées » sur une seule fibre optique, ce qui équivaut au multiplexage par répartition en fréquence dans le domaine des communications sans fil.

Étant donné que la bande passante de la lumière est très large, vous pouvez sélectionner une bande passante relativement stable et la découper en de nombreuses bandes d'ondes différentes, qui apparaissent à l'œil humain comme une lumière de différentes couleurs. En fait, ce sont des bandes de fréquences différentes, et le signal à transmettre peut être modulé de manière stable sur chaque bande. Après modulation photoélectrique, le signal est transmis via fibre optique.

Song Jiqiang a partagé la feuille de route d'évolution des performances des puces Intel OCI. Il existe trois directions principales pour l'itération technologique :Le nombre de longueurs d'onde des ondes lumineuses, le taux de transmission des fibres optiques et le nombre de fibres optiques.

Une fibre optique peut être divisée en différentes bandes pour la transmission. Actuellement, 8 bandes peuvent assurer une transmission stable, le taux de transmission des données débogué à la lumière de chaque bande est de 32 Gbit/s. Le nombre de paires de fibres optiques pouvant être assemblées en même temps. sans s'affecter, c'est 8. c'est vrai. Multipliée par trois, la vitesse de transmission de données unidirectionnelle atteint 2 Tbps et la vitesse bidirectionnelle est de 4 Tbps.

À l'avenir, si la bande à 8 bandes reste inchangée et que le débit de transmission par fibre optique est augmenté à 64 Gbit/s, la vitesse de transmission de données unidirectionnelle sera doublée pour atteindre 4 Tbit/s. Plus tard, si elle passe à 16 bandes, la vitesse de transmission sera. augmenté à 8Tbps. Il peut continuer à évoluer dans le futur et augmenter progressivement la bande passante.

3. À l'avenir, il pourra également être intégré au GPU, à plusieursDémanteler les avantages différentiels

Par rapport aux solutions séparées et enfichables,Lorsque la puce OCI et le CPU sont scellés ensemble, la gestion thermique doit être considérée dans son ensemble, et la densité de transmission du signal et la fréquence de transmission doivent être garanties au niveau de l'emballage. . La technologie actuelle d'Intel est déjà capable de répondre à ces besoins.

À l’avenir, les puces OCI pourront être utilisées pour mettre en œuvre des communications et pourront également être intégrées à des puces informatiques telles que CPU, GPU et IPU.Grâce à l'intégration de la photonique sur silicium et à une technologie d'emballage avancée, Intel peut obtenir des puces d'E/S de plus haute densité, puis les combiner avec d'autres xPU pour former de nombreux types différents de puces informatiques et d'interconnexion basées sur les puces à l'avenir, avec des perspectives d'application prometteuses.

Song Jiqiang a en outre expliqué que le défi de l'intégration ultérieure avec d'autres types de puces ne se situe pas au niveau technique, mais au niveau de la mise en œuvre, ce à quoi il faut prêter attention.densité de bande passante , par exemple, lorsque la distance entre les interfaces photoélectriques est limitée, comment mettre en place ces interfaces de conversion photoélectrique ? La densité de bande passante réalisable est-elle suffisante dans une certaine plage de taille ?

Selon lui, afin de rendre la puce OCI plus flexible et de réduire la charge de travail pendant le processus d'intégration,En règle générale, on envisagerait d'utiliser une interface électrique entre le xPU hôte et les E/S qui a été standardisée via un écosystème IP robuste, tel que UCIe, PCIe, Ethernet, etc.

Il a également évoqué les avantages différentiels de la solution Intel.

Premièrement, Intel peut produire en masse des lasers hautement intégrés au niveau des tranches, avec un rendement et une fiabilité plus élevés et un coût total inférieur. Ce n’est qu’après avoir transformé la théorie en production à haut rendement que les capacités d’industrialisation pourront être formées.

Les solutions laser externes existantes nécessitent l'utilisation de fibres optiques spécialisées, qui sont coûteuses et n'ont pas de cas de déploiement à grande échelle.L’avantage des lasers sur puce est qu’ils peuvent être transmis à l’aide de fibres optiques ordinaires. Puisqu’aucune source de lumière externe n’est requise, il n’est pas nécessaire de recourir à des fibres de maintien de polarisation.(PMF, une fibre optique spéciale nécessaire pour connecter des sources de lumière externes à des circuits intégrés photoniques passifs en silicium).

Lors de la fabrication d'un émetteur laser, il est relativement simple de créer un appareil séparé. Il existe un seuil technique pour fabriquer un laser sur une tranche. Différents types de semi-conducteurs doivent être bien liés au niveau de la tranche, puis le circuit de contrôle peut être formé via le processus de fabrication des semi-conducteurs. Les dispositifs optiques, notamment les sources de lumière, les modulateurs, les amplificateurs, les guides d'ondes optiques, les détecteurs, etc. doivent être mis en œuvre au niveau de la tranche.

Deuxièmement, Intel dispose de plates-formes et d'appareils éprouvés et à grand volume, dotés d'une fiabilité de pointe.

Les puces Intel OCI sont construites sur une plate-forme d'intégration photonique sur silicium interne et éprouvée en production qui a fourni plus de 100 % des applications de connectivité dans les centres de données hyperscale depuis 2015.8 millionsModules émetteurs-récepteurs optiques (dont plus de8 millionsCircuits intégrés photoniques sur silicium et au-delà32 millionsLaser intégré), utilisé pour les applications nécessitant des taux de transmission allant jusqu'à 100 Gbit/s, 200 Gbit/s et 400 Gbit/s.

Sa fiabilité a été vérifiée sur des millions d'appareils et les données montrent que le taux de défaillance de la base de temps (FIT) du laser est inférieur à0.1, ce qui revient à dire qu'une panne ne peut survenir qu'une fois toutes les 10 milliards d'heures.

De plus, la construction des circuits photoniques et CMOS sur deux puces distinctes (circuit intégré photonique au silicium et circuit intégré électronique) garantit l'évolutivité et l'optimisation des performances., sans les compromis et les compromis nécessaires pour combiner deux technologies très différentes sur une seule puce.

L'accumulation par Intel d'emballages, de systèmes et de plates-formes avancés lui permet également d'optimiser les solutions d'E/S optiques.Intel investit dans la recherche et le développement de nouveaux nœuds de processus de fabrication photonique sur silicium pour obtenir des améliorations de pointe en matière de performances des appareils, une densité plus élevée, un meilleur couplage et des avantages économiques plus élevés. Il continuera également à améliorer les performances et le coût des lasers et des émetteurs-récepteurs optiques sur puce. .et la fiabilité.

Conclusion : Passer du prototype technologique à la solution de commercialisation

Dans le domaine de la photonique sur silicium, l'Intel Research Institute est profondément impliqué dans la photonique sur silicium depuis plus de 25 ans et est un pionnier et un leader dans l'intégration de la photonique sur silicium. Intel est le premier du secteur à développer et à fournir des dispositifs de connectivité photonique sur silicium en volume à de grands fournisseurs de services cloud, et travaille avec ses clients pour transformer les prototypes de technologie de puce OCI en solutions commerciales évolutives.

En termes de coût, Intel estime qu'avec le temps et à mesure que les volumes augmentent, le coût total d'interconnexion par bit pour les E/S optiques deviendra comparable à celui des E/S électriques au niveau du système. Des performances d’E/S optiques plus élevées contribuent également à améliorer les performances au niveau du système.

Pour atteindre cet objectif, Intel développe actuellement un nœud de processus de fabrication photonique sur silicium de deuxième génération, qui devrait réduire la surface de la puce de plus de 40 % et la consommation d'énergie de plus de 15 %, améliorant ainsi les avantages économiques et l'efficacité du couplage optique. la puissance laser, etc. progresse.