nouvelles

L'interconnexion entre CPU et GPU est passée de 1 mètre à 100 mètres Intel : croyez-vous à la lumière ?

2024-07-27

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Jin Lei vient du temple Aofei
Qubits | Compte public QbitAI

Pour Intel"Lumière", résolvant l'épineux problème de la puissance de calcul à l'ère des grands modèles——

Lancement du premier système entièrement intégré du secteurOCI(Optical Computing Interconnect).



△Source : Intel

Vous devez savoir que lorsque les grands modèles d'IA suivent la loi de mise à l'échelle, afin d'obtenir de meilleurs résultats, soit l'échelle du modèle, soit l'échelle des données évolue vers une tendance plus large.

Cela amènera les grands modèles d'IA à mettre en avant des exigences plus élevées sur l'ensemble du calcul et du stockage, y compris la communication E/S intermédiaire, au niveau de la puissance de calcul.

La percée d’Intel cette fois est exactementCommunication E/S

En CPU et GPU,Utilisez des E/S optiques au lieu des E/S électriques pour la transmission des données.

Quelle est l'utilité?

En un mot,La distance de transmission des données est beaucoup plus longueLa quantité est grandeLa consommation d'énergie est faible——Le « physique » est plus adapté aux grands modèles d'IA.



△Source : Intel

Alors pourquoi Intel utilise-t-il la « lumière » ? Comment est-il mis en œuvre concrètement ?

En utilisant la « lumière », il est passé d'une calèche à un camion

La méthode traditionnelle d'E/S électrique (connexion par fil de cuivre) a certainement ses avantages, comme la prise en charge d'une densité de bande passante élevée et d'une faible consommation d'énergie, mais le problème fatal estLa distance de transmission est relativement courte (moins de 1 mètre)

Il n'y a aucun problème si celui-ci est placé dans un rack, mais la puissance de calcul des grands modèles d'IA se situe souvent au niveau d'un cluster de serveurs.

Non seulement il occupe une grande surface, mais il s'étend également sur N racks. Les câbles doivent mesurer des dizaines, voire des centaines de mètres de long, et la consommation électrique est assez élevée ; qu'il n'y a pas assez de puissance pour effectuer des opérations de calcul et de lecture et d'écriture sur la puce mémoire.

en plus,Ratio dépôt/compteD'un autre côté, c'est précisément en raison des « grandes » caractéristiques des grands modèles que le rapport initial entre une lecture unique et des centaines de calculs est désormais devenu proche de 1 : 1.



△Source : Intel

Cela nécessite une nouvelle méthode capable d'augmenter la puissance de calcul et la densité de stockage tout en réduisant la consommation d'énergie et la taille, plaçant ainsi plus de calcul et de stockage dans un espace limité.

Avec les E/S optiques, le problème est résolu :

Il peut prendre en charge 64 canaux 32 Gbit/s dans une direction sur fibre optique jusqu'à 100 mètres.

Une métaphore d'image est, tout comme l'utilisationle chariot(capacité et distance limitées) à utiliservoitures et camionspour livrer des marchandises (quantités plus importantes et distances plus grandes).

De plus, même s'il s'agit d'effectuer un travail de transmission de données à plus haute densité et plus flexible à une distance relativement courte, l'OCI peut être comparé àmoto, plus rapide et plus flexible.

Il convient de mentionner que cette méthode OCI n’est pas seulement théorique.

Selon Intel, ils ont tiré parti de la technologie éprouvée de photonique sur silicium pour intégrer des circuits intégrés photoniques sur silicium (PIC) contenant des lasers sur puce, des amplificateurs optiques et des circuits intégrés électroniques.

Et il a déjà démontré que les puces OCI fournies avec son propre processeur peuvent également être intégrées à des SOC (systèmes sur puce) tels que les processeurs, GPU et IPU de nouvelle génération.

Ce n'est pas encore terminé : Intel a expédié plus de 8 millions de circuits intégrés photoniques au silicium, parmi lesquels plus de 32 millions de lasers sont désormais utilisés.



△Source : Intel

La question suivante est donc :

Comment l'OCI d'Intel est-il « raffiné » ?

Vice-président d'Intel Research et directeur d'Intel China ResearchChanson JiqiangAu cours du processus de communication, il a procédé à une analyse et une interprétation approfondie de cette question.



△Song Jiqiang, vice-président de l'Institut de recherche Intel et directeur de l'Institut de recherche Intel Chine

La technologie photonique sur silicium combine deux des inventions les plus importantes du XXe siècle : les circuits intégrés au silicium et les lasers à semi-conducteurs.

Il prend en charge des vitesses de transfert de données plus rapides sur de plus longues distances que l'électronique traditionnelle, tout en tirant parti de l'efficacité de la fabrication de silicium en grand volume d'Intel.



Technologie d'intégration photonique sur silicium publiée cette fois par Intel, les puces OCI ont atteint le niveau du co-packaging optoélectronique.

Ce co-package optoélectronique place un circuit intégré photonique au silicium (PIC) et un circuit intégré électronique (EIC) sur un substrat pour former une puce OCI, qui sert de composant de connexion intégré.

Cela signifie que les xPU, y compris le CPU, et les futurs GPU peuvent être emballés avec des puces OCI.

Le cœur OCI convertit tous les signaux d'E/S électriques du processeur du centre de données en lumière et les transmet entre les nœuds ou les systèmes des deux centres de données via des fibres optiques.

La vitesse actuelle de transmission de données bidirectionnelle atteint 4 Tbit/s. Son protocole de transmission de couche supérieure est compatible avec PCIe 5.0 et prend en charge 64 canaux de 32 Gbit/s dans une direction, ce qui est suffisant dans les centres de données actuels :

Il utilise 8 paires de fibres optiques et consomme seulement 5 picojoules (pJ) par bit, soit 10 à 12 joules, ces données sont trois fois inférieures à la consommation électrique des modules émetteurs-récepteurs optiques enfichables (cette dernière est de 15 picojoules par bit). ).



△Source : Intel

Dans un canal de transmission optique, il comporte en réalité 8 bandes différentes. L'intervalle de fréquence de chaque bande est de 200 GHz, occupant un espacement spectral total de 1,6 THz pour la transmission.

La lumière va de la lumière visible à la lumière invisible. En fait, sa largeur de spectre est très large, à partir du THz, elle est proche de la communication optique.



Alors, dans quels domaines les particules centrales OCI seront-elles utilisées à l’avenir ?

À cet égard, Song Jiqiang a déclaré :

La première est que vous pouvez l'utiliser pour établir la communication, et vous pouvez également l'emballer avec des puces informatiques telles que le CPU et le GPU. L'informatique et la communication sont très étroitement regroupées.
Grâce à l'intégration de la photonique sur silicium et à la technologie d'emballage avancée, Intel dispose également de nombreuses technologies différentes pour obtenir des puces d'E/S de plus haute densité, puis les combiner avec d'autres xPU pour former de nombreux types différents basés sur les puces du futur. et les puces d'interconnexion auront de très bonnes perspectives d'application.

À en juger par la feuille de route d'évolution des performances de la puce d'interface d'E/S OCI, elle peut actuellement atteindre une solution technique de vitesse de transmission de 32 Tbps, en s'appuyant principalement sur l'amélioration itérative et constante de trois indicateurs, à savoir :

  • Il y a 8 bandes stables dans une fibre optique
  • Le taux de transmission de données optiques de chaque bande est de 32 Gbit/s
  • Peut tirer 8 paires de fibres optiques en même temps sans s'affecter

Multipliée par ces trois indicateurs, la vitesse actuelle de transmission des données est de 2 Tbps dans un sens et de 4 Tbps dans les deux sens. À l’avenir, nous pourrons continuer à évoluer vers le haut et améliorer progressivement les capacités de bande passante.



△Source : Intel

Enfin, Song Jiqiang a également expliqué la différenciation d'Intel en matière de technologie d'intégration photonique sur silicium :

La raison principale est que nous construisons des émetteurs laser haute fréquence sur la tranche et intégrons des amplificateurs optiques en silicium. Il s'agit de deux technologies relativement fondamentales, toutes deux fabriquées au niveau de la tranche.
Ensuite, nous pouvons produire en masse de tels lasers hautement intégrés, car l’avantage de ce laser sur puce est qu’il peut être transmis à l’aide de fibres optiques ordinaires.
Et en termes de stabilité, c'est presqueIl faut 10 milliards d'heures pour qu'une erreur se produise

Alors que pensez-vous de la « lumière » du choix Intel ? Bienvenue à laisser un message dans la zone de commentaires pour discussion.

Liens de référence :
[1]https://mp.weixin.qq.com/s/ozx_ficqlxjEPKa5AlBdfA
[2]https://community.intel.com/t5/Blogs/Tech-Innovation/Artificial-Intelligence-AI/Intel-Shows-OCI-Optical-IO-Chiplet-Co-packaged-with-CPU-at/post/1582541
[3]https://www.youtube.com/watch?v=Fml3yuPR2AU