Nachricht

Das Schwert zeigt auf 32 Tbit/s!Intel enthüllt Roadmap für die Silizium-Photonik-Integration, OCI-Chips legen den Grundstein für zukünftige KI-Infrastruktur

2024-08-01

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Xinxi berichtete am 31. Juli, dass die Optical Fiber Communications Conference (OFC) als die weltweit höchste und größte internationale Veranstaltung im Bereich der optischen Kommunikation gilt und der Dreh- und Angelpunkt für die Entwicklung modernster optischer Kommunikationstechnologien sei. Auf der diesjährigen Optical Fiber Communications Conference präsentierte Intels Silicon Photonics Integrated Solutions (IPS)-Team seine bahnbrechenden Fortschritte bei der Förderung von Innovationen in der Verbindungstechnologie mit hoher Bandbreite –Branchenführender, vollständig integrierter OCI-Chip (Optical Computing Interconnect) mit Intel-CPUs zur Ausführung realer Daten

Für Rechenzentren und High-Performance-Computing-Anwendungen (HPC) realisiert der von Intel entwickelte OCI-Kern ein optisches I/O-Co-Paket und kann 64 32-Gbit/s-Kanäle in einer Richtung auf Glasfasern mit einer Länge von bis zu 100 Metern unterstützen die steigende Nachfrage nach KI-Infrastruktur. Wachsende Nachfrage nach höherer Bandbreite, geringerem Stromverbrauch und längerer Übertragungsentfernung.

Intel hat die genauen Abmessungen der OCI-Pellets nicht bekannt gegeben, aber kürzlich veröffentlichte Fotos zeigen die OCI-Pellets im Vergleich zum Radiergummi am Ende eines Standardbleistifts Nr. 2.

Bezüglich weiterer technischer Details der OCI-Core-Chips führte Song Jiqiang, Vizepräsident des Intel Research Institute und Direktor des Intel China Research Institute, kürzlich einen intensiven Austausch mit Core Media und anderen Medien.Song Jiqiang teilte Intels zukünftige Innovations-Roadmap für die Silizium-Photonik-Integration mit. Durch die Erhöhung der Leitungsrate, der Anzahl der Wellenlängen pro Faser, der Anzahl der Fasern und des Polarisationsmodus wird erwartet, dass die Leistung künftiger Generationen von OCI-Kernen erweitert und eine neue Generation geschaffen wird Bandbreite von bis zu32 Tbit/sGerät.

Intel beliefert verschiedene interne und externe Kunden mit OCI-Chips. Spezifische Kundenanwendungen und Produktanforderungen bestimmen die Reihenfolge und den Zeitpunkt dieser Expansionsprogramme.

1. Strom wird durch Silikonlicht ersetzt ≈ Fahrrad wird zum Motorrad

Da die Entwicklung generativer KI immer schneller voranschreitet, erfordern große Modelle eine hohe Rechendichte, große Speicherkapazität und Bandbreite und lassen sich nur schwer auf einem einzelnen Serverknoten bereitstellen, sodass Rack-übergreifende Verbindungen erforderlich sind. Große Rechencluster bedeuten längere Übertragungsentfernungen und höhere Anforderungen an die I/O-Bandbreite.

Song Jiqiang sagte, dass KI-Anwendungen in Bezug auf Speicher- und Berechnungsverhältnis ein neues Niveau erreicht haben und häufig Speicherzugriff erforderlich ist. Daher werden Speicherkanäle und Verzögerungen die Bereitstellung umfangreicher Anwendungsdienste in Zukunft beeinflussen. Dies erfordert die Erforschung einiger neuer Methoden,Während die Rechenleistung und die Speicherdichte erhöht werden, wird der Stromverbrauch gesenkt und die Größe verkleinert, wodurch mehr Rechenleistung und Speicher (Chips) auf begrenztem Raum untergebracht werden.

In der Vergangenheit wurden bei elektrischen E/A Kupferdrähte verwendet, um die Verbindung zwischen Chips herzustellen. Die Geschwindigkeit der Kupferdrähte ist hoch genug und der Stromverbrauch ist gering, aber die effektive Übertragungsentfernung ist sehr begrenzt und beträgt nur kurze ZeitUngefähr 1 Meter

Wenn Sie im gesamten Rechenzentrum einen Cluster aufbauen, treten auch die Probleme einer großen Clusterfläche, langer Kabel und eines hohen Stromverbrauchs bei der Übertragung über große Entfernungen auf, was es schwierig macht, sowohl eine hohe Rechenleistung als auch Energieeinsparungen zu erreichen. In einem Rechenzentrum gibt es viele Serverknoten, und es gibt eine Obergrenze für die Stromversorgung. Zusätzlich zu den Chips gibt es auch E/A- und andere Stellen im Rack, die Strom verbrauchen Der jedem Chip zugewiesene Verbrauch ist sehr begrenzt.

Laut Song Jiqiang hat die I/O in der gesamten Computerbranche in den letzten 20 bis 30 Jahren immer mehr Strom benötigt. Wenn die aktuelle Technologie genutzt wird und der aktuelle Maßstab wächst, wird sie die gesamte bereitgestellte Leistung verbrauchen Dadurch ist nicht genügend Strom vorhanden, um Lese- und Schreibvorgänge in den Rechen- und Speicherchips durchzuführenUm den Stromverbrauch im I/O-Teil zu unterdrücken, müssen neue technische Lösungen eingesetzt werden.

Intel vergleicht herkömmliche elektrische E/A mit einer Pferdekutsche mit begrenzter Übertragungsgeschwindigkeit und EntfernungInnerhalb von 100 MeternUm eine höhere Dichte und eine flexiblere Datenübertragung zu erreichen, ist die Silizium-Photonik-Integrationsmethode wie ein leichtes Motorrad, das schnell, flexibel, effektiv und energiesparend istMehr als 100 MeterFür die Übertragung über große Entfernungen ist die Verwendung eines steckbaren optischen Transceivers so, als würde man ein Auto mit größerer Kapazität und ausreichend hoher Geschwindigkeit ersetzen.

Optische I/O und steckbare optische Transceiver sind vorhandenSilizium-Photonische VerbindungDie Lösung hat den Vorteil eines geringen Stromverbrauchs und eignet sich für die Übertragung über größere Entfernungen.

Steckbarer optischer TransceiverDie Lösung ist relativ ausgereift und kann direkt an die Schnittstelle des elektronischen integrierten Schaltkreises (EIC) angeschlossen werden, was die Übertragungsentfernung erhöhen kann. Sie ist jedoch größer und erfordert normalerweise einen Hochgeschwindigkeits-Serialisierer und -Deserialisierer (SerDes) oder eine digitale Signalverarbeitung (DSP)-Technologie. Daher ist die Funktionalität eingeschränkt. Der Verbrauch ist höher, die Bandbreitendichte ist geringer und die Verzögerung ist länger.

Und durch die VerwendungSilizium-Photonik-IntegrationTechnologie, optische I/O kann eine Bandbreite von mehreren Tbit/s bei geringem Stromverbrauch, hoher Bandbreitendichte, geringer Latenz und längerer Übertragungsentfernung erreichen, um den Anforderungen der KI-Erweiterung gerecht zu werden.

OCI-Kernpartikel(oder jede optische I/O-Lösung), die zusammen mit der CPU, GPU oder dem SoC versiegelt ist, kann die I/O-Bandbreitendichte, die Gesamtenergieeffizienz, die Latenz und die Kosten optimieren und verbessern, sowie durch neue Architekturen, die die Ressourcendisaggregation unterstützen, wie z. B. HBM oder CXL-Speicherpooling), um eine effizientere Ressourcennutzung zu erreichen.

Künftig wird Intel verschiedene Lösungen für unterschiedliche Übertragungsentfernungen anbieten, darunter optoelektronische Co-Packaging- und steckbare OCI-Lösungen.

zwei,Gemeinsam mit der CPU verpackt,Wie sorgt der Intel OCI-Chip für Energieeffizienz?

Der Intel OCI-Chip ist ein komplettes optisches I/O-Gerät für die physikalische Schicht, einschließlich eines integrierten Silizium-Photonik-Schaltkreises (PIC) mit On-Chip-Lasern mit dichter Wellenlängenmultiplexierung und optischen Halbleiterverstärkern sowie einem EIC zur Steuerung des PIC und zur Verbindung mit dem Host .

Die Funktion von EIC hängt eher davon ab, wie bestimmte Signale verwendet werden und welche Teile damit verbunden sind. Es wird zu einer Konvertierungs- und Anpassungsschicht in einem Protokoll. Bei PIC geht es eher darum, das Problem der stabilen Lichtübertragung, der Verbesserung und Übertragung von Signalen und der nachhaltigen Entwicklung zu lösen, beispielsweise wie eine gute Umwandlung zwischen dielektrischen und optischen Medien durchgeführt werden kann.

EIC verwendet Standard-CMOS-Prozessknoten und PIC nutzt Intels Silizium-Photonik-Herstellungsprozess auf Basis von 300-mm-Siliziumwafern. Normalerweise verwendet EIC einen relativ fortschrittlichen Prozess, um nahe am zu unterstützenden Hauptchip zu sein oder diesen auszurichten, während PIC einen ausgereifteren Prozess verwendet.

Da es keine steckbare Methode gibt, haben solche Computerkomponenten selbst eine geringere Leistung. Während sie die Bandbreite erhöhen und die Übertragungsentfernung verlängern, können sie die Integration optischer Siliziumverbindungen effektiv verbessern, wodurch die Leistung und der Energieverbrauch verbessert und die Clusterdichte erhöht werden.

Der vollständig integrierte OCI-Chip von Intel ermöglicht bidirektionale Datenübertragungsgeschwindigkeiten von bis zu4 Tbit/s, und kompatibel mitPCIe 5. Generation, Einwegunterstützung64 Spuren mit 32 Gbit/s(Song Jiqiang sagte, dies sei in aktuellen Rechenzentren ausreichend), mit einer Übertragungsentfernung von bis zu100 Meter(Aufgrund von Übertragungsverzögerungen kann die Entfernung in tatsächlichen Anwendungen auf mehrere zehn Meter begrenzt sein).

Es verwendet 8 Paar Glasfasern mit jeweils 8 Wellenlängen des Dense Wavelength Division Multiplexing (DWDM) und hat einen geringen Stromverbrauch5pJ pro Bit(Pikojoule), nur Stromverbrauch des steckbaren optischen Transceivermoduls1/3

Laut Song Jiqiang ist Intel zuversichtlich, durch verschiedene Verbesserungen im Geräte- und Verpackungsdesign, in den Herstellungsprozessen und in der Bandbreitenerweiterung die Energieeffizienz in nachfolgenden Produktgenerationen auf bis zu 10 % senken zu können.3,5 PJ pro Bitdie folgende.

Auf der Optical Fiber Communications Conference 2024 führte Intel eine Live-Demonstration optischer Verbindungen durch, bei der die Sender- und Empfängerverbindung zwischen zwei Rechenzentrums-CPU-Plattformen über Singlemode-Glasfaserbrücken (SMF) gezeigt wurde.

Die CPU generiert und misst die Bitfehlerrate. Zwei Rechenzentrums-CPUs senden und empfangen Daten miteinander. Der OCI-Kern wandelt alle elektrischen I/O-Signale über optische Fasern in die beiden Rechenzentren um hin und her zwischen Knoten oder Systemen.

Wie in der Abbildung dargestellt, gibt es in den Systemhosts auf beiden Seiten elektrische Signale, die durch fotoelektrische Umwandlungschips in Licht umgewandelt werden. Der Sender verfügt über ein Gesamtspektrum von 1,6 THz, einschließlich 8 Wellenlängen im Abstand von 200 GHz auf einer einzelnen Faser, und ein 32-Gbit/s-Sender-Augendiagramm zeigt eine starke Signalqualität an.

Der farbige Teil ist Licht, und verschiedene Farben repräsentieren Licht unterschiedlicher Wellenlänge mit ausreichenden Frequenzintervallen, damit sie sich während der Modulation und Demodulation nicht gegenseitig stören. Diese Lichter können miteinander kombiniert und auf einer Glasfaser übertragen werden, d. h. mehrere Bänder können auf einer Glasfaser „multiplext“ werden, was dem Frequenzmultiplex im Bereich der drahtlosen Kommunikation entspricht.

Da die Bandbreite des Lichts sehr groß ist, kann man eine relativ stabile Bandbreite auswählen und sie in viele verschiedene Wellenbänder zerlegen, die für das menschliche Auge als Licht unterschiedlicher Farbe erscheinen. Tatsächlich handelt es sich um Bänder mit unterschiedlichen Frequenzen, und das zu übertragende Signal kann auf jedem Band stabil moduliert werden. Nach der photoelektrischen Modulation wird das Signal über eine Glasfaser übertragen.

Song Jiqiang teilte die Roadmap zur Leistungsentwicklung von Intel OCI-Chips mit. Es gibt drei Hauptrichtungen für die Technologieiteration:Die Anzahl der Wellenlängen von Lichtwellen, die Übertragungsrate von Lichtwellenleitern und die Anzahl von Lichtwellenleitern.

Eine Glasfaser kann zur Übertragung in verschiedene Bänder unterteilt werden. Derzeit kann eine stabile Übertragung der Datenübertragungsrate für jedes Band gewährleistet werden. Die Anzahl der Glasfaserpaare, die gleichzeitig zusammengestellt werden können ohne sich gegenseitig zu beeinflussen ist 8. richtig. Multipliziert mit drei beträgt die Datenübertragungsgeschwindigkeit in eine Richtung 2 Tbit/s und in beide Richtungen 4 Tbit/s.

Wenn das 8-Band-Band in Zukunft unverändert bleibt und die Glasfaserübertragungsrate auf 64 Gbit/s erhöht wird, wird die Einweg-Datenübertragungsgeschwindigkeit auf 4 Tbit/s verdoppelt. Wenn es später 16-Band wird, beträgt die Übertragungsgeschwindigkeit auf 8 Tbit/s erhöht. Es kann sich in Zukunft weiterentwickeln und die Bandbreite schrittweise erhöhen.

3. In Zukunft kann es auch mit mehreren GPUs integriert werdenAbbau der Differentialvorteile

Im Vergleich zu Einzel- und Plug-in-LösungenWenn der OCI-Chip und die CPU gemeinsam versiegelt werden, muss das Wärmemanagement als Ganzes betrachtet werden und die Signalübertragungsdichte und Übertragungsfrequenz muss auf Verpackungsebene sichergestellt werden. . Die aktuelle Technologie von Intel ist bereits in der Lage, diese Anforderungen zu erfüllen.

Zukünftig können OCI-Chips zur Implementierung der Kommunikation verwendet und auch in Computerchips wie CPU, GPU und IPU integriert werden.Durch Silizium-Photonik-Integration und fortschrittliche Verpackungstechnologie kann Intel I/O-Chips mit höherer Dichte erreichen und diese dann mit anderen xPUs kombinieren, um in Zukunft viele verschiedene Arten von Computer- und Verbindungschips auf Basis der Chips mit vielversprechenden Anwendungsaussichten zu bilden.

Song Jiqiang erklärte weiter, dass die Herausforderung der späteren Integration mit anderen Chiptypen nicht auf der technischen Ebene liegt, sondern auf der Implementierungsebene, worauf man achten mussBandbreitendichte Wenn beispielsweise der Abstand zwischen den fotoelektrischen Schnittstellen begrenzt ist, wie werden diese fotoelektrischen Umwandlungsschnittstellen eingebaut? Reicht die erreichbare Bandbreitendichte innerhalb eines bestimmten Größenbereichs aus?

Um den OCI-Chip flexibler zu machen und den Arbeitsaufwand während des Integrationsprozesses zu reduzieren, seien seiner Meinung nachTypischerweise würde man die Verwendung einer elektrischen Schnittstelle zwischen der Host-xPU und dem E/A in Betracht ziehen, die durch ein robustes IP-Ökosystem wie UCIe, PCIe, Ethernet usw. standardisiert wurde.

Er sprach auch über die unterschiedlichen Vorteile der Intel-Lösung.

Erstens kann Intel hochintegrierte Laser auf Wafer-Ebene in Massenproduktion herstellen, mit höherer Leistung und Zuverlässigkeit sowie niedrigeren Gesamtkosten. Erst nach der Umsetzung der Theorie in eine ertragsstarke Produktion können Industrialisierungsfähigkeiten geschaffen werden.

Bestehende externe Laserlösungen erfordern den Einsatz spezieller optischer Fasern, die kostspielig sind und keine großflächigen Einsatzmöglichkeiten bieten.Der Vorteil von On-Chip-Lasern besteht darin, dass sie mit herkömmlichen optischen Fasern übertragen werden können. Da keine externe Lichtquelle erforderlich ist, sind keine polarisationserhaltenden Fasern erforderlich.(PMF, eine spezielle optische Faser, die zum Anschluss externer Lichtquellen an passive photonische integrierte Siliziumschaltkreise erforderlich ist).

Bei der Herstellung eines Lasersenders ist es relativ einfach, ein separates Gerät herzustellen. Es gibt einen technischen Schwellenwert für die Herstellung eines Lasers auf einem Wafer. Verschiedene Arten von Halbleitern müssen auf Waferebene gut verbunden sein, und dann kann der Steuerkreis durch den Halbleiterherstellungsprozess gebildet werden. Optische Geräte einschließlich Lichtquellen, Modulatoren, Verstärker, optische Wellenleiter, Detektoren usw. müssen auf Waferebene implementiert werden.

Zweitens verfügt Intel über hochvolumige, bewährte Plattformen und Geräte mit branchenführender Zuverlässigkeit.

Intel OCI-Chips basieren auf einer hauseigenen, produktionserprobten Silizium-Photonik-Integrationsplattform, die seit 2015 mehr als 100 % der Konnektivitätsanwendungen in Hyperscale-Rechenzentren bereitgestellt hat.8 MillionenOptische Transceiver-Module (einschließlich mehr als8 MillionenIntegrierte Silizium-Photonik-Schaltkreise und darüber hinaus32 MillionenIntegrierter Laser), der für Anwendungen verwendet wird, die Übertragungsraten von bis zu 100 Gbit/s, 200 Gbit/s und 400 Gbit/s erfordern.

Seine Zuverlässigkeit wurde an Millionen von Geräten überprüft und Daten zeigen, dass die Zeitbasisausfallrate (FIT) des Lasers weniger als beträgt0.1, was der Aussage entspricht, dass ein Ausfall nur einmal alle 10 Milliarden Stunden auftreten darf.

Darüber hinaus gewährleistet der Aufbau der Photonik- und CMOS-Schaltkreise auf zwei separaten Chips (integrierter Silizium-Photonik-Schaltkreis und elektronischer integrierter Schaltkreis) Skalierbarkeit und Leistungsoptimierung, ohne die Kompromisse und Kompromisse, die notwendig sind, um zwei sehr unterschiedliche Technologien auf einem einzigen Chip zu kombinieren.

Dank der Anhäufung fortschrittlicher Pakete, Systeme und Plattformen ist Intel auch in der Lage, optische I/O-Lösungen zu optimieren.Intel investiert in die Forschung und Entwicklung neuer Silizium-Photonik-Herstellungsprozessknoten, um führende Geräteleistungsverbesserungen, höhere Dichte, bessere Kopplung und größere wirtschaftliche Vorteile zu erreichen. Außerdem wird es die Leistung und Kosten von On-Chip-Lasern und optischen Transceivern weiter verbessern . und Zuverlässigkeit.

Fazit: Übergang vom Technologieprototyp zur Kommerzialisierungslösung

Im Bereich der Silizium-Photonik beschäftigt sich das Intel Research Institute seit mehr als 25 Jahren intensiv mit der Silizium-Photonik und ist ein Pionier und Marktführer bei der Integration der Silizium-Photonik. Intel ist das erste Unternehmen der Branche, das Silizium-Photonik-Konnektivitätsgeräte in großen Mengen an große Cloud-Dienstleister entwickelt und liefert, und arbeitet mit Kunden zusammen, um Prototypen der OCI-Chiptechnologie in skalierbare, kommerzielle Lösungen umzuwandeln.

Hinsichtlich der Kosten geht Intel davon aus, dass mit der Zeit und bei steigenden Volumina die Gesamtverbindungskosten pro Bit für optische I/O mit denen für elektrische I/O auf Systemebene vergleichbar werden. Eine stärkere optische I/O-Leistung trägt auch zur Verbesserung der Leistung auf Systemebene bei.

Um dieses Ziel zu erreichen, entwickelt Intel derzeit einen Silizium-Photonik-Herstellungsprozessknoten der zweiten Generation, der die Chipfläche um mehr als 40 % und den Stromverbrauch um mehr als 15 % reduzieren soll, wodurch sich der wirtschaftliche Nutzen erhöht und die Effizienz der optischen Kopplung verbessert wird. Laserleistung usw. machen Fortschritte.