Belegung

Die Verbindung zwischen CPU und GPU ist von 1 Meter auf 100 Meter gestiegen. Intel: Glauben Sie an Licht?

2024-07-27

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Jin Lei stammt aus dem Aofei-Tempel
Qubits |. Öffentliches Konto QbitAI

Für Intel"Licht", Durchbruch des heiklen Rechenleistungsproblems im Zeitalter großer Modelle——

Markteinführung des ersten vollständig integrierten Unternehmens der BrancheOCI(Optical Computing Interconnect)-Chip.



△Quelle: Intel

Sie müssen wissen, dass sich entweder der Modellmaßstab oder der Datenmaßstab in Richtung eines größeren Trends entwickelt, wenn große KI-Modelle dem Skalierungsgesetz folgen, um bessere Ergebnisse zu erzielen.

Dies wird dazu führen, dass große KI-Modelle höhere Anforderungen an die gesamte Rechenleistung und Speicherung, einschließlich der zwischengeschalteten I/O-Kommunikation, auf der Ebene der Rechenleistung stellen.

Der Durchbruch von Intel ist dieses Mal genau das RichtigeI/O-Kommunikation

In CPU und GPU,Verwenden Sie für die Datenübertragung optische I/O statt elektrischer I/O.

Was ist der Nutzen?

Kurzgesagt,Die Datenübertragungsentfernung ist viel längerDie Menge ist großDer Stromverbrauch ist gering——Der „Körper“ eignet sich eher für große KI-Modelle.



△Quelle: Intel

Warum verwendet Intel also „Licht“? Wie wird es konkret umgesetzt?

Mit „light“ verwandelte es sich von einer Kutsche in einen Lastwagen

Die herkömmliche Methode der elektrischen E/A (Kupferdrahtverbindung) hat sicherlich ihre Vorteile, wie z. B. die Unterstützung einer hohen Bandbreitendichte und eines geringen Stromverbrauchs, aber das fatale Problem besteht darinDie Übertragungsentfernung ist relativ kurz (weniger als 1 Meter)

Die Platzierung in einem Rack stellt kein Problem dar, allerdings liegt die Rechenleistung großer KI-Modelle oft auf dem Niveau eines Server-Clusters.

Es nimmt nicht nur eine große Fläche ein, sondern erstreckt sich auch über N Racks. Die Kabel müssen mehrere Dutzend oder sogar Hunderte Meter lang sein, und der Stromverbrauch ist ziemlich hoch dass nicht genügend Leistung vorhanden ist, um Lese- und Schreibvorgänge für Rechen- und Speicherchips durchzuführen.

außerdem,Verhältnis Einlage zu KontoAndererseits liegt das ursprüngliche Verhältnis von einmaligem Lesen und Hunderten von Berechnungen gerade aufgrund der „großen“ Eigenschaften großer Modelle mittlerweile bei nahezu 1:1.



△Quelle: Intel

Dies erfordert eine neue Methode, die die Rechenleistung und Speicherdichte erhöhen und gleichzeitig den Stromverbrauch senken und die Größe verkleinern kann, wodurch mehr Rechenleistung und Speicher auf begrenztem Raum untergebracht werden können.

Mit optischem I/O ist das Problem gelöst:

Es kann 64 32-Gbit/s-Kanäle in einer Richtung über Glasfaser bis zu 100 Metern unterstützen.

Eine Bildmetapher ist, genau wie die VerwendungWagen(begrenzte Kapazität und Entfernung) zu verwendenAutos und Lastwagenzur Lieferung von Waren (größere Mengen und größere Entfernungen).

Darüber hinaus kann OCI mit OCI verglichen werden, auch wenn es darum geht, einige Datenübertragungsarbeiten mit höherer Dichte und Flexibilität in relativ kurzer Entfernung durchzuführenMotorrad, schneller und flexibler.

Es ist erwähnenswert, dass diese OCI-Methode nicht nur theoretisch ist.

Laut Intel haben sie die bewährte Silizium-Photonik-Technologie genutzt, um integrierte Silizium-Photonik-Schaltkreise (PICs) zu integrieren, die On-Chip-Laser, optische Verstärker und elektronische integrierte Schaltkreise enthalten.

Und es hat bereits gezeigt, dass OCI-Chips, die mit einer eigenen CPU ausgestattet sind, auch in SOC (System-on-Chip) wie CPUs, GPUs und IPUs der nächsten Generation integriert werden können.

Intel ist noch nicht fertig und hat mehr als 8 Millionen photonische integrierte Siliziumschaltkreise ausgeliefert, von denen derzeit mehr als 32 Millionen Laser im Einsatz sind.



△Quelle: Intel

Die nächste Frage lautet also:

Wie wird Intels OCI „verfeinert“?

Vizepräsident von Intel Research und Direktor von Intel China ResearchLied JiqiangWährend des Kommunikationsprozesses führte er eine eingehende Analyse und Interpretation dieses Themas durch.



△Song Jiqiang, Vizepräsident des Intel Research Institute und Direktor des Intel China Research Institute

Die Silizium-Photonik-Technologie vereint zwei der wichtigsten Erfindungen des 20. Jahrhunderts: integrierte Siliziumschaltkreise und Halbleiterlaser.

Es unterstützt schnellere Datenübertragungsgeschwindigkeiten über größere Entfernungen als herkömmliche Elektronik und nutzt gleichzeitig die Effizienz der hochvolumigen Siliziumfertigung von Intel.



Die diesmal von Intel veröffentlichte Silizium-Photonik-Integrationstechnologie, OCI-Chips, hat das Niveau des optoelektronischen Co-Packaging erreicht.

Dieses optoelektronische Co-Package bringt einen photonischen integrierten Schaltkreis (PIC) aus Silizium und einen integrierten elektronischen Schaltkreis (EIC) auf ein Substrat, um einen OCI-Chip zu bilden, der als integrierte Verbindungskomponente dient.

Dies bedeutet, dass xPU, einschließlich CPU, und zukünftige GPUs mit OCI-Chips verpackt werden können.

Der OCI-Kern wandelt alle elektrischen I/O-Signale der Rechenzentrums-CPU in Licht um und überträgt sie über Glasfasern zwischen den Knoten oder Systemen der beiden Rechenzentren.

Die aktuelle bidirektionale Datenübertragungsgeschwindigkeit erreicht 4 Tbit/s. Das Übertragungsprotokoll der oberen Schicht ist mit PCIe 5.0 kompatibel und unterstützt 64 32-Gbit/s-Kanäle in eine Richtung, was in aktuellen Rechenzentren ausreichend ist:

Es verwendet 8 Lichtwellenleiterpaare und verbraucht nur 5 Pikojoule (pJ) pro Bit, also 10-12 Joule. Diese Daten sind dreimal niedriger als der Stromverbrauch von steckbaren optischen Transceivermodulen (letzterer beträgt 15 Pikojoule pro Bit). ).



△Quelle: Intel

In einem optischen Übertragungskanal gibt es tatsächlich 8 verschiedene Bänder. Das Frequenzintervall jedes Bandes beträgt 200 GHz, was insgesamt einen Spektrumsabstand von 1,6 THz für die Übertragung einnimmt.

Licht reicht vom sichtbaren Licht bis zum unsichtbaren Licht. Tatsächlich ist seine Spektrumsbreite ausgehend von THz nahe an der optischen Kommunikation.



In welchen Bereichen werden OCI-Kernpartikel in Zukunft eingesetzt?

In diesem Zusammenhang sagte Song Jiqiang:

Zum einen können Sie es zur Kommunikation verwenden und es auch mit Computerchips wie CPU und GPU verpacken. Computer und Kommunikation sind sehr eng miteinander verbunden.
Durch Silizium-Photonik-Integration und fortschrittliche Verpackungstechnologie verfügt Intel auch über viele verschiedene Technologien, um I/O-Chips mit höherer Dichte zu erreichen und diese dann mit anderen xPUs zu kombinieren, um in Zukunft viele verschiedene Arten von Computern zu bilden und Verbindungschips werden sehr gute Anwendungsaussichten haben.

Gemessen an der Roadmap zur Leistungsentwicklung des OCI-I/O-Schnittstellenchips kann derzeit eine technische Lösung mit einer Übertragungsgeschwindigkeit von 32 Tbit/s erreicht werden, die sich hauptsächlich auf die iterative und stetige Verbesserung von drei Indikatoren stützt, nämlich:

  • In einer Glasfaser gibt es 8 stabile Bänder
  • Die optische Datenübertragungsrate jedes Bandes beträgt 32 Gbit/s
  • Kann 8 Paar Glasfasern gleichzeitig ziehen, ohne sich gegenseitig zu beeinflussen

Multipliziert mit diesen drei Indikatoren beträgt die aktuelle Datenübertragungsgeschwindigkeit 2 Tbit/s in eine Richtung und 4 Tbit/s in beide Richtungen. Auch in Zukunft können wir uns weiterentwickeln und die Bandbreitenkapazitäten schrittweise verbessern.



△Quelle: Intel

Abschließend erläuterte Song Jiqiang auch Intels Differenzierung in der Silizium-Photonik-Integrationstechnologie:

Der Hauptgrund dafür ist, dass wir Hochfrequenz-Laseremitter auf dem Wafer bauen und optische Siliziumverstärker integrieren. Dies sind zwei relativ Kerntechnologien, die beide auf Waferebene hergestellt werden.
Als nächstes können wir solche hochintegrierten Laser in Massenproduktion herstellen, denn der Vorteil dieses On-Chip-Lasers besteht darin, dass er über gewöhnliche optische Fasern übertragen werden kann.
Und was die Stabilität angeht, ist es fast soEs dauert 10 Milliarden Stunden, bis ein Fehler auftritt

Was halten Sie also von der „leichten“ Wahl von Intel? Gerne können Sie im Kommentarbereich eine Nachricht zur Diskussion hinterlassen.

Referenzlinks:
[1]https://mp.weixin.qq.com/s/ozx_ficqlxjEPKa5AlBdfA
[2]https://community.intel.com/t5/Blogs/Tech-Innovation/Artificial-Intelligence-AI/Intel-Shows-OCI-Optical-IO-Chiplet-Co-packaged-with-CPU-at/post/1582541
[3]https://www.youtube.com/watch?v=Fml3yuPR2AU