noticias

La interconexión entre CPU y GPU se ha disparado de 1 metro a 100 metros Intel: ¿Crees en la luz?

2024-07-27

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Jin Lei viene del templo de Aofei.
Qubits | Cuenta pública QbitAI

Para Intel"Luz", superando el espinoso problema de la potencia informática en la era de los modelos grandes——

Lanzó el primer sistema totalmente integrado de la industria.OCI(Interconexión de Computación Óptica).



△Fuente: Intel

Debe saber que cuando los grandes modelos de IA siguen la Ley de escala, para lograr mejores resultados, la escala del modelo o la escala de datos se están desarrollando hacia una tendencia mayor.

Esto hará que los grandes modelos de IA presenten requisitos más altos en toda la informática y el almacenamiento, incluida la comunicación de E/S intermedia, en el nivel de potencia informática.

El avance de Intel esta vez es exactamentecomunicación de E/S

En CPU y GPU,Utilice E/S ópticas en lugar de E/S eléctricas para la transmisión de datos.

¿Cuál es el uso?

En una palabra,La distancia de transmisión de datos es mucho mayor.La cantidad es grandeEl consumo de energía es bajo——El "físico" es más adecuado para modelos de IA grandes.



△Fuente: Intel

Entonces, ¿por qué Intel utiliza "ligero"? ¿Cómo se implementa específicamente?

Usando "luz", pasó de un carruaje a un camión.

El método tradicional de E/S eléctrica (conexión con cable de cobre) ciertamente tiene sus ventajas, como soportar una alta densidad de ancho de banda y un bajo consumo de energía, pero el problema fatal es queLa distancia de transmisión es relativamente corta (menos de 1 metro)

No hay problema si se coloca en un bastidor, pero la potencia informática de los grandes modelos de IA suele estar al nivel de un clúster de servidores.

No solo ocupa un área grande, sino que también abarca N bastidores. Los cables deben tener decenas o incluso cientos de metros de largo y el consumo de energía es bastante alto, consumirá toda la energía suministrada a los bastidores; que no hay suficiente energía para realizar operaciones de lectura y escritura de chips de memoria y computación.

además,Relación depósito-cuentaPor otro lado, es precisamente debido a las características "grandes" de los modelos grandes que la proporción original de leer una vez y hacer cientos de cálculos ahora se ha acercado a 1:1.



△Fuente: Intel

Esto requiere un nuevo método que pueda aumentar la potencia informática y la densidad de almacenamiento al tiempo que reduce el consumo de energía y reduce el tamaño, colocando así más informática y almacenamiento en un espacio limitado.

Con E/S ópticas, el problema está resuelto:

Puede admitir 64 canales de 32 Gbps en una dirección en fibra óptica hasta 100 metros.

Una metáfora de imagen es, al igual que usarcarro(capacidad y distancia limitadas) para utilizarcoches y camionespara entregar mercancías (mayores cantidades y mayores distancias).

No solo eso, incluso si se trata de completar un trabajo de transmisión de datos más flexible y de mayor densidad a una distancia relativamente corta, OCI se puede comparar conmotocicleta, más rápido y más flexible.

Cabe mencionar que este método OCI no es sólo teórico.

Según Intel, han aprovechado la tecnología probada de fotónica de silicio para integrar circuitos integrados de fotónica de silicio (PIC) que contienen láseres en chip, amplificadores ópticos y circuitos integrados electrónicos.

Y ha demostrado anteriormente que los chips OCI empaquetados con su propia CPU también se pueden integrar con SOC (sistema en chip), como CPU, GPU e IPU de próxima generación.

Aún no terminado, Intel ha enviado más de 8 millones de circuitos integrados fotónicos de silicio, de los cuales más de 32 millones de láseres están actualmente en uso.



△Fuente: Intel

Entonces la siguiente pregunta es:

¿Cómo se "refina" la OCI de Intel?

Vicepresidente de Intel Research y Director de Intel China Researchcanción jiqiangDurante el proceso de comunicación, hizo un profundo análisis e interpretación de este tema.



△Song Jiqiang, vicepresidente del Instituto de Investigación Intel y director del Instituto de Investigación Intel China

La tecnología fotónica de silicio combina dos de los inventos más importantes del siglo XX: los circuitos integrados de silicio y los láseres semiconductores.

Admite velocidades de transferencia de datos más rápidas en distancias más largas que los dispositivos electrónicos tradicionales y, al mismo tiempo, aprovecha la eficiencia de la fabricación de silicio de alto volumen de Intel.



La tecnología de integración de fotónica de silicio lanzada por Intel esta vez, los chips OCI han alcanzado el nivel de co-empaquetado optoelectrónico.

Este co-paquete optoelectrónico coloca un circuito integrado fotónico de silicio (PIC) y un circuito electrónico integrado (EIC) sobre un sustrato para formar un chip OCI, que sirve como componente de conexión integrada.

Esto significa que las xPU, incluida la CPU, y las futuras GPU se pueden empaquetar con chips OCI.

El núcleo OCI convierte todas las señales eléctricas de E/S de la CPU del centro de datos en luz y las transmite entre sí entre los nodos o sistemas de los dos centros de datos a través de fibras ópticas.

La velocidad de transmisión de datos bidireccional actual alcanza los 4 Tbps. Su protocolo de transmisión de capa superior es compatible con PCIe 5.0 y admite 64 canales de 32 Gbps en una dirección, lo cual es suficiente en los centros de datos actuales:

Utiliza 8 pares de fibras ópticas y consume sólo 5 picojulios (pJ) por bit, o 10-12 julios. Estos datos son tres veces menores que el consumo de energía de los módulos transceptores ópticos enchufables (este último es de 15 picojulios por bit). ).



△Fuente: Intel

En un canal de transmisión óptica, en realidad tiene 8 bandas diferentes. El intervalo de frecuencia de cada banda es de 200 GHz, ocupando un espacio total de espectro de 1,6 THz para la transmisión.

La luz varía desde la luz visible hasta la luz invisible. De hecho, su ancho de espectro es muy amplio, a partir de THz, está cerca de la comunicación óptica.



Entonces, ¿en qué campos se utilizarán las partículas centrales OCI en el futuro?

Al respecto, Song Jiqiang dijo:

Una es que puede usarlo para lograr la comunicación y también puede empaquetarlo con chips informáticos como CPU y GPU. La computación y la comunicación están muy estrechamente empaquetadas.
A través de la integración de la fotónica de silicio y la tecnología de empaquetado avanzada, Intel también tiene muchas tecnologías diferentes para lograr chips de E/S de mayor densidad y luego combinarlos con otras xPU para formar muchos tipos diferentes de chips en el futuro. y los chips de interconexión tendrán muy buenas perspectivas de aplicación.

A juzgar por la hoja de ruta de evolución del rendimiento del chip de interfaz OCI I/O, actualmente puede alcanzar una solución técnica de velocidad de transmisión de 32 Tbps, basándose principalmente en la mejora iterativa y constante de tres indicadores, a saber:

  • Hay 8 bandas estables en una fibra óptica.
  • La velocidad de transmisión de datos ópticos de cada banda es de 32 Gbps.
  • Puede tirar de 8 pares de fibras ópticas al mismo tiempo sin afectarse entre sí.

Multiplicada por estos tres indicadores, la velocidad de transmisión de datos actual es de 2 Tbps en una dirección y 4 Tbps en ambas direcciones. En el futuro, podremos seguir evolucionando hacia arriba y mejorar gradualmente las capacidades de ancho de banda.



△Fuente: Intel

Finalmente, Song Jiqiang también explicó la diferenciación de Intel en la tecnología de integración de fotónica de silicio:

La razón principal es que construimos emisores láser de alta frecuencia en la oblea e integramos amplificadores ópticos de silicio. Estas son dos tecnologías relativamente centrales, ambas fabricadas a nivel de oblea.
A continuación, podremos producir en masa láseres altamente integrados, porque la ventaja de este láser en chip es que puede transmitirse mediante fibras ópticas ordinarias.
Y en términos de estabilidad, es casiSe necesitan 10 mil millones de horas para que ocurra un error

Entonces, ¿qué opinas de la "luz" de la elección de Intel? Bienvenido a dejar un mensaje en el área de comentarios para discusión.

Enlaces de referencia:
[1]https://mp.weixin.qq.com/s/ozx_ficqlxjEPKa5AlBdfA
[2]https://community.intel.com/t5/Blogs/Tech-Innovation/Artificial-Intelligence-AI/Intel-Shows-OCI-Optical-IO-Chiplet-Co-packaged-with-CPU-at/post/1582541
[3]https://www.youtube.com/watch?v=Fml3yuPR2AU