noticias

¡La espada apunta a 32Tbps!Intel revela la hoja de ruta para la integración de la fotónica de silicio y los chips OCI sientan las bases para la futura infraestructura de IA

2024-08-01

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Xinxi informó el 31 de julio que la Conferencia de Comunicaciones por Fibra Óptica (OFC) es reconocida como el evento internacional más grande y de mayor nivel en el campo de las comunicaciones ópticas en el mundo, y es un punto de referencia para el desarrollo de tecnologías de comunicaciones ópticas de vanguardia. En la Conferencia de Comunicaciones de Fibra Óptica de este año, el equipo de Soluciones Integradas de Fotónica de Silicio (IPS) de Intel compartió su gran avance en la promoción de la innovación en la tecnología de interconexión de gran ancho de banda.Tarjeta OCI (Optical Computing Interconnect) líder en la industria y totalmente integrada, empaquetada con CPU Intel para ejecutar datos reales

Para aplicaciones de centros de datos y computación de alto rendimiento (HPC), el núcleo OCI creado por Intel realiza un paquete conjunto de E/S ópticas y puede admitir 64 canales de 32 Gbps en una dirección en fibra óptica de hasta 100 metros, lo que se espera que cumpla con los requisitos. Demanda creciente de infraestructura de IA. Demanda creciente de mayor ancho de banda, menor consumo de energía y mayor distancia de transmisión.

Intel no ha revelado las dimensiones exactas de los gránulos de OCI, pero fotografías publicadas recientemente muestran los gránulos de OCI en comparación con el borrador en el extremo de un lápiz número 2 estándar.

Con respecto a más detalles técnicos de los chips centrales OCI, Song Jiqiang, vicepresidente del Instituto de Investigación Intel y director del Instituto de Investigación Intel China, recientemente mantuvo intercambios profundos con los medios centrales y otros medios.Song Jiqiang compartió la futura hoja de ruta de innovación de Intel para la integración fotónica de silicio. Al aumentar la velocidad de línea, la cantidad de longitudes de onda por fibra, la cantidad de fibras y el modo de polarización, se espera expandir el rendimiento de las futuras generaciones de núcleos OCI y crear un nuevo modelo. ancho de banda de hasta32 Tbpsdispositivo.

Intel suministra chips OCI a varios clientes internos y externos. Las aplicaciones específicas de los clientes y los requisitos de los productos determinarán la secuencia y el momento de estos planes de expansión.

1. Electricidad sustituida por luz de silicio ≈ bicicleta transformada en motocicleta

A medida que se acelera el desarrollo de la IA generativa, los modelos grandes requieren una alta densidad informática, una gran capacidad de memoria y ancho de banda, y son difíciles de implementar en un solo nodo de servidor, por lo que se requieren conexiones entre racks. Los grandes clústeres informáticos implican distancias de transmisión más largas y mayores requisitos de ancho de banda de E/S.

Song Jiqiang dijo que las aplicaciones de IA han alcanzado un nuevo nivel en términos de relación de memoria a computación y que a menudo se requiere acceso a la memoria. Por lo tanto, los canales de memoria y los retrasos afectarán la forma de proporcionar servicios de aplicaciones a gran escala en el futuro. Esto requiere explorar algunos métodos nuevos,Al tiempo que aumenta la potencia informática y la densidad de almacenamiento, reduce el consumo de energía y reduce el tamaño, colocando así más informática y almacenamiento (chips) en un espacio limitado.

En el pasado, las E/S eléctricas utilizaban cables de cobre para completar la interconexión entre chips. La velocidad del cable de cobre es lo suficientemente rápida y el consumo de energía es bajo, pero la distancia de transmisión efectiva es muy limitada, tan corta como.Aproximadamente 1 metro

Si construye un clúster en todo el centro de datos, también enfrentará los problemas de una gran área de clúster, cables largos y alto consumo de energía para la transmisión a larga distancia, lo que dificultará lograr una alta potencia informática y un ahorro de energía. Hay muchos nodos de servidor ubicados en un centro de datos y existe un límite superior en la energía que se puede suministrar. Además de los chips, también hay E/S y otros lugares que consumen energía en el bastidor. La cantidad asignada a cada chip es muy limitada.

Según Song Jiqiang, en los últimos 20 a 30 años, la E/S en toda la industria informática ha requerido cada vez más energía. Si se utiliza la tecnología actual y se utiliza la escala actual para crecer, consumirá toda la energía suministrada. Como resultado, no hay suficiente electricidad para realizar operaciones de lectura y escritura en los chips de computación y almacenamiento.Se deben utilizar nuevas soluciones técnicas para suprimir la energía utilizada en la parte de E/S.

Intel compara las E/S eléctricas tradicionales con un carruaje tirado por caballos, con velocidad y distancia de transmisión limitadas;Dentro de 100 metrosPara lograr una mayor densidad y una transmisión de datos más flexible, el método de integración fotónica de silicio es como una motocicleta liviana, que es rápida, flexible, efectiva y ahorra energía;Más de 100 metrosPara transmisiones de larga distancia, utilizar un transceptor óptico enchufable es como reemplazar un automóvil con mayor capacidad y velocidad suficiente.

Las E/S ópticas y los transceptores ópticos conectables sonInterconexión fotónica de silicioLa solución tiene la ventaja de un bajo consumo de energía y es adecuada para transmisiones a larga distancia.

Transceptor óptico enchufableLa solución es relativamente madura y se puede conectar directamente a la interfaz del circuito electrónico integrado (EIC), lo que puede aumentar la distancia de transmisión. Sin embargo, es de mayor tamaño y generalmente requiere un serializador y deserializador de alta velocidad (SerDes) o procesamiento de señales digitales. (DSP) Por lo tanto, la funcionalidad es limitada, el consumo es mayor, la densidad del ancho de banda es menor y el retraso es mayor.

Y usandoIntegración de fotónica de silicioLa tecnología de E/S óptica puede lograr un ancho de banda de varios Tbps con bajo consumo de energía, alta densidad de ancho de banda, baja latencia y mayor distancia de transmisión para satisfacer las necesidades de expansión de la IA.

Partículas del núcleo OCI(o cualquier solución de E/S óptica) co-sellada con la CPU, GPU o SoC puede optimizar y mejorar la densidad del ancho de banda de E/S, la eficiencia energética total, la latencia y el coste, así como a través de nuevas arquitecturas que admitan la desagregación de recursos como HBM. o agrupación de memoria CXL) para lograr una utilización más eficiente de los recursos.

En el futuro, Intel proporcionará diferentes soluciones para diferentes distancias de transmisión, incluido el co-empaquetado optoelectrónico OCI y soluciones conectables.

dos,Empaquetado conjuntamente con la CPU,¿Cómo aporta el chip Intel OCI eficiencia energética?

El chip Intel OCI es un dispositivo de E/S ópticas de capa física completo, que incluye un circuito integrado de fotónica de silicio (PIC) con láseres de multiplexación por división de longitud de onda densa en el chip y amplificadores ópticos semiconductores, y un EIC para controlar el PIC y conectarse al host. .

La función de EIC está más cerca de cómo se utilizan señales específicas y qué partes están conectadas a ella. Se convertirá en una capa de conversión y adaptación en un protocolo. PIC tiene más que ver con resolver el problema de la transmisión estable de luz, actualizar y enviar señales y la evolución sostenible, como por ejemplo cómo completar una buena conversión entre medios dieléctricos y ópticos.

EIC utiliza nodos de proceso CMOS estándar y PIC utiliza el proceso de fabricación de fotónica de silicio de Intel basado en obleas de silicio de 300 mm. Por lo general, EIC utiliza un proceso relativamente avanzado para estar cerca o alineado con el chip principal que se va a admitir, mientras que PIC utiliza un proceso más maduro.

Dado que no existe un método conectable, dichos componentes informáticos tienen menor potencia, al tiempo que aumentan el ancho de banda y extienden la distancia de transmisión, pueden mejorar efectivamente la integración de las interconexiones ópticas de silicio, mejorando así el rendimiento y el consumo de energía, y ayudando a aumentar la densidad del clúster.

El chip OCI totalmente integrado de Intel permite velocidades de transmisión de datos bidireccionales de hasta4 Tbpsy compatible conPCIe de quinta generación, soporte unidireccional64 carriles de 32Gbps(Song Jiqiang dijo que esto es suficiente en los centros de datos actuales), con una distancia de transmisión de hasta100 metros(Debido a retrasos en la transmisión, la distancia puede limitarse a decenas de metros en aplicaciones reales).

Utiliza 8 pares de fibras ópticas, cada una con 8 longitudes de onda de multiplexación por división de longitud de onda densa (DWDM), y el consumo de energía es solo5pJ por bit(picojulios), solo consumo de energía del módulo transceptor óptico enchufable1/3

Según Song Jiqiang, Intel confía en que a través de diversas mejoras en el diseño de dispositivos y empaques, procesos de fabricación y expansión del ancho de banda, reducirá la eficiencia energética hasta un 10% en las siguientes generaciones de productos.3,5 PJ por bitla siguiente.

En la Conferencia de Comunicaciones de Fibra Óptica de 2024, Intel realizó una demostración de enlace óptico en vivo, mostrando la interconexión del transmisor y el receptor entre dos plataformas de CPU de centros de datos a través de puentes de fibra monomodo (SMF).

La CPU genera y mide la tasa de error de bits. Dos CPU de centro de datos se envían y reciben datos entre sí. Un núcleo OCI y una CPU están empaquetados conjuntamente. El núcleo OCI convierte todas las señales eléctricas de E/S de la CPU en luz, a través de fibras ópticas, en los dos centros de datos transmitidos. ida y vuelta entre nodos o sistemas.

Como se muestra en la figura, hay señales eléctricas en los hosts del sistema en ambos lados, que se convierten en luz a través de chips de conversión fotoeléctrica. El transmisor tiene un espectro total de 1,6 THz, incluidas 8 longitudes de onda espaciadas a 200 GHz en una sola fibra, y un diagrama de ojo del transmisor de 32 Gbps indica una fuerte calidad de señal.

La parte coloreada es luz, y los diferentes colores representan luz de diferentes longitudes de onda, con intervalos de frecuencia suficientes para que no interfieran entre sí durante la modulación y demodulación. Estas luces se pueden combinar y transmitir a través de una fibra óptica, es decir, se pueden "multiplexar" múltiples bandas en una fibra óptica, que es lo mismo que la multiplexación por división de frecuencia en el campo de las comunicaciones inalámbricas.

Debido a que el ancho de banda de la luz es muy grande, se puede seleccionar un ancho de banda relativamente estable y cortarlo en muchas bandas de ondas diferentes, que aparecen ante el ojo humano como luz de diferentes colores. De hecho, son bandas de diferentes frecuencias y la señal a transmitir se puede modular de manera estable en cada banda. Después de la modulación fotoeléctrica, la señal se transmite a través de fibra óptica.

Song Jiqiang compartió la hoja de ruta de evolución del rendimiento de los chips Intel OCI. Hay tres direcciones principales para la iteración tecnológica:El número de longitudes de onda de las ondas de luz, la velocidad de transmisión de las fibras ópticas y el número de fibras ópticas.

Una fibra óptica se puede dividir en diferentes bandas para la transmisión. Actualmente, 8 bandas pueden garantizar una transmisión estable. La velocidad de transmisión de datos depurada a la luz de cada banda es de 32 Gbps. sin afectarse entre sí es 8. correcto. Multiplicada por tres, la velocidad de transmisión de datos unidireccional alcanza los 2 Tbps y la velocidad bidireccional es de 4 Tbps.

En el futuro, si la banda de 8 bandas permanece sin cambios y la velocidad de transmisión de fibra aumenta a 64 Gbps, la velocidad de transmisión de datos unidireccional se duplicará a 4 Tbps. Posteriormente, si pasa a ser de 16 bandas, la velocidad de transmisión aumentará. a 8Tbps. Puede seguir evolucionando en el futuro y aumentar gradualmente el ancho de banda.

3. En el futuro, también se podrá integrar con GPU, múltiplesDesmontando las ventajas diferenciales

En comparación con las soluciones independientes y enchufables,Cuando el chip OCI y la CPU están sellados juntos, la gestión térmica debe considerarse como un todo y la densidad de transmisión de la señal y la frecuencia de transmisión deben garantizarse a nivel del paquete. . La tecnología actual de Intel ya es capaz de satisfacer estas necesidades.

En el futuro, los chips OCI se podrán utilizar para implementar comunicaciones y también integrarse con chips informáticos como CPU, GPU e IPU.A través de la integración de la fotónica de silicio y la tecnología de empaquetado avanzada, Intel puede lograr chips de E/S de mayor densidad y luego combinarlos con otras xPU para formar muchos tipos diferentes de chips de computación e interconexión basados ​​en los chips en el futuro, con perspectivas de aplicación prometedoras.

Song Jiqiang explicó además que el desafío de la integración posterior con otros tipos de chips no está en el nivel técnico, sino en el nivel de implementación, a lo que se debe prestar atención esdensidad de ancho de banda Por ejemplo, cuando la distancia entre las interfaces fotoeléctricas es limitada, ¿cómo colocar estas interfaces de conversión fotoeléctrica? ¿Es suficiente la densidad de ancho de banda alcanzable dentro de un determinado rango de tamaño?

Según él, para hacer que el chip OCI sea más flexible y reducir la carga de trabajo durante el proceso de integración,Normalmente, se consideraría utilizar una interfaz eléctrica entre la xPU del host y las E/S que se haya estandarizado a través de un ecosistema IP sólido, como UCIe, PCIe, Ethernet, etc.

También habló de las ventajas diferenciales de la solución de Intel.

En primer lugar, Intel puede producir en masa láseres altamente integrados a nivel de oblea, con mayor rendimiento y confiabilidad y menor costo total. Sólo después de transformar la teoría en producción de alto rendimiento se podrán formar capacidades de industrialización.

Las soluciones láser externas existentes requieren el uso de fibras ópticas especializadas, que son costosas y no tienen casos de implementación a gran escala.La ventaja de los láseres en chip es que se pueden transmitir utilizando fibras ópticas ordinarias. Dado que no se requiere una fuente de luz externa, no hay necesidad de mantener la polarización de las fibras.(PMF, una fibra óptica especial necesaria para conectar fuentes de luz externas a circuitos integrados fotónicos de silicio pasivo).

Al fabricar un transmisor láser, es relativamente sencillo fabricar un dispositivo independiente. Existe un umbral técnico para fabricar un láser en una oblea. Los diferentes tipos de semiconductores deben estar bien unidos al nivel de la oblea, y luego se puede formar el circuito de control mediante el proceso de fabricación del semiconductor. Los dispositivos ópticos, incluidas fuentes de luz, moduladores, amplificadores, guías de ondas ópticas, detectores, etc., deben implementarse a nivel de oblea.

En segundo lugar, Intel cuenta con plataformas y dispositivos probados y de gran volumen con confiabilidad líder en la industria.

Los chips Intel OCI se basan en una plataforma interna de integración de fotónica de silicio probada en producción que ha entregado más del 100 % de las aplicaciones de conectividad en centros de datos de hiperescala desde 2015.8 millonesMódulos transceptores ópticos (incluidos más de8 millonesCircuitos integrados de fotónica de silicio y más32 millonesLáser integrado), utilizado para aplicaciones que requieren velocidades de transmisión de 100 Gbps, 200 Gbps y 400 Gbps.

Su confiabilidad se ha verificado en millones de dispositivos y los datos muestran que la tasa de falla de base de tiempo (FIT) del láser es menor que0.1, lo que equivale a decir que una falla puede ocurrir sólo una vez cada 10 mil millones de horas.

Además, la construcción de los circuitos fotónicos y CMOS en dos chips separados (circuito integrado fotónico de silicio y circuito integrado electrónico) garantiza la escalabilidad y la optimización del rendimiento., sin los compromisos y compensaciones necesarios para combinar dos tecnologías muy diferentes en un solo chip.

La acumulación de paquetes, sistemas y plataformas avanzados de Intel también le permite optimizar las soluciones de E/S ópticas.Intel está invirtiendo en la investigación y el desarrollo de nuevos nodos de proceso de fabricación de fotónica de silicio para lograr mejoras líderes en el rendimiento de los dispositivos, mayor densidad, mejor acoplamiento y mayores beneficios económicos. También continuará mejorando el rendimiento y el costo de los láseres en chip y los transceptores ópticos. . y confiabilidad.

Conclusión: pasar del prototipo de tecnología a la solución de comercialización

En el campo de la fotónica de silicio, el Instituto de Investigación Intel ha estado profundamente involucrado en la fotónica de silicio durante más de 25 años y es pionero y líder en la integración de fotónica de silicio. Intel es el primero en la industria en desarrollar y entregar dispositivos de conectividad fotónica de silicio en volumen a grandes proveedores de servicios en la nube, y está trabajando con los clientes para transformar prototipos de tecnología de chip OCI en soluciones comerciales escalables.

En términos de costo, Intel cree que con el tiempo y a medida que los volúmenes aumenten, el costo total de interconexión por bit para E/S ópticas será comparable al de E/S eléctricas a nivel de sistema. Un mayor rendimiento de E/S ópticas también ayuda a mejorar el rendimiento a nivel del sistema.

Para lograr este objetivo, Intel está desarrollando actualmente un nodo de proceso de fabricación de fotónica de silicio de segunda generación, que se espera que reduzca el área del chip en más del 40% y el consumo de energía en más del 15%, mejorando así los beneficios económicos y mejorando la eficiencia del acoplamiento óptico. la potencia del láser, etc. avanzan.