noticias

Diálogo con Xiong Dapeng, presidente de Yizhu Technology: la integración del almacenamiento y la informática puede iniciar la segunda curva de crecimiento de la potencia informática en la era de la IA

2024-08-14

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

La explosión de la inteligencia artificial (IA) ha provocado una demanda masiva de potencia informática. En la era posterior a Moore, los procesos avanzados de fabricación de chips se están acercando a sus límites físicos y se espera que la integración del almacenamiento y la informática se convierta en una de las rutas tecnológicas importantes. en el futuro.
El almacenamiento y la informática están integrados, es decir, el almacenamiento de datos y la informática están integrados en la misma zona del mismo chip. ¿En qué aspectos se reflejan las ventajas de rendimiento y costos de los chips de arquitectura informática y de almacenamiento integrados? ¿Cuáles son los desafíos actuales que enfrenta la comercialización a gran escala? ¿Se convertirá la integración del almacenamiento y la informática en una posibilidad para que la industria nacional de chips cambie de carril y la supere?
China Business News mantuvo recientemente un intercambio con Xiong Dapeng, fundador, presidente y director ejecutivo de Yizhu Technology, sobre los temas mencionados anteriormente. En su opinión, la tecnología integrada de almacenamiento e informática tiene un potencial transformador en el campo de la informática del futuro y romperá la Ley de Moore e iniciará la segunda curva de crecimiento de la potencia informática. "Especialmente en la era de la IA, esta tecnología puede convertirse en un factor clave para impulsar el crecimiento de la potencia informática".
Romper la arquitectura von Neumann y eliminar tres problemas principales
Bajo la arquitectura tradicional de von Neumann, las funciones informáticas y de almacenamiento se completan mediante unidades informáticas (CPU, GPU, etc. XPU) y unidades de almacenamiento, respectivamente. Los datos se obtienen de la memoria y se devuelven a la memoria después del procesamiento. El tiempo necesario para transportar y leer datos de la memoria fuera de la unidad de procesamiento suele ser varias veces mayor que el tiempo de cálculo, lo que resulta en una disminución de la eficiencia informática o de la potencia informática efectiva.
"Hoy en día, cuando prevalecen los modelos grandes, es necesario mover los parámetros del modelo para completar los cálculos. La cantidad de parámetros es muy grande y el tiempo invertido representa una alta proporción, incluso más del 80%. En algunos casos, esto "La proporción es aún mayor. Por lo tanto, el ancho de banda de datos limita el rendimiento efectivo del chip puede ser una P, pero el rendimiento real puede ser mucho menor que este número. Este es el llamado 'muro de almacenamiento'", Xiong Dapeng. dijo a China Business News.
Junto con el problema del "problema de la pared de almacenamiento", se consume una gran cantidad de energía en el proceso de transmisión, lo que resulta en una reducción significativa en el índice de eficiencia energética del chip, que es el "problema de la pared de energía".
Además, existe el problema del "muro de compilación", es decir, la programación dinámica del flujo de datos es compleja y el compilador no puede optimizar automáticamente los operadores y programas ejecutables para lograr la optimización del flujo de datos en condiciones estáticas y predecibles. El ajuste para lograr esto aumenta la potencia informática efectiva y aumenta el tiempo y los costos laborales de la implementación y la migración reales. "Estos tres puntos han restringido en gran medida el desarrollo de la industria de la inteligencia artificial, que tiene cada vez menos recursos y ha aumentado significativamente el consumo de energía", dijo Xiong Dapeng.
La tecnología informática y de almacenamiento integrado rompe la arquitectura de von Neumann, integra funciones de almacenamiento y funciones informáticas en el mismo chip y utiliza directamente unidades de almacenamiento para el procesamiento de datos modificando la arquitectura informática en memoria del circuito de "lectura". en el circuito de "lectura". El resultado de la operación se obtiene en el circuito y el resultado se "escribe" directamente en la dirección de destino de la memoria. Ya no se requieren transferencias frecuentes de datos entre la unidad de computación y la unidad de almacenamiento, lo que elimina la necesidad. el consumo causado por el movimiento de datos y reduciendo en gran medida el consumo de energía, mejorando en gran medida la eficiencia informática.
"Se espera que la tecnología informática y de almacenamiento integrado se convierta en una de las rutas técnicas importantes en la era posterior a Moore. Desde el primer principio de potencia informática efectiva, para la integración del almacenamiento y la informática, la cantidad de transferencia de datos se reduce significativamente y la efectividad La potencia informática muestra un crecimiento lineal. Se puede decir que el almacenamiento y la potencia informática están integrados. La integración informática romperá la ley de Moore y abrirá la segunda curva de crecimiento de la potencia informática. Al mismo tiempo, creemos que la tecnología de integración de almacenamiento e informática tiene un efecto transformador. "En el futuro campo de la informática, especialmente en la era de la inteligencia artificial, esta tecnología puede convertirse en un factor clave para promover el crecimiento de la potencia informática", dijo Xiong Dapeng.
Una solución con mejor eficiencia energética y rentabilidad
En comparación con el recientemente popular chip de memoria de gran ancho de banda HBM, el chip de arquitectura integrada de almacenamiento e informática tiene una mejor eficiencia energética del sistema y mejor rendimiento de costos.
HBM es una tecnología de interfaz de memoria de alto rendimiento que se utiliza principalmente para mejorar las capacidades de procesamiento de datos de GPU y sistemas de computación de alto rendimiento (HPC). Esta tecnología aumenta drásticamente el ancho de banda al apilar chips DRAM verticalmente y conectarlos firmemente al procesador mediante interconexiones de alta velocidad.
"HBM es una ruta técnica efectiva para resolver el problema del 'muro de almacenamiento', pero requiere costo y consumo de energía, porque proporcionar un gran ancho de banda requiere un mayor consumo de energía, y el precio también es muy caro, superando con creces el precio de la DRAM tradicional". Xiong Dapeng dijo: "Básicamente, HBM es un chip de memoria y no tiene funciones informáticas. Debe combinarse con chips informáticos como GPGPU para lograr funciones informáticas".
Desde la perspectiva del costo del sistema, el chip informático y de almacenamiento integrado puede ser más bajo que la combinación de GPGPU y HBM tradicionales.
Por un lado, se debe a la mayor densidad de potencia informática o PPA de la arquitectura integrada de almacenamiento e informática. "El ancho de banda de datos equivalente de la arquitectura informática y de almacenamiento integrada es mucho mayor que el de HBM, que puede ser varias veces o incluso diez veces la diferencia. Al mismo tiempo, su densidad de potencia informática es más ventajosa. La potencia informática efectiva real "La relación entre rendimiento, costes y eficiencia energética será mucho mayor que la de la solución GPGPU+HBM", afirmó Xiong Dapeng.
Por otro lado, la tecnología informática y de almacenamiento integrado depende relativamente menos de procesos avanzados, mientras que tanto GPGPU como HBM dependen en gran medida de procesos avanzados. "HBM se basa en procesos avanzados y tiene grandes riesgos en la cadena de suministro. Sin embargo, si adopta la ruta de la tecnología informática y de almacenamiento integrado, incluso si no utiliza procesos avanzados, como 12 nm y 22 nm, el rendimiento puede no ser peor que 4 nm o Incluso 3 millas náuticas. Esto también es un cambio en el concepto de adelantamiento”.
En términos de rentabilidad, aunque el almacenamiento y la informática integrados pueden requerir más chips para lograr el mismo rendimiento, su alto rendimiento de costes y su alta relación de eficiencia energética son una de sus ventajas importantes.
Es posible que se implemente a gran escala en el campo de los modelos grandes en los próximos 2 o 3 años.
La investigación y la aplicación de tecnología informática y de almacenamiento integrado se están acelerando en todo el mundo.
En la actualidad, las empresas extranjeras de chips informáticos a gran escala que adoptan la ruta integrada de almacenamiento e informática incluyen Groq, la startup de chips de inteligencia artificial, valorada en más de 2.800 millones de dólares estadounidenses y considerada un fuerte competidor de Nvidia d-Matrix; adquirió Microsoft, Temasek, Samsung, Marvell, Hainan, etc. Lux, Ericsson y muchas otras empresas han invertido.
Además, Samsung también publicó una investigación sobre computación en memoria basada en MRAM en Nature y demostró la alta precisión de su algoritmo de IA. SK Hynix ha lanzado productos informáticos en memoria DRAM basados ​​en la interfaz GDDR, que pueden aumentar significativamente la velocidad informática y reducir el consumo de energía.
"Hasta donde yo sé, la mayoría de las empresas extranjeras implementan la integración de almacenamiento e informática basada en SRAM, pero su capacidad es baja y el costo es alto. Por ejemplo, la solución completa de Groq requiere más de 570 chips. Si se usa NVIDIA H100, The La cantidad de chips es de solo un dígito. Esto se debe principalmente a una densidad de almacenamiento insuficiente ", dijo Xiong Dapeng, muchas empresas nacionales emergentes han logrado avances en la tecnología informática y de almacenamiento integrado, brindando la posibilidad a la industria de chips de China de cambiar de carril y adelantar.
Sin embargo, cuando la potencia informática del almacenamiento integrado y los chips informáticos se expande a gran escala, todavía enfrenta muchos desafíos: en primer lugar, el problema de la precisión poco confiable, en segundo lugar, la conversión de digital a analógico basada en cálculos analógicos genera cuellos de botella en la energía; consumo, tamaño de matriz y rendimiento; en tercer lugar, los grandes modelos de IA tienen requisitos de capacidad.
"El camino totalmente digital puede resolver bien estos problemas, lo que también es la base para que Yizhu Technology desarrolle chips de inferencia de IA de gran potencia informática", dijo Xiong Dapeng.
En un sistema integrado de computación y almacenamiento analógico general, los datos se almacenan en forma de señales analógicas, representadas por diferentes niveles de voltaje dentro de la unidad de almacenamiento, y operaciones como MAC se realizan según la ley de Ohm y las leyes de Kirchhoff. El mayor problema con este enfoque es que la precisión y la exactitud no son confiables debido al ruido del circuito analógico y diversas variables. Independientemente del proceso de fabricación o del entorno de trabajo, los valores representados por el memristor tendrán errores o desviaciones. Los métodos híbridos digital-analógico intentan equilibrar los problemas de eficiencia y precisión, pero aún no pueden garantizar una alta precisión y confiabilidad.
Xiong Dapeng presentó que la solución de Yizhu Technology es una integración informática y de almacenamiento totalmente digital basada en memristor (ReRAM). Debido a que es completamente digital, los datos se colocan en la unidad de almacenamiento en forma binaria. Un memristor solo representa un bit y solo hay diferencias entre niveles altos y bajos, resistencia alta y baja y corriente alta y baja. puede ser confiable.
Además, el desarrollo del almacenamiento y la informática integrados también enfrenta problemas de implementación de proyectos. "Como nueva ruta tecnológica, cómo utilizarla e integrarla en la ecología existente es un gran desafío. La programabilidad y la compatibilidad con la ecología existente son cruciales", dijo Xiong Dapeng a China Business News.
En conjunto, la tecnología informática y de almacenamiento integrado se considera globalmente como un medio eficaz para resolver la contradicción entre la alta demanda de potencia informática y los altos costos de consumo de energía. También brinda una importante oportunidad para que la industria de chips de China se ponga al día. En los próximos años, a medida que la tecnología siga madurando y aumente la demanda del mercado, se espera que los chips informáticos y de almacenamiento integrados se utilicen ampliamente en muchos campos y promuevan el desarrollo innovador de toda la industria. En la actualidad, la aplicación de chips informáticos y de almacenamiento integrados en el campo de los modelos grandes aún se encuentra en la etapa de desarrollo, y Xiong Dapeng predice que se implementará a gran escala en los próximos 2 o 3 años.
(Este artículo proviene de China Business News)
Informe/Comentarios