Ejecutivo de Intel: los modelos de IA pasarán gradualmente de la nube al borde

2024-07-26

·El tiempo de procesamiento en la nube se extiende, los costos de transmisión de datos son altos y existen preocupaciones sobre la seguridad de los datos. El vicepresidente senior de Intel, Sachin Katti, dijo que la IA está penetrando hasta el borde y que los modelos grandes pueden pasar gradualmente de la nube al borde.

Sachin Katti, vicepresidente senior y director general del Networking and Edge Group de Intel.

"Esperamos que la IA se implemente y aplique más en el borde para procesar datos locales. Con el tiempo, los modelos de IA pueden pasar gradualmente de la nube al borde el 24 de julio, en Intel Network & Edge 2024 en la Computing Industry Conference, Sachin". Katti, vicepresidenta senior y gerente general de la División de Red y Edge de Intel, dijo que la IA actual se ejecuta principalmente en la nube, ya que los dispositivos de borde generan grandes cantidades de datos localmente, y el costo de transmitir todos los datos a la nube es bastante alto. a la informática de punta es la tendencia general.

La seguridad de los datos y el tiempo real promueven la IA desde la nube hasta el borde

Sachin Katti dijo que los seres humanos están en la era de la asistencia de la IA, y la IA ayuda a los humanos a trabajar de manera más eficiente. Después de la era de la asistencia de la IA, los humanos entrarán en la era de los asistentes de la IA. “Cuando conducen por un restaurante de comida rápida, los agentes de IA pueden hacerlo. "

Sachin Katti dijo que el crecimiento actual de la IA se concentra principalmente en la nube, pero la evolución hacia la informática de punta es la tendencia general. “En el pasado, la IA de la que hablamos se refería básicamente a la visión artificial o la tecnología de automatización basada en series de tiempo. Pero ahora la IA de borde ha progresado gradualmente desde la visión artificial en el borde hasta aplicaciones de borde, como modelos de lenguaje grandes e IA generativa. Intel continuará brindando capacidades relevantes para acelerar la implementación de IA generativa y modelos de lenguaje grandes en el borde”.

Además de los requisitos de transmisión de datos en el borde, la seguridad de los datos y el rendimiento en tiempo real son consideraciones importantes a la hora de promover la IA desde la nube hasta el borde. Guo Wei, vicepresidente del Grupo de Marketing de Intel y director general de la División de Centros de Datos de Canal y Red de Intel China, dijo que, por un lado, las empresas tienen preocupaciones sobre la colocación de datos en la nube, y por otro lado, la computación de borde ayuda a resolver; requisitos en tiempo real.

"Básicamente, este año más de la mitad de nuestros clientes están explorando soluciones de implementación basadas en grandes modelos de borde", dijo Chen Wei, vicepresidente de Intel y gerente general de la División de Redes y Borde de China, desde la perspectiva de la implementación de la computación de borde, el tamaño del modelo no es Cuanto más grande, mejor, pero debería adaptarse a las necesidades reales de los escenarios de aplicación del mercado. “La implementación de la informática de punta debe considerar muchos factores, como la latencia, la disponibilidad, la optimización ajustable de los microdatos y la seguridad de la información. , etc."

El ajuste de borde está limitado por el volumen de datos

"La característica del borde es la fragmentación". Zhang Yu, director de tecnología de la División de Red y Borde de Intel China e ingeniero jefe senior de inteligencia artificial de Intel, dijo que diferentes usuarios tienen diferentes requisitos de potencia y rendimiento informático. Un desafío común en el ajuste de bordes es la limitación del volumen de datos. La cantidad de datos que una escuela o una fábrica realmente puede utilizar para la capacitación es muy pequeña. Los datos de diferentes empresas y escuelas también son diferentes. Las plantas de producción de autopartes y las plantas de mecanizado encuentran diferentes problemas en los productos que no se pueden detectar con un modelo unificado y el modelo debe entrenarse con datos específicos de la empresa.

Al mismo tiempo, Zhang Yu dijo: "La capacitación requiere etiquetado para que la máquina sepa a qué está prestando atención. Las personas que realmente operan el equipo funcional de IA en una fábrica son a menudo los trabajadores de la línea de producción. ¿Cómo puede ser posible? ¿Tienen la energía para etiquetar durante el proceso de producción? "Por lo tanto, cuando la cantidad de datos es pequeña, se deben utilizar métodos de anotación automatizados durante el ajuste de bordes para completar la anotación. "En el borde, los usuarios finales buscan implementación empresarial, no soluciones técnicas. Los requisitos de los usuarios para los servicios son conveniencia, facilidad de implementación y facilidad de administración después de la implementación. Esto suele ser un problema para los clientes".

Guo Wei dijo que no es suficiente confiar únicamente en la capacitación modelo para resolver problemas prácticos de la industria, y la demanda de mejorar las capacidades de razonamiento es particularmente obvia este año. La implementación de modelos grandes implicará inevitablemente una distribución equilibrada de la potencia informática desde el extremo hasta el borde y luego a la nube. "Si se trata solo de una aplicación estándar de modelos grandes verticales, los modelos grandes se implementarán principalmente en la nube. Sin embargo, debido a la necesidad de implementación industrial, la potencia informática de la IA inevitablemente se trasladará a la nube. "Distribución perimetral y final".

Sachin Katti dijo que las principales cargas de trabajo en el borde son la inferencia y el aprendizaje continuo. A veces, después de la implementación en el borde, se descubre que el efecto no es tan bueno como se esperaba, o que se ejecuta durante un período de tiempo y es necesario ajustar el modelo original.

¿Cuánta potencia informática se necesita en el borde? Sachin Katti dijo que existe una correlación positiva entre la potencia informática y el consumo de energía. El equipo implementado en el borde consume alrededor de 200 vatios de energía, la implementación en la nube consume entre 1 y 2 kilovatios y el consumo de energía de un bastidor de una sola capa en el centro de datos puede llegar a 100 kilovatios. Si se suma el consumo de energía de todo el centro de datos, puede alcanzar entre 50 y 100 gigavatios. En los casos en los que la potencia informática o el consumo de energía son altos, la eficiencia y la capacidad de refrigeración son variables clave que deben tenerse en cuenta. Dado que los datos a gran escala y la potencia informática generarán mucho calor, "actualmente utilizamos tecnología de refrigeración líquida para enfriar eficazmente la flota. La tecnología de refrigeración líquida existente ha podido enfriar con éxito la flota de 100 kilovatios y se espera que "Se ampliará a 300 kilovatios en el futuro. Por lo tanto, las limitaciones. Otro factor muy importante en la potencia informática es si se tiene la capacidad suficiente para enfriar eficazmente el entorno general".

noticias

Ejecutivo de Intel: los modelos de IA pasarán gradualmente de la nube al borde

Introducción

Mi informacion de contacto