noticias

Otra exploración de la implementación de la inteligencia incorporada en el ámbito industrial.

2024-08-07

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Producido | Grupo de expertos de Huxiu

Autor |

Imagen de encabezado |

En la era actual de transformación industrial y la afluencia de nueva productividad, la inteligencia incorporada trae una serie de tecnologías de vanguardia, como modelos grandes, modelos grandes multimodales, modelos pequeños visuales/táctiles, etc., a las fábricas y se embarca en un viaje práctico en el campo de la fabricación industrial. Sin embargo, los escenarios industriales complejos y diversos plantean graves desafíos a la inteligencia incorporada. ¿Con qué escena deberías empezar? ¿Cómo puedo cambiar libremente entre diferentes escenas? ¿Cómo obtener los datos extensos y de alta calidad que requieren sus sistemas inteligentes?

Por lo tanto, a las 7 pm del 30 de julio de 2024, los colegas en línea de Huxiu Think Tank 502 invitaronYin Zhi, consultor jefe de la Asociación de Tecnología de Inteligencia Artificial de Shanghai, Fu Yihui, director de Tashan Technology Ecology, y el Dr. Zhao He, CTO de Weiyi Intelligent Manufacturing, discutieron conjuntamente las aplicaciones innovadoras de modelos grandes en el campo de la inteligencia incorporada y compartieron casos de aplicaciones prácticas de inteligencia incorporada y robots humanoides.

1. Integración de inteligencia incorporada y grandes modelos y desafíos técnicos.

El mejor portador de inteligencia encarnada son los robots humanoides, cuyo crecimiento se basa en modelos de gran tamaño.

La combinación de grandes modelos e inteligencia incorporada ha logrado ciertos resultados y tiene amplias perspectivas. Yin Zhi, consultor jefe de la Asociación de Tecnología de Inteligencia Artificial de Shanghai, dijo que los modelos grandes pueden usarse como cerebros de robots, con capacidades de planificación y razonamiento, y pueden descomponer objetivos en subobjetivos y llamar a funciones relacionadas, aunque el uso actual es limitado. La dirección tiene un gran potencial.

El Dr. Zhao He, CTO de Weiyi Intelligent Manufacturing, cree que en escenarios industriales, debido a la naturaleza de su trabajo, los robots no humanoides pueden ser más adecuados en escenarios de vida, puede ser una mejor forma;

El modelo grande subvierte el método de interacción entre humanos y computadoras, permitiendo que los humanos y las máquinas se comuniquen de manera natural, como texto, voz e imágenes. La máquina puede comprender las intenciones humanas y realizar operaciones. Los modelos grandes proporcionan una interacción eficiente, lo que permite a los robots aprender nuevas tareas y obtener requisitos y especificaciones operativas específicas.

Fu Yihui, director ecológico de Tashan Technology, está de acuerdo en que los modelos grandes pueden potenciar la inteligencia corporal. Dijo que los robots humanoides son los mejores portadores de inteligencia corporal y su crecimiento depende del desarrollo de modelos grandes. Construir un robot humanoide que piense y se mueva como humanos no solo se basa en modelos grandes, sino que también implica aprendizaje profundo, algoritmos de control de movimiento y percepción general, como la percepción táctil, la percepción visual y la capacidad de comprender entornos complejos y razonamiento lógico.

La inteligencia espacial recientemente mencionada se basa en permitir que los robots vean el mundo, permitiendo que los robots comprendan mejor el mundo, aprendan conocimientos y tomen acciones mientras observan el mundo. Entonces, bajo esta premisa general, lograr la percepción incorporada real2sim (el proceso de aplicar un modelo entrenado en un entorno de simulación a un entorno real), que permita al robot percibir mejor el mundo, es el requisito previo para convertirse en un robot más flexible.

Integrar modelos grandes en inteligencia incorporada requiere equilibrar el consumo de energía y los ingresos

Algunos espectadores preguntaron: "Si un modelo grande está integrado en un robot inteligente, ¿requiere soporte de hardware adicional? ¿Es necesario reequilibrar el rendimiento y el consumo de energía?".

El Dr. Zhao cree que esta es una buena pregunta. Al incorporar robots inteligentes en modelos grandes, se debe considerar el soporte de hardware y el equilibrio entre rendimiento y consumo de energía. La inteligencia incorporada en un sentido amplio, incluidos los humanos, necesita equilibrar el consumo de energía con los beneficios obtenidos. Por ejemplo, el cerebro humano consume poca energía pero es inteligente. Sin embargo, la potencia informática y el consumo de energía de los grandes modelos actuales durante el entrenamiento y la inferencia no pueden satisfacer las necesidades de los robots inteligentes.

La dirección del desarrollo futuro es: primero, reducir significativamente el consumo de potencia y energía informática de los modelos grandes a través de la tecnología; segundo, mejorar la arquitectura y el paradigma del modelo; tercero, desarrollar chips especiales, como ASIC, para aumentar la densidad de inteligencia; , es decir, la inteligencia del chip por unidad de área. Hasta cierto punto, la tecnología de modelos grandes se puede aplicar eficazmente a robots inteligentes incorporados mediante el refuerzo del software y el uso del chip dedicado desarrollado para el razonamiento del modelo.

Los grandes modelos multimodales serán un módulo importante de inteligencia incorporada para lograr avances tecnológicos como el control y la toma de decisiones.

En términos de tecnologías clave como el control, la toma de decisiones y la navegación de la inteligencia incorporada, Yin Zhi cree que el problema actual de los robots impulsados ​​por grandes modelos de lenguaje es que necesitan convertir información en texto y luego procesarla. Una transición temporal. En el futuro, los robots deberían poder comprender el entorno de percepción nativo. No es necesario utilizar el lenguaje para tomar decisiones de control y navegación, y habrá mucha lógica en la visión.

En el futuro, los modelos grandes podrán utilizar sistemas multimodales para mejorar las capacidades de inteligencia, con módulos responsables de diferentes funciones, como el cerebro humano. En la actualidad, puede haber varios modelos pequeños que controlan diferentes funciones respectivamente. Los robots de comando de modelos grandes son una forma de transición. Los modelos grandes multimodales son una tendencia, pero primero se pueden mejorar las capacidades inteligentes combinando modelos pequeños con modelos grandes. , Dependiendo de En el desarrollo de modelos grandes, actualmente faltan datos de modelos grandes nativos multimodales.

Zhao He señaló que en términos de control, la introducción de servos visuales en robots industriales puede abrir el control subyacente y las tareas de nivel superior, reduciendo significativamente los costos de la aplicación en términos de navegación, la premisa es la percepción, incluida la información multimodal; como el tacto y la temperatura, pero la eficacia de la información multimodal La integración tiene mayores desafíos técnicos, pero es una dirección de desarrollo positiva. Permitir que las máquinas comprendan las intenciones humanas y los requisitos de las tareas a través del diálogo multimodal entre varias personas y tangentes flexibles completas será un progreso revolucionario. También puede proporcionar estándares inteligentes básicos para robots industriales más inteligentes y lograr una producción estandarizada y una adaptación flexible en el sitio. .

Fu Yihui estuvo de acuerdo con el punto de vista del Dr. Zhao He. Mencionó que al proporcionar sensores táctiles para robots humanoides, estos enfrentan el problema de la fusión de datos táctiles y datos visuales, así como problemas como la percepción de alta precisión y la toma de decisiones complejas. fabricación y robustez Entre ellos, los datos táctiles y la fusión de datos de percepción multimodal son la clave para romper con la percepción corporal. Los grandes modelos multimodales con datos de detección táctil ayudan a los robots a interactuar en escenas complejas. Aunque los algoritmos tradicionales se pueden implementar en algunas escenas después de mucho entrenamiento, todavía habrá escenas que no hayan sido entrenadas y es difícil cubrir las de bajo nivel. Escenas de probabilidad. Problemas con baja capacidad de generalización.

2. Escenarios de implementación y expresión de valor de la inteligencia incorporada en el ámbito industrial

Los escenarios de aplicaciones de fabricación industrial comienzan con la resolución de tangentes flexibles

Los robots industriales se han utilizado durante mucho tiempo, pero la mayoría de ellos están automatizados. Hay problemas como depuración compleja, alto costo y baja eficiencia. El núcleo de la inteligencia es resolver el problema de las tangentes flexibles. Zhao He compartió una serie de casos de aplicaciones industriales específicas, como en la línea de ensamblaje, que ayudan a los clientes a resolver los problemas de los altos costos de corte de línea y la dificultad para ajustar las líneas de producción. Originalmente, tres ingenieros tardaron casi una semana en ajustar la línea de producción para que toda la línea de producción funcionara a plena capacidad. Se espera que el uso de tecnología de robots industriales inteligentes mejore esta situación.

En el proceso de inspección de calidad, proporcionamos una máquina de inspección de calidad de apariencia basada en tecnología de inteligencia artificial a una gran fábrica con más de 3000 personas, reemplazando con éxito a más de 2000 trabajadores de inspección de calidad. No solo redujo los costos laborales, sino también el rendimiento de la máquina. No era inferior al del trabajo manual y puede funcionar las 24 horas del día.

En el proceso de posprocesamiento después de la detección de defectos, para resolver los problemas de eficiencia y calidad causados ​​por la escritura ciega de los trabajadores en el proceso de reparación de piezas de fundición a presión, se utiliza tecnología de robot industrial inteligente para combinar múltiples robots para formar una serie de Operaciones como detección de defectos, planificación de trayectorias y pulido. La estación de trabajo inteligente resuelve las limitaciones de la operación manual y tiene un impacto positivo en el flujo del proceso de piezas de fundición a presión de gran tamaño.

La inteligencia incorporada y las poderosas capacidades tangentes flexibles mejorarán la eficiencia de la producción de fabricación industrial.

La mejora de la eficiencia corporativa se refleja en dos aspectos: el coste laboral y la eficiencia de producción y operación. Fu Yihui señaló que desde la perspectiva de los costos laborales, cuando el precio de los robots pueda cubrir mejor los costos laborales, será el nodo para la comercialización. La industria de los robots humanoides puede ser más grande que el mercado de la industria automotriz. En términos de eficiencia de producción, los robots pueden trabajar las 24 horas del día y su eficiencia de aprendizaje es mucho mayor que la de los humanos. Mediante una toma de decisiones optimizada y un control preciso, pueden mejorar la eficiencia de las operaciones industriales o comerciales.

Zhao He cree que el primer problema común en la industria manufacturera son los problemas humanos, como la dificultad para contratar y retener trabajadores calificados. Las empresas esperan reducir su dependencia de la mano de obra y reducir los costos. Weiyi Intelligent Manufacturing presentó una máquina de inspección de calidad basada en tecnología de inteligencia artificial para una gran fábrica con más de 3000 personas, reemplazando a 2000 trabajadores de inspección de calidad, reduciendo los costos laborales y el rendimiento de la máquina no es peor que el de los humanos, y puede operar las 24 horas. horas al día.

En segundo lugar, el costo del corte de líneas flexibles es alto, los modelos de producción, suministro y comercialización han cambiado y los pedidos de lotes pequeños y de lotes múltiples han aumentado. El modelo de producción tradicional no puede satisfacer la demanda del mercado. Se requiere tener capacidades de corte de línea flexibles, rápidas y de bajo costo para hacer frente a la situación. Nuevos puntos débiles en la industria manufacturera, lo que permite a las empresas mejorar la eficiencia de la producción.

Priorice la implementación de escenarios peligrosos e ingrese a escenarios más complejos a medida que aumenta la capacidad de generalización.

Existen diferentes opiniones sobre en qué escenarios se deberían implementar primero robots inteligentes incorporados. Yin Zhi cree que la industria manufacturera ha utilizado ampliamente equipos inteligentes incorporados, como brazos robóticos, robots logísticos, etc., y se utilizará más en los enlaces de ensamblaje, logística y almacenamiento de la industria manufacturera en el futuro. También se vuelven cada vez más comunes, incluidos hogares, centros comerciales, comunidades, etc. Escenarios, los automóviles autónomos también son una categoría. Consideró que deberíamos comenzar con trabajos que los humanos no están dispuestos a hacer, que no son aptos para realizar o que son peligrosos y aburridos.

Fu Yihui cree que no puede entenderse simplemente en el orden de la industria, el comercio y la familia. Los primeros en implementarse deberían ser aquellos con escenarios y requisitos de capacidad relativamente únicos, por ejemplo, en la línea de producción de automóviles, la instalación y el cableado. de los arneses de cableado en los automóviles todavía dependen del trabajo manual, y los robots humanoides deben ser táctiles y una solución de fusión de percepción modal en escenarios comerciales, como farmacias que reemplazan a los empleados para tomar medicamentos, reemplazo y reabastecimiento de supermercados, reabastecimiento de combustible en gasolineras; y carga, etc., también existen escenarios de aplicación especiales o peligrosos, que pueden reemplazar a las personas involucradas en trabajos peligrosos y, eventualmente, seguir al humanoide. Con capacidades de generalización mejoradas, los robots ingresarán a escenarios de interacción y colaboración doméstica más complejos.

Con un aprendizaje de adquisición rápido y capacidades de generalización mejoradas, podrá resolver muchos problemas de escenas complejos.

Con respecto a cómo mejorar la generalización y la capacidad general de varias habilidades para lograr su aplicación en diferentes escenarios, Fu Yihui comenzó desde la perspectiva de la percepción táctil, recopiló datos relacionados con el tacto a través de escenas reales y promovió el entrenamiento de simulación para mejorar la operación diestra del robot y la capacidad de generalización. de agarre.En escenarios industriales, cuando nos enfrentamos a objetos agarrados complejos y diversos, es necesario mejorar la generalización de las capacidades táctiles o de agarre para resolver el problema.

Zhao He cree que actualmente no hay forma de que los robots hagan todo sin aprender. En escenarios industriales, la generalización y las capacidades generales se reflejan en la inteligencia básica, es decir, a través de tecnologías como modelos grandes, los robots pueden aprender rápidamente nuevas habilidades para tareas. Si esta capacidad se puede realizar, será un avance revolucionario para la aplicación de robots industriales inteligentes en la industria.

Fu Yihui cree que los robots humanoides necesitan la capacidad de pensar en una cadena de pensamiento y tener un cierto grado de generalización para satisfacer las necesidades de los robots en diversos escenarios. Por ejemplo, Google RT2 integra LLM y visual Transformer para integrar detección y control basándose en juzgar el entorno y la intención, puede crear estrategias de acción óptimas para mejorar las capacidades de ejecución del robot.

3. Exploración de métodos de capacitación y recopilación de datos para la inteligencia incorporada.

Un miembro de la audiencia preguntó cómo obtener grandes cantidades de datos. ¿Existen formas innovadoras de obtenerlos? Zhao He cree que el desarrollo de Internet industrial ha acumulado datos objetivamente para el nacimiento de grandes modelos industriales. En la implementación real, la recopilación, organización, automatización y operación inteligente de datos deben implementarse en productos y servicios como puntos centrales.

Actualmente, no existe ningún método de entrenamiento maduro y ampliamente aceptado para la inteligencia corporal. Tomando como ejemplo los robots industriales inteligentes, se espera que los modelos grandes puedan comprender tareas y generar instrucciones de control mediante métodos como la videovisión artificial.

En términos de métodos de entrenamiento para inteligencia incorporada, se trata más de entrenar inteligencia incorporada en un entorno de simulación, o utilizar simulación y datos generados para el entrenamiento. Porque el uso de datos reales para entrenar modelos inteligentes incorporados o robots inteligentes tiene el problema de la dificultad en la recopilación de datos y el volumen de datos insuficiente.

Yin Zhi propuso que existen proveedores de servicios de datos profesionales externos, como empresas de anotación de datos, que pueden convertirse en formadores de IA o empresas proveedoras de servicios en el futuro. En China, las ventajas en los costos laborales son relativamente obvias y se espera que forme una industria de datos multimodales y servicios de capacitación inteligentes.

dar palabras

Aunque la integración de la inteligencia incorporada y los grandes modelos ha logrado ciertos resultados, todavía es necesario seguir investigando cómo optimizar aún más el equilibrio entre el consumo de energía y los ingresos y lograr la aplicación madura de los grandes modelos multimodales. Desde resolver problemas clave tangentes flexibles hasta mejorar las capacidades de generalización para adaptarse a entornos industriales complejos y diversos, establecer métodos de capacitación maduros y efectivos o aprovechar al máximo las ventajas de los servicios de datos de terceros, todos estos son factores que promueven la aplicación generalizada. de la inteligencia corporal en el ámbito industrial.

A lo largo del evento, los asistentes en línea participaron activamente en intercambios interactivos, incluidas personas de Audi China, NIO, Ideal, Dongfeng, Schneider Electric, Amazon Cloud Technology, Horizon Robotics, Huawei Terminal, Baidu, China Telecom y otras empresas. instituciones como CICC Capital, Dingjie Software Ventures, China Software Group, Yizhuang State Investment y China Unicom Industrial Internet of Things. La audiencia y los invitados sostuvieron conversaciones profundas, intercambiaron experiencias prácticas y discutieron la cooperación empresarial, concluyendo con éxito este seminario de pares en línea 502.

Para realizar un seguimiento de más actividades prácticas de innovación digital y de IA, síganos.Grupo de expertos sobre el olfato de tigreComplete el registro para recibir nuestras actualizaciones de contenido y notificaciones de eventos.

Acerca de Huxiu Think Tank: Huxiu Think Tank es una nueva organización de servicios de investigación que se centra en la digitalización empresarial y la práctica de innovación en IA. Proporciona informes de investigación detallados, selección de casos y reuniones en línea para ambas partes en el proceso de inteligencia industrial. Se brindan actividades y servicios de visitas para apoyar la toma de decisiones acertadas de los ejecutivos corporativos en inteligencia y digitalización. Los valores fundamentales que brindamos: conocimientos oportunos y de alta calidad, comprensión de la tecnología, la industria, los pares y los oponentes, proporcionando referencias importantes para los tomadores de decisiones en materia de tecnología y decisiones estratégicas de productos, planificación industrial y selección de soluciones; comprender las tecnologías de vanguardia y el estado de desarrollo de las industrias afectadas y las tendencias futuras