Desde juguetes y herramientas hasta “colegas” y “AI Einstein”, ¿qué tan lejos estamos de la inteligencia artificial general?

2024-07-16

Hoy en día, la inteligencia artificial general (AGI) se ha convertido en una de las palabras clave en las que se centra la comunidad científica y la industria. Hace apenas unos años, muchas personas creían que se necesitarían al menos entre 10 y 50 años para realizar la AGI. nunca sería posible. Hoy en día, estos últimos son pocos y espaciados. Sin embargo, en comparación con el entusiasmo del público por esta ola de cambios tecnológicos, muchos académicos de primera línea y líderes de la industria en el campo de la IA (inteligencia artificial) sienten que todavía queda un largo camino por recorrer antes de que la IA actual pueda convertirse en AGI.

Según Qi Yuan, el distinguido profesor Hao Qing de la Universidad de Fudan, decano del Instituto de Inteligencia Científica de Shanghai (en adelante, "Instituto de Shanghai") y fundador de la gran empresa de modelos de confianza "Infinite Lightyear", "una de las más altas "Manifestaciones de inteligencia artificial general". Es descubrir las leyes desconocidas del mundo complejo. En resumen, debería ser un 'AI Einstein'. Esto requiere que creemos una combinación de predicción de probabilidad de 'caja negra' de pensamiento rápido y pensamiento lento. el razonamiento lógico de la caja blanca para crear el gran modelo confiable de la 'Caja Gris' y, a través de la profunda integración de la tecnología y la industria, promovemos la investigación básica, la formación de talentos y la implementación de resultados para crear un ecosistema de innovación científica e inteligente ".

En la Conferencia Mundial de Inteligencia Artificial (WAIC) de 2024 y la Conferencia de Alto Nivel sobre Gobernanza Global de la Inteligencia Artificial, que concluyó no hace mucho, el Instituto de Tecnología de Shanghai celebró con éxito el foro temático "Inteligencia artificial: cambio de paradigma de investigación científica y desarrollo industrial". Esta es también la primera vez que esta nueva institución de I+D aparece en WAIC. Se puede decir que el Instituto Shangzhi es un modelo para Shanghai en la exploración del modelo ecológico científico inteligente "1+1+N" impulsado por la innovación. Es decir, el "1" del Instituto Shangzhi sirve como centro y eje del ecosistema, responsable. para la planificación estratégica general, la integración de recursos y La I + D e innovación de tecnologías clave, combinadas con otro "1" de la Universidad de Fudan y las "N" de muchas universidades, instituciones de investigación científica, empresas de tecnología, equipos de innovación e instituciones de inversión, promueven conjuntamente investigación científica, formación de talentos, transformación de logros científicos y tecnológicos e innovación y mejora de la industria.

El estándar para AGI debería ser crear "AI Einstein"

Desde una perspectiva técnica, ¿los modelos grandes con cada vez más parámetros conducirán a la inteligencia artificial general? Hoy en día, ya sea desde la perspectiva de la tecnología de inteligencia artificial en sí o desde la perspectiva del consumo de energía, aunque los grandes modelos basados en la arquitectura autorregresiva de Transformer todavía tienen dividendos, no son suficientes para conducir a la inteligencia artificial general. La inteligencia artificial requiere el desarrollo de nuevos modelos grandes y confiables de "caja gris". Este es un resumen de los muchos años de experiencia práctica de Qi Yuan en el mundo académico y la industria.

Hace diez años, con la idea de "hacer útil la inteligencia artificial", Qi Yuan dirigió el equipo para aumentar el sistema central de aprendizaje automático de Alibaba de 2 millones de parámetros a cientos de millones de parámetros por primera vez, logrando un efecto comercial a gran escala. Demostrar la transformación integrada de datos, algoritmos y capacidades de ingeniería. Esta es exactamente la encarnación de la ley de escala de la que se habla hoy en el círculo de la inteligencia artificial.

Qi Yuan recordó que el equipo probó los beneficios de la Ley de Escala en ese momento: después de que los parámetros del modelo se incrementaron cien veces, el efecto general mejoró a pasos agigantados. "Pero ahora estoy pensando: ¿Por qué no hicimos más modelos de IA en ese entonces? ¿Por qué me detuve aquí cuando dimos un paso adelante? Dijo: "Todavía existen grandes modelos con cientos de millones de parámetros". No es suficiente para avanzar hacia decenas de miles de millones, cientos de miles de millones o incluso billones. En ese momento, tanto la academia como las instituciones carecían de potencia informática, e incluso en el mundo industrial, lograr una potencia informática tan alta requería costos muy altos, e incluso. Más aún, por no hablar de la academia".

La razón por la que el estándar para AGI debería ser crear un "AI Einstein", explicó Qi Yuan, es para que sea eficaz e inteligente. En primer lugar, Einstein vio las "nubes oscuras de la física de principios del siglo XX" a través de varios puntos de datos clave. AGI también debería poder descubrir leyes desconocidas que comprendan el mundo complejo. Sin embargo, ninguno de los grandes modelos actuales puede hacer esto. Aunque el gran modelo visual SORA simula el mundo físico en un grado sin precedentes, SORA todavía construye un mundo tridimensional basado en la simulación del mundo bidimensional, que aún está lejos. desde una comprensión profunda del mundo físico. Mucha distancia. El segundo es el consumo de energía. La potencia del cerebro humano es de aproximadamente 15 vatios y la potencia máxima de una GPU es de varios cientos de vatios. Sin mencionar que para soportar el entrenamiento de modelos grandes de uso general se requieren una kilotarjeta o un grupo de diez mil tarjetas. . Por ahora, si continúa utilizando la arquitectura existente, requerirá una enorme cantidad de consumo de energía, lo que dificultará lograr el objetivo de ser eficaz e inteligente.

"AI Einstein" es también un objetivo clave de AI for Science (Nota: Inteligencia científica, en lo sucesivo denominada AI4S). La inteligencia científica ya desempeña un papel importante a la hora de acelerar la solución de ecuaciones físicas conocidas, pero la inteligencia científica necesita combinar reglas y datos conocidos, reducir la gran dependencia de los datos y la potencia informática, mejorar la precisión del razonamiento y la predicción, y realizar ajustes en función del conocimiento de los datos. reglas y proponer nuevas teorías científicas. Esto también coincide con el objetivo a largo plazo de Qi Yuan de trabajar en la Universidad de Fudan y el Instituto de Propiedad Intelectual de Shanghai: "utilizar la inteligencia artificial para comprender el mundo complejo y descubrir leyes desconocidas".

El modelo grande de campo vertical confiable de "caja gris" empodera a miles de industrias

¿Qué problemas deben resolverse con urgencia cuando los modelos grandes implementan nueva productividad a partir de herramientas de inteligencia artificial? Desde la perspectiva de Qiyuan, la industria de los grandes modelos enfrenta muchos desafíos comunes, lo que dificulta igualar la tecnología, los productos y la demanda del mercado.

"En la actualidad, el mayor problema en la implementación de modelos a gran escala es que parecen útiles a primera vista, pero son inútiles una vez que se usan". Qi Yuan explicó que el núcleo de los modelos de lenguaje a gran escala actuales es simplemente predecir la siguiente palabra para predecir la siguiente palabra, pero esto no es adecuado para un razonamiento riguroso de varios pasos. "El lenguaje es una herramienta para la comunicación, no una herramienta para el pensamiento". Recientemente, un artículo publicado por el Instituto Tecnológico de Massachusetts (MIT) y otras instituciones en la importante revista académica "Nature" señaló que el lenguaje es una poderosa herramienta para la difusión. conocimiento cultural, y puede estar relacionado con Nuestras capacidades de pensamiento y razonamiento coevolucionaron para reflejar la complejidad de la cognición humana. Pero el lenguaje no crea la complejidad del razonamiento.

En vista de las características existentes de los modelos grandes, como la falta de confiabilidad, la baja interpretabilidad y el alto costo, una solución verdaderamente efectiva es combinar el razonamiento probabilístico de redes neuronales con cálculos lógicos simbólicos, similar a la combinación del premio Nobel de economía Daniel Card. Se puede decir que el pensamiento rápido basado en el instinto humano y el pensamiento lento basado en el razonamiento lógico descritos en el libro de Niemann "Thinking Fast and Slow" son un gran modelo de 'caja gris', según Qi Yuan, la "caja gris" confía en los modelos grandes. Combinar la computación simbólica con las redes neuronales puede reducir la "ilusión" de la inteligencia artificial y resolver problemas profesionales en campos verticales, empoderando así a miles de industrias y liberando la productividad de grandes modelos.

¿Qué es un modelo grande confiable de "caja gris"? "Originalmente se pensaba que el aprendizaje profundo era una 'caja negra', pero ahora combinamos la 'caja blanca' del razonamiento lógico con el aprendizaje profundo, y se convierte en una 'caja gris', explicó Qi Yuan: "La 'caja negra' original. ' hace que las personas no sepan nada sobre el proceso de generación de resultados de datos, y el modelo grande de 'caja gris' puede hacer que las personas 'sepan qué está sucediendo y por qué' con la ayuda del razonamiento lógico. Los modelos pueden utilizar el aprendizaje profundo para reducir las reglas que no lo hacen. coincide con los datos de observación del mundo real".

Qi Yuan dijo que para hacer que los escenarios complejos en diversas industrias se conviertan en nuevos campos de batalla donde la IA desempeñe un papel central, ya sea en finanzas y seguros, energía eólica, transporte marítimo, escenarios médicos y farmacéuticos, es necesario integrar el conocimiento sistemático de la industria. Lógica de razonamiento y mecanismos de toma de decisiones combinados con modelos grandes. Los modelos grandes de "caja gris" no son sólo la dirección general de la inteligencia artificial general, sino también una herramienta poderosa para que los modelos grandes penetren profundamente en campos verticales y resuelvan verdaderamente problemas prácticos. "Si lo miras desde una perspectiva industrial, esta comprensión es muy intuitiva". Qi Yuan dio un ejemplo. Los médicos no necesitan ser abogados y los abogados no necesitan ser expertos en inversiones. Cada función profesional debe centrarse en sí misma. campo y fabricar sus propias herramientas de productividad. Técnicamente hablando, puede ocurrir un "olvido catastrófico" si un modelo grande se aprende demasiado en tareas irrelevantes. Al igual que si Li Bai trabajara como contador todo el día y no escribiera poesía, su inspiración poética podría desvanecerse gradualmente. "Hemos observado que cuando se entrena un modelo grande en un campo vertical, si se le permite al modelo aprender demasiadas funciones irrelevantes, interferirá con sus capacidades originales. Por lo tanto, es necesario hacer un modelo grande de 'caja gris' en el campo vertical. Creo que tiene un gran valor en la implementación industrial".

"Creo que el gran modelo de 'caja gris' desempeñará un papel cada vez más importante en el camino hacia la implementación de AGI y la industria vertical, porque desde una metodología bayesiana, consiste en combinar nuestro conocimiento conocido y oculto. La información desconocida en los datos se combina para descubrir nuevas leyes y resolver problemas científicos e industriales ", Qi Yuan dijo sin rodeos que en el futuro, "AI Einstein" también puede ser "AI Buffett".

Abrir la cadena de innovación y construir un ecosistema de innovación científica e inteligente.

En la Conferencia Mundial de Inteligencia Artificial de 2024, un equipo dirigido por Qi Yuan lanzó un modelo médico y financiero en lenguaje ligero confiable a gran escala con decenas de miles de millones de parámetros. Las pruebas de modelos grandes en estos dos campos verticales han superado el modelo grande GPT4-Turbo de billones de parámetros de OPEN AI, lo que una vez más despertó la atención de la industria sobre la implementación de modelos grandes.

"Los avances actuales en inteligencia artificial no solo provienen de la innovación de principios subyacentes, sino que también están impulsados por productos orientados a necesidades sociales. Lo que la sociedad necesita no es solo la publicación de artículos teóricos o la innovación de modelos de negocios, sino la integración profunda de tecnologías innovación e innovación industrial, que se basa en un gran avance en el principio de unidad. Una vez que los dos se combinan, podemos nadar hasta un lugar donde el agua es más azul", dijo Qi Yuan.

La academia y la industria tienen misiones diferentes. La academia debe explorar cosas nuevas, mientras que la industria primero debe resolver problemas prácticos. Existe un problema común en el país y en el extranjero: las instituciones de investigación necesitan estudiar muchas cuestiones de innovación tecnológica, pero si ignoran la productización y las necesidades sociales, habrá dos deficiencias: la falta de presión competitiva real y la incapacidad de moderar las tecnologías innovadoras en competencia. La retroalimentación eficaz de la información del mercado impulsa la dirección de la investigación y el desarrollo de tecnología.

Con este fin, Qiyuan ha estado esperando abrir la cadena de innovación de "universidades-institutos de investigación-empresas emergentes" y crear un buen ecosistema de innovación. No solo piensa en la tecnología subyacente, sino que también comprende la demanda del mercado. Utilice la demanda y los escenarios del mercado para impulsar la dirección del producto e innove desde abajo hacia arriba para desarrollar la competitividad central del producto.

Shangzhiyuan, fundada en 2023, está comprometida con la innovación original en IA para la ciencia que combina conocimiento y datos. Recientemente, el Instituto Shangzhi lanzó la serie Fuxi de modelos meteorológicos 2.0 a gran escala para aplicaciones industriales como nuevas energías, seguros y gestión urbana, y tomó la iniciativa en el lanzamiento de la Alianza Ecológica de Innovación Meteorológica Inteligente, uniendo múltiples unidades para promover gradualmente la industrialización. de la serie Fuxi de aplicación de modelos meteorológicos a gran escala 2.0. También está en marcha el lanzamiento del producto del modelo grande confiable "caja gris" Infinite Lightyear, una compañía de modelos grandes confiable donde Qi Yuan es el fundador.

Para seguir prosperando el ecosistema de innovación científica e inteligente, la segunda conferencia fue patrocinada conjuntamente por la Academia Inteligente de Shanghai y la Universidad de Fudan, y guiada conjuntamente por la Comisión Municipal de Ciencia y Tecnología de Shanghai, la Comisión de Reforma y Desarrollo Municipal de Shanghai y la Comisión de Información y Economía Municipal de Shanghai. Comisión, Comisión Municipal de Educación de Shanghai y otros departamentos. Se ha lanzado el Concurso Mundial de Ciencia e Inteligencia. La competición establece un premio de un millón de dólares para reclutar jugadores de todo el mundo para explorar conjuntamente los campos fronterizos de la inteligencia científica. Al mismo tiempo, el Instituto Shangzhi ha liderado el desarrollo de una plataforma de datos científicos que cubre datos científicos multimodales. La plataforma tiene capacidades de enlace completo desde la recopilación y el procesamiento de datos hasta la gestión y el modelado, lo que garantiza un procesamiento eficiente, confiabilidad e interoperabilidad segura de los datos. . Sobre la base de esta plataforma, SPIC y sus socios han construido múltiples conjuntos de datos científicos de alta calidad para los campos de las ciencias biológicas, las ciencias físicas y las ciencias atmosféricas, proporcionando recursos valiosos para la investigación de inteligencia científica. Además, el Instituto Shangzhi tomó la iniciativa en el lanzamiento de la Alianza Ecológica Global de Datos Científicos. El primer grupo de unidades miembros de la alianza incluye más de diez unidades, incluidas China Telecom Co., Ltd., COSCO Shipping Property Insurance Captive Co., Ltd., Shanghai. Lingang New Area Tecnología de datos transfronterizos Co., Ltd. La alianza construirá una plataforma global de apertura e intercambio de recursos de big data de investigación científica de múltiples campos a través de la cooperación con gobiernos, empresas, universidades, instituciones de investigación y otras partes.

"Tanto la investigación científica como la industria no deberían ser 'nuevas por ser nuevas'. Esperamos poder construir en el futuro inteligencia artificial general y aplicaciones para resolver problemas del mundo real", dijo Qi Yuan.

autor:

Imagen: Foto cortesía del Instituto de Investigación de Inteligencia de Shanghai Editor: Wu Jinjiao Editor en jefe: Jiang Peng

Indique la fuente al reimprimir este artículo.

noticias

Desde juguetes y herramientas hasta “colegas” y “AI Einstein”, ¿qué tan lejos estamos de la inteligencia artificial general?

Introducción

Mi informacion de contacto