noticias

Visitando la nueva productividad de Beijing·Fuera del laboratorio|Gran modelo invisible, productividad visible

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

En 2017, la inteligencia artificial se incluyó por primera vez en el informe de trabajo del gobierno chino y se convirtió en una estrategia nacional. En 2018, nació el Instituto de Investigación de Inteligencia Artificial Zhiyuan de Beijing (en lo sucesivo, "Zhiyuan") en una pequeña oficina en el país líder. espacio de innovación. En ese momento, el modelo GPT de primera generación lanzado por OpenAI aún no había acaparado los titulares de los medios.

En 2023, Zhiyuan actualizó el primer modelo inteligente de ultra gran escala de mi país, "Wudao", a 3.0, convirtiéndose en una de las tres instituciones de inteligencia artificial más avanzadas del mundo en la mente del presidente de Microsoft, Brad Smith. En el campo de los modelos grandes, Zhiyuan es la única institución de investigación no empresarial del mundo que no cuenta con el respaldo de un gran fabricante. También es la primera institución de investigación nueva en China que presenta sistemáticamente y de forma abierta la investigación y el desarrollo de tecnología de modelos grandes. fuente de construcción ecológica, formación de talentos y cultivo empresarial.

"La igualdad de derechos en ciencia y tecnología siempre ha dado lugar a importantes oportunidades industriales en el pasado". Wang Zhongyuan, el nuevo presidente de Zhiyuan, que tiene experiencia corporativa y experiencia en instituciones de investigación, tiene un conocimiento más profundo de las industrias impulsadas por la tecnología. . La definición de inteligencia artificial del país también es más específica: la inteligencia artificial es un motor importante para el desarrollo de nuevas fuerzas productivas.


Trabaja duro para adelantarte a la tormenta

Una o dos veces, el director ejecutivo de Dark Side of the Moon, Yang Zhilin, estuvo rodeado de asistentes al menos tres veces en la Conferencia Zhiyuan de Beijing 2024. Cuando el fundador de OpenAI, Sam Altman, pronunció un discurso en video en la Conferencia de Zhiyuan hace un año, la inquietud fue igualmente obvia. .

De 2023 a 2024, los científicos de inteligencia artificial, los directores ejecutivos de las principales empresas de tecnología y los fundadores de nuevas empresas estrella se reunirán en varios lugares para predicar sobre modelos grandes, ya sean expertos técnicos o no, todos en el escenario han oído hablar más o menos. El nombre Zhiyuan. Muchos de ellos estuvieron directamente involucrados en los proyectos de investigación de modelos a gran escala de Zhiyuan en ese entonces. El CTO de Baidu, Wang Haifeng, una vez se desempeñó como director de Zhiyuan, Tang Jie, fundador de Zhipu AI, se desempeñó como vicepresidente de Zhiyuan y Yang Zhilin participó en la investigación y el desarrollo de Wu Dao.

Estos creadores de tendencias de IA no se involucraron con Zhiyuan en este momento, y Zhiyuan no se involucró en modelos grandes solo después de que se hicieron populares.

En 2019, Zhiyuan comenzó a diseñar modelos grandes. En 2020, estableció un equipo de investigación de Wudao y lanzó la investigación y el desarrollo de modelos grandes. En marzo de 2021, se lanzó por primera vez el modelo grande Wu Dao 1.0, y en junio se lanzó Wu Dao 2.0. Utiliza 1,75 billones de parámetros para crear el récord del modelo grande "más grande del mundo" en ese momento. El modelo grande GPT-3 más avanzado de OpenAI en ese momento tenía 10 veces más parámetros.

La investigación científica presta atención a lo somatosensorial, planteando preguntas y emitiendo juicios. El juicio de que "se acerca la era de los grandes modelos de inteligencia artificial" le dio a Zhiyuan un coraje sin reservas. Incluso el término chino "gran modelo" fue propuesto por primera vez por Zhiyuan.

¿Qué es un modelo grande? Huang Tiejun, presidente del Instituto de Investigación Zhiyuan, cree que se deben cumplir tres condiciones: a gran escala, con parámetros que superen las decenas de miles de millones; emergente, capaz de producir nuevas capacidades inesperadas, versátiles, no limitadas a problemas o campos especializados, capaces de manejar; Muchas tareas diferentes.

En 2023, los modelos grandes saldrán a la luz pública. Los modelos de la serie Wudao se actualizaron a la versión 3.0, cubriendo modelos grandes básicos como lenguaje, visión y multimodalidad, y son de código completamente abierto. En la discusión sobre modelos básicos en la Universidad de Stanford en ese momento, Intelligent Source se ubicó junto a gigantes tecnológicos como Google, Microsoft y Facebook (ahora Meta), convirtiéndose en la institución representativa de la investigación de grandes modelos en el mundo.

"El surgimiento de la mayoría de los resultados de la investigación en la historia fue accidental y nadie pudo planificarlo. Todos los esfuerzos están destinados a mejorar la probabilidad: reunir a investigadores destacados y brindarles un entorno comunitario donde puedan colisionar ideas, descubrir problemas y encontrar socios colaboradores "El prefacio escrito por Zhang Hongjiang, presidente fundador del Instituto de Investigación Zhiyuan, a la autobiografía del ganador del Premio Turing Yann LeCun se parece más a la razón por la que Zhiyuan llegó primero.

hacer ingenieria de sistemas

A principios de 2018, Beijing emitió las "Medidas de implementación de Beijing para apoyar la construcción de nuevas instituciones de investigación y desarrollo de clase mundial" para llevar a cabo una reforma radical del sistema de ciencia y tecnología. En diciembre, con la orientación y el apoyo del Ministerio de Ciencia y Tecnología y el Comité y Gobierno del Partido Municipal de Beijing, se estableció oficialmente Zhiyuan.

Anteriormente, el proceso de gestión de la investigación científica era complejo, con largos ciclos desde la propuesta del proyecto hasta la publicación de la guía, la solicitud de financiación y la revisión, lo que dificultaba la adaptación a las necesidades de investigación científica en constante cambio en un entorno altamente competitivo. Según este sistema, la institución de investigación presentó propuestas de proyectos en octubre de 2020, y la investigación modelo a gran escala no podrá lanzarse oficialmente hasta 2022 como muy pronto. El modelo Zhiyuan tardó menos de cinco meses desde el establecimiento del proyecto hasta el lanzamiento de los modelos grandes.

Se trata de un nuevo tipo de institución de I+D entre universidades y empresas. Xin Zai no utiliza artículos como índice de evaluación final, ni productos como índice de evaluación, sino que para construir sistemas innovadores Xin Zai reúne a académicos de diferentes instituciones y empresas como la Universidad de Tsinghua, la Universidad de Pekín, el Laboratorio de Inteligencia Artificial de Facebook, Baidu, etc. Grandes cosas; lo nuevo es apuntar a grandes problemas, mantener un ojo atento a las principales cuestiones científicas y hacer planes con visión de futuro.

"El modelo universitario ha estado en funcionamiento durante décadas. Es difícil llevar a cabo una I+D sistemática, de manera organizada, a gran escala y entre equipos. Las empresas también invertirán en I+D, pero se inclinan más por una I+D que esté estrechamente relacionada con "El negocio Zhiyuan realizará de tres a un proyecto de investigación que tardará cinco años o más en ver resultados", dijo Wang Zhongyuan en una entrevista exclusiva con un periodista del Beijing Business Daily.

En la actualidad, la confianza de Zhiyuan todavía reside en la determinación del país en materia de inteligencia artificial. En marzo de 2024, Li Qiang, miembro del Comité Permanente del Buró Político del Comité Central del PCC y Primer Ministro del Consejo de Estado, lo dejó claro durante una investigación en Beijing: La inteligencia artificial es un motor importante para el desarrollo de nuevas fuerzas productivas. .

La productividad de nueva calidad es una cualidad de productividad avanzada que desempeña un papel destacado en la innovación, rompe con el modo tradicional de crecimiento económico y la vía de desarrollo de la productividad, tiene las características de alta tecnología, alta eficiencia y alta calidad, y se ajusta al nuevo concepto de desarrollo. Nació de avances tecnológicos revolucionarios, de una asignación innovadora de los factores de producción y de una profunda transformación y modernización industrial. "La igualdad de derechos en ciencia y tecnología ha creado siempre importantes oportunidades industriales en el pasado, y los grandes modelos pueden traer nueva igualdad en ciencia y tecnología", cree firmemente Wang Zhongyuan.

Por ejemplo, los modelos grandes son portadores de "inteligencia", la ola centrada en la IA son las operaciones de inteligencia, la capa inferior son los sistemas técnicos de software y hardware, la capa superior son las aplicaciones de IA y los modelos grandes están en el medio de los dos. desempeñando el papel de "tronco". La importancia del modelo grande es convertir la "inteligencia" en servicios públicos como el agua, la electricidad e Internet, y proporcionar servicios de inteligencia artificial a un gran número de empresas o individuos a través de la computación en la nube.

Se trata de un proyecto sistemático. "Requiere una inversión concentrada de recursos y mano de obra. No lo pueden realizar muchas personas, sino que cada uno lo hace por separado, pero se debe formar un sistema técnico". como la fabricación de acero y la generación de energía, se necesita un conjunto completo de sistemas técnicos para garantizar la producción de acero de alta calidad y una generación de energía estable a un costo relativamente bajo", afirmó Huang Tiejun.

Ir más allá de la industria

El sistema técnico construido por Zhiyuan incluye: grupo de familia de modelos grandes, sistema operativo de modelos grandes, conjunto de datos, marco de capacitación, biblioteca de operadores, etc. Estos logros están colgados en la pared del primer piso del edificio Chiyuan junto con la visión y los objetivos de Chiyuan.

La visión y los objetivos se dividen en cinco grandes sectores, incluidos los mecanismos y el desarrollo industrial, que se pueden resumir como innovación. "Zhiyuan quiere desarrollar la tecnología de inteligencia artificial más avanzada, liderar y predecir el desarrollo de la inteligencia artificial e ir más allá de la industria", explicó Wang Zhongyuan en detalle: "Zhiyuan hará cosas que las universidades no pueden hacer y las empresas no están dispuestas a hacerlo". "Investigación y desarrollo, proyectos de investigación que tardan de 3 a 5 años o incluso más en ver resultados".

En su opinión, cuando las capacidades técnicas de los modelos grandes alcancen un cierto nivel, habrá dos direcciones principales: "Una dirección es integrarse con productos, promover aplicaciones y ejercer valor comercial. Por otra parte, hay un pequeño número". "Las instituciones que continúan haciendo iteración y optimización de los grandes modelos principales, ya sean empresas o instituciones de investigación, deben continuar abordando tecnologías clave".

Por ejemplo, en multimodalidad, la mayoría de las empresas nacionales eligen la arquitectura DiT para investigación y desarrollo. "Esto se debe a que DiT es una ruta probada. Zhiyuan espera poner diferentes modalidades de información, como texto, imágenes, videos y voces, en un modelo de entrenamiento desde el principio. Wang Zhongyuan utilizó la analogía del cerebro humano". "Este gran modelo multimodal puede ver, comprender y razonar sobre el mundo. En el futuro, los modelos grandes combinados con hardware, es decir, inteligencia incorporada, podrán ingresar al mundo físico para servir a los humanos".

Las empresas se mantienen cerca del mercado y buscan escenarios ascendentes, mientras que las instituciones de I + D se centran en avances tecnológicos centrales y brindan apoyo a la baja. Wisdom Source pertenece al segundo tipo, que está lejos de aplicaciones y escenarios, pero utiliza el código abierto como respaldo. La industria.

"La inteligencia artificial no equivale a grandes modelos, es sólo un género de inteligencia artificial", explicó Wang Zhongyuan a un periodista del Beijing Business Daily. La Fuente Inteligente de hoy también está haciendo todo lo posible por otras tecnologías de inteligencia artificial, como la investigación similar al cerebro y el corazón digital, lo que significa que no hay límite superior para la imaginación de la inteligencia artificial en otras industrias.

Wei Wei, periodista del Beijing Business Daily