noticias

Zhou Chang, la columna vertebral técnica de Alibaba Tongyi Qianwen, dimitirá, pero el último día aún no ha llegado

2024-07-18

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Informe del corazón de la máquina

Departamento editorial de Machine Heart

Hoy, hay noticias en el mercado de que Zhou Chang (apodo: Zhong Huang), la columna vertebral técnica de Alibaba Tongyi Qianwen, ha renunciado para iniciar un negocio. Según las noticias de Machine Heart, Zhou Chang efectivamente dimitirá, pero la fecha final de dimisión aún no ha llegado.

Zhou Chang es una figura importante en el modelo grande de Tongyi Qianwen. De 2020 a 2021, dirigió el equipo para diseñar e implementar el modelo M6 de preentrenamiento multimodal a gran escala, logrando avances en la cantidad de parámetros y el modo de entrenamiento con bajas emisiones de carbono. Este año, el modelo de código abierto Owen1.5-72B de Tongyi Qianwen se convirtió en el primer modelo de código abierto en la lista de rendimiento de modelos HuggingFace (ChatArena), y también es una de las series de modelos comúnmente utilizadas en la comunidad de código abierto.

Anteriormente, Zhou Chang jugó un papel importante en múltiples proyectos durante su tiempo en la Academia DAMO, como el desarrollo de la aplicación de algoritmo de representación de gráficos de productos a escala ultragrande, el marco de representación de usuarios ATRank y la serie CLRec de algoritmos de recuperación de vectores basados ​​​​en uno mismo. -Aprendizaje contrastivo supervisado.

Zhou Chang se graduó de la Universidad de Fudan en 2012 con una licenciatura en informática y tecnología, y en 2017 con un doctorado en teoría y software informático de la Universidad de Pekín. Se unió a Alibaba a través de la contratación escolar y ha trabajado en Alibaba durante más de ocho años. .

Se especializa en aprendizaje profundo, minería de gráficos y computación distribuida. Ha publicado más de 30 artículos en las principales conferencias internacionales en los campos de aprendizaje automático, minería de datos y bases de datos, y se desempeña como revisor de conferencias académicas como NeurIPS/ICML/KDD. /WWW. Los resultados de la investigación del equipo de Zhou Chang ganaron el primer premio del Premio al Progreso Científico y Tecnológico de la Sociedad Electrónica de China y el Equipo Líder de Innovación y Emprendimiento de Hangzhou.

Según Workplace Bonus, la evaluación de Zhou Chang por parte de los expertos de Alibaba es: "Él realmente quiere hacer un modelo grande que sea más de propósito general, en lugar de vertical a un solo campo y escenario".

En la actualidad, el propio Zhou Chang no ha respondido al próximo plan.



Acerca de Tongyi Qianwen

Tongyi Qianwen es un modelo de lenguaje a gran escala desarrollado de forma independiente por el Laboratorio Tongyi. El Laboratorio Tongyi es un laboratorio de procesamiento de lenguaje natural del Grupo Alibaba y se dedica a investigar y desarrollar tecnología general de procesamiento de lenguaje natural para cada unidad de negocios del grupo. proporciona servicios de procesamiento inteligente del lenguaje. El actual director del Laboratorio Alibaba Tongyi es Zhou Jingren.

El 7 de abril de 2023, Tongyi Qianwen comenzó las pruebas de invitación.

El 11 de abril de 2023, todos los productos de Alibaba se conectarán al gran modelo Tongyi Qianwen para una transformación integral en el futuro.

En agosto de 2023, Tongyi Qianwen abrió el modelo qwen-7b.

En septiembre de 2023, Tongyi Qianwen se abrió oficialmente al público; el 25 del mismo mes, Alibaba Cloud anunció que el modelo de código abierto Tongyi Qianwen de 14 mil millones de parámetros Qwen-14B y su modelo de conversación Qwen-14B-Chat son gratuitos para uso comercial. usar.

El 31 de octubre de 2023, Tongyi Qianwen 2.0 se actualizó y lanzó oficialmente, y la aplicación Tongyi Qianwen también se lanzó en consecuencia.

El 1 de diciembre de 2023, Alibaba Cloud abrió el modelo Tongyi Qianwen de 72 mil millones de parámetros Qwen-72B, el modelo de 1.8 mil millones de parámetros Qwen-1.8B y el modelo de audio grande Qwen-Audio. Hasta ahora, Tongyi Qianwen ha logrado un código abierto de "tamaño completo y modalidad completa", con un total de 4 modelos de lenguaje grandes con 1.8 mil millones, 7 mil millones, 14 mil millones y 72 mil millones de parámetros de código abierto, así como dos multi- Modos modales: comprensión visual y comprensión auditiva. Modelo grande.

El 4 de enero de 2024, la aplicación Tongyi Qianwen lanzó la función "Tongyi Dance King".

El 26 de enero de 2024, el modelo de comprensión visual Qwen-VL de Tongyi Qianwen lanzó la versión Max.

El 22 de marzo de 2024, la función de procesamiento de documentos largos de 10 millones de palabras se abrirá para todos de forma gratuita.

El 29 de marzo de 2024, se abrió el primer modelo MoE Qwen1.5-MoE-A2.7B.

El 3 de abril de 2024, Tongyi Lingma se lanzó oficialmente en la aplicación Tongyi Qianwen y está abierta al público de forma gratuita.

El 7 de abril de 2024, se abrió el modelo de 32 mil millones de parámetros Qwen1.5-32B.

El 28 de abril de 2024, se lanzó el modelo Qwen1.5-110B de parámetros de nivel 100 mil millones.

El 9 de mayo de 2024, se lanzó el modelo grande Tongyi Qianwen 2.5 y se le cambió el nombre a Tongyi.

En mayo de 2024, Tongyi Qianwen ha proporcionado 8 modelos industriales principales, que involucran programación, lectura, procesamiento de audio y video, creación de personajes, finanzas, servicio al cliente, salud, derecho y otros campos, que se pueden aplicar para escribir código, leer código, y verificar ERRORES, optimizar código, obtener resúmenes y fuentes de texto extensos, procesar contenido de audio y video, crear personajes personalizados, interpretar informes financieros e informes de investigación, analizar eventos de la industria financiera y otros escenarios.