noticias

Zhang Xiangyu, autor de ResNet, se dedica a grandes modelos de IA

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

El viento del oeste en la casa proviene del templo de Aofei.
Qubits | Cuenta pública QbitAI

El talentoso efecto agujero negro de los modelos grandes continúa.

Qubit se enteró de que el último gran nombre que apareció en la lista de transferencias de grandes modelos es el pez gordo de la IA nacido en la década de 1990.Zhang Xiangyu, uno de los cuatro autores de ResNet, el primer estudiante de doctorado en aprendizaje profundo de Sun Jian y ganador del Future Science Award.

Ahora, aparece en el unicornio modelo nacional grande.estrellas de pasoen los rumores de fichaje.

Además, se dice que uno de los seis primeros, Step Star, no es el único maestro de la IA recientemente.



Sin embargo, al cierre de esta edición, Step Star aún no ha dado una respuesta clara.

Zhang Xiangyu, uno de los cuatro autores de ResNet



△Fuente de la imagen: sitio web oficial de Future Technology Awards

En 2008, Zhang Xiangyu fue admitido enUniversidad Xi'an Jiaotong; Un año después, solicita cambiar tu especialización para estudiar ingeniería de software.

En 2011, Zhang Xiangyu ganó el Premio Especial de Nominación (Finalista) del Concurso de Modelado Matemático para Estudiantes Universitarios Estadounidenses (MCM), estableciendo el mejor resultado en la historia de la Universidad Xi'an Jiaotong desde que participó en el concurso en ese momento.

En 2012, Zhang Xiangyu recibió una licenciatura en ingeniería de software de la Escuela de Software de la Universidad Xi'an Jiaotong.

Más tarde, Zhang Xiangyu fue seleccionado para la Universidad Xi'an Jiaotong yInvestigación de Microsoft AsiaProyecto conjunto de formación doctoral,Estudió con Sun Jian y He Kaiming. . En 2017, recibió su doctorado.

Fue mientras estaban en Microsoft Research Asia que He Kaiming, Sun Jian, Ren Shaoqing y Zhang Xiangyu completaron conjuntamente el famosoRed de res, Zhang Xiangyu es responsable del marco subyacente y la codificación.

ResNet es aprendizaje residual. Aunque se investiga en el campo de la visión por computadora, su idea central, la conexión residual, se ha cruzado y se ha convertido en un componente básico de los modelos modernos de aprendizaje profundo.

AlphaGo Zero, que inició el último auge de la IA, se completó combinando ResNet + aprendizaje por refuerzo + búsqueda Monte Carlo.

En ChatGPT, que inició la última moda de la IA, la "T" significa que las conexiones residuales también se utilizan en la red Transformer.

El artículo original de ResNet ganó el premio CVPR al mejor artículo en 2016.

El año pasado, He Kaiming, Sun Jian, Ren Shaoqing y Zhang Xiangyu ganaron el Premio Ciencia del Futuro 2023 por esta investigación.Premio de Matemáticas e InformáticaEsto demuestra su influencia de gran alcance.



En la actualidad, este artículo ha sido citado por Google Scholar más de 230.000 veces, lo que lo convierte en uno de los artículos sobre aprendizaje profundo más populares de este siglo:



En julio de 2016, Sun Jian se unió a Megvii como científico jefe y director del Instituto de Investigación Megvii.Después de que Zhang Xiangyu se graduara del doctorado, también siguió a su mentor alIrrespetuoso

Los intereses de investigación de Zhang Xiangyu incluyen el diseño de redes convolucionales de alto rendimiento, AutoML y búsqueda de arquitectura de redes neuronales automatizadas, y aceleración y adaptación profunda de modelos.

En 2017 y 2018, Zhang Xiangyu completó otra obra maestra: una red neuronal convolucional eficiente para terminales móviles.Red ShuffleDos partes.

Cofundador de Dark Side of the Moon y jefe del equipo de algoritmosZhou Xinyu, también un trabajo conjunto.





Posteriormente, ShuffleNet influyó en varias tecnologías de desbloqueo facial de milisegundos de teléfonos móviles, incluido el desbloqueo facial 3D de Apple.

En 2020, Zhang Xiangyu fue seleccionado en el puesto número 4 en la lista de "Los académicos más influyentes del mundo en visión por computadora de AI 2000".

Además, Zhang Xiangyu tiene muchos otros estudios. Los datos de Google Scholar muestran que sus artículos han sido citados 320.510 veces y su índice h es 59.



También hay 2 grandes de Wanyin que se unen al equipo.

En 2024, el flujo de expertos en IA no disminuirá, pero sus opciones no se centran únicamente en iniciar un negocio.

Las personas en la industria a menudo tienen fuertes experiencias personales con la tecnología de IA. También hay muchas personas como Zhang Xiangyu que optan por acudir a empresas existentes y navegar apasionadamente por las nuevas tendencias.

Y Step Star ha reclutado silenciosamente a muchas personas talentosas que eligen este camino.

Qubit se enteró de que Yu Gang de Tencent y Duan Nan de MSRA también se unieron al equipo de Stepping Stars.

Yu Gang, actual estrella de pasoInvestigador Jefe.

Antes de eso, se desempeñó como director de investigación en Tencent; antes de eso, fue líder del equipo de MegviiDetection.



Yu Gang se graduó en la Universidad de Shandong en 2007 y obtuvo una maestría en informática en la Universidad Jiao Tong de Shanghai en 2010.

Después de eso, fue a la Universidad Tecnológica de Nanyang para estudiar un doctorado con Yuan Junsong. Durante este período, realizó una pasantía en Microsoft Research y se unió a Megvii después de graduarse en 2014.

Principalmente responsable de la investigación sobre detección, segmentación, seguimiento, esqueleto, comportamiento de acción, etc. e implementación de algoritmos.

En 2017, Yu Gang lideró al equipo para participar en el COCO+Places Challenge 2017 y ganó el primer lugar en pruebas y estimación de la postura humana. En 2018, llevó al equipo a participar nuevamente en el COCO+Mapilary Challenge y ganó el primer lugar en cuatro. categorías.

Durante los cinco años de Megvii, Yu Gang y Sun Jian, científico jefe de Megvii y director del Instituto de Investigación Megvii, fueron coautores de diez artículos.

A finales de 2019, Yu Gang confirmó su renuncia a Zhihu y anunció que se uniría al Laboratorio de Investigación de Iluminación y Sombras de Tencent PCG y continuaría participando en la investigación de tecnología y algoritmos relacionados con CV.

Este año, Yu Gang tiene 2 artículos aceptados por ECCV2024 y 2 artículos aceptados por CVPR al mismo tiempo, y también se desempeña como presidente regional de CVPR;

Actualmente, las citas de Yu Gang en Google Scholar son 19.000.



hablemos de nuevoMSRA Duan Nan——De hecho, en mayo de este año, Qubit compartió con todos la noticia de que se unió a Step Star.

Antes de dimitir, Duan Nan era investigador principal senior en MSRA y director de investigación del equipo de informática del lenguaje natural.

Se dedica principalmente a la investigación sobre procesamiento del lenguaje natural, inteligencia multimodal, inteligencia de código, razonamiento automático, etc., y se ha desempeñado como presidente de programa y presidente de campo en conferencias académicas de PNL/IA en numerosas ocasiones.

También es supervisor de doctorado a tiempo parcial en la Universidad de Ciencia y Tecnología de China y la Universidad Xi'an Jiaotong, y profesor a tiempo parcial en la Universidad de Tianjin.



Duan Nan se unió a MSRA después de graduarse de la Universidad de Tianjin con un doctorado. Zhou Ming, uno de los chinos más destacados en el campo de la PNL y ex vicedecano de MSRA, es su mentor.

Ha estado en MSRA durante 17 años y 9 meses.

Durante su trabajo, los numerosos resultados de la investigación de Duan Nan se aplicaron con éxito a los productos de inteligencia artificial de Microsoft, incluidos Bing Search, Bing Ads, Microsoft News, el asistente de voz Cortana y Microsoft XiaoIce.

Su trabajo de investigación también incluye Microsoft NüWA (Nuwa), un modelo de preentrenamiento multimodal creado conjuntamente por MSRA y la Universidad de Pekín que ganó 8 SOTA cuando se lanzó.

Se entiende que Duan Nan es responsable del proyecto de la familia de modelos de la serie NüWA como líder y mentor del equipo de investigación.

Actualmente, las citas de Duan Nan en Google Scholar se acercan a las 19.000.

Otras estadísticas muestran que Duan Nan y Jiang Daxin, ex vicepresidente global de Microsoft y fundador y director ejecutivo de Step Star, son coautores de 44 artículos.



Grandes modelos de emprendimiento, un nuevo agujero negro para los talentos de la IA

En unos pocos meses, se adquirieron Zhang Xiangyu, Yu Gang y Duan Nan, y la noticia de que se unieron más talentos de IA se mantuvo en secreto.

Step Star debe tener dos cepillos en su cuerpo.



La razón es, en primer lugar, suEstado reconocido en el mundo.

Step Star ya está reconocida como una de las "Seis empresas emergentes modelo nacionales más fuertes" a gran escala:

Junto con Dark Side of the Moon, Minimax, Zhipu Huazhang, Zero One Thousand Things y Baichuan Intelligence, ha cultivado profundamente el campo de los modelos básicos y, debido a la evaluación integral de talentos, tecnología, productos y reconocimiento del mercado, su valoración. Ha saltado rápidamente a más de mil millones de dólares estadounidenses.

En junio, se reveló que el patrimonio neto de Step Star en el mercado de inversiones y financiación ascendía a 2.000 millones de dólares.

Y luegoUna fortaleza de talentos que atrae a las personas desde el momento en que aparecen.

Fundador y CEOJiang Daxin, ex vicepresidente global de Microsoft.

Sin mencionar nada más, con solo mirar su último título en Microsoft, se puede entender fácilmente por qué muchos talentos de IA que están indisolublemente vinculados a MSRA se apresuran hacia el abrazo de las estrellas (una cabeza de perro).

En 2011, Jiang Daxin comenzó a trabajar en la Academia de Ingeniería de Internet de Microsoft Asia (STCA). En marzo del año pasado, fue ascendido a vicepresidente de Microsoft. También se desempeñó como gerente general de WebXT S+D (Experiencia Web, Búsqueda). y Distribución) del Centro de Tecnología de Software de Asia.

Luego, cuando su carrera alcanzó un nuevo pico, comenzó su propio negocio y se convirtió en la estrella que es hoy.



Responsable de datos de Step StarJiao BinxingEs decir, él y Jiang Daxin se empaquetan y se unen a la nueva ola de emprendimiento de IA de Microsoft.

El administrador del sistema de esta empresa.Zhu Yibo, también tenía experiencia laboral en MSRA.

Más importante aún, es uno de los pocos profesionales en China que tiene experiencia práctica en la construcción de sistemas y la gestión de más de 10.000 tarjetas en un solo grupo muchas veces.

Y el indispensable artefacto de bola de nieve: los modelos y productos de desarrollo propio.

En cuanto a los modelos, los modelos grandes de uso general de la serie Step, así como los dos productos toC de Yuewen y Bubble Duck, se han lanzado al mercado uno tras otro para realizar pruebas y están ganando un mayor reconocimiento.

Lo anterior puede explicar por qué Step Star se ha convertido en el “agujero negro de talentos de IA” que vemos.

La atracción de Stepping Stars por los talentos es el epítome de la razón por la que los Big Model Six están locos por el "talento".

El flujo de talentos continuará.

Referencias:
[1]https://se.xjtu.edu.cn/info/1044/2628.htm
[2]https://www.skicyyu.org/
[3]https://scholar.google.com.sg/citations?user=BJdigYsAAAAJ&hl=es
[4]https://nanduan.github.io/