nouvelles

Zhang Xiangyu, auteur de ResNet, se consacre aux grands modèles d'IA

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Le vent d'ouest dans la maison vient du temple Aofei
Qubits | Compte public QbitAI

L’effet trou noir du talent des grands modèles se poursuit.

Qubit a appris que le dernier grand nom à apparaître sur la liste des transferts des grands noms du mannequinat est le big shot de l'IA né dans les années 1990.Zhang Xiangyu, l’un des quatre auteurs de ResNet, le premier doctorant en apprentissage profond de Sun Jian et lauréat du Future Science Award.

Maintenant, il apparaît dans la licorne grand modèle domestiqueÉtapes étoilesdans les rumeurs de signature.

De plus, on dit que l'un des six premiers, Step Star, n'est pas le seul maître de l'IA récemment.



Cependant, au moment de mettre sous presse, Step Star n’a pas encore donné de réponse claire.

Zhang Xiangyu, l'un des quatre auteurs de ResNet



△Source photo : Site officiel des Future Technology Awards

En 2008, Zhang Xiangyu a été admise àUniversité Jiaotong de Xi'an; Un an plus tard, postulez pour changer de spécialisation pour étudier le génie logiciel.

En 2011, Zhang Xiangyu a remporté le prix spécial de nomination (finaliste) du concours de modélisation mathématique pour étudiants américains (MCM), établissant ainsi le meilleur résultat de l'histoire de l'université Jiaotong de Xi'an depuis sa participation au concours à cette époque.

En 2012, Zhang Xiangyu a obtenu une licence en génie logiciel de l'École de logiciel de l'Université Jiaotong de Xi'an.

Plus tard, Zhang Xiangyu a été sélectionné à l'Université Jiaotong de Xi'an etMicrosoft Recherche AsieProjet de formation conjointe doctorale,A étudié auprès de Sun Jian et He Kaiming . En 2017, il a obtenu son doctorat.

C'est chez Microsoft Research Asia que He Kaiming, Sun Jian, Ren Shaoqing et Zhang Xiangyu ont réalisé conjointement le célèbreRéseau ResNet, Zhang Xiangyu est responsable du cadre et du codage sous-jacents.

ResNet est un apprentissage résiduel. Bien qu'il fasse l'objet de recherches dans le domaine de la vision par ordinateur, son idée centrale, la connexion résiduelle, a traversé et est devenue un composant fondamental des modèles modernes d'apprentissage profond.

AlphaGo Zero, qui a lancé le dernier boom de l'IA, a été complété en combinant ResNet + apprentissage par renforcement + recherche Monte Carlo.

Dans ChatGPT, qui a lancé le dernier engouement pour l'IA, le « T » signifie que les connexions résiduelles sont également utilisées dans le réseau Transformer.

L'article ResNet original a remporté le CVPR Best Paper Award en 2016.

L'année dernière, He Kaiming, Sun Jian, Ren Shaoqing et Zhang Xiangyu ont remporté le Future Science Award 2023 pour cette recherche.Prix ​​Mathématiques et Informatique» Cela montre son influence considérable.



À l'heure actuelle, cet article a été cité par Google Scholar plus de 230 000 fois, ce qui en fait l'un des articles sur l'apprentissage profond les plus populaires de ce siècle :



En juillet 2016, Sun Jian a rejoint Megvii en tant que scientifique en chef et directeur de l'Institut de recherche Megvii.Après que Zhang Xiangyu ait obtenu son doctorat, il a également suivi son mentor dans leIrrespectueux

Les intérêts de recherche de Zhang Xiangyu incluent la conception de réseaux convolutifs hautes performances, la recherche automatique d’architecture de réseaux neuronaux et d’AutoML, ainsi que l’adaptation et l’accélération approfondies de modèles.

En 2017 et 2018, Zhang Xiangyu a réalisé un autre chef-d'œuvre : un réseau neuronal convolutif efficace pour les terminaux mobiles.ShuffleNetDeux parties.

Co-fondateur de Dark Side of the Moon et responsable de l'équipe algorithmiqueZhou Xinyu, également un travail commun.





ShuffleNet a ensuite influencé diverses technologies de déverrouillage du visage en millisecondes pour téléphones mobiles, y compris le déverrouillage du visage 3D d'Apple.

En 2020, Zhang Xiangyu a été sélectionné au 4e rang sur la liste des « chercheurs les plus influents au monde en vision par ordinateur selon AI 2000 ».

En outre, Zhang Xiangyu dispose de nombreuses autres études. Les données de Google Scholar montrent que ses articles ont été cités 320 510 fois et que son indice h est de 59.



Il y a aussi 2 grands Wanyin qui rejoignent l'équipe

En 2024, le flux d’experts en IA ne diminuera pas, mais leurs choix ne se résument pas uniquement à la création d’entreprise.

Les acteurs du secteur ont souvent de solides expériences personnelles avec la technologie de l’IA. Il y a aussi beaucoup de gens comme Zhang Xiangyu qui choisissent de se tourner vers des entreprises existantes et de surfer avec passion sur les nouvelles tendances.

Et Step Star a discrètement recruté de nombreuses personnes talentueuses qui choisissent cette voie.

Qubit a appris que Yu Gang de Tencent et Duan Nan de MSRA ont également rejoint l'équipe de Stepping Stars.

Yu Gang, star actuelle de la scèneChercheur en chef.

Avant cela, il a été directeur de recherche chez Tencent ; avant cela, il était chef d'équipe de Megvii Detection.



Yu Gang est diplômé de l'Université du Shandong en 2007 et a obtenu une maîtrise en informatique de l'Université Jiao Tong de Shanghai en 2010.

Après cela, il est allé à l'Université technologique de Nanyang pour étudier un doctorat sous la direction de Yuan Junsong. Au cours de cette période, il a effectué un stage chez Microsoft Research et a rejoint Megvii après avoir obtenu son diplôme en 2014.

Principalement responsable de la recherche sur la détection, la segmentation, le suivi, le squelette, le comportement d'action, etc. et de la mise en œuvre d'algorithmes.

En 2017, Yu Gang a conduit l'équipe à participer au COCO+Places Challenge 2017 et a remporté la première place dans les tests et l'estimation de la posture humaine. En 2018, il a conduit l'équipe à participer à nouveau au COCO+Mapillary Challenge et a remporté la première place sur quatre. catégories.

Au cours des cinq années d’existence de Megvii, Yu Gang et Sun Jian, scientifique en chef de Megvii et directeur de l’Institut de recherche Megvii, ont co-écrit dix articles.

Fin 2019, Yu Gang a confirmé sa démission sur Zhihu et a annoncé qu'il rejoindrait le laboratoire de recherche sur l'éclairage et les ombres de Tencent PCG et continuerait à s'engager dans la recherche sur les algorithmes et les technologies liées au CV.

Cette année, Yu Gang a 2 articles acceptés par ECCV2024 et 2 articles acceptés par CVPR en même temps, il est également président régional du CVPR ;

Actuellement, les citations Google Scholar de Yu Gang s’élèvent à 19 000.



Parlons encoreMSRA Duan Nan——En fait, en mai de cette année, Qubit a annoncé à tout le monde qu'il avait rejoint Step Star.

Avant de démissionner, Duan Nan était chercheur principal principal au MSRA et directeur de recherche de l'équipe d'informatique en langage naturel.

Principalement engagé dans la recherche sur le traitement du langage naturel, l'intelligence multimodale, l'intelligence des codes, le raisonnement automatique, etc., et a été président de programme et président de terrain de conférences universitaires PNL/IA à plusieurs reprises.

Il est également directeur de doctorat à temps partiel à l'Université des sciences et technologies de Chine et à l'Université Jiaotong de Xi'an, et professeur à temps partiel à l'Université de Tianjin.



Duan Nan a rejoint MSRA après avoir obtenu un doctorat à l'Université de Tianjin. Zhou Ming, l'un des Chinois les plus accomplis dans le domaine de la PNL et ancien doyen adjoint de MSRA, est son mentor.

Il travaille chez MSRA depuis 17 ans et 9 mois.

Au cours de son travail, les nombreux résultats de recherche de Duan Nan ont été appliqués avec succès aux produits Microsoft AI, notamment Bing Search, Bing Ads, Microsoft News, l'assistant vocal Cortana et Microsoft XiaoIce.

Ses travaux de recherche incluent également Microsoft NüWA (Nuwa), un modèle de pré-formation multimodal créé conjointement par la MSRA et l'Université de Pékin. Il a remporté 8 SOTA lors de son lancement.

Il est entendu que Duan Nan est responsable du projet de famille modèle de la série NüWA en tant que chef de l'équipe de recherche et mentor.

Actuellement, les citations de Duan Nan sur Google Scholar approchent les 19 000.

D'autres statistiques montrent que Duan Nan et Jiang Daxin, ancien vice-président mondial de Microsoft et fondateur et PDG de Step Star, ont co-écrit 44 articles.



L’entrepreneuriat des grands modèles, un nouveau trou noir pour les talents de l’IA

En quelques mois, Zhang Xiangyu, Yu Gang et Duan Nan ont été acquis, et la nouvelle de l'arrivée de nouveaux talents en IA est restée secrète.

Step Star doit avoir deux brosses sur son corps.



La raison en est avant tout sonStatut reconnu dans le monde

Step Star est déjà reconnue comme l’une des « six startups modèles nationales à grande échelle les plus fortes » :

Avec Dark Side of the Moon, Minimax, Zhipu Huazhang, Zero One Thousand Things et Baichuan Intelligence, elle a profondément cultivé le domaine des modèles de base et, grâce à une évaluation complète des talents, de la technologie, des produits et de la reconnaissance du marché, sa valorisation a rapidement grimpé à plus d'un milliard de dollars américains.

En juin, la valeur nette de Step Star sur le marché de l’investissement et du financement s’est révélée être de 2 milliards de dollars américains.

Et puisUne forteresse de talents qui attire dès leur apparition.

Fondateur et PDGJiang Daxin, ancien vice-président mondial de Microsoft.

Pour ne rien dire d’autre, rien qu’en regardant son dernier titre chez Microsoft, on comprend facilement pourquoi de nombreux talents en IA inextricablement liés à MSRA se précipitent vers l’étreinte des stars (une tête de chien).

En 2011, Jiang Daxin a commencé à travailler à la Microsoft Asia Internet Engineering Academy (STCA). En mars de l'année dernière, il a été promu vice-président de Microsoft. Il a également occupé le poste de directeur général de WebXT S+D (Web Experience, Search). et distribution) du groupe Asia Software Technology Center.

Puis, lorsque sa carrière a atteint un nouveau sommet, il a quand même lancé sa propre entreprise et il est devenu la star qu’il est aujourd’hui.



Responsable des données de Step StarJiao Binxing, c'est-à-dire que lui et Jiang Daxin se sont emballés et ont rejoint la nouvelle vague d'entrepreneuriat en IA de Microsoft.

Le gestionnaire système de cette entrepriseZhu Yibo, avait également une expérience professionnelle au sein de MSRA.

Plus important encore, il est l'un des rares praticiens en Chine à posséder à plusieurs reprises une expérience pratique dans la construction de systèmes et la gestion de plus de 10 000 cartes dans un seul cluster.

Et l'artefact boule de neige indispensable - des modèles et des produits auto-développés.

Du côté des modèles, les grands modèles polyvalents de la série Step, ainsi que les deux produits toC de Yuewen & Bubble Duck, ont été mis sur le marché l'un après l'autre pour des tests et gagnent en popularité.

Ce qui précède peut expliquer pourquoi Step Star est devenu le « trou noir des talents en IA » que nous voyons.

L'attrait des Stepping Stars pour les talents est la quintessence de la raison pour laquelle les Big Model Six sont fous de « talent ».

Le flux de talents va se poursuivre.

Les références:
[1]https://se.xjtu.edu.cn/info/1044/2628.htm
[2]https://www.skicyyu.org/
[3]https://scholar.google.com.sg/citations?user=BJdigYsAAAAJ&hl=fr
[4]https://nanduan.github.io/