notícias

Zhang Xiangyu, autor de ResNet, dedica-se a grandes modelos de IA

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

O vento oeste na casa vem do Templo Aofei
Qubits | Conta pública QbitAI

O efeito de buraco negro de talento dos grandes modelos continua.

Qubit aprendeu que o último grande nome a aparecer na lista de transferências de grandes nomes de modelos é o figurão da IA ​​​​nascido na década de 1990.Zhang Xiang Yu, um dos quatro autores do ResNet, o primeiro aluno de doutorado em aprendizagem profunda de Sun Jian e vencedor do Future Science Award.

Agora, ele aparece no grande modelo unicórnio domésticoPasso estrelasnos rumores de assinatura.

Além disso, diz-se que um dos seis primeiros, Step Star, não é o único mestre de IA recentemente.



No entanto, até o momento desta publicação, Step Star ainda não deu uma resposta clara.

Zhang Xiangyu, um dos quatro autores do ResNet



△Fonte da imagem: Site oficial do Future Technology Awards

Em 2008, Zhang Xiangyu foi admitidoUniversidade Xi'an Jiaotong; Um ano depois, inscreva-se para mudar de curso para estudar engenharia de software.

Em 2011, Zhang Xiangyu ganhou o Prêmio Especial de Nomeação (Finalista) do American College Student Mathematical Modeling Contest (MCM), estabelecendo o melhor resultado da história da Xi'an Jiaotong University desde que participou da competição naquela época.

Em 2012, Zhang Xiangyu recebeu o diploma de bacharel em engenharia de software pela Escola de Software da Universidade Xi'an Jiaotong.

Mais tarde Zhang Xiangyu foi selecionado para a Universidade Xi'an Jiaotong eMicrosoft Research ÁsiaProjeto de formação conjunta de doutorado,Estudou com Sun Jian e He Kaiming . Em 2017, ele recebeu seu doutorado.

Foi enquanto estavam na Microsoft Research Asia que He Kaiming, Sun Jian, Ren Shaoqing e Zhang Xiangyu concluíram em conjunto o famosoRede de Res, Zhang Xiangyu é responsável pela estrutura e codificação subjacentes.

ResNet é aprendizagem residual Embora seja pesquisada no campo da visão computacional, sua ideia central, conexão residual, passou e se tornou um componente básico dos modelos modernos de aprendizagem profunda.

AlphaGo Zero, que iniciou o último boom de IA, foi concluído combinando ResNet + aprendizagem por reforço + pesquisa de Monte Carlo.

No ChatGPT, que deu início à última moda da IA, o “T” significa que conexões residuais também são usadas na rede Transformer.

O artigo original da ResNet ganhou o prêmio CVPR de melhor artigo em 2016.

No ano passado, He Kaiming, Sun Jian, Ren Shaoqing e Zhang Xiangyu ganharam o 2023 Future Science Award por esta pesquisa.Prêmio Matemática e Ciência da Computação”Isso mostra sua influência de longo alcance.



Atualmente, este artigo foi citado pelo Google Scholar mais de 230.000 vezes, tornando-o um dos artigos de aprendizagem profunda mais populares deste século:



Em julho de 2016, Sun Jian ingressou na Megvii como cientista-chefe e chefe do Megvii Research Institute.Depois que Zhang Xiangyu se formou no doutorado, ele também seguiu seu mentor noDesrespeitoso

Os interesses de pesquisa de Zhang Xiangyu incluem projeto de rede convolucional de alto desempenho, AutoML e pesquisa automatizada de arquitetura de rede neural, além de adaptação e aceleração profunda de modelos.

Em 2017 e 2018, Zhang Xiangyu concluiu outra obra-prima - rede neural convolucional eficiente para terminais móveisShuffleNetDuas partes.

Cofundador do Dark Side of the Moon e chefe da equipe de algoritmosZhou Xinyu, também um trabalho conjunto.





Mais tarde, o ShuffleNet influenciou várias tecnologias de desbloqueio facial em milissegundos de telefones celulares, incluindo o desbloqueio facial 3D da Apple.

Em 2020, Zhang Xiangyu foi selecionado como número 4 na lista dos "Acadêmicos mais influentes do mundo em visão computacional do AI 2000".

Além disso, Zhang Xiangyu tem muitos outros estudos. Os dados do Google Scholar mostram que seus artigos foram citados 320.510 vezes e seu índice h é 59.



Há também dois grandões Wanyin se juntando à equipe

Em 2024, o fluxo de especialistas em IA não diminuirá, mas as suas escolhas não se limitam a iniciar um negócio.

As pessoas do setor costumam ter fortes experiências pessoais com a tecnologia de IA. Há também muitas pessoas como Zhang Xiangyu que optam por ir para empresas existentes e navegar apaixonadamente pelas novas tendências.

E Step Star recrutou discretamente muitas pessoas talentosas que escolheram esse caminho.

Qubit soube que Yu Gang da Tencent e Duan Nan da MSRA também se juntaram à equipe Stepping Stars.

Yu Gang, atual estrela da etapaPesquisador Chefe.

Antes disso, ele atuou como diretor de pesquisa na Tencent; antes disso, foi o líder da equipe de Detecção Megvii.



Yu Gang se formou na Universidade de Shandong em 2007 e fez mestrado em ciência da computação pela Universidade Jiao Tong de Xangai em 2010.

Depois disso, ele foi para a Universidade Tecnológica de Nanyang para fazer doutorado com Yuan Junsong. Durante esse período, estagiou na Microsoft Research e ingressou na Megvii após se formar em 2014.

Principalmente responsável por pesquisas sobre detecção, segmentação, rastreamento, esqueleto, comportamento de ação, etc. e implementação de algoritmos.

Em 2017, Yu Gang liderou a equipe para participar do Desafio COCO+Places 2017 e conquistou o primeiro lugar em testes e estimativa de postura humana. Em 2018, ele liderou a equipe para participar novamente do Desafio COCO+Mapilar e conquistou o primeiro lugar em quatro. categorias.

Durante os cinco anos do Megvii, Yu Gang e Sun Jian, cientista-chefe do Megvii e diretor do Megvii Research Institute, foram coautores de dez artigos.

No final de 2019, Yu Gang confirmou sua renúncia em Zhihu e anunciou que se juntaria ao Tencent PCG Lighting and Shadow Research Laboratory e continuaria a se envolver em algoritmos e pesquisas de tecnologia relacionados a CV.

Este ano, Yu Gang tem 2 artigos aceitos pelo ECCV2024 e 2 artigos aceitos pelo CVPR ao mesmo tempo, ele também atua como presidente regional do CVPR;

Atualmente, as citações de Yu Gang no Google Scholar são 19.000.



Vamos conversar novamenteMSRA Duan Nan——Na verdade, em maio deste ano, Qubit compartilhou com todos a notícia de que ele se juntou ao Step Star.

Antes de renunciar, Duan Nan foi pesquisador principal sênior da MSRA e gerente de pesquisa da equipe de computação em linguagem natural.

Envolvido principalmente em pesquisas sobre processamento de linguagem natural, inteligência multimodal, inteligência de código, raciocínio de máquina, etc., e atuou como presidente de programa e presidente de campo de conferências acadêmicas de PNL/IA por muitas vezes.

Ele também é supervisor de doutorado em tempo parcial na Universidade de Ciência e Tecnologia da China e na Universidade Xi'an Jiaotong, e professor em tempo parcial na Universidade de Tianjin.



Duan Nan ingressou na MSRA após se formar na Universidade de Tianjin com doutorado. Zhou Ming, um dos chineses mais talentosos na área de PNL e ex-vice-reitor da MSRA, é seu mentor.

Ele está na MSRA há 17 anos e 9 meses.

Durante seu trabalho, muitos resultados de pesquisa de Duan Nan foram aplicados com sucesso a produtos de IA da Microsoft, incluindo Bing Search, Bing Ads, Microsoft News, assistente de voz Cortana e Microsoft XiaoIce.

Seu trabalho de pesquisa também inclui o Microsoft NüWA (Nuwa), um modelo multimodal de pré-treinamento criado em conjunto pela MSRA e pela Universidade de Pequim. Ele ganhou 8 SOTAs quando foi lançado.

Entende-se que Duan Nan é responsável pelo projeto da família modelo da série NüWA como líder e mentor da equipe de pesquisa.

Atualmente, as citações de Duan Nan no Google Scholar estão se aproximando de 19.000.

Outras estatísticas mostram que Duan Nan e Jiang Daxin, ex-vice-presidente global da Microsoft e fundador e CEO da Step Star, são coautores de 44 artigos.



Grande modelo de empreendedorismo, um novo buraco negro para talentos de IA

Dentro de alguns meses, Zhang Xiangyu, Yu Gang e Duan Nan foram adquiridos, e a notícia da adesão de mais talentos de IA foi mantida em segredo.

Step Star deve ter dois pincéis em seu corpo.



A razão é, antes de tudo, a suaStatus reconhecido no mundo

Step Star já é reconhecida como uma das “Seis Mais Fortes” startups nacionais de modelos de grande escala:

Juntamente com Dark Side of the Moon, Minimax, Zhipu Huazhang, Zero One Thousand Things e Baichuan Intelligence, cultivou profundamente o campo dos modelos básicos e, devido à avaliação abrangente de talentos, tecnologia, produtos e reconhecimento de mercado, sua avaliação saltou rapidamente para mais de mil milhões de dólares americanos.

Em junho, o patrimônio líquido da Step Star no mercado de investimento e financiamento foi revelado em US$ 2 bilhões.

E entãoUma fortaleza de talentos que atrai as pessoas desde o momento em que aparecem.

Fundador e Chefe ExecutivoJiang Daxin, ex-vice-presidente global da Microsoft.

Sem mencionar mais nada, apenas olhando para seu último título na Microsoft, você pode facilmente entender por que muitos talentos de IA que estão inextricavelmente ligados ao MSRA estão correndo em direção ao abraço das estrelas (uma cabeça de cachorro).

Em 2011, Jiang Daxin começou a trabalhar na Microsoft Asia Internet Engineering Academy (STCA). Em março do ano passado, foi promovido a vice-presidente da Microsoft. Ele também atuou como gerente geral da WebXT S+D (Web Experience, Search). e Distribuição) Grupo do Centro de Tecnologia de Software da Ásia.

Então, quando sua carreira atingiu um novo pico, ele ainda abriu seu próprio negócio e se tornou a estrela que é hoje.



Pessoa responsável pelos dados da Step StarJiao Bin Xing, ou seja, ele e Jiang Daxin se empacotam e se juntam à nova onda de empreendedorismo em IA da Microsoft.

O gerente de sistema desta empresaZhu Yibo, também teve experiência de trabalho na MSRA.

Mais importante ainda, ele é um dos poucos profissionais na China que tem experiência prática na construção de sistemas e no gerenciamento de mais de 10.000 cartões em um único cluster muitas vezes.

E o artefato bola de neve indispensável são modelos e produtos desenvolvidos por você mesmo.

Do lado do modelo, os grandes modelos de uso geral da série Step, bem como os dois produtos toC da Yuewen & Bubble Duck, foram colocados no mercado um após o outro para testes e estão ganhando maior reconhecimento.

O que foi dito acima pode explicar por que Step Star se tornou o “buraco negro de talentos de IA” que vemos.

A atração dos Stepping Stars pelos talentos é o epítome da razão pela qual os Big Model Six são loucos por "talentos".

O fluxo de talentos continuará.

Referências:
[1]https://se.xjtu.edu.cn/info/1044/2628.htm
[2]https://www.skicyyu.org/
[3]https://scholar.google.com.sg/citations?user=BJdigYsAAAAJ&hl=pt-BR
[4]https://nanduan.github.io/