소식

ResNet의 저자 Zhang Xiangyu는 대규모 AI 모델에 전념하고 있습니다.

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

집 안의 서풍은 아오페이사에서 불어온다
Qubits 공개 계정 QbitAI

대형모델의 인재 블랙홀 효과는 계속된다.

큐빗은 최근 빅모델 빅네임 이적자 명단에 등장한 빅네임이 1990년대 태어난 AI 빅스타라는 사실을 알게 됐다.장샹위, ResNet의 네 명의 저자 중 한 명, Sun Jian의 첫 번째 딥 러닝 박사 과정 학생이자 미래 과학상 수상자입니다.

이제는 국내 대형모델 유니콘에도 등장합니다스텝 스타서명 소문에.

게다가 최근 AI 마스터는 톱6 중 하나인 스텝스타만 있는 것은 아니라고 한다.



그러나 보도 시점 현재 스텝스타 측은 아직 명확한 답변을 내놓지 않고 있다.

ResNet의 네 명의 저자 중 한 명인 Zhang Xiangyu



△사진출처: 미래기술대상 공식홈페이지

2008년 장샹위가 입학했다.시안교통대학교; 1년 후, 소프트웨어 엔지니어링을 공부하기 위해 전공 변경을 신청하세요.

2011년 장샹위(Zhang Xiangyu)는 미국 대학생 수학적 모델링 경연대회(MCM)에서 특별상 후보(최종 후보)를 수상하여 당시 대회 참가 이후 시안교통대학교 역사상 최고의 성적을 거두었습니다.

2012년에 Zhang Xiangyu는 Xi'an Jiaotong University의 소프트웨어 학교에서 소프트웨어 공학 학사 학위를 받았습니다.

그 후 Zhang Xiangyu는 Xi'an Jiaotong University에 입학했으며마이크로소프트 리서치 아시아박사학위 합동연수사업,Sun Jian과 He Kaiming 밑에서 공부함 . 2017년에 그는 박사 학위를 받았습니다.

He Kaiming, Sun Jian, Ren Shaoqing 및 Zhang Xiangyu가 공동으로 유명한 작품을 완성한 것은 Microsoft Research Asia에서였습니다.레스넷, Zhang Xiangyu는 기본 프레임워크와 코딩을 담당합니다.

ResNet은 컴퓨터 비전 분야에서 연구되었지만 ResNet의 핵심 아이디어인 Residual Connection은 교차되어 현대 딥러닝 모델의 기본 구성 요소가 되었습니다.

마지막 AI 붐을 일으킨 알파고 제로는 ResNet + 강화학습 + 몬테카를로 탐색을 결합하여 완성되었습니다.

최근 AI 열풍을 일으킨 ChatGPT에서 "T"는 Transformer 네트워크에서도 잔여 연결이 사용된다는 의미입니다.

원본 ResNet 논문은 2016년 CVPR 최우수 논문상을 수상했습니다.

작년에 He Kaiming, Sun Jian, Ren Shaoqing 및 Zhang Xiangyu는 이 연구로 2023 미래 과학상을 수상했습니다.수학과 컴퓨터 공학상” 이것은 광범위한 영향력을 보여줍니다.



현재 이 논문은 Google Scholar에서 230,000회 이상 인용되어 금세기 가장 인기 있는 딥 러닝 논문 중 하나입니다.



2016년 7월 Sun Jian은 Megvii 연구소의 수석 과학자이자 책임자로 Megvii에 합류했습니다.Zhang Xiangyu는 박사 학위를 졸업한 후 멘토를 따라무례한

Zhang Xiangyu의 연구 관심 분야에는 고성능 컨벌루션 네트워크 설계, AutoML 및 자동화된 신경망 아키텍처 검색, 심층 모델 조정 및 가속화가 포함됩니다.

2017년과 2018년에 Zhang Xiangyu는 또 다른 걸작인 모바일 단말기를 위한 효율적인 컨벌루션 신경망을 완성했습니다.셔플넷두 부분.

Dark Side of the Moon의 공동 창립자이자 알고리즘 팀장저우 신위, 또한 공동 작업입니다.





ShuffleNet은 나중에 Apple의 3D 얼굴 잠금 해제를 포함하여 다양한 휴대폰 밀리초 얼굴 잠금 해제 기술에 영향을 미쳤습니다.

2020년 Zhang Xiangyu는 "컴퓨터 비전 분야에서 AI 2000 세계에서 가장 영향력 있는 학자" 목록에서 4위로 선정되었습니다.

그 외에도 Zhang Xiangyu는 다른 많은 연구를 통해 그의 논문이 320,510회 인용되었으며 h-index가 59임을 보여줍니다.



완인 빅맨 2명도 팀에 합류

2024년에도 AI 전문가의 유입은 줄어들지 않겠지만 이들의 선택이 창업의 전부는 아니다.

업계에 종사하는 사람들은 AI 기술에 대해 개인적으로 강력한 경험을 갖고 있는 경우가 많습니다. 장샹위처럼 기존 기업을 선택하고 열정적으로 새로운 트렌드를 탐색하는 사람도 많습니다.

그리고 스텝스타는 이런 길을 선택한 많은 인재들을 조용히 모집해왔습니다.

Qubit은 Tencent의 Yu Gang과 MSRA의 Duan Nan도 Stepping Stars 팀에 합류했다는 사실을 알게 되었습니다.

현 스텝스타 유강수석 연구원.

그 전에는 Tencent에서 연구 책임자를 역임했고 그 전에는 MegviiDetection의 팀 리더였습니다.



Yu Gang은 2007년에 산둥대학교를 졸업하고 2010년에 Shanghai Jiao Tong University에서 컴퓨터 과학 석사 학위를 받았습니다.

이후 난양공과대학에 진학해 위안준송 밑에서 박사학위를 취득했으며, 이 기간 마이크로소프트 리서치에서 인턴을 거쳐 2014년 졸업 후 메그비에 입사했다.

탐지, 분할, 추적, 뼈대, 행동행동 등에 관한 연구와 알고리즘 구현을 주로 담당합니다.

유강 대표는 2017년 팀을 이끌고 2017 COCO+Places Challenge에 참가해 테스트 및 인체 자세 추정 부문에서 1위를 차지했으며, 2018년에는 팀을 이끌고 다시 COCO+Mapillary Challenge에 참가해 4개 대회에서 1위를 차지했습니다. 카테고리.

Megvii의 5년 동안 Yu Gang과 Megvii의 수석 과학자이자 Megvii 연구소 소장인 Sun Jian은 10개의 논문을 공동 집필했습니다.

2019년 말 Yu Gang은 Zhihu에서 사임을 확인하고 Tencent PCG 조명 및 그림자 연구소에 합류하여 CV 관련 알고리즘 및 기술 연구에 계속 참여할 것이라고 발표했습니다.

올해 Yu Gang은 ECCV2024에 2개의 논문이 승인되었고 CVPR에 2개의 논문이 동시에 승인되었으며 CVPR의 지역 회장으로도 활동하고 있습니다.

현재 유강의 구글 학술검색 인용횟수는 19,000회이다.



다시 얘기하자MSRA 두안난——실제로 올해 5월, Qubit은 Step Star에 합류했다는 소식을 모든 사람에게 알렸습니다.

사임하기 전에 Duan Nan은 MSRA의 선임 수석 연구원이자 자연어 컴퓨팅 팀의 연구 관리자였습니다.

주로 자연어 처리, 다중 모드 지능, 코드 지능, 기계 추론 등에 관한 연구에 종사하고 있으며 NLP/AI 학술회의에서 프로그램 의장 및 현장 의장을 여러 번 역임했습니다.

그는 또한 중국 과학기술대학교와 시안교통대학교에서 시간제 박사 지도교수, 천진대학교 시간교수로 재직하고 있습니다.



Duan Nan은 Tianjin University에서 박사 학위를 취득한 후 MSRA에 합류했습니다. NLP 분야에서 가장 뛰어난 중국인 중 한 명이자 전 MSRA 부학장인 Zhou Ming이 그의 멘토입니다.

그는 MSRA에서 17년 9개월 동안 근무했습니다.

작업하는 동안 Duan Nan의 많은 연구 결과는 Bing Search, Bing Ads, Microsoft News, Cortana 음성 도우미 및 Microsoft XiaoIce를 포함한 Microsoft AI 제품에 성공적으로 적용되었습니다.

그의 연구 작업에는 MSRA와 Peking University가 공동으로 만든 다중 모드 사전 훈련 모델인 Microsoft NüWA(Nuwa)도 포함되어 있으며 출시 당시 8개의 SOTA를 획득했습니다.

Duan Nan은 연구팀 리더이자 멘토로서 NüWA 시리즈 모델 패밀리 프로젝트를 담당하고 있는 것으로 이해됩니다.

현재 Duan Nan의 Google Scholar 인용 횟수는 19,000회에 육박하고 있습니다.

다른 통계에 따르면 Duan Nan과 Microsoft의 전 글로벌 부사장이자 Step Star의 창립자 겸 CEO인 Jiang Daxin이 44개의 논문을 공동 집필한 것으로 나타났습니다.



AI 인재를 위한 새로운 블랙홀, 대형 모델 창업

몇 달 만에 Zhang Xiangyu, Yu Gang, Duan Nan이 인수되었고 더 많은 AI 인재가 합류한다는 소식은 비밀로 유지되었습니다.

스텝 스타의 몸체에는 두 개의 브러시가 있어야 합니다.



그 이유는 우선 그것 때문이다.세계에서 인정받는 위상

스텝스타는 이미 국내 '6강' 대형 모델 스타트업 중 하나로 인정받고 있습니다.

Dark Side of the Moon, Minimax, Zhipu Huazhang, Zero One Thousand Things, Baichuan Intelligence와 함께 기본 모델 분야를 심도있게 육성했으며, 인재, 기술, 제품 및 시장 인지도에 대한 종합적인 평가로 인해 가치가 평가됩니다. 10억 달러 이상으로 급속히 뛰어올랐습니다.

지난 6월 투자 및 금융 시장에서 스텝스타의 순자산은 20억 달러로 밝혀졌다.

그런 다음등장하는 순간부터 사람들을 매료시키는 재능의 요새.

창립자 겸 CEO장다신, 전 Microsoft 글로벌 부사장.

다른 것은 말할 것도 없고, 그의 마이크로소프트에서의 마지막 타이틀만 봐도 왜 MSRA와 뗄래야 뗄 수 없는 관계에 있는 많은 AI 인재들이 스타(개머리)의 포옹을 향해 달려가고 있는지 쉽게 이해할 수 있습니다.

장다신은 2011년 마이크로소프트 아시아 인터넷 엔지니어링 아카데미(STCA)에 입사해 지난해 3월 마이크로소프트 부사장으로 승진했으며, WebXT S+D(웹 경험, 검색) 총괄 책임자도 맡았다. 및 유통) 아시아 소프트웨어 기술 센터 그룹.

그러다가 그의 경력이 새로운 정점에 도달했을 때 그는 여전히 자신의 사업을 시작했고 오늘날의 스타가 되었습니다.



스텝스타 데이터담당자자오빈싱즉, 그와 Jiang Daxin은 스스로를 포장하고 Microsoft의 AI 기업가 정신의 새로운 물결에 동참합니다.

이 회사의 시스템 관리자주이보, 또한 MSRA에서 근무한 경험이 있습니다.

더 중요한 것은 그는 단일 클러스터에서 10,000개 이상의 카드를 관리하는 시스템 구축 및 관리에 대한 실무 경험을 여러 번 보유한 중국에서 몇 안 되는 실무자 중 한 명이라는 것입니다.

그리고 필수적인 눈덩이 아티팩트는 자체 개발한 모델과 제품입니다.

모델 측면에서는 Step 시리즈 범용 대형 모델과 Yuewen & Bubble Duck의 두 가지 toC 제품이 차례로 시장에 출시되어 더욱 큰 인지도를 얻고 있습니다.

위 내용은 스텝스타가 우리가 보는 'AI 인재 블랙홀'이 된 이유를 설명할 수 있습니다.

스테핑스타즈가 인재들에게 매력을 느끼는 것은 빅모델6가 '재능'에 열광하는 이유를 그대로 보여주는 대목이다.

인재의 흐름은 계속될 것입니다.

참고자료:
[1]https://se.xjtu.edu.cn/info/1044/2628.htm
[2]https://www.skicyyu.org/
[3]https://scholar.google.com.sg/citations?user=BJdigYsAAAAJ&hl=ko
[4]https://nanduan.github.io/