소식

북경 신생산성·실험실 밖 방문│보이지 않는 대형모델, 보이는 생산성

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

2017년 중국 정부 업무보고에 처음으로 인공지능이 포함돼 국가 전략이 됐다. 2018년에는 베이징 즈위안(Beijing Zhiyuan) 인공지능 연구소(이하 '즈위안')가 선도적인 작은 사무실에서 탄생했다. 혁신 공간. 당시 OpenAI가 출시한 1세대 GPT 모델은 아직 언론 헤드라인을 장식하지 못했습니다.

2023년에 Zhiyuan은 중국 최초의 초대형 지능형 모델인 'Wudao'를 3.0으로 업그레이드하여 Microsoft 사장 Brad Smith가 염두에 둔 세계 3대 최첨단 AI 기관 중 하나가 되었습니다. 대형 모델 분야에서 Zhiyuan은 대형 제조업체의 지원을 받지 않는 세계 유일의 비기업 연구 기관이기도 합니다. 자원 생태 건설, 인재 양성 및 기업 육성.

"과거에도 과학과 기술의 평등권은 항상 주요 산업 기회를 불러일으켰습니다." Zhiyuan의 신임 사장인 Wang Zhongyuan은 기업 경험과 연구 기관에서의 배경 지식을 모두 갖추고 있으며 기술 기반 산업에 대해 더 깊은 이해를 갖고 있습니다. . 인공 지능에 대한 국가의 정의도 더욱 구체적입니다. 인공 지능은 새로운 생산력 개발을 위한 중요한 엔진입니다.


폭풍에 앞서기 위해 열심히 일하세요

Dark Side of the Moon CEO Yang Zhilin은 2024년 베이징 Zhiyuan 컨퍼런스에서 적어도 세 번 참석자들에게 둘러싸여 있었습니다. OpenAI 창립자인 Sam Altman이 1년 전 Zhiyuan 컨퍼런스에서 비디오 연설을 했을 때도 불안은 똑같이 명백했습니다. .

2023년부터 2024년까지 AI 과학자, 주요 기술 기업의 CEO, 스타 스타트업 창업자들이 다양한 장소에 모여 기술 전문가든 아니든 무대 위의 누구나 들어본 적이 있는 대형 모델에 대해 설교할 예정이다. Zhiyuan이라는 이름은 당시 Zhiyuan의 대규모 모델 연구 프로젝트에 직접 참여했습니다. Baidu CTO Wang Haifeng은 한때 Zhiyuan의 이사를 역임했으며 Zhipu AI의 창립자 Tang Jie는 Zhiyuan의 부사장을 역임했으며 Yang Zhilin은 Wu Dao의 연구 개발에 참여했습니다.

이들 AI 트렌드세터들은 당장 Zhiyuan에 관여하지 않았고, Zhiyuan은 인기를 얻은 후에야 대형 모델에 관여하지도 않았습니다.

Zhiyuan은 2019년에 대형 모델을 배치하기 시작했습니다. 2020년에는 Wudao 연구팀을 설립하고 대형 모델 연구 개발에 착수했습니다. 2021년 3월 우다오 1.0 대형 모델이 처음 출시됐고, 지난 6월에는 우다오 2.0이 출시됐다. 위즈덤은 1조7500억 개의 매개변수를 사용해 당시 '세계 최대' 대형 모델이라는 기록을 세웠다. 당시 OpenAI의 가장 발전된 대형 모델 GPT-3은 매개변수 수가 10배입니다.

과학 연구는 체성 감각, 질문 및 판단에 주목합니다. '인공지능 대형모델 시대가 도래한다'는 판단은 즈위안에게 남다른 용기를 주었다. 심지어 중국 용어인 '빅모델'도 즈위안이 처음 제안한 것이다.

대형 모델이란 무엇입니까? Zhiyuan Research Institute의 Huang Tiejun 회장은 세 가지 조건이 충족되어야 한다고 믿습니다. 즉, 수백억 개가 넘는 매개변수를 갖춘 대규모, 전문적인 문제나 분야에 국한되지 않고 다양한 기능을 생성할 수 있는 능력, 그리고 처리할 수 있는 능력입니다. 다양한 작업.

2023년에는 대형 모델이 대중의 주목을 받게 될 것입니다. Wudao 시리즈 모델은 버전 3.0으로 업그레이드되어 언어, 비전, 다중 양식 등 기본 대형 모델을 포함하며 완전 오픈 소스입니다. 당시 스탠포드 대학의 기본 모델 논의에서 인텔리전트 소스는 구글, 마이크로소프트, 페이스북(현 메타) 등 거대 기술 기업들과 함께 순위를 매기며 전 세계 대형 모델 연구를 대표하는 기관으로 자리 잡았다.

"역사상 대부분의 연구 결과는 우연이었고, 누구도 계획할 수 없었습니다. 모든 노력은 확률을 높이는 것입니다. 뛰어난 연구자들을 모아 아이디어가 충돌하고, 문제를 발견하고, 발전할 수 있는 커뮤니티 환경을 제공하는 것입니다. 협력 파트너를 찾으세요. "Zhiyuan 연구소 창립 회장인 Zhang Hongjiang이 Turing Award 수상자 Yann LeCun의 자서전에 쓴 서문은 Zhiyuan이 먼저 나온 이유에 가깝습니다.

시스템엔지니어링을 하라

2018년 초, 베이징은 과학기술 시스템의 도약적인 개혁을 수행하기 위해 '세계 수준의 새로운 R&D 기관 건설을 지원하기 위한 베이징 실행 조치'를 발표했습니다. 12월, 과학기술부와 베이징시 당위원회 및 정부의 지도와 지원을 받아 Zhiyuan이 공식적으로 설립되었습니다.

이전에는 과학 연구 관리 프로세스가 프로젝트 제안부터 출시 안내, 자금 지원 신청 및 검토까지 긴 주기로 복잡해 경쟁이 치열한 환경에서 끊임없이 변화하는 과학 연구 요구 사항에 적응하기가 어려웠습니다. 이 시스템에 따르면 연구기관은 2020년 10월에 프로젝트 제안을 내놓고, 대규모 모델 연구는 이르면 2022년까지는 공식적으로 착수할 수 없다. Zhiyuan 모델은 프로젝트 수립부터 대형 모델 출시까지 5개월도 채 걸리지 않았습니다.

이는 대학과 기업 간의 새로운 유형의 R&D 기관입니다. Xin Zai는 논문을 최종 평가 지표로 사용하거나 제품을 평가 지표로 사용하지 않고 혁신적인 시스템을 구축하기 위해 Tsinghua University, Peking University, Facebook Artificial Intelligence Laboratory, Baidu 등 Big things; 새로운 것은 큰 문제를 목표로 하고, 주요 과학 문제에 예리한 시선을 유지하며 미래 지향적인 계획을 세우는 것입니다.

"대학 모델은 수십 년 동안 운영되어 왔습니다. 조직적이고 대규모이며 팀 간 방식으로 체계적인 R&D를 수행하는 것은 어렵습니다. 기업도 R&D에 투자하겠지만, 기업과 밀접한 관련이 있는 R&D에 더 관심이 있습니다. Zhiyuan은 베이징 비즈니스 데일리 기자와의 단독 인터뷰에서 "결과를 보려면 5년 이상이 걸릴 3대A 연구 프로젝트를 수행할 것"이라고 말했습니다.

현재 Zhiyuan의 자신감은 여전히 ​​인공 지능에 대한 국가의 의지에 있습니다. 2024년 3월, CPC 중앙 정치국 상무위원이자 국무원 총리인 Li Qiang은 베이징 조사에서 다음과 같이 분명히 밝혔습니다. 인공 지능은 새로운 생산력 개발을 위한 중요한 엔진입니다. .

신품질 생산성은 혁신을 주도하는 선진적인 생산성 품질로서 전통적인 경제성장 방식과 생산성 발전 경로에서 벗어나 첨단기술, 고효율, 고품질의 특성을 가지며 신개발 이념에 부합하는 선진적인 생산성 품질이다. 이는 혁신적인 기술 혁신, 혁신적인 생산 요소 할당, 심층적인 산업 변화 및 업그레이드를 통해 탄생했습니다. Wang Zhongyuan은 "과거에는 과학 기술의 평등권이 항상 중요한 산업 기회를 창출했으며 대형 모델은 과학 기술의 새로운 평등을 가져올 수 있다"고 굳게 믿습니다.

예를 들어, 대형 모델은 "지능"의 운반체이고, AI를 중심으로 한 파동은 지능 운영이며, 최하층은 기술 소프트웨어 및 하드웨어 시스템, 최상층은 AI 애플리케이션, 대형 모델은 둘의 중간에 있습니다. "트렁크" 역할을 수행합니다. 대형 모델의 의의는 '지능'을 물, 전기, 인터넷 등 공공 서비스로 전환하고, 클라우드 컴퓨팅을 통해 다수의 기업이나 개인에게 AI 서비스를 제공한다는 점이다.

이는 체계적인 프로젝트다. "자원과 인력의 집중적인 투자가 필요하다. 여러 사람이 할 수는 없고 각자가 따로 해야 하지만, 기술적인 시스템이 만들어져야 한다." 철강 제조 및 발전과 마찬가지로 상대적으로 저렴한 비용으로 고품질 철강을 생산하고 안정적인 발전을 보장하려면 완전한 기술 시스템 세트가 필요합니다."라고 Huang Tiejun은 말했습니다.

업계 그 이상으로 나아가다

Zhiyuan이 구축한 기술 시스템에는 대형 모델 계열 버킷, 대형 모델 운영 체제, 데이터 세트, 교육 프레임워크, 운영자 라이브러리 등이 포함됩니다. 이러한 성과는 Chiyuan의 비전 및 목표와 함께 Chiyuan 빌딩 1층 벽에 걸려 있습니다.

비전과 목표는 혁신으로 요약할 수 있는 메커니즘, 산업 발전 등 5개 주요 부문으로 구분된다. "지위안은 최첨단 인공지능 기술을 개발하고, 인공지능 발전을 선도하고 예측하며, 업계보다 더 나아가기를 원한다"고 왕중위안은 "대학이 할 수 없고 기업도 하기 싫은 일을 하게 될 것"이라고 자세히 설명했다. 연구 개발, 결과를 확인하는 데 3~5년 또는 그 이상이 걸리는 연구 프로젝트입니다."

그는 대형 모델의 기술력이 일정 수준에 도달하면 크게 두 가지 방향이 있다고 본다. 최고의 대형 모델을 계속해서 반복하고 최적화하는 기관은 기업이든 연구 기관이든 계속해서 핵심 기술을 다루어야 합니다."

예를 들어, 다중 양식에서는 대부분의 국내 기업이 연구 개발을 위해 DiT 아키텍처를 선택합니다. "DiT는 검증된 경로이기 때문입니다. Zhiyuan은 처음부터 텍스트, 이미지, 비디오, 음성과 같은 다양한 정보 양식을 하나의 모델에 넣어 훈련하기를 희망합니다." Wang Zhongyuan은 인간 두뇌에 비유하여 "이 다중 모드 대형 모델은 세상에 대해 보고, 이해하고, 추론할 수 있습니다. 미래에는 하드웨어, 즉 구체화된 지능과 결합된 대형 모델이 물리적 세계에 들어가서 인간에게 봉사할 수 있습니다."

기업은 시장에 가까이 머물면서 상향식 시나리오를 모색하는 반면, R&D 기관은 핵심 기술 혁신에 중점을 두고 하향식 지원을 제공합니다. Wisdom Source는 두 번째 유형에 속합니다. 이는 애플리케이션 및 시나리오와는 거리가 멀지만 오픈 소스를 기반으로 합니다. 업계.

왕중위안(Wang Zhongyuan)은 베이징 비즈니스 데일리(Beijing Business Daily) 기자에게 “인공지능은 대형 모델과 동일하지 않고 단지 인공지능의 한 장르일 뿐이다”라고 설명했다. 오늘날 인텔리전트소스는 두뇌형 연구, 디지털 심장 등 다른 인공지능 기술에도 총력을 기울이고 있는데, 이는 다른 산업 분야에서 인공지능의 상상력에 한계가 없다는 뜻이다.

베이징 비즈니스 데일리 기자 웨이 웨이