소식

화웨이 허블은 칭화대학교 두 그룹의 사람들에게 조용히 투자했습니다.

2024-08-20

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

글/왕숴궈 편집자/옌쯔웨이

화웨이 허블이 조용히 투자한 두 개의 대형 모델 회사가 새로운 개발물을 속속 출시했다.

8월 중순, Facewall Intelligence는 대규모 언어 모델인 MiniCPM 시리즈가 2월 출시 이후 100만 건 이상의 다운로드를 기록했다고 발표했습니다.

7월 말, Shenshu Technology는 글로벌 시장에 진출하여 Sora를 벤치마킹한 성능을 갖춘 Wensheng Video의 대형 모델인 Vidu를 출시했습니다.

Wall-facing Intelligence와 Shengshu Technology는 각각 2022년과 2023년에 설립되었으며 핵심 팀은 모두 칭화대학교 출신입니다. Wall-Facing Intelligence의 CEO는 Zhihu의 전 CTO인 Li Dahai이고, Shengshu Technology의 CEO는 Tsinghua University에서 컴퓨터 공학과를 졸업하고 석사 학위를 취득한 Tang Jiayu입니다.

AI 트랙이 뜨겁다. 화웨이 허블은 이 두 젊은 인재의 잠재력을 낙관하고 있다.

새로운 팀

허블 투자(Hubble Investment)는 화웨이가 전액 출자한 투자 기관입니다.

Qicchacha에 따르면 Hubble Technology Investment Co., Ltd.와 Shenzhen Hubble Technology Investment Partnership이라는 두 개의 법인이 있습니다.

이전까지 화웨이 허블은 다수의 반도체 칩 기업에 투자하는 등 하드 기술에 집중해 올해에는 칭화대 첨단 기업 2곳을 잇달아 지원하며 AI 트랙에 중점을 두는 모습을 보였다.

IT오렌지 자료에 따르면 허블은 올해 인공지능 분야에 잇달아 투자해 누적 투자액이 1억3200만 위안에 달한다.

대형모델의 경우 명문학교 출신 엘리트를 선호한다.

회사에 투자한 두 회사는 창립 팀 구조가 유사하며 둘 다 칭화대학교의 지원을 받습니다.

Shengshu Technology의 핵심 구성원은 Tsinghua University의 인공 지능 연구소에서 왔으며 Wall-Facing Intelligence의 창립 팀은 학교의 자연어 처리 연구소(THUNLP)에서 탄생했습니다.

Tsinghua 얼굴 그룹이 생명공학 부문의 고위 경영진을 구성하고 있습니다. CEO 외에 수석 과학자는 칭화 인공 지능 연구소 부소장인 Zhu Jun이고, CTO Bao Fan은 Tang Jiayu의 동료 학생이자 Zhu Jun의 연구팀의 구성원입니다.

지난해 6월부터 8월까지 Shengshu Technology는 두 차례 연속 자금 조달을 완료하여 총 수억 위안을 받았습니다. 올해 6월 허블은 주식에 투자하고 A+ 자금 조달에 참여했습니다.

벽을 향한 지능의 성장 경로는 비슷합니다.

공동 창업자인 Liu Zhiyuan은 칭화대학교 컴퓨터과학과 박사과정 지도교수이며, 그의 연구 방향은 컴퓨터 자연어 처리이며, 회사의 CTO인 Zeng Guoyang(26세)은 이번 대회에 추천된 학생입니다. 2학년 칭화 자연어 처리 연구실.

Li Dahai에 따르면, 벽에 직면한 지능형 과학 연구 팀에는 100명이 넘는 사람들이 있으며 그 중 80%가 Qingbei 출신이며 평균 연령은 28세입니다. 그들은 권위 있는 저널과 컨퍼런스에 100개 이상의 논문을 발표했습니다.

Wall-face Intelligence를 설립하기 전에 Li는 Zhihu의 CTO로 플랫폼에 대한 검색 및 추천 비즈니스를 처음부터 구축하고 AI "지능형 커뮤니티"를 시작하고 월간 활성 사용자 수를 늘렸습니다.

작년에는 ChatGPT가 큰 인기를 끌었고 모두가 AGI(인공지능)에 관해 이야기를 나눴습니다. 그는 회사의 핵심 구성원들과 대화를 나눴습니다. AGI가 모두의 신념임을 확인한 후, 결단력 있게 동참하세요.

그의 옛 고용주는 그의 기업가 정신을 지원했고, 같은 해 4월 Face Wall Intelligence는 Zhihu로부터 수천만 위안의 투자를 받았습니다. 1년 후, 허블은 지분을 인수했습니다.

지속적으로 신제품 출시

두 스타트업 모두 비교적 짧은 기간에 신제품을 출시했다. 이는 화웨이, 허블 등 기관으로부터 투자를 유치하는 중요한 이유다.

4월 말, Shengshu Technology는 Tsinghua University와 협력하여 대형 비디오 모델인 Vidu를 출시했습니다. 7월 말 Vidu는 전 세계적으로 출시되어 Wensheng Video와 Tusheng Video의 두 가지 핵심 기능을 개방하고 최대 1080P의 해상도로 4초와 8초의 두 가지 지속 시간 옵션을 제공합니다.

Vidu는 단 30초 만에 4초짜리 클립을 생성합니다. 현재 사용자는 이메일 주소로 직접 등록하여 Vidu를 경험할 수 있습니다.

보고에 따르면 Vidu에서 생성된 비디오는 부드럽고 일관적이며 뚜렷한 프레임 삽입 현상이 없으며 렌즈 언어가 풍부하고 롱 샷, 클로즈 샷, 클로즈업과 같은 다양한 렌즈를 전환할 수 있습니다.

Shengshu Technology의 수석 과학자인 Zhu Jun은 "Vidu의 성능은 16초 장기 유지 및 의미 이해 측면에서 매우 뛰어납니다."라고 말했습니다.

벽면을 향한 지능 역시 끊임없이 새로운 움직임을 추진하고 있습니다.

지난 5월에는 대형 모델 루카가 출시됐다. Li Dahai는 Luca의 다중 언어 모델 기능이 ChatGPT와 동일하다고 말했습니다.

같은 달, 벽을 향한 MiniCPM-V2.0이 출시되었습니다. 이 제품은 복잡한 세부 묘사로 거리 장면을 정확하게 식별하고 2,300년 이상 전의 칭화 전표에 적힌 고대 필기체를 읽을 수 있습니다.

이미 작년 초, Face Wall Intelligence는 ChatDev 지능형 소프트웨어 개발 플랫폼을 출시했습니다. 소규모 게임 제작, 웹사이트 개발, 창의적인 디자인 등이 필요한 사용자는 ChatDev를 통해 프로젝트 이름과 관련 아이디어만 기술하면 빠르게 구현할 수 있습니다.

Li Dahai의 말에 따르면 일반 사용자는 "단지 콜라 한 잔으로 1달러 미만의 비용으로" 작은 소프트웨어를 만들 수 있습니다.

상용화가 최초로 구현되었습니다. Face Wall Intelligence는 China Merchants Bank, Digital Network, Zhihu 등과 손을 잡고 금융, 교육, 스마트 단말기 등의 시나리오에 기술을 적용했습니다.

예를 들어, 6월 말 회사가 개발한 인공지능 지원 재판 시스템이 선전 중급인민법원에 가동되어 사건 접수, 파일 검토, 법원 심리, 문서 제작 등의 프로세스를 포괄합니다.

올해 1월 시범 운영 이후 이 시스템은 291,000건의 사건 접수를 지원했으며 11,600건의 초안 초안 생성을 지원했습니다.

새로운 길을 찾아보세요

Li Dahai와 Tang Jiayu는 동일한 특성을 가지고 있으며 전임자가 취한 길에 대해 미신을 믿지 않습니다.

예를 들어, GPT는 "큰 노력이 기적을 낳을 수 있다"고 강조하는 반면 벽을 향한 팀의 접근 방식은 작은 모델을 통해 큰 모델의 성능을 예측하는 것입니다. 먼저 0.009B에서 0.03B 범위의 매개변수를 사용하여 모델을 훈련한 다음 예측 성능을 2.4B 모델로 추정하고 마지막으로 2.4B 모델을 학습합니다.

이 방법은 먼저 작은 모델을 실험하고 매개변수를 조정하면 훈련 비용을 줄일 수 있습니다.

회사가 설립되기 전, Wall-Facing 팀은 베이징 Zhiyuan 인공 지능 연구소의 "계몽" 프로젝트의 일원으로 2020년부터 대규모 언어 모델 훈련을 시작했습니다.

과거 경험을 통해 대규모 모델에 어떤 종류의 데이터가 필요한지 알 수 있습니다.

"누구나 오해에 빠지고 데이터의 절대적인 양에 너무 집중하기 쉽습니다. 사실 데이터의 품질, 데이터 사용 방법, 데이터에 대한 이해가 더 중요합니다." 말했다.

리소스 제약으로 인해 팀은 비용 절감을 위해 분산 가속 및 매개변수 미세 조정과 같은 방법을 오랫동안 사용해 왔습니다. 2022년에는 벽면팀의 매개변수 미세 조정 작업이 네이처(Nature) 하위 저널에도 게재되었습니다.

Shengshu Technology의 플레이 스타일도 비슷합니다.

기술 로드맵에서 Shengshu는 Sora와 동일한 통합 아키텍처를 사용하지만 제품 경로에서는 두 가지가 다릅니다.

소라팀은 Open AI의 기술력과 마이크로소프트의 컴퓨팅 파워를 바탕으로 올인원 영상을 긴 영상으로 선정했습니다. 스타트업이 디지털 기술을 개발하기 위한 조건은 비교할 수 없을 정도로 뛰어납니다.

Tang Jiayu 팀은 2D 이미지로 시작한 다음 3D 및 비디오 분야로 확장하기로 결정했습니다.

비디오는 본질적으로 연속적인 다중 프레임 이미지로 볼 수 있는 시계열 이미지의 증폭이며, 데이터 수집, 정리, 주석 및 효율적인 모델 교육과 같은 이미지에 대한 엔지니어링 작업을 재사용할 수 있습니다.

2023년 내내 Shengshu의 주요 리소스는 이미지와 3D에 배치됩니다. 4초짜리 단편영상 세대가 출시된 것은 올해 1월부터다. 지난 2월 소라가 출시된 이후 회사의 발전은 가속화됐고, 4월에는 16초짜리 단편 영상을 제작할 수 있게 됐다.

대형 모델 트랙에서는 국내외 팀들이 '근육 뭉치기' 경쟁을 펼친다. 칭화대 두 팀은 이제 막 몸을 풀기 시작했으며 좋은 결과를 기대하고 있습니다.

그때쯤이면 조기 투자한 화웨이 허블이 초과수익을 거둘 것으로 예상된다.