소식

투자자 Chen Yu와의 대화: 대규모 모델 기반의 역량이 무너질 때까지 애플리케이션의 질적 변화를 가져오기는 어려울 것입니다.

2024-08-22

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

·대형 모델 개발은 여전히 ​​'돌감도'다. B엔드(기업 중심) 시장을 선택하든, C엔드(소비자 중심) 시장을 선택하든, 대형 모델 업체들은 여전히 ​​'돌감도'다. 비슷한 어려움에 직면해 있고 명확하고 확립된 비즈니스 모델이 없습니다.
지난 8월에는 대형 모델 스타트업들이 다크사이드오브더문(Dark Side of the Moon)과 제로원천씽(Zero One Thousand Things)에서 잇달아 새로운 펀딩을 완료했다고 보도했다. 3억 달러, 최근 평가액은 33억 달러입니다. 자본이 AI 유니콘 기업에 다시 한 번 호의를 보였지만, 투자자들의 눈에는 대형 모델의 개발 경로는 여전히 '돌을 느끼면서 강을 건너는 것'이다.
"대형 AI 모델이 좋다는 것은 누구나 알고 있는데, 대형 모델의 효율성을 극대화하기 위해 내부적으로 어떻게 배치할 수 있을까요?" "대형 모델이 B-end 시장을 선택하든 C-end 시장을 선택하든 현재로서는 명확한 것이 없습니다. 10년 동안 최첨단 기술, 지능형 운전 및 기타 분야에 투자해 온 Yunqi Capital의 파트너 Chen Yu는 최근 ThePaper Technology(www.thepapaper.cn)와의 인터뷰에서 솔직하게 말했습니다. ).
Yunqi Capital의 파트너 Chen Yu
Yunqi에 합류하기 전 Chen Yu는 Google의 엔지니어이자 국내 상장 기업의 CTO(최고 기술 책임자)로 근무했습니다. Chen Yu는 이미 2021년부터 대형 모델 산업에 뛰어들었습니다. 그 해에 그는 대형 모델 투자에 참여했습니다. MiniMax를 창업하여 투자자의 천사가 된 MiniMax는 현재 대형 모델 스타 스타트업 중 하나입니다. Chen Yu는 "미래에는 모든 기업이 자체적인 대규모 모델 애플리케이션을 갖게 될 것이지만 현재로서는 좋은 비즈니스 수익 모델이 없습니다."라고 믿습니다.
The Paper: 최근 일부 대규모 스타트업에 대한 연구를 진행한 결과, 스타트업이 어떻게 지속 가능한 발전을 이룰 수 있는지에 대해 많은 불확실성이 있다는 사실을 발견했습니다. 한편으로는 투자 규모가 매우 크고 다른 한편으로는 자금 조달이 어렵습니다. 쉽지 않은 일이죠. 투자자로서 어떻게 생각하시나요?
첸 유:실제로 올해 대형 모델 기업들이 자금을 조달했고, 스타 스타트업의 가치도 20억~30억 달러에 이른 것으로 보인다. 그러나 기술 기업의 벤처캐피털 환경은 사실 매우 잔인하고, 자본이 무익한 자금을 무한정 지원할 수는 없다. 기업과 스타트업은 결국 자신만의 비즈니스 모델을 형성하고 대규모 수익을 창출할 수 있어야 합니다. 하지만 대규모 스타트업이 수익성은커녕 규모의 수익도 달성하기가 매우 어려운 것이 현실이다. B-side(기업 중심) 시장을 선택하든 C-side(소비자 중심) 시장을 선택하든 대형 모델 기업들은 비슷한 딜레마에 직면해 있으며 아직 명확하고 확립된 비즈니스 모델이 없습니다.
B면 시장은 실제로 기업 고객이 개인 모델을 배포하는 데 도움이 됩니다. 현재 B엔드 시장의 이윤폭은 급격히 줄어들고 있다. 지난해 수천만 달러에 팔렸던 대형 모델 프로젝트가 올해는 100만 위안에 팔릴 수도 있다. 시장에는 패키징할 수 있는 오픈소스 대형 모델이 너무 많고 경쟁도 매우 치열합니다. B측 사업에는 사전 판매 서비스, 계약 체결, 프로젝트 구현(예: 모델 감독 및 미세 조정), 판매 후 유지 관리 등이 포함됩니다. 이 모든 작업에는 원래 수천만 달러에 판매되는 대형 모델 회사의 인력이 필요할 수 있습니다. 매출총이익을 낼 여지가 있는데, 이제는 매출총이익조차 남지 않습니다.
대형 모델 회사가 기본 모델을 훈련시키기 위해 소비하는 컴퓨팅 파워 비용은 대개 수억 달러에 이르며, 현재 대형 모델 회사는 B측 사업 수익을 통해 훈련 비용을 할당할 방법이 없습니다.
ThePaper Technology: 현재로서는 당사자 A의 고객에게 대규모 개인 모델을 배포하는 것이 비용 효율적이지 않습니까?
첸 유:많은 기업들이 AI의 물결을 놓치고 싶지 않지만 AI를 자사 비즈니스와 통합할 수 있는 명확한 길을 찾지 못했습니다. A당도 마찬가지다. A당이 직면한 가장 큰 문제는 대형 모델을 사용할 줄은 알지만, 기업 내에서 대형 모델을 구현 및 배포하는 방법과 대형 모델의 효과를 극대화하는 방법을 모른다는 점이다. 실제로 이를 위해서는 많은 시간과 대규모 기업 커뮤니케이션이 필요합니다.
기업이 대규모 모델을 민영화하고 배포할 때 데이터가 실질적인 장애물이 될 수 있습니다. 어떤 종류의 데이터가 미세 조정에 적합한지, 데이터를 어떻게 정제하는지, 유용한 데이터에 라벨을 붙이는 방법에는 모두 인력과 물적 자원이 필요합니다. 훈련 데이터의 선택과 모델 정렬은 모델의 효율성에 큰 영향을 미치므로 모든 시나리오에 적합할 수 있는 대규모 모델은 없습니다.
ThePaper Technology: B면 시장은 어려운데 C면은 어떻습니까?
첸 유:C-end 대중 시장을 위한 대형 모델의 제품 적용은 크게 두 가지 범주로 나눌 수 있습니다. 하나는 MiniMax의 Hoshino와 같은 감성 동반자 대화 로봇이고, 두 번째 범주는 생산성 도구입니다. 이런 제품들은 사실 대형기종들이 다 만드는 제품인데, 문제는 대기업이 하루동안 충전을 하지 않는 한, 본질적으로 사용자 끈적임이 없기 때문에 다른 업체에서는 충전이 어렵다는 것입니다. 현금 흐름이 좋은 대기업의 경우 가장 좋은 전략은 경쟁사보다 오래가는 것이므로 국내 스타트업이 C측 생산성 도구에 비용을 청구하기 어려울 것입니다. 결국 자금을 조달하지 못하고 도태되는 기업도 분명히 있을 것이다.
The Paper: 현재 많은 대형 모델 회사들이 해외 사업을 전개하고 있습니다. 이러한 현상에 대해 어떻게 생각하시나요?
첸 유:대형 모델이 특정 가치 평가에 도달한 후에는 어떻게 대규모 수익 창출을 달성할 것인지에 대한 질문에 답해야 합니다. 해외 시장은 더 크고 해외 고객의 지불 의향은 국내 고객보다 높습니다. 그래서 제가 현재 주목하고 있는 기업들도 해외사업을 하고 있는 기업들입니다. 대형모델이 해외에 진출할 경우 수익방식은 국내시장과 크게 다르지 않으나, 해외 대형모델 제품과의 경쟁에 직면하게 되어 매우 어려운 상황이다.
The Paper: 작년부터 올해까지 모두의 관심이 대형 모델에서 기술 중심으로 옮겨갔지만 애플리케이션이 폭발적으로 증가하지 않은 이유는 무엇입니까?
첸 유:지난해부터 올해까지 대형 모델의 추론 비용이 크게 줄었지만 좋은 적용 시나리오가 없는 이유는 여전히 추론 능력, 환각 문제 등 대형 모델 자체의 능력에 한계가 있다.
이제 모든 사람의 전반적인 느낌은 대형 모델이 여러 곳에서 사용될 수 있지만 모든 곳에서 쓸모가 없어 보인다는 것입니다. 이는 대형 모델이 훈련되기 전에 여전히 환상과 같은 문제가 있기 때문입니다. 모두가 AI 적용 방향을 주목하고 있지만 문제는 대형 모델의 기본 역량이 더디게 발전하고 있다는 점이다. 대규모 모델 기능이 획기적인 발전을 이루기 전에는 기본 애플리케이션에서 실질적인 변경을 수행하기가 어려울 것입니다.
따라서 현재로서는 너무 높은 기대를 갖지 마십시오. 그러나 미래에 대해서는 낙관할 수 있습니다. 기술의 반복은 매우 빠릅니다. 지난해 대형 모델의 수준이 중학교 3학년 수준이었다면 이제는 고등학교 2학년 수준이 될 수도 있다. 또한 사람처럼 계속 배우고 발전합니다.
올해 대형모델 분야에서 가장 큰 변화는 가격으로, 최소 2배 이상 하락했다. 비용 절감은 한편으로는 시장 압력의 결과이기도 하고, 다른 한편으로는 기술의 발전에 따른 결과이기도 합니다. 기본 알고리즘의 혁신은 실제로 항상 존재해 왔으며, 이는 비용 절감을 가져왔습니다.
기술의 발전에는 누구나 인내심을 가져야 한다. 대형 모형회사의 경험이 고작 1~2년에 불과해 이제는 모두가 돌을 느끼며 강을 건너는 것과 같은 상태다. 그러나 기술의 발전 추세는 궁극적으로 기술의 민주화이며, 이로 인해 모든 사람이 사용할 수 있는 문턱이 낮아질 것이기 때문에 조금만 더 기다리면 미래에는 모든 기업이 자체적인 대규모 모델 애플리케이션을 갖게 될 것이라고 생각합니다. 오늘날 기업은 프라이빗 모델을 배포하는 데 수천만 달러의 비용이 들 수 있지만, 10년 후에는 더 이상 그렇게 높은 비용을 지출할 필요가 없게 됩니다. 앞으로는 기업에 민영화된 대규모 모델을 배포하는 것이 도구 기반, 제품 기반이 될 수 있다고 생각합니다.
기술이 성숙할수록 비용은 점점 낮아지게 됩니다. 모든 기술의 개발은 이러한 개발 경로를 따르게 됩니다. 높은 비용은 단지 단기적인 단계의 현상일 뿐입니다. 작년 11월 저희 LP(투자자)들과 공유했을 때, 대형 모델의 원가가 앞으로 3년 안에 두 자릿수로 떨어진다고 했는데, 예상외로 반년 만에 현실이 되었습니다. 사실 세상은 우리가 상상하는 것보다 더 빠르게 변화하고 있습니다.
더페이퍼 유옌 기자
(이 기사는 The Paper에서 발췌한 것입니다. 더 많은 원본 정보를 보려면 “The Paper” 앱을 다운로드하세요.)
보고/피드백