소식

대형 모델의 오픈 소스와 폐쇄 소스를 두고 벌어지는 싸움은 무엇입니까?

2024-08-14

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina




분쟁은 서로의 시장 가치를 부정할 수 없습니다. 두 가지 시장 요구는 오랫동안 공존할 것입니다.



텍스트 | 우준위 쑤웬푸

편집자 │ 시릴롱

올해부터 중국과 미국의 AI(인공지능) 산업에 종사하는 기업가, 투자자, 기업가들은 대형 모델이 오픈소스여야 하는지, 폐쇄소스여야 하는지에 대한 논쟁을 동시에 시작했다.
중국에서 논란의 중심에 있는 인물은 바이두 창업자인 로빈 리이다. 올해 4월 그는 공개적으로 "오픈소스를 사용해본 사람은 누구나 오픈소스가 저렴하다고 생각했다. 사실 대규모 모델 시나리오에서는 오픈소스가 가장 비싸다. 오픈소스 모델은 점점 낙후될 것"이라고 공개적으로 밝혔다. 이 견해에 대한 반대는 부족함이 없습니다. 반대자로는 Alibaba Cloud CTO(최고 기술 책임자) Zhou Jingren,바이촨 인텔리전스왕샤오촨 CEO와 치타모바일 푸성 CEO. Zhou Jingren은 올해 5월 언론 인터뷰에서 "오픈소스가 글로벌 기술과 생태계에 기여한다는 것은 의심할 여지가 없다. 이는 전 세계적으로 여러 차례 입증됐기 때문에 더 이상 논의할 필요가 없다"고 직설적으로 말했다.
미국에서는 논쟁이 더욱 뜨거워진다. Tesla 창립자 Musk는 한때 AI 스타트업을 고소했습니다.오픈AI. 머스크는 2015년 OpenAI의 주요 창립자이자 투자자 중 한 명이었습니다. 그는 현 CEO인 알트만이 이끄는 OpenAI가 "비영리 조직으로 운영하고 AI를 오픈 소스화하고 오픈 소스로 만들겠다"는 약속을 위반했다고 믿습니다. 실리콘밸리의 유명 투자자인 a16z의 창업자인 Andreessen과 Kleiner Perkins Caufield & Byers의 창업자인 Kosla는 소셜 미디어에서 여러 차례 대결을 벌였습니다. 전자는 폐쇄형 소스 모델이 거대 기업의 독점을 초래하고 학술 연구를 약화시킬 것이라고 믿습니다. 후자는 대형 모델이 경제적 무기이며 오픈 소스가 되어서는 안 된다고 믿습니다.


오픈 소스는 소프트웨어 개발 모델입니다. 소스 코드는 무료로 공개되며 커뮤니티 기부로 유지됩니다. 개발자는 소프트웨어를 자유롭게 다운로드, 수정, 배포하고, 소프트웨어 버그(소프트웨어 결함 또는 오류)를 보고하고, 최적화 제안을 할 수 있습니다. 이러한 집단적 혁신은 소프트웨어 반복을 가속화할 것입니다.오픈 소스 모델은 무료로 사용할 수 있고 모델 매개변수와 같은 기술 세부 정보를 게시한 모델을 의미합니다. 비공개 소스 모델은 지불이 필요하고 기술 세부 정보를 게시하지 않는 모델을 의미합니다.간단히 이해하면, 오픈 소스는 무료이지만 음식을 직접 구매하고 요리해야 합니다. 폐쇄 소스는 비용을 지불하는 것이므로 레스토랑에 가서 식사하는 것과 동일하며 더 나은 서비스를 받을 수 있습니다.
대형 모델은 오픈 소스여야 할까요, 아니면 비공개 소스여야 할까요? 상업적인 이해관계, 기술적인 의견, 기타 요인들이 뒤섞여 많은 사실들이 혼동되고 있지만, 이 논쟁의 이면에는 몇 가지 확실한 사실이 있습니다.
첫째, 다양한 비즈니스 전략을 통해 기업은 다양한 기술 경로를 선택할 수 있습니다.대규모 모델 비즈니스를 빠르게 상용화하기를 희망하는 Baidu 및 OpenAI와 같은 회사는 Alibaba Cloud, Meta 및 기타 회사가 의존하는 폐쇄 소스를 선택했습니다.클라우드 컴퓨팅또는 수익성 있는 광고 사업을 운영하는 회사에서는 파이를 더 크게 만들기 위해 오픈 소스를 선택합니다.
둘째, 오픈소스와 클로즈드소스에 대한 시장 수요는 장기간 공존할 것이며 단순히 어느 것이 더 낫다고 판단하는 것은 불가능하다.오픈 소스 모델과 폐쇄 소스 모델에는 각각 적용 가능한 시나리오가 있으며, 어떤 모델을 선택할지는 시장 수요와 관련이 있습니다. 이는 모델 제조업체의 의지에 따라 변경되지 않습니다.
셋째, 오픈 소스 모델과 오픈 소스 소프트웨어 사이에는 본질적인 차이점이 있습니다.오픈 소스 소프트웨어는 소스 코드와 대부분의 기술 세부 사항을 공개합니다. 오픈 소스 모델은 무료 기술 블랙박스에 가깝습니다. 모델 매개변수는 공개되어 있지만 소스 코드, 훈련 데이터, 훈련 프로세스 및 기타 기술 세부사항은 거의 공개되지 않습니다.

게다가 중국 AI 산업에서 공개 소스와 비공개 소스 간의 싸움은 상업적 경쟁에 더 가깝습니다.오픈 소스에는 국경이 없습니다. 이 개념은 일반적으로 인식되어 왔습니다. 그러나 AI 산업을 둘러싼 중국과 미국의 경쟁이 심화되는 가운데 오픈소스에 대한 미국 업계의 반대 목소리는 점점 커지고 있다.

누가 오픈 소스이고 누가 클로즈 소스인가요?
대형 모델의 개발은 아직 초기 단계이고 시행착오가 필요합니다.오픈소스와 클로즈드소스는 구분되지 않습니다. 기업이 오픈 소스와 폐쇄 소스라는 객관식 문제에 직면할 때 세 가지 다른 길을 택합니다.

가장 극단적인 것은 오픈 소스 모델만 하는 것입니다. 이 길을 택하는 회사는 상대적으로 적으며 Meta는 몇 안되는 회사 중 하나입니다. 장점은 더 많은 사용자를 유치할 수 있다는 점이다. 문제는 수익모델이 없고 대기업만이 감당할 수 있다는 점이다.
Meta가 소유한 Llama 3는 전 세계에서 가장 많은 사용자를 보유한 오픈 소스 모델입니다. Meta의 주요 사업은 소셜 미디어(Facebook, Instagram 등)이며, 2023년 순이익은 390억 달러에 달합니다. 메타는 새로운 사업을 개척하고 싶은 충동은 있지만, 모델을 통해 돈을 벌어야 한다는 압박감은 없습니다. 따라서 오픈소스 모델만 할 수 있고, 당분간 수익성 문제는 고려하지 않을 수 있다.
중간 경로는 오픈 소스와 폐쇄 소스를 병렬로 사용하는 것으로 매우 유연합니다. 기업은 오픈 소스를 통해 사용자를 확보할 수 있을 뿐만 아니라 폐쇄 소스를 통해 수익도 얻을 수 있습니다. 이는 개발자에게 선택의 여지를 제공할 뿐만 아니라 기업 자체에도 오류의 여지를 허용합니다.
이 경로를 선택하는 기업에는 Microsoft, Google, Alibaba Cloud, Tencent Cloud뿐만 아니라 Mistral Al, Zhipu AI, Baichuan Intelligence와 같은 AI 스타트업도 포함됩니다. 오픈 소스와 폐쇄 소스를 병렬화하는 일반적인 방법은 무료 오픈 소스 모델을 사용하여 사용자의 관심을 끌고 사용자가 크기가 더 크고 성능이 더 강력한 폐쇄 소스 모델을 사용하도록 안내하는 것입니다. 예를 들어, Microsoft의 주요 상용 모델은 OpenAI의 GPT-4 시리즈이지만 소형 모델인 Phi-3 Mini도 오픈 소스로 제공하고 있습니다. 폐쇄 소스 기반, 산업 모델 Google은 소형 모델인 Gemma 시리즈를 오픈 소스로 제공하고 있으며 Mistral Al과 같은 신생 기업의 폐쇄 소스 Gemini 시리즈에도 역방향 모델을 제공합니다. 이전 세대에서는 성능을 발휘했으며, 이번 세대에서는 더 강력한 성능을 갖춘 모델을 사용하기 위해 비용을 지불하도록 사용자를 안내했습니다.
오픈 소스와 폐쇄 소스의 문제점은 상용화에 때때로 경쟁적인 노력이 필요하다는 것입니다. 일부 고객은 무료 오픈 소스 모델을 사용해 왔으며 더 이상 유료 폐쇄 소스 모델을 사용하지 않을 것입니다. 결과적으로 모델 제조업체는 수입의 일부를 잃게 됩니다.
중국 AI 소프트웨어 서비스 제공업체의 한 기술 담당자는 올해 7월 Caijing에 최근 Alibaba Cloud의 Tongyi Qianwen 오픈 소스 모델(Qwen2)을 보조 교육 및 세부 조정에 사용하여 지역 도시 관광국에 서비스를 제공했다고 말했습니다. 이번 주문 금액은 1000만 위안이 넘고 이들이 수혜자지만 알리바바 클라우드에는 수입이 없다. "Caijing"은 Github(세계 최대 코드 호스팅 플랫폼)에서 Qwen2의 라이선스 계약에 대해 문의했습니다. 계약서에는 "상업적 사용 요청이 필요하지 않습니다"라고 명시되어 있습니다. 즉, Qwen2를 학습시키고 미세 조정한 후에는 상업적 사용에 대한 비용을 지불할 필요가 없습니다.
오픈소스의 장기적인 가치는 모델 시장을 더 크게 만드는 것입니다. Alibaba Cloud 관계자는 Caijing에게 사용자가 상업적 용도로 오픈 소스 모델을 수정하는 것이 일반적이며 오픈 소스를 수행할 때 이에 대비해야 한다고 말했습니다. Alibaba Cloud는 아직 모든 케이크를 먹어치운 것은 아니지만 업계 케이크를 더 크게 만들었습니다. 장기적으로는 궁극적으로 이익이 될 것입니다. 정부, 대기업, 개발자 등 다양한 고객이 대형 모델을 널리 사용할 때만 화학 반응이 발생합니다. 대형 모델산업은 생태계를 구축하고 성장 플라이휠을 형성해야 합니다. 이러한 추세는 Alibaba Cloud가 소유한 AI 오픈소스 커뮤니티인 ModelScope에서 확인할 수 있습니다. 올해 7월 현재 Moda 커뮤니티는 560만 명이 넘는 개발자, 5,500개 이상의 고품질 모델, 수천 개의 데이터 세트를 보유하고 있어 중국 최대의 오픈 소스 모델 커뮤니티가 되었습니다.
보다 낙관적인 견해는 오픈 소스와 폐쇄 소스가 업스트림 및 다운스트림 관계를 형성할 수도 있다는 것입니다. 오픈 소스는 기술의 업스트림에 있으며 커뮤니티 참여, 기술 반복, 고객 유치 및 기술이 동료보다 앞서도록 보장합니다. 폐쇄 소스는 다운스트림이며 상업적 구현을 ​​담당합니다.
Lanzhou Technology는 중국의 대형 모델 스타트업 회사입니다. Lanzhou Technology의 파트너이자 공동 CEO인 Li Jingmei는 Caijing에게 오픈 소스는 기술 전략이자 비즈니스 전략이라고 말했습니다. 이는 개발자 커뮤니티는 물론 잠재 고객 기술팀의 정신에도 영향을 미칠 수 있습니다. 오픈소스와 클로즈드소스는 모순되지 않습니다. 비공개 소스 모델에 대한 고객 피드백 주기는 상대적으로 길지만, 오픈 소스 모델의 커뮤니티 개발자는 신속하게 피드백을 제공합니다. 이는 기업이 제품을 신속하게 반복하는 데 도움이 될 수 있습니다.
중국의 한 선도적인 기술 기업의 AI 전략 기획자는 Alibaba Cloud와 같은 선도적인 클라우드 공급업체의 경우 오픈 소스와 폐쇄 소스를 병행하는 것이 폐쇄 소스만 사용하는 것보다 낫다고 믿습니다. Alibaba Cloud의 수익은 주로 퍼블릭 클라우드의 4가지 주요 구성 요소(컴퓨팅, 스토리지, 네트워크, 데이터베이스)에서 발생합니다. 무료 오픈 소스 모델은 고객의 비즈니스 데이터 소비를 촉진하여 위에서 언급한 기본 클라우드 제품의 판매를 촉진할 것입니다.
비공개 소스 모델만 만드는 것은 간단하고 직접적이며 논리적인 접근 방식입니다. 이 경로를 택하는 대기업은 대형 모델을 상용화하려면 소스를 폐쇄해야 하며, 그렇지 않으면 상용 루프를 폐쇄할 수 없다고 믿습니다.
AI 스타트업 OpenAI(GPT-4 시리즈 모델), Amazon(Claude 3.5 시리즈 모델을 포함하는 AI 스타트업 Anthropic에 투자), Huawei(Pangu 모델), Baidu(Wenxin 모델) 및 기타 기업이 이 길을 선택했습니다. 대규모 모델을 사용하는 기업은 API(응용 프로그래밍 인터페이스) 호출별로 비용을 지불하는 경우가 많습니다. 이는 사용량에 따라 물, 전기, 가스 요금을 지불하는 것과 같습니다. 폐쇄 소스 모델의 비즈니스 모델은 이론적으로 가장 건전합니다. 마이크로소프트 애저(Microsoft Azure), 아마존 AWS(아마존 AWS), 구글 클라우드(Google Cloud)의 매출 성장률은 지난해 약 5%포인트 증가했고, 이익 수준도 소폭 증가했다. 이는 대형 모델 풀의 결과로 생각됩니다.
하지만 중국에서는 폐쇄형 소스 모델이 단기적으로 진정한 수익을 내기가 어렵습니다. 올해 5월, 중국 모델 시장은 가격 전쟁에 돌입했다. 가격 인하의 목적은 고객 수요를 자극하고 시장 규모를 확대하는 것입니다. ByteDance의 클라우드 서비스 Volcano Engine, Alibaba Cloud, Tencent Cloud 및 Baidu Smart Cloud는 대규모 모델 호출 가격을 연속적으로 90% 이상 인하했습니다. 대형 모델콜 매출총이익률은 60% 이상에서 0% 미만으로 떨어졌다.
중국의 한 클라우드 벤더 대형모델 사업 담당자는 대형모델 콜이 '마이너스 매출총이익 시대'에 진입했다고 보고 있다. 더 많이 사용할수록 손실은 더 커질 것입니다. 차이점은 알리바바, 바이트댄스, 바이두 등 대기업은 손실을 감당할 수 있지만 중소기업과 스타트업은 그렇지 않다는 점이다.

그와 대형 모델 스타트업 임원은 비슷한 견해를 밝혔습니다. 즉, 회사마다 유전자가 다르고 모델 사업 전략도 다르다는 것입니다. 클라우드는 알리바바 클라우드의 핵심 사업으로, 오픈소스 모델의 궁극적인 목표는 더 많은 클라우드를 판매하는 것입니다. Volcano Engine은 ByteDance의 지원을 받으며, 모회사의 광고 사업을 수혈할 수 있습니다. 볼케이노엔진의 클라우드 컴퓨팅 시장점유율은 알리바바 클라우드보다 훨씬 낮으며, "맨발이고 신발 신는 것도 두렵지 않다"며 가격 전쟁을 통해 더 많은 시장점유율을 선점하기를 바라고 있다. AI는 바이두의 핵심 사업이다. 바이두는 대형 모델로 돈을 벌기를 희망하므로 비공개 소스 모델의 가치를 강조한다.

주장은 무엇입니까? 합의는 무엇입니까?
대형 모델에 대한 중국의 오픈 소스 및 비공개 소스 논쟁에는 몇 가지 초점이 있습니다. 첫째, 오픈 소스 모델과 오픈 소스 소프트웨어 사이에 차이가 있습니까? 둘째, 오픈 소스 모델과 폐쇄 소스 모델 중 어느 것이 더 강합니까? 셋째, 오픈 소스 모델과 폐쇄 소스 모델 중 어느 것이 더 비쌉니까?
첫 번째 논쟁은 오픈 소스 모델과 오픈 소스 소프트웨어 사이에 차이가 있는가입니다. 대답은 '큰 차이가 있다' 입니다. 대부분의 오픈 소스 모델은 완전한 오픈 소스가 아닙니다. 오픈소스 소프트웨어처럼 투명한 상자라기보다는 무료로 사용할 수 있는 블랙박스에 가깝습니다.
오픈 소스 소프트웨어는 소스 코드를 공개하고 개발자는 소스 코드를 통해 소프트웨어의 기술적 세부 사항 대부분을 마스터할 수 있습니다. 무료 오픈 소스 소프트웨어의 핵심 논리는 사회 전반의 개발자가 소프트웨어 제조업체가 제품 버그를 찾고 최적화 제안을 제공하도록 도울 수 있다는 것입니다. 사회 발전은 소프트웨어 연구 및 개발 비용을 절감할 뿐만 아니라 소프트웨어 반복 속도도 높일 수 있습니다. 모바일 운영 체제인 Android와 데이터베이스 소프트웨어인 MySQL은 모두 이러한 방식으로 성공을 거두었습니다.
오픈 소스 모델의 복잡성은 오픈 소스 소프트웨어의 복잡성을 훨씬 능가합니다. 오픈 소스 프로젝트에는 소스 코드, 매개변수 가중치, 모델 구조, 교육 데이터, 교육 프로세스 등이 포함됩니다. 네덜란드 Radboud 대학의 학자인 Lisenfeld와 Dingemans는 올해 3월 오픈소스 모델의 오픈소스 정도를 비교하는 논문을 발표했습니다. 이 논문에서는 가장 성능이 뛰어난 오픈 소스 모델은 일반적으로 오픈 소스 매개변수 가중치만 보여준다는 것을 보여줍니다. 한 가지 설명은 선도적인 모델 성능을 보장하기 위해 모델 제조업체가 모든 "레시피"를 공개할 수 없다는 것입니다. 세계에서 가장 강력한 오픈 소스 모델인 Llama3를 예로 들어 보겠습니다. 이 모델은 매개변수 가중치와 모델 구조를 부분적으로만 오픈 소스화했습니다. 소스 코드, 훈련 데이터 및 훈련 프로세스는 오픈 소스화되지 않았습니다.


산업 생태계에 대한 오픈 소스 개념의 가치에 대해서는 의심의 여지가 없습니다.Baidu Smart Cloud AI 및 대형 모델 플랫폼의 총책임자인 Xin Zhou는 올해 7월 Caijing과의 인터뷰에서 오픈 소스 모델이 모델 애플리케이션과 산업 모델을 더욱 풍부하게 만들 것이라고 말했습니다. 그러나 그는 오픈 소스 모델을 오픈 소스 소프트웨어와 통합하는 데 반대합니다.둘 사이에는 본질적인 차이가 있기 때문에 오픈 소스 모델은 오픈 소스 소프트웨어처럼 제품 성능을 향상하고 R&D 비용을 줄이기 위해 소셜 개발자의 참여에 의존할 수 없습니다. 기본 모델은 모델 제조업체의 자체 교육을 통해서만 개선될 수 있습니다. 오픈 소스 모델의 미세 조정 및 추론 최적화는 개발자에게 기술적 요구 사항이 높지 않으며 실제 사용 비용도 낮습니다. 낮은.
두 번째 논쟁은 오픈 소스 모델과 폐쇄 소스 모델 중 어느 것이 더 강력한가입니다. 사실 비공개 소스 모델은 일반적으로 오픈 소스 모델보다 더 나은 성능을 발휘하지만 오픈 소스 모델과 비공개 소스 모델 간의 성능 격차는 줄어들고 있습니다.


스탠포드 대학의 CRFM(Center for Research on Fundamental Models)은 오랫동안 글로벌 대형 모델 테스트 순위를 실시해 왔습니다. 7월 24일 발표된 대규모 MMLU(Multi-task Language Understanding) 테스트 순위에 따르면 상위 10개 성능 모델 중 Claude3.5(Amazon 투자), GPT 등 Llama3.1만 오픈소스 모델인 것으로 나타났습니다. -4o(Microsoft 투자), Gemini1.5 Pro(Google 자체 개발) 등은 비공개 소스 모델입니다.
Li Jingmei는 같은 회사의 폐쇄 소스 모델이 오픈 소스 모델보다 더 나은 성능을 가져야 한다고 믿습니다. 그러나 업계의 수평적 비교에서 폐쇄 소스 모델이 반드시 오픈 소스 모델보다 나은 것은 아닙니다. 대규모 모델은 6~12개월마다 반복되므로 일부 오픈 소스 모델은 더 빠르게 발전할 수 있습니다.


검토 기관별 순위는 이러한 추세를 보여줍니다. LMSYS 조직(Large Model System Research Organization)은 캘리포니아 버클리 대학에서 시작되었으며 오랫동안 글로벌 모델 성능을 평가하고 순위를 매기게 됩니다. 이번 평가에서는 Meta의 Llama3.1과 Alibaba Cloud의 Qwen2가 빠른 속도로 순위가 상승하고 있습니다. Llama3.1은 대부분의 비공개 소스 모델을 능가합니다.
중국의 한 클라우드 벤더 대형 모델 사업 담당자는 지난 1년 동안 오픈소스 모델과 폐쇄형 소스 모델 간 성능 격차가 전반적으로 좁아진 이유를 두 가지로 분석했다. 성능 개선. 오픈 소스 모델은 많은 개발자의 관심을 끌고 있습니다. 코드 피드백을 통해 모델 성능을 직접적으로 향상시킬 수는 없지만 모델 연구의 전반적인 수준을 향상시켜 오픈 소스 모델이 모델 성능을 향상시키는 데 간접적으로 도움이 됩니다.
세 번째 논쟁은 오픈 소스 모델과 폐쇄 소스 모델 중 어느 것이 더 비쌉니까? 결론은 성능이 결정적인 요소라는 것입니다. 모델 사용 비용은 모델 성능과 직접적인 관련이 있습니다. 성능이 높을수록 작업을 완료하는 데 필요한 호출 수가 줄어들기 때문에 장기적인 사용 비용이 낮아집니다.
오픈 소스 모델은 무료이며 종종 더 저렴하고 비용이 저렴하다는 인상을 줍니다. Xin Zhou는 대형 모델 애플리케이션은 '기술 + 서비스'를 포함한 포괄적인 솔루션이며 기업은 '총계정원장'을 계산해야 한다고 설명했습니다. 완전한 모델과 도구 체인을 제공하는 것 외에도 폐쇄 소스 모델 제조업체는 기업이 빠르게 시작할 수 있도록 교육 및 기술 서비스도 제공합니다. 오픈소스 모델은 무료인 것 같지만, 클로즈드소스와 동일한 효과를 얻으려면 후속으로 인력, 비용, 시간에 대한 투자가 많이 필요하고 전체적인 비용도 더 많이 듭니다.

장기적으로 오픈소스와 폐쇄소스 모델의 적용 비용을 결정하는 결정적인 요소는 추론 비용이다. 매개변수 크기가 동일한 폐쇄 소스 모델은 일반적으로 오픈 소스 모델보다 성능이 뛰어나며 종합 비용이 더 낮습니다. Xin Zhou는 기업이 오픈 소스 모델을 무료로 배포하는 경우 폐쇄 소스 모델을 배포하는 데 드는 비용이 500,000위안이라고 계산했습니다. 초기 투자 단계에서는 오픈소스 모델이 더 저렴하다. 사용 후기 단계에서 폐쇄 소스 모델의 종합 성능이 오픈 소스 모델보다 20% 더 뛰어나면 폐쇄 소스 모델은 일부 대규모 기업에서 하루에 수만 위안을 절약할 수 있습니다. . 궁극적으로 장기적인 사용 비용은 오픈 소스 모델보다 훨씬 낮아야 합니다.

오픈 소스 모델을 사용하는 사람은 누구입니까? 비공개 소스 모델을 사용하는 사람은 누구입니까?
오픈 소스 모델이 더 좋습니까, 아니면 폐쇄 소스 모델이 더 좋습니까? 이 문제는 공급 측 모델 제조업체가 결정하는 것이 아니라 수요 측 기업 고객이 결정합니다.
공개적으로는 기업의 말싸움이 계속되고 있습니다. 그러나 클라우드 공급업체의 많은 기술 인력은 Caijing에게 이러한 주장이 서로의 시장 가치를 부정할 수는 없다고 말했습니다. 이 두 가지 요구 사항은 오랫동안 공존할 것입니다. 다른 관점에서 보면, 말싸움을 하면 공동으로 시장 가시성을 높이는 것이 더 쉬워집니다.
실제로 대부분의 기업 고객은 모델이 오픈 소스여야 하는지 여부에 관심이 없습니다. Xin Zhou는 많은 대기업 고객과 대화한 후 IT 부서장이 모델을 사용해야 하는지 여부는 일반적으로 효과, 성능, 가격, 보안 등 여러 요소에 따라 결정된다는 결론을 내렸습니다. 오픈소스인지, 클로즈드소스인지는 결정적인 요소가 아닙니다.
대부분의 회사의 "도구 상자"에서 오픈 소스 모델과 폐쇄 소스 모델은 상호 보완적입니다. 대기업의 대규모 모델 구현은 일반적으로 여러 단계로 구분됩니다.
초기 단계에서는 IT 부서에서 시중에 나와 있는 오픈소스 모델과 폐쇄소스 모델의 성능과 특성을 정리할 예정이다. 모델마다 장점이 다릅니다. 일부는 강력한 언어 발음 기능을 갖고 일부는 강력한 데이터 통계 기능을 갖습니다. 비즈니스 효과를 검증하기 위한 무료 초기 단계 오픈 소스 모델 POC(개념 증명) 테스트입니다.
중기적으로는 마케팅, 고객 서비스, 지식 기반 등 난이도가 낮고 결과가 빠른 비즈니스 시나리오의 프로젝트 첫 단계부터 시작할 것입니다. 비공개 소스 모델을 구매해야 할 뿐만 아니라 자체 오픈 소스 모델을 훈련하고 세부 조정해야 합니다. 내부 및 외부 모델이 서로 "경쟁"하도록 하고, 다양한 모델의 효과와 비용을 비교하고, 언제든지 사용법을 전환하십시오.
이후 단계에서는 실행 결과를 기반으로 성과 창출이 어렵고 느린 비즈니스 시나리오에서 2단계 및 3단계 프로젝트를 점진적으로 계획할 것입니다. 현재 독립적이고 제어 가능한 기본 대형 모델 또는 업계 대형 모델 세트를 구축하려면 수천만 위안을 지출해야 하는 경우도 많습니다.
오픈 소스 모델은 무료이지만 바로 사용할 수 없고 시간과 노력이 필요하며 세부 사항에 대해 누구도 책임지지 않습니다. 비공개 소스 모델은 성숙한 제품을 직접 확보하고 판매 전, 판매 중, 판매 후에 전체 서비스를 제공할 수 있습니다. 쉽게 이해하면 오픈소스 모델은 스스로 음식을 사서 요리하는 것과 같고, 클로즈드 소스 모델은 식당에서 식사하기 위해 돈을 쓰는 것과 같습니다.
Xin Zhou의 관점은 오픈 소스 모델이 학술 연구, IT 예산이 극도로 제한된 일부 중소기업, 독립적이고 통제 가능한 내부 자체 연구 프로젝트를 위한 일부 대기업에 적합하지만 그렇지 않다는 것입니다. 대규모 외부 상업 프로젝트에 적합합니다. 수백만 또는 수천만 달러의 비용이 드는 일부 심각한 상업 프로젝트에서는 비공개 소스 모델이 여전히 최선의 선택입니다.
오픈 소스 모델은 공짜 점심이 아닙니다. 오픈 소스 모델을 사용하는 대기업에는 숨겨진 비용이 많이 있습니다. 예를 들어 컴퓨팅 성능 구매, 소프트웨어 적응 등이 있습니다. 중국 해외 지능형 마케팅 서비스 제공업체의 기술 이사는 올해 7월 Caijing에 자신의 회사가 클라우드 서비스에 크게 의존하고 있으며 매년 연구 개발에 8천만 위안 이상을 지출한다고 말했습니다. 지난 2년 동안 이 회사는 10개 이상의 비공개 소스 모델을 동시에 사용해 왔지만 그중 오픈 소스 모델은 없습니다. 그의 견해로는 오픈 소스 모델을 작업하려면 시간과 인력이 필요합니다. 대부분의 오픈 소스 모델은 바로 사용할 수 없으며 세부 사항을 아는 사람이 없으며 "장난감"으로만 간주될 수 있습니다. 그는 12개 이상의 비공개 소스 모델을 관리하고 가격과 성능에 따라 언제든지 전환하는 경향이 있습니다. 이것이 가장 비용 효율적입니다.
대형 합자 상업 은행의 IT 책임자는 오픈 소스 모델을 즉시 사용할 수 없는 것이 큰 문제가 아니라고 생각합니다. 그는 2023년 12월 Caijing에 자신의 팀이 자체 개발 연구 규정 준수 보고 감사 애플리케이션에 Alibaba(Tongyi 오픈 소스 모델), Meta(Llama 오픈 소스 모델), Baidu(Wenxin 시리즈) 및 Zhipu(GLM 시리즈)를 사용했다고 말했습니다. 오픈 소스 모델은 무료 POC 테스트를 허용하고 필요에 따라 수정할 수 있으므로 소규모 프로젝트에 적합합니다. 그의 IT 팀에는 이러한 문제를 처리하기에 충분한 인력을 갖춘 아웃소싱 IT 서비스 회사는 물론 수십 명의 인력이 있습니다. 그러나 그는 또한 100만~1천만 위안 규모의 대규모 프로젝트에서는 비공개 소스 모델이 더 적합하다고 믿습니다. 비공개 소스 모델은 안정적이고 신뢰할 수 있기 때문에 이를 담당하는 모델 회사를 찾을 수도 있습니다.

오픈 소스 모델을 사용하여 일련의 산업 모델을 완전히 교육하는 데 수천만 위안의 비용이 들고, 자체 구축 컴퓨터실을 구축하려면 AI 칩을 구입해야 합니다. 위에서 언급한 AI 소프트웨어 서비스 제공업체 기술자들은 오픈 소스 모델이 데이터 보안, 자율성 및 통제에 대한 요구 사항이 높고 비용에 그다지 민감하지 않은 일부 중앙 국영 기업에 적합하다고 결론지었습니다. 그들은 오픈 소스 모델을 사용하여 자신의 산업 모델을 교육할 것입니다. "오픈 소스 모델 + 프라이빗 클라우드"는 많은 중앙 기업과 국영 기업의 데이터 보안 및 독립적인 제어 가능성 요구 사항을 충족하기 때문입니다.

미래는 무엇입니까?
중국 시장에서 대형 모델의 공개 소스와 비공개 소스 간의 논쟁은 순전히 상업적인 문제입니다. 그러나 국제 시장에서는 대형 모델 공개 소스와 비공개 소스 간의 분쟁에는 독점 금지, 국익 등의 요소가 더 많이 포함됩니다.
올해 5월 가격 전쟁 이후 중국 대형 모델 콜은 '마이너스 총이익 시대'에 돌입했다. 오픈 소스 모델과 폐쇄 소스 모델 모두 문제에 직면해 있습니다. 대형 모델은 직접적인 수익을 창출할 수 없습니다.
"대형 모델 시장 녹아웃 경쟁이 시작됐다" 중국 클라우드 벤더의 대형 모델 사업 담당자는 대형 모델 통화 매출총이익이 마이너스라는 것은 단기적으로 통화가 더 많이 이뤄지는 것을 의미한다고 분석했다. 클라우드 공급업체의 손실이 더 커집니다. 중국 클라우드 벤더들은 대형 모델 호출 가격이 90% 인하된 후 향후 1~2년 내에 대형 모델 호출 수가 기하급수적으로 늘어날 것이라고 장담하고 있다. 장기적으로 클라우드 공급업체의 컴퓨팅 전력 비용은 고객 수요가 증가함에 따라 희석될 것이며 결국 여전히 긍정적인 이익을 달성할 수 있을 것입니다. 이 내기가 사실이 아니더라도, 모델 제조업체 그룹은 가격 전쟁에서 죽을 것이고, 살아남은 제조업체가 부품을 가져갈 것입니다.
많은 업계 관계자들은 이번 탈락 라운드가 1~2년 동안 지속될 것이며, 3~5개의 기본 모델 회사만이 계속 살아남을 수 있다는 입장을 밝혔다.
중국 정보화 바이후이(China Informatization Baihui) 집행위원이자 알리바바 클라우드 지능형 기술 연구 센터 소장인 안샤오펑(An Xiaopeng)은 올해 7월 카이징과의 인터뷰에서 중국에서는 수백 가지 모델의 전쟁도, 심지어 10가지 모델의 전쟁도 없다고 말했습니다. 대형 모델은 지속적인 투자가 필요하고 카드 용량이 10,000장, 심지어 100,000장에 달하며 상업적인 수익이 필요합니다. 많은 회사에는 그러한 능력이 없습니다. 앞으로 중국 시장에는 기본 모델 제조업체가 3~5개만 남게 될 것입니다.
가격 전쟁으로 누가 이익을 얻나요? 마지막에 웃는 사람은 누구일까요? 위에서 언급한 중국 최고의 기술 기업의 AI 전략 기획자들은 이번 가격 전쟁에서 Alibaba Cloud와 ByteDance의 Volcano Engine이 가장 많은 피를 흘리고 있다고 믿습니다. 알리바바 클라우드는 클라우드로 돈을 벌 수 있고, 볼케이노 엔진은 바이트댄스의 광고 사업을 갖고 있다. 가격 전쟁에서 Baidu는 Alibaba 및 ByteDance만큼 좋지 않습니다. 그러나 Baidu의 Wenxin 대형 모델은 강력한 기술을 보유하고 있으며 기술 비용을 지불할 의향이 있는 고객 그룹을 보유하게 될 것입니다. 이는 Baidu가 가격 전쟁에서 살아남는 데 도움이 될 것입니다. 그는 또한 이러한 중국 시장의 대형 모델 스타트업이 향후 1~2년 내에 심각한 테스트에 직면할 것이라고 설명했습니다. 대규모 모델 스타트업은 프로젝트 기반 모델 개발 회사가 되거나 수직 산업 모델로 전환할 수 있습니다.
중국 대형 모델 시장의 전반적인 경쟁은 오픈 소스 모델과 폐쇄 소스 모델 간의 현지 경쟁보다 훨씬 더 중요합니다. 글로벌 경쟁의 방향이 로컬 경쟁의 결과를 직접적으로 결정하게 됩니다.
Alibaba Cloud 관계자는 오픈 소스 모델과 폐쇄 소스 모델 모두 각자의 장점이 있으며 Alibaba Cloud는 AI를 더욱 포괄적으로 만들기를 희망한다고 솔직하게 말했습니다. 오픈소스든 비공개소스든 상관없이 핵심 목적은 개발자에게 더 많은 선택권을 제공하는 것입니다. Alibaba Cloud는 오픈 소스와 폐쇄 소스라는 두 가지 다리를 선택했습니다. 여기에는 전체 크기, 전체 모달 오픈 소스 모델과 폐쇄 소스 모델이 모두 있습니다. 중국 클라우드 공급업체의 대규모 모델 비즈니스를 담당하는 또 다른 사람은 오픈 소스에는 비즈니스 모델이 없다고 생각합니다. 중국 모델 시장에서는 지속적으로 자금을 조달할 수 있는 선두 기업이나 극소수의 스타트업만이 오픈소스를 고집할 수 있다. 결국 중국 시장에는 오픈소스 모델이 1~2개밖에 남지 않을 수도 있다.
모델 제조업체는 거의 6~12개월마다 새로운 세대의 모델을 교육합니다. 중국 모델 시장에서는 이익 창출에 대한 압력이 증가함에 따라 모델 오픈 소스가 점점 더 "전략적"이 될 수 있습니다. 기업은 이전 세대의 낙후된 기술과 더 작은 매개 변수를 사용하여 소스 모델을 오픈하는 경향이 있으며 사용자에게 비용을 지불하도록 안내할 것입니다. 더 큰 비공개 소스 모델을 사용하여 기술 업데이트를 수행합니다.
오픈 소스와 폐쇄 소스 모델 간의 경쟁은 조만간 끝나지 않을 것입니다. 일부 회사에서는 오픈 소스와 비공개 소스를 동시에 실행할 수도 있습니다.IT 업계에서는 데이터베이스가 탄생한 지 60년이 넘었고, 최초의 오픈소스 데이터베이스가 탄생한 지 50년이 넘은 전례가 없습니다. 현재 데이터베이스 시장은 다양한 클로즈드 소스와 오픈 소스 데이터베이스로 활발히 활동하고 있으며, 새로운 데이터베이스 브랜드도 여전히 끊임없이 등장하고 있습니다. 거대 데이터베이스 Oracle은 비공개 소스 RDBMS 데이터베이스와 오픈 소스 MySQL 데이터베이스를 모두 보유하고 있습니다.
많은 클라우드 공급업체 기술자는 오픈 소스 모델과 폐쇄 소스 모델이 오랫동안 공존할 것이라고 믿습니다. 대형 모델 시장은 다양한 기술 경로의 경쟁 속에서 점차 성장할 것입니다.

편집자|장위페이