대형 모델 출시 전쟁에서 바이두는 어떻게 돌파할 수 있을까?

2024-09-02

1년이 넘는 연구 끝에 대형 모델이 정말 '인기'가 있을까?

대형 모델에 대해서는 끝없는 논쟁이 있는 것 같습니다. "대형 매개변수"를 추구할 것인가 아니면 "스케일링 법칙"을 고려할 것인가? "밀도" 또는 "희소" 프레임워크 중 어느 프레임워크가 더 좋나요? "언어" 또는 "다중 양식": 대형 모델의 진정한 미래는 누구입니까? 플레이어들은 확고한 입장과 각자의 의견을 가지고 있지만, 이러한 인기는 좀 더 확립된 시장으로 결코 전달되지 않은 것 같습니다.

주요 제조업체 중 baidu는 대규모 모델 엔지니어링을 구현한 몇 안되는 회사 중 하나입니다. 오늘 발표된 baidu의 2024년 2분기 재무 보고서에 따르면 분기별 총 수익은 339억 위안, baidu의 핵심 수익은 267억 위안, 바이두 코어 영업이익은 56억 위안으로 전년 대비 23% 증가했다.

wenxin의 대형 모델은 일일 호출 수가 6억 건이 넘으며, ai는 전년 대비 14% 증가한 51억 위안의 클라우드 수익을 창출했습니다.

하늘에 떠 있는 ai를 다시 땅으로 가져오면 바이두가 제대로 한 일이 무엇일까?

통화 건수는 가격 인하 및 강세에 따라 계속해서 증가하고 있습니다.

baidu의 2분기 재무 보고서에서 가장 눈길을 끄는 데이터인 wenxin의 대규모 모델에 대한 호출 급증부터 시작해 보겠습니다.

일일 호출 수는 6억 건을 초과하고, 하루 평균 처리되는 토큰 수는 1조 개를 초과합니다. 급증하는 문의 뒤에는 업계 전체의 관심을 끌었던 올 5월 대규모 '대형 모델 가격 전쟁'이 늘 떠오른다.

이 전투에서 baidu의 가격 인하 노력은 "사나운" 것으로 묘사될 수 있습니다.

전투는 빠르게 시작되었고 baidu는 ernie-speed, ernie-lite 및 ernie-tiny 시리즈 모델 사전 설정 서비스가 무료라고 직접 발표했습니다.

올해 7월 waic 기간 동안 baidu smart cloud는 추가 가격 인하를 발표하여 두 가지 주력 모델인 ernie 4.0 및 ernie 3.5의 가격을 대폭 인하했습니다. 입력 및 출력은 각각 0.03위안/천 토큰 및 0.06위안/천 토큰만큼 낮습니다. .

단순히 가격 임계값을 제거하면 자연스럽게 많은 사용자가 몰려들게 됩니다. 특히 많은 대, 중, 소기업과 기관에서는 더 이상 비용에 대한 걱정이 없으며, 대형 모델을 시도하려는 열정을 갖고 있습니다.

가격 인하로 인해 고객이 전화를 걸어야 하는 "밀기"가 실제로 감소했습니다.그리고 대형 모델에 대한 경쟁은 그토록 치열합니다. 가격이 낮아지더라도, 특히 가격이 이미 극도로 낮은 상황에서 wenxin이 두각을 나타낼 수 있는 이유는 무엇일까요?

한 기사는 baidu가 거의 결정적인 이익 이전을 수행할 수 있는 능력은 본질적으로 baidu의 더욱 발전된 풀 스택 ai 기술에 달려 있으며 이를 통해 무료화하고 가격을 낮출 수 있다는 자신감을 갖게 된다고 오랫동안 분석했습니다.

wenxin big model 탄생 이후, wenxin big model의 주당 평균 훈련 효율성은 wenxin yiyan 출시 당시와 비교하여 5.1배 증가했습니다. 추론 비용은 105배가 됩니다. 추론 비용은 원래 1%로 떨어집니다. 지난 6월 바이두는 플라잉 패들 3.0(flying paddle 3.0)도 출시했는데, 이번 업그레이드를 통해 플라잉 패들 프레임워크와 바이두 ai 인프라 및 wenxin 대형 모델의 호환성이 크게 향상되었으며 향후 모델 추론 비용이 더욱 절감될 것으로 예상됩니다.

baidu는 대규모 모델 사용자의 현재 문제점에 대해 매우 심오한 분석을 수행했습니다. 사용자의 첫 번째 유형의 문제점은 애플리케이션 구현에 대한 상대적으로 높은 임계값과 시나리오를 기반으로 적절한 애플리케이션을 신속하게 개발하는 방법입니다. 문제점은 특정 시나리오, 자신의 업계 요구 사항을 충족하기 위해 특수 모델을 사용하는 방법입니다.

본질적으로, 사용자가 구매하게 만드는 기술 제품의 경우 여전히 최우선 순위는 기술 제품의 "가용성"과 "사용 용이성"입니다.

재무 보고서가 발표되기 하루 전에 baidu는 주력 대형 모델 ernie 4.0 turbo의 미세 조정 지원을 발표했습니다. 이전에 baidu qianfan 대형 모델 플랫폼은 모델 미세 조정을 위해 ernie 3.5, ernie speed, ernie lite, ernie tiny 및 ernie character를 지원했습니다. 현재까지 qianfan 플랫폼에서는 총 6개의 wenxin 대형 모델을 미세 조정할 수 있습니다. 누적된 미세 조정 21,000개의 모델을 생산하여 1,000개가 넘는 기업의 핵심 비즈니스 시나리오를 지원하고 많은 성공 사례를 보유하고 있습니다.

정부 업무 분야에서는 중국전국노총연맹과 바이두 스마트 클라우드가 법률 상담에 ai 기능을 활용해 근로자들이 법적 문제를 더 정확하게 이해하고 노동 보상 금액을 더 빠르게 계산하며 대형 모델을 통해 더욱 개인화된 솔루션을 제공할 수 있게 됐다. . 사례 평가를 완료하세요.

극도로 높은 정확도와 피드백 속도를 요구하는 이 시스템은 전통적인 개발 방식과 비교하여 단 한 달 만에 납품되었으며, 이는 기존의 3~6개월 납품 주기에 비해 효율성이 크게 향상된 것입니다.

이렇게 생산성이 향상되고 더 많은 사용자가 이 값을 확인할 수 있다면 wenxin의 대형 모델에 대한 호출 횟수가 늘어나지 않을 수 없을 것입니다.

클라우드 비즈니스는 maas와 도구에 의존하며 빠르게 성장하고 있습니다.

ai의 급속한 발전은 바이두에 직접적인 성과를 가져왔고, 이는 바이두의 클라우드 사업의 지속적인 성장이다.

재무 보고서에 따르면 2분기 바이두 스마트 클라우드 매출은 전년 동기 대비 14% 증가한 51억 위안을 기록했으며, ai 매출은 전 분기 6.9%보다 높은 9%를 차지했다.

우수한 대형 모델을 명함처럼 여기고, 이에 긴밀하게 융합된 클라우드 사업도 자연스럽게 추진될 것입니다. ai 애플리케이션의 큰 번영으로 인해 gpu 클라우드는 점차 기업 조달의 "표준 구성"이 되었습니다.

그 결과 maas(model as a service) 모델이 점차 무대에 등장하고 baidu cloud 성장에 새로운 추가 요소가 되고 있습니다.

최신 idc 보고서에 따르면 baidu intelligent cloud는 2023년 중국 대형 모델 플랫폼 시장 점유율 19.9%로 1위를 차지할 것으로 예상됩니다. 마찬가지로 올해 중국에서 낙찰자로 발표된 260여개 대형 모델 프로젝트 중 바이두가 낙찰자 순위 1위에 올랐다. 주류 대형 모델 제조업체 중에서 baidu는 낙찰 프로젝트 수가 가장 많고 산업 분야도 가장 많으며 입찰에서 6,400만 위안 이상을 획득하여 3개 업체 중 1위를 차지했습니다.

대형 모델이 출시된 기간 동안 qianfan 플랫폼은 '큰 돈을 벌었고' 총 150,000명의 고객에게 서비스를 제공했으며, 정부 업무, 전력, 교육 등 다양한 산업 분야에서 노력해 왔습니다. 기술 제품에 대한 인정을 얻었을 뿐만 아니라 생산성 향상의 형태로 사회에 피드백을 제공합니다.

허난, 충칭 및 기타 지역의 농촌 지역에서 qianfan은 "시골로 가는 대형 모델"을 홍보하여 마을 주민들이 의료 보험 지불 및 호적 등록 처리와 같은 가장 사소하고 시간이 많이 걸리는 문제를 안전하게 지원에 맡길 수 있도록 합니다. 큰 모델의.

지방 정부 지식 기반에서 정확하게 다루기 어려운 문제가 발생하면 대형 모델은 baidu 검색을 결합하여 답변을 제공하고 질문하는 사람에게 자동으로 @답장하여 시골에 24시간 편리한 서비스를 제공할 수도 있습니다.

현재 상주보조인은 6,000여개 마을에 진출해 서민들이 더욱 스마트한 삶을 누릴 수 있게 됐다.

고객이 "사용 가능"하고 "사용하기 쉽다"는 느낌을 주기 위해 baidu의 대형 모델 상용화는 대형 모델 도구 체인 업그레이드에 더 많이 의존합니다.

도구 체인 업그레이드를 심층적으로 육성하는 것은 올해 baidu 기술 개발의 주요 주제 중 하나입니다.

모델 미세 조정의 관점에서 modelbuilder는 하이브리드 wenxin 대형 모델의 고품질 데이터 기능을 출시했습니다.사용자는 일반 혼합 코퍼스와 수직 도메인 코퍼스를 비즈니스 데이터와 통합하여 보다 안정적이고 효과적인 산업별 대형 모델을 미세 조정할 수 있습니다.

ai 네이티브 애플리케이션 개발의 관점에서 appbuilder는 ai 네이티브 애플리케이션을 개발할 때 고객이 직면하는 많은 문제를 해결합니다. 대규모 지식 검색, 사용자 정의 전략, 엔터프라이즈 수준 보안 및 기타 측면이 향상되어 대규모 모델을 더 쉽게 사용할 수 있습니다. 수준. 현재 온라인 교육, 전자 상거래, 정부 업무 및 기타 산업을 포괄하는 수십만 개 이상의 애플리케이션이 플랫폼에 생성되었습니다.

baidu의 대형 모델 시스템은 실제로 고객 생산성을 향상시켰으며 이는 업계 모두에게 명백합니다.

돌이켜보면 바이두 자체도 거대한 기술 제품 생태계를 갖고 있다. 대형 모델의 능력이 정말 이렇게 강력하다면, 24년 된 '고목'인 바이두가 다시 '새싹'을 키울 수 있을까?

제품 모델을 재구성하고, 세상을 보고, 자신을 보십시오.

인터넷에는 2차 세계대전 중 전쟁이 불안한 시기였지만 미군 낙하산의 품질이 걱정돼 낙하산 통과율 100%를 달성하기 위해 군이 왔다는 이야기가 널리 퍼졌다. 해결책을 마련하세요. 낙하산 판매원에게 직접 테스트해 보도록 하세요. 점프하지 않으면 통과할 수 없습니다. 그 결과, 드디어 낙하산 통과율이 100%에 가까워졌습니다.

“당신이 직접 제품을 사용하지 않는다면, 어떻게 다른 사람들을 편안하게 만들 수 있겠습니까?”

baidu에도 동일한 원칙이 적용됩니다. 작년 초 robin li는 wenxin 모델을 사용하여 baidu의 모든 제품을 재구성하겠다고 대담한 성명을 발표했습니다. 가장 먼저 가장 큰 타격을 입은 곳은 바이두의 본거지인 검색이다.

현재 검색 결과의 18%가 ai에 의해 생성되어 사용자에게 보다 정확하고 직접적인 결과를 제공할 수 있습니다. 이는 1년 전 baidu가 제안한 "새로운 검색"의 개념을 확인하는 것입니다. "극단적인 만족", "추천 자극" 및 "다중 상호 작용"의 세 가지 특성을 통해 사용자의 검색 결과를 더욱 정확하고 체계적이며 효율적으로 만들 수 있습니다. 더 효율적입니다.

에이전트는 이에 대한 핵심 부분입니다. 바이두는 검색결과 내 에이전트 분포에 속도를 내고 있다. 현재 바이두의 일일 평균 에이전트 분포는 5월보다 2배 많은 8억 명을 넘어섰다.

robin li는 에이전트가 임계값은 낮지만 상한선은 높은 ai 웹사이트와 같다는 점을 반복해서 강조했습니다.

개발적인 관점에서는 웹사이트보다 에이전트를 개발하는 것이 더 쉽습니다. robin li는 "그때 웹사이트는 어떻게 만들어졌나요? 브라우저를 통해 소스 코드를 살펴보는 것은 매우 간단했습니다. 몇 가지만 변경하겠습니다. 지능형 에이전트는 이것과 매우 유사합니다. 이름을 지정하고 응답할 내용과 응답하지 않을 내용을 지정하면 지능형 에이전트가 생성됩니다."

업계 최초의 주요 제조업체 중 하나인 baidu는 지능형 에이전트 트랙에서 구체화되기 시작하는 생태계를 구축했습니다. baidu wenxin intelligence platform agentbuilder는 200,000명의 개발자와 63,000개의 회사를 보유하고 있습니다. 개발자가 wenxin intelligence platform에서 에이전트를 생성하면 wenxin model 3.5 또는 4.0 버전을 유연하게 선택할 수 있으며, 이는 "평준화"되었다고 할 수 있습니다. 사용의 한계”.

올 여름 파리 올림픽 개막과 함께 많은 운동선수들의 팬들이 자발적으로 바이두원신 스마트 플랫폼에 모여 많은 팬 지원 스마트 바디를 개발했다. 중국 여자 탁구 선수 sun yingsha의 팬들은 그녀를 위해 "sun yingsha의 꼬마 부채 소녀"를 개발했으며, 여자 테니스 선수 wang manyu를 지지하는 팬들은 "manyu의 꼬마 타로 볼"을 개발했습니다. 팬들은 '찬찬의 작은 책가방'이라고 이름을 붙였습니다. 그 교환은 독특하고 매우 흥미로웠습니다.

농업 분야에서는 중국 공정원의 zhu youyong 학자도 baidu를 도와 '농민 학자 정보'를 만들었습니다. zhu youyong과 그의 팀의 연구 결과를 갖춘 이 지능형 에이전트는 고품질 건조지 쌀, 겨울 감자 및 기타 작물 재배를 포함하여 농민의 다양한 질문에 답하고 농민에게 혜택을 주는 기술을 새로운 수준으로 끌어올릴 수 있습니다.

임계값이 낮고 효과가 좋은데 어떻게 지능형 에이전트가 대중화되지 않을 수 있습니까? 미래의 지능형 에이전트의 규모는 오늘날 거대한 생태계를 형성하고 있는 수많은 웹사이트와 비교할 수 있다고 보는 것은 어렵지 않습니다.

baidu의 야망은 검색을 지능형 에이전트 배포의 가장 큰 입구로 사용하고 지능형 에이전트의 엄청난 번영의 최전선에 서는 것입니다.

baidu의 많은 전통 제품 중에서 baidu wenku는 "두 번 득점"으로 유명합니다.

빅 모델을 통해 "원스톱 ai 콘텐츠 획득 및 생성 플랫폼"으로 재구성된 baidu wenku는 수백 개의 스마트 ppt, 스마트 문서, 스마트 마인드 맵, 스마트 연구 보고서 등을 통해 ai의 길에서 더욱 앞서 있습니다. 모달 ai 기능은 사용자의 문서 경험과 사용 효율성을 크게 향상시킵니다.

현재까지 baidu wenku ai 누적 사용자 수는 1억 8천만 명을 넘어섰고, ai 기능 사용 건수는 22억 개를 넘어 대형 모델이 가져다주는 생산성 배당을 더 많은 사람들이 누릴 수 있게 되면서 15년 된 이 제품은 "두 번째 봄" ".

결론

올해 robin li는 대규모 모델의 초점이 여전히 '볼륨 애플리케이션'에 있다는 주목할만한 성명을 발표한 적이 있습니다. "애플리케이션이 없으면 오픈 소스든 폐쇄 소스든 기본 모델만 쓸모가 없습니다."

하지만 실제로 볼 수 있는 것은 바이두가 기본 모델과 애플리케이션을 모두 파악해야 하고 양손이 강해야 한다는 것이다.

지난 10년 동안 baidu는 대형 모델과 기본 ai 연구에 대한 땀을 흘리며 마침내 1에이커의 비옥한 토양을 확보했지만 토양만으로는 충분하지 않습니다. baidu는 ai 기본 애플리케이션 구축에 중점을 두고 대형 모델 개발의 두 번째 단계에 들어갔습니다. 이 "비옥한 토양"에서 풍부한 "작물"을 재배하고 있습니다.

생성 ai를 비즈니스에 깊이 통합하고 대형 모델을 사용하여 검색을 재구성함으로써 baidu에 대한 많은 증권 회사의 신뢰가 높아졌습니다.

jp morgan은 "비즈니스 관점에서 볼 때 이러한 변화는 가치 사슬에서 baidu의 역할을 순수한 트래픽 안내에서 사전 판매 컨설팅으로 확장할 것입니다. 우리는 후자가 성공적으로 실행되면 거래 대화의 흐름을 증가시킬 것이라고 믿습니다. 중장기적으로 수익에 긍정적인 영향을 미칠 것입니다.”

다른 주요 기업이 대규모 모델을 구현하려는 경우 baidu에서 실제로 배워야 할 수도 있습니다. 사용량 및 비용 임계값을 최소한으로 낮추고, 클라우드의 강점과 도구 체인을 활용하여 제대로 작동하는 생태계를 구축하고, 대규모 모델과 기존 비즈니스를 재구성하는 에이전트입니다.

이 세 가지 움직임은 모두 대형 모델을 진정으로 "일반인의 집으로 날아갈" 수 있도록 홍보하는 핵심 작업입니다.

소식

대형 모델 출시 전쟁에서 바이두는 어떻게 돌파할 수 있을까?

소개

내 연락처 정보