소식

로빈 리 내부 연설 폭로

2024-09-16

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

최근 언론보도에 따르면 “외부에서는 대형 모델에 대한 오해가 꽤 많다”고 로빈 리의 내부 연설이 드러났다. 최근 직원들과의 커뮤니케이션에서 robin li는 대형 모델 경쟁, 오픈 소스 모델 효율성 및 지능형 에이전트를 다루면서 대형 모델에 대한 세 가지 오해에 대해 이야기했습니다.경향뜨거운 주제를 기다리세요.



robin li는 대형 모델 간의 격차가 앞으로 점점 더 커질 수 있다고 말했습니다. 그는 대형 모델의 상한선이 매우 높고 여전히 이상적인 상황과는 거리가 멀다고 말했습니다. 따라서 모델은 계속해서 빠르게 반복, 업데이트 및 업그레이드해야 하며 수년 이상 지속적으로 투자할 수 있어야 합니다. 10년 동안 지속적으로 사용자 요구를 충족하고 비용을 절감합니다.



다음은 내부 연설 내용이다.

질문: 어떤 사람들은 대형 모델의 성능 사이에 장벽이 없다고 생각합니까?

로빈 리:나는 이 말에 동의하지 않습니다. 외부 세계에서는 대형 모델에 대해 오해가 꽤 많은 것 같아요. 새로운 모델이 출시될 때마다 확실히 좋다고 말하고 따라가고 싶어하는 것 같아요.gpt-4o와의 비교를 위해 테스트 세트를 사용하거나 목록을 작성하여 내 점수가 gpt-4o와 거의 동일하거나 일부 개별 항목에서 이를 초과한다고 말하지만 이것이 새로 출시된 모델이 가장 진보된 모델이라는 것을 증명하지는 않습니다. openal과 비교하면 그렇게 큰 차이는 없습니다.



모델 간의 격차는 다차원적입니다. 한 차원은 이해 능력, 생성 능력, 논리적 추론 능력 또는 기억 능력과 같은 기본 능력의 격차이든 다른 차원은 비용입니다.이 능력을 갖고 싶거나 이러한 질문에 대답하고 싶다면 비용이 얼마나 드나요? 일부 모델은 동일한 효과를 달성하더라도 추론 속도가 매우 느릴 수 있지만 실제로는 가장 진보된 모델만큼 좋지 않습니다. 그리고 테스트 세트의 경우과적합, 자신의 능력을 증명하려는 모든 모델은 순위에 오르게 됩니다. 순위를 매길 때 그는 다른 사람들이 무엇을 테스트하고 있는지, 내가 사용할 수 있는 질문과 내가 맞힐 수 있는 기술이 무엇인지 추측해야 하므로 순위를 통해 또는 테스트 세트 겉보기에는 기능이 매우 유사하다고 생각되지만 실제 애플리케이션에서는 여전히 뚜렷한 차이가 있습니다.



자체 미디어에 대한 과대광고의 일부와 새로운 모델이 출시될 때마다 홍보하려는 동기가 결합되어 모든 사람에게 모델 간의 성능 차이가 상대적으로 작다는 인상을 줍니다. 실제로는 그렇지 않습니다. 실제 사용 과정에서 우리 기술 직원이 순위를 매기는 것을 허용하지 않습니다. wenxin 대형 모델의 기능을 실제로 측정하는 것은 특정 애플리케이션 시나리오에서 사용자의 요구를 충족할 수 있는지 여부와 가치 이득을 생성할 수 있는지 여부입니다. 우리가 정말로 관심을 갖는 것.



우리는 한편으로는 모델 역량 사이에 상대적으로 분명한 격차가 있다는 점과 다른 한편으로는 현재 수행하는 작업이 실제로 원하는 작업과 여전히 거리가 멀다는 점을 확인해야 합니다. 이상적인 상태이므로 모델도 지속적으로 신속하게 반복, 업데이트 및 업그레이드되어야 합니다.오늘은 그 격차가 그다지 크지 않다고 하더라도, 다음 해에는 그 격차가 더 벌어졌다고 볼 수 있을까요? 누가 이 방향에 몇 년 또는 10년 이상 계속 투자하여 사용자의 요구 사항을 점점 더 충족시키고 시나리오를 충족하며 효율성 향상 또는 비용 절감 요구 사항을 충족할 수 있습니까?서로 다른 모델 간의 격차는 점점 작아지는 것이 아니라 점점 더 커질 것입니다. 그러나 실제 요구 사항을 모르면 테스트 세트 질문만 하면 거의 충분하다고 느낄 수 있습니다.

소위 말하는 선두12개월, 18개월 뒤는 그다지 중요하지 않다고 생각합니다. 우리 회사는 모두 완전히 경쟁적인 시장 환경에 있습니다. 어떤 방향을 택하든 경쟁업체는 많이 있을 것입니다. 항상 경쟁사보다 12~18개월 앞서 있다고 확신할 수 있다면 무적이 될 것입니다. 12~18명의 사람들이 당신 앞에 있다고 생각하면 한 달은 매우 짧은 시간입니다.항상 경쟁사보다 앞서 있다고 보장할 수 있다고 하더라도6개월 후 승리, 귀하의 시장 점유율은70%, 상대방은 20% 또는 10%만 공유할 수 있습니다.



q: 오픈소스 모델이 클로즈드 소스 모델과의 격차를 좁히고 있다고 말하는 사람들도 있는데, 이것이 대형 클로즈드 소스 모델 기업의 비즈니스 모델을 무너뜨리게 될까요?

로빈 리:이 질문은 이전 질문과 관련이 깊습니다. 성능이나 효과 외에도 모델은 효율성 측면에서도 효율적이어야 한다고 말씀드렸습니다. 오픈 소스 모델은 좋지 않습니다. 정확하게 말하면, 비공개 소스 모델을 비즈니스 모델이라고 불러야 합니다. 상용 모델은 수많은 사용자나 고객이 동일한 자원을 공유하고 r&d 비용, 기계 자원, 추론 자원을 공유하는 모델입니다.gpu와 오픈 소스 모델에서는 일련의 항목을 직접 배포해야 합니다. 배포 후 gpu의 사용률은 얼마나 됩니까? 우리의wenxin 대형 모델3.54.0에 관계없이 사용률이 90%가 넘습니다. 귀하가 배포하는 오픈 소스 모델을 사용하는 사람은 몇 명입니까? 우리는 wenxin 모델이 하루에 6억 번 ​​이상 호출되고 매일 생성되는 토큰의 수가 1조를 초과한다고 대중에게 알립니다. 어떤 오픈 소스 모델이 하루에 호출 횟수와 생성되는 토큰 수를 알 수 있습니까? 아무도 사용하지 않으면 비용은 어떻게 분담되나요? 추론 비용을 상용 모델과 어떻게 비교할 수 있나요?



빅 모델 시대 이전에는 모두가 무료, 저렴한 비용을 의미하는 오픈 소스에 익숙했습니다. 당시 시중에 나와 있는 상용 제품은 컴퓨터 설치물을 구입하는 등 버전별로 비용을 지불해야 했습니다.windows, microsoft는 많은 비용을 청구해야 할 수도 있지만 linux를 실행하면 이 돈을 쓸 필요가 없습니다. 리눅스는 오픈소스이기 때문에 모든 프로그래머가 코드를 볼 수 있고, 뭔가 잘 안되면 업데이트하면 되고, 업데이트 후에는 체크인하면 됩니다. 거인의. 그러나 대형 모델 시대에는 이러한 것들이 사실이 아니다. 대형 모델 시대에는 gpu가 얼마나 비싼지 이야기하는 경우가 많으며, 컴퓨팅 성능은 대형 모델의 성패를 결정하는 핵심 요소이다.오픈 소스 모델이 컴퓨팅 성능을 제공합니까? 컴퓨팅 성능을 제공하지 않는다면 어떻게 효율적으로 사용할 수 있습니까? 오픈 소스 모델은 이 문제를 해결할 수 없습니다.



과거에는 컴퓨터를 구입할 때 이미 컴퓨팅 성능에 대한 비용을 지불했지만 대규모 모델 추론의 경우에는 그렇지 않습니다. 이 추론은 실제로 매우 비쌉니다. 따라서 오픈 소스 대형 모델의 가치는 교육 및 연구 분야에 있습니다. 대형 모델이 어떻게 작동하는지 이해하고 싶다면 소스 코드를 모르면 분명히 단점이 있을 것입니다. 분야에서 효율성, 효과를 추구할 때, 최저 비용을 추구할 때 오픈 소스 모델은 이점이 없습니다.



묻다:ai 애플리케이션은 어떻게 진화할 것인가? 왜 지능을 강조하는가?

로빈 리: 대형 모델의 개발 과정은 처음에는 사람들의 도움을 받고, 최종적으로 무언가가 나오면 최종 점검을 거쳐야 효과가 있다고 확신합니다.좋습니다. 모든 측면에서 좋을 경우에만 출시됩니다. 이것은 copilot 단계이고 더 아래에는 agent 정보가 있습니다. 가장 중요한 것은 agent에 대한 정의가 다양하다는 것입니다. 자율성, 도구 사용, 반성, 자기 진화 등의 능력을 갖추고, 이 정도의 자동화가 더 진행되면 다양한 정신적, 육체적 작업을 수행할 수 있는 소위 알 워커(al worker)가 될 것입니다. 인간으로서 모든 업무를 독립적으로 완료할 수 있습니다. 그런 과정이 있어야 합니다.



"지능형 에이전트가 대형 모델의 가장 중요한 개발 방향"이라는 판단은 실제로는 합의되지 않은 것입니다. baidu create 컨퍼런스에서 우리는 agentbuilder, appbuilder, modelbuilder라는 세 가지 제품을 출시했습니다. agentbuilder와 appbuilder는 둘 다 에이전트에 관한 것이며 다른 하나는 더 강력한 기능을 가지고 있습니다. 우리가 설명한 후에 일부 사람들은 마침내 이것이 정말 흥미롭고 가치를 생산할 수 있으며 모든 사람이 사용할 수 있다고 느끼는 상대적으로 낮은 임계값으로 만들 수 있다는 것을 이해하기 시작했습니다. 이후 지능형 에이전트의 인기가 점차 높아지면서 많은 사람들이 지능형 에이전트의 개발 방향에 대해 낙관하기 시작했습니다.하지만 현재 바이두처럼 지능을 대형 모델의 가장 중요한 전략이자 가장 중요한 발전 방향으로 여기는 기업은 많지 않다.



왜 우리는 대리인을 그토록 강조하는가? 지능형 에이전트에 대한 임계값은 실제로 매우 낮기 때문에 작년에 우리는 애플리케이션을 출시해야 하며 모든 사람이 애플리케이션을 만들어야 한다고 말했습니다. 실제로 많은 사람들이 이를 수행하는 방법을 모른다고 말합니다. 이 방향이 이루어질 수 있는지 여부 어떤 능력을 사용해야 합니까? 이 시나리오에서 가치를 창출할 수 있는지 여부는 수많은 불확실성이 있으며 모두가 모델에서 응용 프로그램으로 이동하는 방법을 모릅니다.그러나 에이전트는 매우 직접적이고 매우 효율적이며 매우 간단한 방법을 제공합니다. 모델 위에 에이전트를 구축하는 것은 매우 편리합니다., 이것이 바로 wenxin 플랫폼에서 매주 수만 명의 새로운 에이전트가 생성되는 이유입니다.



에이전트 측면에서 우리는 이미 추세를 확인했으며 모델 자체의 강력한 기능 외에도 좋은 유통 채널도 갖추고 있습니다. 바이두의app, 특히 baidu 검색에는수십억 명의 사람들사용 중에 사용자는 자신의 요구 사항을 적극적으로 표현하며, 어떤 지능형 에이전트가 자신의 질문에 더 잘 답하고 요구 사항을 충족할 수 있는지는 자연스러운 매칭 프로세스이므로 이러한 개발자가 지능적으로 배포할 수 있도록 가장 잘 도울 수 있습니다.

보고/피드백