11개 지표에서 GPT-4o를 이기세요! 360 게임을 통해 16개 대형 모델 회사가 힘을 합쳐 싸울 수 있게 되었습니다

11개 지표에서 GPT-4o를 이기세요! 360 게임을 통해 16개의 대형 모델 회사가 힘을 합쳐 싸울 수 있습니다.

2024-08-05

크레시는 아오페이 사원(Aofei Temple)에서 왔습니다.
Qubits 공개 계정 QbitAI

마지막으로 국내 대형 모델은 종합적인 성능 측면에서 GPT-4o와 경쟁할 수 있다.

12개 지표 테스트에서 이 모델은11개 항목이 GPT-4o를 넘어섰고, 전체적인 능력치가 10%포인트 높아졌다.。

더욱이 시 감상 등 중국적 특성을 지닌 분야에서는 그 장점이 더욱 뚜렷해진다."가장 어려운 중국 벤치마크" 정신지체 바도 획기적인 발전을 이루었습니다。

그러나 이는 대형 모델 제조사가 단독으로 노력한 결과가 아니다.16개 제조사로 구성된 '공동팀'。

팀의 창설자는 360입니다. 자체 참여 외에도 BAT를 포함한 주요 제조업체가바이두, 바이트댄스, 텐센트, 알리바바, 화웨이, 국내 대형 모델 "다섯 마리의 작은 호랑이",Zhipu AI, Dark Side of the Moon, MiniMax, Baichuan Intelligence, Zero One Thing, 5개의 헤드 로브 제조업체가 있으며,SenseTime, iFlytek, TAL, Huanquan 정량적, Wall-Facing Intelligence , 총 16개의 제조업체가 도착했습니다. (참고: 위 순위는 특별한 순서가 없습니다)

이제 이 "공동 팀"이 제품에 초대되었습니다.AI 비서모든 사용자는 무료로 사용할 수 있습니다.

10개 이상의 대형 모델을 작업할 수 있습니다.

AI 비서 중 16개 제조사의 대형 모델이 모여 동일한 플랫폼에서 직접 소통할 수 있다.원하는 것을 선택하세요。

그리고 중간쯤 지나서언제든지 모델을 전환할 수 있습니다., 시스템은 이전 컨텍스트를 기억하고 후속 모델이 계속해서 대화를 완료하도록 합니다.

예를 들어 아래 대화창에서 우리는 Zhipu 9.11과 9.8 중 어느 것이 더 큰지 물은 다음 모델을 Spark로 전환하고 어떻게 비교하는지 직접 물었습니다.

나중에 교체된 Xinghuo는 "비교하는 방법"이라는 네 단어가 소수점 크기의 비교에 대해 묻는 것임을 정확하게 이해했다는 것을 대화에서 볼 수 있습니다.

물론 동일한 문제에 대해 직접현장PK를 위한 타업체 모델 소환。

모델을 PK하는 동안 더 많은 정보나 답변을 볼 수 있으므로 답변이 더 상세해질 뿐만 아니라 교차 검증도 가능합니다.

예를 들어, 우리는 TV 시리즈 '옹정왕조'에 등장하는 두 인물의 관계에 대해 질문을 제기했는데, 이 질문은 지푸에게 처음 제기되었습니다.

그런 다음 Wen Xin Yiyan에게 더 많은 정보를 얻을 수 있는지 확인하기 위해 답변을 요청했습니다. 결과적으로 Zhipu의 답변이 정확했고 Wen Xin Yiyan은 더 자세한 보충 자료를 제공했습니다.

더 중요한 점은 360 AI 비서는 선택에 어려움을 겪거나 어떤 모델이 더 적합한지 모르는 사용자에게도 매우 친절하다는 점입니다.

"AI Assistant" 온톨로지를 대화 모델로 선택하면 시스템은 대화 내용을 기반으로 사용자의 의도를 결정한 다음 작업 유형에 따라 사용자의 의도를 결정합니다.가장 적합한 모델을 자동으로 매칭。

예를 들어 글쓰기 작업을 완료하면 AI 비서가 카피라이팅을 잘하는 빈백을 우리에게 배정해준다.

프로그래밍 문제가 발생하면 강력한 코딩 기능을 갖춘 DeepSeek이 호출됩니다.

주로 논리적 추론에 기초한 문제는 지혜 스펙트럼을 통해 답할 수 있습니다.

물론, 인터페이스에 표시되는 작업 분류는 상대적으로 일반적이며, 실제 작업 중에 AI 보조원도 작업을 보다 세밀하게 나누었습니다.

또한, 모델 선택과 동시에 AI 어시스턴트가 온라인 검색도 먼저 진행한다.

따라서 AI 어시스턴트를 사용하면 모델의 지식베이스 업데이트 시간을 걱정하지 않고도 최신 정보를 얻을 수 있다는 또 다른 이점이 있습니다.

몇 가지 일반적인 작업을 위해 AI 보조 플랫폼도 준비했습니다.전담 비서, 이러한 기능을 더 잘 실현할 수 있습니다.

웹페이지에서 활용되는 것 외에도 AI 비서데스크톱과 360 보안 브라우저라는 두 가지 주요 입구가 더 있습니다.。

예를 들어 360 Secure Browser에서는 AI 보조 플러그인을 설치한 후 웹 브라우징 시 오른쪽 하단에 떠다니는 공을 볼 수 있습니다.

클릭 한 번으로 오른쪽 사이드바에 AI 도우미를 소환할 수 있고, 글을 쓰면서 같은 창에서 AI와 빠르게 대화도 가능하다.

또한, 떠 있는 공 위에 마우스를 올리면 그 위에 새로운 버튼이 나타나며, 이를 클릭하면 한 번의 클릭으로 현재 탐색 중인 페이지를 요약할 수 있습니다.

페이지의 세부 사항에 대해 AI 도우미에게 질문할 수도 있습니다.

영어 내용 요약도 지원합니다.

또한 페이지 내 개별 단어나 문구를 선택하면 AI 도우미 툴바가 나타나 선택한 부분을 번역 및 설명하거나 온라인에서 더 관련성 높은 정보를 검색할 수 있다.

데스크탑측은 360 Security Guard를 기반으로 구현되어 있으며, 기능은 브라우저와 유사하지만, 워드호출의 범위가 웹페이지에서 시스템 전체로 확장되어 있습니다.

그렇다면 AI 비서 뒤에는 어떤 기술이 사용되는 걸까요?

독창적인 "전문가 협업" 구조

사실, 수요에 따라 대형 모델을 예약하는 이러한 방식은 우연히 360에서 출시된 신기술입니다——CoE(Collaboration-of-Experts), 전문가 협업 아키텍처。

개별 지표에서는 많은 국내 모델이 OpenAI와 동점이거나 심지어 능가하는 것으로 알고 있지만, 전반적인 강점 측면에서는 격차가 드러납니다.

360의 아이디어는이 "혼자 일하는" 모델을 변경하고 대형 모델 "전문가 클러스터"를 구축하여 하이브리드 대형 모델을 형성합니다., 각자가 자신의 강점을 활용하고 "합동 팀" 방식으로 GPT-4o와 싸울 수 있도록 합니다.

그 결과, 360CoE 아키텍처를 기반으로 국내 대형 모델 16종으로 구성된 하이브리드 대형 모델은 12개 지표 테스트에서 종합점수 80.49점을 획득해 GPT-4o의 69.22점을 넘어섰다.

그리고 코드를 제외한 나머지 11개 지표는 GPT-4o보다 우수합니다.

특히 '지연바', 시 감상 등 중국적 특성을 지닌 이슈에서는 CoE의 우위가 더욱 뚜렷해진다.

MoE(Mixture-of-Experts, 혼합 전문가) 아키텍처와 비교하여 360의 CoE 모델은속도, 인텔리전스 및 비용세 가지 수준 모두에서 상당한 이점이 있습니다.

CoE는 추론 자원 할당을 최적화하고, 효율성을 향상시키며, 의도 인식 및 작업 스케줄링을 통해 비용을 절감합니다.추론 비용이 90% 감소했습니다.。

CoE 아키텍처에서 가장 효율적인 방식으로 모델을 예약하려면 최소한 두 가지 작업 측면이 필수적입니다.

하나는이러한 모델의 기능에 대한 포괄적인 평가, 그래야만 각 모델이 잘하는 영역을 이해하고 모델에 어떤 작업을 할당해야 하는지 알 수 있습니다.

이를 위해 360은 전문가 데이터베이스에서 12개 분야의 모델 성능에 대한 종합적인 테스트를 진행해 모델 고유의 역량을 알아보았다.

△GPT-4o를 제외한 다른 모델명은 가려졌다

반면에 그것은사용자 의도 해석——작업 요구 사항에 대한 이해는 분명히 할당 모델에 없어서는 안될 기초입니다.

360은 지난 10년간 검색엔진 업계에서 축적된 기술과 데이터를 바탕으로 1억개 이상의 의도 분류를 식별할 수 있는 전용 모델을 학습시켰습니다.

AI를 더욱 포용적으로 만드세요

기술력 외에도 360은 어떻게 상황을 정리하고 15개 대형 모델 제조사를 '허브'로 만들 수 있는지 묻고 싶습니다.

360 Company의 창립자이자 회장인 Zhou Hongyi는 제조업체가 협력하는 출발점은 다음과 같다고 말했습니다.대형 모델에 대한 투자는 막대합니다. 이를 사용해야만 비용을 충당할 수 있고 제품을 지속적으로 개선할 수 있습니다.。

360은 많은 수의 사용자를 보유하고 있으며 데스크톱과 브라우저의 두 가지 스타 시나리오를 열 수 있어 이러한 모델에 대규모 사용자 그룹을 가져올 수 있습니다.

플러그인에 비해 이 두 입구를 통해 사용자는 대형 모델의 기능에 매우 근접할 수 있습니다. 오늘날 대형 모델에 대한 가장 큰 요구는 바로 사용자가 사용할 수 있도록 현장과 사용자에게 가까이 있어야 한다는 것입니다.

또한 통합 AI 비서는 단일 대형 모델의 단점을 피하고 서로의 장점을 활용하여 GPT-4o를 능가할 수 있습니다. 이를 통해 제조업체는 사용자에게 이를 사용할 수 있는 기회를 제공하며 향후 더 많은 시나리오가 출시될 예정입니다.

360 AI Assistant의 이 모델은 AGI가 등장하기 전의 모델 수준을 향상시키는 좋은 솔루션이자 AI 보급률을 높이는 데에도 도움이 된다고 할 수 있습니다.

최근 국내 대형 모델 제조사들이 공감대를 형성하고 개방화되기 시작하면서 보다 저렴한 Token API를 속속 제공하고 있습니다.

따라서 360을 데스크톱과 브라우저의 두 입구로 여는 것은 "전 세계의 인재를 모으기 위한 것"일 뿐만 아니라 개방성을 향한 이러한 일반적인 추세를 따르기 위한 것이기도 합니다.

더 높은 수준에 서서 여전히 360AI가 더 많은 사람들에게 도움이 되기를 바랍니다.。

Zhou Hongyi는 다음과 같이 믿습니다.AI가 사람을 없애는 것이 아니라, AI 사용법을 모르는 사람을 없애는 것입니다.; 그리고 그것을 사용하는 방법을 아는 사람들에게 AI는 강력한 도구가 될 것입니다.

하지만 동시에 AI 자체가 거만해서는 안 되며, AI를 배우려는 사람들에게 숙달될 수 있는 기회도 주어야 합니다.

이것이 360이 말하는 포용적 AI입니다. 모든 사람이 AI가 제공하는 기능을 누리고 AI 시대에 뒤처지지 않도록 하는 것입니다.

AI 보조 포털:
https://bot.360.com

소식

11개 지표에서 GPT-4o를 이기세요! 360 게임을 통해 16개의 대형 모델 회사가 힘을 합쳐 싸울 수 있습니다.

10개 이상의 대형 모델을 작업할 수 있습니다.

독창적인 "전문가 협업" 구조

AI를 더욱 포용적으로 만드세요

소개

내 연락처 정보