소식

robin li의 내부 연설 노출: 오픈 소스 모델은 효율적이지 않으며 컴퓨팅 성능 문제를 해결할 수 없습니다

2024-09-11

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

"외부에서는 대형 모델에 대한 오해가 꽤 많다." 최근 로빈 리의 내부 연설이 폭로됐다. robin li는 앞으로 대형 모델 간의 격차가 더 벌어질 수 있다고 믿습니다. 그는 또한 대형 모델의 "한계"가 매우 높으며 여전히 이상적인 상황과는 거리가 멀다고 설명했습니다. 따라서 모델은 계속해서 빠르게 반복, 업데이트 및 업그레이드해야 하며 여러 가지에 대해 매일 투자할 수 있어야 합니다. 수년 또는 10년 이상 지속적으로 사용자 요구를 충족하고 비용을 절감하며 효율성을 높입니다.

"대형 모델의 성능에는 장벽이 없다"는 업계의 주장에 대해 로빈 리는 "신모델이 나올 때마다 gpt-4o와 비교해야 한다"며 "내 점수는 거의 1위"라고 말했다. 마찬가지로, 일부 개별 항목의 점수도 이를 초과했지만, 그렇다고 최신 모델과의 격차가 없다는 의미는 아닙니다.”

자신을 증명하기 위해 많은 모델들이 출시된 뒤 순위에 오르고, 그 순위를 통해 모델들의 역량이 매우 근접할 수도 있다고 말했다. 애플리케이션의 강점은 여전히 ​​​​명백한 격차가 있습니다.”

robin li는 모델 간의 격차가 다차원적이라고 지적했습니다. 업계에서는 종종 이해력, 생성력, 논리력, 기억력 및 기타 능력의 차이에 더 많은 관심을 기울이지만 비용 및 추론 속도와 같은 측면을 무시합니다. 일부 모델은 동일한 효과를 얻을 수 있지만 여전히 고급 모델보다 열등합니다. 비용이 높고 추론 속도가 느립니다.

로빈 리 역시 “대형 모델 시대 이전에는 모두가 무료, 저비용을 의미하는 오픈소스에 익숙했다”고 말했다. 그는 예를 들어 오픈 소스 linux를 사용하면 이미 컴퓨터가 있으므로 linux를 사용하는 것은 무료라고 설명했습니다. 하지만 대형 모델 시대에는 그렇지 않습니다. 대형 모델 추론은 비용이 많이 들고, 오픈 소스 모델은 컴퓨팅 성능을 직접 구입해야 하기 때문에 컴퓨팅 성능을 효율적으로 활용할 수 없습니다.

그는 “오픈소스 모델은 효율성 측면에서 효율적이지 않다”며 “클로즈드소스 모델은 엄밀히 말하면 비즈니스 모델이라고 불러야 한다”며 “수많은 사용자가 r&d 비용과 추론에 사용되는 머신 리소스, gpu를 공유할 수 있게 된다”고 말했다. .gpu의 사용 효율성이 가장 높습니다. baidu 기사 xinda 모델 3.5 및 4.0의 gpu 사용률은 90% 이상에 도달했습니다.

robin li는 교육 및 과학 연구와 같은 분야에서는 오픈 소스 모델이 가치가 있지만, 효율성, 효율성 및 최저 비용을 추구하는 상업 분야에서는 오픈 소스 모델이 이점이 없다고 분석했습니다.

대규모 모델 적용 수준에서 robin li는 copilot이 먼저 사람을 지원하고, 그 다음에는 어느 정도 자율성을 갖고 독립적으로 도구를 사용하고, 반영하고, 스스로 발전할 수 있는 agent intelligence가 나타날 것이라고 믿습니다. 자동화가 발전하면 ai worker가 되어 모든 업무를 독립적으로 완료할 수 있게 됩니다.

그는 또 “지능의 발전 방향에 대해 많은 사람들이 낙관하고 있지만, 현재로서는 지능이 합의된 것이 아니며, 지능을 가장 중요한 전략이자 대형 모델의 가장 중요한 발전 방향으로 여기는 바이두 같은 기업은 그렇지 않다”고 말했다. 많은".

robin li는 지능형 에이전트의 한계가 실제로 매우 낮다고 믿습니다. 많은 사람들이 대규모 모델을 애플리케이션으로 전환하는 방법을 모릅니다. 지능형 에이전트는 매우 직접적이고 효율적이며 간단한 방법입니다. 모델의.