소식

AI 스타 기업은 소형 모델과 경쟁해 가격이 급락하고 전기료도 절약돼 AI 대중화 속도가 빨라지고 있다.

2024-07-22

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


스마트한 것들(공개 계정:지드엑스컴
Meng Qiang이 편집함
편집자 윤펑

Venture Beat 보고서에 따르면 지난주 Hugging Face, Mistral AI 및 OpenAI는 7월 16일과 18일에 각각 소형 모델(SLM)을 출시하여 고급 자연어 처리 기능의 대중화를 약속했습니다. 과거에는 기술 회사들이 대규모 언어 모델 트랙에서 더 크고 복잡한 신경망을 추구하기 위해 경쟁해 왔습니다. Venture Beat는 이러한 작은 모델이 새로운 트랙을 열었으며 기업이 AI 솔루션을 사용하는 방식에도 영향을 미칠 수 있다고 믿습니다.

이름에서 알 수 있듯이 소형 모델은 LLM(대형 언어 모델)에 비해 일반적으로 매개 변수가 적고 컴퓨팅 리소스 요구 사항이 낮습니다. 종종 수천억 또는 심지어 수조에 달하는 매개변수를 갖는 대규모 언어 모델과 비교할 때, 세 가지 새로운 소형 모델인 SmolLM, Mistral NeMo 및 GPT-4o mini의 매개변수는 훈련에 따라 수억에서 수백억까지 다양할 수 있습니다. 볼륨이 큰 언어 모델보다 에너지 소비가 적습니다. 세 가지 모델은 AI를 대중화하기 위해 서로 다른 방법을 사용하지만 모두 더 많은 장치와 애플리케이션에 강력한 언어 처리 기능을 제공한다는 공통 목표를 가지고 있습니다.

1. 소형 모델이 엣지 컴퓨팅을 어떻게 변화시키는가

Venture Beat는 Hugging Face의 SmolLM이 세 가지 중 가장 혁신적이라고 믿습니다. 모바일 장치에서 실행되도록 특별히 설계되었으며 1억 3,500만, 3억 6,000만, 17억 개의 매개변수의 세 가지 사양을 갖추고 있어 엣지 장치에서 AI 처리를 촉진하고 데이터 개인 정보 보호 및 대기 시간의 주요 문제를 해결합니다.

SmolLM의 중요성은 효율성 향상 그 이상입니다. 에지 장치에서 AI 처리를 사용하도록 허용하면 낮은 대기 시간과 높은 개인 정보 보호를 기반으로 장치 애플리케이션을 실행할 수 있습니다. 과거에는 개인 정보 보호나 연결 문제로 인해 구현할 수 없었던 복잡한 AI 기능이 SmolLM을 통해 현실화될 수 있습니다.

또한 Mistral AI는 120억 개의 매개변수와 최대 128,000개의 컨텍스트 창을 갖춘 Mistral NeMo 모델을 출시했습니다. Mistral NeMo는 데스크톱 컴퓨터를 목표로 하며 대규모 클라우드 모델과 초소형 모바일 AI 사이에 위치합니다. 전자는 클라우드 컴퓨팅 플랫폼에서 훈련되고 실행되는 대규모 AI 모델인 반면, 후자는 제한된 리소스를 사용하는 모바일 장치입니다. 휴대폰) 및 웨어러블 기기 등).

Venture Beat는 Mistral NeMo의 컴퓨팅 방식이 기업 분야에 상당한 변화를 가져올 수 있다고 말했습니다. 이 모델은 소비자급 하드웨어를 활용하여 한때 거대 기술 기업과 충분한 자금을 지원받은 연구 기관의 전유물이었던 복잡한 AI 기능을 민주화할 수 있는 잠재력을 가지고 있습니다. 이는 고객 서비스 최적화, 보다 정교한 데이터 분석 도구 제공 등 다양한 산업에서 AI 기반 애플리케이션을 대중화하는 데 도움이 될 수 있습니다.

2. OpenAI의 효율적인 소형 모델 GPT-4o mini는 가격이 저렴합니다.

오픈AI도 시장에서 가장 가성비 좋은 소형 모델로 불리는 GPT-4o mini를 출시하며 소형 모델 경쟁에 동참했다. 입력 비용은 백만 토큰당 15센트, 출력 비용은 백만 토큰당 60센트에 불과합니다. Venture Beat는 GPT-4o mini가 AI 통합 자금 액세스를 크게 줄인다고 주장합니다.

그 외에도 GPT-4o mini의 가격 전략은 특히 스타트업과 중소기업 사이에서 AI 기반 혁신의 새로운 물결을 일으킬 수 있습니다. AI 통합 비용을 크게 줄임으로써 이 모델은 AI 기반 솔루션 채택에 대한 진입 장벽을 효과적으로 낮춥니다. Ventrue Beat는 이것이 여러 산업 분야에서 기술 혁신과 개혁을 가속화할 수 있다고 믿습니다. 또한 더 작은 모델로의 이러한 전환은 AI 커뮤니티의 새로운 추세를 반영합니다. 연구원과 개발자는 효율성, 접근성 및 틈새 애플리케이션에 점점 더 집중하고 있습니다. 이러한 추세는 특정 작업 및 산업에 최적화된 보다 표적화되고 효율적인 AI 솔루션으로 이어질 수 있습니다.

3. 소형 모델은 녹색 기술 혁신을 촉진하고 기술 탄소 배출량을 줄입니다.

더 작은 모델로의 전환은 AI가 환경에 미치는 영향에 대한 우려가 커지는 것과도 일치합니다. 소규모 모델 훈련 및 운영은 에너지를 덜 소비하므로 AI 기술의 탄소 배출량을 줄일 수 있습니다. 기술 기업들이 지속 가능성에 대한 압력이 증가함에 따라 Venture Beat는 소형 모델의 낮은 에너지 소비 및 낮은 배출량이 중요한 판매 포인트가 될 수 있다고 믿습니다.

더 작은 모델로의 전환이 환경에 미치는 영향은 엄청날 수 있습니다. AI가 널리 보급됨에 따라 보다 효율적인 모델의 확산으로 인한 에너지 절감 효과는 엄청날 수 있습니다. 이를 통해 AI는 지구 온난화에 계속 기여하기보다는 녹색 혁신에서 리더십 역할을 맡을 수 있습니다.

그러나 소형 모델의 부상에는 어려움이 따르지 않습니다. AI가 더욱 보편화되면서 편견, 책임, 윤리적 사용 문제가 더욱 시급해졌습니다. 규제되지 않은 채로 놔두면 소규모 모델을 통해 AI를 확산시키면 기존 편견이 증폭되거나 새로운 윤리적 딜레마가 발생할 수 있습니다. 소형 모델의 개발자와 사용자에게는 기술적 역량 외에도 윤리적 문제도 우선적으로 고려되어야 합니다.

결론: AI 개발의 미래는 다양화와 전문화에 있다

소규모 모델은 효율성과 일반화 가능성 측면에서 장점이 있지만, 매개변수 수의 제한으로 인해 많은 작업에서 처리 능력이 대규모 언어 모델의 처리 능력과 일치하지 않을 수 있습니다. Venture Beat는 이것이 미래 AI 개발 환경에 다양한 크기의 언어 모델이 있을 것이며, 더 작은 모델이 자신이 잘하는 특정 측면을 가질 것임을 보여준다고 말했습니다.

앞으로는 AI 모델의 개발이 번창할 것으로 예상됩니다. 그것이 큰 언어 모델이건 작은 모델이건, 모든 것에 적용되는 단일한 접근 방식은 바람직하지 않습니다. 성능 및 특정 애플리케이션 요구 사항. 기업과 기술 의사 결정권자에게 이 세 가지 작은 모델은 보다 효율적이고 전문적이며 배포 가능한 AI 솔루션으로의 전환을 나타내며 기업 환경에서 AI 통합을 위한 새로운 가능성을 제공합니다. 작은 모델이 현재 클라우드에서 큰 모델의 지배력을 대체할 수 있는지 여부에 대해서는 아직 결론을 내리기에는 너무 이릅니다.

출처: VentureBeat