소식

"가장 강력한 기능과 저렴한 가격"! OpenAI, 소형 모델 경쟁에 돌입하기 위해 GPT-4o mini 출시

2024-07-19

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

OpenAI는 목요일 동부 시간으로 'GPT-4o mini'를 출시하며 '작지만 세련된' AI 모델 경쟁에 돌입했습니다. 이 새로운 모델을 '가장 강력하고 저렴한 모델'이라고 부르며 이미지, 비디오, 오디오를 통합할 계획이었습니다. 앞으로는 이 모델로.

GPT-3.5 Turbo 대비 60% 이상 저렴하며, 경쟁제품 대비 채팅 성능이 좋습니다.

회사는 GPT-4o mini가 목요일부터 ChatGPT 무료 사용자, ChatGPT Plus 및 Teams 가입자에게 제공되며 다음 주에 ChatGPT 기업 사용자에게도 제공될 것이라고 밝혔습니다. GPT-4o mini는 ChatGPT에서 이전 모델인 GPT-3.5 Turbo를 대체합니다. OpenAI는 GPT-4o mini의 가격이 입력 토큰 백만개당 15센트, 출력 토큰 백만개당 60센트로 GPT-3.5 Turbo보다 ​​60% 이상 저렴하다고 밝혔습니다.

회사는 또한 새로운 모델이 현재 채팅 선호도에서 GPT-4 모델을 능가하며 대규모 다중 작업 언어 이해(MMLU) 테스트에서 82%의 점수를 획득했다고 밝혔습니다. 언론 보도에 따르면 MMLU는 언어 모델 기능을 평가하는 데 사용되는 텍스트 지능 및 추론 벤치마크입니다. MMLU 점수가 높을수록 다양한 영역에서 언어에 대한 이해와 사용이 향상되어 실제 적용이 향상된다는 것을 의미합니다.

OpenAI 데이터에 따르면 GPT-4o 미니 모델은 82%로 다른 저가 경쟁사 2개보다 높은 점수를 기록했고, 구글의 제미니 플래시(Gemini Flash)는 77.9%, 앤트로픽(Anthropic)의 클로드 하이쿠(Claude Haiku)는 73.8%를 기록했다.

대형 모델 중 GPT-3.5는 이 테스트에서 70%를 기록했고 GPT-4o는 88.7%를 기록했으며 Google은 Gemini Ultra가 역대 최고 점수인 90%를 달성했다고 주장합니다.

분석에 따르면 더 작은 언어 모델은 실행하는 데 더 적은 컴퓨팅 성능이 필요하므로 리소스가 제한된 기업이 생성 AI를 배포하는 데 더 저렴한 옵션이 될 수 있습니다.

또한 이 새로운 경량 모델은 API에서 텍스트 및 시각적 기능도 지원하며 OpenAI는 곧 비디오 및 오디오와 같은 모든 다중 모드 입력 및 출력을 처리할 것이라고 밝혔습니다. 이러한 기능을 통해 이는 잠재적으로 여행 일정을 이해하고 권장 사항을 제시할 수 있는 보다 강력한 가상 비서처럼 작동할 수 있습니다. 그러나 이 모델은 현재 주로 간단한 작업에만 사용할 수 있습니다.

'작지만 세련된' AI 모델 경쟁 치열, OpenAI 드디어 본격 진출

언론 보도에 따르면 마이크로소프트가 지원하는 OpenAI의 가치는 800억 달러를 넘어섰습니다. 비록 생성 AI 시장에서 여전히 선두 위치를 차지하고 있지만 회사는 점점 더 치열해지는 경쟁 압박에 직면해 있습니다. OpenAI는 모델을 구축하고 교육하기 위해 프로세서와 인프라에 많은 돈을 지출하기 때문에 돈을 버는 방법도 찾아야 합니다.

그러나 많은 회사에서는 더 크고 더 비싼 모델을 감당할 수 없으므로 가볍고 저렴한 모델이 더 인기를 끌 수 있습니다. 그때까지 많은 개발자는 가장 강력한 모델을 실행하는 데 필요한 높은 계산 비용을 지불하는 대신 Claude 3 Haiku 또는 Gemini 1.5 Flash를 선택했습니다. 예를 들어, 작은 모델은 대용량의 기본 작업을 자동화하는 데 가장 적합할 수 있는 반면, 큰 모델은 더 복잡한 작업을 처리할 수 있습니다. 일부 개발자는 단일 애플리케이션에서 두 모델을 모두 사용하기를 원할 수도 있습니다.

OpenAI의 API 제품 책임자인 Olivier Godement는 언론과의 인터뷰에서 회사가 "작고 세련된" AI 모델을 더 일찍 출시하지 못한 이유를 설명했습니다. 그는 OpenAI가 더 크고 더 나은 것을 만드는 데 집중했기 때문에 이는 순전히 "우선순위"의 문제라고 말했습니다. GPT-4와 같은 모델에는 상당한 인적 자원과 계산 자원이 필요합니다. 시간이 지남에 따라 OpenAI는 개발자들이 점점 더 작은 모델을 사용하고 싶어한다는 것을 알아차렸고, 이제 회사는 GPT-4o Mini 개발에 리소스를 투자할 때라고 결정했습니다.

OpenAI의 API 제품 책임자인 Olivier Godement는 "우리의 임무는 가장 최첨단 기술을 만들고 가장 강력하고 유용한 애플리케이션을 구축하는 것입니다. 우리는 계속해서 최첨단 모델을 만들고 기술 발전을 촉진하기를 바랍니다"라고 말했습니다. 미디어. "하지만 우리는 또한 가장 좋은 작은 모델을 갖고 싶고 그것이 매우 인기가 있을 것이라고 생각합니다."

"GPT-4o Mini는 AI의 접근성을 높이려는 OpenAI의 사명을 실제로 구현한다고 생각합니다. AI가 전 세계 모든 산업, 모든 애플리케이션에 혜택을 주기를 원한다면 OpenAI의 API 플랫폼 제품 디렉터 Olivier를 더욱 저렴하게 만들어야 합니다." Godement는 언론에 말했다.

GPT-4o mini는 직원의 집중력을 돕습니다.

Godement는 일부 개발자가 지난 주에 이 모델을 시험해 왔다고 말했습니다.

OpenAI는 핀테크 스타트업 Ramp에게 GPT-4o Mini를 사용하여 영수증에서 비용 데이터를 추출하는 도구를 구축하는 모델 테스트를 요청했습니다. 따라서 사용자는 영수증 사진을 업로드할 수 있으며 모델은 이를 위해 데이터를 구성합니다. 이메일 클라이언트 Superhuman도 GPT-4o Mini를 테스트하고 이를 사용하여 이메일 답장을 자동으로 제안하는 기능을 만들었습니다.

처음에 GPT-4o mini는 텍스트와 이미지를 처리하고 생성할 수 있습니다. OpenAI는 최종 버전이 완성되면 다른 유형의 콘텐츠도 처리할 수 있을 것이라고 밝혔습니다.

OpenAI는 또한 GPT-4o mini가 새로운 보안 정책 "명령 계층"을 사용하는 회사 최초의 AI 모델이라고 밝혔습니다. 이 접근 방식의 목표는 AI 시스템이 회사의 지침과 같은 특정 지침의 우선 순위를 지정하여 사람들이 도구에서 수행해서는 안 되는 작업을 수행하기 어렵게 만드는 것입니다.

분석에서는 GPT-4o 미니 모델이 ChatGPT라는 하나의 도구에서 광범위한 AI 생성 미디어(예: 텍스트, 이미지, 오디오 및 비디오)를 제공하는 "다중 모드"에 대한 OpenAI의 약속의 일부라고 믿습니다.

작년에 OpenAI COO인 Brad Lightcap은 언론에 다음과 같이 말했습니다.

"세상은 다중 모드입니다. 인간으로서 세상을 처리하고 참여하는 방식을 생각해 보면 우리는 사물을 보고 듣고 말합니다. 세상은 단순한 텍스트가 아닙니다. 따라서 우리에게는 텍스트와 코드만 있습니다. 단일 양식, 단일 인터페이스는 항상 불완전하다고 느껴집니다. 왜냐하면 이러한 모델의 힘과 그 이상으로 할 수 있는 일이 많기 때문입니다.”