느리고 비싸나요? openai 추론모델 '스트로베리' 등장, gpt-5는 어디까지?

느리고 비싸나요? openai 추론 모델 '스트로베리' 등장, gpt-5는 어디까지?

2024-09-13

openai의 '스트로베리'가 드디어 출시되었습니다.

현지 시간으로 9월 12일, 거대 인공지능(ai) openai는 openai o1-preview와 o1-mini의 소형 버전을 포함하여 코드명 "strawberry"라는 ai 추론 모델 openai o1 시리즈를 출시했습니다.

openai에 따르면 o1은 인간처럼 반응하기 전에 문제에 대해 생각하는 데 더 많은 시간을 할애할 것입니다. 훈련을 통해 저는 사고 과정을 다듬고, 다양한 전략을 시도하고, 실수를 인식하는 방법을 배웠습니다. 이전의 과학, 코딩, 수학적 모델보다 복잡한 작업에 대해 추론하고 더 어려운 문제를 해결하세요.

openai는 이 모델 시리즈가 복잡한 추론 작업을 위한 주요 발전이라고 밝혔으므로 제품 카운터를 1로 재설정하고 이름을 openai o1로 지정했습니다. 이름의 "o"는 오리온을 의미할 수 있습니다.

더 강력한 추론 능력, 사고 체인은 모델 보안을 위한 새로운 기회를 제공합니다.

'스트로베리' 프로젝트는 이전에는 'q*'로 불렸는데, 이는 openai의 '법원 싸움'을 촉발하고 회사 ceo 샘 알트먼의 돌연 해임으로 이어진 이유다. 당시 openai 최고 기술 책임자인 mira murati는 직원들에게 q*(q-star로 발음) ai 혁신에 대한 편지가 이사회를 해고하게 만들었다고 소식통에 말했습니다.

q*에 대한 openai의 진전으로 인해 일부 회사 내부자는 이것이 "초지능(agi, 인공 일반 지능)"을 찾는 데 돌파구가 될 수 있다고 믿게 되었습니다.

공식 정보에 따르면 o1은 gpt-4o를 훨씬 능가하는 많은 기능을 보유하고 있습니다. codeforces에서 89위, 미국 수학 올림피아드(aime)에서 미국 내 상위 500명의 학생 중 하나로 선정되었으며 인간 박사 수준을 넘어섰습니다.

보고에 따르면 인간이 어려운 문제에 답하기 전에 오랜 시간 동안 생각하는 것과 유사하게 o1도 문제를 해결하려고 할 때 일련의 생각을 사용합니다. 강화 학습을 통해 o1은 사고 사슬을 연마하고 사용하는 전략을 개선하는 방법을 배울 수 있습니다. 실수를 인식하고 수정하고, 까다로운 단계를 더 간단한 단계로 나누고, 현재 단계가 작동하지 않을 때 다른 접근 방식을 시도하는 방법을 배웁니다.

openai는 사고 체인을 사용하면 모델의 사고를 명확한 방식으로 관찰할 수 있고 보안 규칙에 대한 모델의 추론이 비배포 시나리오에서 더욱 강력해지기 때문에 보안과 일관성을 크게 향상시킬 수 있다고 말했습니다.

sensetime의 회장 겸 ceo인 xu li는 이전에 미래에 모델이 스마트한지 여부는 전적으로 모델 사고 체인 데이터를 구성하는 방법론이 충분히 강력한지, 이 충분히 강력한 방법론이 지속 가능한지에 달려 있다고 말했습니다. 그리고 반복.

openai o1의 원래 완전한 사고 체인의 부분 스크린샷

그러나 openai는 궁극적으로 사용자에게 원래의 사고 사슬을 보여주지 않고 사고 사슬의 요약을 표시하기로 결정했습니다. openai는 추가로 다음과 같이 설명했습니다. "숨겨진 사고 체인은 모델을 모니터링할 수 있는 독특한 기회를 제공합니다. 모델을 충실히 읽을 수 있다고 가정하면 숨겨진 사고 체인을 통해 모델의 생각을 '읽고' 모델의 사고 과정을 이해할 수 있습니다. 예를 들어, 미래에는 그러나 이를 위해서는 모델이 자신의 생각을 변경되지 않은 형태로 자유롭게 표현할 수 있어야 하므로 사용자 선호도에 대한 정책 준수를 훈련할 수 없습니다. 사용자가 일관되지 않은 사고 사슬을 직접 보는 것을 원하지 않습니다.”

현재 chatgpt의 plus 및 team 사용자를 위해 두 가지 o1 모델을 사용할 수 있으며, 기업 및 교육 사용자는 다음 주부터 사용할 수 있습니다.

gpt-4o의 "후계자"는 아니지만 느리지만 더 비쌉니다.

현재 주간 메시지 제한은 o1-preview의 경우 30개, o1-mini의 경우 50개입니다. openai는 메시지 제한을 늘리고 chatgpt가 주어진 프롬프트에 따라 적절한 모드를 자동으로 선택할 수 있도록 열심히 노력하고 있으며 더 많은 사용자 수준으로 액세스를 확장하고 모든 무료 사용자에게 o1-mini 액세스를 제공할 계획이라고 밝혔습니다.

api(애플리케이션 프로그래밍 인터페이스) 측면에서 o1-preview는 입력 토큰 100만개당 15달러(대형 모델은 텍스트를 단어, 문자 집합 또는 단어와 구두점의 조합으로 나눕니다), 출력 토큰 100만개당 60달러를 청구합니다. gpt-4o와 비교하면 입력비용은 3배, 출력비용은 4배이다.

o1-mini는 포지셔닝이 더 빠르고 비용 효율성도 뛰어납니다. aime, codeforces 등의 평가 벤치마크에서도 o1과 거의 동등한 성능을 발휘합니다. o1-preview에 비해 속도 제한이 높고 대기 시간이 짧은 o1-mini는 api 사용자에게 o1-preview보다 80% 저렴합니다.

다른 단점도 분명합니다. openai o1은 다른 모델보다 느립니다. 외신 보도에 따르면 o1이 특정 질문에 답변하는 데 10초 이상이 걸릴 수 있으며 모델은 현재 실행 중인 하위 작업에 대한 레이블을 표시하여 진행 상황을 표시하도록 선택합니다.

동시에 생성 ai 모델의 예측 불가능성을 고려할 때 o1에는 다른 결함과 한계가 있을 수 있습니다. 예를 들어, 틱택토(tic-tac-toe) 게임에서는 때때로 실수가 발생할 수 있습니다. openai는 기술 문서에서 일부 테스터가 o1이 gpt-4o보다 환각에 더 취약하고 질문에 대한 답을 모를 때 인정하려 하지 않는다는 소문이 있었다고 말했습니다.

또한 o1은 현재 웹 검색이나 파일 분석을 할 수 없습니다.

altman은 o1이 현재 openai의 가장 강력하고 정렬된 모델 시리즈이지만 여전히 결함이 있음을 솔직하게 인정했습니다.

openai 회장 greg brockman은 또한 o1 기술은 아직 초기 단계이며 openai는 공격자에 대한 신뢰성, 환각 및 견고성(안정성)을 포함하여 적극적으로 탐색하고 있다고 말했습니다.

openai는 초기 모델인 openai o1에는 네트워크 정보 검색, 파일 및 사진 업로드 등 chatgpt를 유용하게 만드는 기능이 아직 많이 포함되어 있지 않다고 밝혔습니다. 많은 일반적인 경우에 대해 gpt-4o는 단기적으로 더 큰 기능을 갖게 됩니다. 정기적인 업데이트와 개선이 뒤따를 것이며 "이 새로운 모델을 현재 모델만큼 사용하기 쉽게 만들기 위한 작업이 아직 진행 중입니다."

openai는 openai o1이 gpt-4o의 '후계자'가 아니라는 점을 강조합니다. 4o는 o1 시리즈 이후에도 gpt 시리즈 모델을 계속 개발 및 출시할 계획입니다.

openai o1과 gpt-4o 간의 여러 벤치마크 비교

이전 외신 보도에 따르면 openai는 월 최대 2,000달러에 도달할 수 있는 '스트로베리' 대형 모델이나 차세대 플래그십 모델에 대해 더 높은 충전 기준 설정을 고려할 수 있다는 점을 언급할 가치가 있습니다. 비교를 위해 chatgpt plus의 현재 요금은 월 $20입니다.

격동하는 openai, gpt-5는 언제 등장할까?

외신 보도에 따르면 물라티는 현재 차세대 주력 모델인 gpt-5를 제작 중이며 이는 전작보다 훨씬 커질 것이라고 밝혔다. 회사는 여전히 규모가 인공 지능의 새로운 기능을 잠금 해제하는 데 도움이 될 것이라고 믿고 있지만, gpt-5에는 이번에 출시된 추론 기술도 포함될 가능성이 높습니다.

murati는 "스케일링 패러다임과 이 새로운 패러다임에는 두 가지 패러다임이 있습니다. 우리는 이들을 하나로 통합하고 싶습니다."라고 말했습니다.

gpt-5의 개발 경로는 쉽지 않습니다.

현지 시간으로 9월 11일, gpt-4o/gpt-5의 연구 리더이자 openai 버전 'her'의 기술 리더인 알렉시스 코노(alexis conneau)가 갑자기 사임을 발표했습니다. 앞서 openai 공동 창업자이자 수석 과학자인 ilya sutskever, 'super alignment' 팀장 jan leike, 공동 창업자 john schulman, chatgpt 대표 peter deng 등이 잇달아 사임했는데... 현재 창업자 11명 중 2명만 남았다. openai에 남아있습니다.

인력 혼란뿐 아니라 openai도 올해 50억 달러의 매출과 지출 격차에 직면한 것으로 밝혀졌습니다.

그러나 볼 수 있는 것은 openai가 이미 조치를 취하고 있다는 것입니다.

openai의 최근 계획은 약 65억 달러를 조달하여 이번 자금 조달의 가치를 1,500억 달러로 끌어올리는 것입니다. 지난달 말에는 openai가 벤처 캐피탈 회사인 thrive capital이 주도하는 10억 달러 규모의 새로운 자금 조달을 준비하고 있으며 microsoft, apple, nvidia가 투자에 참여할 가능성이 있는 것으로 밝혀졌습니다. 1000억 달러가 조금 넘는다.

현지 시간으로 8월 29일, openai는 chatgpt가 현재 주간 활성 사용자 수 2억 명 이상을 보유하고 있다고 밝혔습니다. 이는 지난 가을보다 두 배나 많은 수치입니다.

openai에 따르면 fortune 500대 기업 중 92%가 openai 제품을 사용하고 있으며 7월 chatgpt-4o mini 출시 이후 api 사용량이 두 배로 늘어났습니다.

더 페이퍼(the paper) 기자 친셩(qin sheng)

(이 기사는 the paper에서 발췌한 것입니다. 더 많은 원본 정보를 보려면 “the paper” 앱을 다운로드하세요.)

보고/피드백

소식

느리고 비싸나요? openai 추론 모델 '스트로베리' 등장, gpt-5는 어디까지?

소개

내 연락처 정보