openai '스트로베리'는 1조 가치가 있나요?

2024-09-13

저자 | 왕징(wang jing) |

울트라맨과 마바오궈의 공통점은 무엇인가요? 대답: 그들은 모두 몰래 공격하는 것을 좋아합니다.

몇 달 전부터 '스트로베리' 소식이 떠돌고 있는데, 이는 openai 내부의 미스터리한 프로젝트로, 이전 세대 모델과는 사뭇 다른 모습이다. 하지만 openai는 이 사실을 비밀로 유지해 왔습니다. 가장 가까운 순간에 ceo인 sam altman이 소셜 미디어에 게시한 실제 딸기 사진이 있었습니다.

불과 며칠 전 '더 인포메이션'에서는 '스트로베리'가 앞으로 2주 안에 개봉한다는 소식을 전했다.

이러한 높은 관심에도 불구하고 openai는 여전히 세계를 놀라게 했습니다. 현지 시간으로 9월 12일 오후, 아무런 예고나 기자회견도 없이 openai가 갑자기 새로운 모델을 출시했습니다.

그러나 새 모델의 이름은 "딸기"만큼 맛있지는 않지만 매우 진지하고 의미가 있습니다. o1.

아시다시피 openai 모델은 2018년 gpt-1부터 올해 5월 gpt-4o까지 "gpt" 시리즈에서 반복되었습니다. 오늘 openai가 새로운 라인을 선보입니다.

openai는 o1을 발표한 공식 블로그 게시물에서 다음과 같이 말했습니다. "초기 모델로서는 chatgpt를 유용하게 만드는 기능이 아직 많지 않습니다...그러나 복잡한 추론 작업의 경우 이는 상당한 개선이며 ai 기능을 나타냅니다. 이를 고려하여 카운터를 다시 1로 재설정하고 이 시리즈의 이름을 openai o1로 지정했습니다.”

새 모델은 현재 chatgpt 유료 구독자와 일부 프로그래머에게만 공개되어 있으며 모델이 아직 성숙하지 않았음을 보여주기 위해 일시적으로 "o1-preview"라고 하며 미리보기는 미리보기를 의미합니다. 또한 openai는 소형 모델 버전인 o1-mini도 출시했습니다. o1-preview이든 o1-mini이든 현재는 주당 응답 수에 제한이 있습니다.

울트라맨 자신도 소셜 미디어에서 새로운 모델을 칭찬했습니다.

항상 chatgpt에 찬물을 붓는 것을 좋아하는 ai 학자 gary marcus는 openai의 움직임이 "익숙한 방법"이라고 농담했습니다. 데모를 발표하고 제한된 수의 사용자에게 공개하고 자금을 모으고 다시 수행하는 것입니다.

o1이 출시되는 순간 openai는 새로운 자금 조달을 진행하고 있었습니다. 블룸버그 최신 뉴스에 따르면 이번 자금 조달은 규모가 수백억 달러, 목표 가치가 1,500억 달러에 달하는 대규모 이벤트가 될 것이라고 합니다.

먼저 모델 자체를 살펴보겠습니다.

이전에 소문에 따르면 o1의 주요 초점은 "추론"입니다. '추리'의 핵심은 '생각'입니다.

사용자가 가장 직관적으로 느끼는 점은 o1-preview가 질문에 답하기까지 시간이 더 오래 걸린다는 것입니다.

o1-미리보기 모델에서 알파벳 목록은 chatgpt에 "오늘은 무슨 요일인가요?"라고 묻습니다. 질문이 전송된 후 chatgpt는 진행 중인 사고 단계를 하나씩 표시합니다. 즉, 날짜 질문에 대답하고, 지침을 검토하고, 현재 날짜를 이해하고, "8초 동안 생각하세요"라고 표시된 답변을 제공합니다.

반면 gpt-4o 모델에서는 chatgpt가 중간 단계를 표시하지 않고 3초 이내에 직접 답변을 제공합니다.

"이것은 강화 학습을 통해 훈련되고 복잡한 추론 작업을 수행하도록 설계된 새로운 대규모 오라클 모델입니다. o1은 질문에 답하기 전에 생각합니다. openai는 블로그 게시물에 썼습니다.

이번에 o1 모델이 출시되자 openai 관계자들은 기술적인 세부 사항을 거의 공개하지 않았으며, 그들이 거듭 강조한 것은 '사고 사슬'이었습니다.

openai에 따르면 o1은 인간이 어려운 질문에 답하기 전에 오랫동안 열심히 생각하는 것과 마찬가지로 문제를 해결하려고 할 때 사고 사슬을 사용합니다. 강화 학습을 통해 o1은 사고 체인을 개선하고 사용 전략을 최적화하는 방법을 배웠습니다. 자신의 실수를 인식하고 수정하며 복잡한 단계를 더 간단한 단계로 나누는 방법을 배울 수 있습니다. 현재 방법이 작동하지 않으면 다른 방법을 시도합니다.

"이 프로세스는 모델의 추론 기능을 크게 향상시킵니다."

그럼 o1의 능력은 얼마나 강한가요? openai가 공개한 여러 시연 영상 외에도 가장 설득력 있는 것은 테스트 결과다. openai는 o1이 여러 추론 중심 벤치마크에서 "인간 전문가와 비교할 수 있는 수준"의 성능을 발휘하며 이전 기술보다 뛰어난 성능을 발휘한다고 말합니다. 예를 들어 국제수학올림피아드(imo)에서는 기존 기술점수가 13%, o1점수가 83%에 달했다.

codeforces 프로그래밍 대회에서 o1은 89%라는 우수한 점수를 획득했습니다. openai는 o1을 기반으로 프로그래밍에 더 뛰어난 o1-ioi도 개발했는데, 그 결과 단번에 참가자의 93%를 넘어섰습니다.

openai가 특별히 "과시"하는 또 다른 테스트는 gpqa-다이아몬드입니다. 이는 화학, 물리학, 생물학 분야의 전문 지식을 평가하는 벤치마크 테스트입니다. openai는 박사학위를 보유한 전문가를 초청해 경쟁을 펼쳤고, "o1의 성과가 이들 인간 전문가를 능가했다"는 사실을 발견했습니다.

openai는 또한 o1이 시각적 인식 기능을 구현한 후 mmmu 테스트에서 78.2%를 획득해 "인간 전문가와 경쟁할 수 있는 최초의 모델이 됐다"고 밝혔습니다. 또한 o1은 57개 mmlu 하위 범주 중 54개에서 gpt-4o보다 성능이 뛰어납니다.

간단히 말해서, o1은 openai의 이전 모델보다 추론 능력에 더 많은 관심을 기울였으며, 특히 수학과 프로그래밍 능력이 향상되었습니다. 과장하자면 권투의 의사이자 발차기의 전문가와 같습니다. , 모형 착시 현상도 감소할 것으로 기대됩니다.

하지만 o1은 아직은 상대적으로 초기 단계에 머물러 있다. 울트라맨이 강조했듯이 “아직 결점과 한계가 있다”.

알파벳 목록의 얕은 시도에서만 o1-preview에서 오류가 발생했습니다. 예를 들어 "9.11과 9.9 중 어느 것이 더 큽니까?"라는 질문에 gpt-4o는 엉뚱한 대답을 했고, o1-preview도 "9.11이 정말 9.9보다 크다. 9.9(9.90)." 생각하는 데 15초가 걸렸다는 점은 말할 것도 없고 장황한 말 속에 유머의 힌트가 있습니다.

또한 o1-preview를 시도한 일부 사용자는 많은 상호 작용이 "추가로 10~20초를 기다릴 가치가 없다"고 말했으며 gpt-4o의 응답 속도를 선호한다고 밝혔습니다.

현재 o1-preview와 o1-mini는 유료 사용자에게 공개되어 있지만 그 수가 제한되어 있습니다. o1-preview에는 주당 30개의 메시지가 있고 o1-mini에는 주당 50개의 메시지가 있습니다.

다음 주부터 chatgpt의 기업 및 교육(edu) 사용자도 두 모델 모두에 액세스할 수 있습니다. 또한 openai는 향후 모든 사용자에게 o1-mini를 무료로 제공하고 싶다고 밝혔으나 구체적인 시기는 아직 발표되지 않았습니다.

openai가 모델을 출시할 때 '미리보기'와 유사한 접미사를 추가한 것은 이번이 처음입니다. 이전에는 gpt-4와 gpt-4o 모두 완전 모델을 직접 출시했습니다.

o1의 무시할 수 없는 특징 중 하나는 가격이 비싸다는 것입니다.

o1에 대한 개발자 액세스 비용은 매우 높습니다. api 측면에서 o1-preview는 모델에 의해 구문 분석된 입력 토큰 또는 텍스트 블록 100만 개당 15달러를 청구합니다. 이는 gpt-4o의 3배, 출력 토큰 100만 달러당 60달러입니다. , gpt-4o의 4배입니다.

the atlantic은 보고서에서 o1이 더 많은 시간을 필요로 하도록 특별히 설계되었으며, 이로 인해 필연적으로 더 많은 자원이 소비되고 aigc의 수익성이 어려워질 것이라고 분석했습니다.

글 서두에서 언급한 게리 마커스(gary marcus)는 인간 신경과학과 인공지능의 교차점에 있는 학자이자 뉴욕대학교 명예교수이자 ai 스타트업인 지오메트리 인텔리전스(geometric intelligence)의 창업자이자 ceo로 더욱 대중적인 역할을 하고 있다. "ai 세계의 가시"는 openai를 거듭 비판해왔다.

그의 견해로는 openai의 갑작스러운 o1-preview 출시는 선전 방법에 가깝습니다.

결국, openai는 중요한 자금 조달 라운드를 진행하고 있습니다. bloomberg의 최신 보고서에 따르면 openai는 투자자로부터 1,500억 달러의 가치로 65억 달러를 조달하기 위해 협상하고 있습니다. 회전 신용 형태의 은행.

"데모를 보내고 제한된 사용자에게 공개하고 돈을 모으고 반복하십시오." marcus는 openai의 "수단"을 요약합니다.

올해 7월 the information은 openai가 올해 최대 50억 달러의 손실을 입을 수 있다고 보도했습니다. 이 중 오픈ai의 올해 인건비는 약 15억 달러, ai 훈련 및 추론 비용은 최대 70억 달러, 연간 매출은 35억~45억 달러가 될 것으로 예상된다.

당시 the information은 이러한 속도로 돈이 소모되면 openai가 곧 자금을 조달해야 할 것이라고 예측했습니다. openai에 대한 마지막 중요한 자금 조달은 microsoft가 수백억 달러를 투자한 2023년 초였습니다.

openai가 핵심 노드에서 '미성숙한 제품'을 출시한 것은 이번이 처음이 아닙니다.

지난해 10월 오픈ai가 주식 매각을 추진한다는 소식이 전해진 바 있다. 당시 평가액은 860억 달러에 달하는 것으로 알려졌다. 하지만 다음 달, 오픈ai는 최고 경영진에 충격적인 변화를 겪었다. 알트만은 회사에서 쫓겨났지만 곧 ceo 자리로 복귀해 '궁전'에서 승리했다. 하지만 주식 매각 계획은 잠시 미뤄졌고, 11월 말까지 거래가 '정상적으로 재개됐다'는 소식은 나오지 않았다. 당시 이 문제에 정통한 관계자들은 비상 사태가 주식 판매에 영향을 미치고 회사 가치에 영향을 미칠 것이라고 직원들이 걱정했다고 말했습니다.

흥미롭게도 올해 2월 15일 openai가 갑자기 새로운 비디오 세대 모델인 sora를 발표했고, 이 데모는 외부 세계에 충격을 안겨주었습니다. new york times는 openai가 3일 만에 직원 주식 매각을 완료했으며 회사의 가치가 "예상대로" 800억 달러를 초과했다고 보도했습니다.

반년이 넘는 시간이 흘렀지만 소라는 대중에게 공개되지도 않았고 대규모 테스트를 추진하지도 않았습니다. 외부 세계에서는 sora가 실제로 운영을 지원할 만큼 컴퓨팅 성능이 충분하지 않다고 의심하기 시작했습니다. 시장 조사 기관인 factorial funds가 발표한 보고서에 따르면 sora를 배포하려면 720,000개의 nvidia h100 칩이 필요할 것이라고 합니다.

지난 9월 초 '대만경제일보'는 tsmc의 a16 옹스트롬 수준 칩이 이미 애플, 오픈ai 등 주요 고객사로부터 주문을 받았다고 보도했다. openai는 맞춤형 칩을 사용하여 sora의 비디오 생성 기능을 향상시킵니다. 이는 또한 소라가 이전에 컴퓨팅 파워 잼을 겪었음을 확인시켜 주는 것 같습니다.

이제 딸기 맛의 chatgpt가 출시되었으므로 아마도 곧 openai가 새로운 자금 조달을 성공적으로 완료했으며 1조 위안 이상의 가치를 지닌다는 소식을 보게 될 것입니다.

소식

openai '스트로베리'는 1조 가치가 있나요?

소개

내 연락처 정보