소식

openai의 신비한 모델인 'strawberry'가 2주 후에 출시될 예정인 것으로 밝혀졌습니다. 질문에 답하는 데 10초 이상이 걸리며 구독료도 10배 이상 비쌀 수 있습니다.

2024-09-11

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

지난달 openai ceo 알트만(altman)은 딸기 사진으로 많은 헤드라인을 장식했습니다. 이제 딸기 모델은 실제로 "성숙"될 것입니다.

the information에 따르면 chatgpt 서비스의 일부로openai는 2주 안에 '스트로베리' 모델을 출시할 계획이다.

물론 최종 출시일이 변경될 수 있다는 내용도 보고서에 명시되어 있으니 주의해서 진행하시기 바랍니다.

믿을 수 있는 제보자 @apples_jimmy는 딸기 모델이 이번 주에 출시될 것으로 예상하고 있습니다.

그리고 그는 또한 openai가 10월에 gpt-4.x 버전, 즉 gpt-4.5라고 불리는 새로운 모델을 출시할 예정이라고 말했습니다.

더욱 강력한 gpt-5 모델에 관해서는 이르면 12월에 출시될 수 있다고 들었지만, 안전을 위해 2025년 1분기나 2분기에 출시될 것으로 예상하는 것이 좋습니다.

정보에 따르면 딸기 모델이 어떤 형태로 출시될지는 불투명하다고 한다.한 가지 가능성은 딸기 모델이 독립형 제품이 될 것이라는 점입니다.

또 다른 가능성은 딸기 모델이다.chatgpt 모델 선택 메뉴에 통합됩니다., 사용자는 마음대로 다른 모델 서비스 간에 전환할 수 있습니다.

이전 보고서에서도 딸기 모델과 다른 모델의 가장 큰 차이점은 다음과 같다고 언급했습니다.질문에 답하기 전에 "생각"하는 방법을 알고 있습니다.

더욱이 딸기 모델은 수학과 프로그래밍 분야에서 좋은 성능을 발휘할 뿐만 아니라, "사고" 시간을 더 많이 주면 제품 마케팅 전략과 같은 주관적인 주제에 대한 고객 질문에 답할 수도 있습니다.

정보에는 다음과 같은 내용이 나와 있습니다.딸기 모델의 사고 시간은 보통 10~20초 정도 지속되는데, 이는 오류를 줄이는 데 도움이 되는 장점이 있다.

그리고 딸기 모델은 생각하는 데 더 많은 시간을 소비하기 때문에 사용자의 요구 사항을 완전히 이해하기 위해 고객에게 더 많은 질문을 해야 할 때를 깨닫게 됩니다.

또한, 스트로베리 모델은 gpt-4o 모델과도 일부 차이점이 있습니다. 예를 들어 원래 버전은gpt-4o의 다중 모델 기능이 없습니다., 텍스트 답장을 받고 생성할 수만 있고 이미지를 처리할 수는 없습니다.

경쟁사에서도 유사한 제품이 출시되고 있기 때문에 이 제품이 일부 측면(이미지 처리가 불가능한 등)에서 완벽하지 않더라도 openai는 출시 속도를 높일 수 있을 뿐입니다.

이와 관련하여 내부고발자 @apples_jimmy도 다음과 같이 언급했습니다. anthropic과 google도 비밀리에 새로운 모델을 준비하고 있으며,그리고 미국 선거 즈음에 이를 출시할 계획입니다.

게다가 구독료는 계속해서 사용자의 감정을 자극했습니다.

chatgpt는 새로운 유료 계층인 chatgpt pro를 출시했으며 이미 일부 사용자에게 푸시했습니다.가격: $200/월, 현재 월 20달러보다 10배 더 비쌉니다.

사실이라면 이는 위에서 언급한 딸기 모델에 대한 보고서와 동일할 수도 있습니다.

정보는 또한 딸기 모델이 chatgpt plus처럼 사용자가 시간당 사용할 수 있는 횟수가 제한될 수 있는 반면, 구독 가격이 더 높은 모델은 더 반응이 좋을 것이라고 지적했습니다.

보도 시간 현재 openai는 이 문제에 대해 응답하지 않았습니다.

층층이 "딸기"를 자릅니다.

openai의 “딸기” 모델은 우리에게 무엇을 의미합니까?

실제로 스트로베리 모델의 전신은 지난해 말 화제를 모았던 의문의 존재 'q*'다.

지난해 11월, 샘 알트먼(sam altman)은 예고도 없이 이사회에서 해임 통보를 받아 회사 전체는 물론 업계 전체에 충격을 안겼다.

당시 이사회는 안전과 위험 관리에 관해 팀과 합의에 이르지 못했다는 이유를 들었다. 그리고 이 리스크는 당시의 극비 프로젝트 "q*"와 관련이 있었습니다.

이 프로젝트는 원래 ilya sutskever가 이끌었습니다. 이제 그는 openai를 떠나 ai 보안과 관련된 사업을 시작했습니다. 머스크가 한때 이 프로젝트가 "인류에 위협이 된다"고 말한 것을 고려하면 여기서 무슨 일이 일어나고 있는지 궁금하지 않을 수 없습니다.

이전에도 the information과 reuters는 내부 정보를 얻기 위해 최선을 다했지만 결국 확인만 할 수 있었습니다.수학적 연산 능력이 "q*"의 핵심입니다.

사진 출처: 로이터

빅 모델은 '문학'에 능숙하며 언어와 텍스트를 능숙하게 처리할 수 있으며 기본적으로 인간과 동등합니다. 하지만 수학 연산이 그다지 좋은 적은 없었습니다. 로이터 통신에 따르면 "q*"는 한때 openai에 큰 변화를 촉발했지만 당시 성능은 초등학생 정도의 컴퓨팅 수준이었습니다.

현재 알려진 최신 정보에 따르면 openai 내에는 이미 수학 연산에서 90%의 정확도를 달성할 수 있는 프로젝트가 있으며 이는 놀라운 개선입니다.

사진 출처: 로이터

강조하자면, "strawberry"가 어떤 단계를 달성했는지 확인하는 것은 현재 불가능합니다.

'스트로베리'가 'q*'의 업그레이드 버전으로 활용된다면 수학과 컴퓨팅 분야에서 계속해서 돌파구를 모색하는 프로젝트가 될 가능성이 높다고 할 수밖에 없다.

'수학적 계산'과 '추론'의 관계는 직접적으로 동일시할 수는 없지만 openai의 야망을 드러냅니다.

나는 항상 추론에 대해 이야기하는데, 정확히 무엇을 말하는 것입니까?

그렇다면 "추론"이란 정확히 무엇입니까?

이 두 단어는 실제로는 매우 광범위한 정의를 갖고 있음이 분명합니다. 올해 초 홍콩중문대학교가 이끄는 팀은 모델 기반 추론 기능에 대한 포괄적인 검토를 수행했습니다. "추론"의 가장 기본적인 정의는 세 가지입니다.

인지적 추론: 불완전하고 일관성 없는 지식으로부터 의미 있는 결론을 도출하는 능력

이러한 추론의 가장 일반적인 형태는 직소 퍼즐을 맞추는 것입니다. 각각의 작은 조각은 거대한 그림의 모서리입니다. 두 조각을 무작위로 잡으면 절대 일치하지 않습니다.

이 작은 조각들을 붙잡고 엮어서 천천히 완성된 그림을 형성하면 됩니다. 이 과정에는 지침이나 단계 다이어그램이 없으며 느낌과 직관에 의존해야 하는 경우가 많습니다.

논리적 추론: 전제와 이들 전제 간의 관계를 바탕으로 질서정연하게 결론을 도출하며, 그 결론은 암묵적 관계를 갖거나 논리적으로 확립되어 있음

수학 문제 해결에는 알려진 조건과 질문이 있으며 이를 바탕으로 단계별로 결과를 계산할 수 있습니다. 논리적 추론은 현재 대규모 모델 개발에서 "가장 단단한 뼈대"입니다.

자연어 추론: 이는 명시적 또는 암묵적 지식일 수 있는 여러 유형의 지식을 통합하여 세상에 대한 새로운 결론을 도출하는 프로세스입니다.

추리소설이나 추리소설을 좋아하는 친구들이라면 이해하기 쉬울 것입니다. 이런 추론은 마치 살인 이야기를 접하는 것과 같습니다. 책 속에는 모호한 힌트도 있고, 불분명한 정보도 있어서 살인자가 누구인지, 범죄 과정이 어떠했는지 추론해야 합니다.

로이터가 입수한 openai 내부 문서만 보면 '스트로베리'의 목표는 인터넷에 접속해 심층적인 연구를 기획하고 수행하는 것이다.

이는 자연어 추론의 마지막 형태에 가깝고, 이를 강화한 것에 지나지 않습니다. 추론 능력의 향상이라고 보기는 어렵습니다.

하지만,openai는 '추론'에 있어서 그렇게 경직되지 않고 더 큰 비전을 가지고 있습니다.

두 달 전, openai 창립자 중 한 명인 john schulman은 dwarkensh 팟캐스트에서 gpt-4의 발전은 주로 사후 훈련 기술에 기인한다고 말했습니다.

john schulman은 “사후 교육을 통해 사람들이 관심을 갖는 기능을 갖춘 모델을 만드는 것은 매우 복잡합니다. 이를 위해서는 많은 투자와 많은 r&d 작업의 축적이 필요하므로 특정 분야에 장벽이 됩니다. 정도. "

존 슐먼(john schulman)은 '추론'에 대해 다음과 같이 정의했습니다.

"추론이란 어떤 계산이 필요하거나 어떤 추론이 필요하다는 뜻이다. 이 정의에서 보면 작업을 처리하면서 계산과 단계별 계산을 할 수 있어야 한다."

그의 정의에서 추론과 계산 행동은 밀접하게 연관되어 있음을 알 수 있으며, 그는 기계 추론이 실시간으로 수행될 수 있기를 희망합니다. 인간과 마찬가지로 정보를 수신하면서 분석하고 해석할 수 있습니다.

그러나 수학에 능숙하지 않더라도 논리적으로 생각하는 데 방해가 되지 않으며 여전히 다양한 유형의 추론을 완료할 수 있습니다. 기계의 수학적 능력이 왜 그렇게 중요한가요?

다음과 같이 이해될 수 있습니다.수학은 단순히 연산을 수행하는 것이 아니라 정보를 표현하는 방법이기도 합니다.

수학은 1은 1이고 0은 0인 상징적 형식과 의미의 정확성에 더 의존하는 언어입니다. 정보를 표현하기 위해 계산 기호와 방정식을 사용할 때 실제로는 자연어보다 차원이 낮습니다.

즉, 대형 모델이 "문학적"인 이유는 "계산"을 기반으로 자연어를 컴퓨터 언어로 변환하기 때문입니다.

이 점은 역사상 가장 중요한 수학자 중 한 명인 george boole(부울 변수를 만든 동일한 boole)에 의해 19세기 초에 제시되었습니다.

조지 불

불은 수학적 추론을 통해 신의 존재를 설명하기까지 한 종교심이 깊은 사람이었습니다.

그의 최종 결론이 무엇이었든, 그가 궁극적으로 세상에 남긴 부, 즉 "사고의 법칙 탐구"라는 책은 처음에 그의 원대한 목표, 즉 미적분학의 상징적 언어를 사용하여 개념을 표현하는 것을 설명합니다. 1. 사고 활동의 기본 법칙.

이는 또한 수학 연산에서 ai의 성능과 관련하여 사람들의 기대가 좀 더 불안한 이유를 설명합니다.

일단 수학적 언어를 돌파하면 사고 활동의 돌파에 거의 가까워질 수 있습니다.

openai 기술 베테랑들이 또 사임했다

openai의 기술 관계자에 대한 큰 뉴스가 나올 때마다 항상 급격한 인사 변화가 동반되는 것 같습니다.

공교롭게도 openai 내부 직원 여러 명이 오늘 공식적으로 사임을 발표했습니다.

예를 들어, openai 오디오 agi의 전 연구 이사였던 alexis conneau는 다른 자격으로 gpt-4o 연구팀의 중요한 기술 구성원으로 사업을 시작하기 위해 떠날 것이라고 발표했습니다.

gpt-4o가 출시되기 전에 그는 이것이 인간-컴퓨터 상호 작용의 새로운 시대를 열 것이라고 흥분하게 예측했습니다.

그는 구글, 메타 등 대기업에서 폭넓은 업무 경험을 쌓은 뒤 2023년 4월 openai에 합류했습니다. 그의 말에 따르면, 주요 임무는 gpt 모델에 "말하는 입"을 갖추는 것입니다.

gpt-4o의 연구팀장인 prafulla dhariwal은 한때 conneau를 칭찬했습니다.

alexis conneau는 openai의 누구보다 먼저 her에 대한 비전을 제시하고 이를 실행하기 위해 끊임없이 노력했습니다!

또는 openai에서 4년 반 동안 근무한 arvind neelakantan도 오늘 '적 진영'인 meta ai 연구팀으로 전환했습니다.

그는 embeddings, gpt-3 및 gpt-4, api 및 chatgpt 등 openai의 많은 중요한 프로젝트 개발에 참여했습니다.

neelakantan은 openai에서 일하는 것이 그의 경력의 하이라이트라고 말했습니다. meta ai에서는 차세대 llama 모델 개발에 집중할 예정입니다.

이와 관련해 전 오픈ai 개발자 관계 이사인 로건 킬패트릭도 사임 축복을 전했다.

올해 초부터 openai는 사퇴의 물결을 일으켰고, 창립팀은 심지어 '해산'되기도 했다.

전 최고과학자인 ilya sutskever가 방금 openai에서 탈퇴를 선언했고, rlhf의 발명가 중 한 명인 jan leike도 그의 뒤를 이어 떠났습니다.

하차 이유는 기본적으로 다르다. 지난해 '궁전' 여파를 제외하면 개인적인 진로 계획 때문일 수도 있다.

openai의 급격한 인사 변화는 단기적으로 ai 경쟁 환경에 영향을 미칠 가능성이 낮습니다. 동시에 경기 침체 속에서 미성숙한 ai 산업은 더 이상 1년이라는 시간을 견딜 수 없습니다.

모델뉴스가 지속적으로 노출되면서 하반기에는 다시 ai 내비게이션의 화려한 시대가 열릴 것으로 기대된다.

아무리 나쁘더라도 적어도 상반기에 지루한 새로운 ai 기술보다 더 흥미로울 것입니다.

ai 기술의 기본 모델의 발전은 당시 gpt-4의 등장과 마찬가지로 전체 애플리케이션 측면의 폭발을 주도하는 강력한 원동력이 되어 우리에게 오랫동안 잊혀진 놀라움을 선사할 수 있을 것으로 예상됩니다.

그때쯤이면 사용자인 우리가 항상 가장 큰 수혜자가 될 것입니다.