소식

OpenAI Strawberry의 계정이 실제로 지능형 에이전트라는 것이 밝혀졌습니다. 스탠포드 기반 스타트업의 AgentQ 과대 광고

2024-08-14

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

기계 심장 보고서

편집자: Du Wei, Jiaqi

과대 광고가 '엄청난 트래픽'을 창출하면 그 제품이 훌륭한지 아닌지에 대해 아무도 관심을 두지 않습니다.

최근 OpenAI의 비밀 프로젝트 'Q*'가 내부자들로부터 큰 관심을 받고 있습니다. 지난달에는 이를 기반으로 한 코드명 '스트로베리(Strawberry)'라는 프로젝트가 다시 공개됐다. 아마도 이 프로젝트는 고급 추론 기능을 제공할 수 있을 것입니다.

최근 이 프로젝트와 관련해 인터넷에는 '죽은 비둘기는 목숨을 걸지 못한다'는 루머가 여러 차례 돌았다. 특히 논스톱 활동을 펼치고 있는 '딸기형님' 계정은 기대감을 주기도 하지만 실망시키기도 한다.



뜻밖에도 이 샘 알트만이 등장하는 곳마다 그가 메시지를 게시한 '마케팅 계정'이 그의 피부 속 지능형 에이전트로 밝혀졌다.

오늘 AI 에이전트 스타트업 'MultiOn'의 창업자가 직접 나서서 다음과 같이 주장했습니다. OpenAI는 'Q*' 출시를 기다리지 않았지만 'Strawberry Brother' 계정을 제어하기 위해 코드를 발행했습니다.새로운 지능형 에이전트 Agent Q, 와서 온라인으로 우리와 함께 플레이하세요!



MultiOn의 공동 창립자이자 CEO인 Div Garg는 스탠포드에서 컴퓨터 과학 박사 과정을 공부하던 중 창업을 위해 공부를 잠시 쉬었습니다.

웨딩드레스를 직접 만드는 OpenAI의 이러한 마케팅 활동은 모두를 혼란스럽게 만드는 것 같습니다. 결국, 최근 OpenAI의 '빅 뉴스'를 기다리며 밤을 새운 사람들이 많습니다. 이는 샘 알트먼과 '스트로베리 형제'의 대화로 거슬러 올라간다. 샘 알트먼이 올린 딸기 사진 아래 그는 '스트로베리 형제'에게 "서프라이즈는 곧 올 것이다"라고 답했다.



하지만 '멀티온'의 창업자인 디브 가르그는 Q요원이 '스트로베리 형제'라고 주장하는 게시물을 조용히 삭제했다.

이번에 '멀티온(MultiOn)'이 출시한다고 밝혔습니다.Agent Q는 획기적인 AI 에이전트입니다.. 학습 방식은 MCTS(Monte Carlo Tree Search)와 자기비판을 결합한 것으로 DPO(Direct Preference Optimization)라는 알고리즘을 통해 인간의 피드백을 통해 학습한다.

동시에 계획 및 AI 자가 치유 기능을 갖춘 차세대 AI 에이전트인 Agent Q의 성능은 LLama 3 기준 제로 샘플 성능보다 3.4배 더 높습니다. 동시에 실제 시나리오 작업 평가에서는 Q 요원의 성공률이 95.4%에 달했습니다.



상담원 Q는 무엇을 할 수 있나요? 먼저 공식 데모를 살펴보겠습니다.

특정 시간에 특정 레스토랑의 좌석을 예약할 수 있습니다.



그런 다음 가용성 확인과 같은 웹 페이지 작업을 수행하십시오. 드디어 예약이 성공했습니다.



게다가 항공편 예약(예: 이번 토요일 뉴욕에서 샌프란시스코까지, 편도, 창가 좌석 및 이코노미 클래스).



하지만 네티즌들은 에이전트Q에 동조하지 않는 것 같습니다. 모두가 더 우려하는 것은 과연 '딸기형님' 계정을 이용해 홍보를 하고 있는 것인지에 대한 것이다.



웨딩드레스를 직접 만드는 OpenAI의 이러한 마케팅 활동은 모두를 혼란스럽게 만드는 것 같습니다. 결국, 최근 OpenAI의 '빅 뉴스'를 기다리며 밤을 새운 사람들이 많습니다. 이는 샘 알트먼과 '스트로베리 형제'의 대화로 거슬러 올라간다. 샘 알트먼이 올린 딸기 사진 아래 그는 '스트로베리 형제'에게 "서프라이즈는 곧 올 것이다"라고 답했다.



하지만 '멀티온'의 창업자인 디브 가르그는 Q요원이 '스트로베리 형제'라고 주장하는 게시물을 조용히 삭제했다.

이번에 '멀티온(MultiOn)'이 출시한다고 밝혔습니다.Agent Q는 획기적인 AI 에이전트입니다.. 학습 방식은 MCTS(Monte Carlo Tree Search)와 자기비판을 결합한 것으로 DPO(Direct Preference Optimization)라는 알고리즘을 통해 인간의 피드백을 통해 학습한다.

동시에 계획 및 AI 자가 치유 기능을 갖춘 차세대 AI 에이전트인 Agent Q의 성능은 LLama 3 기준 제로 샘플 성능보다 3.4배 더 높습니다. 동시에 실제 시나리오 작업 평가에서는 Q 요원의 성공률이 95.4%에 달했습니다.



상담원 Q는 무엇을 할 수 있나요? 먼저 공식 데모를 살펴보겠습니다.

특정 시간에 특정 레스토랑의 좌석을 예약할 수 있습니다.



그런 다음 가용성 확인과 같은 웹 페이지 작업을 수행하십시오. 드디어 예약이 성공했습니다.



게다가 항공편 예약(예: 이번 토요일 뉴욕에서 샌프란시스코까지, 편도, 창가 좌석 및 이코노미 클래스).



하지만 네티즌들은 에이전트Q에 동조하지 않는 것 같습니다. 모두가 더 우려하는 것은 과연 '딸기형님' 계정을 이용해 홍보를 하고 있는 것인지에 대한 것이다.