해석｜샤오양화: 박사급 수학적 능력을 갖춘 o1 모델은 어떤 영향을 미칠까?

2024-09-13

·전문가 수준의 추론 능력은 질의응답 전술이 아니라 탄탄한 사고력이 필요합니다. 대규모 모델 추론 능력을 훈련하는 데 어려운 점은 인간의 사고 과정이 다수 표현되지 않기 때문에 사고 과정에 대한 데이터가 극히 부족하다는 점이다. 이번에는 openai가 대량의 합성 데이터를 사용해야 한다고 추측했다.

·인공지능의 발전 속도를 따라잡기 위해 인간이 인공지능에 대한 이해를 높이는 것은 점점 더 어려워지고 있다. 인간의 인지 수준을 넘어서기 때문에 초능력을 활성화할 수 없는 때가 있을 가능성이 매우 높습니다.

openai가 출시한 새로운 모델 o1은 강력한 추론 능력을 갖추고 있습니다. 시각적인 중국 지도

현지 시간으로 9월 12일, openai는 차세대 모델 시리즈 o1을 출시했습니다. 이전 모델과 비교하여 이 모델은 물리학, 화학, 생물학 분야의 벤치마크 작업을 처리할 때 박사 과정 학생과 마찬가지로 강력한 추론 능력을 보여주었습니다. 이 기능은 이전 모델에는 없었던 기능입니다.

9월 13일 푸단대학교 컴퓨터과학기술대학원 교수이자 박사과정 지도교수이자 상하이 핵심 데이터과학연구소 소장인 샤오양화(xiao yanghua)는 더 페이퍼(the paper)와의 인터뷰에서 o1 모델의 출현이 의미하는 바는 다음과 같다고 말했습니다. 대형 모델의 추론 능력은 전문가 수준에 완전히 도달할 수 있으며, 이는 인공 지능의 획기적인 진전으로 간주될 수 있으며, 이는 기업 측의 모델 적용을 크게 향상시킬 것입니다.

그러나 그는 또한 모델의 지적, 지각적, 합리적 능력이 계속 향상되면서 인간의 능력을 능가할 것이라고 인정했다. 앞으로 인공지능이 인간에게 어떤 영향을 미칠지 예측하기는 어렵다. 이제 개발 속도는 인간이 이해하는 속도를 넘어섰고, 인공지능 거버넌스는 큰 도전이 될 것입니다."라고 xiao yanghua는 말했습니다.

복잡한 업무에 대한 추론 능력이 뛰어나며, 박사급 수준의 성과를 냅니다.

초기 모델인 새로운 추론 모델 o1은 네트워크 정보 검색, 파일 및 이미지 업로드 등 chatgpt에서 사용하는 기능을 아직 완전히 갖추고 있지 않습니다. 그러나 openai는 이것이 복잡한 추론 작업에 있어 상당한 개선이었으며 새로운 수준의 인공 지능 기능을 나타낸다고 말했습니다.

"훈련을 통해 그들은 사고 과정을 다듬고, 다양한 전략을 시도하고, 실수를 인식하는 방법을 배웁니다." 대규모 강화 학습 알고리즘은 훈련 과정에서 사고 사슬을 사용하여 효과적으로 생각하는 방법을 모델에게 가르치며, o1 모델은 사전에 생각할 수 있습니다. 사용자에게 응답하기 긴 내부 생각 사슬을 생성합니다. 더 많은 강화 학습과 더 많은 생각할 시간을 통해 o1 성능은 계속해서 향상됩니다. 까다로운 단계를 더 간단한 단계로 나누는 방법을 배웁니다. 현재 방법이 작동하지 않으면 다른 접근 방식을 시도합니다.

새로운 추론 모델 o1은 수학과 프로그래밍에 탁월하며, 복잡한 코드를 정확하게 생성하고 디버깅하는 데에도 뛰어납니다. openai는 aime(american mathematics invitational competition)에서 모델의 수학적 성능을 평가했습니다. 2024년 aime 시험에서 gpt-4o는 각 문제의 단일 샘플에 대해 평균 12%(1.8/15) 문제만 해결했습니다. %(11.1/15). 국제 수학 올림피아드(imo) 자격 시험에서 gpt-4o는 문제의 13%만을 올바르게 해결한 반면, 새로운 추론 모델은 83%를 기록했습니다.

새로운 모델은 물리학, 화학, 생물학 분야의 벤치마크 작업에 대해 박사과정 학생처럼 수행하면서 복잡한 작업을 추론할 수 있습니다. openai는 화학, 물리학 및 생물학 분야에서 gpqa 다이아몬드 벤치마크를 수행했습니다. 모델을 인간과 비교하기 위해 박사학위를 보유한 전문가를 모집해 함께 질문에 답했다.

"우리는 o1이 인간 전문가의 성능을 능가하여 이 벤치마크에서 그렇게 한 최초의 모델이 되었다는 것을 발견했습니다. 이러한 결과는 o1이 모든 측면에서 박사 학위보다 더 능력이 있다는 것을 의미하는 것이 아니라, 단지 모델이 박사 학위 요구 사항을 더 잘 해결한다는 것을 의미합니다. o1을 사용하여 세포 서열 분석 데이터에 주석을 달 수 있고, 물리학자는 o1을 사용하여 양자 광학에 필요한 복잡한 수학 공식을 생성할 수 있으며, 모든 분야의 개발자가 다단계 워크플로를 구축하고 실행하는 데 사용할 수 있다고 openai는 말했습니다.

마일스톤 추론 기능은 애플리케이션 효과를 크게 향상시킵니다.

"이전의 대형 언어 모델은 인문계 학생에 가까웠고 아직 이과 학생의 수준과는 거리가 멀습니다. 하지만 인간 지능의 핵심 능력은 사고와 사고입니다. openai 새로운 추론 모델 o1 시리즈는 인간의 사고 과정을 보여줍니다. 샤오양화는 “새로운 추론 모델 o1의 본질은 여전히 대형 언어 모델이지만 대형 모델의 잠재력을 충분히 활용하고 있다”고 말했다. 과거에는 대형 모형의 생성 능력이 말뭉치에 의해 결정되었는데, 이는 "당시 300수를 익히면, 어떻게 짓는지 몰라도 낭송할 수 있다"는 것과 같았다. 하지만 전문가의 추론능력은 질의응답 전술이 아니라 탄탄한 사고력이 필요합니다. 대규모 모델 추론 능력을 훈련하는 데 어려운 점은 인간의 사고 과정이 다수 표현되지 않기 때문에 사고 과정에 대한 데이터가 극히 부족하다는 점이다. 이번에는 openai가 대량의 합성 데이터를 사용해야 한다고 추측했다.

"openai는 확실한 선점자 이점을 가지고 있습니다. 기본 모델이 더 강력하고, 많은 사고 과정 데이터를 수집하고, 대량의 고품질 사고 데이터를 선별 및 합성하며, 강력한 평가 기능을 갖추고 있습니다. 어떤 추론 과정이 올바른지 이를 위해서는 강화 학습이 필요합니다. 강화 학습은 본질적으로 탐색과 시행착오의 과정입니다. 그래도 작동하지 않으면 다른 방법을 시도해 보세요. "xiao yanghua는 이러한 기술과 데이터의 도움을 받아 다음과 같이 말했습니다. openai는 대형 모델을 과학 학생의 의미에서 실제 모델로 만들어 전문가 수준에 도달했습니다.

daguan data의 chen yunwen 회장은 이전 모델은 복잡한 고급 수학 문제를 계산할 수 없었지만 o1은 수학 및 추론 능력이 향상되어 큰 발전을 이루었다고 말했습니다. 그러나 수학적 능력의 향상은 대형 모델의 r&d 패러다임이 본질적인 변화를 겪었음을 의미하는 것이 아니라 이전의 단점을 개선하는 방향일 뿐입니다.

xiao yanghua의 견해에 따르면 o1의 출현은 예상치 못한 일이 아니었습니다. “사실 우리는 대형 모델이 더 강한 감정적, 이성적 능력을 가질 것이라고 아주 일찍 판단했습니다. 예상치 못한 것은 우리가 그렇게 빨리 보게 될 것이라는 점이었습니다. 그리고 그 효과는 정말 놀랍습니다.” 그는 미래에는 openai가 일반적인 대형 모델을 기반으로 다양한 일을 잘하는 많은 대형 모델로 차별화될 수 있다고 믿습니다.

예를 들어, 이전 버전의 gpt-4는 모든 지식과 사실에 익숙하고 지적 능력을 강조한 반면, gpt-4o는 다중 모드 상호 작용을 강조하고 지각 능력을 강조했으며, o1 시리즈는 사고와 합리적 능력을 강조했습니다. 모델 합리성의 향상으로 to b 산업은 엄청난 발전을 이룰 수 있을 것입니다. "to b의 가장 큰 문제점과 병목 현상은 대형 모델의 추론 능력에 있습니다. 새로운 추론 모델 o1 시리즈의 등장은 to b 업계의 많은 문제가 향후 크게 완화될 수 있음을 의미합니다."

인공지능의 급속한 발전이 가져온 과제

"openai는 정말 강력합니다. 지금까지 openai의 기술 로드맵은 인식 범위를 벗어나지 않았지만 다중 양식 및 향상된 추론 기능을 포함한 대형 모델의 개발 방향을 우리 모두 알고 있지만 openai만이 이를 빠르게 현실로 만들었습니다. 그들은 인간과 똑같은 방식으로 대형 모델을 훈련합니다. 그들은 인간의 지적 발달과 인지 발달에 대해 매우 강한 생각을 갖고 있으며, 인간의 성장과 진화에 대해 매우 명확한 이해를 갖고 있으며, 지금까지 어떤 잘못된 단계도 발견하지 못했습니다. " 설명하다.

openai는 국내 대형 모델 개발에 대해선 "openai의 장점은 모두 우리에게 단점이다. 진정하고 천천히 따라잡아야 한다. 일반 인공지능 트랙에는 1위만 있고 2위는 없다"고 말했다. 그러나 샤오양화는 장기적으로 볼 때 대형 모델의 개인 역량 향상에는 한계가 있다고 말했다. 왜냐하면 인간의 실제 원본 데이터는 제한되어 있고 제작 속도도 느리기 때문입니다. "현재 openai는 추론 능력을 높이기 위해 인간의 데이터를 사용해 새로운 데이터를 합성합니다. 그러나 합성 데이터는 원본 데이터에 의해 제한됩니다. 무한한 데이터를 합성할 수도 없고 본질적으로 새로운 데이터를 얻을 수도 없습니다. 이 때문에 새로운 주제를 발명할 수 없습니다. 아인슈타인과 같은 새로운 이론은 "하드웨어 측면에서 추론은 훈련보다 컴퓨팅 성능이 덜 필요하지만 사고 체인의 확장으로 인해 추론 효율성에 대한 요구 사항이 높아져 학습의 가속화 및 최적화에 대한 요구 사항이 높아집니다. 추론 과정.

그러나 대규모 모델이 여러 측면에서 개선됨에 따라 거버넌스에 문제가 발생했습니다. 문제는 모델에 대한 인간의 이해가 발전만큼 빠르게 향상되지 않았다는 것입니다.

철학자 칸트는 인간의 인지 과정을 지각, 지적, 합리적의 세 단계로 나누었습니다. 요즘에는 대형 모델의 감성, 지능, 합리성이 모두 향상되어 인간을 능가할 가능성이 높습니다. 이 세 가지 인식에 강한 사람은 거의 없습니다.

"현재 o1은 박사과정 수준에 도달했습니다. 앞으로 과학자 수준에 도달하는 것은 양적 변화를 이루는 과정일 뿐입니다. 인간은 인공지능 발달의 인지 사각지대에 점차 빠져들게 될 것입니다. 예를 들어, 현재 대형 모델의 추론 능력은 실제로 ai에 사용될 수 있습니까? 지식 수준 이상의 사람들의 비율은 세계에서 박사 학위에 도달할 수 있는 사람이 거의 없습니다. 수학, 물리학, 화학, 수학 분야에서 ai를 이해하고 인식하고 제어할 수 있는 사람이 얼마나 될까요?”라고 샤오양화는 말했다. 인간은 현재 박사 수준이다. 인공지능의 기본적인 인지 체계가 부족하다. 고용, 경제, 윤리, 사회적 관계 등의 주제는 광범위한 논의를 불러일으킬 것입니다. "인간은 인공지능의 마법을 차단하는 존재입니다. 인공지능에 초인적인 능력이 있다면 인간이 활성화할 수 없는 초능력이 될 가능성이 높습니다. 인간의 인식 수준을 넘어서는 것입니다.”

더페이퍼 장징(zhang jing) 기자

(이 기사는 the paper에서 발췌한 것입니다. 더 많은 원본 정보를 보려면 “the paper” 앱을 다운로드하세요.)

보고/피드백

소식

해석｜샤오양화: 박사급 수학적 능력을 갖춘 o1 모델은 어떤 영향을 미칠까?

소개

내 연락처 정보