소식

o1은 어떻게 인간처럼 "이성"을 할까요? openai 연구팀 q&a: 모델 세부 정보, 향후 계획, o1 성능 극대화를 위한 팁 공개

2024-09-15

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

지난 9월 13일, openai는 o1 시리즈 모델의 공식 데뷔를 발표하여 ai 분야의 새로운 시대를 열었고, 범용적인 복잡한 추론 작업을 수행할 수 있는 대형 모델의 시대를 열었습니다. openai 연구팀은 모델 출시 후 x 소셜 플랫폼에서 ama(ask me anything) 이벤트를 진행해 o1 시리즈 모델에 대한 많은 세부 사항을 심도 깊게 공개했습니다.

이미지 출처: x 소셜 플랫폼
  • "외계인" 수준의 ai 조수

openai에 따르면 o1 시리즈에는 전체 모델의 초기 버전인 o1-preview와 더 빠르고 가벼운 o1-mini의 두 가지 버전이 포함되어 있습니다. 이전 모델과 달리,o1은 최종 답변을 제공하기 전에 숨겨진 사고 과정의 긴 체인을 생성하여 인간과 같은 추론 능력을 보여줄 수 있습니다.연구원들은 o1을 초능력을 가진 "외계인"에 비유합니다.

이미지 출처: x 소셜 플랫폼

추론 과정에서,o1은 강화 학습을 사용하여 "추론" 성능을 달성합니다.. 현재 이러한 사고 체인 토큰을 api 사용자나 chatgpt에 표시할 계획은 없지만 연구원들은 프롬프트에 포함된 지침이 o1의 사고 방식에 영향을 미칠 수 있음을 밝혔습니다. 대조적으로,gpt-4o는 프롬프트를 통해 o1의 사고 사슬 성능 수준에 도달할 수 없습니다.

이미지 출처: x 소셜 플랫폼

o1 시리즈 모델은 gpt-4o와 동일한 토크나이저를 사용하며 입력 토큰에서 일관성을 유지합니다. 하지만,o1은 더 길고 개방적인 작업을 처리할 수 있으므로 입력 청크의 필요성이 줄어듭니다. 앞으로 o1은 더 큰 입력 컨텍스트 창도 지원할 예정입니다.

o1은 또한 코드 해독, 철학적 질문 숙고, 자가 테스트를 통해 자신의 능력을 평가하는 등 인상적인 추론 및 일반화 능력을 보여주었습니다.

연구팀은 또 이렇게 밝혔다.일부 맞춤형 작문 작업에 대한 o1-preview의 성능은 gpt-4o와 동일하거나 약간 더 좋습니다.

  • 미니 버전이 더 강해졌나요?

o1-preview에 비해 o1-mini는 크기와 속도가 최적화되어 있습니다.

이미지 출처: x 소셜 플랫폼

세계지식 등 일부 영역에서는 한계가 있을 수 있지만,o1-mini는 stem(과학, 기술, 공학, 수학) 작업 및 코드 관련 작업에서 장점을 보여줍니다.. 또한,o1-mini는 o1-preview보다 더 많은 사고 사슬을 탐색할 수 있습니다.

이미지 출처: x 소셜 플랫폼
  • o1은 곧 도구 통합 및 다중 모드 이해를 지원할 예정입니다.

o1-preview는 현재 도구를 사용하지 않지만,openai는 함수 호출, 코드 해석기, 웹 브라우징 등의 기능을 추가할 계획입니다. 도구 지원, 구조화된 출력 및 시스템 프롬프트도 향후 업데이트에 도입될 예정입니다.

이미지 출처: x 소셜 플랫폼

또한 openai 개발자 팀은 다음과 같이 밝혔습니다.앞으로는 사용자가 o1의 사고 시간과 토큰 한도를 제어할 수 있게 될 것입니다., 이 기능의 구현을 적극적으로 추진할 것을 약속했습니다.

openai는 또한 api에서 스트리밍 지원 및 추론 진행 피드백을 적극적으로 홍보하고 있습니다.. 또한,o1에는 이미 다중 모드 기능이 내장되어 있습니다.다중 모드 이해 작업(mmlu) 분야에서 최고 수준에 도달할 것으로 예상됩니다.

이미지 출처: x 소셜 플랫폼
  • o1-mini에는 주당 50개의 메시지 제한이 있습니다.

o1-mini는 현재 chatgpt plus 사용자에게 공개되어 있지만 주당 프롬프트 수는 50개로 제한됩니다.모든 팁은 동일한 할당량에 포함됩니다. openai는 약속합니다.api 액세스 수준 및 요금 제한은 향후 점진적으로 높아질 예정이며, 제한이 완화된 후 대량 가격 할인이 제공될 예정입니다.

o1 모델의 가격은 1~2년 주기로 가격 인하 추세를 따를 것으로 예상. 또한,개인화된 미세 조정 지원은 제품 로드맵에 있습니다.이지만 구체적인 출시 일정은 아직 명확하지 않습니다.

이미지 출처: x 소셜 플랫폼
  • o1 성능 극대화의 비결

o1-mini는 현재 2023년 10월 기준 데이터를 사용하여 학습되었으며, 향후 반복에서는 새로운 데이터 세트를 사용하여 세계에 대한 지식을 확장할 것입니다.

o1의 추론 이점을 최대한 활용하기 위해,팀은 사용자가 프롬프트를 디자인할 때 극단적인 사례를 다루는 유익하고 구체적인 예를 제공하고 필요한 추론 단계와 스타일을 명확하게 지정할 것을 권장합니다.. 하지만 조심하세요.관련 없는 컨텍스트가 모델의 추론 프로세스를 방해할 수 있습니다.

매일경제뉴스 종합자체정보

매일 경제 뉴스

보고/피드백