2024-09-15
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
지난 9월 13일, openai는 o1 시리즈 모델의 공식 데뷔를 발표하여 ai 분야의 새로운 시대를 열었고, 범용적인 복잡한 추론 작업을 수행할 수 있는 대형 모델의 시대를 열었습니다. openai 연구팀은 모델 출시 후 x 소셜 플랫폼에서 ama(ask me anything) 이벤트를 진행해 o1 시리즈 모델에 대한 많은 세부 사항을 심도 깊게 공개했습니다.
openai에 따르면 o1 시리즈에는 전체 모델의 초기 버전인 o1-preview와 더 빠르고 가벼운 o1-mini의 두 가지 버전이 포함되어 있습니다. 이전 모델과 달리,o1은 최종 답변을 제공하기 전에 숨겨진 사고 과정의 긴 체인을 생성하여 인간과 같은 추론 능력을 보여줄 수 있습니다.。연구원들은 o1을 초능력을 가진 "외계인"에 비유합니다.。
추론 과정에서,o1은 강화 학습을 사용하여 "추론" 성능을 달성합니다.. 현재 이러한 사고 체인 토큰을 api 사용자나 chatgpt에 표시할 계획은 없지만 연구원들은 프롬프트에 포함된 지침이 o1의 사고 방식에 영향을 미칠 수 있음을 밝혔습니다. 대조적으로,gpt-4o는 프롬프트를 통해 o1의 사고 사슬 성능 수준에 도달할 수 없습니다.。
o1 시리즈 모델은 gpt-4o와 동일한 토크나이저를 사용하며 입력 토큰에서 일관성을 유지합니다. 하지만,o1은 더 길고 개방적인 작업을 처리할 수 있으므로 입력 청크의 필요성이 줄어듭니다. 앞으로 o1은 더 큰 입력 컨텍스트 창도 지원할 예정입니다.。
o1은 또한 코드 해독, 철학적 질문 숙고, 자가 테스트를 통해 자신의 능력을 평가하는 등 인상적인 추론 및 일반화 능력을 보여주었습니다.
연구팀은 또 이렇게 밝혔다.일부 맞춤형 작문 작업에 대한 o1-preview의 성능은 gpt-4o와 동일하거나 약간 더 좋습니다.
o1-preview에 비해 o1-mini는 크기와 속도가 최적화되어 있습니다.
세계지식 등 일부 영역에서는 한계가 있을 수 있지만,o1-mini는 stem(과학, 기술, 공학, 수학) 작업 및 코드 관련 작업에서 장점을 보여줍니다.. 또한,o1-mini는 o1-preview보다 더 많은 사고 사슬을 탐색할 수 있습니다.。
o1-preview는 현재 도구를 사용하지 않지만,openai는 함수 호출, 코드 해석기, 웹 브라우징 등의 기능을 추가할 계획입니다. 도구 지원, 구조화된 출력 및 시스템 프롬프트도 향후 업데이트에 도입될 예정입니다.。
또한 openai 개발자 팀은 다음과 같이 밝혔습니다.앞으로는 사용자가 o1의 사고 시간과 토큰 한도를 제어할 수 있게 될 것입니다., 이 기능의 구현을 적극적으로 추진할 것을 약속했습니다.
openai는 또한 api에서 스트리밍 지원 및 추론 진행 피드백을 적극적으로 홍보하고 있습니다.. 또한,o1에는 이미 다중 모드 기능이 내장되어 있습니다.다중 모드 이해 작업(mmlu) 분야에서 최고 수준에 도달할 것으로 예상됩니다.
o1-mini는 현재 chatgpt plus 사용자에게 공개되어 있지만 주당 프롬프트 수는 50개로 제한됩니다.모든 팁은 동일한 할당량에 포함됩니다. openai는 약속합니다.api 액세스 수준 및 요금 제한은 향후 점진적으로 높아질 예정이며, 제한이 완화된 후 대량 가격 할인이 제공될 예정입니다.。
o1 모델의 가격은 1~2년 주기로 가격 인하 추세를 따를 것으로 예상. 또한,개인화된 미세 조정 지원은 제품 로드맵에 있습니다.이지만 구체적인 출시 일정은 아직 명확하지 않습니다.
o1-mini는 현재 2023년 10월 기준 데이터를 사용하여 학습되었으며, 향후 반복에서는 새로운 데이터 세트를 사용하여 세계에 대한 지식을 확장할 것입니다.
o1의 추론 이점을 최대한 활용하기 위해,팀은 사용자가 프롬프트를 디자인할 때 극단적인 사례를 다루는 유익하고 구체적인 예를 제공하고 필요한 추론 단계와 스타일을 명확하게 지정할 것을 권장합니다.. 하지만 조심하세요.관련 없는 컨텍스트가 모델의 추론 프로세스를 방해할 수 있습니다.。
매일경제뉴스 종합자체정보
매일 경제 뉴스