소식

openai, 소규모 개발자 컨퍼런스 개최: 비용 대폭 절감 및 실시간 api 공개 베타 출시

2024-10-02

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

하이라이트:

  1. openai는 화요일 샌프란시스코에서 두 번째 개발자 컨퍼런스를 조용히 개최했습니다. 언론은 참석하도록 초대받지 않았으며 신제품도 출시되지 않았습니다.

  2. 이번 개발자 컨퍼런스는 샌프란시스코, 런던, 싱가포르에서 각각 개최되며 나머지 두 차례는 10월 30일과 11월 21일에 개최된다.

  3. openai는 개발자를 위한 4가지 새로운 도구를 출시하여 최종 사용자 애플리케이션에서의 직접 경쟁에서 개발자 생태계 강화로 초점을 전환했습니다.

  4. 현재 300만 명이 넘는 개발자가 openai 모델을 사용해 애플리케이션을 개발하며 플랫폼의 매력과 경쟁력을 입증하고 있습니다.

10월 2일 뉴스에 따르면 지난주는 최고 경영진의 이탈과 중요한 자금 조달 활동 등 openai에 대한 도전으로 가득 차 있었지만 회사는 2024 개발자 컨퍼런스(devday)에서 관심을 끄는 데 다시 집중했습니다. 도구를 만드는 모델. 최근 언론의 큰 주목을 받았던 openai ceo 샘 알트만(sam altman)은 개발자 컨퍼런스에 모습을 드러내지 않았다.

openai의 최고 제품 책임자인 kevin weil은 월요일에 열린 기자 회견에서 회사의 최고 기술 책임자인 mira murati(mira murati)와 최고 연구 책임자인 bao bob mcgrew가 최근 자신의 사임을 발표했지만 이러한 변화는 미디어에 영향을 미치지 않을 것이라고 언론에 말했습니다. 회사의 발전. ware는 정중하게 "bob과 myra는 훌륭한 리더라는 점부터 말씀드리겠습니다. 저는 그들로부터 깊은 영향을 받았으며 그들은 우리가 오늘날의 위치에 오르는 데 중요한 역할을 했습니다. 그리고 우리는 앞으로도 그럴 계획이 없습니다."라고 말했습니다. 천천히." 우리의 개발 속도."

지난해 openai는 미국 샌프란시스코에서 업계에 돌풍을 일으킨 첫 번째 개발자 컨퍼런스(devday 2023)를 개최했습니다. 이 회사는 다수의 미디어를 초대한 45분간의 기조연설에서 128k 컨텍스트 지원이 포함된 gpt-4 turbo, api 가격 인하, 새로운 assistants api, 시각적 기능을 위한 gpt-4 turbo, dall·e 3 api, 크게 개선된 json 모델은 물론, 불운한 gpt와 앱스토어 같은 플랫폼인 gpt 스토어까지. 마이크로소프트(ms) ceo 사티아 나델라(satya nadella)도 게스트로 출연했다.

openai의 플랫폼 제품 책임자인 olivier godement는 openai가 더 이상 개발자 컨퍼런스에서 새로운 모델을 출시하지 않을 것이며 모델이 자체 연구 및 안전 일정을 따르도록 할 것이라고 말했습니다. 이러한 변화는 openai가 기술을 너무 빨리 발전시킨다는 비판을 받고 있는 배경에서 이루어졌습니다. 비영리 단체로 시작된 openai는 비영리 단체가 통제력을 잃고 전통적인 스타트업으로 변모할 수 있는 구조 조정 단계에 있습니다. 이는 자본 조달, 인재 모집 및 유지를 돕기 위한 조치입니다. 그러나 이러한 변화는 "회사를 분열"시키고 있으며 mulati와 수석 과학자 ilya sutskever는 회사가 너무 빨리 성장했기 때문에 떠났습니다.

지난해 개발자 컨퍼런스 이후 고위 인사 교체를 겪은 오픈ai는 올해 개발자 컨퍼런스를 개최하기 위해 좀 더 낮은 접근 방식을 선택했다. 지난해 행사에 비해 올해 openai 개발자 컨퍼런스는 좀 더 절제된 모습을 보인다. 회사는 이전에 미디어를 참여하도록 초대하지 않을 것이라고 밝혔습니다. 공식 정보에 따르면 제2회 devday 개발자 컨퍼런스는 10월 1일, 10월 30일, 11월 21일 싱가포르에서 각각 기술 세미나, 그룹 토론, 제품 시연 등으로 개최됩니다. 이번 행사 참가자들은 공식 홈페이지를 통해 성공적으로 신청하고 등록비 us$450를 납부한 후 참가할 수 있다.

openai 경영진은 회사가 리더십 변화에 직면하고 있음에도 불구하고 여전히 300만 명 이상의 개발자가 개발을 위해 ai 모델을 사용하고 있어 플랫폼의 매력과 경쟁력을 입증하고 있다고 밝혔습니다. 그럼에도 불구하고 openai는 시장 경쟁, 특히 meta 및 google과 같은 경쟁업체의 가격 압박이 심화되고 있음을 알고 있습니다. 개발자를 유치하고 유지하기 위해 openai는 지난 2년 동안 api 액세스 비용을 99% 절감했는데, 이는 경쟁사의 도전에 대응하는 전략일 수 있습니다.

openai는 이번 개발자 컨퍼런스에서 새로운 인공지능 첨단 모델을 공개한 것이 아니라 생태계 구축에 중점을 두고 개발자들이 서로 연결하고 새로운 인공지능 기능과 제품에 대한 심층적인 이해를 얻을 수 있도록 돕는 데 중점을 두었습니다. openai가 업계를 파괴하는 기업에서 플랫폼 제공업체로 전환함에 따라 openai의 성공은 활발한 개발자 생태계를 육성하는 능력에 달려 있습니다. openai는 더욱 발전된 도구를 제공하고 비용을 낮추며 지원을 늘려 인공지능 분야의 지속적인 성장과 안정성을 위한 탄탄한 기반을 마련했습니다. 이 전략의 직접적인 영향은 즉각적으로 명백하지 않을 수 있지만 궁극적으로는 더 광범위한 산업 전반에 걸쳐 지속 가능하고 심층적인 ai 채택으로 이어질 것으로 예상됩니다.

openai는 이번 개발자 컨퍼런스에서 vision fine-tuning, realtime api, model distillation 및 prompt caching이라는 네 가지 주요 혁신을 선보였습니다. 이러한 새로운 도구는 openai의 전략적 초점이 최종 사용자 애플리케이션에서 직접 경쟁하는 것에서 개발자 생태계를 강화하는 것으로 전환되었음을 의미합니다.

01 프롬프트 캐싱: 개발자를 위한 비용 절감 도구

openai는 개발자 컨퍼런스에서 개발자의 비용과 작업 지연을 크게 줄여줄 신속한 캐싱이라는 혁신적인 기능을 발표했습니다. 이 기능은 모델에서 최근 처리한 입력 토큰을 자동으로 식별하고 캐시할 수 있으며, 이러한 캐시된 토큰에 대해 최대 50%의 가격 할인을 제공할 수 있습니다. 이는 동일한 컨텍스트를 자주 사용하는 애플리케이션에 큰 도움이 됩니다.

openai 플랫폼 제품 책임자인 gudmont는 "우리는 열심히 일해 왔습니다."라고 말했습니다. "2년 전을 되돌아보면 gpt-3가 시장의 지배적인 선두주자였습니다. 오늘날 우리는 비용을 1,000배나 줄이는 데 성공했습니다. 2년 만에 이렇게 상당한 비용 절감을 달성할 수 있는 다른 기술은 정말 생각할 수 없습니다. 줄이다."

이러한 상당한 비용 절감은 모든 규모의 기업과 스타트업이 새로운 애플리케이션, 특히 비용 문제로 인해 출시가 지연된 프로젝트를 탐색할 수 있는 기회를 열어줍니다.

02 시각적 미세 조정: 시각적 인공지능의 새로운 시대

또 다른 중요한 발표는 openai의 최신 대규모 언어 모델인 gpt-4o에 대한 시각적 미세 조정 기능의 도입입니다. 이 새로운 기능을 통해 개발자는 이미지와 텍스트를 활용하여 모델의 시각적 이해를 맞춤화할 수 있습니다. 이 기능의 의미는 광범위하며 자율 주행 자동차, 의료 영상, 시각적 검색 기능과 같은 영역에 상당한 영향을 미칠 수 있습니다.

openai는 동남아시아 음식 배달 및 차량 호출 회사 grab이 이미 지도 서비스를 개선하기 위해 이 기술을 사용하고 있다고 밝혔습니다. 단 100개의 예시를 통해 grab은 차선 계산 정확도를 20% 향상시키고 속도 제한 표지판 위치를 13% 향상시켰습니다. 이 실제 응용 프로그램은 시각적 미세 조정이 시각적 훈련 데이터의 작은 배치를 활용하여 다양한 산업 분야에서 인공 지능 서비스의 가능성을 크게 향상시킬 수 있는 방법을 보여줍니다.

03 인스턴트 api: 대화형 ai 격차 메우기

openai는 또한 인스턴트 api의 공개 베타 버전을 출시했습니다. 이는 개발자가 특히 음성 대 음성 애플리케이션에서 지연 시간이 짧은 다중 모드 환경을 만들 수 있는 새로운 서비스입니다. 이는 개발자가 앱에 chatgpt의 음성 제어 기능을 추가할 수 있음을 의미합니다.

api의 잠재력을 입증하기 위해 openai는 작년 컨퍼런스에서 선보인 여행 계획 앱 wanderlust의 업데이트 버전을 선보였습니다. 인스턴트 api를 활용해 사용자는 앱과 직접 대화하며 자연스러운 대화 방식으로 여행 계획을 세울 수 있습니다.

여행 계획은 하나의 예일 뿐이지만 인스턴트 api는 다양한 산업 분야에서 음성 인식 애플리케이션에 대한 광범위한 가능성을 열어줍니다. 고객 서비스부터 교육 및 접근성 도구에 이르기까지 개발자는 이제 더욱 직관적이고 반응성이 뛰어난 ai 기반 경험을 만들 수 있는 강력하고 새로운 리소스를 갖게 되었습니다. "우리는 제품을 디자인할 때마다 기본적으로 스타트업과 기업에 대해 생각합니다."라고 gudmont는 설명합니다. "따라서 알파 테스트에서는 신제품의 새로운 모델인 api를 사용하는 기업이 많이 있습니다."

instant api는 본질적으로 음성 도우미 및 기타 대화형 ai 도구를 구축하는 프로세스를 단순화하므로 전사, 추론 및 텍스트 음성 변환을 위해 여러 모델을 결합할 필요가 없습니다. 건강 및 피트니스 코칭 앱 healthify, 언어 학습 플랫폼 speak 등 얼리어답터들은 자사 제품에 인스턴트 api를 통합했습니다. instant api의 가격 구조는 오디오 입력의 경우 분당 0.06달러, 오디오 출력의 경우 분당 0.24달러로 저렴하지는 않지만 음성 기반 애플리케이션을 만들려는 개발자에게는 여전히 상당한 가치를 나타낼 수 있습니다.

04 모델 증류: 인공지능 대중화의 새로운 장

openai는 또한 가장 혁신적인 발전일 수 있는 모델 증류 기술을 출시했습니다. 이 기술을 통해 개발자는 o1-preview 및 gpt-4o와 같은 고급 모델의 출력을 활용하여 gpt-4o mini와 같은 보다 효율적인 모델의 성능을 향상시킬 수 있습니다.

이러한 혁신을 통해 중소기업은 더 낮은 계산 비용으로 대형 모델에 필적하는 기능을 달성할 수 있으며, 이를 통해 ai 업계에서 오랫동안 지속되어 온 모순, 즉 리소스 집약적이고 접근 가능하지만 기능이 제한된 시스템 간의 격차를 해결할 수 있습니다. 예를 들어, 소규모 의료 기술 스타트업은 모델 증류 기술을 활용하여 시골 진료소를 위한 ai 기반 진단 도구를 개발할 수 있습니다. 이 회사는 표준 장비에서 실행될 뿐만 아니라 대형 모델에 근접한 진단 정확도를 제공하는 경량 모델을 훈련할 수 있어 자원이 제한된 영역에서 의료 서비스를 개선할 수 있을 것으로 기대됩니다. (tencent technology에서 특별히 편집한 wuji)