2024-09-25
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
가을까지 기다릴 필요가 없습니다. 오늘 이른 아침, openai는 chatgpt의 고급 음성 모드의 새 버전이 이번 주에 모든 plus 및 team 사용자에게 완전히 출시될 것이라고 발표했습니다.
openai ceo sam altman은 x 플랫폼에 다음과 같이 게시했습니다.
고급 음성 모드가 오늘 공식 출시되었습니다! (이번주에 전면 밀릴 예정입니다) 기다릴만한 가치가 있다고 느끼셨으면 좋겠습니다 🤣🫶
그러나 새 버전의 고급 음성 모드에도 일일 사용 시간 제한이 있으며 이 제한도 사용자에게 15분이 남으면 시스템에서 알림을 발행합니다.
24시간 모든 것을 이야기할 수 있는 ai 친한 친구로 활용하는 것이 현실적이지 않을 수도 있다는 뜻이다.
푸시 자격을 취득했는지 여부를 확인하는 두 가지 간단한 방법이 있습니다.
먼저, 푸시 대상에 해당되면 처음 음성 모드에 접속할 때 앱에 다음과 같은 알림이 표시됩니다.
두 번째 방법은 음색 스타일의 개수를 확인하는 것입니다.
이전에 chatgpt는 5가지 사전 설정된 음성 스타일을 지원했지만 이후 "sky" 음성 스타일과 "widow sister" 간의 법적 분쟁으로 인해 목록에서 제거되었습니다.
오늘 openai는 더욱 자연스럽게 들리는 다섯 가지 새로운 음성 스타일(vale, spruce, arbor, maple 및 sol)을 출시합니다.
openai 공식 웹사이트에서는 9가지 소리를 다음과 같이 설명합니다.
아버(arbor) - 편안하고 다재다능함
브리즈(breeze) - 활기차고 진지함
코브 - 조용하고 솔직함
엠버(ember) - 자신감 있고 낙천적
주니퍼 - 개방적이고 낙천적
메이플 - 명랑하고 솔직한 성격
솔 - 똑똑하고 여유로운
가문비나무 - 차분하고 자신감 있는
베일(vale) - 지능적이고 호기심이 많습니다.
새로운 목소리 스타일을 듣고 나면 네티즌들은 모두 각자의 취향을 가지고 있습니다. 일부는 "sky"를 그리워하고 다른 일부는 이미 새로운 음성 스타일에 푹 빠져 있습니다. sol은 현재 가장 인기 있는 톤입니다. 어떤 톤을 선호하시나요? 댓글 영역에서 공유해 주세요.
그렇다면 chatgpt의 고급 음성 모드의 효과는 무엇일까요?
공식은 중국어만 사용하는 할머니에게 지각에 대해 진심으로 사과하고 싶을 때 50개 이상의 언어를 구사하는 chatgpt를 사용하면 됩니다.
잘 들으셨습니다. chatgpt는 중국어로 다음과 같이 명확하고 간결하게 말했습니다.
할머니, 죄송해요. 너무 오래 기다리게 할 생각은 아니었어요. 어떻게 보상할 수 있나요?
또한 chatgpt의 고급 음성 모드는 이제 사용자 정의 명령 설정을 지원합니다.
openai 직원은 음성 양식(음성이 전달되는 방식)에는 악센트, 억양, 리듬 등 텍스트 대화에 반영되지 않을 수 있는 요소가 많이 포함되어 있다고 지적합니다.
이제 사용자는 모델이 원하는 방식을 보다 정확하게 설명하는 설정을 통해 ai 모델이 말하는 방식을 사용자 정의할 수 있습니다.
그녀는 모델이 특정 속도로 말하고, 명확하게 말하고, 천천히 말하고, 사용자 이름을 정기적으로 사용하는 등의 예를 제시했습니다. 그녀는 모델에게 사용자 이름과 몇 가지 기본 정보를 알려주는 등 간단하게 시작할 것을 권장합니다.
특정 시나리오에서 사용자는 주말에 어떤 재미있는 일을 할 수 있는지 묻습니다. chatgpt의 고급 음성 모드는 하이킹, 피크닉, 1번 국도 운전 등 날씨와 사용자 위치(베이 지역)를 기반으로 제안을 제공합니다.
또는 그녀가 경치를 따라 운전하는 아이디어가 마음에 든다고 말하고 어떤 경로를 택해야 하는지 물으면 chatgpt는 철저한 계획을 세울 수 있습니다.
즉, chatgpt의 고급 음성 모드는 모델의 음성과 상호 작용을 맞춤 설정함으로써 사용자의 선호도와 요구 사항에 따라 구체적인 제안을 제공할 수 있어 상호 작용이 더욱 자연스럽고 유용해집니다.
또한 chatgpt 고급 음성 모드 새 버전의 대화 속도, 유창성 및 억양이 크게 향상되었습니다. 외국어 파트너로서 고려할 가치가 있습니다.
사용자 경험에 대해 이야기할 때 openai 모델 디자이너 drew는 자신이 무언가를 하고 있거나 chatgpt와 대화할 필요가 없을 때 chatgpt가 조용히 있을 것이라고 말했습니다.
그는 질문이 있을 때 그것을 묻고, 그 질문은 긴 대화로 이어질 수 있습니다.
대화 중에 chatgpt의 음성은 대화의 톤에 맞춰 조정됩니다. 그의 관점에서 chatgpt는 정보를 제공할 뿐만 아니라 아이디어를 전달하는 옆에 앉아 있는 친구와 같습니다.
실제로 지연에 대한 걱정 없이 인터뷰 및 기타 시나리오를 연습하는 데 사용할 수도 있습니다.
drew는 "내 말은 대기 시간이 너무 낮아 마치 다른 사람과 대화하는 것과 같다"고 강조했습니다.
첫 번째 사용자 경험에 대해서는 appso의 이전 기사를 검토하세요👇
gpt-4o 음성 모드의 첫 번째 사용자 경험이 여기에 있습니다! 영화 '그녀'가 드디어 현실이 됐다, 네티즌: 그녀와 사랑에 빠질 뻔했다
openai가 출시한 고급 음성 모드의 새 버전은 현재 eu, 영국, 스위스, 아이슬란드, 노르웨이 및 리히텐슈타인에 공개되지 않는다는 점은 주목할 가치가 있습니다.
돌 하나가 수천 개의 파도를 일으켰고, 피해를 입은 네티즌들은 분노하고 무기력해졌습니다.
불행히도 chatgpt의 비디오 및 화면 공유는 아직 활성화되지 않았습니다.
4개월 전 이 기능은 기자간담회에서 공개됐다. 당시 openai는 눈앞의 종이에 적힌 수학 문제나 컴퓨터 화면의 코드를 chatgpt에 실시간으로 물어보는 방법도 보여주었습니다.
현재 openai는 이 기능이 언제 출시될지 지정하지 않았습니다.
항상 발전을 예측할 수 없는 ai 산업에서 뒤늦은 고급 음성 모드는 사실상 거세된 제품이다.
눈에 띄는 새로운 기능도 없고, 5월 컨퍼런스에서 약속한 기능도 제대로 이행하지 못한 채 워밍업된 본격적인 추진은 구글의 신모델을 겨냥한 제품에 가깝다.
역설적이게도 openai 사전에 나오는 'coming soon'은 우리와는 다른 것 같습니다.
오랫동안 약속된 일부 기능은 내일 또는 내년을 의미할 수도 있습니다.
다른 각도에서 생각해보면, 뛰어난 기술력을 보유한 오픈ai 역시 상상력을 파는 기업일지 모른다. 우리가 가장 기대하는 것은 이들의 다음 발굴이 아닐까.
결국 그것은 그들에게 전통이 됐습니다. 그렇죠?
하나 더
openai 공식 웹사이트는 오늘 chatgpt 음성 모드에 대한 qa 답변 버전을 업데이트했습니다. 또한 여러분에게 참고가 되기를 바라며 몇 가지 실용적인 답변을 간략하게 요약했습니다.
1. 고급 음성 모드를 사용하는 경우에도 휴대폰 배경에 대기하면서 대화를 계속할 수 있습니다.
2. 문자 또는 표준 음성 모드에서 고급 음성 모드로 전환할 경우, 이전 문자 또는 표준 음성 대화 상태로 돌아갈 수 없으니 주의하시기 바랍니다.
3. 차량 내 bluetooth 또는 핸즈프리 전화 기능을 사용할 때 openai는 현재 이러한 장치에 대한 특별한 최적화를 제공하지 않기 때문에 고급 음성 대화 경험에 영향을 미칠 수 있습니다.
3. 고급 음성 대화는 아직 gpt에 공개되지 않았습니다. gpt와는 표준 음성 대화만 할 수 있습니다. gpt에는 shimmer라는 고유한 음성 옵션이 있습니다.
4. 음악 창작자의 저작권을 존중하기 위해 openai는 음성 대화가 노래를 포함한 음악 콘텐츠를 생성하지 못하도록 하는 새로운 필터링 조건을 포함하여 다양한 보안 조치를 채택했습니다.
5. 고급 음성 모드 대화는 본질적으로 다중 모드이며, 복사된 텍스트가 항상 원본 대화와 정확히 일치하지는 않습니다.
6. 고급 음성 대화의 오디오는 귀하가 적극적으로 삭제할 때까지 채팅 기록과 함께 유지됩니다. 삭제 후 오디오는 일반적으로 30일 이내에 삭제되지만 특정 상황에서는 더 오래 보관될 수 있습니다.
7. openai에 따르면 기본적으로 시스템은 오디오 공유를 선택하지 않는 한 모델 교육을 위해 음성 채팅에서 오디오를 사용하지 않습니다.
8. "설정"에서 "모든 사용자를 위한 음성 채팅 환경 개선" 옵션이 켜져 있지 않으면 오디오를 공유하지 않았으며 시스템에서 모델 교육에 오디오를 사용하지 않는다는 의미입니다.