notícias

o modo de voz avançado chatgpt foi lançado oficialmente! suporta mais de 50 idiomas

2024-09-25

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

título original: o modo de voz avançado chatgpt é lançado oficialmente! suporta mais de 50 idiomas no vídeo de demonstração, “sinto muito” é dito em mandarim, mas a voz de scarlett desapareceu.

em 25 de setembro, a openai anunciou oficialmente que o modo de voz avançado do chatgpt será lançado oficialmente para usuários individuais do chatgpt plus e usuários de equipes (equipes) de pequenas empresas esta semana.

além disso, a openai disse que abrirá esse recurso para usuários do openai enterprise e education edition na próxima semana. mas é importante notar que o novo recurso de voz está disponível para o modelo gpt-4o da openai e não para o modelo de visualização o1 lançado recentemente.

fonte da imagem: plataforma social x

esta atualização significa,a partir desta semana, usuários individuais e usuários de equipes de pequenas empresas da versão plus do chatgpt podem interagir com o chatbot por “voz” em vez da entrada de texto tradicional.

os dois destaques do modo de voz avançado são particularmente atraentes: primeiro,apoie os usuários na definição de "comandos personalizados" para assistentes de voz, para conseguir operações personalizadas;equipado com uma função de “memória” que pode lembrar o método de interação preferido do usuário, que é semelhante a um recurso lançado para a versão em texto do chatgpt no início deste ano.

fonte da imagem: plataforma social x

no vídeo lançado oficialmente, a gerente de projeto técnico da openai, charlotte cole, e o engenheiro de pesquisa da openai, mike, disseram:os usuários não apenas podem personalizar a velocidade da conversa, mas também podem fazer com que o modelo se comunique pelo nome do usuário ou título preferido., tornando a comunicação mais cordial e natural.

também,os usuários também podem predefinir nome pessoal e informações de endereço no sistema. ao iniciar uma nova rodada de diálogo, como perguntar "o tempo está muito bom neste fim de semana, há alguma atividade ao ar livre interessante que você possa recomendar?" visite e até planeje cuidadosamente as rotas de viagem.

fonte da imagem: plataforma social x

para atender às preferências de diferentes usuários,o modo de voz avançado adiciona cinco vozes distintas: arbor, maple, sol, spruce e vale, juntamente com os quatro sons originais breeze, juniper, cove e ember, formam nove opções de alto-falantes. as vozes têm nomes inspirados em elementos naturais e são projetadas para proporcionar uma variedade de tons e características.

vale a pena notar queopenai remove dublagem de sky acusada de imitar a atriz scarlett johansson. anteriormente, scarlett acusou o chatgpt da openai de usar sua voz ilegalmente e solicitou que a voz fosse retirada das prateleiras.

além disso, openai disse que tambémotimizou a capacidade de conversação de algumas línguas estrangeiras, não apenas melhorando a velocidade e a fluência da conversação, mas também fazendo ajustes detalhados no sotaque, esforçando-se para se comunicar mais perto da natureza.

drew, designer de modelos da openai, também compartilhou sua experiência. ele disse que no uso diário, os usuários podem deixar de lado o assistente de voz avançado e ele esperará em silêncio sem incomodar o usuário. e quando os usuários tiverem alguma dúvida ou necessidade, eles podem iniciar uma conversa com ele a qualquer momento. ele capturará rapidamente as mudanças no tom da conversa e desempenhará vários papéis com flexibilidade, de forma tão natural e suave quanto conversar com um amigo real.

fonte da imagem: plataforma social x

o modo de voz avançado chatgpt agora suporta mais de 50 idiomas, ampliando o escopo de comunicação para os usuários. o que é particularmente interessante é que no vídeo de demonstração lançado oficialmente, o usuário pediu ao assistente de voz que pedisse desculpas à avó por mantê-la esperando por tanto tempo.o assistente de voz avançado primeiro resumiu fluentemente em inglês e, depois que o usuário disse "vovó só fala mandarim", ele expressou novamente em mandarim padrão "sinto muito, estou atrasado"., como se a openai estivesse se desculpando com os usuários por atrasar repetidamente o lançamento de modos de voz avançados.

deve-se notar queeste modo de voz avançado não está atualmente disponível na ue, reino unido, suíça, islândia, noruega e liechtenstein.. a openai ainda não anunciou o horário de funcionamento para essas regiões.

fonte da imagem: plataforma social x

o ceo da openai, sam altman, não conseguiu esconder seu entusiasmo nas plataformas sociais, dizendo: “espero que você sinta que a espera vale a pena”, acrescentando um olhar de queixa e simpatia.

fonte da imagem: plataforma social x

o presidente da openai, greg brockman, que ainda está de férias, também participou com entusiasmo da promoção. ele disse: “o lançamento de recursos avançados de voz permite que você tenha facilmente uma conversa tranquila e desobstruída com o chatgpt. quão antinatural é a maneira antiga de digitar em um computador.”