minhas informações de contato
correspondência[email protected]
2024-10-02
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
autora|jéssica
hoje, o primeiro devday da openai em 2024 foi realizado de forma discreta no gateway pavilion no pier 2 em são francisco.
diferente do turbulento anúncio oficial do ano passado, a notícia do developer day deste ano só apareceu uma vez na conta x do openai developers há dois meses, então muitas pessoas não sabiam disso.
os participantes são basicamente clientes convidados e desenvolvedores de linha de frente selecionados. o local foi mantido em segredo até o último momento, a misteriosa programação só foi revelada no dia e não houve transmissão ao vivo.
antes da reunião, sam altman tuitou rapidamente:
“algumas novas ferramentas para desenvolvedores estão sendo lançadas hoje!
do último devday até este: o custo por token de gpt-4 para 4o mini caiu 98%, o número de tokens em nosso sistema aumentou 50 vezes, a inteligência do modelo fez um excelente progresso e houve um pouco drama no processo.
estou ansioso pelo progresso deste devday para o próximo. o caminho para agi nunca foi tão claro. "
como romain huet, diretor de experiência de desenvolvedor da empresa, informou anteriormente sobre a plataforma x, o devday deste ano não lançou nenhum modelo novo e focou apenas em melhorias de api.
e a openai realmente empacotou uma série de apis em tempo real, cache imediato, destilação de modelo, ajuste visual, otimização de playground, bem como expandiu o escopo da api o1 e aumentou o limite de taxa para desenvolvedores neste verdadeiro “dia do desenvolvedor”. atualizações importantes da ferramenta.
o preço destas novas apis não é absolutamente barato. muitos desenvolvedores comentam que a combinação de preços e capacidades as torna atraentes. este sincero pacote de presentes para desenvolvedores é apresentado de uma só vez, e a openai ainda quer ganhar mais dinheiro vendendo os melhores produtos.
fonte da imagem: @swyx |
1
api em tempo real: crie seu próprio aplicativo “her” em uma única etapa
como o recurso mais atraente atualmente, a api realtime permite que os desenvolvedores chamem gpt-4o-realtime-preview, o modelo subjacente do modo de voz avançado do chatgpt, para construir uma experiência de conversação voz a voz rápida e natural em aplicativos. suporta 6 vozes predefinidas para obter interação de voz de baixa latência.
no passado, ao criar assistentes de voz, os desenvolvedores precisavam contar com vários modelos para realizar tarefas diferentes: primeiro, usar um modelo de reconhecimento de fala como o whisper para transcrever áudio em texto, depois passar o texto para um modelo de linguagem para inferência e, finalmente, gerar fala. através de um modelo de conversão de texto em fala. não só o processo é complicado, mas a emoção e o sotaque podem ser facilmente perdidos e há atrasos significativos.
a api em tempo real requer apenas uma chamada para concluir todo o processo de conversação. melhore drasticamente a naturalidade e a capacidade de resposta das conversas transmitindo entrada e saída de áudio. ele usa uma conexão websocket persistente para trocar mensagens com gpt-4o e suporta chamadas de função, que podem responder rapidamente a solicitações, realizar operações como fazer pedidos ou fornecer serviços personalizados. ele também pode lidar automaticamente com interrupções, como modo de voz avançado, para garantir uma experiência de usuário mais tranquila. é muito adequado para suporte ao cliente, aprendizado de idiomas e outros cenários que exigem alta interatividade.
no local, a equipe demonstrou o assistente de voz construído por meio de api em tempo real, ajudando mais de 100 desenvolvedores na plateia a “ligar e fazer um pedido de 400 morangos para entrega”.