notícias

openai devday “sem modelos, sem novos recursos”, o que mais os desenvolvedores podem esperar?

2024-10-01

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

imagem de cabeçalho gerada por doubao
palavras de dica: interação do desenvolvedor, chamada de api, modelo grande de ia, cyberpunk, detalhes de alta definição

no ano passado, a openai realizou uma conferência de desenvolvedores (devday 2023) que causou agitação na indústria em são francisco, lançando uma série de novos produtos e ferramentas, incluindo gpt-4 turbo que suporta contexto de 128k, redução de preço de api, novos assistentes api, e gpt-4 turbo para recursos visuais, api dall·e 3 e um modelo json amplamente aprimorado, bem como os malfadados gpts e a plataforma semelhante à app store gpt store.

o ceo sam altman disse com confiança: "esperamos que você possa voltar no próximo ano. comparado com os novos resultados que estamos construindo cuidadosamente, o que divulgamos hoje parecerá muito desatualizado", aumentando novamente as expectativas.

depois de experimentar uma nova rodada de demissões de equipes de gerenciamento sênior, o evento anual devday 2024 da openai está se aproximando e todos têm uma pergunta em mente: o que acontecerá a seguir?

no entanto, o openai devday deste ano mudou discretamente de tom. primeiro, foi anunciado que o formato da conferência seria ajustado, passando de um evento de grande escala para uma série de sessões interativas para desenvolvedores no estilo roadshow.

o que é ainda mais surpreendente é que, de acordo com spoilers oficiais, a openai não lançará seu principal modelo principal de próxima geração durante o devday, mas se concentrará em atualizações de apis e serviços de desenvolvedor.

resumindo: o modelo da próxima geração ainda está assando no forno, então não vamos falar disso.

devday não é mais uma conferência modelo, desta vez é realmente uma conferência de “desenvolvedores”.

1

sem o gpt-5 devday, o que mais os desenvolvedores esperam?

embora a openai tenha anunciado que não lançará uma nova geração de modelos emblemáticos no devday este ano, a indústria ainda tem muitas expectativas para esta conferência de desenvolvedores. segundo especulações, a openai pode se concentrar no lançamento de novos recursos de api, como raciocínio de longo prazo e chamada de função, ao mesmo tempo em que aprimora os recursos do agente do modelo para fornecer aos desenvolvedores mais autonomia e a possibilidade de integração com outras apis.

a api do modo de voz 4o também é altamente esperada

a silicon star também se comunicou com vários desenvolvedores para entender suas reais necessidades de apis. multimodalidade e desempenho se tornaram o foco de atenção.

talkme é um produto toc de aprendizagem de idiomas para mercados estrangeiros. o ceo jia zijian disse à silicon star que os desenvolvedores de ia que vão para o exterior geralmente escolhem a api da openai, e um pequeno número deles usa gemini e claude. a principal api utilizada pela talkeme é openai, além de assistência gemini.

"o gpt-3.5 turbo foi basicamente eliminado e todos mudarão para 4o-mini ou 4o para melhorar a lógica de negócios. para produtos saas mais complexos, você pode considerar o gpt-4, que tem capacidades mais fortes e é relativamente mais caro."

o1 também está atualmente sendo considerado pela talkme, mas devido ao seu alto custo, está atualmente limitado à pré-pesquisa em funções experimentais e não pode ser colocado na produção formal de aplicações toc.

“as capacidades do o1 são realmente muito fortes, mas do ponto de vista da engenharia, usar o1 para alguns, 4o para alguns e 4omini para alguns pode basicamente cobrir o cenário de desenvolvimento.”

em relação às expectativas para a api openai, jia zijian disse que há três pontos principais:

o primeiro é a baixa latência.

a segunda são as capacidades multimodais sob baixa latência: “parte de nossas capacidades multimodais estão atualmente usando 4o e algumas estão usando gemini”.

o terceiro ponto é a saída json mais estável. "a divulgação do openai ainda não é tão rigorosa. é mais provável que seja dominada por algoritmos de cientistas. como resultado, a saída json do openai não é muito estável. em muitos cenários, é melhor escrever suas próprias regras regulares para analisar o conteúdo do texto de saída nesta dimensão, o google é pior que o openai. se bem feito, será mais benéfico para os desenvolvedores se houver uma saída json estável.

em termos de preço, “exceto o1, outros preços são relativamente baratos”.

chen yang, diretor de operações de motores cocos e gerente da lao cai miao, conduziu uma análise da perspectiva dos produtos domésticos de ia. ele disse à silicon stars que em termos de capacidades atuais e velocidade de resposta, openai ainda é o mais forte. por outro lado, os desenvolvedores nacionais consideram mais a conformidade e o roi, enquanto qwen, doubao, minimax e modelos domésticos como wenxin também estão se recuperando. , e a relação preço/desempenho de alguns produtos após descontos não é mais fraca do que openai.

ele disse: "a demanda futura deve ser multimodal. as solicitações http post tradicionais serão gradualmente eliminadas. doubao doméstico assumiu a liderança no uso do webrtc e o openai webrtc está prestes a ser aberto. portanto, além da qualidade do modelo , o mercado futuro deve considerar o efeito abrangente, a combinação de asr, tts, webrtc, etc., nesta perspectiva, os produtos nacionais têm maiores vantagens na integração, e há uma chance de obter vantagem na guerra de preços.

a yuhe technology visa aplicações de cenário empresarial, chi guangyao, espera que a atualização da api openai possa fornecer melhorias em dois aspectos: recursos de engenharia integrados para reduzir ou detectar alucinações para o1, fornecer opções de uso mais flexíveis, permitindo que os usuários especifiquem; se use recursos de raciocínio complexos nesta solicitação.

1

agi pode esperar, mas o dinheiro não pode esperar

a mudança de foco do devday se alinha com a estratégia recente da openai de tomar medidas mais incrementais no desenvolvimento de ia generativa.

a empresa está atualmente otimizando seus principais modelos gpt-4o e gpt-4o mini, enfrentando o desafio de se manter à frente da tecnologia na corrida pela ia generativa. de acordo com alguns benchmarks, a openai parece ter perdido a liderança tecnológica absoluta.

um dos motivos é a dificuldade em obter dados de treinamento de alta qualidade. de acordo com dados da originality.ai, mais de 35% dos 1.000 principais sites do mundo baniram o web crawler da openai.

um estudo realizado pelo projeto de proveniência de dados do mit descobriu que cerca de 25% dos dados de fontes de “alta qualidade” tiveram seu uso restrito no treinamento de modelos de ia.

para enfrentar esses desafios de aquisição de dados, a openai assinou uma série de acordos de licenciamento de alto valor com editores e corretores de dados.

outro aspecto da pressão vem do custo operacional da empresa. segundo a reuters, a openai espera que a receita este ano atinja us$ 3,7 bilhões e um prejuízo de us$ 5 bilhões, que será usado principalmente para pagar custos de serviços operacionais e salários de funcionários. e aluguel de escritórios. não inclui outras despesas importantes, como incentivos de capital para funcionários.

para resolver o problema de financiamento, a openai está promovendo uma nova rodada de financiamento. no início de setembro, surgiram notícias de financiamento de que a openai poderia receber um investimento de us$ 6,5 bilhões a uma avaliação de us$ 150 bilhões. segundo fontes, esta avaliação depende de a openai conseguir transformar a sua estrutura corporativa num modelo de lucro semelhante aos seus concorrentes anthropic e xai.

no entanto, a última notícia é que a apple decidiu não participar na última ronda de financiamento de 6,5 mil milhões de dólares. além disso, a saída do diretor de tecnologia, diretor de pesquisa e vice-presidente de pesquisa na semana passada também adicionou incerteza à openai.

embora a diretora financeira da openai, sarah friar, tenha revelado aos investidores em 27 de setembro que esta rodada de financiamento foi superada e está programada para ser concluída antes do final do mês, as negociações de financiamento ainda não foram finalizadas e os participantes e valores específicos ainda podem mudar .

o foco nas apis pode estar relacionado à pressão financeira que a openai enfrenta.

de acordo com relatórios de pesquisa e dados relacionados publicados pela futuresearch, a receita anual da openai é de us$ 3,4 bilhões, 76% dos quais vêm de usuários pagos do chatgpt (assinaturas chatgpt plus, chatgpt enterprise e chatgpt team), e os serviços de interface api contribuem com 15% do faturamento da empresa. receita, aproximadamente us$ 510 milhões.

o modelo de serviço orientado por api já ajudou plataformas como a aws a crescer rapidamente. à medida que mais e mais empresas usam apis da amazon para desenvolver novos produtos ou serviços, gerando assim efeitos de rede, o valor de seu ecossistema continua a crescer.

embora a atual receita direta de apis da openai não seja alta, no contexto da desaceleração do chatgpt e da openai tomando medidas mais incrementais para desenvolver ia generativa, pode ser possível fornecer apis melhores para a empresa abre novas oportunidades de mercado e promove a colaboração com outras empresas .

sem o gpt-5, os executivos saíram e se transformaram em uma empresa com fins lucrativos. esta série de eventos indica que a comercialização se tornou um problema urgente a ser resolvido por sam altman.

durante muito tempo, sam altman usou excelentes habilidades para manipular o sentimento público enquanto dirigia seu próprio negócio, tornando-o o líder entre os ceos da indústria de tecnologia.

mas não se surpreenda se você o ouvir falar sobre os planos da openai de mudar para um “modelo de lucro” no openai devday em são francisco.