lento e caro? o modelo de inferência openai "strawberry" está aqui, a que distância está o gpt-5?

2024-09-13

o “morango” da openai finalmente chegou.

em 12 de setembro, horário local, a gigante da inteligência artificial (ia) openai lançou a série openai o1 de modelos de inferência de ia com o codinome "strawberry", incluindo openai o1-preview e uma versão pequena do o1-mini.

de acordo com a openai, o1 passará mais tempo pensando nos problemas antes de reagir, assim como os humanos. através do treinamento, aprendi a refinar meu processo de pensamento, experimentar diferentes estratégias e reconhecer meus erros. raciocine sobre tarefas complexas e resolva problemas mais difíceis do que os modelos científicos, de codificação e matemáticos anteriores.

openai afirmou que esta série de modelos é um grande avanço para tarefas de raciocínio complexas, por isso também redefine o contador do produto para 1 e o nomeia openai o1. o “o” no nome pode referir-se a orion.

capacidade de raciocínio mais forte, cadeia de pensamento oferece novas oportunidades para segurança do modelo

o projeto “strawberry” era anteriormente chamado de “q*”, motivo que desencadeou a “batalha judicial” da openai e levou à demissão repentina do ceo da empresa, sam altman. na época, a diretora de tecnologia da openai, mira murati, disse aos funcionários que uma carta sobre o avanço da ia q* (pronuncia-se q-star) levou o conselho a aceitar a demissão, segundo fontes.

o progresso da openai em q* levou alguns membros da empresa a acreditar que este pode ser o seu avanço na descoberta de "superinteligência (agi, inteligência artificial geral)".

segundo informações oficiais, o1 possui muitos recursos que excedem em muito os do gpt-4o. classificada em 89º lugar no codeforces, classificada entre os 500 melhores alunos do país na olimpíada americana de matemática (aime) e ultrapassou o nível de doutorado em humanas.

segundo relatos, assim como os humanos podem pensar por muito tempo antes de responder a um problema difícil, o1 também usa uma série de pensamentos ao tentar resolver um problema. através da aprendizagem por reforço, o1 pode aprender a aprimorar sua cadeia de pensamento e melhorar as estratégias que utiliza. ele aprende a reconhecer e corrigir erros, dividir etapas complicadas em etapas mais simples e tentar abordagens diferentes quando a atual não estiver funcionando.

openai disse que o uso de cadeias de pensamento pode melhorar significativamente a segurança e a consistência porque o pensamento do modelo pode ser observado de forma clara, e o raciocínio do modelo sobre as regras de segurança é mais robusto para cenários fora da distribuição.

xu li, presidente executivo e ceo da sensetime, disse anteriormente que, no futuro, se um modelo é inteligente ou não depende inteiramente de a metodologia para construir dados da cadeia de pensamento do modelo ser forte o suficiente e se essa metodologia forte o suficiente pode ser sustentável e iterativo.

captura de tela parcial da cadeia de pensamento completa original do openai o1

no entanto, a openai optou por não mostrar a cadeia de pensamento original ao usuário, mas exibir um resumo da cadeia de pensamento. openai explicou ainda: "cadeias de pensamento ocultas fornecem uma oportunidade única para monitorar modelos. supondo que o modelo seja legível fielmente, então as cadeias de pensamento ocultas nos permitem 'ler' os pensamentos do modelo e compreender seu processo de pensamento. por exemplo, no futuro um pode querer monitorar as cadeias de pensamento em busca de sinais de manipulação dos usuários. no entanto, para fazer isso, o modelo deve ser capaz de expressar livremente seus pensamentos de uma forma inalterada, portanto, não podemos treinar qualquer conformidade com a política nas cadeias de pensamento ou nas preferências do usuário. não quero que os usuários vejam diretamente cadeias de pensamento inconsistentes.”

atualmente, os modelos o1 estão disponíveis para usuários plus e team do chatgpt, e usuários corporativos e educacionais poderão usá-los a partir da próxima semana.

mais lento, mas mais caro, não o “sucessor” do gpt-4o

atualmente, o limite semanal de mensagens é 30 para o1-preview e 50 para o1-mini. a openai disse que está trabalhando duro para aumentar o limite de mensagens e permitir que o chatgpt selecione automaticamente o modo apropriado com base nas solicitações fornecidas. ele também estende o acesso a mais níveis de usuários e planeja fornecer acesso o1-mini a todos os usuários gratuitos.

no lado da api (application programming interface), o1-preview cobra us$ 15 por 1 milhão de tokens de entrada (modelos grandes dividem o texto em palavras, conjuntos de caracteres ou combinações de palavras e sinais de pontuação) e us$ 60 por 1 milhão de tokens de saída. comparado com o gpt-4o, o custo de entrada é 3 vezes e o custo de saída é 4 vezes.

o1-mini é mais rápido no posicionamento e mais econômico. diz-se também que tem excelente desempenho em matemática e programação. é quase equivalente a o1 no desempenho em benchmarks de avaliação, como aime e codeforces. para o1-preview com limites de taxa mais altos e menor latência, o1-mini é 80% mais barato que o1-preview para usuários de api.

outras desvantagens também são óbvias. de acordo com relatos da mídia estrangeira, pode levar mais de 10 segundos para o1 responder a certas perguntas, e o modelo opta por exibir o progresso exibindo rótulos para as subtarefas que estão sendo executadas no momento.

ao mesmo tempo, dada a imprevisibilidade dos modelos generativos de ia, o1 pode ter outras falhas e limitações. por exemplo, às vezes podem ser cometidos erros em um jogo da velha. em um artigo técnico, a openai disse que alguns testadores haviam rumores de que o o1 era mais propenso a alucinações do que o gpt-4o e estava menos disposto a admitir quando não sabia a resposta a uma pergunta.

além disso, o1 atualmente não consegue navegar na web ou analisar arquivos.

altman admitiu francamente que o1 é a série de modelos mais poderosa e alinhada da openai atualmente, mas ainda tem falhas.

o presidente da openai, greg brockman, também disse que a tecnologia o1 ainda está em seus estágios iniciais e a openai está explorando ativamente, incluindo confiabilidade, alucinações e robustez (estabilidade) contra invasores.

openai disse que, como modelo inicial, openai o1 ainda não possui muitos dos recursos que tornam o chatgpt útil, como navegar nas informações da rede, fazer upload de arquivos e imagens, etc. para muitos casos comuns, o gpt-4o terá maiores capacidades no curto prazo. atualizações e melhorias regulares seguirão, e “o trabalho ainda está em andamento para tornar este novo modelo tão fácil de usar quanto o modelo atual”.

openai enfatiza que openai o1 não é o “sucessor” do gpt-4o e pode ser usado em conjunto com as funções de inferência do o1. ela planeja continuar a desenvolver e lançar modelos da série gpt após a série o1.

comparação de vários benchmarks entre openai o1 e gpt-4o

vale ressaltar que, de acordo com relatos anteriores da mídia estrangeira, a openai pode estar considerando estabelecer padrões de cobrança mais elevados para o modelo grande "morango" ou para o modelo principal da próxima geração, que pode atingir um máximo de us$ 2.000 por mês. para efeito de comparação, a taxa atual do chatgpt plus é de us$ 20 por mês.

openai turbulento, quando chegará o gpt-5?

de acordo com relatos da mídia estrangeira, mulati disse que está sendo construído o modelo principal da próxima geração gpt-5, que será muito maior que seu antecessor. embora a empresa ainda acredite que a escala ajudará a desbloquear novas capacidades de inteligência artificial, o gpt-5 provavelmente também incluirá a tecnologia de inferência lançada desta vez.

“existem dois paradigmas”, disse murati, “o paradigma de escala e este novo paradigma. queremos reuni-los”.

o caminho de desenvolvimento do gpt-5 não é fácil.

em 11 de setembro, horário local, alexis conneau, líder de pesquisa do gpt-4o/gpt-5 e líder técnico da versão openai de “her”, anunciou repentinamente sua renúncia. anteriormente, o cofundador e cientista-chefe da openai ilya sutskever, o líder da equipe “super alignment” jan leike e o cofundador john schulman , o chefe do chatgpt peter deng e outros renunciaram... atualmente, apenas dois dos 11 fundadores permanecem na openai .

não só há turbulência pessoal, mas também é revelado que a openai enfrenta uma lacuna de receitas e despesas de 5 mil milhões de dólares este ano.

mas o que se percebe é que a openai já está agindo.

o plano mais recente da openai é arrecadar aproximadamente us$ 6,5 bilhões, elevando a avaliação desta rodada de financiamento para us$ 150 bilhões. no final do mês passado, foi revelado que a openai estava preparando uma nova rodada de financiamento de us$ 1 bilhão liderada pela empresa de capital de risco thrive capital, com microsoft, apple e nvidia possivelmente participando do investimento quando a openai foi avaliada em apenas. mais de us$ 100 bilhões.

em 29 de agosto, horário local, a openai afirmou que o chatgpt tem atualmente mais de 200 milhões de usuários ativos semanais, o dobro do outono passado.

a openai afirma que 92% das empresas fortune 500 usam seus produtos, e o uso de sua api dobrou desde o lançamento do chatgpt-4o mini em julho.

o repórter do jornal qin sheng

(este artigo é do the paper. para mais informações originais, baixe o app “the paper”)

relatório/comentários

notícias

lento e caro? o modelo de inferência openai "strawberry" está aqui, a que distância está o gpt-5?

introdução

minhas informações de contato