como o1 “raciocina” como um humano? perguntas e respostas da equipe de pesquisa openai: revelando detalhes do modelo, planos futuros e dicas para maximizar o desempenho o1

2024-09-15

em 13 de setembro, a openai anunciou a estreia oficial da série de modelos o1, marcando uma nova era no campo da ia e inaugurando a era dos grandes modelos capazes de realizar tarefas de raciocínio complexas de uso geral. depois que o modelo foi lançado, a equipe de pesquisa da openai realizou um evento ama (ask me anything) na plataforma social x, revelando muitos detalhes do modelo da série o1 em profundidade.

fonte da imagem: plataforma social x

assistente de ia de nível “alienígena”

openai disse que a série o1 inclui duas versões: o1-preview, que é uma iteração inicial do modelo completo, e o mais rápido e leve o1-mini. ao contrário dos modelos anteriores,o1 é capaz de gerar longas cadeias de processos de pensamento ocultos antes de dar a resposta final, demonstrando capacidades de raciocínio semelhantes às humanas。pesquisadores comparam o1 a um “alienígena” com superpoderes。

fonte da imagem: plataforma social x

durante o processo de raciocínio,o1 usa aprendizagem por reforço para alcançar desempenho de "raciocínio". embora atualmente não haja planos para exibir esses tokens de cadeia de pensamento para usuários de api ou chatgpt, os pesquisadores revelaram que as instruções incorporadas nos prompts podem influenciar a maneira como o1 pensa. em contraste,gpt-4o não pode atingir o nível de desempenho da cadeia de pensamento de o1 por meio de prompts。

fonte da imagem: plataforma social x

o modelo da série o1 usa o mesmo tokenizer do gpt-4o e permanece consistente no token de entrada. mas,o1 é capaz de lidar com tarefas mais longas e abertas, reduzindo a necessidade de agrupamento de entradas. no futuro, o1 também suportará janelas de contexto de entrada maiores。

o1 também demonstrou impressionantes habilidades de raciocínio e generalização, como decifrar códigos, ponderar questões filosóficas e fazer autotestes para avaliar suas habilidades.

a equipe de pesquisa também revelou queo desempenho do o1-preview em algumas tarefas de escrita personalizadas é equivalente ou ligeiramente melhor que o gpt-4o.

a versão mini é ainda mais forte?

comparado com o1-preview, o1-mini é otimizado em tamanho e velocidade.

fonte da imagem: plataforma social x

embora possa haver limitações em algumas áreas como o conhecimento mundial,o1-mini demonstra suas vantagens em tarefas stem (ciência, tecnologia, engenharia, matemática) e tarefas relacionadas a código. também,o1-mini pode explorar mais cadeias de pensamento do que o1-preview。

fonte da imagem: plataforma social x

o1 em breve apoiará a integração de ferramentas e a compreensão multimodal

embora o1-preview atualmente não use ferramentas,a openai planeja adicionar recursos como chamadas de função, interpretadores de código e navegação na web. suporte de ferramentas, resultados estruturados e prompts do sistema também serão introduzidos em atualizações futuras。

fonte da imagem: plataforma social x

além disso, a equipe de desenvolvedores do openai afirmou:no futuro, os usuários poderão controlar o tempo de pensamento e os limites de token do o1., e prometeu promover ativamente a implementação desta função.

a openai também está promovendo ativamente suporte de streaming e feedback de progresso de inferência na api. também,o1 já possui recursos multimodais integrados,espera-se que atinja o nível de ponta em tarefas de compreensão multimodal (mmlu).

fonte da imagem: plataforma social x

o1-mini tem um limite de 50 solicitações por semana

o1-mini está atualmente aberto para usuários do chatgpt plus, mas há um limite de 50 solicitações por semana.todas as gorjetas contam para a mesma cota. openai promete,os níveis de acesso à api e os limites de taxas serão aumentados gradualmente no futuro, e descontos nos preços por volume serão fornecidos após o relaxamento das restrições.。

espera-se que o preço do modelo o1 siga a tendência de redução de preços a cada 1-2 anos. também,o suporte personalizado para ajuste fino está no roteiro do produto, mas o cronograma de lançamento específico ainda não está claro.

fonte da imagem: plataforma social x

segredos para maximizar o desempenho do o1

o1-mini é atualmente treinado com dados de outubro de 2023, e as iterações futuras usarão conjuntos de dados mais recentes para expandir seu conhecimento do mundo.

para aproveitar ao máximo as vantagens de raciocínio de o1,a equipe recomenda que os usuários forneçam exemplos informativos e concretos cobrindo casos extremos ao projetar prompts e especifiquem claramente as etapas e o estilo de raciocínio necessários. mas tenha cuidado,contexto irrelevante pode interferir no processo de inferência do modelo。

notícias econômicas diárias, informações públicas abrangentes

notícias econômicas diárias

relatório/comentários

notícias

como o1 “raciocina” como um humano? perguntas e respostas da equipe de pesquisa openai: revelando detalhes do modelo, planos futuros e dicas para maximizar o desempenho o1

assistente de ia de nível “alienígena”

a versão mini é ainda mais forte?

o1 em breve apoiará a integração de ferramentas e a compreensão multimodal

o1-mini tem um limite de 50 solicitações por semana

segredos para maximizar o desempenho do o1

introdução

minhas informações de contato