minhas informações de contato
correspondênciaadmin@informação.bz
2024-09-15
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
em 13 de setembro, a openai anunciou a estreia oficial da série de modelos o1, marcando uma nova era no campo da ia e inaugurando a era dos grandes modelos capazes de realizar tarefas de raciocínio complexas de uso geral. depois que o modelo foi lançado, a equipe de pesquisa da openai realizou um evento ama (ask me anything) na plataforma social x, revelando muitos detalhes do modelo da série o1 em profundidade.
openai disse que a série o1 inclui duas versões: o1-preview, que é uma iteração inicial do modelo completo, e o mais rápido e leve o1-mini. ao contrário dos modelos anteriores,o1 é capaz de gerar longas cadeias de processos de pensamento ocultos antes de dar a resposta final, demonstrando capacidades de raciocínio semelhantes às humanas。pesquisadores comparam o1 a um “alienígena” com superpoderes。
durante o processo de raciocínio,o1 usa aprendizagem por reforço para alcançar desempenho de "raciocínio". embora atualmente não haja planos para exibir esses tokens de cadeia de pensamento para usuários de api ou chatgpt, os pesquisadores revelaram que as instruções incorporadas nos prompts podem influenciar a maneira como o1 pensa. em contraste,gpt-4o não pode atingir o nível de desempenho da cadeia de pensamento de o1 por meio de prompts。
o modelo da série o1 usa o mesmo tokenizer do gpt-4o e permanece consistente no token de entrada. mas,o1 é capaz de lidar com tarefas mais longas e abertas, reduzindo a necessidade de agrupamento de entradas. no futuro, o1 também suportará janelas de contexto de entrada maiores。
o1 também demonstrou impressionantes habilidades de raciocínio e generalização, como decifrar códigos, ponderar questões filosóficas e fazer autotestes para avaliar suas habilidades.
a equipe de pesquisa também revelou queo desempenho do o1-preview em algumas tarefas de escrita personalizadas é equivalente ou ligeiramente melhor que o gpt-4o.
comparado com o1-preview, o1-mini é otimizado em tamanho e velocidade.
embora possa haver limitações em algumas áreas como o conhecimento mundial,o1-mini demonstra suas vantagens em tarefas stem (ciência, tecnologia, engenharia, matemática) e tarefas relacionadas a código. também,o1-mini pode explorar mais cadeias de pensamento do que o1-preview。
embora o1-preview atualmente não use ferramentas,a openai planeja adicionar recursos como chamadas de função, interpretadores de código e navegação na web. suporte de ferramentas, resultados estruturados e prompts do sistema também serão introduzidos em atualizações futuras。
além disso, a equipe de desenvolvedores do openai afirmou:no futuro, os usuários poderão controlar o tempo de pensamento e os limites de token do o1., e prometeu promover ativamente a implementação desta função.
a openai também está promovendo ativamente suporte de streaming e feedback de progresso de inferência na api. também,o1 já possui recursos multimodais integrados,espera-se que atinja o nível de ponta em tarefas de compreensão multimodal (mmlu).
o1-mini está atualmente aberto para usuários do chatgpt plus, mas há um limite de 50 solicitações por semana.todas as gorjetas contam para a mesma cota. openai promete,os níveis de acesso à api e os limites de taxas serão aumentados gradualmente no futuro, e descontos nos preços por volume serão fornecidos após o relaxamento das restrições.。
espera-se que o preço do modelo o1 siga a tendência de redução de preços a cada 1-2 anos. também,o suporte personalizado para ajuste fino está no roteiro do produto, mas o cronograma de lançamento específico ainda não está claro.
o1-mini é atualmente treinado com dados de outubro de 2023, e as iterações futuras usarão conjuntos de dados mais recentes para expandir seu conhecimento do mundo.
para aproveitar ao máximo as vantagens de raciocínio de o1,a equipe recomenda que os usuários forneçam exemplos informativos e concretos cobrindo casos extremos ao projetar prompts e especifiquem claramente as etapas e o estilo de raciocínio necessários. mas tenha cuidado,contexto irrelevante pode interferir no processo de inferência do modelo。
notícias econômicas diárias, informações públicas abrangentes
notícias econômicas diárias