interpretação｜xiao yanghua: que impacto trará o modelo o1 com habilidade matemática de nível de doutorado?

interpretação｜xiao yanghua: que impacto o modelo o1 com habilidade matemática de nível de doutorado trará?

2024-09-13

·a capacidade de raciocínio de nível especializado não é uma tática de perguntas e respostas, requer uma forte capacidade de raciocínio. a dificuldade em treinar capacidades de raciocínio de grandes modelos é que um grande número de processos de pensamento humano nunca são expressos, de modo que os dados sobre o processo de pensamento são extremamente escassos. ele especulou que o openai deveria usar uma grande quantidade de dados sintéticos desta vez.

·é cada vez mais difícil para os humanos melhorar a sua compreensão da inteligência artificial para acompanhar a velocidade de desenvolvimento da inteligência artificial. este é um enorme desafio de governação. capacidades, é muito provável que haverá momentos em que os humanos serão incapazes de ativar seus superpoderes porque estão além do nível da cognição humana.

o novo modelo o1 lançado pela openai possui poderosas capacidades de raciocínio. mapa visual da china

em 12 de setembro, horário local, a openai lançou uma série de modelos de nova geração o1. em comparação com os modelos anteriores, este modelo demonstrou fortes capacidades de raciocínio e teve um desempenho tão bom quanto os alunos de doutorado ao lidar com tarefas de referência em física, química e biologia. essa capacidade é algo que os modelos anteriores não tinham.

em 13 de setembro, xiao yanghua, professor e supervisor de doutorado da escola de ciência da computação e tecnologia da universidade fudan e diretor do laboratório chave de ciência de dados de xangai, disse em entrevista ao the paper que o surgimento do modelo o1 significa que as capacidades de raciocínio de grandes modelos podem atingir totalmente o nível de especialista. isso pode ser considerado um marco no progresso da inteligência artificial, o que melhorará muito a aplicação de modelos no lado empresarial.

mas ele também admitiu que, à medida que as capacidades intelectuais, perceptivas e racionais do modelo continuarem a melhorar, será difícil prever o impacto que a inteligência artificial terá nos seres humanos no futuro. do desenvolvimento agora excede a velocidade da compreensão humana e a governança da inteligência artificial será um enorme desafio", disse xiao yanghua.

bom em raciocinar sobre tarefas complexas, desempenho semelhante ao de um ph.d.

por ser um modelo inicial, o novo modelo de inferência o1 ainda não possui totalmente as funções utilizadas pelo chatgpt, como navegação nas informações da rede, upload de arquivos e imagens, etc. mas a openai disse que esta é uma melhoria significativa para tarefas complexas de raciocínio e representa um novo nível de capacidades de inteligência artificial.

"através do treinamento, eles aprendem a refinar seus processos de pensamento, experimentar estratégias diferentes e reconhecer seus erros." algoritmos de aprendizagem por reforço em grande escala ensinam os modelos a pensar de forma eficaz usando suas cadeias de pensamento durante o processo de treinamento, e o modelo o1 pode pensar antes. responder ao usuário gera uma longa cadeia interna de pensamentos. com mais aprendizado por reforço e mais tempo para pensar, o desempenho do o1 continua a melhorar. ele aprende a dividir etapas complicadas em etapas mais simples. quando o método atual não funciona, ele tenta uma abordagem diferente.

o novo modelo de inferência o1 é excelente em matemática e programação, destacando-se na geração e depuração precisa de códigos complexos. openai avaliou o desempenho matemático do modelo no aime (american mathematics invitational competition) no exame aime de 2024, o gpt-4o resolveu em média apenas 12% (1,8/15) dos problemas. para uma única amostra de cada problema, o1 teve média de 74. %(11,1/15). no exame de qualificação da olimpíada internacional de matemática (imo), o gpt-4o resolveu corretamente apenas 13% dos problemas, enquanto o novo modelo de raciocínio obteve 83%.

o novo modelo pode raciocinar sobre tarefas complexas, atuando como um estudante de doutorado em tarefas de referência em física, química e biologia. openai fez benchmarks de diamantes gpqa em química, física e biologia. para comparar o modelo com humanos, especialistas com doutorado foram recrutados para responder perguntas em conjunto.

“descobrimos que o o1 superou o dos especialistas humanos, tornando-se o primeiro modelo a fazê-lo neste benchmark. esses resultados não significam que o o1 seja mais capaz do que os phds em todos os aspectos, apenas que o modelo é melhor para resolver as necessidades de phd dos pesquisadores da área da saúde. pode usar o1 para anotar dados de sequenciamento de células, os físicos podem usar o1 para gerar as fórmulas matemáticas complexas necessárias para a óptica quântica e pode ser usado por desenvolvedores em todas as áreas, disse openai para construir e executar fluxos de trabalho de várias etapas.

os recursos de raciocínio milestone melhorarão muito os efeitos do aplicativo

"o grande modelo de linguagem anterior era mais parecido com um estudante de artes liberais e ainda está longe do nível de um estudante de ciências. mas a habilidade central da inteligência humana é pensar e pensar. o novo modelo de raciocínio da série o1 da openai mostra o processo de pensamento humano. " xiao yanghua disse: a essência do novo modelo de inferência o1 ainda é um grande modelo de linguagem, mas aproveita totalmente o potencial do grande modelo. no passado, a capacidade de geração de grandes modelos era determinada pelo corpus, que era como “familiarizado com trezentos poemas tang, e você pode recitá-los mesmo que não saiba como compô-los”. no entanto, a capacidade de raciocínio especializado não é uma tática de perguntas e respostas, mas requer uma forte capacidade de raciocínio. a dificuldade em treinar capacidades de raciocínio de grandes modelos é que um grande número de processos de pensamento humano nunca são expressos, de modo que os dados sobre o processo de pensamento são extremamente escassos. ele especulou que o openai deveria usar uma grande quantidade de dados sintéticos desta vez.

"openai tem uma clara vantagem de ser o pioneiro. seu modelo básico é mais forte, coleta muitos dados do processo de pensamento, filtra e sintetiza uma grande quantidade de dados de pensamento de alta qualidade e possui fortes capacidades de avaliação. quais processos de raciocínio estão corretos e quais processos de raciocínio isso requer o uso de aprendizagem por reforço. a aprendizagem por reforço é essencialmente um processo de exploração e tentativa e erro. se não funcionar, tente outro método "xiao yanghua disse que com a ajuda dessas tecnologias e dados, openai tornou o modelo grande um modelo real para estudantes de ciências no sentido de atingir o nível de especialista.

chen yunwen, presidente da daguan data, disse que os modelos anteriores não podiam calcular problemas matemáticos avançados e complexos, e o1 melhorou as capacidades matemáticas e de raciocínio, o que é uma grande melhoria. no entanto, a melhoria das capacidades matemáticas não significa que o paradigma de i&d dos grandes modelos tenha sofrido alterações essenciais, mas apenas melhorias direcionadas para deficiências anteriores.

na opinião de xiao yanghua, o surgimento do o1 não foi inesperado “na verdade, julgamos desde o início que os modelos grandes teriam habilidades emocionais e racionais mais fortes. aqui, e o efeito é incrível.” ele acredita que, no futuro, o openai poderá se diferenciar em muitos modelos grandes que são bons em fazer coisas diferentes com base no grande modelo geral.

por exemplo, as versões anteriores do gpt-4 estavam familiarizadas com todos os conhecimentos e fatos e enfatizavam as habilidades intelectuais; o gpt-4o enfatizava a interação multimodal e enfatizava as habilidades perceptivas; a melhoria da racionalidade do modelo permitirá que a indústria to b inaugure um tremendo desenvolvimento. “a maior dor e gargalo do to b reside nas capacidades de raciocínio de grandes modelos. o surgimento do novo modelo de inferência da série o1 significa que muitos problemas na indústria to b podem ser bastante aliviados no futuro.”

desafios trazidos pelo rápido desenvolvimento da inteligência artificial

"openai é realmente poderoso. embora o roteiro técnico da openai até agora não tenha ultrapassado o escopo da cognição, todos nós conhecemos a direção do desenvolvimento de grandes modelos, incluindo multimodalidade e capacidades de raciocínio aprimoradas, mas apenas a openai rapidamente a transformou em realidade. eles treinam grandes modelos exatamente da mesma maneira que os seres humanos. eles têm ideias muito fortes sobre o desenvolvimento intelectual humano e o desenvolvimento cognitivo e têm uma compreensão muito clara do crescimento e da evolução humana. " explicar.

openai tem vantagens óbvias de ser o pioneiro em relação ao desenvolvimento de modelos domésticos em grande escala, "as vantagens do openai são todas desvantagens para nós. precisamos nos acalmar e recuperar o atraso. há apenas o primeiro lugar no caminho geral da inteligência artificial, não o segundo. ." no entanto, no longo prazo, xiao yanghua disse que há um teto para a melhoria das capacidades individuais de modelos grandes. porque os dados originais reais dos seres humanos são limitados e a velocidade de produção é lenta. "atualmente, a openai usa dados humanos para sintetizar novos dados para aprimorar as capacidades de raciocínio. no entanto, os dados sintéticos são limitados pelos dados originais. não pode sintetizar dados infinitos, nem pode obter dados essencialmente novos. não pode inventar novos assuntos por causa disso. propor uma nova teoria como einstein. "em termos de hardware, o raciocínio requer menos poder de computação do que o treinamento, mas devido à extensão da cadeia de pensamento, os requisitos para a eficiência do raciocínio tornam-se maiores, o que apresenta requisitos mais elevados para a aceleração e otimização do processo de raciocínio.

contudo, à medida que os grandes modelos melhoraram em muitos aspectos, trouxeram desafios à governação. o desafio é que a compreensão humana sobre eles não melhorou tão rapidamente como se desenvolveu.

o filósofo kant dividiu o processo cognitivo humano em três etapas: perceptiva, intelectual e racional. hoje em dia, a sensibilidade, a inteligência e a racionalidade dos grandes modelos estão melhorando e provavelmente superarão os humanos. muito poucas pessoas conseguem ser fortes nessas três cognições.

“atualmente o1 atingiu o nível de doutorando. no futuro, atingir o nível de cientista será apenas um processo de obtenção de mudanças quantitativas. por exemplo, o que significa a atual capacidade de raciocínio dos grandes modelos? ela pode realmente ser usada em ia a proporção de pessoas acima do nível de conhecimento só se tornará cada vez menor? nível em matemática, física, química ou matemática. quantos de nós podemos compreender, reconhecer e controlar a ia ", disse xiao yanghua, os seres humanos estão atualmente em nível de doutorado. falta a estrutura cognitiva básica da inteligência artificial. isso é enorme. desafio de governação. tópicos como emprego, economia, ética e relações sociais suscitarão uma discussão generalizada. estão além do nível da cognição humana.”

o repórter do jornal zhang jing

(este artigo é do the paper. para mais informações originais, baixe o app “the paper”)

relatório/comentários

notícias

interpretação｜xiao yanghua: que impacto o modelo o1 com habilidade matemática de nível de doutorado trará?

introdução

minhas informações de contato