notícias

Este modelo grande realmente curou meu distúrbio de leitura de papel

2024-08-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Máquina Coração Original

Autor: Zhang Qian

Em março deste ano, o CEO da Nvidia, Jensen Huang, realizou um evento muito especial. Ele convidou os autores do artigo inovador "Atenção é tudo que você precisa" para se reunirem no GTC para falar sobre a direção futura do desenvolvimento da IA ​​generativa.

“Tudo o que nosso campo desfruta hoje pode ser rastreado até aquele momento… Você mudou o mundo…” disse Huang Jenxun no local.



Para uma indústria orientada para a investigação científica como a IA, a próxima oportunidade de mudar o mundo também pode estar escondida num determinado artigo.

portanto,Temos assistido a um fenómeno invulgar neste círculo: alguns CEO com formação não técnica também começaram a ficar acordados até tarde a ler documentos, na esperança de reduzir o custo de tentativa e erro na tomada de decisões.

Se isso for verdade para os CEOs, muito menos para outros profissionais da área. Há algum tempo, OpenAI, Google e Meta têm feito grandes movimentos, e algumas startups também estão constantemente lançando novos modelos e métodos. Acredito que muitos profissionais sentirão que há muitos artigos para cobrir.

Fornecer artigos para a IA resumir é um método de leitura comum hoje em dia, mas muitos resumos de IA carecem de níveis claros e descrições detalhadas de inovações e limitações. Precisamos passar por várias rodadas de questionamentos para formar uma compreensão completa do artigo. Além disso, alguns diagramas de arquitetura de modelo chave e diagramas de resultados experimentais devem ser encontrados no artigo, e o tempo real economizado é muito limitado.

Em Tencent "Yuanbao”na última atualização, vimos as soluções para esses problemas. Seu novo "Modo de leitura profunda"apoiarLeitura longa e intensivaCapacidade de gerar análises modulares e ilustradas, muito adequado para leitura de jornais.

Para verificar o efeito desta nova função, a Machine Heart conduziu um teste real em primeira mão.

“Leitura intensiva” do artigo, onde está a essência?

Como é usar IA para ler artigos? Muitas vezes é: você lança um PDF e ele retorna um resumo + vários resumos (às vezes pode chegar a 10). Esta informação é realmente útil, mas por vezes é difícil distinguir quais são os destaques, o que o documento resolve e o que não resolve, e quais as questões centrais que valem a pena analisar.

Nossos testes reais descobriram que "Yuanbao" resolve esses problemas, fornecendo uma série de informações modulares e estruturadas.

Pegue um artigo SIGGRAPH que testamos como exemplo. Se você jogar o papel diretamente nele, o resumo que ele retornará não será muito diferente de outras IAs. No entanto, contanto que você role para baixo com paciência, verá um botão para “ler o documento em profundidade”. Este é o botão de “um clique” para leitura intensiva do artigo.



Diferente da interface anterior para resumo de artigos,A leitura intensiva da página quebrará o papel em muitas camadas., o histórico da pesquisa, os métodos de pesquisa, o projeto experimental, a análise dos resultados e a conclusão geral são organizados em um módulo, muito parecido com o layout do artigo que Machine Heart geralmente apresenta. Tudo isso pode ser acessado rapidamente por meio do contorno à esquerda.



Embora não haja muitas palavras em cada módulo, essas palavras são, na verdade, muito informativas. Por exemplo, no módulo de antecedentes de pesquisa, o parágrafo “Dificuldades de Pesquisa” descreve quatro dificuldades em apenas três frases curtas, e “Trabalho Relacionado” é uma versão altamente condensada do “trabalho relacionado” no Capítulo 2. Em um parágrafo, descreve as quatro dificuldades neste domínio As principais vias técnicas são claramente apresentadas. Portanto, após a leitura deste módulo, podemos basicamente entender qual problema o artigo estuda e que tipo de pesquisa estamos enfrentando.

Além dessas informações estruturadas convencionais, a leitura intensiva de Yuanbao também tem um design atraente——Ele listará os pontos fortes e fracos do artigo, para que os pesquisadores possam entender rapidamente o que podem aprender com este artigo e quais questões valem a pena continuar a estudar.





Por que esse recurso é tão importante? Peng Minghui, professor da Universidade Tsinghua em Taiwan, escreveu certa vez num artigo sobre a leitura de artigos científicos que os livros didáticos são diferentes dos livros didáticos, pois fornecem conhecimento sistemático compilado e organizado por outros, enquanto os artigos científicos exigem que os leitores recuperem e organizem o conhecimento não organizado por conta própria. Filtre e organize o conhecimento. em,A capacidade de analisar os pontos fortes e fracos da pesquisa existente é particularmente importante. Esta é uma parte fundamental do pensamento crítico e uma forma importante de melhorar a pesquisa acadêmica.. Ao analisar e resumir rapidamente as vantagens e desvantagens dos artigos, Yuanbao pode ajudar os pesquisadores a economizar muito tempo na triagem e na compreensão preliminar, permitindo-lhes concentrar-se mais rapidamente nos artigos diretamente relacionados à sua pesquisa.

No entanto, se achar que as informações anteriores são muito tediosas, você também pode pular diretamente para a última.Módulo "Principais perguntas e respostas". Aqui estão algumas das perguntas mais críticas para ajudá-lo a compreender rapidamente o valor do artigo e, então, determinar se vale a pena gastar tempo lendo o texto original. É claro que muitos assistentes de IA anteriores também apresentarão algumas perguntas-chave no final da resposta, e você pode obter a resposta com um clique. No entanto, se você for um iniciante ou um leitor com formação interdisciplinar, pode não ser fácil. para você julgar quais questões são mais críticas. A apresentação direta do Yuanbao parece mais intuitiva.



A imagem original é o número original. Quem disse que a IA não pode adicionar imagens ao ler artigos?

Ao ler um artigo, muitas pessoas têm o hábito de ler a descrição do artigo enquanto olham as fotos. É mais rápido e fácil entender dessa forma. No entanto, a maioria dos aplicativos de IA no mercado agora retornam resultados de texto. Se você quiser ver as imagens, precisará encontrá-las no texto original.

Em nossos testes descobrimos queYuanbao é uma das poucas IAs que pode recortar diretamente as imagens do papel e colocá-las nas posições correspondentes dos parágrafos.. Por exemplo, se um módulo fala sobre arquitetura, ele colocará o diagrama de arquitetura correspondente:





Se você falar sobre resultados experimentais em um determinado módulo, ele colocará o gráfico correspondente:





Como todos sabemos, não há como resolver completamente o problema da ilusão dos grandes modelos. Portanto, esta apresentação de números originais é, na verdade, um método de saída mais confiável, que facilita aos leitores a verificação das respostas do modelo a qualquer momento, e é mais seguro quando usado como referência.

Além disso, também descobrimos que se você precisar escrever um blog ou outra saída externa, o Yuanbao também pode ajudá-lo a desenhar gráficos, e você não precisa dizer onde encontrar os dados. Ele pode localizar as tabelas relevantes no. papel sozinho e coloque os dados. Extraia e desenhe. Esta função pode ser acionada através do botão “Faça uma pergunta” no lado direito da página de leitura intensiva.



Você pode ler quando e onde quiser. Quem disse que existem muitos obstáculos para a leitura de jornais?

Além de informações estruturadas e resultados com imagens e textos, também descobrimos durante o teste que o Yuanbao possui algumas pequenas funções muito práticas que podem tornar a leitura de artigos mais conveniente.

primeiro éTradução e pesquisa de palavras, essas são duas pequenas funções práticas da interface de leitura do "texto original". A tradução de palavras cruzadas pode ajudar os leitores com inglês ruim a superar as barreiras linguísticas a qualquer hora e em qualquer lugar, e a pesquisa de palavras cruzadas vai um passo além. Por exemplo, a função de pesquisa do Yuanbao foi transformada em um plug-in, para que você possa pesquisar. para obter informações relevantes a qualquer momento. Além disso, a explicação dada por Yuanbao não é apenas um breve resumo, mas também uma expansão modular. É realmente “estruturada” e “informativa” em todos os detalhes.





seguido pela"Leitura off-line”. A praticidade dessa função é que ela permite revisar o conteúdo da leitura intensiva e o texto original em “modo avião” sem perder tempo fragmentado. Isto permite que as companhias aéreas recuperem algum terreno na competição com o transporte ferroviário de alta velocidade. Talvez a próxima inspiração dos pesquisadores venha da revisão da leitura intensiva no avião.



A última pequena função é "calculadora”. Há algum tempo, a IA causou muita discussão porque não sabia dizer qual era maior, 9,9 ou 9,11. No Yuanbao, descobrimos que ele possui uma função de calculadora integrada que garante que as respostas sejam geradas com base em cálculos precisos. Este recurso é muito útil quando lemos dados experimentais.

Por trás da leitura intensiva de longos artigos: Acontece que há orientação especializada

De acordo com informações oficiais, esta atualização do Tencent Yuanbao concentra-se na “leitura intensiva de textos longos” e pode suportar nativamente a entrada de até quase 500.000 palavras. Os papéis que usamos no teste estão longe de atingir esse comprimento, e a maioria dos papéis com os quais temos contato diariamente não consegue atingir esse comprimento. Portanto, ao usar o Yuanbao para ler artigos intensamente, a janela de contexto é suficiente na maioria dos casos. Sua modularidade, saída gráfica e de texto e pequenas funções como busca de palavras e tradução também tornam a leitura de artigos verdadeiramente conveniente e eficiente, dando mais um passo em direção à "praticidade".

Esta evolução é inseparável do modelo por trás dela - a atualização do grande modelo Hunyuan da Tencent. É relatado que, para melhorar o profissionalismo e a praticidade do modelo na área profissional, a equipe Tencent HunyuanEspecialistas na área são especialmente convidados para delinear as competências essenciais de cada área profissional e formular padrões para responder a questões profissionais., permitindo que o modelo atue como um verdadeiro especialista no domínio. Então, depois de usá-lo, sentimos que Yuanbao sabe quais informações os leitores precisam e como as informações devem ser apresentadas.

Além de artigos, esse novo recurso também pode ser utilizado para leitura intensivaRelatórios financeiros, relatórios de pesquisaTexto de igual comprimento. Nesses cenários, ele pode classificar informações de múltiplas dimensões e gerar gráficos profissionais, como os gráficos de análise da DuPont, com base no conteúdo do relatório, permitindo que pessoas que não entendem esses documentos entendam a situação financeira da empresa e outras informações.



Porém, para o cenário de leitura de uma tese, Yuanbao ainda tem espaço para melhorias, como a falta de comparação completa do texto original-tradução na interface de leitura do texto original, e às vezes a identificação das fórmulas não é suficientemente precisa. Também esperamos que Yuanbao possa melhorar esses problemas em atualizações futuras.

Mas como um aplicativo lançado há apenas dois meses, o desempenho do Tencent Yuanbao já superou as expectativas. Sua trajetória evolutiva nos permite ver como grandes modelos se transformarão em nova produtividade, passo a passo. Esperamos também que este APP nos traga mais surpresas.