Relatório semanal de IA | O modelo grande não consegue determinar qual é maior, 9.11 ou 9.9 OpenAI lança modelo leve GPT-4o mini

Relatório semanal de IA | O modelo grande não consegue determinar qual é maior, 9.11 ou 9.9 OpenAI lança modelo leve GPT-4o mini;

2024-07-21

O modelo grande não consegue determinar qual é maior, 9,11 ou 9,9

Um problema de matemática que é difícil para os alunos do ensino primário tem confundido muitos grandes modelos de IA no país e no estrangeiro. Qual é maior, 9,11 ou 9,9? Em relação a esta questão, em 17 de julho, os repórteres do China Business News testaram 12 modelos grandes, entre os quais Alibaba Tongyi Qianwen, Baidu Wenxinyiyan, Minimax e Tencent Yuanbao responderam corretamente, mas ChatGPT-4o, Byte Doubao, Dark of the Moon Mian kimi, Zhipu Qingyan , Zero One All Things Knowledge, Step Stars Yuewen, Baichuan Zhibai Xiaoying, Shangtang Discussion, todos obtiveram respostas erradas e as maneiras erradas são diferentes. A maioria dos grandes modelos compara erroneamente números após a vírgula decimal em suas perguntas e respostas, pensando que 9,11 é maior que 9,9.

Comentário: Por trás dos erros, a baixa capacidade matemática de grandes modelos é um problema de longa data. Alguns membros da indústria acreditam que os modelos de linguagem generativa são projetados para se parecerem mais com o pensamento literal do que com o pensamento numérico. No entanto, o treinamento direcionado do corpus pode melhorar gradualmente a capacidade do modelo de responder a questões científicas no futuro.

OpenAI lança modelo leve GPT-4o mini, custo do modelo caiu 99% em dois anos

Em 18 de julho, horário local, a OpenAI lançou um novo modelo grande e leve GPT-4o mini. Segundo relatos, o GPT-4o mini substituirá o GPT-3.5 Turbo no robô de perguntas e respostas ChatGPT a partir de agora, e os usuários corporativos poderão acessar o GPT-4o mini a partir da próxima semana. “Esperamos que o GPT-4o mini expanda a aplicação da inteligência artificial e torne a inteligência artificial mais acessível.” De acordo com um artigo no site oficial da OpenAI, o preço de entrada do GPT-4o mini é de 15 centavos (US$ 0,15)/milhão. tokens (elementos de palavras), o preço de saída é de 60 centavos (US$ 0,6)/milhão de tokens, 60% mais barato que o GPT-3.5 Turbo. A OpenAI disse que a empresa também continuará a reduzir custos e, ao mesmo tempo, melhorar o desempenho do modelo. Comparado com o modelo text-davinci-003 de 2022, o custo do GPT-4o mini caiu 99%.

Comentário: Embora a OpenAI não tenha lançado o modelo GPT-5 de próxima geração, ela ainda está atualizando o modelo com base em seus recursos existentes e continua a reduzir o custo de modelos grandes. Outros grandes fabricantes de modelos também estão promovendo modelos leves este ano. O Google lançou o modelo leve Gemini 1.5 Flash em maio deste ano. A série Claude 3 lançada pela Anthropic em março inclui o leve Claude 3 Haiku. Modelos grandes com parâmetros menores mostraram grande potencial este ano. O treinamento pode melhorar o desempenho aumentando a quantidade de dados em vez de aumentar a quantidade de parâmetros.

Seis grandes fabricantes de modelos responderam ao problema das fracas capacidades digitais dos grandes modelos

Os repórteres do China Business News contataram e entrevistaram recentemente vários grandes fabricantes de modelos, incluindo Alibaba Tongyi, Tencent Hunyuan Team, Dark Side of the Moon Kimi, MiniMax Conch, Xueersi Jiuzhang, NetEase Youdao, etc. problema de modelo matemático pobre. Wang Xiaoming, gerente de produto do Laboratório Alibaba Tongyi, disse que problemas semelhantes são problemas comuns de cálculo matemático e raciocínio lógico, e também são casos que os desenvolvedores costumam testar durante o processo de treinamento e uso de modelos. Modelos grandes têm "respostas corretas" ou ". respostas erradas". "Na verdade, é uma questão de probabilidade. A equipe da Tencent Hunyuan afirmou que o modelo grande em si é um modelo probabilístico e é difícil para ele resolver de forma estável tais cálculos numéricos ou problemas de comparação sob várias circunstâncias.

Comentário: “Qual é maior, 9,11 ou 9,9?” não é difícil para humanos, mas para modelos grandes, não é necessariamente uma pergunta fácil de responder. A julgar pelas respostas abrangentes, as opiniões mencionadas pelos responsáveis pelos grandes fabricantes de modelos incluem que os grandes modelos ainda não controlam com precisão as regras de cálculo ou comparação entre números. numa fase muito inicial. Muitos membros da indústria também acreditam que, no futuro, é necessário melhorar o nível de inteligência do modelo básico subjacente e resolver esses erros a partir do nível dos dados de formação e das ferramentas externas. A solução final pode ser melhorar as capacidades da próxima geração. modelo. A descoberta de tais casos ajudará os fabricantes a aumentar a sua compreensão dos limites das capacidades dos grandes modelos.

A Lei de Inteligência Artificial entrará em vigor em toda a UE em 1º de agosto

A primeira Lei de Inteligência Artificial do mundo (Lei de IA da UE) emitida pela União Europeia entrará em vigor em toda a UE em 1 de agosto. Este é também o projeto de lei mais abrangente visando a supervisão de inteligência artificial lançado no mundo até agora. A Lei de Inteligência Artificial da UE também estabelece as bases para a regulamentação global da inteligência artificial, com o objetivo de alcançar o mesmo “efeito Bruxelas” que o Regulamento Geral de Proteção de Dados (RGPD). De acordo com o último projeto de lei, as empresas que violarem a regulamentação estarão sujeitas a multas administrativas até 35 milhões de euros ou 7% da receita anual máxima, consoante o que for maior.

Comentário: A UE sempre esteve na vanguarda da regulamentação tecnológica. A Lei da Inteligência Artificial da UE é o primeiro ato regulamentar abrangente sobre inteligência artificial do mundo, demonstrando a visão e a liderança da UE no domínio da regulamentação tecnológica. No entanto, as regras também aumentarão os custos operacionais das empresas. You Yunting, sócio do Shanghai Dabang Law Firm, disse que desde a implementação do GDPR, os custos das empresas, especialmente os custos de conformidade, aumentaram significativamente. Espera-se que a Lei de Inteligência Artificial seja a mesma, o que significa que as empresas devem investir em novos regulamentos e nomear pessoal dedicado para estudar as políticas de conformidade. Além disso, o processamento de avisos de violação, sistemas de divulgação pública, etc., também aumentará os custos.

São divulgadas as notas das sete principais modelos após a participação no “Vestibular”: apenas duas disciplinas de ciências podem ser cursadas

Em junho anterior, o OpenCompass, o sistema de avaliação Sinan do Laboratório de Inteligência Artificial de Xangai, divulgou os primeiros resultados da avaliação completa do exame de admissão à faculdade de IA, que mostrou que os candidatos à IA poderiam marcar no máximo 303 pontos em três disciplinas além linguagem e matemática, e foi reprovado em todas as matemáticas. Em 17 de julho, o OpenCompass divulgou ainda uma avaliação que ampliou o escopo das disciplinas. A equipe testou 7 grandes modelos de IA em todas as 9 disciplinas do vestibular, para que possam ser comparadas com as notas de admissão do vestibular.

Se a IA fizer o vestibular, em qual universidade ela poderá ser admitida? O teste OpenCompass descobriu que se o modelo grande fizer o exame de artes liberais, a melhor pontuação poderá ser "admitida" em um livro, mas se fizer o exame de ciências, só poderá ser "admitida" em no máximo dois livros (com base em a linha de pontuação da província de Henan, que tem o maior número de exames de admissão à faculdade este ano) para referência).

Comentário: A julgar pela avaliação da classificação dos professores, em comparação com os candidatos humanos, o grande modelo atual ainda tem grandes limitações. Após a conclusão da classificação, os professores concordaram que, embora o modelo grande tivesse um bom desempenho no domínio do conhecimento básico, ainda era insatisfatório em termos de raciocínio lógico e aplicação flexível do conhecimento. Especificamente, ao responder a questões subjetivas, grandes modelos muitas vezes não conseguem compreender completamente o radical da pergunta e não entendem a direção dos pronomes, resultando em respostas incorretas ao responder a questões matemáticas, o processo de resolução de problemas é mecânico e pouco lógico. problemas com lógica espacial ocorrem frequentemente.

Li Feifei incuba "unicórnio", avaliação do World Labs ultrapassa US$ 1 bilhão

Em 17 de julho, foi noticiado que a avaliação do World Labs, uma startup de “inteligência espacial” fundada pelo famoso cientista da computação chinês Li Feifei, ultrapassou US$ 1 bilhão. A startup usa principalmente tecnologia de processamento de dados visuais semelhantes aos humanos para equipar a IA com capacidades avançadas de raciocínio.

Desde a sua criação em abril deste ano, o World Labs conduziu duas rodadas de financiamento, com investidores incluindo o principal investidor em tecnologia Andreessen Horowitz e o fundo de IA Radical Ventures. Entende-se que a última rodada de financiamento da empresa poderá atingir aproximadamente US$ 100 milhões. Li Feifei, Andreessen Horowitz e Radical Ventures não responderam aos pedidos de comentários.

Comentário: Como figura lendária, as tendências empreendedoras de Li Feifei também atraíram muita atenção da indústria. Li Feifei tornou-se professor titular do Departamento de Ciência da Computação de Stanford aos 33 anos, acadêmico da Academia Nacional de Engenharia aos 44 anos e atualmente é diretor do Stanford Human-Centered Artificial Intelligence Institute (HAI). ). ImageNet, referência na área de visão computacional, também foi impulsionada por ela. Ele tem muitos discípulos, como Andrej Karpathy, que trabalhou na OpenAI e Tesla, e Jim Fan, que atualmente trabalha na Nvidia, etc. Eles também são figuras influentes no campo da IA.

Gigantes fabricantes de chips de IA e fabricantes de nuvem “abocanham” empresas globais de IA

De acordo com estatísticas da Crunchbase, uma empresa de banco de dados de serviços empresariais, o financiamento para startups globais de IA no primeiro semestre deste ano aumentou 24% em relação ao ano anterior, para US$ 35,6 bilhões. Investimentos em IA nos últimos anos. De acordo com estatísticas públicas do China Business News, a Nvidia investiu ou adquiriu nada menos que 16 empresas relacionadas à IA este ano, e a maioria das rodadas de financiamento totalizaram mais de 100 milhões de dólares americanos. Depois que a Microsoft investiu na OpenAI, ela também participou de várias rodadas de financiamento, totalizando mais de 100 milhões de dólares este ano. O Google implantou extensivamente o ecossistema de IA por meio de suas múltiplas plataformas de investimento e participou de nada menos que 31 rodadas de financiamento. Nesta rodada de boom de investimentos em IA, os números ativos incluem AMD, Amazon, SoftBank, etc.

Comentário: A popularidade da IA reflete-se intuitivamente no investimento. Os estilos de investimento e as preferências dos grandes gigantes não são exatamente os mesmos. Vale a pena ponderar que, quer sejam fabricantes cujo negócio principal é hardware semicondutor, como Nvidia e AMD, ou fabricantes de nuvem, como Microsoft, Google e Amazon, todos eles. espero investir em algumas grandes empresas. Os fornecedores de modelos e os fornecedores de nuvem estão mais dispostos a vincular fortemente as grandes empresas iniciantes. Observando as maiores rodadas de financiamento do setor este ano, podemos descobrir que grandes modelos básicos, direção autônoma, dados de IA e robôs humanóides são os maiores pontos críticos.

Reino Unido inicia investigação antitruste sobre Microsoft e acordo de Inflection AI

O regulador antitruste britânico, a Autoridade de Concorrência e Mercados (CMA), declarou recentemente que iniciou uma investigação antitruste formal sobre a transação Microsoft-Inflection AI. Em março deste ano, a Microsoft concordou em pagar US$ 650 milhões à startup de IA Inflection AI para licenciar seu software de IA. Além disso, a Microsoft anunciou a contratação dos cofundadores da Inflection AI, Mustafa Suleyman e Karén Simonyan, bem como da maioria dos funcionários da empresa.

Comentário: A avaliação da Inflection AI é de aproximadamente US$ 4 bilhões. Especialistas da indústria dizem que o comportamento da Microsoft é equivalente a anexar a Inflection AI a um preço baixo. Ao contrário da aquisição, a Inflection AI ainda mantém sua tecnologia proprietária. Além do Reino Unido, houve relatos no mês passado de que a Comissão Federal de Comércio dos EUA (FTC) também estava analisando o acordo. Segundo relatos, a FTC emitiu intimações à Microsoft e à Inflection AI, solicitando documentos relevantes dos últimos dois anos.

Empresa de robôs humanóides Zhuji Dynamics conclui financiamento da Série A

Em 15 de julho, o China Business News soube que a startup geral de robôs humanóides Zhuji Dynamics concluiu o financiamento da Série A, liderado pela China Merchants Venture Capital, a plataforma de investimento de capital privado do Grupo SAIC, Shangqi Capital, e os antigos acionistas Fengrui Capital, Oasis Capital e Mingshi Capital também participou do investimento e o valor do financiamento não foi divulgado. Anteriormente, o Alibaba também investiu na Zhuji Dynamics. A Zhuji Dynamics foi fundada em 2022. O fundador Zhang Wei é professor titular da Southern University of Science and Technology. Os produtos da Zhuji Dynamics incluem robôs humanóides em tamanho real, robôs quadrúpedes, robôs bípedes e soluções relacionadas.

Comentário: Muitas empresas de robôs humanóides ainda estão em processo de financiamento. Este ano, tem havido constantes eventos de financiamento na pista de robôs humanóides. Em janeiro deste ano, a Era Xingdong anunciou a conclusão do financiamento da rodada anjo de mais de 100 milhões de yuans. Posteriormente, a Yushu Technology anunciou a conclusão do financiamento da rodada B2 de 1 bilhão de yuans, o Kepler Exploration Robot concluiu o financiamento da rodada anjo e a Galaxy Universal Robots concluiu o financiamento da rodada anjo. rodada de financiamento de 700 milhões de yuans. Os gigantes da Internet Tencent, Baidu e Alibaba investiram em UBTECH, Zhiyuan Robot e Zhuji Dynamics respectivamente, enquanto Meituan investiu em Galaxy Universal Robots e Yushu Robot. Depois que as empresas de robôs humanóides arrecadaram fundos, o próximo passo é implementar a produção em massa.

NVIDIA e Mistral AI lançam modelo grande Mistral-NeMo

De acordo com notícias de 19 de julho, a NVIDIA e a startup francesa Mistral AI lançaram o modelo de linguagem grande Mistral-NeMo AI, que possui 12 bilhões de parâmetros e uma janela de contexto (o número máximo de tokens que o modelo AI pode processar ao mesmo tempo) de 128.000 fichas. O grande modelo Mistral-NeMo AI é voltado principalmente para ambientes corporativos e implementa soluções de inteligência artificial sem usar uma grande quantidade de recursos de nuvem.

Comentário: Mistral AI completou 600 milhões de euros em financiamento este ano, e a lista de investidores inclui Nvidia e Samsung. A Microsoft também anunciou anteriormente um investimento de 15 milhões de euros na Mistral AI, que será convertido em capital na próxima ronda de financiamento da Mistral AI. A Mistral AI fez parceria com a Nvidia para lançar modelos grandes, e a empresa também irá equilibrar e buscar cooperação entre grandes gigantes. A Nvidia está se envolvendo mais no ecossistema de IA. Anteriormente, ela abriu o código-fonte do modelo da série Nemotron-4 340B para uso dos desenvolvedores na geração de dados sintéticos para o treinamento de grandes modelos de linguagem.

notícias

Relatório semanal de IA | O modelo grande não consegue determinar qual é maior, 9.11 ou 9.9 OpenAI lança modelo leve GPT-4o mini;

Introdução

minhas informações de contato