notícias

teleai concluiu o primeiro treinamento de modelo grande wanka wangan de produção nacional, código aberto telechat2-115b

2024-09-29

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

recentemente, o instituto de pesquisa de inteligência artificial da china telecom (referido como: teleai) concluiu com sucesso o primeiro grande modelo de trilhão de parâmetros na china com base no treinamento de cluster wanka produzido nacionalmente (referido como: wanka wancan) e abriu oficialmente o primeiro código-fonte nacional modelo produzido com base no cluster wanka produzido nacionalmente telechat2-115b, um grande modelo com centenas de bilhões de parâmetros treinados pelo cluster huawanka e estrutura doméstica de aprendizado profundo, é um grande modelo de star semantics.

este é outro marco e importante conquista de pesquisa científica liderada pelo professor li xuelong, cto, cientista-chefe do china telecom group e reitor do china telecom artificial intelligence research institute. isso marca que o treinamento de modelos domésticos em grande escala realmente realizou a substituição da nacionalização. e entrou oficialmente no mercado uma nova etapa de inovação independente, segurança e controlabilidade para a produção nacional.

telechat2-115b foi treinado com base na "plataforma integrada de serviços de computação inteligente" desenvolvida pela própria china telecom tianyi cloud e na "plataforma xinghai ai" da empresa de inteligência artificial. ele usa uma variedade de métodos de otimização para melhorar a eficiência e a precisão do treinamento do modelo, garantindo ao mesmo tempo o treinamento. precisão, alcançando mais de 93% da eficiência computacional da gpu com o mesmo poder computacional, enquanto o tempo efetivo de treinamento do modelo é responsável por mais de 98%.

o código aberto do telechat2-115b marca outra nova jornada para a localização de modelos grandes. como a primeira empresa estatal a criar grandes modelos de código aberto, a teleai promove ativamente o progresso contínuo da tecnologia de grandes modelos através de código aberto e continua a promover e liderar a rápida transição da inovação tecnológica para a implementação industrial.

na lista de testes opencampass de maio deste ano, as capacidades de raciocínio lógico dos modelos da série telechat ficaram em primeiro lugar na lista de grandes modelos de código aberto. como uma versão de nova geração, o telechat2-115b ficou em primeiro lugar com uma pontuação de 86,9 pontos na última lista abrangente de modelos de acesso aberto de avaliação c-eval, lançada em setembro. suas capacidades gerais são quase 30% superiores às dos modelos da série telechat, especialmente em termos de uso de ferramentas, raciocínio lógico, cálculos matemáticos, geração de código e escrita longa.

telechat2-115b ocupa o primeiro lugar na lista abrangente de modelos de acesso aberto da c-eval

entende-se que o grande modelo semântico desenvolvido pela própria teleai conquistou o primeiro lugar em muitas competições oficiais. entre eles, ganhou o primeiro lugar na avaliação de compreensão semântica espacial chinesa e na avaliação de extração de tipo de evento histórico chinês antigo na conferência ccl2024. além disso, ele venceu o campeonato no desafio nlpcc2024 chinese argumentative paper mining (shared task5).

(informação)

relatório/comentários