notícias

Para fornecer corpus de alta qualidade para grandes modelos de IA, a construção desta infraestrutura já começou!

2024-08-20

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Em 19 de agosto, na Conferência do Ecossistema de Inteligência Artificial de Pequim de 2024, foi lançada oficialmente a construção de uma infraestrutura de circulação confiável para corpus de alto valor. Sob a escolta de tecnologias de informação de ponta, como blockchain e computação de privacidade, o corpus de dados que apoia o crescimento de alta qualidade de grandes modelos de inteligência artificial se despedirá da circulação desordenada e se transformará em uma "rodovia" de operação padronizada. Isto é de grande importância para acelerar a formação de um grande modelo de formação nas terras altas para a inteligência artificial e promover a ultrapassagem e o desenvolvimento acelerado da inteligência artificial do meu país.

Nos últimos anos, a tecnologia de inteligência artificial desenvolveu-se rapidamente e desempenhou um papel cada vez mais importante em áreas-chave da economia nacional. Os dados do corpus de alto valor usados ​​no treinamento de grandes modelos são como um importante "combustível" no desenvolvimento de grandes modelos de inteligência artificial. No entanto, os dados corpus de alto valor são distribuídos entre unidades, indústrias e regiões e carecem de segurança de privacidade suficiente e de mecanismos eficazes de incentivo à circulação. Como resultado, os proprietários de dados corpus de alto valor muitas vezes “não ousam partilhar” ou “relutam”. compartilhar." . Uma grande quantidade de dados corpus de alto valor é "difícil de fornecer, circular e usar" e tornou-se um gargalo para o desenvolvimento da inteligência artificial no meu país.

É relatado que a infraestrutura de circulação confiável de corpus de alto valor é liderada pelo Centro Nacional de Inovação Tecnológica Blockchain e pelo Grupo de Energia de Pequim, e coopera com mais de 10 empresas chinesas de corpus, incluindo o Laboratório Nacional Chave da Agência de Notícias Xinhua, Diário do Povo Online, Higher Education Press e Grupo Geral de Tecnologia do meu país Criado em conjunto pelas principais unidades de dados. A nova geração de tecnologia da informação representada pelo blockchain e pela computação de privacidade pode garantir a circulação, uso e gerenciamento confiáveis ​​e seguros de dados corpus em virtude de suas características de armazenamento confiável de certificados, não adulteração, fácil verificação de direitos e proteção total de dados privacidade e segurança, resolvem efetivamente os problemas acima.

De acordo com a pessoa responsável pelo Centro Nacional de Inovação Tecnológica Blockchain, a infraestrutura de circulação confiável de corpus de alto valor usará a tecnologia de software e hardware blockchain independentemente controlável e de desempenho líder para construir uma ponte de interconexão de dados de corpus distribuída em todo o país. fornecedores, processadores e demandantes de corpus para obter acesso confiável a dados de corpus distribuídos nacionalmente, tornando-os detectáveis ​​e acessíveis em todas as regiões, formando ao mesmo tempo um conjunto de dados de corpus de alta qualidade, usando tecnologia inovadora de computação de privacidade, por meio de "dados não; vazar a abordagem "Domínio, disponível e invisível" garante que dados de corpus de modelo em grande escala e de alto valor não possam ser disseminados sem autorização durante o processamento e treinamento de modelo. Além disso, esta infraestrutura também realizará incentivos na cadeia por meio de contratos inteligentes para fornecer; os recursos do corpus e a circulação fornecem energia endógena sustentável.

Com o apoio da infraestrutura de circulação confiável de dados de corpus de alto valor, as principais unidades nacionais de dados de corpus também desenvolverão especificações de circulação confiáveis ​​e seguras para dados de corpus baseadas em blockchain e computação de privacidade para formar um sistema sustentável para a circulação e valor agregado de dados de corpus de alto valor.

Fonte: Cliente Diário de Pequim

Repórter: Sun Qiru

Relatório/Comentários