notícias

Huawei Hubble investiu discretamente em dois grupos de pessoas da Universidade de Tsinghua

2024-08-20

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Texto/Editor Wang Shuoguo/Yan Ziwei

Duas grandes empresas modelo nas quais a Huawei Hubble investiu discretamente lançaram novos desenvolvimentos, um após o outro.

Em meados de agosto, a Facewall Intelligence anunciou que sua série MiniCPM de modelo de linguagem grande recebeu mais de um milhão de downloads desde seu lançamento em fevereiro.

No final de julho, a Shenshu Technology tornou-se global e lançou o Vidu, um grande modelo de Wensheng Video, com desempenho comparado ao Sora.

Wall-facing Intelligence e Shengshu Technology foram estabelecidas em 2022 e 2023, respectivamente, e suas equipes principais são todas da Universidade de Tsinghua. O CEO da Wall-Facing Intelligence é Li Dahai, o ex-CTO da Zhihu; o CEO da Shengshu Technology é Tang Jiayu, que estudou no Departamento de Ciência da Computação da Universidade de Tsinghua com bacharelado e mestrado.

O caminho da IA ​​​​está em alta e a Huawei Hubble está otimista quanto ao potencial desses dois jovens talentos.

Nova equipe

Hubble Investment é uma instituição de investimento de propriedade integral da Huawei.

De acordo com Qichacha, possui duas entidades, nomeadamente Hubble Technology Investment Co., Ltd. e Shenzhen Hubble Technology Investment Partnership.

Anteriormente, o investimento da Huawei Hubble concentrava-se em tecnologia dura, investindo em uma série de empresas de chips semicondutores. Este ano, apoiou sucessivamente duas empresas de ponta da Tsinghua, mostrando sua ênfase na pista de IA.

De acordo com dados da IT Orange, o Hubble tem feito apostas sucessivas na área da inteligência artificial este ano, com um investimento acumulado de 132 milhões de yuans.

Na direção de modelos grandes, prefere elites de escolas de prestígio.

As duas empresas que investiram na empresa têm estruturas de equipe fundadoras semelhantes e são apoiadas pela Universidade Tsinghua.

Os membros principais da Shengshu Technology vêm do Instituto de Pesquisa de Inteligência Artificial da Universidade Tsinghua, e a equipe fundadora da Wall-Facing Intelligence nasceu no Laboratório de Processamento de Linguagem Natural da escola (THUNLP).

Um grupo de rostos de Tsinghua forma a alta administração de biotecnologia. Além do CEO, seu cientista-chefe é Zhu Jun, vice-diretor do Instituto Tsinghua de Inteligência Artificial, e o CTO Bao Fan é colega de Tang Jiayu e membro da equipe de pesquisa de Zhu Jun.

De junho a agosto do ano passado, a Shengshu Technology completou duas rodadas de financiamento consecutivas e recebeu centenas de milhões de yuans no total. Em junho deste ano, o Hubble investiu em ações e participou na sua ronda de financiamento A+.

O caminho de crescimento da inteligência voltada para a parede é semelhante.

Seu cofundador, Liu Zhiyuan, é supervisor de doutorado no Departamento de Ciência da Computação da Universidade de Tsinghua, e sua direção de pesquisa é o processamento de linguagem natural por computador; o CTO da empresa, Zeng Guoyang, de 26 anos, é um aluno recomendado na competição e entrou no concurso; Laboratório de Processamento de Linguagem Natural Tsinghua em seu segundo ano.

De acordo com Li Dahai, a equipe de pesquisa científica inteligente tem mais de 100 pessoas, 80% das quais se formaram em Qingbei, com idade média de apenas 28 anos. Eles publicaram mais de 100 artigos em revistas e conferências confiáveis.

Antes de fundar a Wall-face Intelligence, Li foi CTO da Zhihu, construindo um negócio de pesquisa e recomendação para a plataforma do zero, lançando uma "comunidade inteligente" de IA e aumentando o número de usuários ativos mensais.

No ano passado, o ChatGPT foi muito popular e todo mundo falava sobre AGI (inteligência artificial geral). Ele conversou com os principais membros da empresa. Depois de confirmar que AGI é a crença de todos, junte-se com decisão.

Seu antigo empregador apoiou seu empreendedorismo e, em abril do mesmo ano, a Face Wall Intelligence recebeu um investimento de dezenas de milhões de yuans de Zhihu. Um ano depois, o Hubble fez uma aposta.

Lançar continuamente novos produtos

Ambas as startups lançaram novos produtos em um período de tempo relativamente curto. Esta é uma razão importante para atrair investimentos de instituições como Huawei e Hubble.

No final de abril, a Shengshu Technology se uniu à Universidade Tsinghua para lançar um grande modelo de vídeo – Vidu. No final de julho, o Vidu foi lançado globalmente, abrindo as duas funções principais do Wensheng Video e Tusheng Video, oferecendo duas opções de duração de 4 segundos e 8 segundos, com resolução de até 1080P.

O Vidu gera um clipe de 4 segundos em apenas 30 segundos. Atualmente, os usuários podem se cadastrar diretamente com seu endereço de e-mail para experimentar o Vidu.

Segundo relatos, o vídeo gerado pelo Vidu é suave e coerente, sem nenhum fenômeno óbvio de inserção de quadro, e a linguagem da lente é rica, e diferentes lentes, como planos gerais, planos próximos e close-ups, podem ser trocadas.

"O desempenho do Vidu é excelente em termos de retenção de longo prazo de 16 segundos e compreensão semântica.", comentou Zhu Jun, cientista-chefe da Shengshu Technology.

A inteligência voltada para a parede também está constantemente promovendo novos movimentos.

Em maio foi lançado seu grande modelo Luca. Li Dahai disse que os recursos do modelo de múltiplos idiomas de Luca são equivalentes ao ChatGPT.

No mesmo mês, foi lançado o MiniCPM-V2.0 voltado para parede, que pode identificar com precisão cenas de rua com detalhes intrincados e ler caligrafia antiga em recibos de Tsinghua que datam de mais de 2.300 anos.

Já no ano passado, Face Wall Intelligence lançou a plataforma de desenvolvimento de software inteligente ChatDev. Os usuários que precisam criar pequenos jogos, desenvolvimento de sites, design criativo, etc. podem implementá-lo rapidamente, simplesmente descrevendo o nome do projeto e as ideias relacionadas por meio do ChatDev.

Nas palavras de Li Dahai, um usuário comum pode criar um pequeno software “com apenas uma xícara de Coca-Cola e a um custo inferior a um dólar”.

A comercialização foi inicialmente implementada. Face Wall Intelligence juntou-se ao China Merchants Bank, Digital Network, Zhihu, etc. para aplicar tecnologia a cenários como finanças, educação e terminais inteligentes.

Por exemplo, no final de junho, o sistema de julgamento assistido por inteligência artificial desenvolvido pela empresa foi colocado em operação no Tribunal Popular Intermediário de Shenzhen, abrangendo processos como arquivamento de casos, revisão de arquivos, audiências judiciais e produção de documentos.

Desde a sua operação experimental em janeiro deste ano, o sistema auxiliou no arquivamento de 291 mil processos e na geração de 11.600 primeiras minutas de documentos.

Encontre um novo caminho

Li Dahai e Tang Jiayu têm as mesmas características, não são supersticiosos quanto ao caminho percorrido pelos seus antecessores.

Por exemplo, o GPT enfatiza que “grandes esforços podem produzir milagres”, enquanto a abordagem da equipe voltada para a parede é prever o desempenho de modelos grandes por meio de modelos pequenos: primeiro treinar em um modelo com parâmetros que variam de 0,009B a 0,03B e depois extrapolar para um modelo 2.4B. Desempenho preditivo e, finalmente, treinar o modelo 2.4B.

Este método obtém o dobro do resultado com metade do esforço. Experimentar primeiro um modelo pequeno e ajustar os parâmetros pode reduzir os custos de treinamento.

Antes de a empresa ser estabelecida, como membro do projeto "Iluminismo" do Instituto de Pesquisa de Inteligência Artificial Zhiyuan de Pequim, a equipe Wall-Facing começou a treinar grandes modelos de linguagem em 2020.

A experiência anterior permite que eles saibam que tipo de dados são necessários para modelos grandes.

“É fácil para todos cair em mal-entendidos e se concentrar demais na quantidade absoluta de dados. Na verdade, a qualidade dos dados, como usá-los e a compreensão dos dados são mais importantes.” disse.

Devido a restrições de recursos, a equipe há muito utiliza métodos como aceleração distribuída e ajuste fino de parâmetros para reduzir custos. Em 2022, o trabalho de ajuste de parâmetros da equipe de revestimento de paredes também foi publicado no subjornal Nature.

O estilo de jogo da Shengshu Technology é semelhante.

No roteiro técnico, Shengshu usa a mesma arquitetura convergente que Sora, mas no caminho do produto os dois são diferentes.

A equipe Sora escolheu tudo em vídeos longos, apoiados pela força técnica da Open AI e pelo poder computacional da Microsoft. As condições para as startups desenvolverem tecnologias digitais são incomparáveis.

A equipe de Tang Jiayu optou por começar com imagens 2D e depois expandir para os campos 3D e vídeo.

O vídeo é essencialmente uma amplificação de imagens em séries temporais, que podem ser vistas como imagens consecutivas de vários quadros. Trabalhos de engenharia em imagens, como coleta de dados, limpeza, anotação e treinamento eficiente de modelos, podem ser reutilizados.

Ao longo de 2023, os principais recursos da Shengshu serão colocados em imagens e 3D. Foi apenas em janeiro deste ano que foi lançada a geração de vídeos curtos de 4 segundos. Depois que Sora foi lançado em fevereiro, o progresso da empresa se acelerou e em abril ela conseguiu gerar vídeos curtos de 16 segundos.

Na grande pista de maquete, equipes nacionais e estrangeiras competem para “flexionar os músculos”. Estas duas equipas do Tsinghua apenas começaram o aquecimento e esperam alcançar bons resultados.

Até lá, espera-se que a Huawei Hubble, que investiu cedo, obtenha retornos excessivos.