notícias

Quem pode superar Sora em termos de experiência prática no desenvolvimento de grandes modelos domésticos de vídeo de IA?

2024-08-10

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Repórter da capa Xiong Yingying
No início deste ano, a empresa americana OpenAI lançou o modelo de geração de vídeo AI Sora, que foi como um trovão no chão, trazendo novas possibilidades para aplicações de inteligência artificial. Naquela época, muitos internautas lamentaram que a distância entre nós e a tecnologia estrangeira de IA estava ficando cada vez maior.
No entanto, em apenas meio ano, "Sora doméstico" como Keling, PixVerse V2, Qingying e Vidu foram lançados um após o outro e estão abertos aos usuários gratuitamente.
Qual modelo de vídeo doméstico é o melhor? Embora a tecnologia continue a fazer avanços, quem pode assumir a liderança na comercialização?
4 produtos “domésticos Sora” serão lançados neste mês
Experiência real de teste do repórter
Embora a guerra de preços entre grandes fabricantes nacionais e grandes modelos seja acirrada, algumas empresas estão se concentrando no campo da geração de vídeo de IA e fazendo esforços secretos. De acordo com estatísticas incompletas, até o momento, existem mais de 10 modelos de vídeo de IA domésticos em grande escala. Somente em julho deste ano, 4 "Sora domésticos" foram lançados online.
No dia 6 de julho, a página Kuaishou Keling AI foi lançada oficialmente, oferecendo funções de vídeo Wensheng e vídeo Tusheng, que podem gerar vídeos de até 10 segundos. Também adicionou funções como controle de movimento da câmera e personalização do primeiro e do último quadro.
No dia 24 de julho, a Aishi Technology lançou oficialmente o PixVerse V2, que será aberto ao mundo simultaneamente. Este modelo pode gerar vários clipes de vídeo ao mesmo tempo e pode atingir a geração de vídeo de 8 segundos para um único clipe e 40 segundos para vários clipes.
Posteriormente, Qingying, criado pela Zhipu AI Company, e Vidu, desenvolvido de forma independente pela Shengshu Technology, também foram lançados um após o outro. Entre eles, Qingying se concentra na geração rápida em 30 segundos, além do estilo realista comum, o Vidu adiciona geração de videoclipe em estilo de animação;
Os modelos de geração de vídeo em grande escala das quatro empresas acima estão atualmente abertos para teste. Após registro rápido por telefone, e-mail, etc., os repórteres também tiveram experiência real.
Para testar a função “Vídeo de imagem”, o repórter carregou a mesma imagem de uma rosa que ainda não floresceu em quatro grandes sites de modelos e digitou a palavra “flor desabrochando”. Tanto Qingying quanto Vidu geraram rosas animadas com sucesso. vídeo de flores desabrochando. No vídeo gerado por PixVerse e Keling, é possível ver as flores balançando, mas não há efeito dinâmico de “desabrochar”. Mas quando o repórter mudou a palavra inicial para “uma flor desabrochando lentamente”, Keling também gerou com sucesso um vídeo de uma rosa desabrochando. Pode-se observar que diferentes modelos grandes apresentam diferenças em sua capacidade de processar e compreender a linguagem.
Capturas de tela de vídeo geradas por quatro grandes modelos domésticos
A julgar pela velocidade de geração do vídeo, o Vidu obteve o tempo mais rápido, gerando um vídeo de 3 segundos em menos de 1 minuto. Os outros três modelos grandes concluíram a geração de vídeo em 5 minutos. Embora Qingying anuncie “geração rápida em 30 segundos”, talvez porque há muitas pessoas tentando fazer isso, a página de geração mostra “espera-se que fique na fila por 3 minutos”.
A julgar pelo feedback da experiência dos internautas nas plataformas sociais, todos os principais modelos têm mais ou menos problemas, como distorção de caracteres e falta de imagens.
“Há muitos que esperam para ver, mas poucos que agem”.
O investimento na área de grandes modelos tende a ser cauteloso
Quando Sora nasceu, no início do ano, ainda havia vozes pessimistas na Internet, acreditando que a China estava muito atrás dos Estados Unidos no domínio da IA. Apenas meio ano depois, vários grandes modelos de vídeo de IA que comparam Sora surgiram na China.
Tianyancha mostra que a Zhipu AI, fundada em 2019, concluiu o financiamento da Série C e está atualmente avaliada em mais de 10 bilhões. Embora a Aishi Technology e a Shengshu Technology tenham sido estabelecidas apenas em 2023, completaram três e quatro rodadas de financiamento, respectivamente. Isso significa que o círculo de investimentos ainda está muito entusiasmado em investir em grandes pistas de corrida?
“Basicamente, ainda vemos mais e investimos muito pouco.” Guo Guo Tao, um investidor anjo e especialista na área de inteligência artificial, disse que atualmente, os maiores investidores são várias grandes empresas de Internet, que investiram extensivamente em vários modelos de grande porte. projetos. Por um lado, os grandes fabricantes podem encontrar alguns cenários de aplicação para grandes modelos de vídeo em seus negócios existentes; por outro lado, se esses grandes modelos tiverem um certo grau de sobreposição com o próprio negócio da empresa, podem ser usados ​​como complemento; a linha de produtos; os grandes fabricantes também podem Através dos recursos ecológicos existentes, essas grandes empresas modelo serão capacitadas até certo ponto.
A empresa Zhipu AI arrecadou mais de 100 milhões de yuans em várias rodadas de financiamento
No geral, as instituições de investimento nacionais ainda mantêm uma atitude conservadora e cautelosa em relação a grandes modelos como Vincent Video e Tush Video. A principal razão por detrás disto é que a sua comercialização enfrenta muitos desafios.
Na opinião de Guo Tao, seja Sora ou uma grande modelo doméstica, os vídeos gerados ainda apresentam algumas falhas. Por exemplo, personagens gerados por IA às vezes têm um dedo extra, não conseguem acertar a cesta ao atirar, etc. Isso mostra que o modelo grande tem compreensão insuficiente da relação espacial entre os objetos, e o modelo de algoritmo também precisa ser melhorado.
Além dos problemas técnicos que ainda precisam ser superados, o maior problema na comercialização de grandes modelos de vídeo de IA é a falta de cenários de aplicação maduros.
“Por exemplo, a própria Kuaishou tem uma plataforma e conteúdo e, relativamente falando, tem certos cenários de aplicação. Muitas empresas de auto-mídia podem usá-lo, disse Guo Tao, mas para algumas empresas puramente técnicas, ainda é difícil encontrá-las.” . Um cenário de procura particularmente bom e rígido, onde os utilizadores estão dispostos a pagar.
Plataforma acelera exploração de comercialização
Espera-se que o mercado de microcurtas-drama assuma a liderança no desembarque
Embora existam desafios na comercialização, grandes plataformas modelo no país e no estrangeiro estão a explorar e a experimentar activamente a comercialização.
O repórter notou que atualmente, grandes modelos domésticos de vídeo de IA também começaram a pagar do lado do consumidor. Em 24 de julho, a postagem oficial do WeChat da Keling AI revelou que o número de usuários que solicitaram permissões ultrapassou 1 milhão. No mesmo dia, o sistema de associação paga foi lançado simultaneamente, incluindo três categorias de associação: ouro, platina e diamante. O preço anual da associação varia de mais de 500 yuans a mais de 5.000 yuans.
PixVerse adota um modelo de pagamento por assinatura, incluindo versão básica, versão padrão e versão ilimitada, com preços unitários variando de 5 yuans a 60 yuans.
No entanto, muitos especialistas da indústria disseram que, atualmente, os grandes modelos de IA têm custos de poder de computação muito elevados e os custos de aquisição dos clientes ainda não foram formados e a concorrência no mercado é extremamente acirrada. no pagamento do lado C.
De acordo com relatos da mídia, em junho deste ano, a marca de brinquedos infantis de renome mundial "Toys R Us" cooperou com a OpenAI para usar o filme comercial de 1 minuto "The Origin of Toys R Us" produzido por Sora. gerar anúncios comerciais viáveis ​​A sexualidade é ainda demonstrada.
Em julho, o primeiro micro-curta-metragem de fantasia original da AIGC, "Mountains and Seas Strange Mirror: Breaking the Waves", foi lançado oficialmente. O drama tem 5 episódios e duração de 15 minutos. No drama, o garoto protagonista é afiado. , o fantástico Kunpeng e a fera estranha, etc., são todos gerados por IA.
À medida que mais e mais produtoras e plataformas começam a explorar o caminho de integração de "IA + micro-curtas-dramas", os grandes modelos de vídeo de IA podem ser os primeiros a serem comercializados no mercado de micro-curtas-dramas.
Relatório/Comentários