sora está desatualizado? o "modelo de vídeo mais forte" do meta não usa dit, mas usa llama para alcançar milagres

sora está desatualizado? o “modelo de vídeo mais forte” do meta não usa dit, mas usa llama para fazer milagres

2024-10-05

autor｜wang zhaoyang

neste momento, quando o principal líder técnico do openai sora foi ao google e vários relatórios apontaram que o openai sora estava tendo dificuldades com problemas internos de qualidade, a meta lançou sem cerimônia seu modelo de vídeo "movie gen" e usou diretamente um sistema de avaliação completo declarou que ele derrotou sora.

o que é ainda mais cruel é que meta também está “matando pessoas”. embora este modelo não seja aberto ao público como o sora, ele fez o relatório técnico de 95 páginas do novo modelo (não é de código aberto, mas contém muitos detalhes). ) público e disse a todos:

este modelo não só derrotou sora na prática, mas também utilizou uma nova rota técnica – o que provou que a rota técnica de sora não é mais a mais avançada hoje.

caros jogadores do vincent video, por favor, não “copiem” sora.

"modelo de pedestal de mídia"

para ser mais preciso, meta lançou uma série de modelos, uma combinação criada para alcançar “conteúdo de mídia gerado por ia”. isso também é o que o título deste artigo técnico significa: movie gen: a cast of media foundation models

este conjunto inclui:

o maior modelo básico de geração de gen video, movie gen video, possui 30 bilhões de parâmetros.

o maior modelo básico de áudio para geração de vídeo, movie gen audio, possui 13 bilhões de parâmetros.

o personalized movie gen video obtido por pós-treinamento do modelo movie gen video é usado para gerar vídeos personalizados com base em rostos individuais. e um novo processo pós-treinamento que gera movie gen edit para edição de vídeo precisa.

notícias

sora está desatualizado? o “modelo de vídeo mais forte” do meta não usa dit, mas usa llama para fazer milagres

introdução

minhas informações de contato