notícias

sora está desatualizado? o “modelo de vídeo mais forte” do meta não usa dit, mas usa llama para fazer milagres

2024-10-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

autor|wang zhaoyang

neste momento, quando o principal líder técnico do openai sora foi ao google e vários relatórios apontaram que o openai sora estava tendo dificuldades com problemas internos de qualidade, a meta lançou sem cerimônia seu modelo de vídeo "movie gen" e usou diretamente um sistema de avaliação completo declarou que ele derrotou sora.

o que é ainda mais cruel é que meta também está “matando pessoas”. embora este modelo não seja aberto ao público como o sora, ele fez o relatório técnico de 95 páginas do novo modelo (não é de código aberto, mas contém muitos detalhes). ) público e disse a todos:

este modelo não só derrotou sora na prática, mas também utilizou uma nova rota técnica – o que provou que a rota técnica de sora não é mais a mais avançada hoje.

caros jogadores do vincent video, por favor, não “copiem” sora.

1

"modelo de pedestal de mídia"

para ser mais preciso, meta lançou uma série de modelos, uma combinação criada para alcançar “conteúdo de mídia gerado por ia”. isso também é o que o título deste artigo técnico significa: movie gen: a cast of media foundation models

este conjunto inclui:

o maior modelo básico de geração de gen video, movie gen video, possui 30 bilhões de parâmetros.

o maior modelo básico de áudio para geração de vídeo, movie gen audio, possui 13 bilhões de parâmetros.

o personalized movie gen video obtido por pós-treinamento do modelo movie gen video é usado para gerar vídeos personalizados com base em rostos individuais. e um novo processo pós-treinamento que gera movie gen edit para edição de vídeo precisa.