nouvelles

pour résoudre le problème de cohérence du modèle de génération vidéo, la version chinoise de "sora" vidu libère la possibilité de "verrouiller le sujet avec une seule image".

2024-09-11

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

le 11 septembre, shengshu technology a organisé une journée portes ouvertes aux médias et a lancé la fonction « cohérence du sujet », qui permet d'obtenir une génération cohérente de n'importe quel sujet, rendant la génération vidéo plus stable et contrôlable. il est entendu que cette fonction est actuellement ouverte gratuitement aux utilisateurs.

auparavant, fin avril, vidu, un modèle vidéo original à grande échelle développé conjointement par shengshu technology et l'université tsinghua, a été officiellement lancé fin juillet et est entièrement ouvert à l'utilisation.

tang jiayu, pdg de shengshu technology, a déclaré aux journalistes, y compris aux journalistes du « daily economic news », lors de la journée portes ouvertes, que la fonction « référence de sujet » était destinée à résoudre les limitations « incontrôlables » du modèle vidéo. actuellement, les modèles vidéo présentent des limites telles qu'une faible continuité et une sortie aléatoire. une faible continuité signifie que la cohérence du sujet, de la scène, du style, etc. ne peut pas être garantie à chaque fois qu'une vidéo est générée, en particulier lorsque des interactions complexes sont impliquées. une sortie aléatoire signifie que les résultats de sortie sont relativement aléatoires et nécessitent des tentatives continues pour générer un contrôle fin et précis des détails tels que le mouvement du miroir et les effets de lumière.

source photo de tang jiayu, pdg de shengshu technology : photo du journaliste li shaoting

auparavant, l'industrie essayait d'adopter la méthode « d'abord l'ia génère des images, puis les images génèrent de la vidéo », en utilisant des outils de dessin d'ia pour générer des images fractionnées, en gardant d'abord le sujet cohérent au niveau de l'image, puis en convertissant les images en vidéo. clips, puis les éditer et les synthétiser.

sous la fonction « référence du sujet », les utilisateurs peuvent télécharger une photo de n'importe quel sujet pour verrouiller l'image du sujet, changer de scène arbitrairement via des descripteurs et produire une vidéo avec le même sujet. cette fonction ne se limite pas à un seul objet, mais est ouverte à « tout sujet », y compris les personnages, les animaux, les marchandises, les personnages d'animation, les sujets de fiction, etc.

l'actualité économique quotidienne

rapport/commentaires