para resolver el problema de la coherencia del modelo de generación de video, la versión china de "sora" vidu lanza la capacidad de "bloquear al sujeto con una imagen"

para resolver el problema de la coherencia del modelo de generación de vídeo, la versión china de "sora" vidu ofrece la posibilidad de "bloquear al sujeto con una imagen".

2024-09-11

el 11 de septiembre, shengshu technology celebró un día de puertas abiertas para los medios y lanzó la función "consistencia de sujetos", que puede lograr una generación consistente de cualquier tema, haciendo que la generación de video sea más estable y controlable. se entiende que esta función actualmente está abierta a los usuarios de forma gratuita.

anteriormente, a fines de abril, se lanzó al mundo vidu, un modelo de video original a gran escala desarrollado conjuntamente por shengshu technology y la universidad de tsinghua. se lanzó oficialmente a fines de julio y está completamente abierto para su uso.

tang jiayu, director ejecutivo de shengshu technology, dijo a los periodistas de los medios, incluidos los de "daily economic news", en la jornada de puertas abiertas que la función de "referencia de tema" tiene como objetivo resolver las limitaciones "incontrolables" del modelo de video. actualmente, los modelos de vídeo tienen limitaciones como continuidad débil y salida aleatoria. una continuidad débil significa que no se puede garantizar la coherencia del tema, la escena, el estilo, etc. cada vez que se genera un vídeo, especialmente cuando se trata de interacciones complejas. la salida aleatoria significa que los resultados de salida son relativamente aleatorios y requieren intentos continuos para generarlos. no se puede lograr un control fino y preciso de detalles como el movimiento del espejo y los efectos de luz.

fuente de la foto de tang jiayu, director ejecutivo de shengshu technology: foto del reportero diario li shaoting

anteriormente, la industria intentó adoptar el método de "primero la ia genera imágenes, luego las imágenes generan videos", utilizando herramientas de dibujo de ia para generar imágenes divididas, primero manteniendo al sujeto consistente en el nivel de la imagen y luego convirtiendo las imágenes en video. clips y editarlos y sintetizarlos.

bajo la función "referencia de sujeto", los usuarios pueden cargar una imagen de cualquier sujeto para bloquear la imagen del sujeto, cambiar escenas arbitrariamente a través de descriptores y generar un video con el mismo sujeto. esta función no se limita a un solo objeto, sino que está abierta a "cualquier tema", incluidos personajes, animales, mercancías, personajes de animación, temas de ficción, etc.

noticias económicas diarias

informe/comentarios

noticias

para resolver el problema de la coherencia del modelo de generación de vídeo, la versión china de "sora" vidu ofrece la posibilidad de "bloquear al sujeto con una imagen".

introducción

mi información de contacto