tang jiayu, director ejecutivo de shengshu technology: la generación de video aún se encuentra en sus primeras etapas y existen cuellos de botella técnicos que superar

tang jiayu, director ejecutivo de shengshu technology: la generación de vídeo aún se encuentra en sus primeras etapas y existen obstáculos técnicos que superar.

2024-09-12

00:04

"al utilizar la ia para hacer películas narrativas, la proporción de películas desechadas puede ser de 50:1, es decir, se generarán 50 imágenes, de las cuales sólo una puede ser adecuada para este tipo de creación narrativa el 11 de septiembre, en beijing shengshu". technology co., ltd. (en lo sucesivo, shengshu technology) celebró un día de puertas abiertas para los medios, un creador de cine y televisión hizo la declaración anterior al compartir.

con el desarrollo de la tecnología de generación de modelos de gran tamaño, cada vez más creadores de cine y televisión están comenzando a intentar utilizar la tecnología de inteligencia artificial en sus creaciones. sin embargo, a día de hoy, todavía existen muchos puntos débiles.

"los vídeos generados por ia son incontrolables y, una vez que hay demasiados elementos, no se pueden entender múltiples personajes y escenas espaciales", dijo vicky, creadora de cine y televisión con ia. muchos creadores de cine y televisión de ia nacionales y extranjeros dijeron que en el proceso de creación real, el problema central común es la capacidad de control insuficiente o la falta de coherencia, especialmente cuando se trata de escenas complejas y escenas interactivas.

aunque el modelo de video ai funciona bien al seguir instrucciones, los resultados de salida aún son inciertos y pueden ser necesarios varios intentos para generar una imagen satisfactoria. además, el modelo generado por ia todavía tiene limitaciones en términos de movimiento de la cámara, efectos de luces y sombras y procesamiento de detalles, lo que dificulta lograr un control completo y preciso.

shengshu technology lanzó oficialmente el modelo de video generado por ia el 30 de julio de este año. para ayudar a los creadores a mejorar la eficiencia, la compañía actualizó recientemente la función del modelo de video vidu y lanzó la función "referencia de tema". al abordar el problema de la coherencia, puede lograr una generación coherente de cualquier tema, lo que hace que la generación de vídeo sea más estable y controlable.

la función "referencia de sujeto" permite a los usuarios cargar una imagen de cualquier sujeto. vidu puede bloquear la imagen del sujeto, cambiar escenas arbitrariamente a través de descriptores y generar un video con el mismo sujeto.

el 11 de septiembre, un reportero de the paper technology (www.thepaper.cn) inició sesión en la plataforma vidu del sitio web oficial de shengshu technology para probar la generación de videos. subió una imagen tridimensional de la estrella de cine estadounidense leonardo dicaprio e ingresó palabras clave como "cielo azul", "copa de vino" y "tostada";

palabras de entrada: "cielo azul", "copa de vino", "brindis", etc.

la imagen generada con vidu es la siguiente:

00:04

sube una captura de pantalla 2d de la heroína del anime japonés "youth" e ingresa palabras clave como "corriendo", "tarde", "mañana", etc.

la imagen generada con vidu es la siguiente:

00:04

tang jiayu, cofundador y director ejecutivo de shengshu technology, dijo en una entrevista que la función de "referencia de sujeto" de vidu es actualmente la primera tecnología del mundo con capacidades de generación consistentes. la tarea principal de shengshu technology es construir modelos grandes multimodales. la generación de videos de ia aún se encuentra en sus primeras etapas y aún quedan más cuellos de botella técnicos que superar en el futuro. él cree que la tecnología de video de ia no siempre será una herramienta para un pequeño grupo de personas. se estima que para fines de este año, la tecnología de video de ia será popularizada por el público y los usuarios podrán usarla fácilmente.

shengshu technology se estableció en marzo de 2023. los miembros principales del equipo son del instituto de investigación de inteligencia artificial de la universidad de tsinghua. el científico jefe zhu jun es profesor de la universidad de tsinghua. el cofundador y director ejecutivo tang jiayu tiene una maestría en ciencias naturales. laboratorio de procesamiento del lenguaje de la universidad de tsinghua y ex empleado de ruilai intelligence, vicepresidente y gerente senior de productos de tencent youtu lab.

el reportero del periódico yu yan y el pasante wang chun

(este artículo es de the paper. para obtener más información original, descargue la aplicación “the paper”)

informe/comentarios

noticias

tang jiayu, director ejecutivo de shengshu technology: la generación de vídeo aún se encuentra en sus primeras etapas y existen obstáculos técnicos que superar.

introducción

mi información de contacto