noticias

El anciano que no puede esperar a Sora corre hacia Kuaishou Keling.

2024-08-01

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


¿Por qué Kuaishou es el primer gran fabricante en lanzar vídeos de IA? ‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

Texto | Chen Meixi

Directora |

En los primeros días, cuando la IA abierta arrasó en el mundo en términos de modelos grandes, Kuaishou no era una figura deslumbrante. En ese momento, a Baidu se le ocurrió Wenxinyiyan, Alibaba se le ocurrió Tongyi Qianwen y Tencent se le ocurrió el gran modelo Hunyuan, poniéndose al día, y la velocidad de investigación, desarrollo y apertura fue muy rápida.

Kuaishou no estaba en la lista inicial de contendientes, e incluso ahora, pocas personas pueden nombrar el nombre del gran modelo de lenguaje de Kuaishou: Ruyi.

La situación de la batalla cambió el 6 de junio de este año. El modelo grande generado por video de Kuaishou, Keling, abrió las solicitudes para la versión beta pública. Ese día también fue el 13º aniversario de Kuaishou. Los medios a menudo comparan a Keling con Sora de Open AI, pero desde su explosivo debut en febrero, Sora no ha estado abierto al público. Como resultado, los usuarios chinos curiosos comenzaron a acudir en masa a Keling.

Diez días después, Keling "ha (recibido) decenas de miles de solicitudes". Estos datos provienen de Wan Pengfei, quien asistió a la Conferencia de Zhiyuan ese día. En el momento del discurso, su título era el de jefe del Centro de Interacción y Generación Visual de Kuaishou, y también era la persona a cargo real de Keling. Al 19 de julio, el número de solicitantes superó el millón. Keling solo tardó más de un mes en aumentar el número de solicitudes de decenas de miles a un millón. Entre los avances de los modelos grandes en la primera mitad del año, este es el desempeño más llamativo.


La imagen generada por el espíritu, la palabra clave: abeja en las flores.

Las historias de cambios siempre son populares entre el público. Sin embargo, un inventario cuidadoso de Keling y el gran negocio modelo Kuaishou detrás revelará que este no es un drama genial que permanece latente y luego emerge de repente, ni es una narrativa heroica en la que un joven talentoso lidera un pequeño equipo para atacar. atrás.

Además, se genera un video basado en la imagen generada por Keling, con la palabra clave: abejas volando

¿Por qué Kuaishou es el primer gran fabricante en lanzar vídeos de IA?Son las necesidades empresariales las que aportan una fuerte motivación y una alta prioridad, es la acumulación de datos y tecnología en forma de producto lo que aporta velocidad de iteración, y es la combinación de escenarios empresariales lo que atrae clientes reales.

La aparición de Ke Ling no es un hecho accidental. A nivel nacional, el mayor rival de Kuaishou en el campo del vídeo de IA probablemente provenga de ByteDance.


Cuando hay demanda, hay motivación

Los creadores son uno de los vínculos más importantes del ecosistema de contenidos de Kuaishou. Según datos oficiales publicados por Kuaishou, en 2023 habrá 138 millones de creadores que publicarán vídeos cortos en Kuaishou por primera vez, y los vídeos publicados a lo largo del año recibirán más de 1 billón de me gusta en la plataforma.

Tener una gran cantidad de creadores de contenido significa que Kuaishou debe hacerse cargo de sus necesidades de herramientas de contenido, de lo contrario, los creadores que persiguen la productividad emergente pronto se apresurarán a utilizar otras herramientas e incluso otras plataformas. Este es también el valor de Kuaiying a Kuaishou y Cutting a Byte.

Por lo tanto, la inversión anterior de Kuaishou en grandes modelos lingüísticos no fue radical, pero tiene que esforzarse por llegar a la cima en la competencia de grandes modelos multimodales.

Antes de Keling, la capacidad de modelo grande Wenshengtu de desarrollo propio de Kuaishou se había integrado en Kuaishou. El resultado de las pruebas internas fue que los usuarios generaron un promedio de más de 500 millones de imágenes de IA en el área de comentarios cada mes.


La imagen generada por Keling, la palabra clave: Alien parado junto al río Yangtze

La fuerte motivación que aporta la demanda es sin duda una condición necesaria para el surgimiento de Keling, pero Kuaishou no es el único que cumple estas condiciones. Si hay algún otro factor importante que influyó en el surgimiento de Ke Ling, podría ser la determinación.

La determinación proviene primero de la alta dirección de Kuaishou.

Anteriormente, los movimientos de Kuaishou en modelos grandes siempre parecían medio paso más lentos. Cuando se trata de modelos de lenguajes grandes nacionales, todos pensarán primero en Wen Xin Yi Yan y Tong Yi Qian Wen; cuando se trata de aplicaciones de modelos de lenguajes grandes, Kimi y Doubao son los más populares en el mercado. En el campo de los gráficos vicencianos, Ririxin 5.0 de SenseTime fue el primero en salir del mercado interno. A la mañana siguiente de su lanzamiento, el precio de las acciones de SenseTime Technology subió más del 30% y la negociación se suspendió temporalmente.

En la serie anterior de historias, Kuaishou estaba en una posición aparentemente marginal. Los modelos de vídeo de gran tamaño y sus aplicaciones son el nodo más importante de la competencia y la parte más importante del diseño general de los modelos de gran tamaño.

En un informe anterior del medio tecnológico Silicon Star, un técnico del equipo de Keling dijo: "Lo que Gai Kun suele decir es que todas las tarjetas de la empresa son para que usted las use, y la empresa las apoya plenamente. Yu Yue. el vicepresidente senior de Kuaishou y se desempeña como director ejecutivo. La persona a cargo del negocio de la línea de estaciones y también la persona a cargo de la línea de ciencias sociales. Después de que el ex director de tecnología Chen Dingjia renunció, Gai Kun se convirtió en uno de los principales líderes de la línea tecnológica de Kuaishou.

Wan Pengfei y su equipo pueden tener una determinación aún mayor.Un detalle es que después de decidir hacerse cargo del proyecto Keling, Wan Pengfei entregó el trabajo original de asumir las necesidades comerciales de todas las partes a otras personas a cargo del mismo nivel en el equipo de Zhang Di.En consecuencia, otros miembros del equipo de Keling también entregaron el negocio original y se dedicaron por completo a la investigación y el desarrollo de Keling. Es normal trabajar horas extras los fines de semana para ponerse al día con el progreso.

Un video generado además en base a la imagen generada por Keling, sugiere palabras: Extraterrestre caminando en el agua, dos extraterrestres chocando las manos.

"En realidad, más de un mes antes del lanzamiento oficial, los resultados de las pruebas de Ke Ling no fueron muy buenos", dijo un practicante de la gran industria del modelo a Hedgehog Commune: "Lao Wan y los demás están luchando contra todo pronóstico. Lo que sigue es Realmente 'resultados milagrosos con gran fuerza'. Mucha gente no esperaba tal efecto al final”.

Entonces la determinación se convirtió en la última variable.


La acumulación conduce a la velocidad

Kuaishou, o cualquier plataforma líder de vídeos cortos, ha acumulado experiencia en el desarrollo de vídeos de IA en dos aspectos, contenido y tecnología.

Los videos son producidos por los usuarios y, después de ser anotados y comprendidos por la plataforma, el contenido que se puede distribuir se filtra. Esta es la ruta inherente a la lógica empresarial de Kuaishou. El contenido procesado se convierte en una especie de datos, desde la descripción del contenido en sí hasta la popularidad después de la distribución, Kuaishou ha dominado una enorme cantidad de datos de contenido.En términos sencillos, ambos tienen contenido y saben qué "buen contenido" les gusta ver a los usuarios.

Para el entrenamiento de grandes modelos de vídeo generativo, este proceso es como preparar los platos con antelación.

Incluso el "cocinero" está listo.

La mayoría de los miembros principales de I+D del equipo del proyecto Keling son antiguos subordinados de Wan Pengfei del período Y-tech. A principios de año, los miembros del equipo entraron gradualmente en contacto con información y materiales relevantes y comenzaron a trabajar en la investigación y el desarrollo de Keling.

Anteriormente, el equipo de Wan Pengfei era el principal responsable de satisfacer las necesidades de creación inteligente de UGC en el ecosistema creativo de Kuaishou y trabajó en estrecha colaboración con partes comerciales como la producción de la estación principal, Kuaiying y Yitian Camera. Las formas del producto incluyen embellecimiento de retratos, efectos especiales de audio y video. , avatares de transmisión en vivo, etc.

En 2021, Wan Pengfei pronunció un discurso público como "Jefe de la plataforma de tecnología de inteligencia artificial del departamento de Y-tech" en la Conferencia global de tecnología de inteligencia artificial.Entre los casos compartidos en ese momento se encontraba el "efecto especial de fotografía viviente", un videojuego Tusheng en la era anterior a los grandes modelos. En ese momento, las bibliotecas de plantillas de Kuaishou y Kuaiying lanzaron el efecto especial "fotos antiguas en movimiento". Después de que los usuarios suben una foto, los personajes de la foto pueden realizar movimientos como sonreír, parpadear y asentir para formar un efecto de vídeo. Según los informes, este efecto especial dinámico ha sido utilizado por más de 3,44 millones de personas en Kuaiying.


Las conmovedoras fotos y videos antiguos publicados por el internauta de Kuaishou @senyuhelu en 2021

En 2021, Wan Pengfei tenía mucha confianza en el desarrollo de la tecnología generativa y propuso que "los modelos generativos serán cada vez más poderosos, el contenido generado será más realista y el proceso de generación será más estable y controlable".

Tres años después, Keling volvió a aparecer con su obra "Reviving Old Photos". Algunos usuarios que solicitaron permiso para utilizarlo utilizaron la función "Tusheng Video" para convertir fotos de familiares fallecidos en vídeos. En comparación con los "efectos especiales de fotografías en vivo" de hace tres años, a través de instrucciones abiertas, los usuarios pueden hacer que los personajes de las fotografías completen acciones más complejas. Este es exactamente el cambio provocado por la nueva tecnología de modelos grandes.

Sora se lanzó en febrero de este año y el equipo de Kuaishou Keling comenzó a formarse en un momento cercano, pero el desarrollo y la aplicación de tecnología de generación de video multimodal siempre ha estado dentro del alcance del trabajo de Wan Pengfei y su equipo. .

Los practicantes mencionados anteriormente expresaron puntos de vista similares a Hedgehog Commune: "De hecho, el surgimiento de Sora equivale a permitir que todos determinen la ruta técnica o el plan en ese nodo, pero hay muchas aplicaciones de la tecnología visual, incluidas las cosas multimodales. Eso es lo que siempre han hecho”.

La acumulación técnica que necesita Ke Ling proviene de esto. El cocinero se encontró con el plato preparado y, después de que una nueva receta fuera vista en todo el mundo, Kuaishou se convirtió en uno de los equipos que preparó el producto terminado más rápido.

Pero al mismo tiempo, los profesionales antes mencionados también tienen una actitud de esperar y ver si Keling podrá mantenerse en una posición de liderazgo en tecnología y productos durante mucho tiempo. "Los algoritmos que todos utilizan ahora son similares. Cada empresa puede tener algunos ajustes, pero la diferencia sigue siendo la misma, con tarjetas, datos y algoritmos similares, es sólo cuestión de tiempo antes de que cada empresa". produce productos con efectos similares.

Por lo tanto, la velocidad es solo una ventaja temporal de Kuaishou. Necesitan transformar realmente su ventaja en clientes estables durante el período de ventana líder.


Donde hay una escena, hay clientes.

El 29 de diciembre de 2020, Kuaishou lanzó oficialmente la "facción Kuaishou" como valor corporativo por primera vez en una carta interna a todos los empleados, diciendo que "obsesionarse con los clientes" es el núcleo de los valores de Kuaishou.

Anteriormente, ya sea dentro de Kuaishou o de otras importantes empresas de Internet, el concepto que se mencionaba con mayor frecuencia era el de "usuarios". Por esta razón, Kuaishou explicó específicamente los motivos de este cambio de vocabulario. "La complejidad empresarial de la empresa se ha vuelto mayor, expandiéndose de 'usuarios' a 'clientes'. Los clientes incluyen productores y consumidores, clientes del lado B y usuarios del lado C, clientes externos y clientes internos. Necesitamos fortalecer nuestra comprensión de los productores y Clientes del lado B. Para mejorar la comprensión y la conciencia del cliente, también debemos enfatizar la conciencia del servicio hacia los clientes internos”.

Mirando hacia atrás, en 2024, efectivamente fue un hito importante en los cambios en la estructura empresarial de Kuaishou. En 2020, entre los ingresos anuales de Kuaishou, la proporción de ingresos por transmisiones en vivo cayó del 80,4% en el año anterior al 56,5%, y la proporción de ingresos por servicios de marketing en línea aumentó del 19% al 37,2% Otros, incluido el comercio electrónico, The. La proporción de ingresos por servicios aumentó rápidamente hasta el 6,3% desde el 1% del año anterior.

Como ha explicado el propio Kuaishou, los productores y consumidores, los clientes del lado B y los usuarios del lado C, los clientes externos y los clientes internos son todos clientes importantes de Kuaishou, y también se convertirán en los clientes objetivo del gran modelo de Kuaishou.

Los productores y consumidores construyen conjuntamente la cadena comercial más básica de Kuaishou. Los productores producen contenido y los consumidores consumen contenido.El valor de los productos de modelos grandes radica en reducir el umbral de producción y al mismo tiempo mejorar la calidad del contenido.

Lo primero es fácil de entender. Como Keling puede lograr actualmente, puede obtener un video ingresando texto o imágenes. Para las personas sin condiciones de filmación ni capacidades de producción, el umbral de producción se ha reducido considerablemente.

Esto último suena un poco contradictorio al principio: con las capacidades de simulación y la duración de salida de los productos de vídeo con IA actuales, ¿cómo puede ser mejor que la filmación real y la producción profesional en términos de calidad? Sin embargo, en plataformas líderes como Kuaishou y Douyin, la mayoría de las decenas de millones de videos cortos producidos todos los días provienen de usuarios comunes. A los ojos de los productores de contenido profesionales, la tecnología de inteligencia artificial "no lo suficientemente sofisticada" es suficiente para convertirlos en usuarios comunes. ' Tome fotografías aleatorias para agregar material y riqueza.

Los comerciantes del lado B también pueden convertirse en clientes de las capacidades de los modelos grandes de Kuaishou. Según los datos publicados por Kuaishou en la Conferencia Mundial de Inteligencia Artificial de este año, sus ingresos por publicidad de IA han superado los 20 millones por día. Los materiales publicitarios generados por IA pueden reducir el costo por artículo a 0,47 yuanes manteniendo el CTR en el nivel básico.


Keling genera imágenes y palabras: material publicitario de zumo de manzana, sobre la mesa blanca hay un vaso de zumo de manzana y a un lado dos manzanas rojas.

Para muchos productos de modelos grandes, encontrar escenarios de aterrizaje es un problema difícil durante todo el ciclo de vida del producto, pero a Kuaishou obviamente no le faltan escenarios.Como dijo Zhang Di, vicepresidente de Kuaishou y jefe de modelos grandes, el éxito de Keling proviene de "extraer valor real en escenas reales para satisfacer las necesidades reales de los usuarios".

El problema que tienen que enfrentar es cómo hacer que los usuarios se conviertan en usuarios de alta frecuencia de los modelos grandes de Kuaishou en el escenario actual, y estén dispuestos a seguir pagando por ello, y primero realizar la comercialización de modelos grandes dentro de su propio ecosistema.

El 25 de julio, Keling abrió completamente el registro. El mismo día, Keling lanzó su sistema de membresía y entró en la etapa de cobro.

Según la información del sitio web oficial de Keling, los usuarios que no son miembros pueden recibir 66 puntos de inspiración cuando inician sesión todos los días. Según el "precio" actual, se pueden generar aproximadamente 6 vídeos o 330 imágenes de forma gratuita.

Hay dos modelos de pago. Uno es el modelo de membresía. Los usuarios pueden comprar diferentes niveles de membresía de forma mensual, trimestral, semestral o anual. Cuanto mayor sea el nivel, más trabajos se pueden generar; el modelo de recarga, donde los usuarios pueden pagar directamente para recargar, el costo de producción del usuario por cada video es de 1 yuan y el costo de producción de cada imagen es de 2 centavos.


La imagen generada por Keling, la palabra clave: amanecer, hay hermosas nubes y el resplandor de la mañana en el horizonte, el sol está escondido entre las nubes.

Hay dos puntos que merecen atención con respecto al sistema de precios de Keling.

En primer lugar, Kuaishou no ofrece una opción de membresía que pueda generar trabajos ilimitados, lo que significa que no importa si eligen el modo de recarga o el modo de membresía, los usuarios en realidad están "pagando dinero para comprar tiempos".La única diferencia es el precio unitario de cada generación, así como funciones diferenciadas como eliminación de marcas de agua, extensión de vídeo y movimiento del espejo maestro.

El costo de generar videos de IA es alto y Kuaishou no proporciona miembros que puedan generar tiempos ilimitados. Kuaishou obviamente quiere evitar un posible control de costos y frenar la producción gris hasta cierto punto.

En segundo lugar, el valor de la inspiración como "moneda de pago" de Keling es equivalente en precio a las monedas Kuai utilizadas para recompensar a los anclas en el ecosistema Kuaishou. Con 1 yuan de RMB, puedes comprar 10 monedas rápidas o 10 puntos de inspiración. Este método de fijación de precios puede preservar la posibilidad de abrir el sistema de pago dentro del ecosistema de Kuaishou en el futuro.


Kuaishou está lejos de ser el único que tiene necesidades, escenarios, clientes, equipos, datos, tecnología y reservas de talento al mismo tiempo.

Los expertos de la industria antes mencionados predicen que en un futuro próximo, Byte podrá producir productos de vídeo generativo del mismo nivel. Antes de eso, Kuaishou necesita completar la acumulación de usuarios y de contenido dentro del período de ventana, para que el contenido de IA pueda operar de manera efectiva dentro del ecosistema de Kuaishou. Es mejor poder recorrer el camino de comercialización y ocupar la posición de líder. un tiempo más largo.

Los medios convencionales de crecimiento y operaciones están en la agenda. El sitio web oficial de Keling lanzó rápidamente un evento de descuento del 50% para miembros. Al mismo tiempo, los usuarios pueden obtener 66 puntos de inspiración iniciando sesión todos los días para reducir el impacto del modelo de pago en el crecimiento y la retención de usuarios, de modo que al menos todos los usuarios puedan. Pruébelo sin ningún umbral.

Además, en la operación del sitio Kuaishou, Keling no pone demasiado énfasis en conceptos como video generativo, soluciones de modelos de difusión y grupos de capacitación distribuidos. En cambio, utiliza "fotos antiguas para convertirse en videos" y "abrazarlo a través de usted". tiempo y espacio" y "resurrección hace 40 años". "Foto anterior" y otros métodos de juego para atraer a los usuarios a comenzar a usarlo primero, a fin de reducir el costo de comprensión del usuario.

Para los usuarios comunes, el nuevo juego tiene la misma dificultad que el juego de efectos especiales de Kuaiying anterior. Lo entienden como un efecto especial más poderoso, ya sea que hayan oído hablar de las tres palabras "modelo grande" o no, no les impide. Se convierten en usuarios reales de productos de modelos grandes.

Este es el primer paso definitivo para que Kuaishou y Byte hagan videos de IA, si los usuarios son suyos, también es la crisis definitiva que enfrentan en la era de la IA, si los usuarios se sienten atraídos por nuevos productos discontinuos;

En lugar de decir que están compitiendo por la entrada a la era del vídeo con IA, es mejor decir que todos son defensores. La nueva productividad creará nuevas formas de contenido y, en última instancia, nuevas plataformas. Esta historia les resulta familiar tanto a Cheng Yixiao como a Zhang Yiming.

Tienen que ser el primer nivel.

(Imagen de portada generada por Keling).


Contacto de cooperación con los medios WeChat ID |ciweimeijiejun

Si desea comunicarse con nosotros, puede responder "unirse al grupo" en segundo plano para unirse a la comunidad.