noticias

"Keling" de Kuaishou se hizo popular inesperadamente, Byte estaba ansioso por ponerse al día y la competencia en la pista de video AI Wensheng se intensificó.

2024-07-31

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina



En febrero de 2024, la aparición de Sora impidió que muchas grandes empresas de modelos tuvieran un buen Festival de Primavera.

"La Gala del Festival de Primavera aún se está repitiendo, por lo que estamos organizando urgentemente debates grupales", dijo con entusiasmo un empleado de una empresa líder en inteligencia artificial a "City Circle". Al ver la experiencia fluida de Sora, incluso los blogueros que venden cursos se apresuran a lanzar tutoriales en línea y ganar mucho dinero.

¿Quién puede "copiar" la versión nacional de Sora en el menor tiempo? Cada vez más personas se centran en Alibaba, Baidu y los "cinco grandes". Pero nadie pensó que el ganador sería un jugador rápido con un rendimiento técnico relativamente "similar al de un Buda".

El 7 de junio, Kuaishou lanzó repentinamente el modelo de video Wensheng "Kling", que puede admitir la generación de videos de hasta 2 minutos. Además, en comparación con Sora, que todavía se encuentra en la etapa de "futuro", Keling se abrió para pruebas tan pronto como se anunció, y los resultados generados también son notables.

"Keling es el tema que más se ha debatido últimamente en el sector", dijo a City Circle una persona del sector del capital riesgo. Según datos oficiales, más de 500.000 personas solicitaron Keling en el plazo de un mes desde su lanzamiento. Se ha abierto a más de 300.000 usuarios y ha generado más de 7 millones de vídeos cortos.

La inesperada popularidad de Ke Ling inevitablemente hizo que Byte se avergonzara un poco. En mayo de este año, Byte también abrió la prueba del modelo "Jimeng" de Wensheng Video, pero el efecto aún no es obvio en la popular pista de Wensheng Video.

De repente, al ser arrojado por un oponente que había sido "ignorado", Byte necesitaba alcanzarlo. Según TMTPost, ByteDance ha establecido recientemente el modelo grande de IA como la dirección de "nivel más alto P0" del grupo. Muchos equipos como Douyin y Jianying también están trabajando arduamente para desarrollar aplicaciones de modelos de video de IA, que se espera que se anuncien en un futuro próximo.

1. Se puede hacer de forma rápida, brusca y feroz.

Muchos desarrolladores dijeron a "City" que el lanzamiento y el excelente desempeño de Keling son una sorpresa en la industria.

Recientemente, "City Boundary" utilizó un párrafo de "gato negro" como palabra clave e ingresó el mismo mensaje en Keling, Jimeng y "Qingying" que acababa de lanzar Zhipu AI: "Las calles de la ciudad en un día lluvioso están vacías Una persona, un lindo gato negro, pasa corriendo. Tiene ojos verdes, un collar amarillo y una campana en el cuello, y pelo largo y negro en el cuerpo. El video está filmado desde la perspectiva de la cámara y el agua en el. El suelo lo refleja. La figura del gato negro.

Entre los tres videos generados, aunque la versión Keling no logró el efecto de correr rápido, los videos generalmente se ajustaron a las reglas objetivas.

Por el contrario, en la versión "Jimeng" no había agua en el suelo y el gato negro no avanzaba. Aunque la versión "Qingying" tiene acumulación de agua, el gato negro tiene un andar extraño al caminar y la cola también pierde marcos.

▲(Los videos son generados por Ke Ling, Ji Meng y Qing Ying en orden)

Según "Silicon Star", Kuaishou tardó tres meses en construir Keling; el equipo es muy pequeño, con solo más de 20 personas. El líder es Wan Pengfei, el actual jefe del Centro de Interacción y Generación Visual de Kuaishou, la mayoría de los cuales realiza investigaciones. Las direcciones incluyen procesamiento de señales de imagen/video, fotografía computacional y visión por computadora, reducción de función de pérdida, generación de visión, etc.

El predecesor de Keling proviene de un proyecto discreto "Puji" reiniciado por Kuaishou en octubre de 2023. Se trata de una herramienta de software que utiliza IA para generar emoticones Gif de 2 segundos a partir de imágenes estáticas. A principios de marzo de este año, Kuaishou celebró una pequeña reunión interna. La idea de Wan Pengfei fue confirmada por Gai Kun (Yu Yue), vicepresidente senior de Kuaishou, y rápidamente se determinó que Puchi era un producto para la investigación previa.

Según "Silicon Star People", "al hacer Keling, existe un consenso a nivel de ejecución de que es rápido, rudo y feroz".

Menos de un mes después del inicio del proyecto Keling, recibió el apoyo del fundador de Kuaishou, Cheng Yixiao, quien lo consideró un proyecto estratégico para la empresa. Gai Kun también suele decir: Todas las tarjetas de la empresa son para su uso y la empresa las respalda plenamente.

Ke Ran, un emprendedor en la vía humana digital, analizó "City": "El éxito de Keling se debe en gran medida al material de datos de video acumulado por Kuaishou. Mirando el país, el único que puede competir con él en este aspecto es el sonido Douishu. ".

Pero si bien el paisaje es hermoso, Byte parece un poco solitario.

Aunque "Jimeng" se anunció oficialmente el 9 de mayo y el 17 de junio, Jimeng también apareció en la serie corta de AIGC "Sanxingdui: Future Apocalypse" como el principal apoyo técnico de IA. Sin embargo, ya sea en términos de su actuación en el lado C o en comparación con el drama corto AIGC de Kuaishou “Mountains and Seas”, que se lanzó el 13 de julio, la voz de Ji Meng no es muy fuerte.

El 17 de julio, hubo noticias en el mercado de que Byte anunciará el progreso de la tecnología de video Vincent similar a Sora. El mundo exterior también interpreta esto como que Byte va a alcanzar y competir frontalmente con Keling.

Sin embargo, Byte declaró más tarde a "City Circle" que la noticia no era exacta. El 17 de julio, "City Circle" notó que el evento se parecía más a una sesión para compartir tecnología. La reunión fue organizada principalmente por Feng Jiashi, el líder del equipo de investigación visual básica del modelo grande de Doubao, y toda la sesión fue compartida por científicos investigadores de Byte, académicos institucionales, etc. en inglés.

Parece que el "gran movimiento" de Byte todavía tendrá que esperar algún tiempo.

2. El byte aún no se ha recuperado

Entonces, ¿por qué Byte se perdió la fiesta en la pista de Vincent Video que ha estado en pleno apogeo recientemente?

Hasta cierto punto, tal vez porque en comparación con Kuaishou apostando por "Ke Ling", puede "derrotar diez habilidades con un solo esfuerzo". El diseño del modelo a gran escala de Byte es más complicado, y en la primera mitad de este año, los oponentes más importantes de Byte son Tencent y Alibaba.

Frente a los modelos grandes, el ritmo de Byte ya no es "radical". Después de todo, fue Byte quien tomó la iniciativa al lanzar una gran guerra de precios de modelos en la industria hace más de 2 meses.

El 15 de mayo, en la “Conferencia FORCE Motive Power” de ByteDance, Byte lanzó un servicio API basado en su modelo de puf de desarrollo propio. Al mismo tiempo, Tan Dai, presidente de Volcano Engine, dio un paso y reveló el último precio de “Doubao”: 0,0008 yuanes/mil tokens, anunciando que este era el “precio mínimo” inferior al 99,3% de la industria.

En ese momento, el "ataque" de Byte había tomado la delantera. Según "círculos de mercado" de muchas fuentes, los principales actores no estaban preparados para el ataque de Byte, aunque todas las partes se sentían impotentes, sólo podían seguirlo pasivamente;

En los días siguientes, Alibaba Cloud, Baidu Wenxin Model y Tencent Cloud anunciaron sucesivamente que reducirían significativamente los precios de sus API y tokens de entrada de inferencia de modelos grandes. Bajo esta influencia, las solicitudes del lado C para modelos de cabeza a gran escala ahora son casi gratuitas y la industria ha comenzado a avanzar hacia el siguiente nivel ecológico.

Según el fundador de una empresa legal de aplicaciones de IA, casi no hubo demora después de que se abrió el servicio API y el personal de ventas de Volcano Engine comenzó a contactar activamente a los clientes y promocionar productos. Esto también confirma la especulación que circula en el mercado de que Byte ha marcado el modelo grande como la estrategia de más alto nivel.



▲(Tan Dai en la "Conferencia FOECE" de 2024. Fuente/Volcano Engine)

Recientemente, los pufs "producto líder" de Byte han crecido significativamente.

Según datos de Questmobile, a junio de 2024, entre las aplicaciones AIGC nacionales, Doubao, Tiangong, Kimi Smart Assistant y Cat Box han logrado un crecimiento impresionante, con Doubao ocupando el primer lugar en tráfico.



▲(Fuente de la foto/QuestMobile)

En comparación con Kuaishou, lo que más preocupa a Byte ahora puede ser la competencia ecológica total desde los grandes modelos básicos hasta la capa de aplicación de IA. Además, teniendo en cuenta que Volcano Engine no se convertirá oficialmente en nube hasta 2021, es el "más joven" entre los gigantes proveedores de nubes. Durante más de tres años, Huoshan Cloud ha sido considerada un desafío en el mercado de la nube. La forma en que Byte colabora con el modelo básico grande, la capa de aplicaciones y el mercado de la nube es una propuesta integral.

Recientemente, según informes de "Photon Planet", una gran cantidad de usuarios de la plataforma "Kouzi" de Byte están buscando formas de conectar sus agentes y bots creados con cuentas oficiales o miniprogramas de WeChat, y las discusiones son muy activas.

En diciembre del año pasado, Byte lanzó la plataforma de desarrollo de aplicaciones de IA "coze" en el extranjero. En febrero de este año, se lanzó en línea la versión nacional de “Button”. Un gran número de comerciantes de Douyin también esperan hacer rápidamente una olla de oro con él.

Teniendo en cuenta que Tencent lanzó tardíamente la plataforma de creación y distribución de agentes de inteligencia artificial "Tencent Yuanqi" en mayo de este año. En ese momento, el número de visitas a Button había alcanzado los 2,33 millones de veces. Hasta el momento, Tencent Yuanqi aún no ha abierto el ecosistema de miniprogramas, cuentas oficiales y cuentas de suscripción de servicio al cliente de la serie WeChat.

Después de todo, el desarrollo de la IA aún se encuentra en sus primeras etapas. Byte, al igual que Tencent, todavía necesita dedicar mucho tiempo a educar a los usuarios. Competir por los derechos de distribución en la era de la IA y obtener una ventaja puede ser una lección más importante que Byte debe aprender para apuntar a Tencent.

3. Golpea más tarde, todavía hay tiempo

A nivel industrial, en la Internet actual no falta tráfico de contenidos, tráfico de comercio electrónico y bytes de munición financiera. Incluso si Vincent Video está "un paso por detrás" a corto plazo, a largo plazo. todavía tiene el potencial de ponerse al día.

Utilizar estrategias de mercado activas para ponerse al día con posiciones rezagadas y lograr milagros con fuerza es también la especialidad de Byte.

Recientemente, apuntando a Alibaba, Byte también ha estado trabajando en la integración de modelos grandes. En la Conferencia del Ecosistema DingTalk que acaba de celebrarse el 26 de junio, el presidente Ye Jun anunció que, además del propio Tongyi de Alibaba, también se incluirán en DingTalk grandes modelos de terceros de las otras seis empresas. Estos incluyen MiniMax, Dark Side of the Moon, Zhipu AI, Orion Star, Zero One Thing y Baichuan Intelligence, que cubren casi todas las empresas emergentes de modelos a gran escala conocidas en China. Es evidente "construir el ecosistema de IA más abierto de China". ".

De manera similar a la jugabilidad de DingTalk, además de admitir su propio "Doubao", la plataforma Kouzi de Byte también tiene acceso a importantes modelos externos como Tongyi Qianwen, Dark Side of the Moon y MiniMax. El 14 de junio, Kouzi también lanzó la función "Model Square", que permite a los usuarios seleccionar dos modelos anónimos y calificarlos según el rendimiento del contenido generado.



Además, Byte ha quedado expuesto recientemente y su exploración del "hardware AI +" se está acelerando y no duda en reclutar talentos mediante adquisiciones.

Según "Tech Planet", PICO, una filial de Byte, ha estado desarrollando múltiples dispositivos portátiles desde la segunda mitad del año pasado, incluidos auriculares y altavoces, y estos dispositivos también estarán equipados con IA. El equipo de Byte Doubao también ha explorado la combinación de software y hardware de modelos a gran escala. La combinación de software y hardware de modelos a gran escala se ha aplicado gradualmente a dispositivos de hardware como máquinas de aprendizaje, perros robot y robots.

Según otro informe de 36Kr, el responsable de la “línea D” del hardware Byte AI es Li Haoqian. Este último es el fundador de Oladance, la marca de auriculares OWS (Open Wearable Stereo) adquirida por Byte en marzo de este año. El responsable de "O Line", otra línea de hardware de IA, es también el fundador de la empresa adquirida por Byte. Depende de Hong Dingkun, vicepresidente de ByteDance Technology.

En dirección a Vincent Video, ante la reciente popularidad del tema, sus perseguidores, entre ellos Byte, todavía están a tiempo.

Recientemente, un desarrollador dijo a "City World": "Actualmente, uso Keling para componer imágenes y reducir la carga de trabajo del flujo de trabajo. Todavía no lo uso completamente para la creación, por lo que no dependo mucho de él todavía".

A los ojos de otro desarrollador y bloguero de vídeos cortos de AIGC, Keling todavía tiene mucho margen de optimización: "Confiar en Keling Wensheng Video no puede garantizar la coherencia de la IP humana virtual. Normalmente uso Kelingtu para producir vídeos. La función es equivalente "Para darle a Ke Ling una imagen, le permite generar videos dinámicos desde diferentes perspectivas y luego unirlos para simular el efecto de mover la cámara. De hecho, la proporción de operación humana es mayor".

Un miembro del equipo de I+D de un producto nacional de citas con simulación de IA dijo: "En el mercado actual de aplicaciones de modelos a gran escala, todo el mundo cruza el río sintiendo las piedras. Cómo comercializarlo es una cuestión demasiado lejana y demasiado vago, pero lo que es seguro es que cuanta más gente lo use y juegue, más podrá garantizar la optimización y la iteración del producto”.

(Ke Ran es un seudónimo)

Autor | Dong Wen Shu

Editar | Li Yuan

Operaciones | Liu Shan