noticias

yan junjie, fundador de minimax: lo único que puedes hacer es mejorar |ai frontier

2024-09-20

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

nota del editor:

"ai daily", una subsidiaria de la agencia de noticias financieras de china y el daily de la junta de innovación científica y tecnológica, lanzó hoy oficialmente la entrevista "insight·ai frontier". las entrevistas se centran en empresas destacadas, empresarios, académicos destacados, inversores, etc. en el campo de la inteligencia artificial y grandes modelos en el país y en el extranjero, aportando las últimas exploraciones, prácticas y pensamientos sobre la ia que empoderan a miles de industrias. insight・¡la ia es la primera línea, la visión, la pionera y la primera línea!

"kechuangban daily" 20 de septiembre (reportero huang xinyi)como uno de los seis tigres de la ia, minimax ha completado la ronda de financiación a+. la última ronda fue liderada por alibaba, con un monto de 600 millones de dólares. la valoración de la empresa ha superado los 2.500 millones de dólares y los inversores detrás de ella incluyen tencent, sequoia china, hillhouse, idg, mihoyo, etc.

en minimax, los compañeros sólo se llaman entre sí por sus apodos. en cuanto al fundador yan junjie, los empleados lo llaman io (nombre de la flor). yan junjie alguna vez se desempeñó como vicepresidente de sensetime, vicepresidente del instituto de investigación y cto del smart city business group. en diciembre de 2021, en vísperas de la salida a bolsa de sensetime, yan junjie dejó sensetime y fundó minimax.

recientemente, minimax lanzó el primer modelo de generación de video de alta definición con ia, abab-video-1. después de la conferencia de prensa, yan junjie reveló en una entrevista con el daily science and technology innovation board y otros medios que el modelo de la serie abab7 que utiliza tecnología de nueva generación se lanzará oficialmente en las próximas semanas y el efecto será comparable al del gpt. -4o modelo. hablando de las dificultades para comercializar modelos grandes, yan junjie respondió que de hecho se trata de una prueba de la industria y que sólo las empresas que la pasen podrán tener éxito.

"cuando nadie usa un producto, o cuando un producto no genera dinero, definitivamente no se puede culpar a los usuarios. la mayoría de ellos sólo pueden culpar a su propia tecnología o a los productos que no son lo suficientemente buenos. esto puede considerarse como una crítica a una industria. si puedes pasar la prueba, puedes salir. si no puedes pasarla, debes cerrar”.

yan junjie en la conferencia de prensa

▌la competencia es inevitable y debemos magnificar infinitamente las áreas en las que podemos ser más fuertes.

con el surgimiento de una nueva ola de inteligencia artificial representada por gpt, se ha creado más espacio de imaginación para la realización de la inteligencia artificial general (agi).

yan junjie cree que,agi no es algo sofisticado, sino algo que puede convertirse en parte de la vida de todos.

“por ejemplo, cuando las personas ven douyin o cuentas de video, no se dan cuenta de que es una plataforma de distribución de contenido para videos cortos basada en algoritmos de recomendación. en cambio, sienten que douyin y wechat se han convertido en parte de la vida de todos.lo mismo ocurre con la agi cuando la ia se convierta en un teléfono móvil y forme parte del uso diario de todos, la agi se hará realidad. por supuesto, esto llevará mucho tiempo, pero creo que podemos trabajar duro paso a paso.

en cuanto a los cambios que la ia puede provocar en el corto plazo de cinco años, yan junjie cree que en cinco años, con la ayuda de la ia, todos aumentarán considerablemente el límite superior de su coeficiente intelectual y serán más altos que la persona con el coeficiente intelectual más alto. en un lugar de cientos de personas. "por supuesto, no está claro hasta qué punto se puede mejorar el límite superior del coeficiente intelectual humano con la ayuda de la ia".

al entrar en 2024, la competencia por los modelos grandes será cada vez más feroz. ante el rápido ataque de los grandes fabricantes, el espacio vital de las empresas emergentes se ha reducido.

"la competencia es inevitable", se lamentó yan junjie: "en algunas industrias bien desarrolladas en china, como los vehículos eléctricos, los teléfonos móviles y la internet móvil, varias empresas han participado en una competencia muy feroz a largo plazo, lo que finalmente llevó a los chinos". productos que toman la delantera en el mundo.dado que la historia del desarrollo de otras industrias emergentes es similar y es probable que los modelos grandes produzcan un gran valor social, debería haber mucha competencia. esta es la ley objetiva del desarrollo.。”

yan junjie cree que si una nueva empresa no puede ganar en la feroz competencia, debería ser eliminada.

cuando empresas muchas veces más grandes que tú empiecen a competir contigo, te darás cuenta de que algunas cosas son inútiles. porque esos grandes fabricantes son cientos de veces mejores que tú. lo que podemos hacer es amplificar (hacer más fuertes) infinitamente las cosas que tienen el potencial de volverse más fuertes.se reduce a dos puntos: uno es cómo mejorar la tecnología y el otro es cómo crear mejores co-creaciones con los usuarios. ambos puntos requieren algunos juicios muy críticos y una acumulación a muy largo plazo. "

▌los grandes modelos multimodales implican que la infraestructura subyacente también debe mejorarse

el campo de los modelos grandes generados por vídeo ha estado muy activo en los últimos meses. se lanzó vidu, un modelo de video grande creado por shengshu technology; zhipu ai lanzó oficialmente el modelo de generación de video grande "qingying" sensetime lanzó vimi, el primer modelo de generación de video de caracteres grandes controlables para usuarios finales c; la plataforma de creación de videos de ia basada en estaciones "xunguang" se lanza oficialmente en la página web y abre un marco de generación de videos de retratos controlable llamado liveportrait...

recientemente, minimax también lanzó su primer modelo de generación de vídeo de alta definición con ia. yan junjie cree que los grandes modelos multimodales son el único camino a seguir, porque el contenido multimodal es una parte importante de la comunicación humana.

“la mayor parte del contenido que leemos todos los días ahora no es texto, sino contenido dinámico. cuando abrimos xiaohongshu, mostrará imágenes y textos, cuando abrimos douyin, mostrará videos e incluso cuando abrimos pinduoduo para comprar cosas. , la mayoría de las veces, mostrará imágenes.para la sociedad humana, el significado central de los modelos grandes es realizar un mejor procesamiento de la información. la mayor parte de la información se refleja en contenido multimodal, en lugar de texto, que suele ser la parte más esencial. para tener una cobertura de usuarios muy alta y una profundidad de uso muy alta, la única forma de generar contenido dinámico (multimodal) no es solo generar contenido puro basado en texto. este es un juicio muy básico.

aunque la multimodalidad es generalmente optimista, la industria también ha sentido durante la exploración que, en comparación con los modelos de texto, el desarrollo de modelos de generación de video es obviamente más difícil de desarrollar.

en este sentido, yan junjie cree que la mayoría de las veces la complejidad del trabajo del video es más difícil que la del texto, porque el texto del video es naturalmente muy largo. por ejemplo, un vídeo implica decenas de millones de entradas y salidas, que naturalmente serán difíciles de procesar. en segundo lugar, la cantidad de vídeos es enorme. otro ejemplo es que un video de 5 segundos pesa varios megabytes, pero una lectura de texto de 5 segundos puede tener menos de 1k. esta es una brecha de almacenamiento de miles de veces.el desafío radica en cómo procesar datos, cómo limpiarlos y cómo etiquetar la infraestructura subyacente que anteriormente se construyó en base a texto. esto significa que la infraestructura también debe actualizarse.

"además, se requiere más paciencia. hay muchas cosas de código abierto para escribir texto. será más rápido si hacemos investigación y desarrollo basados ​​en código abierto. pero no hay tantas cosas de código abierto para video. es necesario "esto se hace de nuevo y requiere más paciencia".

▌objetivamente hablando, la guerra de precios ha aumentado el número de llamadas al modelo

desde este año, muchas grandes empresas de modelos han iniciado guerras de precios a cambio de la popularidad de los grandes modelos de ia. yan junjie cree que, objetivamente hablando, la guerra de precios ha aumentado el número de llamadas de modelos.

"cuando comenzó la guerra de precios de los modelos nacionales, la mayoría de las empresas que originalmente pensaban que los modelos grandes eran caros comenzaron a descubrir que los modelos grandes son baratos y pueden usarse con confianza. al final, se hizo un descubrimiento sorprendente.tras la guerra de precios de los modelos grandes, muchas empresas muy tradicionales empezaron a estar muy dispuestas a utilizar modelos grandes. sienten que el costo es bajo de todos modos y no importa si algo sale mal. si algo sale mal, pueden llamarlo una vez más. objetivamente hablando, esto aumenta enormemente el número de llamadas de modelos. "

en medio de una feroz competencia entre los modelos nacionales, minimax se está expandiendo a los mercados extranjeros. yan junjie dijo: "es precisamente debido a la feroz competencia entre los modelos nacionales que tenemos que avanzar. al menos ahora podemos alcanzar un nivel comparable al gpt en idiomas de países que no hablan inglés. competencia y varios dado que no se pueden evitar todo tipo de cosas, intente hacer lo mejor que pueda.vemos el lado optimista. de hecho, el uso de modelos nacionales grandes está creciendo significativamente y los modelos chinos se están volviendo cada vez más competitivos en el extranjero. creo que estos son dos cambios positivos. "

con respecto al modelo de comercialización específico, yan junjie presentó que la comercialización de toda la empresa se puede dividir en dos formas: una es la plataforma abierta minimax para la cara b y la otra es el mecanismo publicitario dentro del producto.

"la plataforma abierta minimax cuenta ahora con más de 30.000 clientes empresariales y desarrolladores, incluidas conocidas empresas de internet, empresas tradicionales, etc. los usuarios utilizarán nuestras capacidades visuales y de voz, porque no todas las empresas pueden hacerlo por sí mismas. somos un buen socio en segundo lugar, los productos de minimax también tienen mecanismos publicitarios que pueden monetizarse. sin embargo, en esta etapa, lo más importante no es comercializarlos, sino hacer que la tecnología esté realmente disponible de manera amplia.

actualmente,hay seis empresas emergentes independientes de modelos a gran escala en china, incluidas zhipu ai, baichuan intelligence, zero one thousand things, dark side of the moon, minimax y step star, que se denominan los "seis pequeños tigres de la ia".. zhu xiaohu, socio director de jinshajiang venture capital, dijo sin rodeos en una entrevista con los medios que los modelos grandes son demasiado caros y que es imposible mantenerse a sí mismo mediante la comercialización. el mejor resultado para estas nuevas empresas es vender a grandes fabricantes.

hablando de los comentarios del inversor zhu xiaohu y de las dificultades para comercializar modelos grandes, yan junjie respondió que se trata de una prueba de la industria y que sólo las empresas que la pasen podrán tener éxito.

“cuando nadie usa el producto, o cuando el producto no genera dinero, definitivamente no se puede culpar a los usuarios en este momento. la mayoría de las veces, solo se puede culpar a su propia tecnología o al producto que no es lo suficientemente bueno. somos así es como lo vemos”.

en opinión de yan junjie, qq no sabía cómo ganar dinero en 2000. intentó numerosos planes de monetización comercial pero fracasó. sin embargo, finalmente encontró servicios y juegos móviles de valor agregado, y todo pasará por este proceso. "esto puede considerarse como una prueba para una industria. si puede pasar la prueba, podrá escapar. si falla, (la empresa) debería cerrarse".

a lo largo de la entrevista, yan junjie siempre pareció relativamente tranquilo acerca de la competencia de la industria y las perspectivas corporativas."ciertamente no se puede culpar a los usuarios ni al ecosistema. (por muchas cosas) sólo podemos culparnos a nosotros mismos por no hacerlo lo suficientemente bien. al menos hemos estado trabajando duro. espero que podamos mejorar. esto es lo único que podemos hacer."

(huang xinyi, reportero del diario de la junta de innovación científica y tecnológica)
informe/comentarios