noticias

el discurso interno de robin li expuesto: el modelo de código abierto no es eficiente y no puede resolver el problema de la potencia informática

2024-09-11

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

"el mundo exterior tiene bastantes malentendidos sobre los modelos grandes". recientemente, se expuso un discurso interno de robin li. robin li cree que la brecha entre los modelos grandes puede ampliarse en el futuro. explicó además que el "techo" de los modelos grandes es muy alto y aún está lejos de la situación ideal. por lo tanto, el modelo debe continuar iterándose, actualizándose y actualizándose rápidamente; años o más de diez años para satisfacer continuamente las necesidades de los usuarios, reducir costos y aumentar la eficiencia.

respecto a la afirmación de la industria de que "no existen barreras entre las capacidades de los modelos grandes", robin li dio una opinión diferente: "cada vez que se lanza un nuevo modelo, hay que compararlo con el gpt-4o y dijo que mi puntuación es casi la misma". igual que él, incluso las puntuaciones en algunos ítems individuales lo han superado, pero esto no significa que no haya una brecha con los modelos de última generación”.

dijo que para demostrar su valía, muchos modelos irán a las clasificaciones después de su lanzamiento y adivinarán las preguntas de la prueba y las habilidades de respuesta a partir de las clasificaciones, las capacidades de los modelos pueden ser muy similares, "pero en la práctica". aplicaciones, la fuerza todavía es hay una brecha clara ".

robin li señaló que la brecha entre modelos es multidimensional. la industria a menudo presta más atención a las brechas en comprensión, generación, lógica, memoria y otras capacidades, pero ignora dimensiones como el costo y la velocidad de razonamiento. aunque algunos modelos pueden lograr el mismo efecto, siguen siendo inferiores a los modelos avanzados debido a su calidad. alto costo y baja velocidad de razonamiento.

robin li también dijo: "antes de la era de los grandes modelos, todo el mundo estaba acostumbrado al código abierto, es decir, gratuito y de bajo coste". explicó que, por ejemplo, linux de código abierto, como ya tienes una computadora, usar linux es gratis. pero esto no es cierto en la era de los modelos grandes. la inferencia de modelos grandes es muy costosa y los modelos de código abierto no proporcionan potencia informática. debe comprar su propio equipo, lo que no puede lograr una utilización eficiente de la potencia informática.

"el modelo de código abierto no es eficiente en términos de eficiencia". dijo: "para ser precisos, el modelo de código cerrado debería llamarse modelo de negocio. permite a innumerables usuarios compartir los costos de i + d y los recursos de la máquina y las gpu utilizadas para el razonamiento". la eficiencia de uso de la gpu es la más alta. artículo de baidu el uso de gpu de los modelos xinda 3.5 y 4.0 ha alcanzado más del 90%.

robin li analizó que en campos como la enseñanza y la investigación científica, el modelo de código abierto es valioso, pero en el campo comercial, cuando se busca eficiencia, eficacia y el menor costo, el modelo de código abierto no tiene ventajas;

en el nivel de aplicación de modelos a gran escala, robin li cree que copilot aparecerá primero para ayudar a las personas, seguido por la inteligencia del agente, que tiene un cierto grado de autonomía y puede utilizar herramientas, reflexionar y evolucionar de forma independiente; si se desarrolla la automatización, se convertirá en un trabajador de ia y podrá completar todos los aspectos del trabajo de forma independiente.

también dijo que aunque "muchas personas son optimistas sobre la dirección del desarrollo de la inteligencia, a día de hoy la inteligencia no es un consenso, y empresas como baidu que consideran la inteligencia como la estrategia más importante y la dirección de desarrollo más importante de los modelos grandes no lo hacen". muchos".

robin li cree que el umbral para los agentes inteligentes es realmente muy bajo. muchas personas no saben cómo convertir modelos grandes en aplicaciones. es una forma muy directa, eficiente y sencilla de construir agentes inteligentes. de modelos.