competencia, eficiencia, inteligencia, el gran modelo que le importa a robin li

2024-09-15

"el techo de los modelos grandes es muy alto y todavía está lejos de la situación ideal". el 11 de septiembre, se expuso un discurso interno del director ejecutivo de baidu, robin li. dijo sin rodeos que el mundo exterior tiene tres malentendidos sobre los modelos grandes: "la brecha entre los diferentes modelos no se hace cada vez más pequeña, sino que se hace cada vez más grande". los modelos de código abierto no pueden resolver este problema". esta pregunta "no hay consenso en que los agentes inteligentes sean la dirección de desarrollo más importante de los modelos grandes".

a menudo se habla del tema de los modelos grandes. el debate entre código abierto y código cerrado, el valor de la lista, etc. se basa en esto. robin li, quien identificó la pista del modelo grande en la etapa inicial, está dispuesto. para compartir sus puntos de vista.

"cada vez que se lanza un nuevo modelo, definitivamente quiero decir lo bueno que es. cada vez que lo comparo con el gpt-4o, hago una prueba o hago algunas listas y digo que mi puntuación es casi la misma, e incluso algunos la puntuación en elementos individuales la ha superado, pero esto no prueba que estos modelos recién lanzados ya no estén tan lejos de los modelos más avanzados de openal". robin li cree que el mundo exterior tiene malentendidos sobre los modelos grandes.

en su opinión, la brecha se refleja en las capacidades y los costos. "a partir de la lista o del conjunto de pruebas, uno siente que las capacidades están muy cerca, pero en las aplicaciones reales todavía hay una brecha clara. no permito que nuestro personal técnico lo haga. en cuanto a las clasificaciones, lo que realmente mide las capacidades del modelo wenxin es si puede satisfacer las necesidades de los usuarios en escenarios de aplicación específicos y si puede generar ganancias de valor. esto es lo que realmente nos importa".

los pares también suelen mencionar valores y escenarios. "la adopción de la ia por parte de la industria empresarial no se trata de buscar tecnología genial, ni de 'buscar clavos con un martillo'. el núcleo es resolver los puntos débiles del negocio. desde el año pasado (2023), todo el mundo ha sido demasiado optimista acerca de los modelos grandes, pensando que pueden cambiar el mundo rápidamente recientemente, hay algunos pesimistas que piensan que los modelos grandes son bonitos pero no fáciles de usar. de hecho, no es aconsejable "sobrestimar el progreso en el corto plazo". y subestimar el efecto a largo plazo'". tang daosheng, vicepresidente ejecutivo senior de tencent group y director ejecutivo de cloud and intelligence industry group. desde la perspectiva del cliente, los escenarios son la clave para desbloquear la ia. lo mejor para las empresas es combinar datos profesionales únicos para encontrar oportunidades para reducir costos y aumentar la eficiencia en los flujos de trabajo y escenarios comerciales existentes, y luego continuar mejorando e invirtiendo a largo plazo.

el código abierto y el código cerrado son temas que se han debatido durante mucho tiempo. como representante del código cerrado, robin li una vez más hizo una comparación: "además de las capacidades o efectos, un modelo también depende de la eficiencia. en términos de eficiencia. , los modelos de código abierto no son buenos."

"el modelo de código cerrado debería llamarse con precisión modelo de negocio. el modelo comercial es que innumerables usuarios o clientes comparten los mismos recursos, comparten los costos de i + d y comparten los recursos de la máquina y la gpu (unidad de procesamiento de gráficos) utilizados para el razonamiento, mientras que el modelo de código abierto el modelo requiere que usted mismo implemente un conjunto de cosas”. dijo además: “antes de la era de los grandes modelos, todos estaban acostumbrados al código abierto, lo que significaba que era gratuito y de bajo costo, pero estas cosas no son ciertas en el modelo grande. era, y todo el mundo lo usa a menudo en la era de los grandes modelos. se trata de lo caras que son las gpu. la potencia informática es un factor clave para determinar el éxito o el fracaso de los modelos grandes. si no le brinda potencia informática, ¿cómo se puede utilizar de manera eficiente el modelo de código abierto? este problema no se puede resolver”.

hace dos meses, robin li declaró en la conferencia mundial de inteligencia artificial de 2024: es muy optimista acerca de los agentes inteligentes. a principios de septiembre, muchos empresarios y expertos creyeron en la conferencia inclusion bund de 2024 que los cuerpos inteligentes son una nueva forma de terminal y generarán una nueva generación de súper plataformas.

con respecto a este tema cada vez más candente, robin li volvió a hablar: "¿por qué ponemos tanto énfasis en los agentes? porque el umbral para los agentes es realmente muy bajo. los agentes proporcionan una forma muy directa, muy eficiente y muy sencilla de desarrollar inteligencia sobre parte superior del modelo. la carrocería es bastante cómoda", preguntó y se respondió a sí mismo.

él cree que "la opinión de que 'los agentes son la dirección de desarrollo más importante de los grandes modelos' en realidad no es un consenso. hasta ahora, no hay consenso sobre los agentes. baidu, por ejemplo, considera a los agentes como la estrategia más importante y la el aspecto más importante de los modelos grandes." no hay muchas empresas en la dirección del desarrollo."

wei wei, periodista del beijing business daily

informe/comentarios

noticias

competencia, eficiencia, inteligencia, el gran modelo que le importa a robin li

introducción

mi información de contacto