noticias

el número de ofertas exitosas en un solo mes superó las 100 y los modelos grandes comenzaron a ingresar al negocio principal de las empresas estatales centrales.

2024-09-25

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

texto | zhao yanqiu y zhou xiangyue

editor |

el modelo a gran escala implementado por las empresas estatales centrales está entrando en una nueva etapa. en una conferencia en septiembre, un alto funcionario de la industria le dijo a digital intelligence frontier que la implementación de modelos grandes ya no se limita a una determinada industria, sino que ha florecido en todos los ámbitos de la vida. también ha dado un gran paso adelante.

según observaciones de la industria, algunas empresas estatales líderes han tomado la iniciativa en completar la implementación piloto inicial de modelos grandes y han comenzado a avanzar gradualmente hacia escenarios más básicos. "desde mayo de este año, a medida que la guerra de precios por los modelos grandes continúa fermentando, la implementación de modelos grandes se ha acelerado aún más. se han comenzado a explorar y replicar una serie de escenarios a gran escala y, a nivel financiero, el retorno de la inversión ha aumentado. se volvió positivo.", dijo xie guangjun, vicepresidente de baidu, a digital intelligence frontline.

en el segundo semestre de este año se volverá a avanzar en la implementación de modelos grandes.en sólo dos meses y medio, el número de ofertas ganadoras relacionadas con modelos a gran escala disponibles públicamente en el mercado ha superado el número total de ofertas ganadoras en los primeros seis meses del año.. los proyectos ganadores de la licitación en un solo mes también han entrado en cientos de etapas. los modelos grandes están acelerando su pleno florecimiento en todos los ámbitos de la vida. entre ellos, las industrias de energía, finanzas, educación, internet y otras son particularmente activas.

bajo la ola de tecnologías que cambian rápidamente, los intercambios industriales se están acelerando. en los últimos meses, han surgido varias conferencias de inteligencia artificial grandes y pequeñas en varios lugares, y se informa que baidu celebrará la conferencia baidu cloud intelligence 2024 el 25 de septiembre. se avecinan más intercambios y colisiones tecnológicas.

01

las empresas estatales centrales han dado otro gran paso adelante

2024,china southern power grid ha completado la contratación y adquisición de múltiples proyectos grandes relacionados con modelos, como "proyecto de tecnología clave del centro de capacitación básica de inteligencia artificial del sistema de distribución principal de la red eléctrica del sur de china: investigación y aplicación de la tecnología de modelo grande de pnl del sistema de energía", "investigación y desarrollo de 2024 del conjunto de funciones de inferencia y capacitación en seguridad del instituto de investigación de la red del sur de china" para modelos grandes de la industria eléctrica"desarrollo de componentes", etc. los equipos relevantes están trabajando con baidu intelligent cloud para la innovación conjunta.

en la industria financiera, un gran banco estatal lanzó solo el año pasado un proyecto piloto a pequeña escala con miles de personas en los escenarios de asistente de servicio al cliente y asistente de mostrador. este año, estas funciones se lanzaron oficialmente en varios centros importantes de servicio al cliente. en todo el país y ascendido a empleados de mostrador de primera línea en todo el país. la actividad diaria de los modelos grandes llega a decenas de miles.

en el campo del automóvil, una persona del instituto de investigación geely dijo con franqueza en una conferencia reciente: "ahora que las empresas de automóviles salen a vender automóviles, les da vergüenza vender sus productos porque no tienen modelos grandes en los automóviles". los modelos grandes están implementando cabinas inteligentes y conducción autónoma, y ​​también están potenciando el marketing digital, las operaciones de los usuarios y otros escenarios. recientemente, han comenzado a potenciar a todas las empresas bajo geely.

en el mercado de asuntos gubernamentales, los gobiernos locales han elaborado planes modelo a gran escala basados ​​en las industrias locales. “primero construya el centro de computación inteligente,desde finales de este año hasta el primer trimestre del próximo, el centro de computación inteligente se implementará a gran escala y luego comenzará la combinación de grandes modelos e industrias locales.. "un funcionario del gobierno habló sobre los avances del mercado. la ciencia, la educación, la cultura y la salud han comenzado a implementar la aplicación. "algunos hospitales terciarios incluso han invertido decenas de millones en escenarios de prueba. "una fuente médica dijo que los decanos se centran en escenarios como la generación de casos, la gestión de personas, la propiedad y la investigación científica que están estrechamente relacionados con los niveles de servicio, la gestión y los niveles de investigación científica.

también se ha explorado y trazado el puerto, un canal importante para el comercio de importación y exportación. "hemos visto que muchos clientes han incluido modelos grandes en sus planes de ti para los próximos tres años". hu wei, gerente general de baidu intelligent cloud logistics and transportation solutions, dijo a digital intelligence frontline que, a diferencia de rondas anteriores de cambios tecnológicos, esta ronda. "hay menos gente esperando y mirando, pero más gente probándolo".

por ejemplo, el puerto de shandong, que ocupa el primer lugar en el mundo en términos de rendimiento de carga, completó la exploración piloto de modelos a gran escala en preguntas y respuestas inteligentes y preguntas y respuestas inteligentes, y estas dos funciones se lanzaron para todos los empleados.

en la industria química, sinochem information y baidu smart cloud están trabajando juntos para explorar el uso de modelos grandes para la investigación y el desarrollo de nuevos materiales. el asistente de conocimiento "hua xiaoyi" puede hacer preguntas a través del lenguaje natural y recuperar y responder conocimientos profesionales como este. como características moleculares y rutas de síntesis molecular. actualmente, la eficiencia de la búsqueda de moléculas específicas se ha multiplicado por más de cinco y la eficiencia del trabajo de investigación y desarrollo ha mejorado enormemente.

este entusiasmo también se refleja en el mercado de licitaciones. los datos públicos muestran quede enero a agosto de este año, el número de proyectos ganadores de modelos nacionales a gran escala alcanzó cinco veces el número de todo el año 2023, y la cantidad ganadora se duplicó con respecto al año pasado.. entre ellos, los fabricantes de modelos de cabezas grandes siguen dominando la toma de pedidos. baidu ocupa el primer lugar en cuatro indicadores clave: la cantidad de proyectos ganadores de modelos a gran escala, la cantidad de ofertas ganadoras, las industrias cubiertas y la cantidad de empresas estatales centrales cubiertas.

sin embargo, según las estadísticas incompletas de data intelligence frontline,del 1 de julio al 15 de septiembre, en sólo dos meses y medio, el número total de ofertas ganadoras relacionadas con grandes modelos fue de al menos 286, alcanzando con éxito el número total de proyectos en los primeros seis meses del año.

entre los compradores, los operadores, energía, educación, asuntos gubernamentales, finanzas, etc. siguen siendo los que realizan el mayor número de pedidos. una señal clara es que algunas empresas han presentado demandas cada vez más segmentadas y adquisiciones como la recopilación y gobernanza de datos, la seguridad de modelos grandes y el cultivo de talentos han aumentado significativamente.

por ejemplo, china southern power grid completó la licitación para al menos 15 grandes proyectos relacionados con modelos en dos meses y medio desde julio hasta mediados de septiembre. state grid también completó la licitación para múltiples grandes proyectos relacionados con modelos en el tercer trimestre.

li chao, director general de baidu intelligent cloud energy power industry, dijo a digital intelligence frontline que ya en septiembre del año pasado, china southern power grid lanzó un gran modelo independiente y controlable: "big watt". entre ellos, la plataforma de modelo grande baidu intelligent cloud qianfan proporciona soporte técnico para escenarios de despacho de energía. en el tercer trimestre de este año, china southern network completó la selección de grandes modelos lingüísticos para el departamento comercial principal de china southern network, y baidu fue seleccionado con éxito como proveedor de servicios técnicos.

02

las grandes empresas apuestan por "seguir la corriente"

casi todas las empresas que fueron las primeras en dar el salto a los modelos grandes en esta ronda tenían experiencia en modelos pequeños. por ejemplo, icbc ha establecido un proyecto alrededor de 2021 y quiere utilizar un "modelo más grande" para crear aplicaciones comerciales como ocr. "después de la llegada de chatgpt, aprovecharon la situación y establecieron un gran proyecto modelo", dijo un financiero a digital intelligence frontline.

el mercado de seguridad de la producción está sujeto a supervisión política y es casi un resultado final para las empresas estatales centrales. anteriormente, longyuan electric power, la mayor empresa de energía eólica secundaria del national energy group, adoptó una solución de seguridad de modelo pequeño tradicional para gestionar más de 200 parques eólicos y más de 10.000 turbinas eólicas, formando un sitio de producción completo desde el monitoreo de seguridad, análisis, alarmante para el procesamiento. en el segundo trimestre de este año, baidu ganó la licitación para una versión mejorada del proyecto, que combinará la generalización del modelo cv grande, un reconocimiento de características más preciso y la capacidad del modelo de lenguaje grande para convertir la información recopilada en grandes cantidades realmente útiles.

¿qué era lo que los modelos pequeños no podían hacer antes, pero que ahora los modelos grandes pueden aportar valor? hu wei dio un ejemplo. la programación en el puerto, la programación del personal, los atracaderos, los patios de almacenamiento, etc., se habían realizado por separado utilizando modelos pequeños en el pasado y los resultados fueron buenos.de hecho, es un problema de algoritmo matemático y el modelo pequeño es muy adecuado.. sin embargo, cuando se combinan para una "programación integrada", los modelos pequeños no pueden lograr computación colaborativa a gran escala y planificación coordinada entre conjuntos de datos y dispositivos. "esperamos especialmente que se puedan resolver los modelos grandes. el desafío es la agregación de datos en el puerto, lo que lleva tiempo".

en la industria industrial, la tasa de reconocimiento de los modelos pequeños de cv tradicionales es relativamente baja cuando se encuentran con muestras pequeñas. con la ayuda de modelos grandes de cv, se puede mejorar la tasa de reconocimiento de datos de muestras pequeñas.

muchas empresas también carecen de plataformas de aplicación, precipitación y gestión del conocimiento. ahora, con la ayuda de grandes modelos y la recuperación de conocimientos, las empresas pueden formar capacidades de plataforma de gestión del conocimiento para completar las tareas de hacer explícito el conocimiento tácito, estructurar el conocimiento explícito, correlacionar el conocimiento estructural y fluidificar el conocimiento relacionado.

muchas empresas celebran reuniones de producción y operación con regularidad y es muy difícil alinear los datos. con la ayuda de grandes modelos de lenguaje, podemos resumir y extraer resultados de manera más rápida y precisa, y completar el análisis preliminar, lo cual es de muy alto valor para los usuarios.

03

para ingresar al negocio principal, es necesario encontrar las “manos y los pies”

li chao observó que en los últimos dos años, la aplicación de modelos grandes aún estaba en su infancia, concentrándose en escenarios de asistencia como oficina y servicio al cliente. esto es completamente inconsistente con las expectativas de la dirección de las empresas estatales centrales con inversiones de decenas de millones, cientos de millones o incluso decenas de miles de millones. ahora, los grandes modelos necesitan profundizar en el negocio principal de la empresa.

“en la industria energética,invertimos en una dirección: optimización de la simulación. ", dijo li chao. en la industria, hay una gran cantidad de tareas de trabajo relacionadas con mecanismos y cálculos científicos, que no pueden realizarse mediante grandes modelos de lenguaje o grandes modelos de cv. "si estos problemas no se resuelven, el futuro que imaginamos será basarse en big data es imposible implementar el modelo como un centro de capacidades para proporcionar un servicio de agente completo. "li chao dijo que en el futuro, los modelos grandes deben combinarse con modelos pequeños en campos profesionales para penetrar en los escenarios comerciales principales de los clientes.

"en los últimos años, hemos sentado algunas bases en esta dirección", dijo li chao, baidu proporciona motores de optimización de simulación y trabaja con socios de la industria para explorar escenarios de despacho de redes eléctricas, refinación de petróleo y petroquímicos y exploración de petróleo y gas. se han implementado el despacho de la red eléctrica y la estabilidad de la red eléctrica. se han implementado proyectos reales relacionados con el modelo del mecanismo, como análisis de estado, optimización de la operación de la isla de energía aérea petroquímica, desulfuración y desnitrificación, etc. en septiembre de este año, baidu también participó en la licitación para el despacho inteligente de la red nacional de oleoductos.

“estas son direcciones de producción centrales que preocupan mucho a los clientes.estas direcciones son las "manos y pies" que son indispensables cuando se utilizan modelos grandes como centro de programación en el futuro para construir algunos servicios de agentes inteligentes en su conjunto.. li chao dijo que pondrán un esfuerzo especial en la planificación de estas "manos y pies". el modelo grande es el cerebro. sólo con estas "manos y pies (api profesionales)" se pueden realizar realmente los servicios centrales de la escena.

"en el puerto, primero dejamos que los clientes vean a través de preguntas y respuestas que el modelo grande original es confiable y luego gradualmente lo incorporamos al sistema comercial principal", dijo hu wei: "nosotros en shandong port group ya estamos planeando la siguiente fase". , profundizará más en los escenarios empresariales”.el puerto es un complejo centro de transporte. su núcleo es el envío de mercancías, personas, camiones, grúas pórtico, etc.. anteriormente, el sistema tos (terminal operating system) introducido por el puerto incorporaba gradualmente algoritmos de ia. los modelos grandes pueden resolver aún más el problema de acceder a más metadatos.

a medida que los modelos grandes avanzan hacia sistemas centrales de producción,una de las habilidades centrales de la competencia global de modelos grandes es el razonamiento lógico.. "en las pruebas realizadas en las instalaciones de los clientes, descubrimos que el razonamiento lógico de los problemas complejos entre diferentes modelos grandes es bastante diferente. además, los recursos de vídeo generados por una gran cantidad de cámaras instaladas en el puerto en realidad no se utilizaron". una dirección ahora es utilizar estos recursos de imagen y hardware originales,utilice grandes modelos multimodales para la integración y lograr una mejor colaboración global.. "esta es una dirección que estamos explorando".

04

el 74% de las cargas de trabajo de ia están en la nube

la implementación de modelos grandes es una ingeniería de sistemas compleja a medida que las empresas ingresan al área de aguas profundas, algunas puertas y caminos para la implementación se aceleran hacia la superficie.

"cuando vamos a conectarnos con los clientes, lo primero que hacemos es ayudarlos a descubrir los límites del modelo grande", dijo hu wei a digital intelligence frontline para evitar cogniciones inconsistentes que puedan provocar problemas o retrasos en la entrega. que están demasiado lejos de las expectativas del cliente, la situación, ahora tienen básicamente todos los proyectos,todos pasarán por un proceso completo de "consulta ligera + implementación".

sobre la construcción de potencia informática inteligente, según muestran los datos de idc,el 74% de las cargas de trabajo de ia están en la nube. pero el paradigma tecnológico actual de la computación inteligente ha cambiado. en la era de la nube de cpu, todo el mundo está más preocupado por la flexibilidad y la máxima rentabilidad, mientras que la nube de gpu se trata de si se puede utilizar la potencia informática de un clúster grande. estos clústeres no sólo son caros, sino que también presentan ciertas barreras técnicas, por lo que los proveedores de la nube siguen siendo un actor importante.

además de la potencia informática, la importancia de los datos sigue surgiendo. según estadísticas incompletas de data intelligence frontier, en el tercer trimestre de 2024, la compra, recopilación, gestión y otras compras relacionadas de datos están aumentando significativamente.

a nivel de datos, por ejemplo, los datos de los clientes del puerto se almacenan en los servidores de cada empresa de terminales. huwei recomienda que los clientes establezcan un equipo de datos dedicado.

cuando se trata de datos, hay problemas más profundos. "hoy en día, cuando la industria habla de modelos grandes, es necesario hablar de datos, pero, francamente, muchos de ellos son palabras vacías."dijo con franqueza un experto de la industria.

"la era de los grandes modelos,¿cómo preparar datos, cómo gestionarlos y cómo aplicar diferentes datos en diferentes etapas del entrenamiento de modelos grandes? la mayoría de la gente todavía está tratando de descubrir el elefante a ciegas.. "li chao dijo que baidu también ha superado muchos obstáculos en este proceso.

por ejemplo, cuando se entrena un modelo industrial basado en un modelo general, existe una guía técnica sobre cómo se deben combinar los datos. si alimenta muy poco a un modelo grande, el efecto no será obvio; si lo alimenta demasiado, el modelo no será fácil de converger e incluso puede provocar una disminución en las capacidades generales del modelo... estos problemas tienen. se resolvió posteriormente, formando un conjunto de herramientas y la metodología se exporta al mundo exterior a través de la plataforma qianfan y un equipo de servicio técnico dedicado.

también es fácil que aparezcan brechas entre la tecnología y las aplicaciones de los modelos grandes., muchas "unidades de usuarios no entienden la ia y las unidades de ia no entienden la industria". li chao dijo que para resolver la brecha, además de equipar a los arquitectos de soluciones con experiencia en la industria, también se centrarán en la selección de socios. "básicamente, solo elegimos dos tipos de socios en la industria energética: uno es la unidad industrial del cliente y el otro es la empresa que proporciona servicios de subcontratación humana en la empresa industrial del cliente", dijo li chao a digital intelligence frontline. que ambos estén profundamente involucrados y comprendan el negocio del cliente, así como la industria de ti.

además, durante la implementación de modelos grandes en escenas específicas,aún queda mucho trabajo de ingeniería por hacer.. por ejemplo, los modelos grandes están acostumbrados a generar respuestas en forma de "puntuación total y total", y las respuestas son diferentes cada vez. sin embargo, algunos clientes están más acostumbrados al método de "primera puntuación y luego total", y esperan que así sea. la respuesta se puede "reproducir". "incluso los cambios menores en el orden de las palabras y la gramática son inaceptables para algunos líderes portuarios", afirmó hu wei. esto les exige realizar un gran trabajo de ingeniería para garantizar que el resultado del modelo grande cumpla con las expectativas de los clientes.

desde la situación general de la implementación empresarial, la dimensión de la demanda de los clientes es de 360 ​​grados. curiosamente, todas las empresas de la nube están pasando actualmente de socios de la nube a socios estratégicos de transformación de la ia y están actualizando sus capacidades técnicas generales en torno a la infraestructura de la ia, los modelos de algoritmos, los datos, la optimización de la implementación y la personalización.

05

factor humano

el cio de una empresa de tecnología encontró una resistencia considerable durante la construcción y promoción de aplicaciones de modelos grandes: los empleados y departamentos de primera línea no cooperaron, incluso si el líder lo dijera, sería inútil.después de que la empresa instaló el asistente de código, la eficiencia general aumentó en 1/3. "aunque rara vez hablamos de reducir la plantilla, eso significa que las personas que escriben código serán transferidas al front-end o back-end del desarrollo. los empleados de primera línea están preocupados por ser despedidos, y algunos departamentos comerciales tienen territorialidad". conciencia. estos son problemas reales.

en muchas grandes empresas de industrias tradicionales,la mayor resistencia proviene de la inercia laboral. muchos empleados de primera línea son viejos maestros. ahora, si se les da la oportunidad de utilizar asistentes de mantenimiento de equipos, dirán: "si sucede algo, también podría probarlo yo mismo o puedo llamar a lao zhang y a los tres. "trabajaremos juntos por el resto de nuestras vidas".

el modelo grande es un proyecto líder.. "una persona del sector financiero observó que es necesario promoverlo de arriba a abajo. los altos directivos apoyan los proyectos de referencia en público. "a veces, no oponerse también es una especie de apoyo. "

"involucre al departamento comercial en la etapa inicial y participe en la construcción, adopción y promoción final", dijo jin jianhua, fundador y director ejecutivo de ianalysis. al igual que los asistentes de mantenimiento, el grupo puede tener las ideas del grupo, las subsidiarias pueden tener las ideas de las subsidiarias y los empleados de primera línea pueden tener las ideas de los empleados de primera línea. ¿cómo alinear las expectativas de ingresos de todos?es una cuestión de equilibrio. por ejemplo, parte de la construcción de mapas de conocimiento la realizan expertos veteranos de empresas secundarias, lo que permite a todos avanzar hacia un objetivo común.

las empresas también deben divulgar periódicamente el estado de las operaciones y los ingresos comerciales de los proyectos de referencia y ofrecer incentivos públicamente. "por ejemplo, dé algunos puntos a los empleados, vincúlelos a algunos sistemas y cámbielos por algunos obsequios", observó hu wei. "lo vincularemos directamente con el desempeño y las bonificaciones", dijo un cio de una empresa de tecnología. "aunque es un poco simple y tosco, tiene un efecto".

la retención por primera vez también es importante. es necesario encontrar formas de mejorar la primera experiencia de inicio de sesión para los empleados después de la revisión e iteración. por ejemplo, si la entrada se deja lo suficientemente clara y lo que antes no estaba permitido ahora es correcto, los empleados corporativos seguirán usándola.

desde la perspectiva del departamento comercial, podemos diseñar historias gráficas y contagiosas, y dejar que algunos maestros hablen desde su propia experiencia, que puede ser contagiosa. la actividad diaria del proyecto, la actividad mensual y otros datos son igualmente importantes. estos soncultivar la cultura de ia de una empresa

la ola de aterrizaje de modelos grandes continúa aumentando. bajo la rápida corriente, los actores de todos los ámbitos de la vida en la cadena industrial continúan aumentando su inversión, empujando a más empresas a dar el salto a la inteligencia digital.

baidu también marcará el comienzo de grandes movimientos en el futuro cercano, que se llevará a cabo el 25 de septiembre.conferencia de inteligencia en la nube de baidu 2024. para entonces, la plataforma baidu intelligent cloud qianfan marcará el comienzo de nuevas actualizaciones en herramientas de desarrollo de aplicaciones, modelos grandes y cadenas de herramientas. los tres principales productos de aplicaciones de ia: baidu intelligent cloud keyue, wenxin quick code·baidu comate y baidu xiling digital people. también se actualizará por completo y se llevarán a cabo simultáneamente múltiples subforos como finanzas inteligentes, industria inteligente, transporte inteligente, asuntos gubernamentales inteligentes, automóviles inteligentes e inteligencia incorporada para lograr más intercambios y colisiones técnicas.