Cuando los grandes modelos penetran en la industria, los escenarios son la clave para la implementación

Cuando los grandes modelos penetran en la industria, los escenarios son la clave para la implementación | Observación de la industria ToB |

2024-08-02

"Como tecnología, los modelos grandes deben ser realmente utilizados por la industria y resolver problemas prácticos en la industria antes de que puedan ejercer su verdadero valor", Guo Wei, vicepresidente del Grupo de Marketing de Intel Corporation y gerente general de Intel China Network y. División de Centro de Datos de Canal y Edge, estaba hablando con Se ha señalado muchas veces en la comunicación con la APLICACIÓN TMTpost Media.

Han pasado casi 2 años desde que salió ChatGPT. En menos de 2 años, los grandes modelos de IA están penetrando en todos los ámbitos de la vida a una velocidad sin precedentes. Especialmente desde este año, tanto los grandes fabricantes de modelos como las empresas del Partido A han cambiado su enfoque del tamaño de los parámetros del modelo a cómo los modelos grandes resuelven los puntos débiles de la industria, tratando de encontrar uno o más modelos grandes que puedan resolver sus propios escenarios de implementación de la industria. .

Desde lo general hasta la industria, los escenarios son la clave para la implementación de grandes modelos.

Si la competencia de los grandes modelos de los principales fabricantes se divide en dos mitades, en la primera mitad, los grandes fabricantes lanzan modelos grandes generales uno tras otro y demuestran su fuerza mejorando continuamente los parámetros de los modelos en la segunda mitad, cuando la IA es grande; Los modelos son aceptados por más industrias. Cuando las empresas secundarias prestan atención, surgen cada vez más modelos de parámetros pequeños y los escenarios de aplicación industrial se han convertido naturalmente en el foco de las empresas de la Parte A y los grandes proveedores de modelos de la Parte B. La implementación de aplicaciones finales se ha convertido. La cuestión de si realmente se pueden realizar modelos grandes en esta etapa es la clave para la “monetización” por parte de la industria.

En este sentido, Guo Wei le dijo a TMTpost Media APP que Intel cree que a medida que la tecnología de modelos grandes de IA penetre gradualmente en la industria, los modelos cambiarán gradualmente de modelos grandes generales a modelos grandes específicos de la industria. El modelo definitivamente cambiará. "Al mismo tiempo, el modelo industrial combinará más conocimientos específicos de la industria y se centrará en uno o varios escenarios específicos".

Casualmente, Cao Peng, presidente del comité técnico de JD Group y presidente de la División JD Cloud, también declaró públicamente en la Cumbre JD Cloud recientemente que "los modelos grandes en general dependen de la potencia informática para desarrollarse, mientras que los grandes modelos industriales dependen de los negocios allí". Ya hay más de 35 Wan Jingdong tiene su propio personal de entrega, más de 200.000 comerciantes, más de 30.000 médicos, más de 20.000 operaciones de adquisiciones y ventas y más de 10.000 empleados de I + D. Utiliza grandes aplicaciones basadas en modelos en más de 100 escenarios de inteligencia artificial en Jingdong.

El "Libro Blanco de la Economía Digital Global 2024" muestra que el número de grandes modelos de inteligencia artificial en el mundo ha llegado a 1.328, de los cuales China representa el 36%. Por otro lado, los datos de IDC muestran que la IA generativa de China representará el 4,6% de la inversión total en el mercado de IA en 2022. Con el rápido desarrollo de la tecnología de IA generativa, la proporción de inversión en IA generativa alcanzará el 33,0% en 2027, la escala de inversión superará los 13.000 millones de dólares y la tasa de crecimiento compuesto (CAGR) a cinco años será del 86,2%.

Obviamente, el gran modelo es como la era anterior de la computación en la nube solo en términos de tecnología, China todavía puede estar ligeramente por detrás del nivel de primera clase del mundo, pero cuando nos centramos en los escenarios, China tiene escenarios de aplicaciones ricos, y estos. escenarios Esta es la clave para realmente "volar a los hogares de la gente común" con grandes modelos de IA.

Desde la nube hasta el borde, ¿cómo se pueden utilizar mejor los modelos grandes?

A medida que los modelos grandes pasan gradualmente de los parámetros grandes de los modelos grandes generales a los parámetros pequeños de los modelos específicos de la industria, los modelos grandes también muestran una tendencia a pasar de la nube al lado del dispositivo. Los datos de IDC muestran que para 2026, el 80% de las empresas globales utilizarán IA generativa y el 50% de las implementaciones globales de borde incluirán IA.

En este sentido, Sachin Katti, vicepresidente senior y director general de la División de Red y Edge de Intel, dijo una vez que el futuro de la inteligencia artificial dependerá de un ecosistema abierto, y que la aplicación de la inteligencia artificial está pasando de los centros de datos a la computación de borde.

No solo eso, Chen Wei, vicepresidente de Intel Corporation y gerente general de la división de red y borde de China, también dijo a TMTpost Media APP que, a juzgar por las tendencias de desarrollo de este año, los clientes de Intel serán los únicos que explorarán la implementación de modelos de borde a gran escala este año. Hay más clientes para la solución. "Este año es completamente diferente. Este año se puede decir básicamente que más de la mitad de los clientes están explorando soluciones de implementación basadas en modelos de borde grande, y hay muchos casos prácticos". señaló además.

A medida que los modelos grandes avanzan hacia el borde, las empresas deben considerar muchos factores al implementarlos, como los requisitos de latencia, la practicidad, la optimización ajustable de los microdatos y los requisitos de seguridad de la información.

Sin embargo, la implementación de modelos a gran escala en el borde aún se encuentra en las primeras etapas de desarrollo, y actualmente hay muchos modelos de implementación visibles en el mercado. “A través de la observación de Intel, vemos que muchos clientes están creando soluciones de hardware y software basadas en. Los modelos comunes a gran escala La optimización del rendimiento es un modelo que se desarrolla rápidamente", dijo Chen Wei cuando se enfrentó a la pregunta planteada por la aplicación Titanium Media sobre cómo aplicar mejor los modelos grandes en el lado del cliente.

Al hablar sobre las tendencias y perspectivas de los grandes modelos de China que se están implementando en la industria, Guo Wei dijo a TMTpost Media APP que desde este año, cada vez más usuarios de la industria han implementado muchos grandes modelos de la industria. “El año pasado, probablemente se trató más de contar. "Este año hemos visto más y más casos de implementación en la industria, y todos ellos son escenarios que pueden resolver eficazmente los puntos débiles de la industria", dijo Guo Wei.

A juzgar por la aplicación actual, los parámetros del modelo en el lado final son mucho más pequeños que los parámetros del modelo grande general. Actualmente, los parámetros del modelo en el lado final están en su mayoría entre 7B y 10B. En este momento, la compresión del modelo se vuelve muy alta. tarea difícil Algo importante y difícil. El modelo convencional actual consiste en inyectar conocimientos específicos de la industria en los datos mientras los comprimen, lo que comúnmente se conoce como solución técnica de poda progresiva.

Al respecto, el director técnico relevante de JD Cloud le dijo a Titanium Media APP que tomando como ejemplo el escenario del vehículo logístico no tripulado, mediante la reducción de magnitud y la búsqueda de redes neuronales, es posible comprimir aproximadamente el doble de parámetros sin reducir el modelo en sí. . Rendimiento, también puede reducir la latencia aproximadamente al doble.

Al mismo tiempo, Guo Wei compartió con Titanium Media APP su análisis y juicio sobre las perspectivas del desarrollo de modelos industriales a gran escala en China. Señaló que China puede desarrollarse más rápido en tres aspectos.

Primero, el desarrollo del modelo en sí en aplicaciones industriales. Como se mencionó anteriormente, "solo en términos de tecnología, China aún puede estar muy por detrás del nivel de primera clase del mundo, pero China tiene escenarios de aplicación ricos en términos de implementación industrial, especialmente en términos de integración con aplicaciones, en opinión de Guo Wei". China puede ir más rápido: "Una de las características distintivas del mercado chino es el rápido desarrollo de aplicaciones y la capacidad de explorar rápidamente formas efectivas de resolver los puntos débiles de la industria", enfatizó Guo Wei.

En segundo lugar, se mejora la capacidad de razonamiento del modelo. Cuando los modelos grandes se aplican realmente en la industria, no es suficiente confiar únicamente en el entrenamiento del modelo. Para resolver verdaderamente los puntos débiles de la industria, es particularmente importante mejorar las capacidades de razonamiento del modelo. En opinión de Guo Wei, el razonamiento del modelo. Las capacidades también tendrán mejoras significativas este año.

En tercer lugar, en opinión de Guo Wei, cuando se implementan modelos grandes en la industria, es necesario coordinar la distribución de la potencia informática entre la nube, el lado del dispositivo y el borde “si se trata solo de algunas aplicaciones estándar de modelos grandes verticales. "Los modelos grandes pueden implementarse principalmente en la nube, pero debido a la necesidad de implementación industrial, la potencia informática de la IA inevitablemente se distribuirá al borde y al lado del terminal", dijo Guo Wei a TMTpost Media APP.

Se han implementado muchas escenas.

Como dijo Guo Wei, desde este año, se han implementado muchos escenarios de aplicación de grandes modelos industriales en el lado del dispositivo.

En términos de educación, Seewo lanzó conjuntamente una solución "AI + Education" basada en la tecnología de Intel. Con la ayuda de los procesadores Intel® Core™ Ultra, Seewo puede completar el funcionamiento de grandes modelos de enseñanza de IA localmente sin depender de los recursos de computación en la nube. mejorando así la velocidad de respuesta y la estabilidad del sistema y asegurando una experiencia fluida durante el proceso de enseñanza.

En la industria minorista, Tous Les Jours ha creado soluciones de tiendas inteligentes a través de tecnología informática de punta. Esta solución puede utilizar los equipos de recolección de audio y video existentes en la tienda y, a través de la plataforma de gestión de optimización e integración de datos, de acuerdo con las necesidades y características de las diferentes tiendas, crear un conjunto de modelos de tienda digital inteligente exclusivos para ellas, brindando exhibición de productos. y servicios de tienda, higiene de la tienda, normas de los empleados, información sobre la multitud y información sobre el flujo de clientes, que han mejorado las capacidades de gestión diferenciadas de las operaciones de las tiendas Tous Les Jours, han mejorado la eficiencia de la gestión, han reducido el costo de las inspecciones manuales de las tiendas y han fortalecido la implementación de. normas de los empleados, acelerando el desarrollo inteligente de la industria de la panificación.

En términos de salud médica, JD Health ha lanzado el modelo grande médico "Jingyi Qianxun" basado en el modelo grande JD Yanxi, que integra una gran cantidad de pautas de práctica clínica, literatura médica y conocimiento experto, y puede completar rápidamente la migración de varios escenarios en el ámbito médico y sanitario y del aprendizaje. Basado en el modelo a gran escala "Beijing Medical Qianxun", ha lanzado una serie de soluciones para médicos en ejercicio, que incluyen clínicas en la nube, seguimiento posterior al diagnóstico, consulta conjunta de expertos, investigación científica clínica, incubación de marcas de IP de médicos y " "Herramientas de asistente médico inteligente", que no solo optimiza la eficiencia y la calidad del diagnóstico y tratamiento en línea de los médicos, sino que también mejora la seguridad de la práctica.

En términos de seguridad, muchos proveedores de seguridad, incluidos 360, Qi'anxin, Tencent Cloud, Sangfor, etc., han lanzado productos de modelos grandes en la industria de la seguridad basados en capacidades de modelos grandes, o han integrado las capacidades de los modelos grandes de IA en originales. Entre los productos, frente a los desafíos de seguridad cada vez más graves que plantea la IA en la era de la IA, hemos logrado el objetivo de "derrotar a la IA con IA".

En términos de trabajo de oficina, muchos fabricantes han propuesto el concepto de AIPC y se están centrando en asistentes de oficina AI. En el escenario AI Chatbot, los modelos grandes se pueden implementar rápidamente en PC Intel Core Ultra AI y los usuarios pueden usar los potentes sin problemas. texto de modelos grandes capacidades de creación, programación, cálculo matemático y razonamiento lógico, y disfrute de una experiencia interactiva inteligente localizada conveniente y segura;

En términos de procesamiento de documentos, los usuarios pueden usar AI PC para procesar correos electrónicos de manera eficiente, formar datos, generar automáticamente documentos de trabajo y mejorar la eficiencia del trabajo. También pueden redactar rápidamente documentos contractuales y usar AI para analizar de manera inteligente casos de litigios, proporcionando una redacción de documentos profesional. capacidades.

Los anteriores son solo algunos de los escenarios en los que las aplicaciones de modelos grandes de IA son populares actualmente. Además, los modelos grandes industriales también se utilizan ampliamente en muchos campos, como las finanzas, la fabricación y la exploración. Ha comenzado la era en la que diversas industrias aprovechan las capacidades de los grandes modelos de IA para potenciar las empresas.

Los datos siguen siendo un tema ineludible

Como todos sabemos, los datos son el "nutriente" para el rápido desarrollo de modelos grandes, ya sea un modelo grande general o un modelo grande de la industria, si desea obtener valor real y reducir las "ilusiones", los datos son imprescindibles. tema de conversación.

En lo que respecta a la industria, los grandes modelos industriales requieren datos masivos y ricos específicos de la industria. Para las empresas que desean utilizar grandes modelos industriales para reducir costos y aumentar la eficiencia, y pasar de la digitalización a la inteligencia digital, esta parte es muy importante. para sus datos. Desde la perspectiva de las aplicaciones industriales actuales, los datos originales de la empresa no son suficientes para entrenar un modelo industrial completo a gran escala a nivel empresarial. La principal solución actual es utilizar datos sintéticos. A continuación, por un lado, las empresas necesitan mejorar la calidad de sus propios datos. Por otro lado, cómo seleccionar datos sintéticos excelentes también se ha convertido en un tema espinoso que las empresas deben enfrentar.

Por otro lado, la diferencia entre los modelos grandes de la industria y los modelos grandes generales es que la mayoría de los modelos grandes de la industria deben implementarse en el lado del dispositivo o en el borde. Gartner predice que para 2025, más del 50% de los datos gestionados por las empresas se crearán y procesarán fuera del centro de datos o la nube.

En otras palabras, para 2025, la cantidad de datos en el dispositivo superará el 50%. En este proceso, a medida que aumenta la cantidad de datos en el borde, el ancho de banda de transmisión de datos también es un desafío importante que las empresas deben enfrentar. "Aunque China es el líder mundial en la construcción de ancho de banda de transmisión para toda la infraestructura, cuando "Cuando los datos se generan en el borde, aún pueden causar tormentas en la red, y aún necesitamos optimizar aún más la gestión de la red y las estrategias de transmisión de datos", dijo Guo Wei a la aplicación Titanium Media.

De cara al futuro, Sachin Katti dijo a TMTpost Media APP que, si bien la IA impulsa los datos para mejorar la calidad, estos datos a su vez ayudarán a que la IA mejore y, en última instancia, logrará un círculo virtuoso.

Obviamente, los modelos grandes han entrado en un período de rápido desarrollo en la industria. Durante este proceso, las empresas deben seguir el principio de "el escenario es el rey basado en datos" para permitir que los modelos grandes se implementen mejor en la industria.(Este artículo se publicó por primera vez en la aplicación Titanium Media, autor | Zhang Shenyu, editor | Gai Hongda)

noticias

Cuando los grandes modelos penetran en la industria, los escenarios son la clave para la implementación | Observación de la industria ToB |

Introducción

Mi informacion de contacto