noticias

Algunas observaciones sobre aplicaciones empresariales de modelos grandes

2024-08-20

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Artículo | Lo pequeño es un gran socio empresarial

A partir de enero de este año, hemos celebrado un salón de aterrizaje de aplicaciones de modelos grandes todos los meses en Shanghai. Me gustaría compartir algunas de mis observaciones aquí:

En cuanto a la evolución del año pasado:

La cognición está alineada, todo está floreciendo, se espera una pequeña cantidad de ganancias y esperamos un éxito.

A principios de año, algunos discursos en la reunión también hablaron de "nuestra empresa tiene 5 años de experiencia en inteligencia artificial" y cosas por el estilo, mezclando LLM con IA anterior intencionalmente o no. Ahora, todos pueden decir con mucha franqueza qué escenas utilizan tecnología de inteligencia artificial anterior y qué modelos se están utilizando. También explicarán claramente cuáles se basan en el modelo y qué escenas se han sometido a ajustes o entrenamiento secundario. Este es un buen fenómeno y permite que todos entren en áreas que deberían discutirse más directamente.

Al mismo tiempo, también hemos visto cada vez más escenarios en los que realmente se utiliza LLM, incluida la combinación de generación de contenido y escenarios de trabajo específicos, nuevos productos RPA que utilizan tecnología LLM, en los campos de entrevistas, selección y capacitación laboral de recursos humanos. . Realmente llegar a buen puerto.

Para los proyectos que ya se han implementado, alguna Parte A tiene datos relativamente cuantitativos para evaluar el resultado del LLM, y alguna Parte B ha comenzado a decir que firmó un contrato o recibió el pago del proyecto. La mayoría de los proyectos emprendidos por el Partido B parecen ser del orden de cientos de miles y, ocasionalmente, hay proyectos por millones. Los ingresos de esta dirección aún no se han convertido en el principal sustento de los ingresos de la empresa.

Alguien preguntaba a principios de año, y esta pregunta todavía se hace ahora, es decir, ¿qué software popular tiene Big Model 2B? Parece que todavía no lo hay. ¿Quizás no por mucho tiempo? ¿Cuáles han sido los mayores éxitos del software 2B a lo largo de los años? ¿Oficimática? ¿ERP financiero? ¿CRM? ¿DingTalk Feishu? Sigamos esperando con ansias

Acerca de la forma del producto:

Interfaz de chat, interfaz tradicional, tradicional + chat = Copiloto, ¿qué más?

Para el software 2B de modelo grande, todos tienen expectativas diferentes, algunos son pesimistas y la mayoría parece demasiado optimista. Concreticemos esta expectativa y preguntemos cómo se sentirán todos en la empresa acerca de este nuevo software empresarial de modelo grande.

El modelo grande entró por primera vez en el campo de visión de las personas, que era la interfaz de chat. Gpt3.0 ya ha demostrado capacidades muy similares a las actuales, pero debido a que no hay chat, solo API, no ha atraído la atención de más personas ni ha roto el círculo. Aunque la interfaz de chat y búsqueda parece similar, una vez que las uses, sentirás que son esencialmente diferentes. Tenemos razones para creer que la nueva generación de infraestructura de sistemas de información empresarial, que utiliza el chat como interfaz y está disponible para todos en la empresa, se volverá popular en todas las empresas, al igual que el software de oficina, el correo electrónico y WeChat/DingTalk/Feishu empresarial. . colingo.ai, incubada por un pequeño y gran socio empresarial, se centra en este mercado.

En el software empresarial tradicional, algunos backends han utilizado varios algoritmos de IA, reemplazando algunos de ellos con modelos grandes para resolver mejor los problemas, o usando modelos grandes para procesar cosas que antes no se podían procesar con algoritmos. Estas cosas han sucedido silenciosamente, pero el. La perceptibilidad de los usuarios finales es relativamente débil. Habrá más y más escenarios de este tipo, pero puede que no sea fácil producir software exitoso.

La combinación de interfaz de chat y software GUI tradicional es Copilot. Como uno de los primeros socios cercanos de OpenAI, lanzó Copilot para oficina, lo que permite a los usuarios utilizar mejor el software tradicional a través de la interfaz de chat. ¿Parece que esta también será una de las principales formas de interfaz durante algún tiempo?

¿Hay nuevos formularios de interfaz? ¿Cómo colaboran los trabajadores digitales con otros trabajadores? Todavía hay mucho margen de discusión en este ámbito.

Respecto a la ruta técnica de los proveedores de servicios de software 2B:

  • Los tres primeros: arreglo, trapo, agente.
  • Los siguientes tres caminos: potencia informática, infraestructura, formación y ajuste

Saber demasiado es una carga. Este fenómeno existe en la era de los grandes modelos, sin mencionar la cuestión del "pensamiento de grandes modelos", que puede que no sea fácil de definir, pero aún se puede ver en el proceso de aplicación de grandes modelos. modelos de varios proveedores de servicios de software.

La diferencia entre los tres caminos superiores y los tres caminos inferiores no es solo unas pocas GPU, sino que los talentos, los procesos de trabajo, los ciclos de entrega, las velocidades de iteración y los costos integrales generales involucrados no son del mismo orden de magnitud.

La primera reacción de los departamentos técnicos de muchas empresas es entrenar primero el modelo, comprar tarjetas y contratar gente. Entonces puede quedar atrapado en el atolladero. Si se lo devuelve al director ejecutivo, se convertirá en un modelo grande. Esto es algo muy pesado y requiere mucha inversión. No hay avances dentro de la empresa y externamente tenemos que enfrentarnos a clientes que constantemente nos preguntan qué pueden hacer por nosotros con modelos grandes, por lo que estamos en un dilema.

La ruta del tercio superior puede resolver la mayoría de los problemas que involucran aplicaciones de modelos grandes. Cuando las empresas de aplicaciones ingresan a la ruta del tercio inferior, al menos deben completar la ruta del tercio superior y confirmar que la ruta del tercio inferior realmente puede mejorar significativamente el efecto antes de ingresar.

La palabra "capacitación" no está permitida en el desarrollo de aplicaciones de modelos grandes. Puede que sea un método excesivo, pero en esta etapa, para la mayoría de las empresas de desarrollo de aplicaciones, apuntar a las tres rutas superiores puede ser la forma más rápida de lograr resultados.

Hay dos preguntas específicas que he discutido con muchas empresas y me gustaría compartir con ustedes:

Respecto a elegir con qué clientes comenzar con aplicaciones de modelos grandes:

"Las empresas avanzadas utilizan Feishu", necesitamos encontrar aquellas partes que ya tengan "un gran modelo de pensamiento". Como proveedor de servicios, es difícil lavar el cerebro de las partes que estén contentas con cada mejora en los resultados. No es así. Antes de comenzar, tenemos 10.000 preguntas por delante. Evitemos a este tipo de usuarios.

Sobre qué modelo elegir:

Comience con el mejor modelo que pueda usar. Si no puede hacerlo, entonces esta generación de modelos no es lo suficientemente buena, así que espere.

Una vez hecho esto, utilice el modelo más realista para ajustarlo y dígale a la Parte A la diferencia en la medida en que esté ajustado. Si es aceptable, adelante. Si no es aceptable, simplemente espere.

No considere el costo del modelo. El precio actual es completamente incomparable al de hace seis meses, y las capacidades dentro de seis meses definitivamente serán mejores que las de hoy. Para realizar aplicaciones de modelos a gran escala, debe tener una creencia básica en la "Ley de Moore de los modelos grandes". En lugar de obsesionarse con la optimización del modelo actual, es mejor aprovechar el tiempo y ser su amigo.

Para resumir el juicio de oportunidades:

En el mercado de aplicaciones 2B de modelo grande, existen nuevos escenarios, nuevas formas, nuevas empresas y viejos escenarios, nuevas soluciones y PK nuevas y antiguas.

No hay duda de que es una oportunidad para nuevas empresas, pero la forma del producto está lejos de estar madura. El iPhone salió al mercado a mediados de 2007. ¿Qué aplicaciones móviles recuerdas de finales de 2008? Solo falta un año y medio para el modelo grande a finales de 2022. Por supuesto, una empresa debe mantenerse viva, pero no puede aspirar a seguir viva. Todavía hay muchas oportunidades que deben ser exploradas, ya sea por usted o por otros.

Las oportunidades también pertenecen a los proveedores de servicios de software actuales en diversas industrias. Los servicios de 2B deben, en última instancia, resolver los problemas de los usuarios, y usted es quien mejor conoce sus necesidades. En el campo de las aplicaciones, la competencia en la era de los modelos grandes ha debilitado enormemente las barreras técnicas. La capacidad de transformar las necesidades del usuario en problemas adecuados para el procesamiento de modelos grandes se ha convertido en el punto competitivo más importante, y este es sin duda el punto fuerte de la industria de servicios de software. .

Es probable que se produzcan cambios, sin importar cuánto tiempo lleve en la industria. Ya sea que sea el primero o el último en la industria, es posible que quede eliminado en esta competencia, dejando algunos puestos para empresas nativas de gran modelo recién ingresadas. El resto también se reordenará en esta revolución tecnológica.

La batalla decisiva será este otoño, este año.

La primera reordenación se producirá este otoño. La mayoría de las empresas no tienen presupuestos específicos para modelos grandes en 2023 y las adquisiciones individuales desvían los presupuestos de otros proyectos de TI. Habrá algunos presupuestos de POC relacionados con modelos grandes en 2024, y gran parte del presupuesto de TI en 2025 deberá estar relacionado con modelos grandes. Si puede hacer realidad su solución y la visión de su empresa en la Parte A este otoño determinará cuántos proyectos puede obtener en 2025 y su posición en la primera batalla de clasificación.