Taxistas, que no cunda el pánico. Los programadores de la industria de la conducción inteligente pronto perderán sus empleos debido a la IA.

Taxistas, que no cunda el pánico. Los programadores de la industria de la conducción inteligente perderán sus empleos a causa de la IA antes.

2024-07-17

¿Ya está aquí el “momento GPT” de la conducción inteligente?

Autor |
editar|

Cada nueva tecnología pasará por diferentes etapas desde su nacimiento hasta su promoción y también enfrentará varias voces. Para encontrar la solución técnica óptima, los desarrolladores pueden renunciar a años de esfuerzos, mientras que las organizaciones comerciales se centran más en juzgar el momento de la implementación de la tecnología para maximizar los beneficios en el momento adecuado.

En cuanto a la conducción inteligente, los fabricantes nacionales de anfitriones alguna vez tuvieron profundas diferencias cognitivas. Los partidarios creen que puede aportar una experiencia "muy avanzada", mientras que los opositores han expresado su desdén con comentarios como "es una tecnología apestosa" y "la conducción autónoma es una estafa".

En 2024, con el lanzamiento oficial de la versión FSD V12 del software de conducción inteligente de Tesla basado en "de extremo a extremo", las actitudes de los fabricantes de automóviles chinos hacia la conducción inteligente finalmente comenzaron a converger.

Tomando como ejemplo a Wei Xiaoli, representante de las nuevas fuerzas en la fabricación de automóviles, varias empresas claramente han comenzado a buscar tecnología "de extremo a extremo".

Xiaopeng propuso introducir modelos grandes de extremo a extremo en sistemas de conducción inteligentes y afirmó que invertirá 4.200 millones de yuanes en datos de inteligencia y entrenamiento este año, con el objetivo de lograr "OTA interna una vez cada dos días" en el futuro. Se trata de una mejora de la eficiencia que era inimaginable en el pasado, que dependía de los humanos para mantener cientos de miles de líneas de código de conducción inteligente.

NIO también ha reestructurado recientemente su departamento de I+D de conducción inteligente, fusionando los equipos tradicionales de percepción y escala en grandes equipos modelo. El núcleo también es promover iteraciones de paradigmas basadas en redes neuronales.

Incluso el ideal que en el pasado fue ridiculizado como "recogida en fábrica" se ha utilizado con frecuencia para generar impulso para la investigación y el desarrollo inteligentes en los últimos tiempos. El director ejecutivo Li Xiang desarrolló personalmente la plataforma de investigación y desarrollo "de extremo a extremo" e introdujo la teoría del pensamiento rápido-lento de los economistas Nobel para ilustrar que su equipo ha encontrado una manera de resolver el caso más complicado de la conducción autónoma.

Entonces, ¿por qué es tan mágico permitir que varios fabricantes pasen del no consenso al consenso de un extremo a otro? ¿Cómo ha cambiado el paradigma de la industria de la conducción inteligente y qué oportunidades y ajustes traerá?

Ha llegado el momento GPT de la conducción inteligente

Una razón importante por la que los fabricantes nacionales formaron rápidamente un consenso es que Tesla tomó la iniciativa al ofrecer una envidiable hoja de respuestas de principio a fin.

En marzo de este año, Tesla lanzó oficialmente la versión FSD V12.3 del software de conducción inteligente. El mayor cambio en esta versión es cambiar el poder de todo el sistema de conducción inteligente de un código escrito por humanos a un gran modelo de IA basado en redes neuronales. Musk utiliza "Video in to Control out" para describir este nuevo paradigma de trabajo, es decir: la IA genera directamente operaciones de conducción en función de la información de la carretera que "ve", lo que a menudo se denomina "de extremo a extremo" en la industria. para terminar).

El mes pasado, He Xiaopeng experimentó la versión FSD V12.3.6 en California. En sus palabras, FSD "maneja muy bien muchas condiciones de la carretera". Ésta es la mayor ventaja de las redes neuronales de IA en comparación con las basadas en códigos: puede mejorar en gran medida las capacidades de aprendizaje generalizado de los sistemas de conducción inteligentes en diferentes ciudades y en diferentes condiciones de la carretera.

Traducido a una frase de publicidad y marketing más familiar para los consumidores nacionales, es: se puede abrir en todo el país (globalmente).

Huawei lanzó el lema “Disponible a nivel nacional” en septiembre del año pasado Fuente: Geek Park |

Por supuesto, esta conclusión es sólo un buen deseo en esta etapa. En el proceso operativo real, también se requiere la bendición y el entrenamiento total de la infraestructura de IA, como datos, algoritmos y potencia informática, para acercarse al objetivo de que "la IA se vuelva tan inteligente como los conductores humanos".

Pero para sus compañeros, la versión FSD V12 significa mucho. Verifica que las redes neuronales realmente pueden reemplazar el código escrito por humanos e incluso hacerlo mejor y más eficientemente.

Esto significa que no hay necesidad de esperar N años, el momento ChatGPT en la industria de la conducción inteligente realmente ha llegado. Piense en lo que dijo una vez Ali Zhang Yong: Vale la pena rehacer todo el software con IA. FSD V12 ha brindado a sus pares una nueva dirección y confianza: todas las pilas de tecnología de conducción inteligente se pueden rehacer de un extremo a otro.

Cuando se lanzó la versión beta de FSD V12, Musk dijo que esta versión comprimió las 300.000 líneas de código de la versión anterior a 2.000 líneas, lo que equivale a menos del uno por ciento.

La competencia de conducción inteligente en el nuevo conjunto de tecnologías no evolucionará hacia juegos más anti-innovación e involución que nadie. Si la eficiencia de la IA realmente puede alcanzar lo que He Xiaopeng dijo que es una OTA interna cada dos días, entonces la táctica del mar humano de escribir reglas una por una y corregir errores puede declararse completamente obsoleta.

Entonces, ¿la industria de la conducción inteligente todavía necesita tantos programadores? El autor no puede dar una respuesta precisa, pero lo cierto es que el contenido del trabajo de los programadores de conducción inteligente también sufrirá una serie de cambios. Los programadores que solo pueden escribir reglas if else probablemente serán reemplazados por la IA antes que los taxistas y los conductores de viajes en línea.

atrapado en datos

En el "Informe de investigación de la industria de la conducción autónoma de extremo a extremo" publicado por la institución de inversión Chentao Capital el mes pasado, sólo el 13% de más de 30 encuestados en la industria de la conducción autónoma expresaron una actitud relativamente cautelosa de "esperar y ver" hacia el final. -tecnología de punta, y el resto expresó una actitud más positiva de “preinvestigación” o incluso de “pleno compromiso”. El principio a fin se ha convertido en un consenso entre los profesionales de la industria.

Pero, de hecho, actualmente no existe ninguna empresa (incluida Tesla) que pueda lograr el "fundamentalismo de extremo a extremo". Es decir, todos los aspectos de la conducción autónoma se concentran en el mismo modelo grande para lograr verdaderamente las mismas "señales visuales de entrada y operaciones de salida del pedal y del volante" que los humanos.

Los principales esfuerzos de la mayoría de los OEM nacionales en esta etapa son abrir los módulos de percepción y toma de decisiones. La clave para esto es cancelar la definición manual de resultados entre módulos y utilizar vectores de características para transmitir información sin pérdidas.

Diagrama esquemático de la evolución de la arquitectura de la conducción autónoma de un extremo a otro Fuente de la imagen: Chentao Capital |

Antes de la arquitectura de conducción autónoma de extremo a extremo, la tradicional se originó en el campo de la robótica y se dividió en diferentes módulos, como percepción, planificación y control. Diferentes equipos desarrollan diferentes módulos y la información se transfiere principalmente entre módulos a través de interfaces definidas manualmente. Para dar el ejemplo más simple, el fenómeno de si un vehículo cruza la línea se puede representar en el módulo de percepción tradicional utilizando el lenguaje binario informático más simple.

El mayor beneficio de abrir los módulos de percepción y toma de decisiones es que puede cubrir más "escenas en escala de grises" que las reglas del mundo real no pueden describir con precisión. Por ejemplo, cuando conduces, no necesitas saber la velocidad precisa del coche que va delante o si está cruzando la línea. Sólo tienes que prestar atención a los cambios de posición relativos.

Sobre esta base, basándose en la teoría de la IA generativa, se espera que el modelo de red neuronal también pueda generar inteligencia después de una gran cantidad de entradas y convertirse en un agente de IA.

La base de todo esto proviene de los datos, que son el material de capacitación "alimentado" al modelo. Sin embargo, a diferencia de los grandes modelos de lenguaje basados en texto, no es fácil para los modelos de conducción inteligentes encontrar suficientes datos de video públicos como material de capacitación.

El "Informe de investigación de la industria de conducción autónoma de extremo a extremo" antes mencionado muestra que el conjunto de datos públicos más grande actualmente tiene solo 1200 horas de datos. Según Musk, en 2023, Tesla invirtió casi 40.000 horas de formación en vídeo en las primeras etapas de un extremo a otro.

En comparación con otras empresas automovilísticas, la principal ventaja de los datos de Tesla reside en el gran número de coches producidos en masa.。

Actualmente, Tesla ha entregado más de 6 millones de vehículos en todo el mundo. Sin embargo, entre las nuevas fuerzas de China que despliegan activamente la conducción inteligente, el número de vehículos producidos en masa es sólo una fracción del de Tesla. Junto con el SKU minimalista y consistente y el hardware de conducción inteligente completamente preintegrado, la recopilación de datos se vuelve más fácil.

La práctica común anterior en China generalmente se basaba en la adquisición manual de información vial. Sin embargo, para entrenar un modelo inteligente de extremo a extremo, también debe intentar cubrir suficientes datos de escenarios de borde (casos de conner). Dado que la aparición de escenas de borde es muy aleatoria, algunos fabricantes han declarado que sólo alrededor del 2% de los datos limitados se pueden obtener únicamente mediante la recopilación manual de datos.

Además, en comparación con Tesla, los fabricantes nacionales suelen tener SKU más complejos. Entre diferentes modelos, debido a diferencias en el tamaño del vehículo, disposición de los sensores, etc., también es necesario realinear los parámetros relevantes del modelo.

Tomando la serie Huawei como ejemplo, Hongmeng Zhixing ha demostrado una sólida capacidad de venta de terminales durante el último año. Sin embargo, para diferentes marcas y modelos de servicios BU de automóviles de Huawei, aún se necesitan ingenieros después de la implementación de extremo a extremo. Trabajos de alineación y entrega. Lo mismo ocurre con Weilai, que tiene 2 marcas y 9 modelos. Han reorganizado el equipo de integración en el equipo de entrega.

Después del lanzamiento de Sora, Musk tuiteó que Tesla usa IA para simular la conducción en el mundo real. Fuente de la imagen: captura de pantalla X |

Existe la opinión de que los productos de vídeo de Wensheng representados por Sora pueden convertirse en la fuente de material para modelos de extremo a extremo. Pero incluso para Musk, entrenar IA con contenido generado por IA aún no ha sido reconocido públicamente. Después de todo, los datos son demasiado importantes para el entrenamiento de modelos. Ya sabes, Musk, que siempre ha sido extremadamente tacaño con los costos laborales, también contrató a un equipo de 1000 personas en Nueva York para anotar los datos de los videos de carreteras de Tesla.

No se dejen “llevar a la zanja” por Musk

Parece que pasar de un extremo a otro es algo natural, pero eliminar 300.000 líneas de código y desmantelar y reorganizar la estructura organizativa anterior definitivamente no es una decisión fácil de tomar. De hecho, incluso Musk se embarcó en este camino por accidente. El ingeniero que le propuso por primera vez a finales de 2022 aprender ChatGPT para construir una red neuronal de conducción inteligente casi fue transferido por Lao Ma para resolver otros problemas después de la adquisición de Twitter.

Después de entrenar el modelo de un extremo a otro, el sistema de soporte correspondiente (incluida la potencia informática, etc.) también debe ser lo suficientemente eficiente. En una entrevista con "Tencent Deep Web", Ren Shaoqing, vicepresidente de investigación y desarrollo de conducción inteligente de NIO, dijo que forzar servicios de un extremo a otro sin capacidades básicas equivale a usar "veneno".

Dijo: "Si la estructura de su código original es lo suficientemente clara, su volumen de pruebas (de depuración) puede ser solo del 1%. Solía tomar tres días volver a probar el 1%, pero ahora lo siento, tiene que volver a probar el 100%. en tres días. Entonces, su sistema de verificación de datos debe ser lo suficientemente eficiente”.

Pero no se deje llevar directamente a la zanja por Tesla. De principio a fin, por el momento solo demuestra que tiene la posibilidad de mejorar la eficiencia del trabajo, pero no demuestra que sea la solución definitiva para la conducción autónoma.

Esto es consistente con la comprensión de la industria sobre si la Ley de Escala puede conducir a AGI (Inteligencia Artificial General) en el mundo físico: es cierto que la inteligencia artificial generativa puede tener una inteligencia superior, pero si puede comprender las leyes físicas y automáticamente para aplicaciones en la conducción. , robótica y otros campos, no existen reglas en la comunidad académica. En el "Informe de investigación de la industria de conducción autónoma de extremo a extremo", más de la mitad de los profesionales no creen que la tecnología de conducción autónoma de extremo a extremo sea la solución definitiva.

Para los OEM que desarrollan su propia conducción inteligente, el enfoque más pragmático en esta etapa es confiar en la implementación de extremo a extremo de capacidades de conducción inteligente de la forma más rápida, sencilla y rentable posible. En cuanto a la suscripción al software de conducción inteligente, es posible que el viaje sea más largo. Después de todo, en el mercado chino el hardware suele venderse mejor que el software y los servicios.

Por supuesto, existe una alta probabilidad de que no mucha gente quiera convertirse en jugadores innovadores como Musk. Si se deja un buen modelo de bajo costo sin investigación y desarrollo y se hace una gran apuesta por Robotaxi, el valor de mercado caerá en cientos de miles de millones de dólares si se retrasa el lanzamiento. Los jugadores más comunes solo esperan que, equipados con un software de conducción inteligente de extremo a extremo, puedan ayudar a que el hardware se venda mejor. Por supuesto, si se pudiera vender más caro, sería lo más maravilloso.

*Fuente de la imagen del encabezado: Visual China

Este artículo es un artículo original de Geek Park. Para reimprimirlo, comuníquese con Geek Jun en WeChat geekparkGO.

friki preguntó

El papel de los programadores en la futura industria de la conducción inteligente.

¿Qué cambios podrían ocurrir?

16 de julio. Lei Jun publicó: A las 7 pm del 19 de julio, este viernes por la noche, daré el quinto discurso anual de Lei Jun. El tema es "Valor" y hablaré sobre los pormenores de la construcción de un automóvil y los altibajos. los últimos tres años.

Me gusta y sigueCuenta de vídeo de Geek Park，

noticias

Taxistas, que no cunda el pánico. Los programadores de la industria de la conducción inteligente perderán sus empleos a causa de la IA antes.

Introducción

Mi informacion de contacto