Wei Xiaoli de principio a fin: diferentes formas, pero las alegrías y las tristezas están entrelazadas
2024-08-19
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
En la Internet china, a menudo se ridiculiza a Musk como el "Dios original" para burlarse de "teslaSin código abierto, China no podrá construir un coche puramente eléctrico", afirma el partido que odia al país.Sin embargo, en el campo de la conducción inteligente, Tesla ha desempeñado un papel de faro que lidera la dirección de las perspectivas de la industria durante mucho tiempo al celebrar el Día de la IA para compartir detalles técnicos (nota: puede haber más de un faro).Pero a partir del año pasado, Tesla canceló el Día de la IA y solo anunció avances tecnológicos y ya no habló de implementación tecnológica. Lo que quedó para el mundo exterior fueron las frecuentes buenas noticias de que FSD utiliza soluciones técnicas de extremo a extremo. Este año, varias empresas de conducción inteligente abrieron los ejercicios completos ofrecidos por Tesla y de repente encontraron una línea de pequeñas palabras en la columna de respuestas: Resuelve el problema.Se omite el proceso.¿Cómo hacerlo de un extremo a otro sin respuestas de referencia? ¿La investigación y el desarrollo de la conducción inteligente de un extremo a otro están respaldados por un modelo de negocio razonable?La pregunta fue formulada primero a Wei Xiaoli, el representante de las nuevas fuerzas automovilísticas.01
Abre la caja negra
Desde el año pasado hasta la primera mitad de este año, el tema principal de la competencia entre los jugadores nacionales de conducción inteligente fue competir por la velocidad de apertura de la ciudad con un mar de tácticas de personas bajo la arquitectura de tecnología modular tradicional.Durante este proceso, el equipo de conducción inteligente de Wei Xiaoli se amplió a mil personas (o más), entrenando, probando y verificando día y noche para conquistar el Caso de la Esquina.Tesla FSD ha verificado el efecto de extremo a extremo, brindando a todos la oportunidad de liberarse de la duplicación de trabajo.Pero el precio es que cada módulo de la pila tradicional de tecnología de conducción inteligente puede probarse y verificarse, mientras que el sistema de conducción inteligente de extremo a extremo es una caja negra que sólo conoce los resultados, pero no el proceso.Wei Xiaoli avanza hacia un extremo a otro y los problemas comunes que enfrentan son:En funciones con fuertes requisitos de seguridad como la conducción inteligente, una caja negra completa es inaceptable. Es necesario encontrar una manera de abrir esta caja negra y comprender "por qué el sistema quiere hacer esto", o al menos hacer que su salida sea relativamente. controlable.XiaopengLa elección es una ruta progresiva segmentada de un extremo a otro, y su solución técnica es la red neuronal de percepción XNet + la red neuronal de planificación XPlanner + el modelo de lenguaje visual XBrain que se centra en la comprensión de la escena.Xpeng segmentado de extremo a extremo
En la cadena tecnológica de extremo a extremo, la segmentación de extremo a extremo se encuentra actualmente en sentido descendente.Los radicales creen que la segmentación de extremo a extremo todavía no se sale del alcance de las soluciones tradicionales. Aunque tanto la percepción como la planificación se han implementado como redes neuronales, un punto clave no ha cambiado: la interfaz que conecta las dos redes neuronales sigue siendo una. interfaz definida por humanos, lo que significa pérdida de información y una gran cantidad de anotaciones manuales. Todo el proceso no conduce a la optimización y automatización global.Pero las ventajas de la segmentación de extremo a extremo también están aquí: hay interfaces definidas por humanos, lo que significa que se generarán resultados intermedios que los humanos pueden entender, lo cual es conveniente para verificar y localizar problemas, y no afectará a todo el cuerpo. , como problemas de detección, no es necesario volver a capacitar a toda la red. Entrenar dos modelos más pequeños juntos es menos difícil y consume menos recursos informáticos que entrenar un modelo grande de un extremo a otro.Más importante aún, este método es teóricamente más fácil de mantener el límite inferior del rendimiento de conducción inteligente.El 30 de julio, después del lanzamiento de la conducción inteligente XNGP de Xpeng, que se abrió por completo en todo el país, He Xiaopeng dijo: “Los edificios deben construirse capa por capa. Es posible que se desarrollen a pasos agigantados, pero el riesgo será extremadamente alto. alto."Esta frase fue interpretada como una advertencia a los empresarios amigos.A principios de julio, Lili presentó una solución integral de una etapa en desarrollo en su conferencia de verano: 4D One Model de extremo a extremo. En una etapa de extremo a extremo, la percepción y la planificación se empaquetan en una red neuronal con cientos de millones de parámetros, y los videos de conducción de conductores experimentados se convierten en los datos de entrenamiento más importantes. Esta solución admite la transmisión de información sin pérdidas y tiene un mayor grado de automatización en el flujo de datos. Es más radical que las soluciones de extremo a extremo de Xiaopeng y Huawei.Sin embargo, esta solución de extremo a extremo tiene problemas como una generalización débil, una interpretabilidad deficiente y límites inferiores inestables. Por esta razón, Ideal ha conectado un VLM (Vision-Language Model) con una escala de 2,2 mil millones de parámetros al final. Modelo de extremo a extremo. Este modelo tiene una mejor comprensión de escenas de tráfico complejas y señales de texto de tráfico, y puede proporcionar una referencia para las decisiones de conducción del modelo de un extremo a otro y mejorar el rendimiento de los sistemas de conducción inteligentes.idealVLM+de extremo a extremoSolución de conducción inteligente con sistema rápido y lentoEn agosto, la solución de conducción inteligente de sistema dual rápido y lento de extremo a extremo + VLM de Ideal inició una prueba interna de miles de personas para usuarios profesionales. Los funcionarios esperan lanzarla para usuarios comunes a fines de este año o principios del próximo. .Antes de esto, Ideal no lideraba la percepción de Zhijia por parte de los usuarios, lo que tuvo un impacto negativo en las ventas (especialmente frente aPregúntale al mundohora). De extremo a extremo + VLM se define idealmente como una batalla clave por la capacidad de conducción inteligente para adelantar en las curvas y convertirse en el primer escalón.En contraste,NÍOAdopta una actitud conservadora y radical de principio a fin.NIO es conservador en el sentido de que su uso actual de extremo a extremo es muy limitado y no se usa para NoA urbano, solo para funciones de seguridad activa. El 11 de julio, NIO comenzó a impulsar AEB utilizando una solución de extremo a extremo para resolver el problema de la cobertura insuficiente de los escenarios AEB en las soluciones tradicionales.El lado radical de NIO es que la conducción inteligente que se lanzará a finales de este año parece estar lista para saltarse la popular tendencia actual de incorporación de un extremo a otro y pasar directamente a la siguiente etapa: la incorporación del modelo mundial.El modelo mundial es la última metodología encontrada en la industria de la conducción inteligente. En CVPR, la principal conferencia sobre inteligencia artificial de 2023, Tesla demostró los resultados de investigación y desarrollo del modelo mundial Wayve.ai, una nueva empresa conocida en la industria por su modelo mundial de conducción autónoma GAIA-1, que recaudó mil millones de dólares. Mayo de este año.Al aprender cantidades masivas de videos de escenas de conducción reales, el modelo mundial puede predecir y generar videos de escenas de conducción en un tiempo determinado en el futuro para tomar decisiones de conducción correctas. Su esencia es la deducción espacio-temporal. Esto es similar al comportamiento de conducción humano. Los conductores experimentados predecirán y deducirán mentalmente el comportamiento de otros participantes del tráfico y los cambios en el flujo de tráfico, y planificarán las operaciones de conducción sobre esta base.El modelo mundial va un paso más allá que el actual modelo de extremo a extremo en el sentido de que su tarea principal no es sólo proporcionar una ruta planificada, sino también "predecir los cambios de píxeles de la escena de conducción". Esta tarea extremadamente difícil obligará al modelo no sólo a aprender el comportamiento de excelentes conductores, sino también a adquirir amplios conocimientos de física y tráfico.Lo que Weilai propuso en NIO IN es un "modelo mundial PLUS" aún más difícil. Es más complejo y tiene más dimensiones de salida, lo que significa que puede generar más señales de supervisión comparándolas con el valor real y acelerar el entrenamiento neuronal. redes, y también reducir el nivel de caja negra de operación del sistema. Pero el precio es una mayor dificultad de desarrollo.modelo mundial NIO,Hay muchosEl resultado de la tarea de predicción de
Como referencia, para entrenar el modelo mundial GAIA-1, que solo se usa para demostración y solo genera rutas y videos planificados, Wayve.ai usó 4700 horas de datos de video y se entrenó durante 15 días con 160 bloques de A100. El modelo mundial que NIO quiere entrenar requiere datos y recursos informáticos que son más de un orden de magnitud superiores.Una vez completada la capacitación, otro problema complejo es cómo comprimir y rellenar un modelo mundial enorme y complejo en Orin-X, que tiene una potencia informática y un ancho de banda muy limitados, y al mismo tiempo garantiza la precisión y la velocidad de ejecución.En la actualidad, Wei Xiaoli, que está probando el extremo a extremo por primera vez (incluso si se adopta con cautela), siente el efecto de "elevar el límite superior y bajar el límite inferior" del extremo a extremo. diversos grados.Por ejemplo, la última versión de Xpeng, XNGP, ha adquirido capacidades de giro en U sin precedentes, pero los comentarios han demostrado que su rendimiento de conducción inteligente a altas velocidades ha retrocedido.La solución VLM + de extremo a extremo de Ideal, que se encuentra bajo pruebas internas, tiene un límite superior alto y un límite inferior fluctuante.El AEB de extremo a extremo que ha impulsado NIO no solo tiene el rendimiento de evitar en extremo las sondas fantasma en escenas no estándar, como puntos ciegos en las curvas, sino que también ha sido criticado por los usuarios por un aumento en las frenadas en falso.02
Investigación y desarrollo de L4, ¿perspectivas de L2?
Cuando el límite inferior es difícil de alcanzar, las empresas automotrices invariablemente han recurrido al extremo a extremo, en gran parte porque el límite superior de extremo a extremo generará suficientes mejoras en la experiencia del usuario y las correspondientes oportunidades comerciales.Pero a medida que las empresas automotrices se involucran más en el extremo a extremo, una pregunta persiste en sus mentes: ¿Se puede calcular la relación entrada-salida de la conducción inteligente?Para vender más FSD, Tesla redujo su precio de suscripción de $199/mes a $99/mes (el precio de compra bajó de $12,000 a $8,000) en marzo de este año. Sin embargo, en mayo de este año, una agencia de consultoría de datos extranjera analizó la información de pago con tarjeta de crédito de 3.500 usuarios y consideró que la tasa de conversión de FSD era solo del 2%, lo que llevó a Musk a refutar el rumor en X de que "la tasa de conversión está lejos". Más del 2%, por favor."Pero mucho más del 2% no es suficiente. Tesla está construyendo un clúster de supercomputación en su fábrica de Texas que se espera alcance las 100.000 tarjetas H100/H200. A un precio preferencial de 25.000 dólares por H100, el gasto de capital sólo para comprar tarjetas de computación superará los 2.500 millones de dólares (ampliándolo). de construirlo como un centro de datos y continuar operando es mayor) y vale la penaTarifa de suscripción FSD para 2,08 millones de vehículos Tesla durante un año completo。El modelo de negocio de conducción inteligente de las empresas automotrices nacionales es aún menos optimista.Los gastos de I+D de Xiaopeng para IA este año son de 3.500 millones de yuanes. Este mes, Ideal ha fijado el umbral de financiación para la conducción inteligente en 1.000 millones de dólares. Sin embargo, tanto el XNGP de Xpeng como el NOA de Ideal vienen de serie con los modelos de alta gama. compra. NIO no ha adoptado una estrategia gratuita. La función de conducción inteligente de alta gama NOP+ tiene un precio de 380 yuanes al mes. Ha generado ingresos brevemente, pero ahora los coches nuevos vienen con un período de uso gratuito de NOP+ de 1 a 2 años.Incluyendo a Tesla, la conducción inteligente de alta gama en el país y en el extranjero todavía se encuentra en la etapa de perder y ganar dinero.La contradicción es que después de ingresar a la competencia NOA urbana y cambiar al paradigma de extremo a extremo, la intensidad de la I + D en conducción inteligente de estas empresas en realidad se ha orientado hacia la conducción autónoma L3 e incluso L4. valor como "no vale la pena el costo adicional del software". Conducción asistida L2 pagada.Para solucionar esta "brecha entre el valor esperado y el valor real", parece que la forma más prometedora es entrar en el mayor mercado de conducción autónoma L4, Robotaxi.En 2018, Morgan Stanley valoró el Robotaxi de Waymo en 80.000 millones de dólares. El mayor admirador de Musk, Mu Jie de Ark Investment, predijo en junio de este año que los ingresos de Tesla Robotaxi alcanzarán “de manera conservadora” los 603 mil millones de dólares en 2029, lo que impulsará el valor de mercado de Tesla hasta alcanzar los 7 billones de dólares para entonces.Antes de esto, Musk anunció en Twitter que lanzaría un modelo Robotaxi en agosto (yapospuesto hasta el 10 de octubre).03
Los retornos comerciales aún no han sido milagrososHacer o no Robotaxi se ha convertido en una cuestión candente para Wei Xiaoli este año.Para Xpeng, el más cercano a Tesla, la respuesta es SÍ. En julio, He Xiaopeng reveló públicamente que Xpeng Motors lanzará Robotaxi en 2026.He Xiaopeng cree que los requisitos de hardware de Robotaxi son mucho más complejos de lo que se imagina, pero la combinación de algoritmos de software de modelo grande y de extremo a extremo que puede crecer rápidamente es suficiente para resolver la conducción autónoma L4. El objetivo de He Xiaopeng para el equipo es que, en la segunda mitad de 2025, la experiencia XNGP se compare con la Robotaxi de Google Waymo.Sin embargo, la fabricación de automóviles en sí misma ya es un negocio con muchos activos, ya que se construye una gran cantidad de Robotaxi y se opera unaUna plataforma de taxis autónoma alargará infinitamente la cadena comercial y el ciclo de retorno de la inversión.Google invirtió 5 mil millones de dólares en Waymo este año y es imposible que Xpeng sea tan rico.De junio a julio, He Xiaopeng visitó al director ejecutivo de Didi, Cheng Wei, y al director ejecutivo de Uber, Dara Khosrowshahi. Dijo que Xpeng no quiere operar Robotaxi, pero espera exportar modelos y tecnología de conducción autónoma a socios globales.Robotaxi de Uber, ahora asociado con Hyundai
El enfoque de las empresas de automóviles hacia Robotaxi de extremo a extremo ha atraído la reacción de muchos profesionales de la conducción autónoma L4, incluido el ex director ejecutivo de TuSimple, Hou Xiaodi, el director de tecnología de Pony.ai, Lou Tiancheng, y el presidente de Qingzhou Zhihang, Hou Cong. Algunos de ellos criticaron airadamente la mitología de extremo a extremo de las empresas de automóviles, y algunos dijeron que los sistemas de capacidad relevantes de las empresas de automóviles no son sólidos, pero los argumentos centrales siguen siendo los mismos:Aunque la conducción inteligente de alta gama de las empresas de automóviles ha progresado rápidamente, está esencialmente diseñada en el marco de la conducción asistida. Los objetivos principales son la usabilidad y el costo, y lo más importante para Robotaxi es la confiabilidad y la seguridad. Los diferentes objetivos dificultan que ambos utilicen el mismo software y hardware, y es difícil para las empresas automotrices realizar una transición sin problemas de la conducción inteligente de alta gama a Robotaxi [1][2][3].Esto juega con el corazón de Li Bin. En una entrevista el 27 de julio,Dejó en claro que “no cree que Robotaxi sea un logro o modelo de negocio emocionante” y dijo enojado:"El valor de la conducción inteligente no es eliminar el arduo trabajo de los chóferes y taxistas actuales".Otra razón por la que no es optimista sobre el robotaxi es porqueDebido a los recursos viales limitados y las regulaciones gubernamentales, el robotaxi no se puede lanzar de forma ilimitada, lo que le dificulta tener un modelo de negocio con altos rendimientos marginales como los servicios de software en la nube.Li Bin siempre ha insistido en que la gente querrá tener un coche propio, por lo que el objetivo de NIO Smart Driving es ayudar a los conductores a liberar energía y reducir los accidentes. La palabra clave de la ruta empresarial es efecto de escala: vender más coches. A los usuarios normales y a los usuarios con tarifas de suscripción suficientes se les cobrarán tarifas de suscripción por una conducción inteligente de alta gama, lo que diluirá los costos y obtendrá ingresos.Sin embargo, frente a la conducción inteligente de alto costo, la escala de usuarios acumulada de NIO de menos de 600.000 todavía no es suficiente, y exportar capacidades de conducción inteligente se ha convertido en una opción. Ren Shaoqing, responsable de la conducción inteligente de NIO, expresó recientemente la voluntad de NIO de abrir sus soluciones de conducción inteligente a otras empresas de automóviles por primera vez, al igual que la apertura de NIO al cambio de baterías.En contraste, el "juicio técnico de Li Xiang es radical y la estrategia comercial es conservadora" para Zhijia.Li Xiang señaló en el Foro del Automóvil de Chongqing este año que la combinación de extremo a extremo + VLM alcanzará la conducción autónoma de nivel L4 en tres años. Pero la diferencia es que Ideal nunca pensó en el negocio de Robotaxi. Incluso hasta ahora, Ideal no ha mostrado ningún interés en cobrar por el software de conducción inteligente. El logotipo en su sitio web oficial sigue siendo "conducción inteligente en todos los escenarios, sin tarifas de suscripción de por vida".Esto está relacionado con la situación competitiva ideal. En el último año, los ideales se han enfrentadoHongmeng Zhixing, las ventas se han visto sometidas a una presión significativa. La lanza más afilada de Hongmeng Zhixing son las capacidades de conducción inteligente ADS de Huawei.En un momento en que Hongmeng Zhixing está aumentando con Huawei ADS 3.0 (el precio de compra es de aproximadamente 10,000 yuanes) de todos los ámbitos de la vida, ejerciendo aún más presión sobre Ideal, la conducción inteligente AD MAX de Ideal, que es más fácil de usar que antes pero gratuita, puede ayudar. agarre más pedidos múltiples. A diferencia de Xpeng y NIO, el KPI de conducción inteligente ideal no es obtener ingresos operativos, sino atender las ventas.Sin embargo, a medida que la industria automotriz nacional entra en la etapa eliminatoria, el negocio de conducción inteligente de Wei Xiaoli no puede permanecer en un estado de hacer amigos durante mucho tiempo.El costo de una tarjeta de capacitación comienza en 100.000 yuanes y el costo laboral de un equipo de mil personas comienza en mil millones por año. Como una de las empresas más caras de Wei Xiaoli, Zhijia se ha embarcado en un camino que consume más recursos para lograr grandes logros. éxito, pero todavía está lleno de incertidumbre sobre si también podrá cosechar los frutos de esfuerzos milagrosos.[1] Hou Xiaodi, el valiente cauteloso, Jiazi Guangnian
[2] Hablando con Lou Tiancheng sobre Robotaxi: "Cuanto más potente es L2, más lejos está de L4", Tencent Auto
[3] Tesla simplifica Robotaxi | Conversación con Hou Cong, cofundador de Qingzhou Zhihang, Yunjian Insight