Wei Xiaoli de bout en bout : des formes différentes, mais les joies et les peines s'entremêlent
2024-08-19
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Sur l'Internet chinois, Musk est souvent ridiculisé comme le "Dieu originel" pour se moquer "TeslaSans open source, la Chine ne sera pas en mesure de construire une voiture purement électrique", affirme le parti qui déteste ce pays.Cependant, dans le domaine de la conduite intelligente, Tesla a en effet joué pendant longtemps un rôle de phare dans la direction des perspectives de l'industrie en organisant la Journée de l'IA pour partager des détails techniques (remarque : il peut y avoir plus d'un phare).Mais à partir de l'année dernière, Tesla a annulé l'AI Day et n'a annoncé que des progrès technologiques et n'a plus parlé de mise en œuvre technologique. Ce qui a été laissé au monde extérieur, c'est la bonne nouvelle fréquente de FSD utilisant des solutions techniques de bout en bout. Cette année, diverses entreprises de conduite intelligente ont ouvert les exercices de bout en bout proposés par Tesla et ont soudainement trouvé une ligne de petits mots dans la colonne de réponses : Résoudre le problèmeLe processus est omis.Comment faire de bout en bout sans réponses de référence ? La recherche et le développement d’une conduite intelligente de bout en bout sont-ils soutenus par un modèle économique raisonnable ?La question a d'abord été posée à Wei Xiaoli, le représentant des nouvelles forces de construction automobile.01
Ouvrez la boîte noire
De l'année dernière au premier semestre de cette année, le thème principal de la compétition entre les acteurs nationaux de la conduite intelligente était de concourir pour la vitesse d'ouverture de la ville avec une mer de tactiques de personnes sous l'architecture technologique modulaire traditionnelle.Au cours de ce processus, l'équipe de conduite intelligente de Wei Xiaoli s'est élargie à un millier de personnes (ou plus), formant, testant et vérifiant jour et nuit pour conquérir le Corner Case.Tesla FSD a vérifié l'effet de bout en bout, donnant à chacun la possibilité de se libérer de la duplication du travail.Mais le prix est que chaque module de la pile technologique de conduite intelligente traditionnelle peut être testé et vérifié, tandis que le système de conduite intelligente de bout en bout est une boîte noire qui ne connaît que les résultats mais pas le processus.Wei Xiaoli s'oriente vers le bout en bout, et les problèmes courants auxquels ils sont confrontés sont les suivants :Dans une fonction avec des exigences de sécurité fortes comme la conduite intelligente, une boîte noire complète est inacceptable. Il faut trouver un moyen d'ouvrir cette boîte noire et comprendre « pourquoi le système veut faire ça », ou du moins rendre sa sortie relativement. contrôlable.Xiao PengLe choix est un itinéraire progressif segmenté de bout en bout, et sa solution technique est le réseau neuronal perceptuel XNet + le réseau neuronal de planification XPlanner + le modèle de langage visuel XBrain qui se concentre sur la compréhension de la scène.Xpeng segmenté de bout en bout
Dans la chaîne technologique de bout en bout, la segmentation de bout en bout se situe actuellement en aval.Les radicaux estiment que la segmentation de bout en bout ne s'éloigne toujours pas de la portée des solutions traditionnelles. Bien que la perception et la planification aient mis en œuvre des réseaux de neurones, un point clé n'a pas changé : l'interface reliant les deux réseaux de neurones est toujours une interface humaine. interface définie. Cela signifie une perte d’informations et une grande quantité d’annotations manuelles. L’ensemble du processus n’est pas propice à l’optimisation et à l’automatisation globales.Mais les avantages de la segmentation de bout en bout sont également là : il existe des interfaces définies par l'homme, ce qui signifie que des résultats intermédiaires que les humains peuvent comprendre seront générés, ce qui est pratique pour vérifier et localiser les problèmes, et n'affectera pas l'ensemble du corps. , tels que des problèmes de détection. Il n'est pas nécessaire de recycler l'ensemble du réseau. La formation conjointe de deux modèles plus petits est moins difficile et consomme moins de ressources informatiques que la formation d’un grand modèle de bout en bout.Plus important encore, cette méthode est théoriquement plus facile à maintenir la limite inférieure des performances de conduite intelligente.Le 30 juillet, après le lancement du système de conduite intelligente XNGP de Xpeng, qui a été entièrement ouvert à l'échelle nationale, He Xiaopeng a déclaré : « Les bâtiments doivent être construits couche par couche. Il est peut-être possible de se développer à pas de géant, mais le risque sera extrêmement élevé. haut."Cette phrase a été interprétée comme un avertissement adressé aux hommes d’affaires amis.Début juillet, Lili a présenté une solution de bout en bout en une étape en cours de développement lors de sa conférence d'été : 4D One Model de bout en bout. En une seule étape, de bout en bout, la perception et la planification sont regroupées dans un réseau neuronal comportant des centaines de millions de paramètres, et les vidéos de conduite de conducteurs expérimentés deviennent les données de formation les plus importantes. Cette solution prend en charge la transmission d'informations sans perte et présente un degré plus élevé d'automatisation du flux de données. Elle est plus radicale que les solutions de bout en bout de Xiaopeng et Huawei.Cependant, cette solution de bout en bout présente des problèmes tels qu'une faible généralisation, une mauvaise interprétabilité et des limites inférieures instables. Pour cette raison, Ideal a connecté un VLM (Vision-Language Model) avec une échelle de 2,2 milliards de paramètres à la fin. Modèle complet. Grand modèle. Ce modèle a une meilleure compréhension des scènes de circulation complexes et des panneaux de signalisation, et peut fournir une référence pour les décisions de conduite dans le modèle de bout en bout, améliorant ainsi les performances du système de conduite intelligent.idéalDe bout en bout+VLMSolution de conduite intelligente à système rapide et lentEn août, la solution de conduite intelligente à double système rapide et lente de bout en bout + VLM d'Ideal a lancé un test interne auprès de milliers de personnes pour les utilisateurs professionnels. Les autorités prévoient de la lancer auprès des utilisateurs ordinaires d'ici la fin de cette année ou au début de l'année prochaine. .Avant cela, Ideal n'était pas en tête dans la perception de Zhijia par les utilisateurs, ce qui avait un impact négatif sur les ventes (en particulier contreDemandez au mondeheure). De bout en bout + VLM est idéalement défini comme une bataille clé pour la capacité de conduite intelligente à dépasser dans les virages et à devenir le premier échelon.En revanche,NIOIl adopte une attitude conservatrice et radicale envers le bout en bout.NIO est conservateur dans la mesure où son utilisation actuelle de bout en bout est très limitée et il n'est pas utilisé pour le NoA urbain, uniquement pour les fonctions de sécurité active. Le 11 juillet, NIO a commencé à promouvoir AEB en utilisant une solution de bout en bout pour résoudre le problème de la couverture insuffisante des scénarios AEB dans les solutions traditionnelles.Le côté radical de NIO est que la conduite intelligente qui sera lancée plus tard cette année semble prête à ignorer la tendance actuelle de l’intégration de bout en bout et à passer directement à l’étape suivante : l’intégration de modèles mondiaux.Le modèle mondial est la dernière méthodologie trouvée dans l’industrie de la conduite intelligente. Lors du CVPR, la plus grande conférence sur l'intelligence artificielle de 2023, Tesla a présenté les résultats de recherche et de développement du modèle mondial Wayve.ai, une start-up connue dans l'industrie pour son modèle mondial de conduite autonome GAIA-1, a levé 1 milliard de dollars. Mai de cette année.En apprenant d'énormes quantités de vidéos de scènes de conduite réelles, le modèle mondial peut prédire et générer des vidéos de scènes de conduite dans un certain laps de temps pour prendre les bonnes décisions de conduite. Son essence est la déduction spatio-temporelle. Ceci est similaire au comportement de conduite humain. Les conducteurs expérimentés prédisent et déduisent dans leur esprit le comportement des autres usagers de la route et les changements dans la circulation, et planifient leurs opérations de conduite sur cette base.Ce qui va plus loin que le modèle mondial de bout en bout actuel, c'est que sa tâche principale n'est pas seulement de donner un chemin planifié, mais aussi de « prédire les changements de pixels dans la scène de conduite ». Cette tâche extrêmement difficile obligera le modèle non seulement à apprendre le comportement d'excellents conducteurs, mais également à acquérir des connaissances approfondies sur la circulation et la physique.Ce que Weilai a proposé à NIO IN est un « modèle mondial PLUS » encore plus difficile. Il est plus complexe et a plus de dimensions de sortie, ce qui signifie que davantage de signaux de supervision peuvent être formés en le comparant à la valeur réelle, ce qui accélère la formation des neurones. réseaux, et réduisent également le niveau de boîte noire du fonctionnement du système. Mais le prix est une difficulté de développement plus élevée.Modèle mondial NIO,Il y a beaucoup deLe résultat de la tâche de prédiction de
À titre de référence, afin de former le modèle mondial GAIA-1, qui n'est utilisé qu'à des fins de démonstration et ne produit que les chemins et vidéos planifiés, Wayve.ai a utilisé 4 700 heures de données vidéo et s'est entraîné pendant 15 jours avec 160 blocs d'A100. Le modèle mondial que NIO souhaite former nécessite des données et des ressources informatiques supérieures d'un ordre de grandeur.Une fois la formation terminée, comment compresser et intégrer un modèle mondial complexe et énorme dans Orin-X, qui a une puissance de calcul et une bande passante très limitées, tout en garantissant la précision et la vitesse d'exécution, est un autre problème complexe.À l'heure actuelle, Wei Xiaoli, qui essaie pour la première fois de bout en bout (même si cela est adopté avec prudence), ressent l'effet « d'augmenter la limite supérieure et d'abaisser la limite inférieure » de bout en bout. des degrés divers.Par exemple, la dernière version de Xpeng, XNGP, a acquis des capacités de demi-tour sans précédent, mais les retours ont montré que ses performances de conduite intelligente à grande vitesse ont régressé.La solution de bout en bout + VLM d'Ideal, qui est en cours de tests internes, a une limite supérieure élevée et une limite inférieure fluctuante.L'AEB de bout en bout que NIO a poussé a non seulement la performance d'éviter extrêmement les sondes fantômes dans des scénarios non standard tels que les angles morts dans les courbes, mais a également été critiqué par les utilisateurs pour une augmentation des faux freinages.02
Recherche et développement L4, perspectives L2 ?
Lorsque la limite inférieure est difficile à comprendre, les constructeurs automobiles se tournent invariablement vers le bout en bout, en grande partie parce que la limite supérieure de bout en bout entraînera des améliorations suffisantes de l'expérience utilisateur et des opportunités commerciales correspondantes.Mais à mesure que les constructeurs automobiles s’impliquent davantage dans la conduite de bout en bout, une question persiste dans leur esprit : peut-on calculer le rapport entrées-sorties de la conduite intelligente ?Afin de vendre davantage de FSD, Tesla a abaissé le prix de son abonnement de 199 $/mois à 99 $/mois (le prix de rachat est passé de 12 000 $ à 8 000 $) en mars de cette année. Cependant, en mai de cette année, une agence étrangère de conseil en données a analysé les informations de paiement par carte de crédit de 3 500 utilisateurs et a jugé que le taux de conversion du FSD n'était que de 2 %, ce qui a amené Musk à réfuter la rumeur sur X selon laquelle « le taux de conversion est loin ». plus de 2%, s'il vous plaît."Mais bien plus que 2 %, ce n’est pas suffisant. Tesla construit un cluster de calcul intensif dans son usine du Texas qui devrait atteindre 100 000 cartes H100/H200. Au prix préférentiel de 25 000 dollars par H100, les dépenses en capital pour l'achat de cartes informatiques à elles seules dépasseront 2,5 milliards de dollars (en l'étendant). de le construire en tant que centre de données et de continuer à l'exploiter est plus élevé) et vaut la peineFrais d'abonnement FSD pour 2,08 millions de véhicules Tesla pour une année complète。Le modèle économique de conduite intelligente des constructeurs automobiles nationaux est encore moins optimiste.Les dépenses de R&D de Xiaopeng pour l'IA cette année s'élèvent à 3,5 milliards de yuans. Ce mois-ci, Ideal a fixé le seuil de financement pour la conduite intelligente à 1 milliard de dollars. Cependant, le XNGP de Xpeng et le NOA d'Ideal sont livrés en standard avec des modèles haut de gamme. achat. NIO n'a pas adopté de stratégie gratuite. La fonction de conduite intelligente haut de gamme NOP+ est proposée au prix de 380 yuans par mois. Elle a brièvement généré des revenus, mais les nouvelles voitures bénéficient désormais d'une période d'utilisation gratuite de NOP+.Y compris Tesla, la conduite intelligente haut de gamme au pays et à l'étranger est encore au stade de la perte et du gain d'argent.La contradiction est qu'après être entrées dans la compétition urbaine NOA et être passées au paradigme de bout en bout, l'intensité de la R&D en matière de conduite intelligente de ces entreprises s'est en fait orientée vers la conduite autonome L3 et même L4. Cependant, le marché grand public continue de les considérer. valeur comme « ne vaut pas le coût supplémentaire du logiciel ».Pour résoudre cet « écart entre la valeur attendue et la valeur réelle », il semble que la voie la plus prometteuse soit d'entrer sur le plus grand marché de la conduite autonome L4, Robotaxi.En 2018, Morgan Stanley a évalué le Robotaxi de Waymo à 80 milliards de dollars. Le plus grand fan de Musk, Mu Jie d’Ark Investment, a prédit en juin de cette année que les revenus de Tesla Robotaxi atteindraient « de manière prudente » 603 milliards de dollars en 2029, augmentant ainsi la valeur marchande de Tesla pour atteindre 7 000 milliards de dollars d’ici là.Avant cela, Musk avait annoncé sur Twitter qu'il lancerait un modèle Robotaxi en août (déjàreporté au 10 octobre).03
Les retours sur investissement n’ont pas encore été miraculeuxFaire ou non du Robotaxi est devenu une question brûlante devant Wei Xiaoli cette année.Pour Xpeng, qui est le plus proche de Tesla, la réponse est OUI. En juillet, He Xiaopeng a révélé publiquement que Xpeng Motors lancerait Robotaxi en 2026.He Xiaopeng estime que les exigences matérielles de Robotaxi sont bien plus complexes qu'on ne l'imaginait, mais la combinaison d'algorithmes logiciels de bout en bout et de grand modèle qui peut croître rapidement est suffisante pour résoudre la conduite autonome L4. L’objectif de He Xiaopeng pour l’équipe est que dans la seconde moitié de 2025, l’expérience XNGP soit comparée au Robotaxi de Google Waymo.Cependant, la construction automobile elle-même est déjà une activité dotée de nombreux actifs, construisant un grand nombre de Robotaxi et exploitant unUne plateforme de taxi autonome allongera infiniment la chaîne commerciale et le cycle de retour sur investissement.Google a investi 5 milliards de dollars dans Waymo cette année, et il est impossible pour Xpeng d'être aussi riche.De juin à juillet, He Xiaopeng a rendu visite au PDG de Didi, Cheng Wei, et au PDG d'Uber, Dara Khosrowshahi. Il a déclaré que Xpeng ne souhaitait pas exploiter Robotaxi, mais espérait exporter des modèles et des technologies de conduite autonome vers des partenaires mondiaux.Robotaxi d'Uber, désormais partenaire de Hyundai
L'approche des constructeurs automobiles envers Robotaxi de bout en bout a suscité la réaction de nombreux praticiens de la conduite autonome L4, notamment l'ancien PDG de TuSimple Hou Xiaodi, le directeur technique de Pony.ai Lou Tiancheng et le président de Qingzhou Zhihang Hou Cong. Certains d'entre eux ont critiqué avec colère la mythologie de bout en bout des constructeurs automobiles, et certains ont déclaré que les systèmes de capacités pertinents des constructeurs automobiles ne sont pas solides, mais les arguments principaux restent les mêmes :Bien que la conduite intelligente haut de gamme des constructeurs automobiles ait fait des progrès rapides, elle est essentiellement conçue dans le cadre de la conduite assistée. Les principaux objectifs de préoccupation sont la convivialité et le coût, et le plus important pour Robotaxi est la fiabilité et la sécurité. Les objectifs différents rendent difficile l’utilisation des mêmes logiciels et matériels, et il est difficile pour les constructeurs automobiles de passer en douceur de la conduite intelligente haut de gamme à Robotaxi [1][2][3].Cela joue dans le cœur de Li Bin. Dans une interview le 27 juillet,Il a clairement indiqué qu'il « ne pense pas que Robotaxi soit une réalisation ou un modèle commercial passionnant » et a déclaré avec colère :"La valeur de la conduite intelligente n'est pas d'éliminer le travail acharné des chauffeurs et des chauffeurs de taxi aujourd'hui."Une autre raison pour laquelle il n'est pas optimiste à propos du robotaxi est queEn raison des ressources routières limitées et des réglementations gouvernementales, le robotaxi ne peut pas être lancé de manière illimitée, ce qui rend difficile la mise en place d'un modèle commercial avec des rendements marginaux élevés comme les services cloud logiciels.Li Bin a toujours insisté sur le fait que les gens voudront posséder leur propre voiture, c'est pourquoi l'objectif de NIO Smart Driving est d'aider les conducteurs à libérer de l'énergie et à réduire les accidents. Le mot clé de l'itinéraire commercial est l'effet d'échelle : vendre plus de voitures à. les utilisateurs ordinaires et les utilisateurs disposant de frais d'abonnement suffisants se verront facturer des frais d'abonnement pour une conduite intelligente haut de gamme, diluant les coûts et gagnant des revenus.Cependant, face à une conduite intelligente coûteuse, le nombre cumulé d'utilisateurs de NIO, inférieur à 600 000, n'est toujours pas suffisant, et l'exportation de capacités de conduite intelligente est devenue une option. Ren Shaoqing, responsable de la conduite intelligente de NIO, a récemment exprimé pour la première fois la volonté de NIO d'ouvrir ses solutions de conduite intelligente à d'autres constructeurs automobiles, tout comme l'ouverture de NIO à l'échange de batteries.En revanche, pour Zhijia, « le jugement technique de Li Xiang est radical et la stratégie commerciale est conservatrice ».Li Xiang a lancé cette année au Forum automobile de Chongqing que la combinaison de bout en bout + VLM atteindra la conduite autonome de niveau L4 d'ici trois ans. Mais la différence est qu’Ideal n’a jamais pensé au métier de Robotaxi. Même jusqu'à présent, Ideal n'a montré aucun intérêt à facturer les logiciels de conduite intelligente. Le logo sur son site officiel reste « conduite intelligente tous scénarios, aucun frais d'abonnement à vie ».Ceci est lié à la situation concurrentielle idéale. Au cours de la dernière année, les idéaux ont été confrontésHongmeng Zhixing, les ventes ont été soumises à une pression importante. Le fer de lance le plus puissant de Hongmeng Zhixing réside dans les capacités de conduite intelligente ADS de Huawei.À l'heure où Hongmeng Zhixing est en plein essor avec Huawei ADS 3.0 (le prix de rachat est d'environ 10 000 yuans) dans tous les horizons, mettant encore plus la pression sur Ideal, le lecteur intelligent AD MAX d'Ideal, qui est plus facile à utiliser qu'avant mais gratuit, peut aider prenez plus de commandes multiples. Contrairement à Xpeng et NIO, le KPI idéal de conduite intelligente n'est pas d'obtenir un résultat opérationnel, mais de servir les ventes.Cependant, alors que l'industrie automobile nationale entre dans la phase à élimination directe, l'activité de conduite intelligente de Wei Xiaoli ne peut pas rester longtemps dans un état de amitié.Le coût d'une carte de formation commence à 100 000 yuans et le coût de la main-d'œuvre d'une équipe de mille personnes commence à 1 milliard par an. En tant que l'une des entreprises les plus chères de Wei Xiaoli, Zhijia s'est lancée dans une voie plus gourmande en ressources pour réaliser de grandes choses. succès, mais il est encore plein d’incertitude quant à sa capacité à récolter les fruits d’efforts miraculeux.[1] Hou Xiaodi, l'homme courageux et prudent, Jiazi Guangnian
[2] Parler à Lou Tiancheng de Robotaxi : « Plus L2 est puissant, plus il est éloigné de L4 », Tencent Auto
[3] Tesla simplifie Robotaxi | Conversation avec Hou Cong, co-fondateur de Qingzhou Zhihang, Yunjian Insight