nouvelles

Chauffeurs de taxi, ne paniquez pas. Les programmeurs du secteur de la conduite intelligente perdront plus tôt leur emploi au profit de l’IA.

2024-07-17

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Le « moment GPT » de la conduite intelligente est-il déjà là ?


Auteur | Cao Siqi
modifierJingyu |

Chaque nouvelle technologie passera par différentes étapes depuis sa naissance jusqu'à sa promotion, et fera également face à diverses voix. Afin de trouver la solution technique optimale, les développeurs peuvent renoncer à des années de travail acharné ; tandis que les organisations commerciales se concentrent davantage sur l'évaluation du calendrier de mise en œuvre de la technologie afin de maximiser les avantages au bon moment.

En ce qui concerne la conduite intelligente, les fabricants d'hôtes nationaux présentaient autrefois de profondes différences cognitives. Les partisans estiment que cela peut apporter une expérience « loin devant », tandis que les opposants ont exprimé leur dédain en faisant des remarques telles que « la puanteur technique » et « la conduite autonome est une arnaque ».

En 2024, avec le lancement officiel de la version FSD V12 du logiciel de conduite intelligente de Tesla basé sur le « bout en bout », les attitudes des constructeurs automobiles chinois à l'égard de la conduite intelligente ont enfin commencé à converger.

En prenant comme exemple Wei Xiaoli, représentant des nouvelles forces de la construction automobile, diverses entreprises ont clairement commencé à poursuivre une technologie « de bout en bout ».

Xiaopeng a proposé d'introduire de grands modèles de bout en bout dans les systèmes de conduite intelligents et a déclaré qu'il investirait cette année 4,2 milliards de yuans dans les données de renseignement et de formation, dans le but d'atteindre « l'OTA interne une fois tous les deux jours » à l'avenir. Il s'agit d'une amélioration de l'efficacité qui était inimaginable dans le passé, où l'on comptait sur les humains pour gérer des centaines de milliers de lignes de code de conduite intelligente.

NIO a également récemment restructuré son département R&D sur la conduite intelligente, en fusionnant les équipes traditionnelles de perception et d'échelle en de grandes équipes de modèles. L'objectif est également de promouvoir des itérations de paradigmes basées sur des réseaux de neurones.

Même l'idéal qui a été ridiculisé dans le passé sous le nom de « sélection en usine » a été fréquemment utilisé ces derniers temps pour créer une dynamique en faveur de la recherche et du développement intelligents. Le PDG Li Xiang a personnellement développé la plateforme de recherche et développement « de bout en bout » et a présenté la théorie de la pensée rapide et lente des économistes Nobel pour illustrer que son équipe a trouvé un moyen de résoudre le cas difficile de la conduite autonome.

Alors, pourquoi est-ce si magique de permettre à différents constructeurs de passer du non-consensus au consensus de bout en bout ? Comment cela a-t-il changé le paradigme de l’industrie de la conduite intelligente, et quelles opportunités et quels ajustements cela apportera-t-il ?

01

Le moment GPT pour la conduite intelligente est arrivé

Une raison importante pour laquelle les fabricants nationaux ont rapidement formé un consensus est que Tesla a pris les devants en fournissant une feuille de réponses enviable de bout en bout.

En mars de cette année, Tesla a officiellement lancé la version FSD V12.3 du logiciel de conduite intelligente. Le plus grand changement dans cette version est de faire passer la puissance de l'ensemble du système de conduite intelligente du code écrit par des humains à un grand modèle d'IA basé sur des réseaux de neurones. Musk utilise « Video in to Control out » pour décrire ce nouveau paradigme de travail, c'est-à-dire : l'IA génère directement des opérations de conduite en fonction des informations routières qu'elle « voit », ce qui est souvent appelé « de bout en bout » dans l'industrie -. finir).

Le mois dernier, He Xiaopeng a testé la version FSD V12.3.6 en Californie. Selon ses mots, FSD « gère très bien de nombreuses conditions routières ». C’est le plus grand avantage des réseaux neuronaux d’IA par rapport aux réseaux basés sur le code : ils peuvent améliorer considérablement les capacités d’apprentissage généralisées des systèmes de conduite intelligents dans différentes villes et dans différentes conditions routières.

Traduit en une expression publicitaire et marketing plus familière aux consommateurs nationaux, c'est : il peut être ouvert à l'échelle nationale (à l'échelle mondiale).


Huawei a lancé le slogan « Disponible dans tout le pays » en septembre de l'année dernière | Source : Geek Park

Bien entendu, cette conclusion n’est qu’un bon souhait à ce stade. Dans le processus opérationnel réel, cela nécessite également le soutien et la formation complets de l'infrastructure de l'IA, telle que les données, les algorithmes et la puissance de calcul, pour se rapprocher de l'objectif consistant à « l'IA devenant aussi intelligente qu'un conducteur humain ».

Mais pour les pairs, la version FSD V12 signifie beaucoup. Il vérifie que les réseaux de neurones peuvent réellement remplacer le code écrit par l'homme et même le faire mieux et plus efficacement.

Cela signifie qu'il n'est pas nécessaire d'attendre N ans, le moment ChatGPT dans l'industrie de la conduite intelligente est effectivement arrivé. Pensez à ce qu'Ali Zhang Yong a dit un jour : tous les logiciels valent la peine d'être refaits avec l'IA. FSD V12 a donné à ses pairs une nouvelle direction et une nouvelle confiance : toutes les piles technologiques de conduite intelligente peuvent être refaites de bout en bout.

Lors de la sortie de la version bêta de FSD V12, Musk a déclaré que cette version compressait les 300 000 lignes de code de la version précédente à 2 000 lignes, ce qui équivaut à moins d'un pour cent.

La compétition de conduite intelligente dans la nouvelle pile technologique n’évoluera pas vers des jeux plus anti-innovation et d’involution que quiconque. Si l'efficacité de l'IA peut vraiment atteindre ce que He Xiaopeng dit être une OTA interne tous les deux jours, alors la tactique maritime humaine consistant à écrire des règles une par une et à corriger les bugs peut être déclarée complètement obsolète.

Alors, l’industrie de la conduite intelligente a-t-elle encore besoin d’autant de programmeurs ? L'auteur ne peut pas donner de réponse précise, mais ce qui est certain, c'est que le contenu du travail des programmeurs de conduite intelligente subira également une série de changements. Les programmeurs qui ne peuvent écrire que des règles if else seront très probablement remplacés par l'IA plus tôt que les chauffeurs de taxi et de covoiturage en ligne.

02

piégé dans les données

Dans le « Rapport de recherche de bout en bout sur l'industrie de la conduite autonome » publié le mois dernier par l'institution d'investissement Chentao Capital, seuls 13 % des plus de 30 personnes interrogées dans l'industrie de la conduite autonome ont exprimé une attitude « attentiste » relativement prudente à l'égard de la fin. -à la technologie de bout en bout, et les autres ont exprimé une attitude plus positive de « pré-recherche » ou même d'« engagement total ». Le bout en bout est devenu un consensus parmi les praticiens de l’industrie.

Mais en fait, aucune entreprise (y compris Tesla) ne peut actuellement atteindre le « fondamentalisme de bout en bout ». C'est-à-dire que tous les aspects de la conduite autonome sont concentrés dans le même grand modèle pour obtenir véritablement les mêmes « signaux visuels d'entrée et opérations de sortie de la pédale et du volant » que les humains.

À ce stade, les principaux efforts de la plupart des équipementiers nationaux consistent à ouvrir les modules de perception et de prise de décision. La clé pour y parvenir est d'annuler la définition manuelle des résultats entre les modules et d'utiliser des vecteurs de fonctionnalités pour transmettre des informations sans perte.


Diagramme schématique de l'évolution de l'architecture de la conduite autonome de bout en bout | Source de l'image : Chentao Capital

Avant l’architecture de bout en bout, l’architecture de conduite autonome traditionnelle provenait du domaine de la robotique et était divisée en différents modules tels que la perception, la planification et le contrôle. Différents modules sont développés par différentes équipes et les informations sont principalement transférées entre les modules via des interfaces définies manuellement. Pour donner l’exemple le plus simple, le phénomène de savoir si un véhicule franchit la ligne peut être représenté dans le module de perception traditionnel en utilisant le langage binaire informatique le plus simple.

Le plus grand avantage de l'ouverture des modules de perception et de prise de décision est qu'elle peut couvrir davantage de « scènes en niveaux de gris » qui ne peuvent pas être décrites avec précision par les règles du monde réel. Par exemple, lorsque vous conduisez, vous n'avez pas besoin de connaître la vitesse précise de la voiture qui vous précède ni si elle franchit la ligne. Il vous suffit de faire attention aux changements de position relatifs.

Sur cette base, sur la base de la théorie de l'IA générative, on s'attend à ce que le modèle de réseau neuronal puisse également générer de l'intelligence après une grande quantité d'entrées et devenir un agent d'IA.

La base de tout cela vient des données, qui sont le matériel de formation « alimenté » par le modèle. Cependant, contrairement aux grands modèles linguistiques basés sur du texte, il n'est pas facile pour les modèles de conduite intelligente de trouver suffisamment de données vidéo publiques comme matériel de formation.

Le « Rapport de recherche de bout en bout sur l'industrie de la conduite autonome » susmentionné montre que le plus grand ensemble de données publiques ne contient actuellement que 1 200 heures de données. Selon Musk, en 2023, Tesla a investi près de 40 000 heures de formation vidéo dans les premières étapes de bout en bout.

Par rapport à d’autres constructeurs automobiles, le principal avantage des données de Tesla réside dans le grand nombre de voitures produites en série.

Actuellement, Tesla a livré plus de 6 millions de voitures dans le monde. Cependant, parmi les nouvelles forces chinoises qui déploient activement la conduite intelligente, le nombre de voitures produites en série ne représente qu'une fraction de celui de Tesla. Associée à un SKU minimaliste et cohérent et à un matériel de conduite intelligent entièrement pré-intégré, la collecte de données devient plus facile.

La pratique courante en Chine reposait généralement sur l’acquisition manuelle des informations routières. Cependant, pour former un modèle intelligent de bout en bout, il est également nécessaire de couvrir suffisamment de données provenant de scénarios de pointe (cas conner). Étant donné que l'apparition de scènes de bord est très aléatoire, certains fabricants ont déclaré que seulement 2 % environ des données limitées peuvent être obtenues par la seule collecte manuelle de données.

De plus, par rapport à Tesla, les fabricants nationaux proposent souvent des SKU plus complexes. Entre les différents modèles, en raison des différences de taille du véhicule, de disposition des capteurs, etc., les paramètres pertinents du modèle doivent également être réalignés.

En prenant la série Huawei comme exemple, Hongmeng Zhixing a démontré de solides capacités de vente de terminaux au cours de la dernière année. Cependant, pour différentes marques et modèles de services de la BU automobile Huawei, des ingénieurs sont encore nécessaires après la mise en œuvre de bout en bout. travaux d’alignement et de livraison. Il en va de même pour Weilai, qui compte 2 marques et 9 modèles. Ils ont réorganisé l'équipe d'intégration en équipe de livraison.


Après la sortie de Sora, Musk a tweeté que Tesla utilise l'IA pour simuler la conduite dans le monde réel. Source de l'image : capture d'écran X |

Certains pensent que les produits vidéo Wensheng représentés par Sora pourraient devenir la source de matériel pour les modèles de bout en bout. Mais même pour Musk, la formation de l’IA avec du contenu généré par l’IA n’a pas encore été publiquement reconnue. Après tout, les données sont trop importantes pour la formation de modèles. Vous savez, Musk, qui a toujours été extrêmement avare en termes de coûts de main d'œuvre, a également embauché une équipe de 1 000 personnes à New York pour annoter les données vidéo routières de Tesla.

03

Ne vous laissez pas « entraîner dans le fossé » par Musk

Il semble que passer à une approche de bout en bout soit une chose naturelle, mais supprimer 300 000 lignes de code et démanteler et réorganiser l’ancienne structure organisationnelle n’est certainement pas une décision facile à prendre. En fait, même Musk s’est engagé dans cette voie par accident. L'ingénieur qui lui a proposé pour la première fois fin 2022 d'apprendre ChatGPT pour construire un réseau neuronal de conduite intelligente a failli être muté par Lao Ma pour résoudre d'autres problèmes après l'acquisition de Twitter.

Après avoir entraîné le modèle de bout en bout, le système de support correspondant (y compris la puissance de calcul, etc.) doit également être suffisamment efficace. Dans une interview avec "Tencent Deep Web", Ren Shaoqing, vice-président de la recherche et du développement de la conduite intelligente chez NIO, a déclaré que forcer des services de bout en bout sans capacités de base équivaut à utiliser un "poison".

Il a déclaré : « Si la structure de votre code d'origine est suffisamment claire, votre volume de test (de débogage) peut n'être que de 1 %. Auparavant, il vous fallait trois jours pour retester 1 %, mais maintenant je suis désolé, vous devez retester 100 %. dans trois jours. Votre système de vérification des données doit donc être suffisamment efficace.

Mais ne vous laissez pas entraîner directement dans le fossé par Tesla. De bout en bout pour le moment, cela prouve seulement qu'il a la possibilité d'améliorer l'efficacité du travail, mais cela ne prouve pas qu'il s'agit de la solution ultime à la conduite autonome.

Cela est cohérent avec la compréhension de l'industrie quant à savoir si la loi de mise à l'échelle peut conduire à l'AGI (Intelligence artificielle générale) dans le monde physique : il est certain que l'intelligence artificielle générative peut avoir une intelligence supérieure, mais si elle peut comprendre automatiquement les lois physiques et les applications dans la conduite automobile. , la robotique et d'autres domaines, il n'y a pas de règles dans la communauté universitaire. Dans le « Rapport de recherche sur l'industrie de la conduite autonome de bout en bout », plus de la moitié des praticiens ne croient pas que le bout en bout soit la solution ultime pour la technologie de conduite autonome.

Pour les équipementiers qui développent leur propre conduite intelligente, l’approche la plus pragmatique à ce stade consiste à s’appuyer sur une mise en œuvre de bout en bout des capacités de conduite intelligente aussi rapidement, facilement et de la manière la plus rentable possible. Quant à l’abonnement au logiciel de conduite intelligente, le trajet peut prendre plus de temps. Après tout, sur le marché chinois, le matériel se vend souvent mieux que les logiciels et les services.

Bien sûr, il est fort probable que peu de gens souhaitent devenir des joueurs innovants comme Musk. Si vous laissez un bon modèle low-cost sans recherche et développement et pariez gros sur Robotaxi, la valeur marchande chutera de centaines de milliards de dollars si la sortie est retardée. Les joueurs les plus ordinaires espèrent simplement qu'équipés d'un logiciel de conduite intelligente de bout en bout, cela pourra aider le matériel à mieux se vendre. Bien sûr, s’il pouvait être vendu plus cher, ce serait la chose la plus merveilleuse.

*Source de l'image d'en-tête : Visual China

Cet article est un article original de Geek Park Pour une réimpression, veuillez contacter Geek Jun sur WeChat geekparkGO.

Geek a demandé

Le rôle des programmeurs dans la future industrie de la conduite intelligente,

Quels changements pourraient survenir ?

16 juillet. Lei Jun a posté : Ce vendredi 19 juillet à 19 heures, je prononcerai le 5e discours annuel de Lei Jun. Le thème est "Courage" et je parlerai des tenants et des aboutissants de la construction d'une voiture ainsi que des hauts et des bas. les trois dernières années.

Aimez et suivezCompte vidéo Geek Park