Νέα

Οδηγοί ταξί, μην πανικοβάλλεστε Οι προγραμματιστές στον κλάδο της έξυπνης οδήγησης θα χάσουν τη δουλειά τους νωρίτερα.

2024-07-17

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Είναι ήδη εδώ η «στιγμή GPT» της έξυπνης οδήγησης;


Συγγραφέας |
επεξεργασία|. Jingyu

Κάθε νέα τεχνολογία θα περάσει από διαφορετικά στάδια από τη γέννηση έως την προώθηση, και θα αντιμετωπίσει επίσης διάφορες φωνές. Προκειμένου να βρεθεί η βέλτιστη τεχνική λύση, οι προγραμματιστές μπορεί να εγκαταλείψουν την πολυετή σκληρή δουλειά, ενώ οι εμπορικοί οργανισμοί επικεντρώνονται περισσότερο στην αξιολόγηση του χρόνου εφαρμογής της τεχνολογίας προκειμένου να μεγιστοποιήσουν τα οφέλη τη σωστή στιγμή.

Όσον αφορά την έξυπνη οδήγηση, οι εγχώριοι κατασκευαστές οικοδεσποτών είχαν κάποτε βαθιές γνωστικές διαφορές. Οι υποστηρικτές πιστεύουν ότι μπορεί να φέρει μια «πολύ μπροστά» εμπειρία, ενώ οι αντίπαλοι έχουν εκφράσει την περιφρόνησή τους κάνοντας παρατηρήσεις όπως «τεχνική βρώμα» και «η αυτόνομη οδήγηση είναι απάτη».

Το 2024, με την επίσημη κυκλοφορία της έκδοσης FSD V12 του λογισμικού έξυπνης οδήγησης της Tesla που βασίζεται στο «από άκρο σε άκρο», οι στάσεις των κινεζικών αυτοκινητοβιομηχανιών για την έξυπνη οδήγηση άρχισαν επιτέλους να συγκλίνουν.

Λαμβάνοντας ως παράδειγμα τον Wei Xiaoli, εκπρόσωπο των νέων δυνάμεων στην κατασκευή αυτοκινήτων, διάφορες εταιρείες ξεκάθαρα έχουν αρχίσει να επιδιώκουν την τεχνολογία "από άκρο σε άκρο".

Η Xiaopeng πρότεινε την εισαγωγή μεγάλων μοντέλων από άκρο σε άκρο σε έξυπνα συστήματα οδήγησης και δήλωσε ότι θα επενδύσει 4,2 δισεκατομμύρια γιουάν σε δεδομένα νοημοσύνης και εκπαίδευσης φέτος, με στόχο την επίτευξη «εσωτερικών OTA μία φορά κάθε δύο ημέρες» στο μέλλον. Αυτή είναι μια βελτίωση της απόδοσης που ήταν αδιανόητη στο παρελθόν, η οποία βασιζόταν στους ανθρώπους για τη διατήρηση εκατοντάδων χιλιάδων γραμμών έξυπνου κώδικα οδήγησης.

Η NIO έχει επίσης αναδιαρθρώσει πρόσφατα το τμήμα Έρευνας και Ανάπτυξης της έξυπνης οδήγησης, συγχωνεύοντας τις παραδοσιακές ομάδες αντίληψης και κλίμακας σε μεγάλες ομάδες μοντέλων.

Ακόμη και το ιδανικό που γελοιοποιήθηκε ως «εργοστασιακή συλλογή» στο παρελθόν έχει χρησιμοποιηθεί συχνά για να οικοδομήσει δυναμική για έξυπνη έρευνα και ανάπτυξη τα τελευταία χρόνια. Ο Διευθύνων Σύμβουλος Li Xiang ανέπτυξε προσωπικά την πλατφόρμα έρευνας και ανάπτυξης "από άκρο σε άκρο" και εισήγαγε τη θεωρία γρήγορης αργής σκέψης των οικονομολόγων του Νόμπελ για να δείξει ότι η ομάδα του βρήκε έναν τρόπο να λύσει την υπόθεση της αυτόνομης οδήγησης.

Λοιπόν, γιατί είναι τόσο μαγικό να επιτρέπουμε σε διάφορους κατασκευαστές να περνούν από τη μη συναίνεση στη συναίνεση από άκρο σε άκρο; Πώς άλλαξε το παράδειγμα της βιομηχανίας έξυπνης οδήγησης και ποιες ευκαιρίες και προσαρμογές θα φέρει;

01

Η στιγμή του GPT για έξυπνη οδήγηση έφτασε

Ένας σημαντικός λόγος για τον οποίο οι εγχώριοι κατασκευαστές σχημάτισαν γρήγορα συναίνεση είναι ότι η Tesla πρωτοστάτησε στην παράδοση ενός αξιοζήλευτου φύλλου απαντήσεων από άκρο σε άκρο.

Τον Μάρτιο του τρέχοντος έτους, η Tesla παρουσίασε επίσημα την έκδοση λογισμικού έξυπνης οδήγησης FSD V12.3. Η μεγαλύτερη αλλαγή σε αυτήν την έκδοση είναι να αλλάξει η ισχύς ολόκληρου του συστήματος ευφυούς οδήγησης από κώδικα που γράφτηκε από ανθρώπους σε ένα μεγάλο μοντέλο AI που βασίζεται σε νευρωνικά δίκτυα. Ο Μασκ χρησιμοποιεί το "Video in to Control out" για να περιγράψει αυτό το νέο παράδειγμα εργασίας, δηλαδή: Η τεχνητή νοημοσύνη εξάγει απευθείας λειτουργίες οδήγησης με βάση τις πληροφορίες δρόμου που "βλέπει", οι οποίες συχνά αποκαλούνται "από άκρο σε άκρο" στη βιομηχανία. να τελειωσει).

Τον περασμένο μήνα, ο He Xiaopeng γνώρισε την έκδοση FSD V12.3.6 στην Καλιφόρνια. Σύμφωνα με τα λόγια του, η FSD «χειρίζεται πολλές οδικές συνθήκες πολύ ομαλά». Αυτό είναι το μεγαλύτερο πλεονέκτημα των νευρωνικών δικτύων τεχνητής νοημοσύνης σε σύγκριση με εκείνα που βασίζονται σε κώδικα: μπορεί να βελτιώσει σημαντικά τις δυνατότητες γενικευμένης μάθησης των ευφυών συστημάτων οδήγησης σε διαφορετικές πόλεις και υπό διαφορετικές συνθήκες δρόμου.

Μεταφρασμένο σε μια φράση διαφήμισης και μάρκετινγκ πιο οικεία στους εγχώριους καταναλωτές, είναι: μπορεί να ανοίξει πανελλαδικά (παγκόσμια).


Η Huawei κυκλοφόρησε το σλόγκαν «Διαθέσιμο σε εθνικό επίπεδο» τον Σεπτέμβριο του περασμένου έτους Πηγή: Geek Park

Φυσικά, αυτό το συμπέρασμα είναι απλώς μια καλή ευχή σε αυτή τη φάση. Στην πραγματική διαδικασία λειτουργίας, απαιτεί επίσης την πλήρη υποστήριξη και εκπαίδευση της υποδομής τεχνητής νοημοσύνης, όπως δεδομένα, αλγόριθμοι και υπολογιστική ισχύς για να πλησιάσει ο στόχος «η τεχνητή νοημοσύνη να γίνει τόσο έξυπνος όσο ένας άνθρωπος οδηγός».

Αλλά για τους ομοτίμους, η έκδοση FSD V12 σημαίνει πολλά. Επαληθεύει ότι τα νευρωνικά δίκτυα μπορούν πραγματικά να αντικαταστήσουν τον κώδικα που γράφεται από τον άνθρωπο και μάλιστα να το κάνουν καλύτερα και πιο αποτελεσματικά.

Αυτό σημαίνει ότι δεν χρειάζεται να περιμένετε για N χρόνια, η στιγμή του ChatGPT στη βιομηχανία της έξυπνης οδήγησης έφτασε στην πραγματικότητα. Σκεφτείτε τι είπε κάποτε ο Ali Zhang Yong: Όλο το λογισμικό αξίζει να το ξανακάνετε με AI. Το FSD V12 έχει δώσει στους συναδέλφους μια νέα κατεύθυνση και εμπιστοσύνη: όλες οι στοίβες τεχνολογίας έξυπνης οδήγησης μπορούν να επαναληφθούν από άκρη σε άκρη.

Όταν κυκλοφόρησε η έκδοση beta του FSD V12, ο Μασκ είπε ότι αυτή η έκδοση συμπίεσε τις 300.000 γραμμές κώδικα της προηγούμενης έκδοσης σε 2.000 γραμμές, που ισοδυναμεί με λιγότερο από ένα τοις εκατό.

Ο ανταγωνισμός έξυπνης οδήγησης στη νέα στοίβα τεχνολογίας δεν θα εξελιχθεί σε περισσότερα παιχνίδια κατά της καινοτομίας και της involution από οποιονδήποτε άλλο. Εάν η αποτελεσματικότητα της τεχνητής νοημοσύνης μπορεί πραγματικά να φτάσει σε αυτό που είπε ο He Xiaopeng ότι είναι μια εσωτερική OTA κάθε δύο ημέρες, τότε η τακτική της ανθρώπινης θάλασσας να γράφει κανείς κανόνες έναν προς έναν και να διορθώνει σφάλματα μπορεί να κηρυχθεί εντελώς ξεπερασμένη.

Άρα η βιομηχανία της έξυπνης οδήγησης χρειάζεται ακόμα τόσους προγραμματιστές; Ο συγγραφέας δεν μπορεί να δώσει ακριβή απάντηση, αλλά το σίγουρο είναι ότι και το εργασιακό περιεχόμενο των προγραμματιστών έξυπνης οδήγησης θα υποστεί μια σειρά αλλαγών. Οι προγραμματιστές που μπορούν να γράψουν μόνο εάν άλλοι κανόνες θα αντικατασταθούν πιθανότατα από την τεχνητή νοημοσύνη νωρίτερα από τους οδηγούς ταξί και διαδικτυακών οδηγών.

02

παγιδευμένο σε δεδομένα

Στην «End-to-End Autonomous Driving Industry Research Report» που κυκλοφόρησε από το επενδυτικό ίδρυμα Chentao Capital τον περασμένο μήνα, μόνο το 13% από περισσότερους από 30 ερωτηθέντες στον κλάδο της αυτόνομης οδήγησης εξέφρασε μια σχετικά επιφυλακτική στάση «αναμονής και προβολής» προς το τέλος. -to-end technology , και τα υπόλοιπα εξέφρασαν μια πιο θετική στάση «προ-έρευνας» ή ακόμα και «πλήρης δέσμευση». Το από άκρο σε άκρο έχει γίνει μια συναίνεση μεταξύ των επαγγελματιών του κλάδου.

Αλλά στην πραγματικότητα, δεν υπάρχει προς το παρόν καμία εταιρεία (συμπεριλαμβανομένης της Tesla) που να μπορεί να επιτύχει «φονταμενταλισμό από άκρο σε άκρο». Δηλαδή, όλες οι πτυχές της αυτόνομης οδήγησης συγκεντρώνονται στο ίδιο μεγάλο μοντέλο για να επιτύχουν πραγματικά τα ίδια "οπτικά σήματα εισόδου και λειτουργίες πεντάλ εξόδου και τιμονιού" με τους ανθρώπους.

Οι βασικές προσπάθειες των περισσότερων εγχώριων OEM σε αυτό το στάδιο είναι να ανοίξουν τις ενότητες αντίληψης και λήψης αποφάσεων. Το κλειδί για αυτό είναι να ακυρώσετε τον μη αυτόματο ορισμό των αποτελεσμάτων μεταξύ των λειτουργικών μονάδων και να χρησιμοποιήσετε διανύσματα χαρακτηριστικών για τη μετάδοση πληροφοριών χωρίς απώλειες.


Σχηματικό διάγραμμα της εξέλιξης της αρχιτεκτονικής της αυτόνομης οδήγησης από άκρο σε άκρο Πηγή εικόνας: Chentao Capital

Πριν από το τέλος σε άκρο, η παραδοσιακή αρχιτεκτονική αυτόνομης οδήγησης προερχόταν από τον τομέα της ρομποτικής και χωρίστηκε σε διαφορετικές ενότητες όπως η αντίληψη, ο σχεδιασμός και ο έλεγχος. Διαφορετικές ενότητες αναπτύσσονται από διαφορετικές ομάδες και οι πληροφορίες μεταφέρονται κυρίως μεταξύ των μονάδων μέσω διεπαφών που ορίζονται με το χέρι. Για να δώσουμε το απλούστερο παράδειγμα, το φαινόμενο εάν ένα όχημα κινείται κατά μήκος της γραμμής μπορεί να αναπαρασταθεί στην παραδοσιακή μονάδα αντίληψης χρησιμοποιώντας την απλούστερη δυαδική γλώσσα υπολογιστή.

Το μεγαλύτερο όφελος από το άνοιγμα των ενοτήτων αντίληψης και λήψης αποφάσεων είναι ότι μπορεί να καλύψει περισσότερες "σκηνές σε κλίμακα του γκρι" που δεν μπορούν να περιγραφούν με ακρίβεια από κανόνες στον πραγματικό κόσμο. Για παράδειγμα, όταν οδηγείτε, δεν χρειάζεται να γνωρίζετε την ακριβή ταχύτητα του προπορευόμενου αυτοκινήτου ή εάν διασχίζει τη γραμμή, χρειάζεται μόνο να προσέχετε τις σχετικές αλλαγές θέσης.

Σε αυτή τη βάση, με βάση τη θεωρία της γενετικής τεχνητής νοημοσύνης, αναμένεται ότι το μοντέλο νευρωνικών δικτύων μπορεί επίσης να δημιουργήσει νοημοσύνη μετά από μεγάλη ποσότητα εισόδου και να γίνει πράκτορας AI.

Η βάση όλων αυτών προέρχεται από δεδομένα, που είναι το εκπαιδευτικό υλικό που «τροφοδοτείται» στο μοντέλο. Ωστόσο, σε αντίθεση με τα μεγάλα μοντέλα γλώσσας που βασίζονται σε κείμενο, δεν είναι εύκολο για τα έξυπνα μοντέλα οδήγησης να βρουν αρκετά δημόσια δεδομένα βίντεο ως εκπαιδευτικό υλικό.

Η προαναφερθείσα «Έρευνα Έρευνας Βιομηχανίας Αυτόνομης Οδήγησης από άκρο σε άκρο» δείχνει ότι το μεγαλύτερο σύνολο δημόσιων δεδομένων έχει επί του παρόντος μόνο 1.200 ώρες δεδομένων. Σύμφωνα με τον Musk το 2023, η Tesla επένδυσε σχεδόν 40.000 ώρες εκπαίδευσης βίντεο στα πρώτα στάδια της end-to-end.

Σε σύγκριση με άλλες εταιρείες αυτοκινήτων, το κύριο πλεονέκτημα των δεδομένων της Tesla έγκειται στον μεγάλο αριθμό αυτοκινήτων μαζικής παραγωγής.

Επί του παρόντος, η Tesla έχει παραδώσει περισσότερα από 6 εκατομμύρια αυτοκίνητα σε όλο τον κόσμο, ωστόσο, μεταξύ των νέων δυνάμεων της Κίνας που αναπτύσσουν ενεργά την έξυπνη οδήγηση, ο αριθμός των αυτοκινήτων μαζικής παραγωγής είναι μόνο ένα κλάσμα του Tesla. Σε συνδυασμό με το σταθερό μινιμαλιστικό SKU και το πλήρως ενσωματωμένο έξυπνο υλικό οδήγησης, η συλλογή δεδομένων γίνεται ευκολότερη.

Η προηγούμενη κοινή πρακτική στην Κίνα βασιζόταν συνήθως στη χειροκίνητη απόκτηση οδικών πληροφοριών. Ωστόσο, για την εκπαίδευση ενός έξυπνου μοντέλου από άκρο σε άκρο, είναι επίσης απαραίτητο να καλύπτονται αρκετά δεδομένα από σενάρια ακμών (conner case). Δεδομένου ότι η εμφάνιση σκηνών ακμών είναι πολύ τυχαία, ορισμένοι κατασκευαστές έχουν δηλώσει ότι μόνο το 2% των περιορισμένων δεδομένων μπορεί να ληφθεί μόνο με τη μη αυτόματη συλλογή δεδομένων.

Επιπλέον, σε σύγκριση με την Tesla, οι εγχώριοι κατασκευαστές έχουν συχνά πιο πολύπλοκα SKU. Μεταξύ διαφορετικών μοντέλων, λόγω διαφορών στο μέγεθος του οχήματος, στη διάταξη των αισθητήρων κ.λπ., οι σχετικές παράμετροι στο μοντέλο πρέπει επίσης να ευθυγραμμιστούν εκ νέου.

Λαμβάνοντας ως παράδειγμα τη σειρά Huawei, η Hongmeng Zhixing έχει επιδείξει ισχυρές δυνατότητες πωλήσεων τερματικών κατά το περασμένο έτος, ωστόσο, για διαφορετικές μάρκες και μοντέλα των υπηρεσιών BU αυτοκινήτου της Huawei, χρειάζονται ακόμα μηχανικοί μετά την εφαρμογή από άκρο σε άκρο εργασίες ευθυγράμμισης και παράδοσης. Το ίδιο ισχύει για την Weilai, η οποία έχει 2 μάρκες και 9 μοντέλα. Έχουν αναδιοργανώσει την ομάδα ενσωμάτωσης στην ομάδα παράδοσης.


Μετά την κυκλοφορία του Sora, ο Μασκ έγραψε στο Twitter ότι η Tesla χρησιμοποιεί τεχνητή νοημοσύνη για να προσομοιώσει την οδήγηση σε πραγματικό κόσμο Πηγή εικόνας: Στιγμιότυπο οθόνης X

Υπάρχει η άποψη ότι τα προϊόντα βίντεο Wensheng που αντιπροσωπεύει ο Sora μπορεί να γίνουν η πηγή υλικού για μοντέλα από άκρο σε άκρο. Αλλά ακόμη και για τον Μασκ, η εκπαίδευση της τεχνητής νοημοσύνης με περιεχόμενο που δημιουργείται από AI δεν έχει ακόμη αναγνωριστεί δημόσια. Εξάλλου, τα δεδομένα δεδομένων είναι πολύ σημαντικά για την εκπαίδευση μοντέλων. Ξέρετε, ο Μασκ, ο οποίος ήταν πάντα εξαιρετικά τσιγκούνης με το κόστος εργασίας, προσέλαβε επίσης μια ομάδα 1.000 ατόμων στη Νέα Υόρκη για να σχολιάσει τα δεδομένα βίντεο δρόμου του Tesla.

03

Μην σας «οδηγήσει στο χαντάκι» ο Μασκ

Φαίνεται ότι η μετάβαση από άκρο σε άκρο είναι κάτι φυσικό, αλλά η διαγραφή 300.000 γραμμών κώδικα και η αποσυναρμολόγηση και η αναδιοργάνωση της προηγούμενης οργανωτικής δομής σίγουρα δεν είναι εύκολη απόφαση. Μάλιστα, ακόμη και ο Μασκ ξεκίνησε αυτό το μονοπάτι τυχαία. Ο μηχανικός που του πρότεινε για πρώτη φορά στα τέλη του 2022 να μάθει το ChatGPT για να δημιουργήσει ένα ευφυές νευρωνικό δίκτυο, σχεδόν μεταφέρθηκε από τον Λάο Μα για να λύσει άλλα προβλήματα μετά την εξαγορά του Twitter.

Μετά την εκπαίδευση του μοντέλου από άκρο σε άκρο, το αντίστοιχο σύστημα υποστήριξης (συμπεριλαμβανομένης της υπολογιστικής ισχύος κ.λπ.) πρέπει επίσης να είναι αρκετά αποδοτικό. Σε συνέντευξή του στο "Tencent Deep Web", ο Ren Shaoqing, αντιπρόεδρος έρευνας και ανάπτυξης έξυπνης οδήγησης του NIO, είπε ότι η εξαναγκασμός υπηρεσιών από άκρο σε άκρο χωρίς βασικές δυνατότητες ισοδυναμεί με τη χρήση "δηλητηρίου".

Είπε: "Εάν η αρχική δομή του κώδικά σας είναι αρκετά σαφής, ο όγκος δοκιμών (εντοπισμός σφαλμάτων) μπορεί να είναι μόνο 1%. Παλιά σας έπαιρνε τρεις ημέρες για να δοκιμάσετε ξανά το 1%, αλλά τώρα λυπάμαι, πρέπει να επαναλάβετε τη δοκιμή 100% Σε τρεις ημέρες, λοιπόν, το σύστημα επαλήθευσης των δεδομένων σας πρέπει να είναι αρκετά αποτελεσματικό.

Αλλά μην οδηγηθείτε απευθείας στο χαντάκι από την Tesla αυτή τη στιγμή μόνο αποδεικνύει ότι έχει τη δυνατότητα να βελτιώσει την απόδοση της εργασίας, αλλά δεν αποδεικνύει ότι είναι η απόλυτη λύση για την αυτόνομη οδήγηση.

Αυτό είναι σύμφωνο με την αντίληψη του κλάδου για το εάν ο νόμος κλιμάκωσης μπορεί να οδηγήσει σε AGI (Γενική Τεχνητή Νοημοσύνη) στον φυσικό κόσμο: είναι βέβαιο ότι η γενετική τεχνητή νοημοσύνη μπορεί να έχει υψηλότερη νοημοσύνη, αλλά αν μπορεί να κατανοήσει τους φυσικούς νόμους και αυτόματα Για εφαρμογές στην οδήγηση , ρομποτικής και άλλων τομέων, δεν υπάρχουν κανόνες στην ακαδημαϊκή κοινότητα. Στην «End-to-End Autonomous Driving Industry Research Report», περισσότεροι από τους μισούς επαγγελματίες δεν πιστεύουν ότι το end-to-end είναι η απόλυτη λύση για την τεχνολογία αυτόνομης οδήγησης.

Για τους ΚΑΕ που αναπτύσσουν τη δική τους έξυπνη οδήγηση, η πιο ρεαλιστική προσέγγιση σε αυτό το στάδιο είναι να βασίζονται στην εφαρμογή από άκρο σε άκρο των δυνατοτήτων έξυπνης οδήγησης όσο το δυνατόν πιο γρήγορα, εύκολα και οικονομικά. Όσον αφορά τη συνδρομή στο λογισμικό έξυπνης οδήγησης, μπορεί να χρειαστεί μεγαλύτερο ταξίδι. Εξάλλου, στην κινεζική αγορά, το υλικό συχνά πωλεί καλύτερα από το λογισμικό και τις υπηρεσίες.

Φυσικά, υπάρχει μεγάλη πιθανότητα να μην θέλουν πολλοί να γίνουν καινοτόμοι παίκτες όπως ο Μασκ. Εάν αφήσετε ένα καλό μοντέλο χαμηλού κόστους χωρίς έρευνα και ανάπτυξη και κάνετε ένα μεγάλο στοίχημα στο Robotaxi, η αγοραία αξία θα μειωθεί κατά εκατοντάδες δισεκατομμύρια δολάρια εάν καθυστερήσει η κυκλοφορία. Οι περισσότεροι απλοί παίκτες ελπίζουν απλώς ότι εξοπλισμένο με λογισμικό έξυπνης οδήγησης από άκρο σε άκρο, μπορεί να βοηθήσει το υλικό να πουλήσει καλύτερα. Φυσικά, αν μπορεί να πουληθεί πιο ακριβά, αυτό θα ήταν το πιο υπέροχο πράγμα.

*Πηγή εικόνας κεφαλίδας: Visual China

Αυτό το άρθρο είναι ένα πρωτότυπο άρθρο από το Geek Park Για επανέκδοση, επικοινωνήστε με το Geek Jun στο WeChat geekparkGO

ρώτησε ο Γκικ

Ο ρόλος των προγραμματιστών στη μελλοντική βιομηχανία έξυπνης οδήγησης,

Τι αλλαγές μπορεί να συμβούν;

16 Ιουλίου. Ο Lei Jun δημοσίευσε: Στις 19:00, στις 19 Ιουλίου, αυτή την Παρασκευή το βράδυ, θα πραγματοποιήσω την 5η ετήσια ομιλία του Lei Jun Το θέμα είναι "Θάρρος" και θα μιλήσω για τα μυστικά της κατασκευής ενός αυτοκινήτου και τα σκαμπανεβάσματα του. τα τελευταία τρία χρόνια.

Κάντε like και followΛογαριασμός βίντεο Geek Park