τα στοιχεία επικοινωνίας μου
ταχυδρομείο[email protected]
2024-09-25
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
μπορεί πραγματικά η αυτόνομη οδήγηση να πραγματοποιηθεί;
η ανθρωπότητα έχει καταναλώσει αμέτρητο χρόνο και χρήμα για την ανάπτυξη της αυτόνομης οδήγησης. σήμερα, τα συχνά ατυχήματα, η ατελείωτη καύση χρημάτων και η αργή πρόοδος έχουν προκαλέσει πολλές σύγχυση και ερωτήματα: είναι η οδήγηση χωρίς οδηγό απάτη ή ακόμα, είναι νεκρή η βιομηχανία;
αυτή η βιομηχανία είναι πραγματικά μια από τις πιο διχασμένες βιομηχανίες που έχω δει ποτέ, κάθε φατρία έχει διαφορετικές απόψεις, κοιτάζει ο ένας τον άλλον και κατηγορεί ο ένας τον άλλον, αφού οι θεοί τσακώνονται, όλοι ακολουθούν τον δικό τους δρόμο. και να νικήσει ο ένας τον άλλον ο καθένας ξοδεύει τα λεφτά του.
το αποτέλεσμα είναι ότι η οδήγηση χωρίς οδηγό θα μπει στον κρύο χειμώνα πριν από το 2024.
αλλά αυτόν τον κρύο χειμώνα, καθώς ο musk ισχυρίζεται ότι έχει ανακατασκευάσει το fsd της tesla «μέσω τεχνολογίας ai από άκρο σε άκρο» και ανακοίνωσε ότι θα εισέλθει στη βιομηχανία αυτόνομων ταξί (robaxi), φαίνεται να υπάρχει κάποια νέα ζωντάνια και ελπίδα.
μπορεί το end-to-end να μας οδηγήσει στην πραγματική οδήγηση χωρίς οδηγό; τα l2 και l4 ορίζονται στην αυτόνομη οδήγηση πολύ μακριά το ένα από το άλλο; πού έχει αναπτυχθεί σήμερα η τεχνολογία χωρίς οδηγό; είναι πραγματικά ατελείωτη η μάχη μεταξύ καθαρής όρασης και πολυτροπικότητας;
προκειμένου να εξερευνήσουμε πώς αναπτύσσεται η βιομηχανία αυτόνομης οδήγησης, περάσαμε τρεις μήνες παίρνοντας συνεντεύξεις με τις πιο σύγχρονες εταιρείες αυτόνομης οδήγησης στην παγκόσμια αγορά, συμπεριλαμβανομένων πρώην βασικών υπαλλήλων της waymo και της cruise, πρώην μηχανικών της tesla fsd και επενδυτών της πρωτογενούς και δευτερογενούς αγοράς υπάρχουν έως και δέκα επαγγελματίες στον κλάδο της αυτόνομης οδήγησης.
διαπιστώσαμε ότι ο κλάδος εξακολουθεί να είναι κατακερματισμένος και δεν υπάρχει συναίνεση στον κλάδο σε πολλές τεχνικές διαδρομές.
σε αυτήν τη σειρά άρθρων, θα εξερευνήσουμε την κατάσταση αιχμής της σημερινής τεχνολογίας αυτόνομης οδήγησης από πολλαπλές προοπτικές, όπως η αντίληψη, οι αλγόριθμοι, τα προϊόντα, οι λειτουργίες, τα οικονομικά και ο νόμος.
σε αυτό το άρθρο, πρώτα θα μιλήσουμε για την τεχνολογία αναλυτικά και στο επόμενο τεύχος θα την αναλύσουμε από λειτουργική και οικονομική άποψη.
1. τι είναι η αυτόνομη οδήγηση;
ας κάνουμε πρώτα μια εννοιολογική διάκριση: ποια είναι η διαφορά μεταξύ οδήγησης χωρίς οδηγό και αυτόνομης οδήγησης;
σύμφωνα με τον βαθμό ευφυΐας, η αυτόνομη οδήγηση χωρίζεται σε 6 επίπεδα από l0 έως l5:
l0 σημαίνει χωρίς αυτοματισμό, l1 σημαίνει υποβοήθηση οδήγησης, l2 σημαίνει μερική αυτόματη οδήγηση, l3 σημαίνει αυτόματη οδήγηση υπό όρους, l4 σημαίνει εξαιρετικά αυτόματη οδήγηση και l5 σημαίνει πλήρως αυτόματη οδήγηση, δηλαδή αληθινή οδήγηση χωρίς οδηγό.
το waymo και το cruise, που αναφέραμε αργότερα, και τα μη επανδρωμένα φορτηγά που κατασκεύασε ο hou xiaodi, ανήκουν στο επίπεδο l4 της tesla, αλλά το tesla robotaxi που ισχυρίζεται ο musk είναι l4.
ως εκ τούτου, αυτή τη στιγμή σε αυτόν τον κλάδο, όταν οι άνθρωποι μιλούν για αυτόνομη οδήγηση, αναφέρονται γενικά σε εταιρείες l4, επειδή κανείς δεν μπορεί να επιτύχει ακόμη το l5 και γενικά, η αυτόνομη οδήγηση περιλαμβάνει όλα τα επίπεδα και είναι πιο γενική.
ας ρίξουμε μια ματιά στο πώς ξεκίνησε η βιομηχανία της αυτόνομης οδήγησης.
αν και οι άνθρωποι άρχισαν να εξερευνούν την αυτόνομη οδήγηση ήδη πριν από 100 χρόνια, αναγνωρίζεται ότι η σύγχρονη αυτόνομη οδήγηση ξεκίνησε επίσημα από την πρόκληση darpa του στρατού των ηπα το 2004.
μετά από αρκετά χρόνια ανάπτυξης, διαμορφώθηκε ένας λειτουργικός σύνδεσμος αντίληψης-σχεδιασμού-ελέγχου. η ενότητα αντίληψης περιλαμβάνει αντίληψη και πρόβλεψη.
το επίπεδο αντίληψης πρέπει να αποκτήσει τις μελλοντικές συνθήκες του δρόμου μέσω αισθητήρων όπως ραντάρ και κάμερες, να προβλέψει τις τροχιές κίνησης των αντικειμένων και να δημιουργήσει έναν χάρτη του περιβάλλοντος περιβάλλοντος σε πραγματικό χρόνο, που είναι η κοινή οπτική γωνία που βλέπουμε στα αυτοκίνητα και μηχανές, και στη συνέχεια περνούν αυτές τις πληροφορίες στο επίπεδο σχεδιασμού το σύστημα καθορίζει την ταχύτητα και την κατεύθυνση με βάση τον αλγόριθμο και τελικά μεταφέρεται στο επίπεδο ελέγχου εκτέλεσης για τον έλεγχο του αντίστοιχου γκαζιού, του φρένου και του συστήματος διεύθυνσης.
αργότερα, με την άνοδο της τεχνητής νοημοσύνης, οι άνθρωποι άρχισαν να αφήνουν το μηχάνημα να μάθει πώς να οδηγεί μόνο του .
τα τελευταία δύο χρόνια, καθώς η tesla εφάρμοσε τη λύση «από άκρο σε άκρο» στην έκδοση fsd v12, ο λειτουργικός σύνδεσμος αντίληψης-σχεδιασμού-ελέγχου άρχισε επίσης να αλλάζει.
στη συνέχεια, θα επικεντρωθούμε στο να μιλήσουμε για τις δύο τεχνικές διαδρομές της βιομηχανίας αυτόνομης οδήγησης σε επίπεδο αντίληψης: το καθαρό οπτικό σχολείο και το πολυτροπικό σχολείο σύντηξης ας μιλήσουμε για τα παράπονα και τα μίση τους.
2. perception: pure vision vs multi-modal fusion
επί του παρόντος, υπάρχουν δύο κύριες λύσεις αντίληψης για τα αυτοκίνητα.
η πρώτη είναι μια πολυτροπική λύση ανίχνευσης σύντηξης που υιοθετήθηκε από πολλές εταιρείες, η οποία συγκεντρώνει και συγχωνεύει πληροφορίες που συλλέγονται από αισθητήρες όπως lidar, ραντάρ κυμάτων χιλιοστών, αισθητήρες υπερήχων, κάμερες και μονάδες αδρανειακής μέτρησης για τον προσδιορισμό του περιβάλλοντος περιβάλλοντος.
επιστρέφοντας στο darpa challenge που αναφέραμε στο προηγούμενο κεφάλαιο, στην πρώτη συνεδρία το 2004, αν και κανένα όχημα δεν τερμάτισε τον αγώνα, ένας διαγωνιζόμενος ονόματι david hall συνειδητοποίησε τη σημασία του lidar κατά τη διάρκεια του διαγωνισμού, η velodyne, η εταιρεία αυτός ιδρύθηκε, άρχισε να μετατοπίζεται από το audio στο lidar.
εκείνη την εποχή, το lidar σάρωνε με μία μόνο γραμμή και μπορούσε να μετρήσει την απόσταση μόνο προς μία κατεύθυνση.
αργότερα, πήρε αυτό το περιστρεφόμενο lidar για να συμμετάσχει στο δεύτερο darpa challenge το 2005. τελικά ένα αυτοκίνητο με 5 λίνταρ στο κεφάλι τερμάτισε τον αγώνα και κατέκτησε το πρωτάθλημα.
αλλά αυτό δεν ήταν το αυτοκίνητο του david hall... το αυτοκίνητό του αποσύρθηκε στη μέση της διαδρομής λόγω μηχανικής βλάβης, αλλά η απόδοσή του έκανε τους πάντες να συνειδητοποιήσουν ότι το lidar είναι ένα "plug-in".
στην τρίτη πρόκληση darpa το 2007, πέντε από τις έξι ομάδες που τερμάτισαν τον διαγωνισμό χρησιμοποίησαν το lidar του velodyne. σε αυτό το σημείο, η lidar έχει αρχίσει να γίνεται δημοφιλής στον κλάδο της αυτόνομης οδήγησης και η velodyne έχει γίνει επίσης η κορυφαία εταιρεία στην αυτοκινητοβιομηχανία lidar.
zhang hang (ανώτερος διευθυντής επιστήμονας στην cruise):
τώρα, είτε πρόκειται για cruise είτε για waymo, ορισμένες λύσεις που βασίζονται στο l4 βασίζονται κυρίως στο lidar, το οποίο μπορεί να λάβει άμεσα πληροφορίες τοποθεσίας σε αυτήν την περίπτωση, οι απαιτήσεις για τον ίδιο τον αλγόριθμο θα είναι σχετικά χαμηλές και, στη συνέχεια, υπάρχουν πολλές πληροφορίες this 3d. μπορεί να ληφθεί απευθείας μέσω αισθητήρων, οι οποίοι θα βελτιώσουν τη στιβαρότητα και την ασφάλεια του συστήματος και θα διευκολύνουν ορισμένα προβλήματα με τη μακριά ουρά.
μια άλλη τεχνική φατρία είναι η καθαρά οπτική λύση που αντιπροσωπεύει η tesla, η οποία βασίζεται μόνο σε κάμερες για τη συλλογή περιβαλλοντικών πληροφοριών και στη συνέχεια χρησιμοποιεί νευρωνικά δίκτυα για να μετατρέψει 2d βίντεο σε χάρτες 3d, οι οποίοι περιλαμβάνουν εμπόδια και προβλέψεις του περιβάλλοντος περιβάλλοντος πληροφορίες.
σε σύγκριση με τη λύση lidar που δημιουργεί απευθείας τρισδιάστατους χάρτες, η καθαρή όραση έχει μια πρόσθετη διαδικασία μετατροπής 2d σε 3d κατά την άποψη του zhang hang, η καθαρά βασισμένη σε δεδομένα εκπαίδευσης «βίντεο» που στερούνται τρισδιάστατων πληροφοριών θα φέρει ορισμένες προκλήσεις στην ασφάλεια.
zhang hang (ανώτερος διευθυντής επιστήμονας στην cruise):
απαιτείται μεγάλος όγκος δεδομένων εκπαίδευσης για την εκμάθηση της έλλειψης τρισδιάστατων πληροφοριών. εάν είναι εντελώς μέσω αυτής της ημι-επίβλεψης, νομίζω ότι είναι πιο δύσκολο να επιτευχθεί η ασφάλεια του συστήματος με βάση τη μέθοδο εκμάθησης. νομίζω ότι ο κύριος σκοπός της tesla είναι να ελέγχει το κόστος, συμπεριλαμβανομένης της τροποποίησης κάποιων μηχανισμών αλλαγής ταχυτήτων, για να εξοικονομήσει κόστος σε ορισμένα μέρη.
όμως, σύμφωνα με τον yu zhenhua, πρώην μηχανικό ai στην tesla, η επιλογή καθαρής όρασης δεν σημαίνει μόνο εξοικονόμηση κόστους.
1. περισσότερα ίσον χάος;
yu zhenhua (πρώην μηχανικός ai της tesla):
στην πραγματικότητα, το αρχικό σύστημα αυτόματου πιλότου της tesla είχε ραντάρ κυμάτων χιλιοστών η σύντηξη αισθητήρων είναι στην πραγματικότητα ένας πολύ περίπλοκος αλγόριθμος, αλλά δεν είναι απαραίτητα καλός όταν κατασκευάζεται.
είχα ένα αυτοκίνητο εκείνη την εποχή που ήταν ένα από τα τελευταία αυτοκίνητα που είχαν ραντάρ κυμάτων χιλιοστών. το 2023, το αυτοκίνητό μου υποβλήθηκε σε συντήρηση και ο μηχανικός σέρβις αφαίρεσε αυτόματα το ραντάρ μου. ποιο είναι το συμπέρασμα αυτού του θέματος; η αφαίρεση του ραντάρ κυμάτων χιλιοστού δεν είναι για λόγους κόστους, επειδή το αυτοκίνητό μου έχει ήδη εκεί ένα ραντάρ κυμάτων χιλιοστού. ο βασικός λόγος είναι ότι η καθαρή όραση έχει ξεπεράσει το ραντάρ κυμάτων χιλιοστών. ο τέσλα λοιπόν κάνει αφαίρεση, αφαιρώντας κάποια περιττά πράγματα που πιστεύει ότι είναι περιττά ή δυσκίνητα πράγματα.
ο yu zhenhua πιστεύει ότι,εάν ο αλγόριθμος σύντηξης δεν γίνει καλά ή εάν η καθαρή όραση μπορεί να επιτύχει αρκετά καλά αποτελέσματα, τότε περισσότεροι αισθητήρες θα γίνουν επιβάρυνση.
πολλοί επαγγελματίες l4 από τους οποίους πήραμε συνέντευξη συμφώνησαν επίσης ότι περισσότερες πληροφορίες δεν είναι καλύτερες.
είναι λοιπόν δυνατόν να βασιστούμε αποκλειστικά στον αισθητήρα της κάμερας που πάντα υποστήριζε ο μασκ;
2. less is more;
ο μασκ είπε ότι αφού οι άνθρωποι μπορούν να οδηγήσουν μόνο με δύο μάτια, τα αυτοκίνητα μπορούν επίσης να επιτύχουν αυτόνομη οδήγηση με βάση μόνο τις πληροφορίες εικόνας, ωστόσο, η ανησυχία της βιομηχανίας για τα καθαρά οπτικά στοιχεία ήταν πάντα η οπτική εξαπάτηση, η οποία πράγματι έφερε λιγότερα ατυχήματα.
για παράδειγμα, η tesla αναγνωρίζει ένα λευκό φορτηγό ως τον ουρανό και το φεγγάρι ως κίτρινο φως ή το ideal αναγνωρίζει το περιεχόμενο σε μια διαφημιστική πινακίδα ως αυτοκίνητο, προκαλώντας ατυχήματα όπως ξαφνικό φρενάρισμα και οπίσθιες συγκρούσεις σε υψηλές ταχύτητες.
σημαίνουν αυτές οι περιπτώσεις ότι οι καθαρές οπτικές λύσεις χωρίς πληροφορίες βάθους έχουν εγγενείς ελλείψεις;
yu zhenhua (πρώην μηχανικός ai της tesla):
πολλές ροές πληροφοριών μπορούν πράγματι να παρέχουν περισσότερες πληροφορίες, αλλά πρέπει να απαντήσετε σε μια ερώτηση, η ίδια η κάμερα δεν έχει αρκετές πληροφορίες; ή είναι ανεπαρκής η ικανότητα του αλγορίθμου να εξορύσσει πληροφορίες;
για παράδειγμα, όταν φρενάρετε ξαφνικά ή αισθάνεστε απογοήτευση όταν οδηγείτε σε αστικούς δρόμους, η βασική αιτία είναι στην πραγματικότητα η ανεπαρκής εκτίμηση της ταχύτητας των γύρω αντικειμένων και η ανεπαρκής γωνία του παροχή εάν παρέχετε πιο άμεσες πληροφορίες, η ίδια η κάμερα σας δίνει στην πραγματικότητα πληροφορίες, αλλά ο αλγόριθμός μας δεν είναι αρκετά καλός για να ανακαλύψει τέτοιες πληροφορίες.
ο yu zhenhua δεν πιστεύει ότι η βασική αιτία της οπτικής εξαπάτησης είναι οι ανεπαρκείς πληροφορίες από την κάμερα, αλλά ότι ο αλγόριθμος είναι ανεπαρκής για την επεξεργασία ή την εξόρυξη των πληροφοριών που δίνονται από την κάμερα. πιστεύει ότι, ειδικά μετά την κυκλοφορία του αλγόριθμου fsd v12 της tesla, έχει αποδειχθεί ότι όταν ο αλγόριθμος έχει βελτιστοποιηθεί σημαντικά, η εξόρυξη και η επεξεργασία των πληροφοριών της κάμερας έχουν βελτιωθεί σημαντικά.
yu zhenhua (πρώην μηχανικός ai της tesla):
το σημερινό fsd v12 δεν είναι τέλειο, υπάρχουν πολλά προβλήματα, αλλά δεν έχω βρει μέχρι στιγμής ποιο πρόβλημα οφείλεται σε ανεπαρκείς αισθητήρες. βέβαια πριν από το v12 πολλά προβλήματα οφείλονταν σε ανεπαρκείς αισθητήρες, αλλά το σημερινό v12 δεν έχει αυτό το πρόβλημα.
ωστόσο, οι επαγγελματίες του l4 έχουν διαφορετική οπτική. πιστεύουν ότι οι κάμερες έχουν φυσικά μειονεκτήματα.
zhang hang (ανώτερος διευθυντής επιστήμονας στην cruise):
προσωπικά πιστεύω ότι είναι δύσκολο και δεν νομίζω ότι είναι απαραίτητα πρόβλημα με τον ίδιο τον αλγόριθμο.
πρώτα απ 'όλα, η ίδια η κάμερα δεν είναι τόσο περίπλοκη όσο το ανθρώπινο μάτι κάθε κάμερα έχει κάποιες παραμέτρους και τους περιορισμούς της.
στη συνέχεια, υπάρχει ο ίδιος ο αλγόριθμος που οι άνθρωποι δεν χρειάζεται να γνωρίζουν πού κινούνται όλα τα αυτοκίνητα σε απόσταση 200 μέτρων οι πόντοι είναι αρκετοί και δεν χρειάζομαι μεγάλη υπολογιστική ισχύ. μπορεί να μην είναι δυνατό να φτάσω σε αυτό το ύψος μέσω αλγορίθμων βραχυπρόθεσμα.
ο zhang hang, ο οποίος ασχολείται με την έρευνα l4, πιστεύει ότι οι κάμερες δεν μπορούν να ταιριάξουν με το ανθρώπινο μάτι. ταυτόχρονα, η λειτουργία άλματος σκέψης των ανθρώπινων όντων δεν μπορεί να εφαρμοστεί βραχυπρόθεσμα στους υπολογιστές, επομένως το lidar μπορεί να χρησιμοποιηθεί για να συμπληρώσει τις ελλείψεις των καμερών.
ωστόσο, υπάρχουν και άλλες απόψεις στην αγορά, οι οποίες πιστεύουν ότι εκτός από οπτικές πληροφορίες, άλλοι αισθητήρες θα φέρουν και πληροφορίες παρεμβολών.
για παράδειγμα, το lidar έχει επίσης τις δικές του ελλείψεις, καθώς χρησιμοποιεί ακτινοβολία λέιζερ, όταν αντιμετωπίζει κάποια ανακλαστικά αντικείμενα, βροχή ή χιόνι ή λέιζερ που εκπέμπονται από άλλα αυτοκίνητα, θα επηρεάσει το lidar και τελικά θα προκαλέσει απατηλά αποτελέσματα.
liu bingyan (επικεφαλής του λογισμικού kargo):
είμαι ένας πολύ σταθερός καθαρός οπτικός άνθρωπος οι πληροφορίες παρέχουν παρεμβολές και η πραγματική αξία που παρέχει, τι είδους διανομή είναι; νομίζω ότι όσο τα γραφικά γίνονται όλο και καλύτερα, μπορεί να συμβαίνει το εντελώς αντίθετο.
εάν μπορεί να αναπτυχθεί ένας αλγόριθμος σύντηξης πολλών αισθητήρων για να επιτρέψει στις πληροφορίες lidar και εικόνας να επαληθεύονται η μία την άλλη, η ασφάλεια του συστήματος μπορεί να βελτιωθεί περαιτέρω.
ο hou xiaodi πρότεινε μια ζωντανή μεταφορά:όταν δύο μαθητές του ίδιου επιπέδου δίνουν τις εξετάσεις, αυτός που χρησιμοποιεί μια αριθμομηχανή θα έχει πιο εύκολο χρόνο στο τέλος, είναι απλώς η οικονομική βάση που καθορίζει αν μπορεί να αντέξει οικονομικά μια αριθμομηχανή.
η συζήτηση μεταξύ καθαρής όρασης και πολυτροπικών λύσεων σύντηξης που βασίζονται στο lidar συνεχίζεται εδώ και αρκετά χρόνια και φαίνεται ότι δεν θα υπάρξει απάντηση βραχυπρόθεσμα. ήγια ορισμένες νεοφυείς επιχειρήσεις, η διαδρομή δεν είναι καθόλου σημαντική, αλλά το κόστος και οι οικονομικοί λογαριασμοί είναι τα πιο σημαντικά.
hou xiaodi (πρώην ιδρυτής και διευθύνων σύμβουλος της tusimple, ιδρυτής της bot.auto):
παλιά με θεωρούσαν οπτικό άτομο επειδή το lidar δεν ήταν διαθέσιμο εκείνη την εποχή, οπότε αναγκαστήκαμε να βρούμε περισσότερες οπτικές λύσεις.
δεν είμαι και κατά του lidar?πότε το lidar έγινε φτηνό.το lidar είναι πραγματικά φθηνό τώρα, οπότε είμαι και εγώ στην ουρά για να αγοράσω lidar για μένα, είναι μια καλή γάτα που πιάνει το ποντίκι. εφόσον το κόστος αυτής της συσκευής είναι αρκετά χαμηλό και εφόσον αυτή η συσκευή μπορεί να μας παρέχει επαρκώς πολύτιμες πληροφορίες από την άποψη της θεωρίας πληροφοριών, θα πρέπει να τη χρησιμοποιούμε.
david (παρουσιαστής του "big horses talking about technology"):
ο αυτόνομος κύκλος οδήγησης της κίνας έκανε γρήγορα αυτό το υλικό, όπως το lidar και το ραντάρ κυμάτων χιλιοστού, διαθέσιμο σε τιμές λάχανου. σε αυτή την κατάσταση, πρέπει να κάνουμε ακόμα καθαρή όραση όπως η tesla; στην πραγματικότητα, πολλές εταιρείες διστάζουν τώρα να αγοράσω ένα lidar στερεάς κατάστασης για περισσότερα από 1.000 γιουάν ή να χρησιμοποιήσω καθαρή όραση, αλλά θα προκαλέσει μεγάλη σπατάλη στην υπολογιστική ισχύ.
yu zhenhua (πρώην μηχανικός ai της tesla):
νομίζω ότι τα 1.000 γιουάν είναι πολύ ακριβά και η tesla δεν είναι καν πρόθυμη να χρησιμοποιήσει αισθητήρα βροχής.
wang chensheng (πρώην διευθυντής προμηθειών της tesla):
αλλά νομίζω ότι καθώς η κλίμακα της εφοδιαστικής αλυσίδας αυξάνεται και το κόστος μειώνεται σημαντικά, όταν το lidar μπορεί να επιτύχει τιμή παρόμοια με αυτή των καμερών, ειδικά σε ένα σενάριο εφαρμογής από άκρο σε άκρο, εξακολουθεί να είναι η καθαρή όραση μια μοναδική διαδρομή;
3. μετάνοια;
είναι ενδιαφέρον ότι καθώς η τιμή του lidar έχει μειωθεί σημαντικά, η βιομηχανία έχει αρχίσει να διαφωνεί για το αν το επερχόμενο αυτόνομα ταξί της tesla θα χρησιμοποιεί lidar.
για παράδειγμα, ο zhang hang πιστεύει ότι εφόσον το robotaxi δεν απαιτεί ανθρώπινη παρέμβαση και αν κάτι πάει στραβά, η εταιρεία πρέπει να είναι υπεύθυνη, η tesla μπορεί να επιλέξει μια πιο συντηρητική διαδρομή και να χρησιμοποιήσει το lidar, το οποίο κάποτε περιφρονούσε.
zhang hang (ανώτερος διευθυντής επιστήμονας στην cruise):
ειδικά όταν χρειάζεται να είναι υπεύθυνο για εταιρικά ατυχήματα, πρέπει να είναι πιο συντηρητικό και νομίζω ότι μπορεί να χρειαστεί ένας επιπλέον αισθητήρας. από αυτή την άποψη, η tesla μπορεί να υιοθετήσει ορισμένες τεχνολογίες που προηγουμένως περιφρονούσε.όσο αυτό το πράγμα είναι χρήσιμο και μπορεί να πετύχει τον σκοπό του l4, θα το υιοθετήσει σταδιακά.
πρόσφατα, ανακαλύψαμε επίσης ότι η tesla εξετάζει επίσης ορισμένες πτυχές των l4 και l5, και μιλά επίσης για συνεργασία με ορισμένους κατασκευαστές αυτού του lidar, οπότε μπορεί να φτάσει ο καθένας στον ίδιο στόχο από διαφορετικούς δρόμους.
φέτος, η εταιρεία lidar luminar δημοσίευσε την οικονομική της έκθεση για το πρώτο τρίμηνο, δείχνοντας ότι οι παραγγελίες της tesla έφτασαν το 10%, καθιστώντας την τον μεγαλύτερο πελάτη της. αλλά ο yu zhenhua διαφώνησε, νομίζοντας ότι αυτό δεν ήταν κάτι καινούργιο.
yu zhenhua (πρώην μηχανικός ai της tesla):
πρώτα απ 'όλα, σίγουρα δεν είναι για χρήση του lidar σε μελλοντικά αυτοκίνητα μαζικής παραγωγής, επειδή τα συνολικά έσοδα της luminar το πρώτο τρίμηνο φαίνεται να είναι 20 εκατομμύρια δολάρια ηπα και το 10% είναι 2 εκατομμύρια, τα οποία δεν αρκούν για την εγκατάσταση πολλών lidars. στην πραγματικότητα, δεν είναι μυστικό ότι τα μηχανικά οχήματα και τα οχήματα δοκιμής της tesla είναι εξοπλισμένα με lidar το lidar χρησιμοποιείται για τη συλλογή αληθειών της γης (στοιχεία πραγματικών τιμών) για την εκπαίδευση των νευρωνικών δικτύων, επειδή οι άνθρωποι δεν μπορούν να σημειώσουν πόσα μέτρα μακριά είναι ένα αντικείμενο από εσάς. για τη σήμανση πρέπει να χρησιμοποιούνται ειδικοί αισθητήρες.
αλλά γιατί η lumina το αποκάλυψε αυτό το πρώτο τρίμηνο, είμαι πραγματικά πολύ μπερδεμένος, επειδή ο μασκ απάντησε επίσης εκείνη τη στιγμή, λέγοντας ότι αφού φτάσουμε στο v12, δεν χρειαζόμαστε δεδομένα πραγματικής αξίας επειδή είναι από άκρο σε άκρο και καταλαμβάνει δίκτυο αυτό είναι ένα θέμα της εποχής του v11, νομίζω ότι υπάρχουν κάποιες παρεξηγήσεις εδώ, δηλαδή από τις οικονομικές εκθέσεις ή τους οικονομικούς κανόνες.
αν και δεν είναι προς το παρόν αβέβαιο εάν το επερχόμενο robotaxi της tesla θα είναι εξοπλισμένο με lidar, ένα είναι βέβαιο ότι με την τρέχουσα διαμόρφωση αισθητήρων της tesla, η ασφάλεια δεν είναι αρκετή για να φτάσει στο l4 ή να λειτουργήσει ένα robotaxi.
liu bingyan (επικεφαλής του λογισμικού kargo):
είμαι πολύ σίγουρος ότι τα υπάρχοντα μοντέλα της tesla έχουν πολύ καθαρά τυφλά σημεία, τα οποία είναι τυφλά σημεία που δεν είναι οπτικά προσβάσιμα, και αυτό το τυφλό σημείο θα προκαλέσει εάν θέλει να πετύχει την απόλυτη, είτε πρόκειται για αυτόνομη οδήγηση l4 είτε l5, το επόμενο αυτοκίνητο πρέπει να λύσει αυτό το πρόβλημα στο τυφλό σημείο.
θα καταργήσουμε λεπτομερώς την τελευταία end-to-end τεχνολογική ενημέρωση της tesla στα κεφάλαια 3 και 4, καθώς και εικασίες σχετικά με τις λεπτομέρειες του robotaxi που θα ανακοινωθούν τον οκτώβριο. στη συνέχεια, ας συζητήσουμε πρώτα μια άλλη σημαντική τεχνολογία στην αντίληψη: χάρτες υψηλής ακρίβειας.
4. διαχρονικό;
εκτός από το lidar, οι χάρτες υψηλής ακρίβειας αποτελούν επίσης σημαντική πηγή κόστους για το αισθητήριο τέλος της αυτόνομης οδήγησης.
οι χάρτες υψηλής ακρίβειας συλλέγουν εκ των προτέρων πληροφορίες για το δρόμο, μειώνουν την πίεση στη μονάδα αντίληψης για τη σχεδίαση τρισδιάστατων χαρτών και βελτιώνουν την ακρίβεια.
συμπτωματικά, το πρώτο άτομο που προώθησε χάρτες υψηλής ακρίβειας ήταν ο sebastian thrun, ο πρωταθλητής του δεύτερου darpa challenge το 2005, ο ιδιοκτήτης αυτοκινήτου με πέντε lidar στο κεφάλι του.
κατά τη διάρκεια του darpa challenge, η google ετοίμαζε το έργο "street view" προσωπικά, ο ιδρυτής της google, για να εντοπίσει ταλέντα, το 2005, ο πέιτζ πλησίασε τον sebastian thrun και τον προσκάλεσε σχεδιάζοντας τον χάρτη του δόθηκε.
στην πορεία, ο thrun και η page συνειδητοποίησαν ξαφνικά,εάν υπάρχει ένας χάρτης που μπορεί να καταγράψει με ακρίβεια όλες τις γραμμές λωρίδων, τα οδικά σήματα, τα φανάρια και άλλες πληροφορίες για το δρόμο, θα βοηθήσει πολύ στην αυτόνομη οδήγηση., που καθιερώνει επίσης τη σημαντική θέση των χαρτών υψηλής ακρίβειας σε έργα αυτόνομης οδήγησης.
ωστόσο, η παραγωγή χαρτών υψηλής ακρίβειας είναι πολύ δαπανηρή το μέσο κόστος για τις εταιρείες αυτόνομης οδήγησης για τη συλλογή χαρτών υψηλής ακρίβειας είναι περίπου 5.000 $ ανά χιλιόμετρο εάν θέλουν να καλύψουν 6,6 εκατομμύρια χιλιόμετρα δρόμων στις ηνωμένες πολιτείες θα φτάσει τα 3,3 δισεκατομμύρια δολάρια ηπα.
σε συνδυασμό με το συχνό κόστος συντήρησης του χάρτη, η τελική κατανάλωση θα είναι αφάνταστα αστρονομική.
πολλές εταιρείες αυτοκινήτων προωθούν τώρα λύσεις χωρίς χάρτη που εγκαταλείπουν τους χάρτες υψηλής ακρίβειας και αντ' αυτού χρησιμοποιούν οχήματα για την κατασκευή περιβαλλοντικών χαρτών σε τοπικό επίπεδο.
ένας μηχανικός αυτόνομης οδήγησης που πήραμε ανώνυμα είπε ότι αυτές οι συγκρίσεις και η δημοσιότητα οφείλονται περισσότερο σε εκτιμήσεις επιχειρηματικού μοντέλου για τις εταιρείες που δραστηριοποιούνται στο robotaxi, η χρήση χαρτών υψηλής ακρίβειας μπορεί να αυξήσει την ασφάλεια.για τις εταιρείες αυτοκινήτων, η εγκατάλειψη χαρτών υψηλής ακρίβειας μπορεί να μειώσει αποτελεσματικά το κόστος, επομένως δεν σημαίνει ότι η εγκατάλειψη των χαρτών υψηλής ακρίβειας θα οδηγήσει σε υψηλότερο τεχνικό επίπεδο.
ανώνυμος ερωτώμενος (μηχανικός l4):
η huawei έχει επίσης μια ιδανική λύση είναι ένα αυτοκίνητο μαζικής παραγωγής.
το κύριο όριο για τον κύριο χάρτη υψηλής ακρίβειας είναι ότι απαιτεί μια διαδικασία συλλογής χαρτών.
έτσι, αν ασχολείστε με τη μαζική παραγωγή αυτοκινήτων, δεν μπορείτε να πείτε ότι έχω ένα αποκλειστικό αυτοκίνητο συλλογής χαρτών και ότι έχω ταξιδέψει σε όλη την κίνα για εσάς.
οι εταιρείες l2 όπως η tesla, η huawei και η ideal εγκατέλειψαν τους χάρτες υψηλής ακρίβειας επειδή δεν μπορούσαν να καλύψουν κάθε δρόμο και στενό.
ενώ η waymo και η cruise το έκαναν αυτό, η εταιρεία l4 της robotaxi επέλεξε να συνεχίσει να χρησιμοποιεί χάρτες υψηλής ακρίβειας επειδή διαπίστωσαν ότιχρειάζεται μόνο να καλύψουμε μερικές βασικές πόλεις για να κατακτήσουμε αρκετές αγορές.
επομένως, η χρήση χαρτών υψηλής ακρίβειας γίνεταιτο οικονομικό λογιστικό πρόβλημα της robotaxi δεν είναι τεχνικό πρόβλημα.
minfa wang (πρώην ανώτερος μηχανικός μηχανικής μάθησης waymo):
εάν κοιτάξετε μόνο το επιχειρηματικό μοντέλο του robotaxi και διαιρέσετε τη ζήτηση για robotaxi στις ηνωμένες πολιτείες, θα διαπιστώσετε ότι οι πέντε κορυφαίες πόλεις αντιπροσωπεύουν ήδη το ήμισυ του εμπορικού όγκου στις ηνωμένες πολιτείες οπουδήποτε στις ηνωμένες πολιτείες, στην πραγματικότητα, έχετε ήδη μια αρκετά μεγάλη αγορά.
ομοίως, ένας άλλος επισκέπτης που πήραμε συνέντευξη, ο οποίος εργάζεται σε αυτόνομα φορτηγά l4 μοιράστηκε επίσης ότι εάν θέλουν να επεκτείνουν τις διαδρομές λειτουργίας τους, δηλαδή να επεκτείνουν την κάλυψη χαρτών υψηλής ακρίβειας, πρέπει πρώτα να μετρήσουν εάν αυτή η διαδρομή είναι κερδοφόρα, διαφορετικά απλά θα βγάλει χρήματα με ζημιά.
μετά από έναν τέτοιο γύρο συνομιλίας, δεν υπάρχει ενιαία άποψη στη βιομηχανία από την πλευρά της αντίληψης όπως είπε ο hou xiaodi, μια γάτα είναι καλή γάτα αν πιάνει ποντίκια.
στη συνέχεια, ας εστιάσουμε στην πρόσφατη πρόοδο στους αλγόριθμους αυτόνομης οδήγησης που όλοι προσέχουν πρόσφατα, ειδικά στον «από άκρο σε άκρο» που προώθησε πρόσφατα η tesla; θα αλλάξει πραγματικά την κατεύθυνση της βιομηχανίας της αυτόνομης οδήγησης;
3. αλγόριθμος: είναι από άκρο σε άκρο το μέλλον της αυτόνομης οδήγησης;
1. τι είναι παράδοση;
ο παραδοσιακός σύνδεσμος λειτουργίας της αυτόνομης οδήγησης είναι πρώτα η αίσθηση, η πρόβλεψη, μετά το σχεδιασμό και τελικά ο έλεγχος.
η μονάδα αντίληψης πρέπει πρώτα να αναγνωρίσει το δρόμο μέσω αισθητήρων όπως κάμερες και ραντάρ, να μεταφράσει αυτές τις πληροφορίες σε μια γλώσσα που μπορεί να δει το μηχάνημα και να τις μεταβιβάσει στη μονάδα πρόβλεψης.
το μοντέλο πρόβλεψης θα κρίνει τις τροχιές οδήγησης άλλων οχημάτων και πεζών, στη συνέχεια θα διαβιβάσει αυτές τις πληροφορίες στη μονάδα σχεδιασμού για να βρει τη διαδρομή με τον χαμηλότερο κίνδυνο και, τέλος, θα περάσει το σήμα ελέγχου στο σύστημα ελέγχου.
ο αλγόριθμος αυτή τη στιγμή καθοδηγείται κυρίως από τη "βάση κανόνων" οι μηχανικοί πρέπει να γράφουν συνεχώς διάφορους κανόνες, όπως επιβράδυνση όταν συναντούν πεζούς, σταματούν στα κόκκινα φανάρια κ.λπ. προκειμένου να ληφθούν υπόψη διάφορες καταστάσεις, η βάση κανόνων. πρέπει να καλύψετε κάθε πιθανότητα όσο το δυνατόν περισσότερο, και κατά συνέπεια, ο κωδικός είναι πολύ, πολύ μεγάλος.
ποιες είναι οι δυσκολίες με έναν τέτοιο αλγόριθμο;
το μεγαλύτερο πρόβλημα είναι ότι το σύστημα χωρίζεται σε διαφορετικές ενότητες, αλλά η μετάδοση πληροφοριών μεταξύ των μονάδων θα χαθεί, εάν η κατάντη δεν μπορεί να λάβει ολοκληρωμένες πληροφορίες, η δυσκολία πρόβλεψης και προγραμματισμού θα αυξηθεί.
για να δώσουμε ένα απλό και κατανοητό παράδειγμα, όλοι έχουν ακούσει για το παιχνίδι τηλεμεταφοράς πολλών παικτών, σωστά; 10 άτομα παραδίδουν μια πρόταση από την αρχή μέχρι το τέλος, αλλά συχνά οι λεπτομέρειες χάνονται ή αλλοιώνονται κατά τη διαδικασία της παράδοσης από πολλά άτομα, έτσι ώστε το νόημα να είναι εντελώς διαφορετικό όταν φτάνει στο τελευταίο άτομο.
ομοίως, στο παραδοσιακό μοντέλο που βασίζεται σε κανόνες, εάν η μονάδα ανώτερου επιπέδου δεν τα πάει αρκετά καλά, θα επηρεάσει την απόδοση του επόμενου επιπέδου.
ένα άλλο μειονέκτημα είναι ότι όλοι οι κανόνες σχεδιάζονται και ορίζονται από ανθρώπους, αλλά οι περιορισμένοι κανόνες δεν μπορούν να καλύψουν άπειρες πιθανές καταστάσεις της πραγματικής ζωής. η «θήκη μακριάς ουράς» ονομάζεται επίσης «γωνιακή θήκη», η οποία θα οδηγήσει σε πολύ υψηλό κόστος για μεγάλης κλίμακας υλοποίηση.
yu zhenhua (πρώην μηχανικός ai της tesla):
ένα άλλο πράγμα είναι ότι όταν χωρίζεται σε δύο ενότητες, νομίζω ότι αυτή η τεχνολογία είναι δύσκολο να κλιμακωθεί. κάθε φορά που προσθέτετε μια νέα εργασία σε μια ρεαλιστική πολύπλοκη σκηνή, πρέπει να προσθέτετε μερικές νέες διεπαφές και πρέπει να αλλάζετε τον σχεδιασμό αντίληψης και ελέγχου.
πάρτε για παράδειγμα την tesla πριν από μερικά χρόνια, η nhtsa (η διοίκηση ασφάλειας μεταφορών) ζήτησε από την tesla να ανιχνεύσει οχήματα έκτακτης ανάγκης, όπως τα πυροσβεστικά οχήματα και τα ασθενοφόρα πρέπει να το κάνετε αυτό είναι μόνο μια εργασία. μπορεί να υπάρχουν εκατοντάδες ή χιλιάδες τέτοιες εργασίες. περίπου 6.000 μηχανικοί, γιατί θα έχετε τόσα πολλά νέα καθήκοντα που εμφανίζονται.
david (παρουσιαστής του "big horses talking about technology"):
αυτή η μέθοδος είναι ακόμα σχετικά παλιομοδίτικη αν και φαίνεται να είναι μια πιο ευέλικτη μεθοδολογία για τη βιομηχανία robotaxi, δεν μπορεί να καλύψει τις ανάγκες των επιβατικών αυτοκινήτων και εκατομμυρίων οχημάτων που κινούνται σε δρόμους σε όλο τον κόσμο στο μέλλον.
ποιες είναι λοιπόν οι λύσεις σε αυτά τα προβλήματα; αυτή τη στιγμή, πρέπει να μιλήσουμε για το «end to end».
2. νέοι σούπερ σταρ
στον τομέα της αυτόνομης οδήγησης, ο τρέχων βασικός ορισμός του "από άκρο σε άκρο" είναι:οι πληροφορίες που συλλέγονται από τον αισθητήρα μεταβιβάζονται στο μεγάλο μοντέλο που βασίζεται στο νευρωνικό δίκτυο χωρίς καμία επεξεργασία και τα αποτελέσματα ελέγχου εξάγονται απευθείας.
με άλλα λόγια, δεν χρειάζεται να γράψετε με μη αυτόματο τρόπο διάφορους κανόνες και να αφήσετε τον αλγόριθμο να μάθει πώς να οδηγεί μόνος του σύμφωνα με τα δεδομένα που του τροφοδοτούνται.
yu zhenhua (πρώην μηχανικός ai της tesla):
γιατί όταν οδηγούμε εμείς οι άνθρωποι, δεν κρίνουμε την ταχύτητα και τη γωνία ενός συγκεκριμένου αυτοκινήτου στο μυαλό μας εσείς παίρνετε τις αποφάσεις σας υποσυνείδητα μέσα από ένα περίπλοκο περιβάλλον.
η λογική σκέψης του "να κάνουμε τους αλγόριθμους περισσότερο σαν ανθρώπους, γιατί έτσι λειτουργούν οι άνθρωποι" είναι ακριβώς η κατεύθυνση του musk για την κορυφαία tesla tesla.
αν και η tesla θα κυκλοφορήσει το fsd v12 χρησιμοποιώντας "end-to-end" για πρώτη φορά στα τέλη του 2023, το "end-to-end" δεν είναι κάτι καινούργιο στον κόσμο της αυτόνομης οδήγησης. μάλιστα, ήδη από το 2016, η nvidia είχε ένα χαρτί που πρότεινε "από άκρο σε άκρο".
τώρα, το "από άκρο σε άκρο" χωρίζεται επίσης σε δύο τύπους το ένα είναι να αντικαταστήσετε ορισμένες μονάδες με νευρωνικά δίκτυα κάθε μονάδα για να μεταφέρετε πληροφορίες μεταξύ τους, πρέπει να καθοριστούν διάφορες διεπαφές, προκαλώντας απώλεια δεδομένων.
στην κύρια προβολή, μόνο όταν πολλαπλές ενότητες ενσωματωθούν σε ένα σύνολο και αφαιρεθούν οι ορισμοί του επιπέδου αντίληψης, του επιπέδου πρόβλεψης και του επιπέδου σχεδιασμού, μπορεί να θεωρηθεί καθαρά "από άκρο σε άκρο".
το 2023, το καλύτερο έγγραφο του cvpr "planning-oriented autonomous driving" πρότεινε ότι το παρελθόν "από άκρο σε άκρο" είτε έτρεχε μόνο σε ορισμένες μονάδες είτε απαιτούσε την εισαγωγή ορισμένων στοιχείων στο σύστημα.
αυτή η εργασία προτείνει την αρχιτεκτονική του μοντέλου uniad, η οποία είναι η πρώτη φορά που όλες οι μονάδες ανίχνευσης, πρόβλεψης και σχεδιασμού ενσωματώνονται σε ένα πλαίσιο δικτύου από άκρο σε άκρο που βασίζεται στο transformer.
σε σύγκριση με τον παραδοσιακό σύνδεσμο εκτέλεσης που βασίζεται σε κανόνες (οδηγείται από κανόνες), το "από άκρο σε άκρο" δεν απαιτεί πλέον από τους μηχανικούς αλγορίθμων να βελτιώνουν επανειλημμένα τη βάση κανόνων, οπότε όταν ο μασκ κυκλοφόρησε το fsd v12, ισχυρίστηκε ότι "ο κώδικάς του έχει αυξηθεί από 300.000 γραμμές μειώθηκε σε 2.000 γραμμές."
αν και η τεχνολογία "από άκρο σε άκρο" στην αυτόνομη οδήγηση δεν εφευρέθηκε από την tesla, η tesla ήταν πράγματι η πρώτη εταιρεία που ανέπτυξε την τεχνολογία "από άκρο σε άκρο" των νευρωνικών δικτύων και την έφερε στην κύρια αγορά.
3. πλεονεκτήματα «από άκρο σε άκρο».
τον νοέμβριο του 2023, η tesla κυκλοφόρησε την πρώτη δοκιμαστική έκδοση του fsd v12, αλλά ήταν ανοιχτή μόνο σε επιλεγμένους υπαλλήλους. μέχρι τις αρχές του 2024, η tesla θα αρχίσει να ανοίγει την έκδοση fsd v12 σε όλους τους κατόχους tesla στις ηνωμένες πολιτείες και κάθε κάτοχος θα έχει δωρεάν δοκιμή ενός μήνα.
μετά την κυκλοφορία του fsd v12, προκάλεσε σάλο για λίγο από την εμπειρία του χρήστη, βλέπουμε ότι το μεγαλύτερο μέρος της κοινής γνώμης πιστεύει ότι η λειτουργία του fsd της tesla είναι πολύ βελτιωμένη σε σύγκριση με το προηγούμενο είναι το "πρώτο στον κόσμο της αυτόνομης οδήγησης".
david (παρουσιαστής του "big horses talking about technology"):
αυτό που πραγματικά με κάνει να νιώθω ότι έχω κάνει πρόοδο είναι ο σχεδιασμός, για παράδειγμα, όταν πρόκειται για κυκλικούς κόμβους, είναι αρκετά δύσκολο να διασχίσεις τον κυκλικό κόμβο προς την παραδοσιακή κατεύθυνση σχεδιασμού, επειδή το αυτοκίνητο μπροστά σου πρέπει να κολλήσει και εσύ. πρέπει να βγείτε από τον κυκλικό κόμβο πώς να ρυθμίσετε τη μέση αυτό το είδος προτεραιότητας;
ακόμα κι αν ορίσετε την προτεραιότητα, πόσο μακριά πρέπει να κρατήσετε από το αυτοκίνητο μπροστά και το αυτοκίνητο δίπλα σας προτού μπορέσετε να βγείτε έξω αισθάνομαι καταπληκτικά. αυτό μου προκαλεί μια μεγάλη έκπληξη.
πολλοί άνθρωποι που έχουν βιώσει το fsd v12 είπαν ότι αυτό το σύστημα, το οποίο μαθαίνει από τα δεδομένα ανθρώπινης οδήγησης, έχει ένα πολύ ανθρώπινο στυλ οδήγησης και δεν έχει πλέον την απογοήτευση που προκαλούν οι μηχανικοί αλγόριθμοι.
αλλά την ίδια στιγμή, κάποιοι καλεσμένοι σκέφτηκαν αφού το βίωσαν,το fsd v12 δεν είναι τόσο καλό ώστε οι άνθρωποι να πρέπει να το χρησιμοποιούν και εξακολουθεί να υπάρχει ένα συγκεκριμένο κενό μεταξύ αυτού και του l4.
justin mok (chief investment officer ενός οικογενειακού γραφείου):
αλλά δεν είναι τόσο καλό όσο το gpt4 και δεν είναι τόσο καλό που πρέπει να χρησιμοποιήσω αυτό το πράγμα ή ότι θα το χρησιμοποιήσω αμέσως και μπορεί να είναι κατάλληλο για χρήση σε πολλά από τα σενάρια μου.
minfa wang (πρώην ανώτερος μηχανικός μηχανικής μάθησης waymo):
η απόδοσή του είναι σχετικά καλή στον αυτοκινητόδρομο, αλλά στους δρόμους, πιστεύω ότι βασικά πρέπει να αναλαμβάνεται χειροκίνητα κάθε 5 μίλια περίπου.
ειδικά σε αυτό που λέμε απροστάτευτη αριστερή στροφή (απροστάτευτη αριστερή στροφή), είναι σχετικά εύκολο να το κάνεις, κάτι που με κάνει να νιώθω ότι δεν είναι πολύ ασφαλής συμπεριφορά αν το mpi (χιλιόμετρα ανάληψης) είναι μόνο 5, τότε είναι προφανώς μακριά από το l4 η αυτόνομη οδήγηση είναι ακόμα μακριά.
έχω δοκιμάσει και ο ίδιος την έκδοση fsd 12.4.4 σε σύγκριση με οχήματα l4 όπως το waymo, το τρέχον fsd της tesla εξακολουθεί να με τρομάζει σε ορισμένες στιγμές ή μερικές φορές παρουσιάζει ανεξήγητη συμπεριφορά.
για παράδειγμα, όταν έκανα μια δεξιά στροφή, επειδή η ακτίνα στροφής του ήταν πολύ μεγάλη, κόντεψε να χτυπήσει το επερχόμενο αυτοκίνητο, οπότε έπρεπε να αναλάβω χειροκίνητα.
από άποψη απόδοσης, το "end-to-end" fsd v12 έχει ακόμα περιθώρια βελτίωσης από άποψη μηχανικής, λειτουργίας και διαχείρισης, τα πλεονεκτήματα "από άκρο σε άκρο" έχουν τρία σημεία:
πρώτον, μπορεί να κάνει το συνολικό σύστημα πιο απλό.μετά την κατάργηση της βάσης κανόνων, χρειάζεται μόνο να προσθέτετε συνεχώς θήκες εκπαίδευσης για να βελτιώσετε περαιτέρω την απόδοση του μοντέλου και το κόστος συντήρησης και αναβάθμισης θα μειωθεί επίσης σημαντικά.
δεύτερον, εξοικονομήστε κόστος εργασίας.δεδομένου ότι το "από άκρο σε άκρο" δεν βασίζεται πλέον σε μια πολύπλοκη βάση κανόνων, δεν υπάρχει ανάγκη να αναπτυχθεί μια μεγάλη ομάδα ανάπτυξης ή ακόμη και να βασιστείτε σε ειδικούς.
τρίτον, μπορεί να επιτύχει ευρύτερη προβολή.μπορείτε να δείτε ότι επί του παρόντος οι εταιρείες l4 μπορούν να λειτουργούν μόνο σε περιορισμένες περιοχές, ανεξάρτητα από ρυθμιστικούς περιορισμούς και περιορισμούς αδειών, επειδή δεν είναι μια λύση "από άκρο σε άκρο" και πρέπει να βελτιστοποιηθεί για συγκεκριμένες περιοχές και "από άκρο σε άκρο " μπορεί να χειριστεί όλες τις οδικές συνθήκες. , περισσότερο σαν ένας "καθολικός" οδηγός, που είναι ένας από τους λόγους για τους οποίους το tesla fsd v12 συγκρίνεται με το chatgpt.
εφόσον το "από άκρο σε άκρο" έχει τόσα πολλά πλεονεκτήματα, μπορεί να λύσει τα τεχνικά προβλήματα που αντιμετωπίζει αυτή τη στιγμή η αυτόνομη οδήγηση;
4. μοντέλο μαύρο κουτί
πολλοί καλεσμένοι που πήραμε συνέντευξη πίστευαν ότι,σε αυτό το στάδιο, η περαιτέρω ανάπτυξη της διαδρομής από άκρο σε άκρο είναι μια αναγνωρισμένη τάση στον τομέα της αυτόνομης οδήγησης, αλλά υπάρχουν ακόμα πολλά προβλήματα.
zhang hang (ανώτερος διευθυντής επιστήμονας στην cruise):
νομίζω ότι αυτή η κατεύθυνση είναι η σωστή κατεύθυνση. είναι αδύνατο για εμάς να φτιάξουμε μια λύση l4, επιδιορθώνοντάς την συνεχώς. τελική λύση, οπότε τώρα είναι ένα αντιφατικό χρονικό σημείο.
το γιατί το τρέχον από άκρο σε άκρο είναι ακόμα πολύ πίσω από το l4 ξεκινά από την αβεβαιότητα του.
από άκρο σε άκρο είναι σαν ένα μαύρο κουτί, το οποίο θα φέρει περισσότερες αβεβαιότητες.
για παράδειγμα, οι μηχανικοί δεν μπορούν να επαληθεύσουν εάν οι περιπτώσεις δεδομένων εισόδου έχουν μαθευτεί από το μοντέλο ή όταν αντιμετωπίζουν ένα σφάλμα, δεν μπορούν να εντοπίσουν ποιος σύνδεσμος προκάλεσε το πρόβλημα ή εάν τα δεδομένα που προστέθηκαν πρόσφατα θα προκαλέσει τη λήθη ή την αντικατάσταση της γνώσης. , αυτή η κατάσταση ονομάζεται καταστροφική λήθη.
για παράδειγμα, η έκδοση του tesla fsd 12.4.2 έχει παραχθεί εσωτερικά εδώ και πολύ καιρό, αλλά χρειάστηκε πολύς χρόνος για να προωθηθεί σε μεγάλη κλίμακα, επειδή τα δεδομένα που τροφοδοτήθηκαν περιείχαν πολλά βίντεο που ήταν χειροκίνητα ανέλαβε, ήταν δύσκολο να το επίπεδο του μοντέλου έχει υποχωρήσει.
δεδομένου ότι η ουσία του από άκρο σε άκρο είναι η μίμηση, εάν η κατάσταση που συναντάται έχει παρόμοιες περιπτώσεις στα δεδομένα εκπαίδευσης, θα έχει πολύ καλή απόδοση, αλλά εάν υπερβαίνει τις υπάρχουσες περιπτώσεις αναφοράς, η απόδοση θα είναι χειρότερη, δηλαδή ας πούμε, το από άκρο σε άκρο έχει πολύ υψηλές απαιτήσεις σχετικά με τον όγκο των δεδομένων εκπαίδευσης και τον πλούτο των περιπτώσεων.
zhang hang (ανώτερος διευθυντής επιστήμονας στην cruise):
όταν υπάρχει κόκκινο φανάρι σε μια διασταύρωση κυκλοφορίας, δεν πρέπει να λειτουργείτε το κόκκινο φανάρι. είναι ένας τόσο απλός κανόνας.
αλλά αν είναι ένα εντελώς ολοκληρωμένο μοντέλο, βασίζεται εξ ολοκλήρου στη μάθηση στο τέλος, είναι πραγματικά πολύ δύσκολο για αυτόν να μάθει έναν τέτοιο τρόπο. επομένως, νομίζω ότι υπάρχει ακόμα ένα μεγάλο χάσμα μεταξύ του l4 από άκρο σε άκρο σε σύντομο χρονικό διάστημα, νομίζω ότι αυτός ο αλγόριθμος είναι ανώριμος.
liu bingyan (επικεφαλής του λογισμικού kargo):
δεν έχετε κάποιους σκληρούς και γρήγορους κανόνες, αλλά μπορεί να προσπαθήσει να κάνει όλα τα πράγματα που έχετε θέσει και δεν μπορούν να γίνουν. έτσι θα υπάρξουν πολλές μετωπικές συγκρούσεις στην προσομοίωση.
ταυτόχρονα, το ανεξήγητο που προκαλείται από άκρο σε άκρο είναι επίσης ανησυχητικό για ορισμένους ανθρώπους.
το λεγόμενο ανεξήγητο σημαίνει ότι η αλλαγή οποιουδήποτε βάρους, κόμβου ή αριθμού επιπέδων στο μοντέλο αλγορίθμου θα έχει απρόβλεπτο αντίκτυπο στην απόδοση του μοντέλου.
το αντίθετο είναι η ερμηνευτικότητα για παράδειγμα, στη λειτουργία βάσει κανόνων, οι μηχανικοί έχουν γράψει τον κανόνα ότι "μπορείτε να συνεχίσετε να οδηγείτε όταν εντοπιστεί μια πλαστική σακούλα", οπότε δεν χρειάζεται να ανησυχούμε για ξαφνικές αλλαγές σε αυτήν την κατάσταση. έλα, πάτα φρένο.
liu bingyan (επικεφαλής του λογισμικού kargo):
μπορείτε να δείτε ότι στο v12, η εμφάνιση στην οθόνη είναι πολύ καλύτερη, αλλά από πού προέρχεται αυτή η λεγόμενη οθόνη από άκρο σε άκρο; εάν αυτή η οθόνη προέρχεται από το αρχικό μοντέλο, ένα από τα ζητήματα που εμπλέκονται είναι ότι έχουμε προσθέσει ένα επίπεδο τεχνητά καθορισμένων διεπαφών σε αυτό το μοντέλο, ώστε να μπορείτε να εξαγάγετε αυτές τις πληροφορίες από μια συγκεκριμένη θέση στο μοντέλο.
ένα άλλο πράγμα που πιστεύω ότι είναι ακόμη πιο τρομακτικό είναι ότι αυτή η οθόνη παίρνει μια εντελώς διαφορετική διαδρομή. αυτό σημαίνει επίσης ότι το αυτοκίνητο δείχνει ότι υπάρχει ένα φορτηγό μπροστά αν αυτό θα ήταν πολύ, πολύ τρομακτικό να δεις ένα αυτοκίνητο μπροστά του, αλλά δεν είσαι σίγουρος ότι δεν πρόκειται να το χτυπήσει.
στην πραγματικότητα, έχω κάποιες αμφιβολίες για το αν είναι πραγματικά από άκρο σε άκρο, ή μπορεί να μην αμφιβάλλω, αλλά μπορεί να υπάρχουν άλλοι κίνδυνοι εδώ.
wang chensheng (πρώην διευθυντής προμηθειών της tesla):
έτσι, για βιομηχανίες όπως η αυτόνομη οδήγηση, που έχουν τόσο υψηλές απαιτήσεις ασφάλειας, η ανεξήγητη φύση που προκαλεί το μοντέλο από άκρο σε άκρο είναι η άλλη όψη του νομίσματος;
δεδομένου ότι η tesla δεν έχει ανακοινώσει ακόμη την τεχνολογία του fsd v12, δεν γνωρίζουμε εάν το fsd υιοθετεί μια στρατηγική πολλαπλών μονάδων, αλλά διαπιστώσαμε ότιορισμένοι ιδιοκτήτες αυτοκινήτων έχουν αντιμετωπίσει περιπτώσεις όπου η οθόνη δεν ταιριάζει με την πραγματική συμπεριφορά.
για παράδειγμα, η εναέρια όψη που κατασκεύασε το όχημα έδειξε ότι υπήρχε κάποιος μπροστά, αλλά δεν έδειξε σημάδια πέδησης, αλλά συνέχισε να περνάει, ευτυχώς, ήταν απλώς ένας λάθος εντοπισμός στο άκρο ανίχνευσης και δεν συνέβη κανένα ατύχημα .
αν και αυτή η περίπτωση μπορεί να φανεί ότι σύμφωνα με τον από άκρο σε άκρο αλγόριθμο, τα σφάλματα ανώτερου επιπέδου δεν θα επηρεάσουν τα πλεονεκτήματα της λήψης αποφάσεων στο χαμηλότερο επίπεδο, δείχνει επίσης ότι το επίπεδο σχεδιασμού περιστασιακά δεν αναγνωρίζει τα αποτελέσματα του επιπέδου αντίληψης , επιβεβαιώνοντας τις ανησυχίες του liu bingyan.
θα γίνει το ανεξήγητο πρόβλημα μείζονος σημασίας που εμποδίζει την ανάπτυξη από άκρο σε άκρο; ακολουθεί η τρίτη σύγκρουση που βλέπουμε.
yu zhenhua (πρώην μηχανικός ai της tesla):
νομίζω ναι,ένα πολύ σοβαρό πρόβλημα με την τεχνητή νοημοσύνη είναι ότι η θεωρητική της φύση υστερεί πολύ.
το ai δεν σας λέει ότι αυτό σίγουρα θα λειτουργήσει ή όχι. ως εκ τούτου, είναι ένα πειραματικό θέμα δεν θεωρείται επιστήμη και απαιτεί πολλή επαλήθευση.
το v12 συνθλίβει εντελώς το v11, οπότε αυτό είναι θέμα αποτελεσμάτων. τότε πιστεύετε ότι υπάρχει κάτι τέτοιο όπως είναι ανεξήγητο από άκρη σε άκρη, επειδή είναι εντελώς τσακισμένο, είναι πολύ ανεγκέφαλο, και πρέπει να κατεβείτε;
ο yu zhenhua πιστεύει ότι η τεχνητή νοημοσύνη είναι ένα πειραματικό θέμα εφόσον τα αποτελέσματα ανταποκρίνονται στις προσδοκίες, αποδεικνύει ότι η κατεύθυνση είναι σωστή και πρέπει να συνεχίσει να προχωρά. ο hou xiaodi είπε ότι η απόδοση του v12 είναι σημαντικά μπροστά από τον v11, μόνο και μόνο επειδή η βάση του v11 είναι πολύ κακή και η απόδοσή του απέχει ακόμα πολύ από την πραγματική οδήγηση χωρίς οδηγό.
wang chensheng (πρώην διευθυντής προμηθειών της tesla):
εάν είναι πραγματικά full self driving και περιορίζεται από το l5, πρέπει να περάσει από τις ρυθμιστικές αρχές και αυτές πρέπει να έχουν επεξήγηση ή προβλεψιμότητα.
επιπλέον, υπάρχουν τόσες πολλές πόλεις στον κόσμο, και στις ηνωμένες πολιτείες, κάθε πόλη μπορεί να έχει διαφορετικούς νόμους και κανονισμούς. το αν αυτό το αυτοκίνητο χρειάζεται να προσαρμοστεί στους τοπικούς νόμους και κανονισμούς όσον αφορά το υλικό και το λογισμικό έχει γίνει ένα μεγάλο ερώτημα εάν μπορεί να κλιμακωθεί.
το από άκρο σε άκρο δεν μπορεί να ρυθμίσει το μοντέλο μέσω τεχνητά καθορισμένων κανόνων, επομένως το αν μπορεί να προσαρμοστεί σε διαφορετικούς κανονισμούς έχει γίνει μια πρόκληση για την κλίμακα από άκρο σε άκρο.
ένας άλλος παράγοντας που επηρεάζει την κλίμακα είναι ότι το end-to-end είναι πιο ευαίσθητο στον όγκο δεδομένων και στους αισθητήρες.
5. το μέλλον είναι αβέβαιο
liu bingyan (επικεφαλής του λογισμικού kargo):
υπάρχει ένα πολύ σοβαρό πρόβλημα από άκρο σε άκρο, το οποίο είναιθα είναι πιο ευαίσθητο στον αισθητήρα, δηλαδή, όταν αλλάζετε τον αισθητήρα ή την κατανομή του αισθητήρα, το μοντέλο σας μπορεί να επανεκπαιδευτεί πλήρως.
από άλλη σκοπιά, είναι απαράδεκτο από μηχανολογική άποψη, ή δεν μπορούμε να φανταστούμε ότι το ίδιο αυτοκίνητο θα κυκλοφορεί σε όλο τον κόσμο στο μέλλον.
μόλις αλλάξει η κατανομή του αισθητήρα, το μοντέλο θα καταστεί άκυρο και η εκπαίδευση πρέπει να ξαναρχίσει για την εκπαίδευση πρέπει να συλλεχθεί μεγάλος όγκος δεδομένων, κάτι που αναπόφευκτα θα επιφέρει τεράστιο κόστος.
τα αμερικανικά οικονομικά μέσα cnbc ανέφεραν ότι στις αρχές του 2023,για να εκπαιδεύσει το fsd, η tesla χρησιμοποίησε περισσότερα από 10 εκατομμύρια βίντεο οδήγησης ιδιοκτητών tesla.
επιπλέον, αυτά τα περισσότερα από 10 εκατομμύρια δεδομένα εκπαίδευσης δεν χρησιμοποιούνται τυχαία. πρέπει να είναι άνθρωποι οδηγοί με σχετικά υψηλές δεξιότητες οδήγησης.
επομένως, η εκπαίδευση του μοντέλου από άκρο σε άκρο δεν απαιτεί μόνο πολλά δεδομένα, αλλά απαιτεί επίσης πολύπλοκο έλεγχο, ο οποίος καταναλώνει πολύ ανθρώπινο δυναμικό. μπορεί να μην είναι πρόβλημα για την tesla, η οποία πουλάει πολλά αυτοκίνητα, αλλά για άλλες εταιρείες, οι πηγές δεδομένων έχουν γίνει μεγάλο πρόβλημα.
david (παρουσιαστής του "big horses talking about technology"):
πολλοί καε έχουν εξαπατηθεί επειδή ακολούθησαν τυφλά τη μεθοδολογία της tesla, αλλά αυτό το σύνολο πραγμάτων δεν είναι πραγματικά κατάλληλο για το 90% των oem.
αυτό σημαίνει ότι άλλοι κατασκευαστές δεν μπορούν πραγματικά να εισέλθουν στο πεδίο από άκρο σε άκρο;
παρόλο που η nvidia και η tesla οδηγούν και οι δύο λειτουργίες αλγορίθμου από άκρο σε άκρο μέσω καθαρής όρασης, από άκρο σε άκρο μπορούν πραγματικά να δεχτούν πολλαπλές εισόδους.
επί του παρόντος, οι ευρέως χρησιμοποιούμενοι αισθητήρες, όπως το ραντάρ κυμάτων χιλιοστών, το ραντάρ υπερήχων και το ραντάρ υπερήχων, είναι σχετικά στερεωμένοι στο όχημα, ειδικά το lidar, το οποίο είναι βασικά στην οροφή. ως εκ τούτου, μπορεί να χρησιμοποιηθεί πολυτροπική πρόσβαση από άκρο σε άκρο χρησιμοποιούνται διαφορετικά μοντέλα για την εκπαίδευση του μοντέλου και ο χώρος σχεδιασμού που απομένει για τον oem θα είναι μεγαλύτερος.
μετά από έναν άλλο γύρο συνομιλίας, κάθε αλγόριθμος έχει τα δικά του πλεονεκτήματα και δεν είναι ακόμα σαφές ποια μέθοδος μπορεί να μας οδηγήσει σε ένα μέλλον χωρίς οδηγό.
zhang hang (ανώτερος διευθυντής επιστήμονας στην cruise):
δεν νομίζω ότι υπάρχει κάποιος αλγόριθμος που μπορεί να είναι απλός και μεγάλης κλίμακας και στη συνέχεια να πληροί το πρότυπο l4, νομίζω ότι ο ίδιος ο αλγόριθμος δεν υπάρχει. είμαι πολύ αισιόδοξος ότι όλοι θα φτάσουν στον ίδιο προορισμό με διαφορετικά μονοπάτια, αν και ο καθένας θα έχει ελαφρώς διαφορετικές αποκλίσεις.
6. τίποτα δεν μπορεί να γίνει
ανεξάρτητα από τον αλγόριθμο που χρησιμοποιείται, τελικά θα αντιμετωπίσει το πρόβλημα της μακριάς ουράς.
σύμφωνα με το παραδοσιακό μοντέλο που βασίζεται σε κανόνες (βασισμένο σε κανόνες), η σύνταξη μιας βάσης κανόνων απαιτεί μια τεράστια ομάδα να ξοδέψει πολλή ενέργεια και είναι δύσκολο να καλύψει τα πάντα να λυθεί;
minfa wang (πρώην ανώτερος μηχανικός μηχανικής μάθησης waymo):
έλυσε τις συμβατικές περιπτώσεις, αλλά νομίζω ότι το πρόβλημα της μακράς ουράς θα υπάρχει ακόμα.
η minfa πιστεύει ότι το ποσοστό ανοχής σφαλμάτων των συστημάτων αυτόνομης οδήγησης είναι πολύ χαμηλό.
ο αλγόριθμος της αυτόνομης οδήγησης θα εξασκηθεί πρώτα στο σύστημα προσομοίωσης μπορεί η εκπαίδευση προσομοίωσης να λύσει ορισμένα προβλήματα μακράς ουράς;
zhang hang (ανώτερος διευθυντής επιστήμονας στην cruise):
προς το παρόν, δεν υπάρχει καλή λύση που να μπορεί πραγματικά να βοηθήσει στην πραγματική μας απόδοση στο δρόμο μέσω των δεδομένων προσομοίωσης που δημιουργούνται.
minfa wang (πρώην ανώτερος μηχανικός μηχανικής μάθησης waymo):
στους τομείς της αυτόνομης οδήγησης ή της ρομποτικής, το περιβάλλον είναι πολύ, πολύ περίπλοκο, δεν προσομοιώνετε μόνο τον εαυτό σας, αλλά και το πώς θα κινηθεί το αυτοκίνητο στο μέλλον το δικό σας αυτοκίνητο αλλάζει κατά καιρούς, θα επηρεάζετε τη συμπεριφορά όλων των αυτοκινήτων και των ανθρώπων γύρω σας.
πώς να προσομοιώσετε καλά και να αποφύγετε τη μετατόπιση διανομής (μετατόπιση διανομής), νομίζω ότι είναι ακόμα ένα ανοιχτό θέμα.
εφόσον οι εικονικές σκηνές δεν μπορούν να προσομοιώσουν πλήρως τις δυνατότητες της πραγματικότητας, σημαίνει αυτό ότι δεν υπάρχει επί του παρόντος τρόπος να λυθεί το πρόβλημα της μακράς ουράς στη βιομηχανία και μπορεί να βασίζεται μόνο στη μακροπρόθεσμη συσσώρευση εμπειρίας;
ανώνυμος ερωτώμενος (μηχανικός l4):
σε κάποιο βαθμό, ναι, αλλά δεν χρειάζεται να είσαι τέλειος, σωστά; οι άνθρωποι δεν είναι τέλειοι, απλά πρέπει να τα καταφέρετε καλύτερα από τους άλλους. οι άνθρωποι έχουν επίσης τα δικά τους ποσοστά ατυχημάτων, αρκεί να τα καταφέρετε καλύτερα από αυτό, αρκεί.
hou xiaodi (πρώην ιδρυτής και διευθύνων σύμβουλος της tusimple, ιδρυτής της bot.auto):
νομίζω ότι το θέμα της μακράς ουράς είναι στην πραγματικότητα μια ψευδής πρόταση, χαίρομαι που το αναφέρατε.
κατά τη γνώμη μου, υπάρχει πρόβλημα με τη μακριά ουρά, για παράδειγμα, τι πρέπει να κάνω αν δω κροκόδειλο; τι πρέπει να κάνω αν δω έναν ελέφαντα; βλέπω ένα αεροσκάφος με σταθερή πτέρυγα παρκαρισμένο στον αυτοκινητόδρομο, τι πρέπει να κάνω;
στην πραγματικότητα, για πολλά προβλήματα μακράς ουράς, τα τυλίγουμε σε μια μεγάλη κατηγορία προβλημάτων πώς να αντιμετωπίσω αντικείμενα που δεν έχω ξαναδεί; είναι αρκετά εύκολο αν το τυλίξετε σε έναν γενικότερο τύπο προβλήματος.
για παράδειγμα, κάποτε είδαμε ένα αεροσκάφος με σταθερές πτέρυγες να σταθμεύουν στον αυτοκινητόδρομο, οπότε η λύση μας ήταν πολύ απλή, σταματήστε το, σωστά;
είναι το πρόβλημα της μακριάς ουράς μια λανθασμένη πρόταση ή είναι ένα πρόβλημα που πρέπει να λυθεί; ο καθένας μπορεί να έχει τη δική του απάντηση σε αυτό το θέμα. το πρόβλημα της μακριάς ουράς αντιστοιχεί στο πότε το l4 ή ακόμα και το l5 μπορεί να κυκλοφορήσει σε μεγάλη κλίμακα, οπότε στη συνέχεια, ας ρίξουμε μια ματιά στη σφοδρή σύγκρουση μεταξύ l2 και l4.
4. μπορεί η tesla robotaxi να πετύχει: η σύγκρουση μεταξύ l2 και l4
1. "δεν μπορεί να γίνει"
ζητήσαμε τη γνώμη τους από τους καλεσμένους πριν ο μασκ ανακοινώσει την αναβολή του robotaxi όλοι είχαν πολύ ομόφωνη άποψη για αυτό, δηλαδή είναι αδύνατο να λανσαριστεί φέτος το αυτόνομο ταξί της tesla.
ο μεγαλύτερος λόγος για τον οποίο όλοι έχουν μια τόσο ενιαία άποψη είναι ότι τα υπάρχοντα μοντέλα της tesla δεν μπορούν να πληρούν το πρότυπο l4 για αυτόνομα ταξί.
liu bingyan (επικεφαλής του λογισμικού kargo):
είμαι πολύ σίγουρος ότι τα υπάρχοντα μοντέλα της tesla έχουν πολύ ξεκάθαρα τυφλά σημεία, αν η tesla θέλει να πετύχει το απόλυτο, είτε πρόκειται για αυτόνομη οδήγηση l4 είτε για l5, το επόμενο αυτοκίνητο της πρέπει να λύσει αυτό το τυφλό σημείο. για να λύσουμε αυτό το πρόβλημα στο τυφλό σημείο, επιστρέφουμε σε αυτό που μόλις είπαμε. το άμεσο αποτέλεσμα της προσαρμογής αυτών των θέσεων είναι ότι το προηγούμενο μοντέλο θα αποτύχει.
από την άποψη της αρχιτεκτονικής οπτικής κάμερας, είναι αδύνατο για τα υπάρχοντα αυτοκίνητα να επιτύχουν fsd που μπορεί να είναι εντελώς αφύλακτο. από αυτή την άποψη, πρέπει να έχει νέο υλικό.
zhang hang (ανώτερος διευθυντής επιστήμονας στην cruise):
από την άποψη του αισθητήρα, πρέπει να εισάγει κάποια πλεονασμό, η οποία μπορεί να μην χρειαζόταν στο l2 πριν.
ενώ οι γνώστες του κλάδου δεν είναι αισιόδοξοι, τι κάνει τον musk τόσο σίγουρο για την κυκλοφορία του robotaxi;
yu zhenhua (πρώην μηχανικός ai της tesla):
νομίζω ότι ο κύριος λόγος είναι οι πολλές τεχνικές ανακαλύψεις αυτού του fsd v12 ως χαρακτήρας του musk, όταν είδε το fsd v12 σήμερα, στο σχέδιό του, θεώρησε ότι το robotaxi έπρεπε να τεθεί στην ημερήσια διάταξη.
μπορεί, λοιπόν, το fsd v12 να επιτρέψει στην tesla να μεταβεί στο l4 και να αναλάβει το σημαντικό έργο του robotaxi; πόσο μεγάλο είναι το χάσμα σε σύγκριση με το υπάρχον waymo ή cruise;
όταν πήρε συνέντευξη από τον hou xiaodi σχετικά με αυτήν την ερώτηση, η απάντησή του μας επέτρεψε να δούμε μια άλλη άποψη στον κλάδο: δηλαδή, το χάσμα μεταξύ l2 και l4 είναι πολύ μακριά.
2. «ούτε καν κοντά»
hou xiaodi (πρώην ιδρυτής και διευθύνων σύμβουλος της tusimple, ιδρυτής της bot.auto):
πρώτα απ 'όλα, αυτό που κάνει η tesla δεν είναι η οδήγηση χωρίς οδηγό οδήγηση, η οποία δεν είναι οδήγηση χωρίς οδηγό, οπότε αυτό που κάνετε δεν είναι το ίδιο πράγμα.
προς το παρόν, η υποβοηθούμενη οδήγηση l2 χρησιμοποιείται ευρέως από εταιρείες αυτοκινήτων, όπως η tesla, η xiaomi, η huawei, η xpeng κ.λπ., ενώ εταιρείες όπως η waymo, η cruise, η baidu και άλλα αυτοοδηγούμενα ταξί χρησιμοποιούν l4 highly αυτοματοποιημένη οδήγηση, παραμερίζοντας τη γραπτή ορισμοί εννοιών,η ουσιαστική διαφορά μεταξύ των δύο είναι ποιος φέρει την ευθύνη.
hou xiaodi (πρώην ιδρυτής και διευθύνων σύμβουλος της tusimple, ιδρυτής της bot.auto):
η λύση που απομακρύνει τους ανθρώπους και αναθέτει την ευθύνη στις εταιρείες ανάπτυξης λογισμικού ονομάζεται αυτο-οδήγηση. επιτρέψτε μου να σας πω ένα αστείο, τι θα συμβεί αν ένας tesla σκοτώσει κάποιον; για τον έλον μασκ, δεν είναι δική τους δουλειά.
επομένως, εάν η tesla θέλει να κάνει αυτόνομα ταξί, πρέπει να αναλάβει τη δική της ευθύνη. ποιες είναι λοιπόν οι τεχνικές διαφορές μεταξύ της υποβοηθούμενης οδήγησης και της αυτόνομης οδήγησης;
hou xiaodi (πρώην ιδρυτής και διευθύνων σύμβουλος της tusimple, ιδρυτής της bot.auto):
ποιο είναι το βασικό πρόβλημα που πρέπει να λύσει η αυτόνομη οδήγηση l4; είναι ασφάλεια, είναι πλεονασμός, όταν κάθε λειτουργική μονάδα ενός συστήματος μπορεί να αποτύχει, το σύστημα μπορεί να εξασφαλίσει την απόλυτη ασφάλεια. αυτό το πράγμα είναι το πιο δύσκολο και κρίσιμο μέρος του l4. πρέπει να λύσει το πρόβλημα ασφάλειας πριν βγάλει χρήματα, αλλά αυτό το θέμα δεν είναι καθόλου ο σχεδιαστικός σκοπός της tesla.
ένας άλλος ερευνητής της αυτόνομης οδήγησης l4 ανέλυσε επίσης τις διαφορές μεταξύ l2 και l4 από την άποψη του υλικού και του λογισμικού.
zhang hang (ανώτερος διευθυντής επιστήμονας στην cruise):
η λύση l4, πρώτα απ 'όλα, είναι ότι έχουμε σχετικά ισχυρούς αισθητήρες, που μπορεί να είναι δύσκολο να χρησιμοποιηθούν σε σενάρια l2, τουλάχιστον όχι τόσο υψηλής ακρίβειας lidar.
από αλγοριθμική άποψη, το l2 μπορεί να επικεντρώνεται περισσότερο στο να είναι πιο αποτελεσματικό και να μειώνει το κόστος πολύ χαμηλό. δεν απαιτεί ιδιαίτερα ακριβούς αισθητήρες και μπορεί να απαιτεί λιγότερους υπολογισμούς για να επιτευχθεί ένα τέτοιο αποτέλεσμα. αυτά τα l2 δεν χρειάζεται πραγματικά να εξετάσουν αυτήν την περίπτωση ενός στο εκατομμύριο.
στη συνέχεια, αυτό που επιδιώκουμε στο l4 είναι ότι η ανθρώπινη απομακρυσμένη βοήθεια πρέπει να εισαχθεί μόνο μία φορά ανά εκατομμύριο μίλια ή περισσότερα.
για να συνοψίσουμε:η λύση l4 χρησιμοποιεί αισθητήρες με μεγαλύτερη ακρίβεια, το τσιπ έχει μεγαλύτερη υπολογιστική ισχύ και μπορεί να χειριστεί πιο ολοκληρωμένα σενάρια.
ωστόσο, στη λύση l2, το κύριο μέλημα είναι το κόστος, επομένως το επίπεδο υλικού θα είναι ελαφρώς χαμηλότερο. η συχνότητα εξαγοράς του l2 θα είναι πολύ υψηλότερη από αυτή του l4.
λοιπόν, μπορούν οι εταιρείες l2 όπως η tesla να επιτύχουν αποτελέσματα l4 βελτιώνοντας το υλικό και το λογισμικό;
3. «δύο διαφορετικά πράγματα»
hou xiaodi (πρώην ιδρυτής και διευθύνων σύμβουλος της tusimple, ιδρυτής της bot.auto):
δεν υποστηρίζω την αργή εξέλιξη των l2 σε l4 και l5, νομίζω ότι αυτό το θέμα είναι μια άλλη λανθασμένη πρόταση με ισχυρές ιδιότητες παρέκτασης.
με την πάροδο του χρόνου, μπορούν τα δελφίνια να εξελιχθούν σε πολιτισμό; νομίζω ότι είναι δυνατό, αλλά πρέπει να ξέρουμε ότι ο πολιτισμός της γης δεν μπορεί πλέον να ανεχθεί την εξέλιξη των δελφινιών, γιατί υπάρχουν ήδη εταιρείες που το έχουν κάνει η εταιρεία μου είναι εδώ για να εφαρμόσει το l4 όσο το δυνατόν γρηγορότερα. δεν θα έχω τίποτα να κάνω μαζί σου αφού προσγειωθώ στο έδαφος, σωστά; όταν ο homo sapiens έπιασε το ακόντιο, δεν υπήρχαν δελφίνια για να δημιουργήσουν πολιτισμό.
κατά την άποψη του hou xiaodi,οι υπάρχουσες εταιρείες l4 έχουν ήδη δημιουργήσει τεχνικά εμπόδια υπό τον σκληρό ανταγωνισμό, δεν θα δώσουν την ευκαιρία στην l2 να εξελιχθεί., την ίδια στιγμή, κάποιοι πιστεύουν ότι αυτό δεν σημαίνει ότι η τεχνολογία l4 είναι πιο προηγμένη από την l2, αλλά ότι όλοι στοχεύουν διαφορετικά σενάρια.
yu zhenhua (πρώην μηχανικός ai της tesla):
αν πούμε ότι το l4 είναι πραγματικά τόσο προηγμένο τεχνικά και μπροστά από το l2 όσο όλοι φαντάζονταν. θα ήθελα λοιπόν να ρωτήσω γιατί η τεχνολογία l4 δεν μπορεί να υποβαθμιστεί απευθείας σε l2;
στην πραγματικότητα, τα τελευταία πολλά χρόνια, λόγω της πίεσης του εισοδήματος, οι εταιρείες l4 βοηθούν τους κατασκευαστές αυτοκινήτων να κάνουν l2, αλλά δεν μπορούν απλώς να υποβαθμίσουν, βασικά πρέπει να αναπτυχθούν εκ νέου.
στη συνέχεια, γνωρίζουμε επίσης ότι στις ηνωμένες πολιτείες, η gm (general motors) κατέχει την εταιρεία cruise l4 και η ford κατέχει την argo ai, η οποία είναι επίσης εταιρεία l4 γιατί δεν μπορεί η gm να χρησιμοποιήσει την τεχνολογία της cruise στα οχήματά της μαζικής παραγωγής; γιατί η ford δεν μπορεί να χρησιμοποιήσει την τεχνολογία l4 της argo ai στα οχήματα παραγωγής της; επομένως, το l4 δεν είναι απολύτως πιο προηγμένο από το l2, όσον αφορά την τεχνική δυσκολία, δεν νομίζω ότι αν κάνετε το l4, θα φαίνεστε πολύ προχωρημένοι.
γιατί δεν μπορεί η τεχνολογία l4 να υποβαθμιστεί απευθείας σε l2 για χρήση; ο zhang hang εξήγησε ότι επειδή το l4 χρησιμοποιεί υψηλότερες προδιαγραφές υλικού και ο αλγόριθμος του l2 πρέπει να προσαρμοστεί σε αισθητήρες με χαμηλότερες προδιαγραφές και επεξεργαστές με λιγότερη υπολογιστική ισχύ, οι τεχνολογίες των δύο δεν μπορούν να μεταφερθούν απευθείας.
ακριβώς όπως ένας αρχιτέκτονας σχεδιαστής που του κατάσχεσαν τον υπολογιστή του και του έδωσαν μόνο χάρακα και στυλό και χαρτί με χαμηλή ακρίβεια, έπρεπε επίσης να προσαρμοστεί στον νέο τρόπο σχεδίασης.
zhang hang (ανώτερος διευθυντής επιστήμονας στην cruise):
αυτό που αναφέρατε προηγουμένως είναι το πρόβλημα του υπολογισμού του ποσού. είναι αδύνατο να υποστηρίξετε τη λύση l2.
ταυτόχρονα, ο zhang hang έδειξε επίσης ένα πιο ανοιχτό μυαλό όταν συγκρίνει τις τεχνολογίες των l2 και l4 έχει ευρύτερη κάλυψη και χρειάζεται να αντιμετωπίσει περισσότερα σενάρια και μόνο βασικά προβλήματα πρέπει να λυθούν. το l4 έχει περιορισμένη κάλυψη, αλλά δίνει μεγαλύτερη προσοχή σε διάφορες λεπτομέρειες. υπάρχουν λοιπόν πλεονεκτήματα και μειονεκτήματα μεταξύ των δύο.
zhang hang (ανώτερος διευθυντής επιστήμονας στην cruise):
το ίδιο το l4 δεν μπορεί να χρησιμοποιηθεί ως λύση l2 απλοποιώντας απλώς το υπάρχον σύστημα και αφαιρώντας τον πλεονασμό, αλλά το αντίστροφο. εάν θέλετε να επιτύχετε τα πρότυπα l2 του l4, χρειάζεται πολύς χρόνος για να συλλέξετε δεδομένα και στη συνέχεια να συγκεντρώσετε εμπειρία.
αλλά δεν νομίζω ότι σημαίνει ότι η τεχνική μας διαδρομή ή το τεχνικό βάθος θα είναι υψηλότερο από το l2. δεν νομίζω ότι αυτό είναι απαραίτητο να έχει πολλούς αλγόριθμους που δεν είναι πολύ αιχμής, αλλά μπορούν να επιλυθούν κάποια προσεκτική σχεδίαση αυτά είναι μερικά πολύ λεπτομερή ζητήματα μακράς ουράς.
ποια άποψη θα υποστήριζες; μπορείτε να αφήσετε ένα μήνυμα να μας το πείτε. στις συνεντεύξεις μας, διαφορετικοί άνθρωποι θα έχουν τις δικές τους απαντήσεις σε αυτή την ερώτηση.
yu zhenhua (πρώην μηχανικός tesla l2):
νομίζω ότι το ευρύ κοινό, ακόμη και ορισμένες εταιρείες l4, θα ενσταλάξουν μια ιδέα σε όλους, δηλαδή ότι η τεχνολογία l4 είναι καλύτερη από την l3 και μετά καλύτερη από την l2. νομίζω ότι αυτό είναι ένα σενάριο που ξεφεύγει από τους περιορισμούς του για να παραπλανήσει το κοινό, επειδή το τρέχον robotaxi της l4 έχει πολύ περιορισμένα σενάρια και πρέπει να βρίσκεται σε μια συγκεκριμένη περιοχή.
shao xuhui (διαχειριστής συνεργάτης της foothill ventures):
προσωπικά θα εξακολουθώ να είμαι αισιόδοξος για τις εταιρείες l4, γιατί από αυτή τη λογική, το l4 μπορεί να μειώσει τις διαστάσεις και να επιτεθεί, αλλά αν το κάνετε μόνο αυτό, δεν θα προβιβαστείτε σε l2 ή θα είναι πολύ, πολύ δύσκολο να προωθηθείτε.
ανώνυμος ερωτώμενος (μηχανικός l4):
στην πραγματικότητα, δεν νομίζω ότι υπάρχει ένα ιδιαίτερα δύσκολο όριο στη στοίβα τεχνολογίας, για παράδειγμα, εάν μια εταιρεία μπορεί να ισχυριστεί ότι είναι εταιρεία l2 σήμερα, τότε ίσως προσθέσει μερικές νέες τεχνολογίες αύριο και μπορεί επίσης να κάνει l4, σωστά. ? όλα εξαρτώνται από την τεχνολογία που χρησιμοποιεί στην εφαρμογή της ή από ποιες νέες τεχνολογικές ανακαλύψεις έχει, σωστά;
hou xiaodi (πρώην ιδρυτής και διευθύνων σύμβουλος της tusimple, ιδρυτής της bot.auto):
η υποβοηθούμενη οδήγηση και η οδήγηση χωρίς οδηγό είναι δύο διαφορετικά πράγματα.
παραγωγοί: hong jun, chen qian, συγγραφέας: wang ziqin, επιμέλεια: chen qian