διάλογος με την ideal lang xianpeng: είμαστε ήδη μπροστά από την tesla

2024-08-31

ο διευθύνων σύμβουλος της tesla, έλον μασκ, ξεκίνησε μια ζωντανή μετάδοση του λογισμικού έξυπνης οδήγησης fsd v12 της tesla το 2023 - το tesla στο βίντεο βασίζεται στην πιο πρόσφατη τεχνολογία από άκρο σε άκρο και το λογισμικό έχει διαγράψει μεγάλο αριθμό μηχανικών κώδικα κανόνα, αντί να χρησιμοποιεί ο αλγόριθμος του κύριου νευρωνικού δικτύου. το όχημα βασίζεται σε αυτόνομη όραση και νευρωνικά δίκτυα για να υποδείξει πού να επιβραδύνει, να αναγνωρίσει τα φανάρια και όλους τους παράγοντες στο δρόμο και να λάβει αυτόνομες αποφάσεις.

αυτή η τεχνολογία προκάλεσε στη συνέχεια μεγάλη συζήτηση και ενδιαφέρον από τη βιομηχανία, τους λάτρεις της τεχνολογίας, ακόμη και τους απλούς καταναλωτές αυτοκινήτων.

αυτός είναι ένας νέος γύρος ανάκτησης παραδείγματος για έξυπνη οδήγηση. μέχρι σήμερα, υπάρχουν ακόμα πολλές απόψεις που αναδύονται στην κινεζική αγορά:

η εμφάνιση της τεχνολογίας από άκρο σε άκρο έχει ισοπεδώσει τη γραμμή εκκίνησης για πολλές εταιρείες αυτοκινήτων που ασχολούνται με την έξυπνη οδήγηση.

η τεχνολογία από άκρο σε άκρο επηρεάζεται από ισχυρά δεδομένα η κατασκευή μοντέλων και η ποσότητα απόκτησης δεδομένων, ειδικά η απόκτηση αποτελεσματικών ποιοτικών δεδομένων, επηρεάζουν την ταχεία επανάληψη της τεχνολογίας.

στην κινεζική αγορά, ανεξάρτητες αυτοκινητοβιομηχανίες με «πλεονέκτημα στο σπίτι» έχουν ξεκινήσει έναν ακόμη αγώνα μεγάλων αποστάσεων για έξυπνη οδήγηση.

ο δρ lang xianpeng, αντιπρόεδρος έρευνας & ανάπτυξης έξυπνης οδήγησης της li auto, πιστεύει επίσης ότι,όσον αφορά την τεχνική αρχιτεκτονική, η τελευταία λύση της ideal δεν διαφέρει πολύ από αυτή της tesla και είναι έστω και λίγο μπροστά. επειδή ιδανικά διαθέτει μοντέλο vlm και σύστημα 2, η tesla διαθέτει μόνο σύστημα 1 από άκρο σε άκρο.

το από άκρο σε άκρο μοντέλο της li auto είναι το one model ολοκληρωμένο από άκρο σε άκρο, το οποίο είναι ελαφρώς διαφορετικό από το end-to-end των άλλων εταιρειών αυτοκινήτων στην αγορά.

η συμβατική τεχνολογία από άκρο σε άκρο χρησιμοποιεί μόνο μοντέλα τεχνητής νοημοσύνης και μηχανική αυτοεκμάθηση για να αντικαταστήσει τις μονάδες αντίληψης, σχεδιασμού και ελέγχου στη διαδικασία έξυπνης οδήγησης, από το οπτικό άκρο "εισαγωγής" έως το έξυπνο σύστημα οδήγησης και τον τελικό έλεγχο του οχήματος η πλευρά "εξόδου" της οδήγησης αναλαμβάνεται πλήρως από το μοντέλο. μια καθαρή τεχνολογία "από άκρο σε άκρο" δεν ορίζει πλέον κωδικούς βασισμένους σε κανόνες σε αυτή τη διαδικασία και γίνεται ένα πλήρες μαύρο κουτί.

ωστόσο, πολλές αυτοκινητοβιομηχανίες στην αγορά, συμπεριλαμβανομένων σχετικά προηγμένων κατασκευαστών όπως η tesla, η huawei και η xpeng, εξακολουθούν να δημιουργούν ορισμένους υποκείμενους αλγόριθμους που είναι υπεύθυνοι για τον πλεονασμό ασφαλείας. ο έλεγχος αντίληψης και σχεδιασμού μπορεί να είναι σχετικά ανεξάρτητες ενότητες και οι διεπαφές πρέπει ακόμα να οριστούν και να συνδεθούν χειροκίνητα.

το ενσωματωμένο από άκρο σε άκρο one model προορίζεται να συνδυάσει τις μονάδες ελέγχου αντίληψης και προγραμματισμού. ονομάζεται εσωτερικά σύστημα 1 και μοιάζει περισσότερο με ένα πρόγραμμα οδήγησης για την γρήγορη εκτέλεση αποφάσεων από άκρο σε άκρο.

στο παρελθόν, οι εφαρμογές από άκρο σε άκρο στον τομέα της έξυπνης οδήγησης αντιμετώπιζαν συχνά το πρόβλημα του υψηλού άνω ορίου αλλά και του χαμηλού κατώτερου ορίου. για παράδειγμα, η tesla, ο ηγέτης του κλάδου, δοκίμασε πολύ ομαλά στην καλιφόρνια των ηπα και συμπεριφέρθηκε πολύ σαν άνθρωπος οδηγός, ωστόσο, μόλις εισέλθει σε μια άγνωστη περιοχή, θα έχει δύσκολες εξηγήσεις ρυθμιστικών αποφάσεων.

αυτό είναι ένα από τα μειονεκτήματα του end-to-end.

η ιδανική προσέγγιση είναι να εισαγάγουμε το σύστημα 2, το μοντέλο οπτικής γλώσσας vlm, και να κάνουμε ένα ακόμη βήμα μπροστά.

στην ιδανική περίπτωση, το μοντέλο οπτικής γλώσσας vlm είναι το πρώτο μεγάλο μοντέλο στον κόσμο που αναπτύχθηκε με επιτυχία σε τσιπ στην πλευρά του αυτοκινήτου και έχει την ικανότητα να χειρίζεται τη λογική σκέψη και τη λήψη αποφάσεων σε πολύπλοκα σενάρια.

εκτός από το one model end-to-end, το system 2 - vlm είναι ένα άλλο σύνολο αλγορίθμων μοντέλων που βοηθούν το σύστημα 1 στον προγραμματισμό και τη λήψη αποφάσεων. το σύστημα 2 που βασίζεται σε vlm μπορεί να παρέχει τη δυνατότητα κατανόησης πολύπλοκων περιβαλλόντων, τη δυνατότητα ανάγνωσης χαρτών πλοήγησης και την ικανότητα κατανόησης των κανόνων κυκλοφορίας.

ο lang xianpeng έδωσε σε αυτόν τον συνδυασμό μια πιο δημοφιλή εξήγηση: το σύστημα 1 είναι σαν οδηγός και το system 2 είναι εκπαιδευτής σχολής οδήγησης. το σύστημα 1 βασίζεται εξ ολοκλήρου στη δική του οπτική αντίληψη για την εκτέλεση λειτουργιών.

ο zhan kun, ειδικός σε προηγμένους αλγόριθμους για έξυπνη οδήγηση του li auto, και η ομάδα του ήταν οι πρώτοι που πρότειναν αυτήν την ιδέα. ακολουθώντας το παράδειγμα του daniel kahneman, ενός γνωστικού ψυχολόγου και βραβευμένου με νόμπελ, πιστεύει ότι ο ανθρώπινος εγκέφαλος έχει δύο συστήματα.

τα δύο συστήματα εξυπηρετούν ολόκληρη την ιδανική έξυπνη οδήγηση, γεγονός που κάνει την ιδανική λύση έξυπνης οδήγησης εντελώς διαφορετική από άλλες εταιρείες αυτοκινήτων.

στην αγορά των ηπα, η tesla fsd κατέχει ηγετική θέση όσον αφορά την υπολογιστική ισχύ και τα δεδομένα.

αλλά στην κινεζική αγορά, η ιδανική στρατηγική φαίνεται να είναι η αναδημιουργία ενός «china tesla smart driving road» για να τοποθετηθεί πιο μπροστά.

ο λανγκ σιανπένγκ είπε:όσον αφορά την υπολογιστική ισχύ και τα δεδομένα εκπαίδευσης της κίνας, πιστεύουμε ότι τουλάχιστον από εδώ και πέρα είμαστε μπροστά από την tesla, επειδή η tesla εξακολουθεί να υπόκειται σε ορισμένους περιορισμούς στην κίνα όσον αφορά τη συμμόρφωση με τα δεδομένα και την ανάπτυξη υπολογιστικής ισχύος να κατασκευαστεί στην κίνα.”

η ideal εισάγει επίσης ένα παγκόσμιο σύστημα μοντέλων στη διαδικασία ελέγχου δεδομένων.

η ideal είπε ότι το παγκόσμιο μοντέλο υποστηρίζει την επανάληψη μεγάλης κλίμακας και υψηλής ταχύτητας μιας νέας γενιάς έξυπνης οδήγησης ideal, παρέχει ένα αυτοματοποιημένο σύστημα αξιολόγησης ικανότητας τεχνητής νοημοσύνης, χρησιμοποιεί τεχνολογία ανακατασκευής για να μετατρέψει τα σενάρια προβλημάτων που αντιμετωπίζουν οι χρήστες σε "λανθασμένα σύνολα ερωτήσεων". , και χρησιμοποιεί τεχνολογία παραγωγής για να μετατρέψει τους χρήστες σε "λάθος σύνολα ερωτήσεων". οι πραγματικές σκηνές οδήγησης χρησιμοποιούνται ως "ερωτήσεις προσομοίωσης". .

βασισμένο στην τεχνική λύση του ideal one model+vlm+world model, αυτό φέρνει επίσης μια νέα γενιά προϊόντων έξυπνης οδήγησης ideal σε ένα νέο στάδιο «εποπτευόμενης αυτόνομης οδήγησης».

η ideal είναι η πρώτη εταιρεία που ανέπτυξε το vlm σε τσιπ orin-x και η πρώτη εταιρεία αυτοκινήτων που υιοθέτησε αρχιτεκτονική διπλού συστήματος. στην κίνα, η ideal έχει ήδη όγκο πωλήσεων κοντά στο ένα εκατομμύριο, γεγονός που αναπόφευκτα θα αυξήσει το ποσοστό των αποτελεσματικών δεδομένων. η τρέχουσα συσσωρευμένη χιλιομετρική προπόνηση του li auto έχει ξεπεράσει τα 2,2 δισεκατομμύρια χιλιόμετρα και αναμένεται να ξεπεράσει τα 3 δισεκατομμύρια χιλιόμετρα μέχρι το τέλος του 2024. η τρέχουσα υπολογιστική ισχύς του li auto έχει φτάσει τα 5,39 eflops και αναμένεται να ξεπεράσει τα 8 eflops μέχρι το τέλος του 2024.

ωστόσο, η βιομηχανία εξακολουθεί να τσακώνεται για την εφαρμογή και τις προοπτικές της τεχνολογίας από άκρο σε άκρο - ορισμένοι πιστεύουν ότι η έξυπνη οδήγηση δεν μπορεί να επιτευχθεί χωρίς 50 δισεκατομμύρια, ενώ άλλοι πιστεύουν ότι τουλάχιστον τα επόμενα χρόνια, από άκρο σε άκρο οι αλγόριθμοι μοντέλων που βασίζονται σε κανόνες και οι συναρτήσεις μεμονωμένων μονάδων θα εξακολουθούν να είναι παράλληλες, το καθαρό από άκρο σε άκρο είναι ακόμα μαλακίες.

σε κάποιο βαθμό, τα αποτελέσματα δοκιμών της ομάδας ιδανικής εμπειρίας χρήστη έχουν επαληθεύσει τον τρέχοντα ορθολογισμό αυτής της διαδρομής. σε κάθε περίπτωση, η li auto πρωτοστάτησε σε αυτό το βήμα.

ο δρ lang xianpeng, αντιπρόεδρος έρευνας & ανάπτυξης έξυπνης οδήγησης της li auto, και zhan kun, ανώτερος ειδικός αλγορίθμων της li auto intelligent driving

ακολουθεί η συντομογραφία της ανταλλαγής με τον δρ. lang xianpeng, αντιπρόεδρο έρευνας και ανάπτυξης έξυπνης οδήγησης της li auto, και zhan kun, ανώτερου αλγορίθμου εμπειρογνώμονα του li auto intelligent driving.

ερώτηση: όλοι στην αγορά λένε ότι είναι από άκρο σε άκρο;

ζαν κουν:από άκρο σε άκρο είναι ένα παράδειγμα έρευνας και ανάπτυξης διεργασία από την είσοδο στην έξοδο. αυτό είναι από άκρο σε άκρο.

τώρα το ιδανικό αυτοκίνητο είναι ένα ολοκληρωμένο μοντέλο one model μέσω άμεσης εισόδου αισθητήρα, αφού ολοκληρωθεί το συμπέρασμα του μοντέλου, ο σχεδιασμός της τροχιάς χρησιμοποιείται απευθείας για τον έλεγχο του αυτοκινήτου, με αρ άλλα βήματα ενδιάμεσα. υπάρχει επίσης μια μέθοδος από άκρο σε άκρο, η οποία είναι η διαίρεση δύο μοντέλων στη μέση. ένα σήμα χρησιμοποιείται ως γέφυρα μεταξύ των μοντέλων. και συνδυάζονται σε ένα δομοστοιχειωτό από άκρο σε άκρο μοντέλο, αυτό μπορεί επίσης να ονομάζεται από άκρο σε άκρο, αλλά πιστεύουμε ότι τέτοιου είδους από άκρο σε άκρο δεν είναι πραγματικά από άκρο σε άκρο. . το ίδιο το li auto θέλει να λύσει την απώλεια ενδιάμεσων πληροφοριών εάν προστεθεί μια τεχνητή διαδικασία πέψης πληροφοριών στη μέση, η απόδοση μπορεί να μην είναι τόσο υψηλή ή το ανώτερο όριο των δυνατοτήτων μπορεί να είναι περιορισμένο ότι το ολοκληρωμένο από άκρο σε άκρο είναι το πιο ουσιαστικό από άκρο σε άκρο.

ερώτηση: είμαστε εμπνευσμένοι από την tesla υπάρχουν διαφορές σε σύγκριση με τις παραδοσιακές ενότητες από άκρο σε άκρο;

ζαν κουν:η tesla ανέφερε το end-to-end στις αρχές του 2023 και ο musk είπε στο twitter ότι ενσωματώνει ένα πλήρες μοντέλο άμεσου ελέγχου αυτοκινήτου από την είσοδο στην έξοδο. όλοι σοκαρίστηκαν όταν είδαν αυτή την είδηση, γιατί δεν πρότειναν μόνο αυτό το πράγμα το 2016, η nvidia είχε ένα μοντέλο που ανέφερε από άκρο σε άκρο και δημοσίευσε μια εργασία, αλλά το αποτέλεσμα ήταν μέτριο και έλυνε μόνο το πρόβλημα. σε ένα ιδιαίτερα απλό σενάριο, δεδομένης της υπολογιστικής ισχύος και της κλίμακας του μοντέλου εκείνη την εποχή, όλοι θεώρησαν ότι αυτό το μονοπάτι δεν ήταν εφικτό.

έως το 2023, θα προστεθεί εξαιρετικά μεγάλη υπολογιστική ισχύς στη νέα αρχιτεκτονική του μετασχηματιστή, μετά την κατασκευή ενός νέου παραδείγματος. από άκρο σε άκρο δεν είναι το πρώτο πράγμα που έχει προτείνει η tesla, αλλά προχωρά σε μια πιο αναπτυξιακή κατεύθυνση. αφού το δούμε αυτό, σκεφτόμαστε επίσης εσωτερικά σε σύγκριση με το προηγούμενο αρθρωτό μοντέλο, η προσέγγιση από άκρο σε άκρο είναι πιο σημαντική για τη μείωση του πλεονασμού των διαφόρων πληροφοριών. στο μοντέλο χωρίς γραφήματα, είμαστε κοντά στο δομοστοιχειωτό μοντέλο από άκρο σε άκρο. παρόλα αυτά, διαπιστώσαμε ότι το μοντέλο από άκρο σε άκρο χρειάζεται ακόμα κανόνες και εξακολουθούν να υπάρχουν δεδομένα χωρισμένα σε ενότητες και εργασίες πολιτικής χωρισμένες σε ενότητες.

αυτή τη φορά, στη συζήτηση και τη σύλληψη νέων λύσεων, προτείναμε ότι η λύση από άκρο σε άκρο πρέπει να είναι πιο εμπεριστατωμένη και ουσιαστική. το li auto έχει πολύ πλούσια δεδομένα και πιστεύουμε ότι αυτά τα δεδομένα μπορούν να μας βοηθήσουν να κάνουμε καλή δουλειά. αυτό είναι το πλεονέκτημά μας. έτσι, επιλέξαμε μια ολοκληρωμένη αρχιτεκτονική που είναι πιο απαιτητική και δύσκολη πολλή τεχνογνωσία για εξερεύνηση και ανασκαφή, αλλά και πάλι επιλέξαμε αποφασιστικά τον δύσκολο αλλά σωστό δρόμο.

ερώτηση: πολλές μάρκες ισχυρίζονται πλέον ότι είναι ηγέτες, και η li auto λέει επίσης ότι έχει εισέλθει στο πρώτο κλιμάκιο της έξυπνης οδήγησης πώς να αξιολογήσετε το από άκρο σε άκρο τεχνικό επίπεδο αυτών των εταιρειών στην αγορά;

lang xianpeng:από τεχνικής άποψης, για τους απλούς καταναλωτές, δεν τους ενδιαφέρει αν υπάρχουν φωτογραφίες ή όχι, από άκρο σε άκρο ή από άκρο σε άκρο αυτό στο οποίο εστιάζεται τελικά ο καθένας είναι το προϊόν και η εμπειρία χρήσης καθώς και την αξία του προϊόντος. επομένως, δεν προσπαθούμε να ανταγωνιστούμε κανέναν, αλλά ελπίζουμε να παρέχουμε καλύτερα προϊόντα και υπηρεσίες στους χρήστες μας. στο παρελθόν, το noa υψηλής ταχύτητας χρησιμοποιήθηκε με χάρτες υψηλής ακρίβειας και η εμπειρία noa υψηλής ταχύτητας ανταποκρίνονταν στις ανάγκες των χρηστών. στη συνέχεια, δοκιμάσαμε πολλές μεθόδους στη διαδικασία κατασκευής του noa της πόλης. παρέχετε φωτεινές εικόνες. αλλά πιστεύουμε ότι τα ελαφριά γραφήματα δεν είναι εφικτά, γιατί από τη στιγμή που χρειάζονται επαναληπτικά γραφήματα, προκύπτουν ζητήματα σχετικά με την επικαιρότητα και το κατά πόσο μπορούν πραγματικά να χρησιμοποιηθούν. δεν μπορούμε να αφήσουμε τους χρήστες να πιστεύουν ότι ένα μέρος που είναι διαθέσιμο σήμερα δεν θα είναι διαθέσιμο αύριο.

στο τέλος, αποφασίσαμε να το κάνουμε απλά χωρίς φωτογραφίες. η προηγούμενη λύση χωρίς εικόνα βασιζόταν σε λύσεις αντίληψης, σχεδιασμού και υπομονάδων, οι οποίες περιελάμβαναν μεγάλο αριθμό χειροκίνητων κανόνων και πραγματικές δοκιμές οχημάτων, για να μην αναφέρουμε την επένδυση προϋπολογισμού, ήταν πολύ δύσκολη από άποψη χρόνου. όταν το μοντέλο επαναλαμβάνεται, εάν θέλετε να αντιμετωπίσετε διάφορες συνθήκες κατά τη διάρκεια του έτους, δεν θα είναι δυνατό μέσα σε ένα ή δύο χρόνια και οι χρήστες δεν μπορούν να περιμένουν τόσο πολύ. έτσι, επαναλάβαμε την τεχνική αρχιτεκτονική από άκρο σε άκρο + vlm, νομίζω ότι αυτή η τεχνική λύση είναι ουσιαστικά μια λύση τεχνητής νοημοσύνης.

επιπλέον, σήμερα σας παρουσίασα το περιεχόμενο του παγκόσμιου μοντέλου. κατά τη γνώμη μου, αυτή η ικανότητα είναι η πιο σημαντική και απαραίτητη εγγύηση για την επίτευξη γρήγορης επανάληψης της αυτόνομης οδήγησης.μια επανάληψη μοντέλου θα απαιτούσε μεγάλο αριθμό οχημάτων, ανθρώπων και χρόνου να δοκιμαστεί με τον παραδοσιακό τρόπο, αλλά τώρα χρησιμοποιούμε την τεχνολογία παραγωγής και ανακατασκευής για να συλλέξουμε τις σκηνές όπου παρουσιάστηκαν προβλήματα στο παρελθόν και να δημιουργήσουμε μια βιβλιοθήκη με λάθος σενάρια σκηνών.πριν από κάθε κυκλοφορία, έγιναν περισσότερα από 10 εκατομμύρια χιλιόμετρα δοκιμών σε απλές λανθασμένες ερωτήσεις, και αυτό είναι ένα αποτελεσματικό σύνολο λανθασμένων ερωτήσεων, όχι ένα τυχαίο τεστ δρόμου. επιπλέον, μπορούμε επίσης να δημιουργήσουμε σενάρια και να προσομοιώσουμε σενάρια, τα οποία είναι επίσης δεκάδες εκατομμύρια δοκιμές σεναρίων. η επανάληψη του μοντέλου με αυτόν τον τρόπο είναι πλέον πολύ πιο αξιόπιστη από την αρχική μέθοδο δοκιμής οχήματος ή δρόμου και μπορεί να καλύψει διάφορα σενάρια κατά τη διάρκεια του έτους. αυτή είναι η προσέγγισή μας δεν ξέρουμε αν άλλες επωνυμίες το κάνουν αυτό, αλλά βασιζόμαστε πλήρως στις ανάγκες των χρηστών. επαναλαμβάνουμε την τεχνολογία, όχι για χάρη της τεχνολογίας, αλλά επειδή αυτή η τεχνολογία μπορεί πραγματικά να λύσει τις ανάγκες των χρηστών και να προσφέρει καλύτερη εμπειρία προϊόντος, τότε θα το κάνουμε αυτό.

ερώτηση: πριν από λίγο καιρό, κάποιος πρόβαλε την ιδέα ότι «είναι αδύνατο να κάνεις έξυπνη οδήγηση χωρίς 50 δισεκατομμύρια».

lang xianpeng:όσον αφορά τα 50 δισεκατομμύρια, πρέπει να κρίνετε εάν πρόκειται για μια εφάπαξ επένδυση ή για μια μακροπρόθεσμη επένδυση, επενδύουμε 1 δισεκατομμύριο δολάρια στην έρευνα και ανάπτυξη της έξυπνης οδήγησης κάθε χρόνο. θα ξεπεράσει τα 50 δις.

η τεχνική αρχιτεκτονική end-to-end + vlm είναι μια κρίσιμη καμπή.πριν, εξακολουθούσαμε να χρησιμοποιούμε παραδοσιακές μεθόδους για αυτόνομη οδήγηση ξεκινώντας από αυτή τη γενιά, χρησιμοποιούμε πραγματικά τεχνητή νοημοσύνη για αυτόνομη οδήγηση. στη συνέχεια, στην έρευνα και ανάπτυξη της αυτόνομης οδήγησης, ο βασικός ανταγωνισμός είναι αν υπάρχουν περισσότερα και καλύτερα δεδομένα και η αντίστοιχη υπολογιστική ισχύς για την εκπαίδευση του μοντέλου. η απόκτηση υπολογιστικής ισχύος και δεδομένων εξαρτάται από το πόσα χρήματα δαπανώνται και πόσοι πόροι επενδύονται. μερικά από αυτά τα πράγματα δεν μπορούν να αγοραστούν με χρήματα, όπως τα δεδομένα προπόνησης και τα χιλιόμετρα προπόνησης κάθε εταιρεία αυτοκινήτων έχει τα δικά της δεδομένα και δεν τα μοιράζεται μεταξύ τους.

ένα άλλο πράγμα που απαιτεί επένδυση είναι η υπολογιστική ισχύς.η τρέχουσα υπολογιστική μας ισχύς των 539 εκατομμυρίων eflops αναμένεται να είναι 800 εκατομμύρια eflops μέχρι το τέλος αυτού του έτους. κατά την είσοδο στο στάδιο l4 στο μέλλον, η ετήσια αύξηση των δεδομένων και η αύξηση της υπολογιστικής ισχύος θα είναι εκθετική, πράγμα που σημαίνει ότι θα απαιτούνται τουλάχιστον 1 δισεκατομμύριο δολάρια ηπα (έξι έως επτά δισεκατομμύρια γιουάν) κάθε χρόνο. και μετά από 5 χρόνια, θα πρέπει να συνεχίσει να επαναλαμβάνεται σε αυτό το επίπεδο, θα είναι πολύ δύσκολο εάν τα κέρδη και τα κέρδη μιας εταιρείας δεν μπορούν να υποστηρίξουν την επένδυση. επομένως, τώρα δεν χρειάζεται να δώσουμε προσοχή στο πόσα δισεκατομμύρια επενδύονται στην αυτόνομη οδήγηση. .

ερώτηση: πώς να διασφαλιστεί η ασφάλεια του μοντέλου όταν ο όγκος των δεδομένων δεν είναι πολύ μεγάλος από εννοιολογική άποψη, είμαστε τώρα και ένα είδος «δύο μοντέλων»;

lang xianpeng:η «ασφάλεια» είναι ένα θέμα που έχει τραβήξει την προσοχή, αν υπάρχουν προβλήματα συντονισμού, αν υπάρχουν ανεξάρτητες μονάδες ασφαλείας κ.λπ. ο λόγος για τον οποίο όλοι έχουν αυτά τα προβλήματα είναι επειδή όλοι σκέφτονται από την οπτική γωνία της προηγούμενης έρευνας και ανάπτυξης αυτόνομης οδήγησης χωρίς τεχνητή νοημοσύνη. για παράδειγμα, συνήθιζα να ιππεύω ένα άλογο. με ρωτούσε αν υπήρχε σέλα στο αυτοκίνητο. είναι επειδή ο καθένας δεν έχει καταλάβει πραγματικά τι είναι οι πρακτικές τεχνητής νοημοσύνης και τι είναι οι πρακτικές που δεν είναι ai αυτό είναι το πρώτο σημείο.

δεύτερον, πολλοί άνθρωποι λένε τώρα ότι έχουν ένα μοντέλο από άκρο σε άκρο, αλλά το πραγματικό μοντέλο από άκρο σε άκρο εξακολουθεί να εξαρτάται από δύο δυνατότητες: εάν υπάρχουν αρκετά δεδομένα και εάν υπάρχει επαρκής υπολογιστική ισχύς. διαφορετικά, νομίζω ότι θα είναι δύσκολο να επιτευχθεί αληθινή από άκρο σε άκρο, επειδή το end-to-end είναι μια προσέγγιση τεχνητής νοημοσύνης.

τρίτον, τα άνω και κάτω όρια των δυνατοτήτων από άκρο σε άκρο είναι πολύ υψηλά. επιτρέψτε μου να κάνω μια αναλογία προτού εμφανιστεί το cnn (μοντέλο βαθιού νευρικού δικτύου), όλοι εξακολουθούσαν να χρησιμοποιούν παραδοσιακές μεθόδους μηχανικής μάθησης για να κάνουν κάποια εργασία, όπως οι εργασίες ταξινόμησης εικόνων που γνωρίζουμε εκείνη την εποχή, οι αλγόριθμοι svm αντιμετώπιζαν συμφόρηση. αλλά μόλις βγήκε το cnn, καταπνίγηκαν τη βελτίωσή τους κατά 10%. αυτό που θέλω να εκφράσω είναι ότι όλοι δεν έχουν κατανοήσει πραγματικά τις δυνατότητες από άκρο σε άκρο και δεν θα βιαστούμε να το προωθήσουμε στους εσωτερικούς χρήστες beta.

όταν χρησιμοποιούμε μεθόδους εκτός τεχνητής νοημοσύνης, πρέπει να λάβουμε υπόψη πολλά σενάρια όσον αφορά τις λεπτομέρειες κάθετου ελέγχου. με αυτόν τον τρόπο, κατά τον σχεδιασμό κανόνων σκηνής, πρέπει να θέσουμε πολλές προϋποθέσεις για να ορίσουμε ποιες ενέργειες πρέπει να γίνουν υπό ορισμένες συνθήκες. συνθήκες. αλλά όταν εκπαιδεύτηκε η πρώτη μας έκδοση του μοντέλου από άκρο σε άκρο, διαπίστωσα ότι θα ήταν πολύ άνετο σε κάθε διασταύρωση ή σε συνθήκες που απαιτούν διαμήκη έλεγχο. δεν κάναμε εντοπισμό σφαλμάτων για ειδικές καταστάσεις, ήταν η ικανότητα του μοντέλου να εκπαιδεύεται. μπορεί να διαπιστωθεί ότι έχουμε μεγάλο πρόβλημα όταν κάνουμε κανόνες, επειδή τα σενάρια είναι πολύ διαφορετικά και είναι αδύνατο να θέσουμε κανόνες για όλα τα σενάρια. αλλά όταν χρησιμοποιούμε την τεχνητή νοημοσύνη για να δημιουργήσουμε ένα μοντέλο από άκρο σε άκρο, θα διαπιστώσουμε ότι έχει αυτή τη μαγική δύναμη, όταν του δίνουμε δεδομένα, μπορεί πραγματικά να μάθει την οδηγική εμπειρία αυτών των ανθρώπων , αλλά μπορεί επίσης να βελτιώσει σημαντικά το μοντέλο. αν και εξακολουθεί να έχει τους δικούς του περιορισμούς, ο τρόπος που το λύνουμε δεν είναι πλέον να θέτουμε κανόνες, αλλά να του δίνουμε περισσότερα και καλύτερα δεδομένα.

ομοίως, έχουμε επίσης μια στρατηγική χωρίς μυαλό για τη μονάδα ελέγχου. επειδή η είσοδος του αισθητήρα από άκρο σε άκρο είναι είσοδος στην έξοδο τροχιάς και η έξοδος τροχιάς δίνεται στις μονάδες διεύθυνσης και πέδησης εδώ έχουμε μια πολιτική ασφαλείας, για παράδειγμα, εάν σκοπεύει να κάνει μια απότομη στροφή 180°. θα οι περιορισμοί εφαρμόζονται, αλλά υπάρχουν πολύ λίγοι παρόμοιοι κανόνες, οι οποίοι μπορούν να αγνοηθούν σε σύγκριση με την προηγούμενη προσέγγιση.

ταυτόχρονα, έχουμε βελτιώσει την κατώτατη γραμμή ασφάλειας και το ανώτατο όριο δυνατοτήτων, η προσέγγισή μας είναι να του παρέχουμε συνεχώς δεδομένα υψηλής ποιότητας και σίγουρα θα μάθει πολλές συνήθειες ασφαλούς οδήγησης.

ερώτηση: πώς να διασφαλίσετε ότι τα δεδομένα end-to-end + vlm είναι καθαρά;

ζαν κουν:είτε κάνετε end-to-end είτε vlm, τα δεδομένα είναι τα πιο σημαντικά και τα μεγάλα μοντέλα έδιναν πάντα έμφαση στα δεδομένα υψηλής ποιότητας.έτσι, το πρώτο μας βήμα είναι να καθαρίσουμε τις πηγές δεδομένων.η επιλογή των δεδομένων οδήγησης είναι πολύ αυστηρή έχουμε μια εσωτερική βαθμολογία για κάθε ιδιοκτήτη αυτοκινήτου, η οποία περιλαμβάνει διάφορες διαστάσεις και είναι σταθμισμένη, όπως εάν υπάρχει παραβίαση οδήγησης, εάν η γραμμή έχει πατηθεί για μεγάλο χρονικό διάστημα, εάν η στάση. η γραμμή έχει σταθμεύσει και εάν η διαδικασία οδήγησης είναι το 3% των κορυφαίων χρηστών θα επιλεγεί ως "έμπειροι οδηγοί" με βάση τις βαθμολογίες που δίνονται από διάφορους δείκτες, όπως όταν στρίβετε το τιμόνι με μέτριο ή επείγοντα τρόπο ή όταν αντιμετωπίζετε δυσφορία. στην περίπτωση των ιδανικών δεδομένων μεγάλης κλίμακας, ακόμη και το πρώτο 3% είναι πολύ μεγάλο ποσό δεδομένων εάν τα δεδομένα δίνονται από άκρο σε άκρο.

υπάρχει επίσης έλεγχος στο δεύτερο επίπεδο κατά τη διάρκεια της διαδικασίας εκπαίδευσης του μοντέλου, πρέπει επίσης να ταιριάξουμε και να ταξινομήσουμε τα δείγματα μοντέλων σε ορισμένα σενάρια μπορεί να καθαρίσει τα δεδομένα και να ταξινομήσει κάθε τύπο δεδομένων σε πολύ λεπτομερείς ετικέτες.

στο τελευταίο επίπεδο, θα γνωρίζουμε ποια δείγματα είναι δύσκολο να μάθουμε κατά τη διάρκεια της εκπαιδευτικής διαδικασίας και θα προσαρμόσουμε τη στρατηγική μάθησης, συμπεριλαμβανομένης της σκόπιμης κατασκευής ορισμένων συνθετικών δεδομένων για ενισχυτική μάθηση και αντίθεση μάθησης. κάντε ορισμένες προσαρμογές στις μεθόδους εκμάθησης για τα δεδομένα μας, έτσι ώστε όλα τα δεδομένα από άκρο σε άκρο και τα δεδομένα vlm να επαληθεύονται και να καθαρίζονται καλά και το μοντέλο που προκύπτει θα είναι καλύτερο. αυτή η διαδικασία δεν γίνεται από τη μια μέρα στην άλλη.

lang xianpeng:υπάρχει ένα άλλο πρόβλημα, το πρόβλημα των βρώμικων δεδομένων. ο όγκος των δεδομένων μας για την προπόνηση εξακολουθεί να είναι σχετικά μεγάλος, ακόμα κι αν έχουμε πολύ μικρά βρώμικα δεδομένα αργότερα, επειδή η προπόνηση ικανότητας τεχνητής νοημοσύνης δεν έχει λεκέ που μπορεί να μολύνει ολόκληρο το αποτέλεσμα, οπότε εφόσον η ποσότητα των ακριβών δεδομένων είναι αρκετά μεγάλη. θα είναι μια μικρή παρέμβαση τα δεδομένα δεν έχουν και μεγάλη σημασία.

ερώτηση: τα τελευταία χρόνια, η τεχνολογική μάχη της έξυπνης οδήγησης έχει αλλάξει γρήγορα και έχει περάσει από πολλές σημαντικές επαναλήψεις. θα είναι ένα πλαίσιο με μακροπρόθεσμη ζωτικότητα;

lang xianpeng:το end-to-end + vlm είναι μια αρχιτεκτονική που προσομοιώνει την ανθρώπινη σκέψη και τη γνώση, γιατί όταν κάνουμε τεχνητή νοημοσύνη, ελπίζουμε τελικά να επιτύχουμε ανθρωπομορφισμό ή ομοιότητα με τον άνθρωπο. εμπνεύστηκα πολύ μετά την ανάγνωση του βιβλίου "thinking, fast and slow" και τελικά ήθελα να μάθω πώς οι άνθρωποι κάνουν τη γνώση και τη σκέψη πιστεύουμε ότι το τρέχον πλαίσιο τεχνητής νοημοσύνης είναι πολύ λογικό και είμαι επίσης πολύ χαρούμενος που το βλέπω μετά το προτείναμε, πολλές εταιρείες του κλάδου άρχισαν να αναφέρουν τα οφέλη της θεωρίας του διπλού συστήματος και προσπαθούν να δώσουν συνέχεια. επιπλέον, η θεωρία του διπλού συστήματος δεν μπορεί να χρησιμοποιηθεί μόνο στην αυτόνομη οδήγηση, αλλά είναι επίσης ένα παράδειγμα για μελλοντική τεχνητή νοημοσύνη και ακόμη και για ευφυή ρομπότ. η αυτόνομη οδήγηση μπορεί να ειπωθεί ότι είναι ένα έξυπνο ρομπότ με τροχούς, αλλά το πεδίο λειτουργίας της είναι ο δρόμος. ως εκ τούτου, νομίζω ότι έχει ορισμένες μακροπρόθεσμες δυνατότητες, αλλά η τεχνολογική ανάπτυξη είναι ατελείωτη. θα διατηρήσουμε έντονη επίγνωση των προηγμένων τεχνολογιών και εάν υπάρχουν νέες τεχνολογίες, θα τις παρακολουθούμε επίσης.

ερώτηση: η ideal αισθάνεται αυτήν τη στιγμή ότι υπάρχει μεγάλο χάσμα μεταξύ εμένα και της έξυπνης οδήγησης της tesla και πότε θα μπορέσω να προλάβω;

lang xianpeng:πέρυσι απάντησα ότι ήταν λιγότερο από μισό χρόνο και φέτος μπορεί να είναι λίγο λιγότερο. πρώτον, όσον αφορά την τεχνική αρχιτεκτονική, δεν διαφέρουμε πολύ από την tesla και είμαστε έστω και λίγο μπροστά, γιατί έχουμε vlm και system 2, ενώ η tesla έχει μόνο system 1, από άκρο σε άκρο. δεύτερον, όσον αφορά την υπολογιστική ισχύ και τα δεδομένα εκπαίδευσης της κίνας, πιστεύουμε ότι τουλάχιστον από εδώ και πέρα είμαστε μπροστά από την tesla, επειδή η tesla εξακολουθεί να υπόκειται σε ορισμένους περιορισμούς στην κίνα όσον αφορά τη συμμόρφωση των δεδομένων, καθώς και την εκπαίδευση η ανάπτυξη η υπολογιστική ισχύς πρέπει ακόμη να εδραιωθεί στην κίνα. από αυτή την άποψη, το χάσμα μεταξύ μας στην κίνα και την tesla μπορεί να μην είναι τόσο μεγάλο. ελπίζουμε επίσης ότι η tesla μπορεί να ενταχθεί, να μάθει ο ένας από τον άλλον και να επικεντρωθεί στη βελτίωση του εαυτού μας.

ερώτηση: υπάρχει μια άποψη ότι η διαδρομή ai για έξυπνη οδήγηση δεν είναι αρκετά σωστή και δεν νομίζω ότι αυτή η διαδρομή μπορεί να λειτουργήσει, επειδή η l2 δίνει μεγαλύτερη προσοχή στο χαμηλό κόστος ή την ευελιξία, αλλά το l4 μπορεί να επιτύχει καθολικότητα μόνο μετά από η ασφάλεια έχει λυθεί, άρα μαζική παραγωγή μπορεί το αυτοκίνητο να είναι l4;

lang xianpeng:πρώτα,πιστεύουμε ότι όλα πρέπει να ξεκινούν από τις ανάγκες των χρηστών και την αξία του χρήστη.κάθε προϊόν που κατασκευάζεται από τη li auto πρέπει να υπερβαίνει ή να ικανοποιεί την αξία του χρήστη. πιστεύουμε ότι οι χρήστες πρέπει να έχουν ζήτηση για αυτόνομη οδήγηση, επομένως είναι αδύνατο να σχεδιάσουμε ότι οι χρήστες μπορούν να οδηγούν l4 μόνο στο chengdu και όχι αλλού.

δεύτερον, η προοδευτική ή άλμα τεχνική διαδρομή επιτρέπει σε κάθε μάρκα να συζητήσει και να επιλέξει τη δική της τεχνική διαδρομή.αλλά το li auto σίγουρα θα επιλέξει μια τεχνική διαδρομή που να ανταποκρίνεται στις ανάγκες των χρηστών.τώρα επιλέγουμε να χρησιμοποιήσουμε τεχνητή νοημοσύνη για να κάνουμε αυτόνομη οδήγηση. παλαιότερα ονομαζόταν υποβοηθούμενη οδήγηση, το σύστημα βοηθούσε τους ανθρώπους να οδηγούν και το θέμα ήταν άνθρωποι. αλλά μετά το στάδιο end-to-end + vlm, πιστεύουμε ότι το αυτοκίνητο θα οδηγήσει μόνο του. μετά την εκπαίδευση ενός πλήρους μοντέλου, το μοντέλο θα είναι σε θέση να οδηγεί το αυτοκίνητο καλά, θα επιβλέπω όπου το αυτοκίνητο δεν λειτουργεί ή εάν υπάρχουν προτροπές ότι πρέπει να το αναλάβετε θα χρησιμεύσει ως βοηθητικός ρόλος στην επίβλεψη, αν φτάσει σε αυτό το επίπεδο, θα ικανοποιήσει την απαίτηση των χρηστών για αυτόνομη οδήγηση.

ερώτηση: η li auto σχεδιάζει να χρεώσει για έξυπνη οδήγηση υψηλής ποιότητας;

lang xianpeng:τυπικές και δωρεάν είναι και οι δύο στρατηγικές που έχει διαμορφώσει η ideal από την πρώτη μέρα της έξυπνης οδήγησης. ο όγκος παράδοσης είναι σχετικά καλός και οι λειτουργίες της εταιρείας είναι σταθερές. διαθέτει επίσης επαρκείς πόρους για να επενδύσει σε έρευνα και ανάπτυξη έξυπνης οδήγησης. ο όγκος παράδοσης είναι μια πολύ σημαντική μέτρηση για εμάς, δεν αφορά μόνο τον όγκο παράδοσης, αλλά μπορεί επίσης να προσφέρει περισσότερα μίλια εκπαίδευσης οχημάτων για αυτόνομη οδήγηση.

νέα

διάλογος με την ideal lang xianpeng: είμαστε ήδη μπροστά από την tesla

εισαγωγή

τα στοιχεία επικοινωνίας μου