Νέα

Li Auto Lang Xianpeng: Χωρίς κέρδος 1 δισεκατομμυρίου δολαρίων στο μέλλον, δεν μπορούμε να αντέξουμε οικονομικά την αυτόνομη οδήγηση 36Kr Αποκλειστική Συνέντευξη

2024-08-06

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Συνέντευξη|Li Qin και Li Anqi

Κείμενο |

Συντάκτης |

Στις αρχές Ιουνίου, μια ημέρα πριν από την ομιλία του στο Chongqing Automobile Forum, ο Li Xiang, Διευθύνων Σύμβουλος της Li Auto, άλλαξε προσωρινά το σενάριο της ομιλίας. Η ομάδα του ετοίμασε αρχικά ένα θέμα για την τεχνητή νοημοσύνη, αλλά αυτό για το οποίο ήθελε να μιλήσει ο Λι ήταν η αυτόνομη οδήγηση.

Ο Λι Σιάνγκ είπε στη συνάντηση ότι η αυτόνομη οδήγηση στο μέλλον θα μοιάζει με τους ανθρώπους, με ικανότητα γρήγορης αντίδρασης και ικανότητα χειρισμού σύνθετων γεγονότων με λογική λογική. Η ιδανική απάντηση είναι: από άκρο σε άκρο + οπτικό μοντέλο γλώσσας VLM - αυτό είναι επίσης το πιο καυτό θέμα στον κλάδο της έξυπνης οδήγησης αυτή τη στιγμή.

Ένα μήνα αργότερα, η ομάδα έξυπνης οδήγησης της Li Auto κυκλοφόρησε μια λεπτομερή λύση "από άκρο σε άκρο + VLM", Διαφορετική από την "τμηματοποιημένη από άκρο σε άκρο" των εγχώριων ομολόγων, η λύση της Li Auto είναι πιο κοντά στην Tesla και ονομάζεται "One". Μοντέλο», ένα μεγάλο δίχτυ.

Με την εντύπωση του έξω κόσμου, το ιδανικό έξυπνο αυτοκίνητο ήταν πάντα κυνηγός. Κατά τη διάρκεια του σκληρού πολέμου Kaicheng στη βιομηχανία πέρυσι, προκειμένου να ανταποκριθεί στους ρυθμούς της βιομηχανίας, η Ideal άρχισε να αλλάζει συχνά τη διαδρομή της: από το να βασίζεται σε χάρτες υψηλής ακρίβειας στους ελαφρούς χάρτες (δίκτυα χαρακτηριστικών NPN) και στη συνέχεια να καταργεί χάρτες υψηλής ακρίβειας.

Ο Lang Xianpeng, αντιπρόεδρος έρευνας και ανάπτυξης έξυπνης οδήγησης της Li Auto, και η Jia Peng, επικεφαλής της έρευνας και ανάπτυξης τεχνολογίας έξυπνης οδήγησης, δέχτηκαν πρόσφατα μια συνέντευξη με την 36Kr Κοιτάζοντας πίσω σε αυτό το ταξίδι αναζήτησης, ο Lang Xianpeng κατέληξε: «Ο πυρήνας Η αρχή είναι αν μπορούμε να βρούμε την ουσία του προβλήματος και μετά να αποφασίσουμε Γρήγορη διόρθωση».

Η επιλογή της τεχνικής διαδρομής "από άκρο σε άκρο" αποτελεί επίσης συνέχεια αυτής της αρχής. Ο Lang Xianpeng είπε ότι στο παρελθόν οι έξυπνες λύσεις οδήγησης, είτε ήταν χάρτες είτε χωρίς χάρτη, η υποκείμενη τεχνική αρχιτεκτονική ήταν «βασισμένη στον χάρτη» και λειτουργούσε σύμφωνα με την υπάρχουσα «διαδικασία αντίληψης προς έλεγχο». Οι πληροφορίες ήταν κατεστραμμένες και η ρύθμιση και ο έλεγχος κατάντη ήταν περιορισμένοι.

Φυσικά, η επένδυση πόρων εξακολουθεί να είναι ένα δευτερεύον ζήτημα.

Το "End-to-end + VLM + world model" είναι το ιδανικό παράδειγμα εφαρμογής τεχνητής νοημοσύνης.

Για να το θέσω απλά, η ιδανική λύση από άκρο σε άκρο εξαλείφει τις πολλαπλές ανεξάρτητες μονάδες του αρχικού ευφυούς συστήματος οδήγησης, όπως η αντίληψη, η πρόβλεψη και ο έλεγχος προγραμματισμού που βασίζονται σε τεχνητούς κανόνες, και τις συγχωνεύει σε ένα μεγάλο νευρωνικό δίκτυο. "Εισαγωγή δεδομένων αισθητήρα και προγραμματισμένη τροχιά εξόδου."

Το μοντέλο οπτικής γλώσσας VLM παρέχει μια προσθήκη από άκρο σε άκρο παρόμοια με το ChatGPT. Το ερώτημα από άκρο σε άκρο είναι «τι είδους δεδομένα του δίνετε, τι είδους συμπεριφορά θα έχει Το μοντέλο οπτικής γλώσσας VLM έχει την ικανότητα να κατανοεί τον κόσμο και τη λογική συλλογιστική». Σε πολύπλοκα σενάρια, οι χρήστες από άκρο σε άκρο μπορούν να κάνουν ερωτήσεις VLM σε πραγματικό χρόνο και οι τελευταίοι θα δίνουν σχετικές προτάσεις οδήγησης.

Το παγκόσμιο μοντέλο είναι ένα τεράστιο λάθος βιβλίο δοκιμών, το οποίο μπορεί να δημιουργήσει δεδομένα προσομοίωσης μέσω ανακατασκευής + παραγωγής, συν πραγματικές περιπτώσεις που συσσωρεύονται πριν από το Ideal, σχηματίζοντας "πραγματικές ερωτήσεις δοκιμής + προσομοιωμένες ερωτήσεις δοκιμής" για τη δοκιμή του μοντέλου από άκρο σε άκρο. Μόνο αφού το μοντέλο περάσει το τεστ και λάβει υψηλές βαθμολογίες, μπορεί να προωθηθεί στους χρήστες.

Εσωτερικά, αυτά τα τρία μοντέλα ονομάζονται System 1, System 2 και System 3 αντίστοιχα. Το Σύστημα 1 αντιστοιχεί στον τρόπο σκέψης σε πραγματικό χρόνο στον ανθρώπινο εγκέφαλο, το Σύστημα 2 αντιστοιχεί στη λογική σκέψη στον ανθρώπινο εγκέφαλο και το Σύστημα 3 είναι ένα μοντέλο εξέτασης υπεύθυνο για την αποδοχή των αποτελεσμάτων εκπαίδευσης και μάθησης του Συστήματος 1 και του Συστήματος 2.

Η τεχνολογία έξυπνης οδήγησης από άκρο σε άκρο ξεκίνησε από την Tesla. Τον Αύγουστο του 2023, ο Musk έδειξε τις δυνατότητες της έκδοσης FSD v12 από άκρο σε άκρο σε ζωντανή μετάδοση Επί του παρόντος, το FSD έχει επαναληφθεί στην έκδοση v12.5. Αλλά σε αντίθεση με την Tesla, εκτός από το end-to-end και το παγκόσμιο μοντέλο, η Ideal εισάγει επίσης δυνατότητες μοντέλων μεγάλης γλώσσας VLM.

Ο Jia Peng εξήγησε στο 36Kr ότι πέρασε μια εβδομάδα στην Ανατολική και τη Δυτική Ακτή των Ηνωμένων Πολιτειών δοκιμάζοντας το FSD του Tesla και διαπίστωσε ότι ακόμη και το "από άκρο σε άκρο" έχει ένα ανώτερο όριο. Στην ανατολική ακτή των Ηνωμένων Πολιτειών, όπου οι συνθήκες του δρόμου είναι περίπλοκες, όπως η Νέα Υόρκη και η Βοστώνη, το ποσοστό αποδοχής της Tesla έχει αυξηθεί σημαντικά «Ο αριθμός των παραμέτρων του μοντέλου από άκρο σε άκρο που μπορούν να εκτελεστούν στο HW3.0 να είναι ιδιαίτερα μεγάλο και η χωρητικότητα του μοντέλου έχει επίσης ένα φυσικό ανώτατο όριο."

Ο ιδανικά σχεδιασμένος ρόλος του VLM είναι να αυξήσει το ανώτατο όριο του "από άκρο σε άκρο". -Τερματισμός συστήματος σε κρίσιμες στιγμές.

Τόσο ο Lang Xianpeng όσο και η Jia Peng πιστεύουν ότι το VLM είναι η μεγαλύτερη μεταβλητή στο ιδανικό έξυπνο σύστημα οδήγησης. Επειδή οι παράμετροι του VLM έχουν φτάσει τα 2,2 δισεκατομμύρια και ο χρόνος απόκρισης είναι 300 χιλιοστά του δευτερολέπτου, εάν υπάρχει ένα τσιπ με μεγαλύτερη υπολογιστική ισχύ, ο αριθμός των παραμέτρων που μπορεί να αναπτυχθεί από το VLM θα φτάσει τα δεκάδες δισεκατομμύρια, που είναι η καλύτερη διαδρομή για προχωρημένους αυτόνομη οδήγηση L3/L4.

"Το ίδιο το VLM παρακολουθεί επίσης την ανάπτυξη της τεχνολογίας μοντέλων μεγάλων γλωσσών. Κανείς δεν μπορεί να απαντήσει πόσο μεγάλος θα είναι ο αριθμός των παραμέτρων τελικά."

Δεν είναι δύσκολο να διαπιστώσουμε ότι χαρακτηριστικά όπως τα μοντέλα με βάση τα δεδομένα και τα μεγάλα οπτικά μοντέλα γλώσσας καθορίζουν ότι η βιομηχανία ευφυούς οδήγησης έχει συμμετάσχει στο παιχνίδι υπολογιστικής ισχύος που ξεκίνησε από εταιρείες όπως η OpenAI, η Microsoft και η Tesla.

Ο Lang Xianpeng δεν μάσησε τα λόγια του, αυτό που όλοι συγκρίνουν είναι η ποσότητα και η ποιότητα των δεδομένων, καθώς και το απόθεμα υπολογιστικής ισχύος. Τα δεδομένα υψηλής ποιότητας βασίζονται σε απόλυτη κλίμακα δεδομένων για την υποστήριξη της εκπαίδευσης του μοντέλου L4 απαιτούνται περίπου δεκάδες EFLOPS υπολογιστικής ισχύος.

«Καμία εταιρεία χωρίς καθαρό κέρδος 1 δισεκατομμυρίου δολαρίων δεν θα μπορεί να αντέξει οικονομικά την αυτόνομη οδήγηση στο μέλλον».

Προς το παρόν, η υπολογιστική ισχύς cloud της Li Auto είναι 4,5 EFLOPS, γεγονός που μείωσε γρήγορα τη διαφορά με την κορυφαία εταιρεία Huawei. Σύμφωνα με το 36Kr Auto, η Ideal αγόρασε πρόσφατα μεγάλο αριθμό τσιπ cloud NVIDIA και «βασικά αγόρασε όλες τις κάρτες στα χέρια των εμπόρων καναλιών».

Ο ίδιος ο Διευθύνων Σύμβουλος Li Xiang έχει επίσης μια εικόνα για την τάση αυτού του ανταγωνισμού: χρήση πόρων και ευφυούς τεχνολογικής μόχλευσης για να απαλλαγούμε από συνομηλίκους. Συχνά παίρνει την πρωτοβουλία να ρωτήσει τον Lang Xianpeng, "Υπάρχουν αρκετοί υπολογιστικοί πόροι; Δεν επαρκούν για τον Xie Yan (ιδανικός CTO) να πάρει περισσότερα."

"Έχουμε επίσης αυτοκίνητα και περισσότερα χρήματα από άλλους. Έχουμε μια μεγάλη ευκαιρία να διευρύνουμε τη διαφορά με τους αντιπάλους μας σε αυτόν τον δρόμο." Η οικονομική έκθεση δείχνει ότι από το πρώτο τρίμηνο του τρέχοντος έτους, τα ταμειακά αποθέματα της Li Auto ήταν κοντά στα 99 δισεκατομμύρια γιουάν.

Το Ideal μπορεί να δει από εσωτερικά δεδομένα ότι ο επιχειρηματικός κλειστός βρόχος της έξυπνης οδήγησης έχει αρχίσει να δείχνει σημάδια. Στις αρχές Ιουλίου, η Ideal άρχισε να παρέχει την έκδοση 6.0 Smart Driving που μπορεί να οδηγηθεί σε εθνικό επίπεδο στους χρήστες της έκδοσης Max του Smart Driving διαπίστωσε ότι το ποσοστό του μοντέλου Lideal Max ξεπέρασε γρήγορα το 50%. περισσότερο από 10% κάθε μήνα Αν το 2%-3% μπορεί να γίνει κατανοητό ως φυσιολογικό jitter, αλλά περισσότερο από το 10% είναι αποτελεσματική ανάπτυξη.

Ο Lang Xianpeng γνωρίζει επίσης ότι, παρόλο που το όραμα της αυτόνομης οδήγησης L4 αρχίζει να γίνεται σαφές, η πορεία υλοποίησής του δεν έχει αλλάξει "Πρέπει να βοηθήσουμε γρήγορα την εταιρεία να πουλήσει αυτοκίνητα. Μόνο πουλώντας τα αυτοκίνητα μπορούμε να έχουμε χρήματα για να αγοράσουμε κάρτες για να εκπαιδεύσουμε έξυπνα. οδήγηση."

Εάν η έξυπνη οδήγηση είναι ο νικητής στο μελλοντικό πεδίο μάχης του αυτοκινήτου, είναι προφανώς ένα πιο σκληρό παιχνίδι πόρων. Η Ideal έχει κάνει εκ των προτέρων προετοιμασίες από τη στρατηγική ανώτατου επιπέδου έως την τεχνική προετοιμασία και τις επενδύσεις πόρων;

Ακολουθεί μια συνομιλία μεταξύ της 36Kr Automobile και του Lang Xianpeng, Αντιπροέδρου Ε&Α της Ideal Intelligent Driving Technology, και της Jia Peng, Επικεφαλής Ε&Α της Ideal Intelligent Driving Technology.

Μιλώντας για το ανώτερο όριο της έξυπνης οδήγησης: είτε υπάρχει εικόνα είτε όχι, είναι μια ομοιογενής αρχιτεκτονική

36Kr Auto: Υπήρξε εσωτερική αναθεώρηση; Πώς θα φτάσετε από το να υστερείτε στην έξυπνη οδήγηση για να φτάσετε γρήγορα σε επίπεδο συγκρίσιμο με αυτό της Huawei;

Lang Xianpeng: Στην πραγματικότητα, σε σύγκριση με τα Xiaopeng, NIO και Huawei, δεν εννοούμε ότι έχουμε πολλά κεφάλια και μπορεί να μην έχουμε τόσες οικογένειες όσες άλλες, αλλά απαιτούμε να είμαστε ρεαλιστές. Μερικές φορές νιώθω ότι οι άνθρωποι μπορεί να μην αναζητούν την ουσία του προβλήματος, όταν αντιμετωπίζουν δυσκολίες, σκέφτονται μόνο αν αυτό που κάνουν τώρα μπορεί να τροποποιηθεί και να επαναληφθεί.

Για παράδειγμα, από το να έχεις φωτογραφίες μέχρι να μην έχεις φωτογραφίες, το μεγαλύτερο πρόβλημα είναι η ίδια η εικόνα. Έχω κάνει πολλή δουλειά στο χάρτη στο παρελθόν, και θα ήθελα να παλέψω λίγο περισσότερο, στην πραγματικότητα, θέλω να επενδύσω γρήγορα στην επόμενη φάση έρευνας και ανάπτυξης. Εξαρτάται από το αν μπορούμε να βρούμε το ουσιαστικό πρόβλημα και να αποφασίσουμε να το διορθώσουμε γρήγορα.

36Kr Automobile: Το ιδανικό είναι να επιτύχετε έξυπνη οδήγηση χωρίς χάρτες. Πώς διορθώνετε την απόκλιση.

Lang Xianpeng: Πέρυσι στο Σαλόνι Αυτοκινήτου της Σαγκάης, όλοι άρχισαν να κάνουν αστικό NOA. Κάθε εταιρεία έχει παρόμοιες ιδέες χάρτες υψηλής ακρίβειας που χρησιμοποιούνται για αυτοκινητόδρομους, επομένως το πρώτο βήμα είναι να δείτε εάν το σχέδιο αυτοκινητόδρομου μπορεί να χρησιμοποιηθεί σε πόλεις πόλεις, αλλά μόνο για περίπου 20 πόλεις. Είπαμε να το δοκιμάσω πρώτα.

Ωστόσο, η επαναληπτική ενημέρωση του σχεδίου και του χάρτη είναι δεσμευμένα. Εκείνη την εποχή, εργαζόμασταν στο Wangjing, φτιάχναμε δρόμους, αλλάζαμε διαδρομές και ακόμη και φανάρια έπρεπε να περιμένουμε το AutoNavi να επαναλάβει τα σχέδια. Περίπου τον Ιούνιο του περασμένου έτους, αποφασίσαμε να μην επαναλάβουμε τον χάρτη και να μεταβούμε στη λύση NPN (ένα νευρωνικό προηγούμενο δίκτυο). Είναι ισοδύναμο με τοπική χαρτογράφηση, χρησιμοποιώντας προηγούμενες πληροφορίες NPN σε μεγάλες διασταυρώσεις, κυκλικούς κόμβους κ.λπ., και το αυτοκίνητό μας ενημερώνει τις δυνατότητες.

Αλλά σε μεγάλες πόλεις όπως το Πεκίνο, η Σαγκάη, η Γκουανγκζού και η Σενζέν, υπάρχουν πολλά αυτοκίνητα, αλλά σε μικρές πόλεις, υπάρχουν λίγα αυτοκίνητα. Να το κάνεις πάντα σε μια μεγάλη πόλη; Οι χρήστες δεν θα το πληρώσουν. Εκείνη την εποχή, η ομάδα ήταν ακόμα διστακτική και το Πεκίνο, η Σαγκάη και η Γκουανγκζού τα πήγαιναν καλά. Υπάρχουν επίσης εσωτερικές φωνές που λένε ότι αντί να χτίσουμε εκατό πόλεις, θα πρέπει να χτίσουμε μερικές πόλεις πρώτης κατηγορίας, ούτως ή άλλως, η Huawei θα είναι μόνο σε 50 πόλεις στην αρχή, επομένως δεν χρειάζεται να είμαστε πρώτοι ή δεύτεροι.

Είπα ότι αυτό δεν είναι δυνατό, και πρέπει ακόμα να το κάνω γρήγορα. Εξακολουθώ να θέλω να μάθω, αν όντως γίνεται σε μεγαλύτερη κλίμακα, είναι εντάξει η μέθοδος NPN; Αυτό είναι το πρόβλημα οι Χάρτες είχαν πάντα περιορισμούς και υπάρχουν επίσης επικρίσεις ότι ορισμένες πόλεις μπορούν να ανοίξουν μόνο δύο δρόμους. Έτσι, αφού μάθαμε από την εμπειρία, αρχίσαμε να κόβουμε σχέδια μετά την παράδοση των 100 πόλεων τον περασμένο Δεκέμβριο.

36Kr Auto: Ποιες είναι οι ανάγκες για την ανάπτυξη ενός NOA χωρίς γραφήματα από άκρη σε άκρη;

Lang Xianpeng: Υπάρχει ακόμα πρόβλημα χωρίς εικόνα. Αποδεικνύεται ότι ο χάρτης μπορεί να παρέχει κάποιες σχετικά ακριβείς πληροφορίες Μετά την αφαίρεση των προηγούμενων πληροφοριών του χάρτη, οι απαιτήσεις για αντίληψη προς τα πάνω γίνονται ιδιαίτερα υψηλές. Στον τομέα της μεταγενέστερης ρύθμισης και ελέγχου, η εισαγωγή πληροφοριών ήταν πολύ τακτική στο παρελθόν, αλλά τώρα γίνεται αντιληπτό ότι υπάρχουν κάποια προβλήματα και λάθη με νευρικότητα, και είναι επίσης μια μεγάλη πρόκληση.

Για να συνεχίσετε να το κάνετε αυτό θα απαιτηθεί πολύ ανθρώπινο δυναμικό. Για παράδειγμα, εάν υπάρχει πρόβλημα με την αντίληψη, πρέπει να προστεθούν πολλοί κανόνες στο μοντέλο του ενδιάμεσου περιβάλλοντος. Αυτό θέτει μια τεράστια πρόκληση για το ανθρώπινο δυναμικό για την ομάδα. Έτσι έγινε η Huawei χωρίς φωτογραφίες (πλεονέκτημα ανθρώπινου δυναμικού Αρχικά θέλαμε να προσλάβουμε περισσότερα άτομα το δεύτερο εξάμηνο του περασμένου έτους).

Αλλά το ανώτερο όριο αυτού του πράγματος είναι αρκετά προφανές. Κυρίως, όλοι οι κανόνες φτιάχνονται από ανθρώπους και σχεδιάζονται από μηχανικούς. Ειδικά τον Ιανουάριο και τον Φεβρουάριο του τρέχοντος έτους, αλλάξαμε συχνά έναν κανόνα Εάν αυτή η περίπτωση λειτουργήσει καλά, άλλες περιπτώσεις δεν θα λειτουργήσουν. Η αμοιβαία εμπλοκή είναι πολύ μεγάλη και ατελείωτη.

Φυσικά, η επένδυση πόρων είναι δευτερεύουσα, το πιο σημαντικό είναι ότι η εμπειρία που βασίζεται σε κανόνες έχει ένα ανώτερο όριο και δεν μπορεί ποτέ να είναι ανθρωπόμορφη. Έτσι επαναλάβαμε το τρέχον end-to-end και VLM. Από άκρο σε άκρο, είναι η πρώτη φορά που χρησιμοποιείται τεχνητή νοημοσύνη για έξυπνη οδήγηση.

36Kr Auto: Πότε είναι η ιδανική στιγμή για να αρχίσετε να επενδύετε σε end-to-end;

Lang Xianpeng:Έχουμε πάντα δύο γραμμές εργασίας, η μία είναι η ανοιχτή γραμμή για μαζική παραγωγή και παράδοση, πέρυσι η φωτεινή εικόνα NPN σε καμία εικόνα είναι η ανοιχτή γραμμή και η από άκρο σε άκρο είναι μια σκοτεινή γραμμή, η οποία είναι η προ- ερευνητική γραμμή.

Απλώς, η Διάσκεψη Στρατηγικής για τη Λίμνη Yanqi το κατέστησε σαφές πέρυσι. Στη συνάντηση στρατηγικής, ο Li Xiang ανέφερε ότι η αυτόνομη οδήγηση είναι η βασική μας στρατηγική και η RD (τεχνολογική έρευνα και ανάπτυξη) πρέπει να φτάσει σε σημαντικά ορόσημα. Η ιδέα από άκρο σε άκρο υπήρχε εδώ και πολύ καιρό, αλλά πάντα υπήρχε πίεση για παράδοση και δεν υπήρχαν πόροι για εξερεύνηση.

36Kr Auto: Το Wutu μπορεί να χρειαστεί να πάει από άκρο σε άκρο αμέσως μετά την κυκλοφορία του Πώς θεωρείται αυτός ο ρυθμός;

Lang Xianpeng: Στην αρχή της χρονιάς, είπα στον Li Xiang το εξής: Αν και θέλουμε να κάνουμε από άκρη σε άκρη, πρέπει να το κάνουμε χωρίς φωτογραφία. Επειδή η υποστήριξη χωρίς γραφήματα είναι από άκρο σε άκρο, από πού θα προέρχονταν τα δεδομένα και η εμπειρία για την υποστήριξη από άκρο σε άκρο;

Και πρέπει να ανέβει χωρίς φωτογραφίες για να πουληθεί εύκολα το αυτοκίνητο. Διαφορετικά, πώς μπορεί να ανταγωνιστεί την Huawei; Τώρα που βρισκόμαστε στο Wutu, προσπαθούμε να κερδίσουμε χρόνο από άκρη σε άκρη και ταυτόχρονα να βελτιώσουμε τις δυνατότητες των προϊόντων μας για να βοηθήσουμε στην πώληση αυτοκινήτων.

36Kr Auto: Στην πορεία αρνείσαι τα σχέδιά σου Υπάρχει πίεση από την άποψη της ανοδικής διαχείρισης;

Lang Xianpeng:Όχι. Πρώτον, η ευθύνη μου είναι να οδηγήσω τον καθένα να συνειδητοποιήσει την αυτόνομη οδήγηση, δεύτερον, ένας ιδανικός οργανισμός έχει τη δική του μεθοδολογία ή διαδικασία, όπως το να κάνεις σωστά αλλά όχι εύκολα πράγματα.

Ο Λι Σιάνγκ δεν θα έλεγε ποτέ γιατί ο Λανγκ Μπο αρνήθηκε αυτό που είχε κάνει πριν. Του ξεκαθαρίσαμε γιατί το κάναμε αυτό, ότι θέλαμε να κερδίσουμε στη στρατηγική AI και βρήκαμε ένα παράδειγμα διπλού συστήματος, το οποίο κατάλαβε αμέσως. Θα έλεγε μόνο ότι το end-to-end είναι υπέροχο και πρέπει να γίνει γρήγορα.

Αυτό που απαιτεί η τεχνητή νοημοσύνη είναι υπολογιστική ισχύς και δεδομένα. Ο Λι Σιάνγκ έρχεται συχνά και με ρωτάει, Λανγκ Μπο, είσαι αρκετά δυνατός; Αν δεν είναι αρκετό, ζητήστε από τον Xie Yan να σας πάρει περισσότερα.

Ο Λι ήθελε να πει ότι έχουμε επίσης αυτοκίνητα και περισσότερα χρήματα από άλλους, οπότε έχουμε μια μεγάλη ευκαιρία να διευρύνουμε το χάσμα με άλλους σε αυτόν τον δρόμο. Μην κάνετε λοιπόν αυτό το κουραστικό πράγμα και βιαστείτε να κάνετε την τεχνητή νοημοσύνη πίσω από αυτό.

Μιλώντας για το μέλλον της έξυπνης οδήγησης: End-to-end + VLM είναι το καλύτερο παράδειγμα για την τεχνητή νοημοσύνη

36Kr: Ορισμένες εταιρείες δεν έχουν κάνει ποτέ χωρίς χάρτη και πιστεύουν ότι από άκρο σε άκρο είναι μια ευκαιρία να αλλάξουν λωρίδα και να προσπεράσουν.

Lang Xianpeng: Αυτό είναι το μισό σωστό. Είναι πράγματι δυνατό να αλλάξουμε λωρίδες από άκρο σε άκρο Ανεξάρτητα από το αν υπάρχει γράφημα, NPN ή κανένα γράφημα, ο πυρήνας της λύσης είναι ομοιογενής. Αφαιρέστε τον χάρτη, βελτιώστε την αντίληψη, στοιβάξτε μικρές μονάδες σε πολλά μεγάλα μοντέλα και χρησιμοποιήστε το ίδιο σχέδιο για να εξελιχθείτε σιγά σιγά.

Αλλά από άκρο σε άκρο είναι διαφορετικό. Για πρώτη φορά χρησιμοποιεί τεχνητή νοημοσύνη για αυτόνομη οδήγηση. Αφού χρησιμοποιήσετε το One Model για να κάνετε από άκρο σε άκρο, η είσοδος είναι μόνο δεδομένα, η έξοδος είναι τροχιά και οι ενδιάμεσες μονάδες ενσωματώνονται σε ένα μοντέλο.

Ολόκληρο το σύστημα διαδικασίας Ε&Α είναι εντελώς διαφορετικό. Στο παραδοσιακό μοντέλο ανάπτυξης προϊόντων, η κινητήρια δύναμη προέρχεται από το σχεδιασμό της ζήτησης ή την ανατροφοδότηση προβλημάτων. Δεν λειτουργεί σε αυτό το σενάριο.

Το end-to-end είναι ένα μαύρο κουτί και οι δυνατότητές του εξαρτώνται εξ ολοκλήρου από το είδος των δεδομένων που του δίνονται. Αυτό που φιλτράρουμε τώρα είναι τα δεδομένα των έμπειρων οδηγών Εάν τα δεδομένα δεν είναι καλά, το μοντέλο που παράγεται δεν θα είναι καλό. Αυτό που μπαίνει είναι σκουπίδια και αυτό που βγαίνει είναι σκουπίδια. Είναι μια εκπαιδευτική διαδικασία ροής δεδομένων. Κάποτε ήταν μια διαδικασία έρευνας και ανάπτυξης λειτουργίας προϊόντων, αλλά τώρα είναι μια διαδικασία βελτίωσης δυνατοτήτων.

Επομένως, δεν υπάρχει πρόβλημα στην αλλαγή λωρίδας από άκρο σε άκρο, αλλά αν θέλετε να προσπεράσετε, πρέπει να έχετε υπολογιστική ισχύ δεδομένων και εκπαίδευσης. Εάν δεν υπάρχουν αυτές οι δύο προϋποθέσεις, για να είμαι ειλικρινής, όλοι έχουν το μοντέλο και το ίδιο το μοντέλο δεν θα είναι πολύ διαφορετικό. Όσο καλό κι αν είναι το μοντέλο, χωρίς δεδομένα και υπολογιστική ισχύ, είναι απλώς ένα σωρό παραμέτρους.

36Kr: Το ιδανικό είναι να συγκεντρώνεις πολλά δεδομένα, αλλά ο He Xiaopeng πρότεινε πρόσφατα την ιδέα ότι το να έχεις περισσότερα δεδομένα δεν σημαίνει ότι μπορεί να επιτευχθεί η αυτόνομη οδήγηση;

Lang Xianpeng:Τα δεδομένα εκπαίδευσής μας είναι κλιπ, τα οποία περιλαμβάνουν πλήρη δεδομένα του οδηγού που οδηγεί για δεκάδες δευτερόλεπτα, συμπεριλαμβανομένων οπτικών αισθητήρων, πληροφοριών κατάστασης οχήματος εκείνη τη στιγμή και λειτουργικών δεδομένων όπως γκάζι και φρένο.

Αλλά τα δεδομένα πρέπει να είναι υψηλής ποιότητας για να είναι χρήσιμα. Τι είναι η υψηλή ποιότητα; Μαζί με την ομάδα υποκειμενικής αξιολόγησης απόδοσης προϊόντων και οχημάτων, έχουμε ορίσει από κοινού ένα πρότυπο που ονομάζεται "Human High-Quality Driver". Μερικοί οδηγοί οδηγούν καθημερινά και είναι πολύ επιδέξιοι Αν πάντα επιταχύνουν και επιβραδύνουν απότομα, χρησιμοποιήσουν AEB ή στρίψουν το τιμόνι απότομα, μπορεί να μην λειτουργήσει.

Σύμφωνα με αυτά τα πρότυπα, μόνο το 3% από τους 800.000 ιδιοκτήτες αυτοκινήτων μας είναι «ανθρώπινοι οδηγοί υψηλής ποιότητας Μαζί με τα δεδομένα υψηλής ποιότητας που συσσωρεύτηκαν προηγουμένως, σχηματίζονται τελικά εκατομμύρια κλιπ, τα οποία είναι όλα τα καλύτερα». Έχει δίκιο ο Xiaopeng, απαιτούνται όντως δεδομένα υψηλής ποιότητας, αλλά η ποιότητα των δεδομένων βασίζεται στην απόλυτη κλίμακα των δεδομένων.

36Kr Auto: Μετά από end-to-end, χρειάζεται αναβάθμιση του συστήματος εργαλείων δεδομένων;

Lang Xianpeng: Η αλυσίδα εργαλείων έχει αλλάξει πολύ. Προηγουμένως, ήταν μια διαδικασία ανάπτυξης μιας λειτουργίας προϊόντος, όπως η εξαγορά από τον χρήστη, η μετάδοση δεδομένων, η χειροκίνητη ανάλυση προβλημάτων και, στη συνέχεια, η τροποποίηση κώδικα, η πραγματική αξιολόγηση του οχήματος και η ηλεκτρονική έκδοση αυτής της διαδικασίας δεδομένων κλειστού βρόχου είναι ήδη πολύ αποτελεσματική. Αλλά θα χρειαστούν αρκετές ημέρες και θα εμπλακεί πολύ ανθρώπινο δυναμικό Όσο περισσότερες δοκιμές υπάρχουν, τόσο περισσότερα προβλήματα θα υπάρχουν και τόσο περισσότεροι άνθρωποι θα πρέπει να κάνουν τροποποιήσεις.

Η τρέχουσα διαδικασία είναι ότι εάν ένας ιδιοκτήτης αυτοκινήτου αναλάβει, αφού επανέλθουν τα δεδομένα, παρόμοιες σκηνές θα δημιουργηθούν αυτόματα χρησιμοποιώντας το παγκόσμιο μοντέλο και θα μετατραπούν σε λάθος τράπεζα ερωτήσεων. Ελέγξτε επίσης εάν υπάρχουν παρόμοια δεδομένα σε λάθος βάση δεδομένων ερωτήσεων Εάν όχι, ψάξτε στην υπάρχουσα βάση δεδομένων και πραγματοποιήστε κοινή εκπαίδευση.

Μετά την εκπαίδευση ενός νέου μοντέλου, το μοντέλο επιστρέφει στο παγκόσμιο σύστημα εξέτασης μοντέλου και δοκιμάζεται δύο φορές. Η πρώτη φορά είναι να δείτε αν έχετε κάνει σωστά τις λάθος ερωτήσεις και η δεύτερη φορά είναι ένα σύνολο πραγματικών ερωτήσεων για να ελέγξετε τις ικανότητές σας. Εάν δεν υπάρχει πρόβλημα και τις δύο φορές, το μοντέλο βγαίνει. Στο ακραίο άκρο, δεν υπάρχει κανείς στη μέση και είναι μια πολύ αυτοματοποιημένη διαδικασία κλειστού βρόχου.

36Kr Auto: Η διαδικασία εκπαίδευσης από άκρο σε άκρο είναι ένα μαύρο κουτί και πρέπει να προστεθεί πολύς κώδικας για να μάθετε τις λεπτομέρειες.

Lang Xianpeng:Πολύ λίγος ο όγκος του κωδικού μας για την έκδοση με γραφικά είναι περίπου 2 εκατομμύρια γραμμές, και για την έκδοση χωρίς γραφικά, είναι μόνο 200.000, που είναι μόνο το 10%.

Υπάρχουν πράγματι κάποιοι κρυφοί κανόνες για τον έλεγχο αυτού. Επειδή τα δεδομένα του αισθητήρα εισάγονται από άκρο σε άκρο και η προγραμματισμένη τροχιά εξέρχεται, ενδέχεται να υπάρχουν προβλήματα, επομένως θα έχουμε ορισμένους βίαιους κανόνες για να αποφύγουμε ορισμένες μη φυσιολογικές συμπεριφορές ελέγχου, όπως το στρίψιμο του τιμονιού 180 μοίρες.

36Kr Auto: Ο Musk είπε ότι διαγράφηκαν 300.000 γραμμές κώδικα. Φαίνεται ότι είστε πιο επιθετικοί.

Lang Xianpeng: Δεν νομίζω ότι θα αλλάξει πολύ. Το κύριο πράγμα είναι ότι έχουμε την ικανότητα να επαναλαμβάνουμε συνεχώς τον εαυτό μας.

36Kr Auto: Το Ideal είχε πάντα δύο γραμμές εσωτερικά: μαζική παραγωγή και προ-έρευνα Η μετάβαση από άκρο σε άκρο από την προ-έρευνα στη μαζική παραγωγή είναι η προ-έρευνα τώρα;

Lang Xianpeng: L4. Αυτό ανάγεται στην κατανόησή μας για την τεχνητή νοημοσύνη. Διαπιστώσαμε ότι αν θέλουμε να επιτύχουμε πραγματική αυτόνομη οδήγηση, η τρέχουσα προσέγγιση είναι πολύ διαφορετική.

Από άκρο σε άκρο, τι είδους δεδομένα του δίνονται, τι είδους συμπεριφορά θα έχει. Εάν δεν δοθούν παρόμοια στοιχεία, δεν θα αντιμετωπιστούν. Αλλά οι άνθρωποι δεν είναι, για παράδειγμα, αν οδηγώ στο Πεκίνο, μπορώ επίσης να οδηγήσω στις Ηνωμένες Πολιτείες. Εάν θέλουμε πραγματικά να επιτύχουμε αυτόνομη οδήγηση, το σύστημα πρέπει να κατανοεί πράγματα όπως οι άνθρωποι και να έχει την ικανότητα να συλλογίζεται.

Μελετήσαμε πώς λειτουργεί και σκέφτεται ο ανθρώπινος εγκέφαλος Τον Αύγουστο και τον Σεπτέμβριο του περασμένου έτους, η Jia Peng και ο Zhan Kun είδαν τη θεωρία του διπλού συστήματος, η οποία είναι ένα πολύ καλό πλαίσιο για την ανθρώπινη σκέψη. Ας υποθέσουμε ότι η τεχνητή νοημοσύνη είναι ένα διπλό σύστημα.

Όλα αυτά είναι μέρος του Τάο, πράγματα σε θεωρητικό επίπεδο. Όσον αφορά την αυτόνομη οδήγηση, το μοντέλο από άκρο σε άκρο είναι το System 1 και το System 2 είναι το μοντέλο οπτικής γλώσσας VLM. Αυτή είναι η καλύτερη λύση για την υλοποίηση της τεχνητής νοημοσύνης στον φυσικό κόσμο.

Πώς λοιπόν μετράτε τις δυνατότητες του Συστήματος 1 και του Συστήματος 2; Έχουμε επίσης ένα παγκόσμιο μοντέλο, το οποίο στην πραγματικότητα ονομάζεται Σύστημα 3 Η χρήση του παγκόσμιου μοντέλου είναι πολύ σαφής. Χρησιμοποιείται για τον έλεγχο του συστήματος 1 και του συστήματος 2.

Έχουμε μια πραγματική τράπεζα δοκιμών, η οποία είναι πραγματικά δεδομένα για άτομα που οδηγούν κανονικά. Το παγκόσμιο μοντέλο είναι ένα παραγωγικό μοντέλο που μπορεί να δημιουργήσει άλλες ερωτήσεις αντλώντας συμπεράσματα από υπάρχοντα δεδομένα. Αφού εκπαιδευτεί ένα μοντέλο, κάντε τις πραγματικές ερωτήσεις μία φορά και, στη συνέχεια, κάντε μερικά σετ προσομοιωμένων ερωτήσεων για να δείτε πόσο βαθμολογείτε. Κάθε μοντέλο θα έχει μια βαθμολογία και όσο υψηλότερη είναι η βαθμολογία, τόσο πιο ισχυρό είναι το μοντέλο.

36Kr Auto: Υπό ποιες συνθήκες θα ενεργοποιηθεί το System 2;

Lang Xianpeng: Το σύστημα 1 και το σύστημα 2 λειτουργούν πάντα. Εάν ορισμένα συστήματα είναι πιο περίπλοκα, το Σύστημα 1 μπορεί να μην είναι εύκολο να αναγνωριστεί, όπως οι υπερβάσεις, οι λακκούβες και τα πρόσφατα κατασκευασμένα δάπεδα από τσιμέντο, το Σύστημα 2 θα λειτουργεί σε τέτοια σενάρια, αλλά η συχνότητα λειτουργίας του θα είναι χαμηλότερη, όπως 3-4 Hz , το Σύστημα 1 μπορεί να λειτουργεί σε υψηλή συχνότητα άνω των δέκα Hz. Παρόμοια με το GPT, το Σύστημα 1 θα κάνει πάντα ερωτήσεις στο Σύστημα 2 σχετικά με το τι πρέπει να κάνει όταν αντιμετωπίζει αυτό το σενάριο.

36Kr Auto: Έχει το ίδιο το System 2 VLM όρια δυνατοτήτων;

Lang Xianpeng: Μπορείτε να το σκεφτείτε ως ένα μεγάλο γλωσσικό μοντέλο. Εστιάζουμε στο να του παρέχουμε νόμους που σχετίζονται με την οδήγηση, να διδάσκουμε βίντεο και σχολικά βιβλία για τα μαθήματα 1-4. Το VLM μας είναι στην πραγματικότητα ένα μεγάλο γλωσσικό μοντέλο που εστιάζει στην οδήγηση.

Βραχυπρόθεσμα, δεν έχει ακόμα κάποιες γνώσεις, αλλά καθώς ο κλειστός βρόχος γυρίζει όλο και πιο γρήγορα, το ανώτερο όριο των δυνατοτήτων του θα γίνεται όλο και υψηλότερο. Οι τρέχουσες παράμετροι από άκρο σε άκρο είναι μόνο πάνω από 300 εκατομμύρια και οι παράμετροι του συστήματος VLM είναι 2,2 δισεκατομμύρια.

36Kr Auto: Δηλαδή η μεγαλύτερη μεταβλητή στο μέλλον της έξυπνης οδήγησης είναι το System 2;

Lang Xianpeng:Η υποκείμενη υποστήριξη είναι το Σύστημα 1, αλλά όταν προχωρήσουμε περαιτέρω, συμπεριλαμβανομένης της αυτόνομης οδήγησης επιπέδου L3L4, πρέπει να έχουμε πολύ ισχυρές δυνατότητες στο Σύστημα 2 Οι τρέχουσες 2,2 δισεκατομμύρια παράμετροι μπορεί να μην είναι αρκετές και θα πρέπει να προστεθούν περισσότερες.

Jia Peng: Το σύστημα 2 εστιάζει κυρίως σε σύνθετες σκηνές Ο χρόνος απόκρισης των 2,2 δισεκατομμυρίων παραμέτρων είναι 300 mm. Αλλά το σύστημα 1 σίγουρα δεν είναι αρκετό, χρειάζεται περίπου δεκάδες χιλιοστά του δευτερολέπτου.

36Kr Auto: Υπάρχει ανώτατο όριο για τις παραμέτρους του μοντέλου; Σαν 8 δισεκατομμύρια; Ποιες είναι κατά προσέγγιση οι απαιτήσεις για υπολογιστική ισχύ τσιπ;

Jia Peng:Όπως ακριβώς το μοντέλο της μεγάλης γλώσσας, κανείς δεν μπορεί να απαντήσει πόσες παραμέτρους έχει.

Lang Xianpeng:Τώρα έχουμε και γνώσεις και δεξιότητες Το Σύστημα 1 συν το Σύστημα 2 είναι ένα καλό παράδειγμα τεχνητής νοημοσύνης, αλλά ο τρόπος εφαρμογής του απαιτεί να το εξερευνήσουμε σιγά σιγά.

36Kr Auto: Εάν το τμηματοποιημένο από άκρο σε άκρο μοντέλο πρόκειται να εξελιχθεί σε One Model, πρέπει να εφεύρουμε εκ νέου τον τροχό;

Jia Peng: Η πρόκληση είναι αρκετά μεγάλη. Αλλά πρώτα, η τεχνική πρόκληση είναι σχετικά μεγάλη, επειδή τα παραδοσιακά έχουν φύγει όλα. Πώς να εκπαιδεύσετε το μοντέλο για να επιτύχετε καλά αποτελέσματα; Το δεύτερο είναι η ανθρώπινη πρόκληση Πώς μπορούν δύο ομάδες ανθρώπων με διαφορετικό υπόβαθρο στην αντίληψη και τον έλεγχο να συνεργαστούν για να δημιουργήσουν ένα μοντέλο;

Η ομάδα μας επίσης παλεύει και πετάγεται. Όσον αφορά το τέλος σε άκρο, οι ρόλοι πολλών ανθρώπων μπορεί να έχουν αλλάξει. Οι άνθρωποι που συνήθιζαν να ασχολούνται με τη μηχανική μπορεί να ορίζουν δεδομένα και σενάρια. Η αλλαγή του ρόλου σας είναι μια μεγάλη πρόκληση.

Μιλώντας για επιχειρήσεις κλειστού βρόχου: Δεν μπορείτε να αντέξετε οικονομικά την αυτόνομη οδήγηση χωρίς 1 δισεκατομμύριο δολάρια

36Kr Auto: Φαίνεται ότι τα κεφάλαια καίγονται Πόσα σκοπεύετε να επενδύσετε από άκρο σε άκρο;

Lang Xianpeng: Σίγουρα, αυτή τη στιγμή είναι 1 δισεκατομμύριο RMB. Στο μέλλον, η εκπαίδευση μοντέλων αυτόνομης οδήγησης μπορεί να απαιτεί 1 δισεκατομμύριο δολάρια ΗΠΑ, χωρίς να συμπεριλαμβάνονται άλλα πράγματα, όπως η αγορά καρτών, οι λογαριασμοί ρεύματος και το ταλέντο. Καμία εταιρεία χωρίς καθαρό κέρδος 1 δισεκατομμυρίου δολαρίων δεν μπορεί να το αντέξει οικονομικά.

36Kr Auto: Το από άκρο σε άκρο μπορεί να είναι μια τεχνολογία ορόσημο στην αυτοκινητοβιομηχανία Από μια εμπορική σκοπιά κλειστού βρόχου, ποια είναι η εμπορική απόδοση της έξυπνης οδήγησης;

Lang Xianpeng: Ξεκινώντας από την έκδοση 6.0, τους τελευταίους 1-2 μήνες, το ποσοστό AD Max έχει ξεπεράσει το 50%, με αύξηση άνω του 10% κάθε μήνα, εάν το 2%-3% μπορεί να γίνει κατανοητό ως κανονικό jitter, αλλά περισσότερο από 10 % είναι αποτελεσματική ανάπτυξη. Στο Πεκίνο, τη Σαγκάη, το Guangzhou και το Shenzhen, το ποσοστό των μοντέλων έξυπνης οδήγησης έφτασε το 70%. Η παραγγελία AD MAX για το μοντέλο L9 είναι 75%, L8 είναι 55% και L7 είναι 65%.

Jia Peng: Το L6 έχει επίσης 22%. Η έξυπνη οδήγηση είναι ήδη ένας πολύ σημαντικός παράγοντας για τους νέους να αγοράσουν αυτοκίνητα. Μετά τη χρήση της έξυπνης οδήγησης, είναι δύσκολο να επιστρέψετε στην αρχική κατάσταση.

Lang Xianpeng: Σήμερα, το NOA υψηλής ταχύτητας αναγνωρίζεται καλά από όλους, ενώ το αστικό NOA βρίσκεται ακόμα σε πολύ πρώιμο στάδιο. Σε μεγάλο βαθμό, οι δυνατότητες του αστικού προϊόντος δεν είναι αρκετά καλές, ακόμη και χωρίς φωτογραφίες, δεν είναι ιδιαίτερα καλές σε σύγκριση με το επίπεδο άνεσης. Μετά από τέλος σε άκρο, όλα θα αλλάξουν, και ορισμένες παραστάσεις είναι αρκετά κοντά στον άνθρωπο.

Με την προσθήκη δεδομένων και υπολογιστικής ισχύος, η αστική έξυπνη οδήγηση που προέρχεται από την αρχιτεκτονική end-to-end είναι πιθανό να επιτύχει μια οδηγική εμπειρία υψηλής ταχύτητας. Σε αυτό το στάδιο, είναι πολύ χρήσιμο για τους χρήστες να αγοράζουν αυτοκίνητα.

36Kr Auto: Η εμπορική αξία της έξυπνης οδήγησης γίνεται όλο και πιο εμφανής, αλλά η ιδανική λειτουργία έξυπνης οδήγησης ήταν πάντα δωρεάν. Θα συζητηθεί εκ νέου η στρατηγική για να γίνει πιο εμφανής η εμπορική αξία;

Lang Xianpeng: Πολλοί άνθρωποι αγοράζουν το Ideal για ψυγεία, έγχρωμες τηλεοράσεις και μεγάλους καναπέδες, αλλά στο μέλλον μπορεί επίσης να αγοράσουν το Ideal για έξυπνη οδήγηση, κάτι που αρκεί για να δείξει την εμπορική αξία της έξυπνης οδήγησης. Η διαφορά μεταξύ των εκδόσεων Max και Pro είναι πραγματικά 30.000 γιουάν.

Όσο για τη φόρτιση λογισμικού, εάν φτάσει στο επίπεδο L4, θα είναι πραγματικά φοβερό να βοηθήσετε τους χρήστες να παραλάβουν τα παιδιά τους από την πύλη του σχολείου. Καθώς βελτιώνονται οι δυνατότητες, θα προκύψουν ορισμένα πρόσθετα επιχειρηματικά μοντέλα, αλλά η προϋπόθεση πρέπει να είναι ότι οι δυνατότητες έξυπνης οδήγησης βελτιώνονται σημαντικά.

36Kr Auto: Η Xiaopeng ανέφερε ότι θα επιτύχει μια εμπειρία παρόμοια με την Waymo της Google τους επόμενους 18 μήνες;

Lang Xianpeng: Δεν πειράζει αν τα δεδομένα και η επιχείρηση μπορούν να υποστηρίξουν τους στόχους. Κάναμε μερικούς εσωτερικούς υπολογισμούς, ας μην μιλήσουμε για το L3L4.

Το Xpeng είναι 2,51 EFLOPS και το ιδανικό είναι 4,5 EFLOPS. Απαιτούνται τουλάχιστον 10 EFLOPS υπολογιστικής ισχύος για να το επιτύχετε, που είναι περίπου 1 δισεκατομμύριο δολάρια ΗΠΑ και 6 δισεκατομμύρια γιουάν ετησίως. Αν έχεις την οικονομική δυνατότητα κάθε χρόνο, μπορείς να παίξεις.

36Kr Auto: Εκτός από την υπολογιστική ισχύ, με βάση την τρέχουσα τεχνική αρχιτεκτονική, πόσες επενδύσεις θα χρειαστεί η ομάδα έξυπνης οδήγησης ετησίως κατά μέσο όρο;

Lang Xianpeng: Το μεγαλύτερο μέρος των δαπανών είναι τσιπ εκπαίδευσης, αποθήκευση δεδομένων και κίνηση, που κοστίζουν τουλάχιστον 1 έως 2 δισεκατομμύρια δολάρια ΗΠΑ ετησίως. Αλλά πηγαίνοντας παραπέρα, ειδικά το παγκόσμιο μοντέλο, ο απώτερος στόχος είναι να αποκατασταθεί ολόκληρος ο πραγματικός φυσικός κόσμος. Αυτό από μόνο του απαιτεί εκπαίδευση και απαιτεί πολλούς υπολογιστικούς πόρους.

Όσο για το ανώτατο όριο, δεν μπορώ να το φανταστώ αυτή τη στιγμή, είναι τουλάχιστον 10 EFLOPS.

36Kr Auto: Οι εταιρείες αυτοκινήτων εξακολουθούν να βασίζονται στο μοντέλο κέρδους της μεταποιητικής βιομηχανίας Θα υπάρξει πόλεμος τιμών φέτος και τα κέρδη θα επηρεαστούν.

Lang Xianpeng: Όποιος μπορεί να λάβει δεδομένα υψηλής ποιότητας και να έχει αρκετή υπολογιστική ισχύ εκπαίδευσης μπορεί να δημιουργήσει ένα μεγάλο μοντέλο. Μπορεί να μην υπάρχουν τόσα πολλά ταλέντα, αλλά τα αντίστοιχα ταλέντα πρέπει να υπάρχουν. Ποιος άλλος μπορεί να έχει και τα τρία εκτός από την Ideal, την Huawei και την Tesla; Δεν μπορώ να το καταλάβω.

Η τρέχουσα ιδέα μας είναι να βοηθήσουμε γρήγορα την εταιρεία να πουλήσει αυτοκίνητα Μόνο πουλώντας τα αυτοκίνητα μπορούμε να έχουμε χρήματα για να αγοράσουμε μια κάρτα για να εκπαιδεύσουμε την έξυπνη οδήγηση.

Όσο πιο πολύ προοδεύουμε στην έξυπνη οδήγηση, τόσο μεγαλύτερο θα μεγαλώνει το χάσμα. Πριν, δεν υπήρχαν φωτογραφίες, αλλά όλοι έφτιαχναν κάτι όπου μπορούσες να δεις το ταβάνι. Για να γίνουν καινοτομίες στο μέλλον, θα πρέπει να προστεθεί η τεχνητή νοημοσύνη και αυτό για το οποίο ανταγωνίζονται όλοι είναι τα δεδομένα και η υπολογιστική ισχύς. Εάν δεν μπορεί να λυθεί, μπορούμε να περάσουμε μόνο στην προηγούμενη διάσταση και θα μεταβούμε στην επόμενη διάσταση για να αποκομίσουμε τα μερίσματα των δεδομένων.

36Kr Auto: Η έξυπνη τεχνολογία οδήγησης αλλάζει τόσο γρήγορα και η επένδυση είναι τόσο μεγάλη Πώς μπορεί ο Li Xiang να διατηρήσει την επίγνωσή του για την έξυπνη οδήγηση;

Lang Xianpeng: Θα μιλούσε με τη δασκάλα Τζία και εμένα ανά πάσα στιγμή. Από τον Σεπτέμβριο του περασμένου έτους, είχαμε μια εβδομαδιαία συνάντηση για την τεχνητή νοημοσύνη, η οποία συγκεντρώνει όλους τους ανθρώπους που σχετίζονται με την τεχνητή νοημοσύνη στην εταιρεία, συμπεριλαμβανομένων ανθρώπων σε έξυπνους χώρους, υποδομές και πλατφόρμες εκπαίδευσης. Η κατανόηση του Li Xiang για την τεχνητή νοημοσύνη είναι ακόμα πολύ καλή.

Έχει επίσης κάποιους άλλους πόρους και γνωρίζει πολλούς ανθρώπους Έχει συνομιλήσει με τον Lu Qi, τον διευθύνοντα σύμβουλο της Kimi, Yang Zhilin, τον Horizon Yu Kai και άλλους. Δεν καταλαβαίνει μόνο την βασική ουσία και την βασική τεχνολογία της τεχνητής νοημοσύνης, αλλά μπορεί επίσης να την εκφράσει με ορισμένους δημοφιλείς όρους.

36Kr Auto: Πόσο ανθρώπινο δυναμικό απαιτείται για τη σχεδίαση μοντέλων από άκρο σε άκρο; Πόσα άτομα θα είναι το μέσο μέγεθος μιας μελλοντικής ομάδας έξυπνης οδήγησης;

Jia Peng: Στην πραγματικότητα, η Tesla έχει πολύ λίγους κατασκευαστές μοντέλων, και η οπτική ομάδα έχει μόνο 20 άτομα συνολικά. Αυτό μπορεί πραγματικά να συναχθεί, για παράδειγμα, με το τσιπ OrinX, το ίδιο το μοντέλο λειτουργεί στα 12-15 Hz, το οποίο ουσιαστικά καθορίζει τον αριθμό των παραμέτρων του μοντέλου και το είδος της δομής του μοντέλου που θα χρησιμοποιηθεί για την εκπαίδευση το.

Lang Xianpeng: Η Tesla είναι πιο ακραία, με μια ομάδα αλγορίθμων λογισμικού που αποτελείται από περισσότερα από 200 άτομα, αλλά κατασκευάζει μόνο ένα τσιπ και λίγα μοντέλα. Δεν μπορούμε να είμαστε τόσο τέλειοι όσο αυτός τώρα, αλλά θα είμαστε ακόμα αρκετές φορές καλύτεροι από αυτόν. Επειδή οι πλατφόρμες τσιπ μας είναι διαφορετικές και έχουμε πολλά μοντέλα, παρόλο που δεν απασχολούμε ιδιαίτερα μεγάλο αριθμό ατόμων, υπάρχουν ακόμα μερικοί άνθρωποι σε κάθε μέρος.

36Kr Auto: Η ισχύς του cloud computing θα είναι μια μεγάλη επένδυση στο μέλλον. Θα είναι δύσκολο να αλλάξω;

Jia Peng: Τα J3 και J5 της Horizon χρησιμοποιήθηκαν για πρώτη φορά στο τέλος του αυτοκινήτου. Η Cloud δοκιμάζει ορισμένα εγχώρια προϊόντα, αλλά η μεγαλύτερη δυσκολία προς το παρόν είναι ότι η οικολογία τους δεν είναι τόσο καλή. Το οικοσύστημα CUDA της NVIDIA είναι τόσο ανίκητο που θα ήταν πολύ ενοχλητικό να προσαρμοστεί σε άλλο οικοσύστημα. Τώρα θέλω ακόμα να βάλω την αποτελεσματικότητα πρώτα και να δώσω προσοχή στην εγχώρια πρόοδο Οι ανταλλαγές και οι δοκιμές έχουν ήδη ξεκινήσει.

36Kr Auto: Μετά την κυκλοφορία του έξυπνου τσιπ οδήγησης που έχει αναπτυχθεί μόνος του, ποιο θα είναι το αποτέλεσμα της ενσωμάτωσης από άκρο σε άκρο;

Jia Peng: Ο συνδυασμός λογισμικού και υλικού θα έχει σίγουρα καλύτερα αποτελέσματα και η Tesla έχει ήδη δημιουργήσει ένα πρωτότυπο. Τα τσιπ είναι φθηνότερα, η υπολογιστική ισχύς είναι μεγαλύτερη και η υποστήριξη για AD είναι καλύτερη Ήθελαν να επεκτείνουν τις παραμέτρους κατά 5 φορές στο FSD V12.5 και το επέκτεισαν. Αυτό έχει μεγάλα πλεονεκτήματα.

Lang Xianpeng:Απαραίτητη προϋπόθεση είναι να καθοριστούν οι αλγόριθμοι L3 και L4.

36Kr Auto: Θα υπάρχει χρονικό σημείο για την αυτόνομη οδήγηση L4;

Lang Xianpeng: Μόλις 3-5 χρόνια. Παραδώσαμε πρώτα το L3, που είναι το σκαλοπάτι στο L4. Πρώτον, μας επιτρέπει να έχουμε μια σαφέστερη κατανόηση της υπολογιστικής ισχύος και των απαιτήσεων δεδομένων του L4, συμπεριλαμβανομένων των βασικών δυνατοτήτων του συστήματος εξέτασης και των δεδομένων κλειστού βρόχου.

Δεύτερον, όσον αφορά τα προϊόντα, πρέπει να δημιουργήσουμε μια σχέση αμοιβαίας εμπιστοσύνης με τους ανθρώπους. Επειδή το ίδιο το από άκρο σε άκρο εξακολουθεί να είναι ένα μαύρο κουτί, οι άνθρωποι εξακολουθούν να μην εμπιστεύονται το σύστημα. Στη συνέχεια, μέσω των προϊόντων L3, μπορείτε να δημιουργήσετε μια καλή σχέση εμπιστοσύνης με τους ανθρώπους.

36Kr Auto: Η προέλευση πολλών τεχνολογιών τεχνητής νοημοσύνης είναι στη Silicon Valley, αλλά η Ideal κάνει τώρα εξερεύνηση αιχμής πώς να διασφαλίσει ότι η κρίση ή η αίσθηση της τεχνολογίας είναι ακριβής και έντονη λάθος δέντρο τεχνολογίας;

Lang Xianpeng:Έχουμε ήδη ένα ολοκληρωμένο σύστημα L4 είναι ακόμα 3 έως 5 χρόνια μακριά, αλλά έχουμε ήδη αρχίσει να το αγγίζουμε, θα κάνουμε ένα λάθος νωρίς, και υπάρχει ακόμα μια ευκαιρία.

Υπάρχει πράγματι μια διαίρεση στην τεχνητή νοημοσύνη μεταξύ της Κίνας και των Ηνωμένων Πολιτειών, και στην πραγματικότητα υπάρχουν πολλά ταλέντα στην Κίνα. Προσπαθούμε να βρούμε τους καλύτερους νέους ανθρώπους. τα οποία βρίσκονται στα 100 κορυφαία του QS (τα 100 κορυφαία πανεπιστήμια του κόσμου).

Μιλώντας για την Tesla: Μάθετε από την Tesla και ξεπεράστε την Tesla

36Kr Auto: Μερικοί άνθρωποι λένε ότι το χάσμα μεταξύ οικιακής και έξυπνης οδήγησης της Tesla είναι 2 χρόνια;

Lang Xianpeng: Σίγουρα όχι. Δεν θα σχολιάσουμε τις τεχνικές λύσεις γιατί η Tesla δεν έχει πει πολλά για τις τεχνικές της λύσεις τα τελευταία δύο χρόνια. Όσον αφορά την εμπειρία προϊόντος, βρισκόμαστε βασικά στο επίπεδο όπου η Tesla μόλις κυκλοφόρησε την end-to-end έκδοση πέρυσι. Υπάρχει ένα κενό περίπου μισού έτους.

36Kr Auto: Η Tesla αντιμετώπισε επίσης ορισμένα προβλήματα, ο Musk είπε ότι υπάρχουν λιγότερα δεδομένα και λιγότερα σχόλια;

Lang Xianpeng:Αυτά είναι διαφορετικά στάδια Όταν τα συναντάμε, σημαίνει ότι έχουμε μπει στο επόμενο στάδιο.

Jia Peng: Το μεγαλύτερο πρόβλημα της Tesla τώρα είναι η επαλήθευση Μπορείτε να δείτε ότι το v12.4 (αριθμός έκδοσης Tesla FSD) δεν είχε καλή απόδοση και στη συνέχεια κυκλοφόρησε το v12.5, με τον όγκο της παραμέτρου να έχει επεκταθεί κατά 5 φορές. Υποθέτω ότι το βήμα επαλήθευσης δεν έγινε ιδιαίτερα καλά. Όταν κυκλοφόρησε το μοντέλο, δεν ήξερα πώς θα λειτουργούσε όταν το χρησιμοποιούσαν πραγματικά οι χρήστες.

Γι' αυτό δίνουμε έμφαση στα παγκόσμια μοντέλα. Έχουμε μάθει αυτά τα μαθήματα και πρέπει να ολοκληρώσουμε την επαλήθευση εκ των προτέρων. Διαφορετικά, πώς μπορεί να επαληθευτεί το μοντέλο για όλους τους δρόμους σε όλη τη χώρα, συμπεριλαμβανομένων των κοινοτήτων πάρκων;

Αν κοιτάξετε την Ημέρα AI της Tesla το 2022, εξακολουθεί να είναι πολύ παραδοσιακή προσομοίωση. Σε αυτό το σημείο, υπάρχουν πράγματι κάποια μαθήματα που έχουμε μάθει από την Tesla. Γι' αυτό καταβάλαμε τόση προσπάθεια για να φτιάξουμε παγκόσμια μοντέλα.

36Kr Auto: Υπάρχει κάτι που σας δυσκολεύει στη διαδικασία δημιουργίας της λύσης από άκρο σε άκρο; Σαν μια αλυσίδα εργαλείων δεδομένων;

Jia Peng: Το σύνολο δεδομένων έχει δημιουργηθεί από το 2019 και τουλάχιστον είναι το καλύτερο στην Κίνα. Τα δεδομένα και η εκπαίδευση είναι στην πραγματικότητα ρουτίνες, και όλα έχουν παραδείγματα που πρέπει να ακολουθήσουν. Επί του παρόντος, η επαλήθευση είναι η μεγαλύτερη πρόκληση.

Ένα άλλο είναι το ίδιο το VLM, το οποίο σταδιακά αναλαμβάνει μεγαλύτερο ρόλο. Μπορεί να χρησιμοποιηθεί μόνο στο 5% των περιπτώσεων στην αρχή, αλλά αργότερα μπορεί να συναντήσει ένα ανώτατο όριο από άκρο σε άκρο και η υπόλοιπη εμπειρία προϊόντος θα βασίζεται στο VLM για επανάληψη. Αυτό θα είναι μια πρόκληση στο μέλλον.

Αυτό είναι επίσης διαφορετικό από την Tesla. Κάναμε VLM και παγκόσμιο μοντέλο γιατί είδαμε τα προβλήματα του Tesla. Υπάρχει πρόβλημα με την επαλήθευση του v12.4 Το έχουμε οδηγήσει στη Βόρεια Αμερική δύο φορές στο παρελθόν, κάθε φορά για περίπου μία εβδομάδα, τόσο στη δυτική όσο και στην ανατολική ακτή. Προφανώς είναι καλό στη δυτική ακτή και κακό στην ανατολική ακτή. Η Βοστώνη και η Νέα Υόρκη δεν είναι τόσο καλές, γιατί αυτές οι δύο πόλεις είναι πολύ πιο περίπλοκες από τη Δυτική Ακτή.

Στην Ανατολική Ακτή, το μέσο ποσοστό εξαγοράς της Tesla είναι αρκετά υψηλό και ίσως κάποια από τα ανώτατα όρια από άκρο σε άκρο είναι εδώ. Όταν λοιπόν κάνουμε VLM, θέλουμε να σπάσουμε αυτό το ταβάνι. Το ανώτερο όριο του VLM είναι πολύ υψηλό και είναι δυνατό να το ξεπεράσεις (Tesla) μέσα από αυτό το σύνολο μονοπατιών.