Νέα

Από τη χωρική νοημοσύνη στην ενσωματωμένη νοημοσύνη, η πιο αποτελεσματική διαδρομή για την εξάσκηση του Sim2Real AI σε όλες τις διαστάσεις

2024-07-22

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Κυκλοφόρησε το Heart of the Machine

Τμήμα Σύνταξης Machine Heart

Σε περισσότερο από ένα χρόνο από την έλευση της τρέλας της ενσώματης νοημοσύνης, έχουν λάβει χώρα επαναστατικές αλλαγές στις μεθόδους παραγωγής και αλληλεπίδρασης του φυσικού κόσμου και των πληροφοριών.

Ταυτόχρονα, μια νέα μάχη ξεκινά αθόρυβα: μεγάλοι κατασκευαστές μαζεύουν το μυαλό τους για να συλλάβουν το πιο πολύτιμο «καύσιμο» της τεχνητής νοημοσύνης - δεδομένα. Επί του παρόντος, η έλλειψη δεδομένων εξακολουθεί να είναι ένας ψηλός τοίχος που αντιμετωπίζει η καθολική ενσωματωμένη νοημοσύνη. Κατά τη διάρκεια των τελευταίων τριών ετών, στην έρευνα για την ενσωματωμένη νοημοσύνη από γνωστές εταιρείες όπως η Google, η NVIDIA και η OpenAI, δεν έχουμε δει ακόμη την εμφάνιση του νόμου κλιμάκωσης. Αυτό σχετίζεται με την έλλειψη διαφόρων τύπων δεδομένων.

Πώς να λύσετε αυτό το θεμελιώδες σημείο πόνου; Από τεχνολογική άποψη, το Sim2Real AI είναι ένα μακροχρόνιο μονοπάτι. Ωστόσο, λόγω της «εννοιολογικής προκατάληψης» για την εξάλειψη του κενού Sim2Real, ο ακαδημαϊκός κόσμος και η βιομηχανία το θεωρούν περισσότερο ως βοηθητική μέθοδο συμπλήρωσης δεδομένων.

Είναι όμως όντως έτσι;

Ο Jia Kui, μόνιμος καθηγητής στο Κινεζικό Πανεπιστήμιο του Χονγκ Κονγκ (Shenzhen) και ιδρυτής της Διαδιάστατης Νοημοσύνης, έδωσε την απάντηση μέσω μακροχρόνιας πρακτικής από τον ακαδημαϊκό χώρο στη βιομηχανία: «Το Sim2Real AI είναι ο πιο αποτελεσματικός δρόμος για την ενσωματωμένη νοημοσύνη».

Από τη δισδιάστατη όραση στην τρισδιάστατη όραση, από τη χωρική νοημοσύνη στην ενσωματωμένη νοημοσύνη, από την επιστημονική έρευνα έως τα προϊόντα έως την εμπορική εφαρμογή, η Jia Kui εξερευνά αυτό το πεδίο για περισσότερα από είκοσι χρόνια. Πρόσφατα, στο WAIC, έγινε μια συζήτηση για το πώς η ενσωματωμένη νοημοσύνη μπορεί να ξεπεράσει το δίλημμα των δεδομένων.

Εάν επρόκειτο να χρησιμοποιήσετε την τεχνητή νοημοσύνη για να προσπαθήσετε να κατανοήσετε αυτήν τη συνομιλία, θα μπορούσε να σας βοηθήσει να συνοψίσετε αυτά τα βασικά σημεία:

Ποια είναι η φύση της χωρικής νοημοσύνης και της ενσωματωμένης νοημοσύνης που είναι αυτή τη στιγμή τα πιο καυτά θέματα;

Ποιο είναι το συγκεκριμένο νόημα της υλοποίησης της χωρικής και ενσωματωμένης νοημοσύνης χρησιμοποιώντας το παράδειγμα του νόμου κλιμάκωσης;

Ποιος είναι ο πιο αποτελεσματικός δρόμος για την επίτευξη καθολικής ενσωματωμένης νοημοσύνης;

Πώς η ενσωματωμένη νοημοσύνη μετακινείται από την τεχνολογία στο προϊόν στην υλοποίηση της επιχείρησης;

Στο μέλλον, ποιες φαντασίες μπορούν να γίνουν πραγματικότητα που μπορούν να ξεπεράσουν το πρότυπο παραγωγής του κλάδου;

Φυσικά, υπάρχουν και σημεία που η τεχνητή νοημοσύνη δεν μπορεί να κατανοήσει ακόμα - αυτός ο επιστημονικός ερευνητής και επιχειρηματίας έχει αποδείξει τη σταθερή του εμπιστοσύνη και την ιστορική του αποστολή.

Ακολουθεί η απομαγνητοφώνηση της συνέντευξης:

Φτιάξτε ένα «παγκόσμιο μοντέλο»

Ενεργοποίηση της «πνευματικότητας» του ρομπότ

Ερ.: Ο καθηγητής Li Feifei, γνωστός ως «Νονά της AI», επέλεξε την κατεύθυνση της «χωρικής νοημοσύνης» όταν ξεκίνησε την πρώτη του επιχείρηση, η οποία προσέλκυσε ευρεία προσοχή σε αυτόν τον τομέα. Μπορείτε να μιλήσετε για την κατανόησή σας για τη χωρική νοημοσύνη και την ενσωματωμένη νοημοσύνη;

Jacqui: Η χωρική νοημοσύνη και η ενσωματωμένη νοημοσύνη είναι θέματα που έχουν προσελκύσει μεγάλη προσοχή σε κοινωνικό επίπεδο τα τελευταία χρόνια, αλλά η ακαδημαϊκή έρευνα πίσω από αυτά συνεχίζεται εδώ και πολύ καιρό. Η Χωρική Νοημοσύνη είναι μια πολυδιάστατη έννοια που συνήθως αναφέρεται στις γνωστικές και συλλογιστικές ικανότητες ενός ατόμου στον τρισδιάστατο φυσικό χώρο και στον τετραδιάστατο χρόνο και χώρο, συμπεριλαμβανομένης της αντίληψης, του συλλογισμού, της λήψης αποφάσεων κ.λπ. Η ενσωματωμένη νοημοσύνη αναφέρεται στη νοημοσύνη στην οποία ένα ευφυές σύστημα έχει φυσική μορφή και αλληλεπιδρά με το περιβάλλον μέσω αυτής της μορφής. Η ενσωματωμένη νοημοσύνη δεν εστιάζει μόνο στην αντίληψη, αλλά περιλαμβάνει επίσης τις ενέργειες και τις αντιδράσεις των ευφυών παραγόντων στο περιβάλλον. Ακριβώς όπως οι άνθρωποι χρησιμοποιούν τα μάτια τους για να αντιληφθούν τον κόσμο, η ενσωματωμένη νοημοσύνη απαιτεί από τα ρομπότ να είναι σε θέση να αντιλαμβάνονται, να αλληλεπιδρούν και να λαμβάνουν αποφάσεις μέσω πολυτροπικών αισθητήρων για να σχηματίσουν ολοκληρωμένες ικανότητες χωρικής γνώσης και λειτουργίας.

Ε: Ποιες είναι οι ομοιότητες και οι διαφορές μεταξύ της χωρικής νοημοσύνης και της ενσωματωμένης νοημοσύνης;

Jacqui: Όπως αναφέρθηκε προηγουμένως, η χωρική νοημοσύνη δίνει στην τεχνητή νοημοσύνη την ικανότητα να αντιλαμβάνεται και να κατανοεί τον πραγματικό κόσμο, ενώ η ενσωματωμένη νοημοσύνη όχι μόνο απαιτεί την αντίληψη και τη γνωστική λογική αντικειμένων, περιβαλλόντων και άλλων παραγόντων που εμπλέκονται στη χωρική νοημοσύνη, αλλά επίσης καλύπτει περαιτέρω σχεδιασμό κίνησης υψηλού επιπέδου και έλεγχος κίνησης χαμηλού επιπέδου που απαιτείται για τη λειτουργία του ρομπότ, καθώς και διάφορες «δεξιότητες» ρομπότ παρόμοιες με τις ανθρώπινες λειτουργικές δυνατότητες που ορίζονται από την αλληλεπίδραση μεταξύ του σώματος του ρομπότ και του λειτουργικού αντικειμένου. Η κυριαρχία κάθε δεξιότητας σημαίνει ότι το ρομπότ μπορεί να χειριστεί διάφορα αντικείμενα που σχετίζονται με αυτήν την ικανότητα, όχι μόνο ένα συγκεκριμένο και συγκεκριμένο αντικείμενο.

Αυτές οι δεξιότητες περιλαμβάνουν μια συλλογή από "υπο-δεξιότητες" και "ατομικές δεξιότητες", σχηματίζοντας μια βιβλιοθήκη δεξιοτήτων ρομπότ ή "χώρο δεξιοτήτων". Η ουσία της ενσωματωμένης νοημοσύνης είναι η εκμάθηση και η γενίκευση αυτού του χώρου δεξιοτήτων, επιτυγχάνοντας έτσι την τεχνητή γενική νοημοσύνη (AGI) με ενσωματωμένα χαρακτηριστικά όπως οι άνθρωποι.

Σε συγκεκριμένες εφαρμογές, η χωρική νοημοσύνη έχει ευρύτερο πεδίο εφαρμογής και μπορεί να προσαρτηθεί στο ρομπότ ή να αποσπαστεί από το ρομπότ Είναι ουσιαστικά θέμα κατανόησης του χώρου, όπως η σημαντική εφαρμογή του AR/VR. Η ενσωματωμένη νοημοσύνη αντανακλάται κυρίως στα ρομπότ, ειδικά στα ρομπότ γενικής χρήσης (ανθρωποειδή).

Γενικά, η χωρική νοημοσύνη εστιάζει περισσότερο στις γνωστικές και συλλογιστικές ικανότητες σε τετραδιάστατο χώρο και χρόνο, ενώ η ενσωματωμένη νοημοσύνη περιλαμβάνει περαιτέρω την ικανότητα άμεσης αλληλεπίδρασης με το περιβάλλον μέσω φυσικών μορφών.

Ε: Γιατί επιλέξατε να ξεκινήσετε μια επιχείρηση προς την κατεύθυνση του διαστήματος και της ενσωματωμένης νοημοσύνης;

Jacqui: Μπορούμε να πούμε ότι έχουμε δώσει προσοχή σε αυτόν τον τομέα πολύ νωρίς και έχουμε βαθιά ιστορική συσσώρευση και συσσώρευση τεχνολογίας. Η ομάδα ίδρυσε το «Εργαστήριο Αντίληψης και Νοημοσύνης Γεωμετρίας» στις πρώτες μέρες, όταν αυτό το πεδίο δεν είχε ακόμη ασχοληθεί από τους γνωστούς «μεγάλους κατασκευαστές».Είμαστε ένας από τους πρώτους μελετητές και ομάδες στην Κίνα που εφάρμοσε τεχνολογία τεχνητής νοημοσύνης σε μη ευρωπαϊκά δεδομένα όπως το 3D.

Η ομάδα μας έχει διεξαγάγει μεγάλο αριθμό διασταυρούμενων καινοτομικών ερευνών στις κατευθύνσεις της γεωμετρικής βαθιάς μάθησης, της τρισδιάστατης μοντελοποίησης, της χωρικής αντίληψης και των ρομποτικών εφαρμογών και έχει επιτύχει μια σειρά αντιπροσωπευτικών αποτελεσμάτων, συμπεριλαμβανομένων των Grasp Proposal Networks (NeurIPS 2020), Analytic Marching (ICML 2020/TPAMI 2021), Sparse Steerable Convolution (NeurIPS 2021), 3D AffordanceNet (CVPR 2021), Fantasia3D (ICCV 2023), SAM-6D (CVPR 2024) και άλλα.



Το DexVerse™ 2.0 εισάγει τη νέα τεχνολογία 4D Mesh, η οποία είναι ειδικά σχεδιασμένη για δυναμική φυσική προσομοίωση και δημιουργία απόδοσης δεδομένων και μπορεί να χειριστεί ομοιόμορφα πολλαπλά αντικείμενα όπως άκαμπτα σώματα, μαλακά σώματα και υγρά. Ως βασική μορφή έκφρασης του κινητήρα, το 4D Mesh θα διατρέξει ολόκληρη τη διαδικασία από τη φυσική προσομοίωση, τη δημιουργία σχολιασμών δεδομένων έως την εκπαίδευση μεγάλων μοντέλων.

视频链接:https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650927069&idx=1&sn=32b8072ec663f02350d3542000d3520000d3510000d35200000d35200000 b5a5ca60fb8582ae4320820f4eb88e827a2f5830eedcc274e6a904482c6f59&token=263296417&lang=zh_CN#rd

Ε: Ποια είναι η κατανόησή σας για τις βασικές έννοιες του χώρου και της ενσωματωμένης νοημοσύνης; Σε αυτό το hot κομμάτι, ποια είναι τα πλεονεκτήματα της υπερδιάστασης;

Jacqui:Πιστεύουμε ότι,Ο πυρήνας της χωρικής και ενσωματωμένης νοημοσύνης είναι η δημιουργία ενός «παγκόσμιου μοντέλου» έτσι ώστε τα ρομπότ να έχουν «πνευματικότητα» παρόμοια με την ανθρώπινη αντίληψη.Συγκεκριμένα, είναι απαραίτητο να δημιουργηθεί ένα «παγκόσμιο μοντέλο» που να μπορεί να μοντελοποιήσει, να κατανοήσει και να αιτιολογήσει με ακρίβεια τη χωρική γεωμετρία και τις φυσικές διεργασίες, έτσι ώστε διάφοροι αισθητήρες ρομπότ, συμπεριλαμβανομένης της όρασης, της δύναμης, της αφής κ.λπ. να έχουν την ικανότητα ανθρώπινης αντίληψης.

Σύμφωνα με την τρέχουσα αρχιτεκτονική και μοντέλο τεχνητής νοημοσύνης, η ομάδα μας ελπίζει να το κάνειΜέσω της γενετικής φυσικής προσομοίωσης, συλλαμβάνουμε τον χωροχρονικό τετραδιάστατο καθρέφτη του ανθρώπινου ζωντανού κόσμου για να αποκτήσουμε ατελείωτα δεδομένα φυσικών χαρακτηριστικών - αυτό είναι το κλειδί για την υλοποίηση της χωρικής και ενσωματωμένης νοημοσύνης.

Ως εκ τούτου, από την ίδρυσή της, η Kuandimensional έχει δημιουργήσει τον υποκείμενο αυτο-αναπτυγμένο χώρο DexVerse™ και την ενσωματωμένη μηχανή νοημοσύνης, η οποία μπορεί να πραγματοποιήσει την πλήρη αλυσιδωτή αυτοματοποίηση της "φυσικής προσομοίωσης - σύνθεσης δεδομένων - εκπαίδευσης μοντέλων" για συγκεκριμένα επιχειρηματικά σενάρια, και με βάση αυτή τη Διαμόρφωση ένα μεγάλο κιτ μοντέλων χωρικής και ενσωματωμένης νοημοσύνης και καθαρών οπτικών ευφυών αισθητήρων, δίνοντας στα καθολικά ρομπότ έναν έξυπνο εγκέφαλο και μάτια.

Προς το παρόν, η Kuandimension έχει επιτύχει ποσοστό επιτυχίας της αποστολής άνω του 99,9% με 100% συνθετικά δεδομένα και απαιτήσεις ακρίβειας λειτουργίας χιλιοστού/υπο χιλιοστού σε πολλαπλά εμπορικά σενάρια.

Καθολικός χώρος και ενσωματωμένη νοημοσύνη

Πόσο απέχει από το τέλος;

Ε: Μόλις μιλήσατε για τη χρήση του παραδείγματος του νόμου κλιμάκωσης για να συνειδητοποιήσετε τη χωρική και ενσωματωμένη νοημοσύνη Μπορείτε να αναλύσετε τη συγκεκριμένη σημασία του; Είναι πιο δύσκολο να συνειδητοποιήσουμε τον παγκόσμιο χώρο και την ενσωματωμένη νοημοσύνη από το να συνειδητοποιήσουμε την καθολικότητα των μεγάλων γλωσσικών μοντέλων;

Jacqui: Είναι πράγματι πιο δύσκολο να επιτευχθεί ο παγκόσμιος χώρος και η ενσωματωμένη ευφυΐα παρά να επιτευχθεί η καθολικότητα μεγάλων γλωσσικών μοντέλων. Τα μοντέλα μεγάλων γλωσσών, που αντιπροσωπεύονται από τη σειρά GPT του OpenAI, επιτυγχάνουν μηδενικό δείγμα (zero-shot), δηλαδή γενικές δυνατότητες, που δείχνουν την αυγή του λεγόμενου AGI.

Η ανθρώπινη φυσική γλώσσα μπορεί να θεωρηθεί ως ένας σημασιολογικός κώδικας που εξευγενίζεται μέσω ενός υψηλού βαθμού αφαίρεσης του σύμπαντος και του φυσικού περιβάλλοντος στο οποίο ζούμε. Επομένως, είναι σχετικά εύκολο για μεγάλα γλωσσικά μοντέλα να μάθουν και να γενικεύσουν απευθείας σε αφηρημένο επίπεδο.

Συγκριτικά μιλώντας,Η χωρική νοημοσύνη απαιτεί μάθηση από ακατέργαστα σήματα που αποκτώνται από αισθητήρες, πράγμα που σημαίνει τη διέλευση του «σημασιολογικού κενού» από τα ακατέργαστα ψηφιακά σήματα στα ανθρώπινα σημασιολογικά σύμβολα.Για να μάθετε τη γενική νοημοσύνη μέσω ενός παραδείγματος νόμου κλιμάκωσης παρόμοιο με το GPT, απαιτείται μεγάλος όγκος δεδομένων εκπαίδευσης.Τα δεδομένα εκπαίδευσης χωρικής νοημοσύνης όχι μόνο απαιτούν μεγάλο όγκο δεδομένων, αλλά απαιτούν επίσης ακριβή βαθμονόμηση των αρχικών σημάτων που λαμβάνονται από τους αισθητήρες για να διασφαλιστεί ότι έχουν μετρήσεις σε απόλυτη φυσική κλίμακα. Αυτό είναι πολύ πιο δύσκολο από τη λήψη μαζικών δεδομένων εικόνας και κειμένου από το διαδίκτυο.

Η ενσωματωμένη νοημοσύνη προχωρά ένα βήμα παραπέρα Εκτός από την εκμάθηση της γενικής νοημοσύνης από αισθητήρια σήματα υψηλών διαστάσεων όπως η όραση, η δύναμη και η αφή. Ο πιο ουσιαστικός στόχος του είναι να μάθει τον «χώρο δεξιοτήτων» του ρομπότ που ορίζεται από κοινού από την οντολογία του ρομπότ και το λειτουργικό αντικείμενο. Η γενικότητα της ενσωματωμένης νοημοσύνης αντανακλάται στη γενίκευση στον χώρο των δεξιοτήτων, γεγονός που αυξάνει τη δυσκολία εκμάθησης διαφορετικών παραδειγμάτων.

Ε: Μπορείτε να μιλήσετε για τις συγκεκριμένες δυνατότητες πολυτροπικών μεγάλων μοντέλων που απαιτούνται για τη χωρική νοημοσύνη και την ενσωματωμένη νοημοσύνη;

Jacqui:Η χωρική νοημοσύνη περιλαμβάνει εργασίες όπως η αντίληψη, η αλληλεπίδραση, ο συλλογισμός και η λήψη αποφάσεων στον τρισδιάστατο φυσικό κόσμο Η ενσωματωμένη νοημοσύνη απαιτεί περαιτέρω το σχηματισμό μιας αυτόνομης βιβλιοθήκης δεξιοτήτων λειτουργίας ενός ρομπότ που βασίζεται σε έξυπνη ανάλυση των σημάτων χωρικής αντίληψης, όπως η όραση, η δύναμη. , και αγγίξτε.

Ως εκ τούτου, απαιτούνται πολλαπλές δυνατότητες μεγάλων μοντέλων, συμπεριλαμβανομένης της φυσικής γλώσσας, της πίεσης, της κατάστασης του σώματος του ρομπότ και άλλων τρόπων.Αυτές οι πολυτροπικότητες μπορούν να «ενσωματωθούν» σε έναν κοινό σημασιολογικό, χωροχρονικό και χώρο δεξιοτήτων, επιτυγχάνοντας έτσι ανθρώπινη χωρική και ενσωματωμένη νοημοσύνη.

Ε: Κατά τη γνώμη σας, πόσο απέχει ο παγκόσμιος χώρος και η ενσωματωμένη ευφυΐα από το να είναι το τελικό παιχνίδι;

Jacqui:Προς το παρόν, το παράδειγμα Scaling Law AI, το οποίο χαρακτηρίζεται από τεράστια δεδομένα, μεγάλα μοντέλα και τεράστια υπολογιστική ισχύ, μπορεί να παραχθεί σταθερά μαζικά με οικονομικά αποδοτικό τρόπο με την προϋπόθεση ότι το καθολικό υλικό ρομπότ είναι ώριμο, δηλαδή βασικά στοιχεία όπως τα ανθρωποειδή ρομπότ, τα επιδέξια χέρια και οι ανθρωποειδείς αισθητήρες, τουλάχιστον μπορεί να υποστηρίξει χωρική και ενσωματωμένη νοημοσύνη για να σχηματίσει ανεξάρτητη επιχειρηματική αξία σε πολλαπλά επιχειρηματικά σενάρια κλειστού βρόχου με όρια και λογική απόδοση επένδυσης.

Συγκεκριμένα, σε πολλαπλά σενάρια όπως η βιομηχανία, η εφοδιαστική, το εμπόριο και το σπίτι, τα ρομπότ μπορούν να ολοκληρώσουν μια ποικιλία εργασιών με γενικεύσιμο τρόπο. Φυσικά, αυτό απαιτεί την απόκτηση τεράστιων πολυτροπικών δεδομένων με φυσικές ιδιότητες, καθώς και τον αυτόματο υπολογισμό πλούσιων σχολιασμών που υποστηρίζουν πολλαπλές στρατηγικές μάθησης, όπως η εποπτευόμενη εκπαίδευση, η μίμηση μάθησης και η ενισχυτική μάθηση.

Ο πιο αποτελεσματικός δρόμος για την επίτευξη καθολικής ενσωματωμένης νοημοσύνης

Ε: Παρατήρησα ότι αναφέρατε "Το Sim2Real AI είναι η πιο αποτελεσματική διαδρομή για την πραγματοποίηση της ενσωματωμένης νοημοσύνης" στην ομιλία σας στο WAIC;

Jacqui: Για να επιτευχθεί ενσωματωμένη νοημοσύνη, πρέπει να ληφθεί υπόψη η φύση και ο σκοπός των δεδομένων. Ο στόχος της ενσωματωμένης νοημοσύνης είναι να επιτρέψει στα ρομπότ να επιτύχουν γενικές δυνατότητες λειτουργίας στον διαρκώς μεταβαλλόμενο φυσικό κόσμο με βάση σήματα αισθητήρων όπως η όραση, η δύναμη και η αφή, όπως ακριβώς κάνουμε εμείς οι άνθρωποι καθημερινά στην καθημερινή μας ζωή.

Σύμφωνα με το πρότυπο τεχνητής νοημοσύνης του νόμου κλιμάκωσης, δηλαδή, τα μοντέλα μηχανικής μάθησης δεν έχουν πραγματική γενική νοημοσύνη ή γενίκευση, αλλά έχουν μόνο την ικανότητα να «παρεμβαίνουν» στην εκμάθηση στατιστικών κατανομών και των στατιστικών κατανομών τους ποσότητα δεδομένων.

Αυτά τα δεδομένα θα πρέπει να καλύπτουν τις διάφορες συνθήκες λειτουργίας που εμπλέκονται σε κάθε δεξιότητα ρομπότ, όπως όλες οι συνθήκες λειτουργίας από το πρωί έως το βράδυ, την άνοιξη, το καλοκαίρι, το φθινόπωρο και τον χειμώνα, από εσωτερικούς έως εξωτερικούς χώρους. Εάν βασίζεστε σε συστήματα συλλογής δεδομένων ρομπότ ή φορητές συσκευές, όπως η γνωστή "τηλελειτουργία", τότε για να συλλέξετε αρκετά δεδομένα, πρέπει πρώτα να δημιουργήσετε ένα επιχειρηματικό μοντέλο που επιτρέπει στους χρήστες να απολαμβάνουν υπηρεσίες και εμπορική αξία, ενώ παράλληλα βοηθά στη συλλογή δεδομένων. δεδομένα, αλλά προς το παρόν δεν υπάρχει τέτοιος τρόπος.

Σε σύγκριση,Το Sim2Real AI μπορεί να καλύψει όλες τις παραπάνω αλλαγές πιο αποτελεσματικά μέσω φυσικής προσομοίωσης και συνθετικών δεδομένων. Αυτή η μέθοδος επιτρέπει την προσομοίωση διαφόρων λειτουργικών αντικειμένων, περιβαλλοντικών αλλαγών, διαμορφώσεων ρομπότ και αλλαγών αισθητήρων στο εικονικό περιβάλλον και μπορεί να μοιραστεί τις υποκείμενες δυνατότητες φυσικής προσομοίωσης και παραγωγής δεδομένων για διαφορετικά επιχειρηματικά σενάρια. Οποιαδήποτε αντικείμενα λειτουργίας, συμπεριλαμβανομένων άκαμπτων σωμάτων, μεντεσέδων, μαλακών σωμάτων, υγρών κ.λπ., μπορούν να υποστηρίξουν τη δημιουργία δεδομένων μέσω ακριβούς φυσικής προσομοίωσης.

Έτσι, σε γενικές γραμμές,Αν και η χρήση συστημάτων συλλογής δεδομένων ρομπότ ή η "τηλελειτουργία" φορητών συσκευών μπορεί γρήγορα να δείξει κάποιες ανθρώπινες λειτουργίες λειτουργίας, σε σύγκριση με τις ενσωματωμένες δυνατότητες νοημοσύνης που απαιτούνται για την επίτευξη γενικών ρομπότ, αυτή η μέθοδος φαίνεται να είναι "το αντίθετο". Είναι ο πιο αποτελεσματικός δρόμος για να πετύχεις τους στόχους σου.

Ερώτηση: Σύμφωνα με αυτήν την τεχνική προσέγγιση, πώς να εξαλειφθεί το GAP μεταξύ συνθετικών δεδομένων και πραγματικών δεδομένων;

Jacqui: Από ακαδημαϊκή άποψη, το Sim2Real AI είναι μια μακροχρόνια τεχνολογική διαδρομή και ένα από τα κύρια μονοπάτια για την επίτευξη χωρικής και ενσωματωμένης νοημοσύνης. Η ομάδα μας ξεκίνησε επίσης από τον ακαδημαϊκό κόσμο ποσοστό, το οποίο μπορεί να είναι μοναδικό στον κόσμο.

Οποιαδήποτε επιτυχία δεν είναι τυχαία, αλλά βασίζεται στη βαθιά κατανόηση του προβλήματος και στη συστηματική λύση. Ξεκινώντας από τις πρώτες αρχές και σκεπτόμενος το εσωτερικό νόημα των πραγμάτων, η πολυδιάστατη ομάδα βρήκε αποτελεσματικές λύσεις απλοποιώντας σύνθετα προβλήματα και αποσυναρμολογώντας τα στρώμα προς στρώμα.

Με απλά λόγια, η χρήση του Sim2Real AI για την επίτευξη ενσωματωμένης νοημοσύνης απαιτεί:

1) Προσομοίωση σώματος ρομπότ, πολυτροπική προσομοίωση αισθητήρα, διαφορετικές μορφές προσομοίωσης αντικειμένου λειτουργίας και προσομοίωση δυναμικής διαδικασίας.

2) Τα δεδομένα και οι σχολιασμοί που αντιστοιχούν στην προσομοίωση αποδίδονται και δημιουργούνται.

3) Δημιουργήστε μια αυτοματοποιημένη αλυσίδα που μπορεί να μεταφερθεί στο Sim2Real σε πτυχές όπως ο ενσωματωμένος έξυπνος σχεδιασμός και η εκπαίδευση μεγάλου μοντέλου, και τουλάχιστον τα ακόλουθα βασικά τεχνικά κατώφλια πρέπει να ξεπεραστούν:

Ελεγχόμενη ενσωματωμένη προσομοίωση φυσικής χαμηλού επιπέδου

Αποτελεσματική πολυτροπική εκπαίδευση μεγάλου μοντέλου και συνεχής μάθηση

Αντιμετωπίστε αποτελεσματικά τις διαφορές μεταξύ συνθετικών και πραγματικών τομέων δεδομένων

Χαμηλού κόστους απόκτηση μαζικών ψηφιακών περιουσιακών στοιχείων

Ε: Με βάση τη διαδρομή τεχνολογίας Sim2Real AI που μόλις αναφέρατε, ποια είναι τα πρακτικά αποτελέσματα σε όλες τις διαστάσεις;

Jacqui: Η Kuandimensional έχει δημιουργήσει μια ενσωματωμένη μηχανή νοημοσύνης DexVerse™ από κάτω προς τα πάνω, που περιλαμβάνει ενότητες όπως φυσική προσομοίωση, απόδοση και παραγωγή δεδομένων, αυτόματο υπολογισμό σχολιασμών, σχεδιασμό μοντέλου και εκπαίδευση. Αυτός ο κινητήρας δεν απαιτεί τη συμμετοχή προσωπικού Ε&Α.Το SDK μπορεί να δημιουργήσει αυτόματα SDK μοντέλων AI για ενσωματωμένες εργασίες νοημοσύνης σε ολόκληρη την αλυσίδα και αν συσσωρεύονται δεδομένα εκπαίδευσης, δεν θα θεωρούνται πλέον ενσωματωμένη νοημοσύνη Ποσοτικό πρότυπο για εφαρμογή.Επί του παρόντος, το DexVerse™ υποστηρίζει την υλοποίηση των προϊόντων λογισμικού και υλικού της Kuaodi σε πολλά σενάρια.



Όπως φαίνεται παραπάνω, το DexVerse™ 2.0 πηγαίνει ένα βήμα παραπέρα:

Πρώτα απ 'όλα, δεδομένου ενός επιχειρηματικού σεναρίου με σαφή όρια και διαμόρφωση υλικού ρομπότ, το DexVerse™ 2.0 μπορεί να χρησιμοποιήσει ένα μεγάλο μοντέλο γλώσσας για να αποσυναρμολογήσει αυτόματα τις εμπλεκόμενες δεξιότητες και δευτερεύουσες δεξιότητες ρομπότ.

Δεύτερον, για οποιαδήποτε δεξιότητα ή δευτερεύουσα ικανότητα, το DexVerse™ 2.0 μπορεί να δημιουργήσει αυτόματα ψηφιακά στοιχεία, όπως αντικείμενα και σκηνές που απαιτούνται για την προσομοίωση, και να προσομοιώνει και να αποδίδει με βάση αυτά τα στοιχεία για τη δημιουργία λωρίδων δεδομένων διαδικασίας λειτουργίας ρομπότ στον εικονικό χώρο.

Στη συνέχεια, το ενσωματωμένο έξυπνο μοντέλο 3D VLA (Vision Language Action) εκπαιδεύεται μέσω της παραγωγής δεδομένων στον εικονικό χώρο.

Τέλος, το εκπαιδευμένο μοντέλο μπορεί να οδηγήσει την οντολογία ρομπότ σε επιλεγμένα επιχειρηματικά σενάρια για να ολοκληρώσει διάφορες λειτουργίες δεξιοτήτων ρομπότ με καθολικό τρόπο.



Μέσω του DexVerse™ Embodied Intelligence Engine 2.0, ολόκληρη η αλυσίδα αποσυναρμολόγησης εργασιών, δημιουργίας σκηνής, δημιουργίας διαμόρφωσης εκπαίδευσης και εκπαίδευσης μοντέλων αυτοματοποιείται και το εκπαιδευμένο μοντέλο εισάγεται στην πραγματική μηχανή για να καθοδηγήσει το ρομπότ να ολοκληρώσει τη συναρμολόγηση του ελαφιού δομικά στοιχεία.

视频链接:https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650927069&idx=1&sn=32b8072ec663f02350d3542000d3520000d3510000d35200000d35200000 b5a5ca60fb8582ae4320820f4eb88e827a2f5830eedcc274e6a904482c6f59&token=263296417&lang=zh_CN#rd

Μέσω αυτού του πλήρως αυτοματοποιημένου κινητήρα, ο σφόνδυλος για τα καθολικά ρομπότ για την εξάσκηση ενσωματωμένων έξυπνων δεξιοτήτων/υπο-δεξιοτήτων θα περιστρέφεται πιο αποτελεσματικά, προωθώντας την εφαρμογή καθολικών ρομπότ σε περισσότερα σενάρια.Η Kuanwei θα συνεργαστεί με περισσότερα βιομηχανικά μέρη για να ανοίξει το οικοσύστημα και να επιτύχει συνεργασία win-win για να προωθήσει από κοινού την ταχεία ανάπτυξη της ενσωματωμένης νοημοσύνης και της γενικής βιομηχανίας ρομπότ της Κίνας.

Ε: Γιατί η Kuaodi επέλεξε έναν αυτοαναπτυγμένο κινητήρα; Ποιες είναι οι διαφορές μεταξύ του πολυδιάστατου κινητήρα DexVerse™ και του Omniverse™ της NVIDIA;

Jacqui:Η ιδέα της κατασκευής μιας διαδιάστατης ενσωματωμένης μηχανής νοημοσύνης είναι εντελώς διαφορετική από κινητήρες όπως το Omniverse™ της NVIDIA.

Εάν το Omniverse™ είναι μια οριζόντια επέκταση, που καλύπτει διαφορετικούς τομείς όπως η ρομποτική, η επιστημονική πληροφορική και η τεχνητή νοημοσύνη για την επιστήμη, ενώ εξυπηρετεί επίσης τα προϊόντα υπολογιστικής ισχύος με τεχνητή νοημοσύνη της NVIDIA, τότεΤο πολυδιάστατο DexVerse™ είναι μια κατακόρυφη διείσδυση από άκρο σε άκρο και η επαναληπτική εξέλιξη του κινητήρα εξυπηρετεί την υλοποίηση ενσωματωμένων έξυπνων εργασιών δεξιοτήτων σε κάθετα σενάρια.

Προς το παρόν, το Sim2Real AI βρίσκεται ακόμα στο στάδιο της επιχειρηματικής εφαρμογής προϊόντων με γνώμονα την καινοτομία Μόνο βασιζόμενος στη μηχανή αυτοερευνητικής ικανότητας μπορεί να υποστηρίξει όλες τις πτυχές της διαδικασίας έρευνας και ανάπτυξης από τη φυσική προσομοίωση, την απόδοση και τη δημιουργία δεδομένων, τον αυτόματο υπολογισμό σχολίων, ενσωματωμένη. έξυπνος σχεδιασμός και εκπαίδευση μοντέλων, σημείο προς σημείο Μόνο με την αντιμετώπιση βασικών προβλημάτων και την εξοικείωση με την τεχνογνωσία μπορεί να εφαρμοστεί πραγματικά το προϊόν σε επιχειρηματικά σενάρια.

Η διαδρομή L1-L5 της ενσωματωμένης έξυπνης επιχειρηματικής υλοποίησης

Ε: Ποια πιστεύετε ότι είναι η πορεία υλοποίησης για την ενσωματωμένη νοημοσύνη από την τεχνολογία στο προϊόν στην εμπορική υλοποίηση;

Jacqui:Η ουσία της ενσωματωμένης νοημοσύνης είναι να δίνει σε όλους τους τύπους ρομπότ γενικές δυνατότητες λειτουργίας σε διαφορετικά σενάρια εφαρμογών μαθαίνοντας μια βιβλιοθήκη δεξιοτήτων ρομπότ που περιέχει διάφορες γενικεύσιμες δεξιότητες, επομένως, η εμπορευματοποίησή της πρέπει να βασίζεται στη βιομηχανία, τη γεωργία, το εμπόριο και την προσωπική / στόχευση επιχειρήσεων. σενάρια με όρια όπως οι οικογένειες, «αρχίζουν με το τέλος στο μυαλό» και διαμορφώνουν την αξία του προϊόντος και την εμπορική εφαρμογή με την καθιέρωση κοινών δεξιοτήτων για τα ρομπότ σε σενάρια ανεξάρτητων επιχειρήσεων.

Τεχνικά, η ενσωματωμένη νοημοσύνη πρέπει να χρησιμοποιεί το Sim2Real AI για να ανοίξει την αυτοματοποιημένη αλυσίδα κατανόησης εργασιών, δημιουργίας ψηφιακών περιουσιακών στοιχείων, δημιουργίας προσομοίωσης δεδομένων και εκπαίδευσης μοντέλων τεχνητής νοημοσύνης για να επιτύχει καθολική εκμάθηση εργασιών ρομπότ με τον πιο αποτελεσματικό τρόπο και να διαμορφώσει ένα εφαρμόσιμο προϊόν λογισμικού και υλικού για διαφορετικά επιχειρηματικά σενάρια, συμπεριλαμβανομένων ενσωματωμένων έξυπνων SoC, έξυπνων αισθητήρων, ελεγκτών ρομπότ γενικής χρήσης κ.λπ.

Στην πορεία, η ενσωματωμένη νοημοσύνη πρέπει πρώτα να ενδυναμώσει σχετικά ώριμες οντολογίες υλικού, όπως ρομποτικά όπλα και σύνθετα ρομπότ Με την ώριμη μαζική παραγωγή καθολικών οντολογιών, όπως τα επιδέξια χέρια και τα ανθρωποειδή ρομπότ, οι συνολικές δυνατότητες θα βελτιωθούν περαιτέρω και θα αυξηθεί η εμπορική αξία. να δημιουργηθεί.



Ερώτηση: Με βάση τα πέντε στάδια της εξαιρετικά ευέλικτης ενσωματωμένης νοημοσύνης L1-L5 που προτείνατε, σε ποιο στάδιο βρίσκεται αυτή τη στιγμή το Interdimensional;

Jacqui:Με βάση τον αυτοαναπτύχθηκε ενσωματωμένο μηχανισμό νοημοσύνης DexVerse™, η Kuandimensional έχει καθιερώσει δυνατότητες πλήρους αλυσίδας, όπως κατανόηση εργασιών σεναρίου, δημιουργία ψηφιακών περιουσιακών στοιχείων, δημιουργία προσομοίωσης δεδομένων και εκπαίδευση μοντέλων τεχνητής νοημοσύνης για να εξυπηρετήσει σενάρια εφαρμογών όπως η έξυπνη κατασκευή και η έξυπνη γεωργία και έχει σχηματίσει ένα ολοκληρωμένο δίκτυο που περιλαμβάνει ευφυείς αισθητήρες όρασης, λογισμικό PickWiz, σύνθετα ρομπότ και άλλα ενσωματωμένα έξυπνα προϊόντα.

Επί του παρόντος, η Kuanwei έχει εφαρμόσει το επιχειρηματικό μοντέλο "Simulation to Reality" και το έχει εφαρμόσει σε περισσότερες από 30 βιομηχανίες όπως ανταλλακτικά αυτοκινήτων, κατασκευή 3C, νέα ενέργεια, οικιακές συσκευές, χημικά προϊόντα και logistics , Haier, Πολλοί κορυφαίοι πελάτες του κλάδου, συμπεριλαμβανομένων των Panasonic και Lens Technology.

Αναφερόμενος στο L1-L5 στο παραπάνω σχήμα, η Kuandimension ολοκλήρωσε την ανάπτυξη του σταδίου L1 της ενσωματωμένης νοημοσύνης και κινείται σταθερά προς το επίπεδο L2, το οποίο είναι ένα από τα λίγα στον κόσμο.

Ε: Ποια πιστεύετε ότι θα είναι η τελική οικολογική αλυσίδα της ενσωματωμένης νοημοσύνης και των ανθρωποειδών ρομπότ; Θα κατασκευάσει η Kuan Dimension πλήρες (ανθρωποειδές) υλικό ρομπότ;

Jacqui: Η καθολική οικολογική αλυσίδα τελικού ρομπότ αποτελείται από κατασκευαστές ανθρωποειδών αμαξωμάτων, κατασκευαστές εξαρτημάτων, κατασκευαστές οπτικών και απτικών αισθητήρων, ενσωματωμένους έξυπνους προμηθευτές τσιπ και λύσεων κ.λπ. Ο πολυδιάστατος ενσωματωμένος κινητήρας νοημοσύνης DexVerse™ θα διαδραματίσει καθοριστικό ρόλο στην τεχνολογική διαδρομή, τη μορφή προϊόντος, την επιχειρηματική εφαρμογή του σεναρίου, κ.λπ. στη διαδικασία της βιομηχανικής αλυσίδας που θα φτάσει στην τελική της κατάσταση Μέσω των δυνατοτήτων πλήρους αλυσίδας AI Sim2Real της DexVerse™ , θα ξεκινήσει έχοντας κατά νου το τέλος, από μια εμπορική προσέγγιση κλειστού βρόχου για την προώθηση ενοποιημένων προτύπων για ενσωματωμένα έξυπνα ρομπότ όσον αφορά τη διαμόρφωση υλικού, την επιλογή αισθητήρων, τα μοντέλα τρόπων μεταφοράς δεδομένων και τα μεγάλα μοντέλα πολλαπλών τρόπων.

Η Kuandimensional έχει δημιουργήσει ενσωματωμένα έξυπνα προϊόντα, όπως σύνθετα ρομπότ, έξυπνους οπτικούς αισθητήρες και λογισμικό PickWiz τελικά ενώσουν τις δυνάμεις τους με τους κατασκευαστές οντολογιών ανθρωποειδών ρομπότ για να επιτύχουν ευρεία εφαρμογή της γενικής ενσωματωμένης νοημοσύνης.