Nachricht

Von räumlicher Intelligenz bis hin zu verkörperter Intelligenz – der effizienteste Weg, Sim2Real AI in allen Dimensionen zu praktizieren

2024-07-22

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Heart of the Machine veröffentlicht

Redaktion von Machine Heart

In den mehr als einem Jahr seit dem Aufkommen des verkörperten Intelligenzwahns haben revolutionäre Veränderungen in den Produktions- und Interaktionsmethoden der physischen Welt und der Informationen stattgefunden.

Gleichzeitig beginnt in aller Stille ein neuer Kampf: Große Hersteller zerbrechen sich den Kopf, um den wertvollsten KI-„Treibstoff“ zu erfassen – Daten. Derzeit ist der Mangel an Daten immer noch eine hohe Hürde für die universelle verkörperte Intelligenz. In den letzten drei Jahren haben wir in der Forschung namhafter Unternehmen wie Google, NVIDIA und OpenAI noch nicht das Aufkommen des Skalierungsgesetzes gesehen. Dies hängt mit dem Mangel an verschiedenen Arten von Daten zusammen.

Wie kann dieses grundlegende Problem gelöst werden? Aus technologischer Sicht ist Sim2Real AI ein langjähriger Weg. Aufgrund der „konzeptionellen Voreingenommenheit“ bei der Beseitigung der Sim2Real-Lücke betrachten Wissenschaft und Industrie es jedoch eher als eine zusätzliche Methode zur Datenergänzung.

Aber ist das wirklich so?

Jia Kui, ordentlicher Professor an der Chinesischen Universität Hongkong (Shenzhen) und Begründer der Cross-Dimensional Intelligence, gab die Antwort durch langjährige Praxis von der Wissenschaft bis zur Industrie: „Sim2Real AI ist der effizienteste Weg zur verkörperten Intelligenz.“

Von zweidimensionaler Vision bis dreidimensionaler Vision, von räumlicher Intelligenz bis hin zu verkörperter Intelligenz, von wissenschaftlicher Forschung über Produkte bis hin zur kommerziellen Umsetzung – Jia Kui erforscht dieses Gebiet seit mehr als zwanzig Jahren. Kürzlich fand am WAIC ein Gespräch darüber statt, wie verkörperte Intelligenz das Datendilemma durchbrechen kann.

Wenn Sie versuchen würden, KI zu nutzen, um dieses Gespräch zu verstehen, könnte Ihnen das dabei helfen, die folgenden Kernpunkte zusammenzufassen:

Was ist die Natur der räumlichen Intelligenz und der verkörperten Intelligenz, die derzeit die heißesten Themen sind?

Was bedeutet es konkret, räumliche und verkörperte Intelligenz mithilfe des Skalierungsgesetz-Paradigmas zu realisieren?

Welches ist der effizienteste Weg, um universelle verkörperte Intelligenz zu erreichen?

Wie bewegt sich verkörperte Intelligenz von der Technologie über das Produkt bis hin zur Geschäftsimplementierung?

Welche Vorstellungen können in Zukunft wahr werden und das Produktionsparadigma der Branche durchbrechen?

Natürlich gibt es auch Teile, die die KI noch nicht verstehen kann – dieser wissenschaftliche Forscher und Unternehmer hat sein festes Selbstvertrauen und seine historische Mission unter Beweis gestellt.

Nachfolgend das Transkript des Interviews:

Bauen Sie ein „Weltmodell“ auf

Auslösen der „Spiritualität“ des Roboters

F: Professor Li Feifei, bekannt als „Godmother of AI“, wählte die Richtung der „räumlichen Intelligenz“, als er sein erstes Unternehmen gründete, was in diesem Bereich große Aufmerksamkeit erregte. Können Sie etwas über Ihr Verständnis von räumlicher Intelligenz und verkörperter Intelligenz sagen?

Jacqui: Räumliche Intelligenz und verkörperte Intelligenz sind Themen, die in den letzten Jahren auf gesellschaftlicher Ebene große Aufmerksamkeit erregt haben, die akademische Forschung dahinter läuft jedoch schon seit langem. Räumliche Intelligenz ist ein mehrdimensionales Konzept, das sich normalerweise auf die kognitiven und logischen Fähigkeiten einer Person im dreidimensionalen physischen Raum und in der vierdimensionalen Zeit und im vierdimensionalen Raum bezieht, einschließlich Wahrnehmung, Argumentation, Entscheidungsfindung usw. Unter verkörperter Intelligenz versteht man Intelligenz, bei der ein intelligentes System eine physische Form hat und über diese Form mit der Umgebung interagiert. Verkörperte Intelligenz konzentriert sich nicht nur auf die Wahrnehmung, sondern umfasst auch die Aktionen und Reaktionen intelligenter Agenten auf die Umgebung. So wie Menschen ihre Augen nutzen, um die Welt wahrzunehmen, erfordert die verkörperte Intelligenz, dass Roboter in der Lage sind, mithilfe multimodaler Sensoren wahrzunehmen, zu interagieren und Entscheidungen zu treffen, um umfassende räumliche Wahrnehmungs- und Bedienfähigkeiten zu entwickeln.

F: Was sind die Gemeinsamkeiten und Unterschiede zwischen räumlicher Intelligenz und verkörperter Intelligenz?

Jacqui: Wie bereits erwähnt, verleiht die räumliche Intelligenz der KI die Fähigkeit, die reale Welt wahrzunehmen und zu verstehen, während die verkörperte Intelligenz nicht nur die Wahrnehmung und das kognitive Denken von Objekten, Umgebungen und anderen an der räumlichen Intelligenz beteiligten Akteuren erfordert, sondern darüber hinaus auch die Bewegungsplanung auf hoher Ebene abdeckt und eine einfache Bewegungssteuerung, die für den Roboterbetrieb erforderlich ist, sowie verschiedene „Fähigkeiten“ des Roboters, die den menschlichen Bedienfähigkeiten ähneln und durch die Interaktion zwischen dem Roboterkörper und dem Bedienobjekt definiert werden. Die Beherrschung jeder Fertigkeit bedeutet, dass der Roboter verschiedene mit dieser Fertigkeit verbundene Objekte handhaben kann, nicht nur ein bestimmtes und spezifisches Objekt.

Diese Fertigkeiten umfassen eine Sammlung von „Unterfertigkeiten“ und „atomaren Fertigkeiten“, die eine Roboterfertigkeitsbibliothek oder einen „Fertigkeitsraum“ bilden. Das Wesen der verkörperten Intelligenz besteht darin, diesen Fähigkeitsbereich zu erlernen und zu verallgemeinern und so eine künstliche allgemeine Intelligenz (AGI) mit verkörperten Attributen wie beim Menschen zu erreichen.

In bestimmten Anwendungen hat die räumliche Intelligenz einen größeren Umfang und kann am Roboter angebracht oder vom Roboter gelöst werden. Dabei geht es im Wesentlichen um das Verständnis des Raums, beispielsweise seiner wichtigen Anwendung AR/VR. Verkörperte Intelligenz spiegelt sich hauptsächlich in Robotern wider, insbesondere in Allzweckrobotern (humanoiden Robotern).

Im Allgemeinen konzentriert sich räumliche Intelligenz mehr auf kognitive Fähigkeiten und Denkfähigkeiten im vierdimensionalen Raum und in der vierdimensionalen Zeit, während verkörperte Intelligenz darüber hinaus die Fähigkeit umfasst, über physische Formen direkt mit der Umgebung zu interagieren.

F: Warum haben Sie sich entschieden, ein Unternehmen in Richtung Weltraum und verkörperte Intelligenz zu gründen?

Jacqui: Man kann sagen, dass wir diesem Bereich schon sehr früh Aufmerksamkeit geschenkt haben und über eine tiefgreifende historische Akkumulation und Technologieakkumulation verfügen. Das Team gründete das „Geometry Perception and Intelligence Laboratory“ in den Anfängen, als dieses Gebiet noch nicht von den bekannten „großen Herstellern“ involviert war.Wir sind einer der ersten Wissenschaftler und Teams in China, der die Technologie der künstlichen Intelligenz auf außereuropäische Daten wie 3D anwendet.

Unser Team hat zahlreiche innovationsübergreifende Forschungen in den Bereichen geometrisches Deep Learning, 3D-Modellierung, räumliche Wahrnehmung und Roboteranwendungen durchgeführt und eine Reihe repräsentativer Ergebnisse erzielt, darunter Grasp Proposal Networks (NeurIPS 2020) und Analytic Marching (ICML 2020/TPAMI 2021), Sparse Steerable Convolution (NeurIPS 2021), 3D AffordanceNet (CVPR 2021), Fantasia3D (ICCV 2023), SAM-6D (CVPR 2024) und mehr.



DexVerse™ 2.0 führt die neue 4D-Mesh-Technologie ein, die speziell für die dynamische physikalische Simulation und Datenrendering-Generierung entwickelt wurde und mehrere Objekte wie starre Körper, weiche Körper und Flüssigkeiten einheitlich verarbeiten kann. Als zentrale Ausdrucksform der Engine durchläuft 4D Mesh den gesamten Prozess von der physikalischen Simulation über die Generierung von Datenanmerkungen bis hin zum Training großer Modelle.

视频链接:https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650927069&idx=1&sn=32b8072ec663f02350d310f082511ebb&chksm=84e42ba3b393a2b5a5 ca60fb8582ae4320820f4eb88e827a2f5830eedcc274e6a904482c6f59&token=263296417&lang=zh_CN#rd

F: Wie verstehen Sie die Kernkonzepte von Raum und verkörperter Intelligenz? Was sind auf diesem heißen Track die Vorteile der Interdimensionalität?

Jacqui:Wir glauben das,Der Kern der räumlichen und verkörperten Intelligenz besteht darin, ein „Weltmodell“ zu etablieren, damit Roboter eine „Spiritualität“ haben, die der menschlichen Wahrnehmung ähnelt.Insbesondere ist es notwendig, ein „Weltmodell“ zu etablieren, das räumliche Geometrie und physikalische Prozesse genau modellieren, verstehen und begründen kann, damit verschiedene Robotersensoren, einschließlich Seh-, Kraft-, Berührungssensoren usw., über die Fähigkeit der menschlichen Wahrnehmung verfügen können.

Unter dem aktuellen KI-Architektur- und Modellparadigma hofft unser Team, dies zu erreichenDurch generative physikalische Simulation erfassen wir den vierdimensionalen Raum-Zeit-Spiegel der menschlichen Lebenswelt, um endlose physikalische Attributdaten zu erhalten – dies ist der Schlüssel zur Verwirklichung räumlicher und verkörperter Intelligenz.

Daher hat Kuandimens seit seiner Gründung den zugrunde liegenden selbst entwickelten DexVerse™-Raum und die verkörperte Intelligenz-Engine geschaffen, die die vollständige Kettenautomatisierung von „physikalischer Simulation – Datensynthese – Modelltraining“ für spezifische Geschäftsszenarien realisieren und auf dieser Grundlage bilden kann Ein großer Modellbausatz mit räumlicher und verkörperter Intelligenz sowie rein visuellen intelligenten Sensoren, der universellen Robotern ein intelligentes Gehirn und intelligente Augen verleiht.

Derzeit hat Kuandimension eine Missionserfolgsquote von mehr als 99,9 % mit 100 % synthetischen Daten und Betriebsgenauigkeitsanforderungen im Millimeter-/Submillimeterbereich in mehreren kommerziellen Szenarien erreicht.

Universeller Raum und verkörperte Intelligenz

Wie weit ist es vom Ende entfernt?

F: Sie haben gerade über die Verwendung des Skalierungsgesetz-Paradigmas gesprochen, um räumliche und verkörperte Intelligenz zu realisieren. Können Sie seine spezifische Bedeutung näher erläutern? Ist es schwieriger, den universellen Raum und die verkörperte Intelligenz zu erkennen, als die Universalität großer Sprachmodelle?

Jacqui: Es ist in der Tat schwieriger, universellen Raum und verkörperte Intelligenz zu erreichen, als die Universalität großer Sprachmodelle. Große Sprachmodelle, repräsentiert durch die GPT-Serie von OpenAI, erreichen Zero-Sample (Zero-Shot), also allgemeine Fähigkeiten, was den Beginn der sogenannten AGI darstellt.

Die natürliche Sprache des Menschen kann als semantischer Code betrachtet werden, der durch einen hohen Abstraktionsgrad des Universums und der natürlichen Umgebung, in der wir leben, verfeinert wird. Daher ist es für große Sprachmodelle relativ einfach, direkt auf der abstrakten Ebene zu lernen und zu verallgemeinern.

Vergleichsweise gesehen,Räumliche Intelligenz erfordert das Lernen aus von Sensoren erfassten Rohsignalen, was bedeutet, dass die „semantische Lücke“ von digitalen Rohsignalen zu menschlichen semantischen Symbolen geschlossen werden muss.Um allgemeine Intelligenz durch ein dem GPT ähnliches Skalierungsgesetz-Paradigma zu erlernen, ist eine große Menge an Trainingsdaten erforderlich;Für räumliche Intelligenz-Trainingsdaten ist nicht nur eine große Datenmenge erforderlich, sondern auch eine präzise Kalibrierung der von den Sensoren erhaltenen Originalsignale, um sicherzustellen, dass sie über Messungen im absoluten physikalischen Maßstab verfügen. Dies ist viel schwieriger als die Beschaffung umfangreicher Bild- und Textdaten aus dem Internet.

Verkörperte Intelligenz geht noch einen Schritt weiter. Zusätzlich zum Erlernen allgemeiner Intelligenz aus hochdimensionalen Sinnessignalen wie Sehen, Kraft und Berührung. Sein wesentlicheres Ziel besteht darin, den „Fähigkeitsraum“ des Roboters zu erlernen, der gemeinsam durch die Roboterontologie und das Betriebsobjekt definiert wird. Die Allgemeingültigkeit der verkörperten Intelligenz spiegelt sich in der Verallgemeinerung im Kompetenzbereich wider, was die Schwierigkeit beim Erlernen verschiedener Paradigmen erhöht.

F: Können Sie über die spezifischen multimodalen Fähigkeiten großer Modelle sprechen, die für räumliche Intelligenz und verkörperte Intelligenz erforderlich sind?

Jacqui:Räumliche Intelligenz umfasst Aufgaben wie Wahrnehmung, Interaktion, Argumentation und Entscheidungsfindung in der dreidimensionalen physischen Welt. Verkörperte Intelligenz erfordert außerdem die Bildung einer autonomen Betriebsfähigkeitsbibliothek auf der Grundlage einer intelligenten Analyse räumlicher Wahrnehmungssignale wie Vision und Kraft , und berühren.

Daher sind multimodale Fähigkeiten großer Modelle erforderlich, einschließlich natürlicher Sprache, Kraftberührung, Roboterkörperzustand und anderer Modalitäten.Diese Multimodalitäten können in einen gemeinsamen semantischen, räumlich-zeitlichen und Fähigkeitsraum „integriert“ werden und so eine menschenähnliche räumliche und verkörperte Intelligenz erreichen.

F: Wie weit sind Ihrer Meinung nach der universelle Raum und die verkörperte Intelligenz davon entfernt, das Endspiel zu sein?

Jacqui:Derzeit kann das Scaling Law AI-Paradigma, das durch riesige Datenmengen, große Modelle und enorme Rechenleistung gekennzeichnet ist, unter der Voraussetzung, dass die universelle Roboterhardware ausgereift ist, d. h. Kernkomponenten, stabil und kostengünstig in Massenproduktion hergestellt werden B. humanoide Roboter, geschickte Hände und humanoide Sensoren, kann es zumindest räumliche und verkörperte Intelligenz unterstützen, um in mehreren geschlossenen Geschäftsszenarien mit Grenzen und einem angemessenen ROI einen unabhängigen Geschäftswert zu schaffen.

Insbesondere in mehreren Szenarien wie Industrie, Logistik, Handel und Haushalt können Roboter eine Vielzahl von Aufgaben auf verallgemeinerbare Weise erledigen. Dies erfordert natürlich die Erfassung umfangreicher multimodaler Daten mit physikalischen Eigenschaften sowie die automatische Berechnung umfangreicher Annotationen, die mehrere Lernstrategien wie überwachtes Training, Nachahmungslernen und Verstärkungslernen unterstützen.

Der effizienteste Weg zur Erlangung universeller verkörperter Intelligenz

F: Mir ist aufgefallen, dass Sie in Ihrer WAIC-Rede „Sim2Real AI ist der effizienteste Weg zur Verwirklichung verkörperter Intelligenz“ erwähnt haben.

Jacqui: Um verkörperte Intelligenz zu erreichen, müssen Art und Zweck der Daten berücksichtigt werden. Das Ziel der verkörperten Intelligenz besteht darin, Roboter in die Lage zu versetzen, auf der Grundlage von Sensorsignalen wie Sehen, Kraft und Berührung allgemeine Handlungsfähigkeiten in der sich ständig verändernden physischen Welt zu erlangen, genau wie wir Menschen es jeden Tag in unserem täglichen Leben tun.

Nach dem Scaling Law AI-Paradigma verfügen maschinelle Lernmodelle nicht über echte allgemeine Intelligenz oder Verallgemeinerung, sondern nur über die Fähigkeit, statistische Verteilungen zu lernen und ihre statistischen Verteilungen zu trainieren Datenmenge.

Diese Daten sollten die verschiedenen Betriebsbedingungen jeder Roboterfähigkeit abdecken, beispielsweise alle Betriebsbedingungen von morgens bis abends, Frühling, Sommer, Herbst und Winter, drinnen bis draußen. Wenn Sie sich auf Roboter-Datenerfassungssysteme oder tragbare Geräte wie die bekannte „Teleoperation“ verlassen, müssen Sie zur Erfassung ausreichender Daten zunächst ein Geschäftsmodell etablieren, das es Benutzern ermöglicht, Dienste und kommerziellen Wert zu nutzen und gleichzeitig bei der Datenerfassung zu helfen. Daten, aber derzeit gibt es keine solche Möglichkeit.

Im Vergleich,Sim2Real AI kann alle oben genannten Änderungen durch physikalische Simulation und synthetische Daten effizienter abdecken. Diese Methode ermöglicht die Simulation verschiedener Betriebsobjekte, Umgebungsänderungen, Roboterkonfigurationen und Sensoränderungen in der virtuellen Umgebung und kann die zugrunde liegenden physischen Simulations- und Datengenerierungsfunktionen für verschiedene Geschäftsszenarien gemeinsam nutzen. Alle Betriebsobjekte, einschließlich starrer Körper, Scharniere, weicher Körper, Flüssigkeiten usw., können die Datengenerierung durch genaue physikalische Simulation unterstützen.

Also im Allgemeinen,Obwohl der Einsatz von Roboterdatenerfassungssystemen oder der „Teleoperation“ von tragbaren Geräten im Vergleich zu den verkörperten Intelligenzfähigkeiten, die zur Erzielung allgemeiner Roboter erforderlich sind, schnell einige menschenähnliche Bedienvorgänge demonstrieren kann, scheint diese Methode „das Gegenteil“ zu sein Es ist der effizienteste Weg, Ihre Ziele zu erreichen.

Frage: Wie kann mit diesem technischen Ansatz die Lücke zwischen synthetischen Daten und realen Daten beseitigt werden?

Jacqui: Aus akademischer Sicht ist Sim2Real AI ein seit langem etablierter Technologieweg und einer der gängigen Wege zur Erlangung räumlicher und verkörperter Intelligenz. Auch unser Team hat im Prozess der Produkt- und Geschäftsimplementierung erfolgreich einen einzigartigen Weg beschritten: Wir sind in der Lage, in mehreren Szenarien eine Genauigkeit von 99,9 % mit 100 % synthetischen Daten unter den Anforderungen der Missionserfüllung im Millimeter-/Submillimeterbereich zu erreichen Rate, die möglicherweise weltweit einzigartig ist.

Jeder Erfolg ist kein Zufall, sondern basiert auf einem tiefen Verständnis des Problems und einer systematischen Lösung. Ausgehend von den ersten Prinzipien und dem Nachdenken über die innere Bedeutung der Dinge fand das dimensionsübergreifende Team wirksame Lösungen, indem es komplexe Probleme vereinfachte und Schicht für Schicht zerlegte.

Einfach ausgedrückt erfordert die Verwendung von Sim2Real AI zur Erzielung verkörperter Intelligenz Folgendes:

1) Roboterkörpersimulation, multimodale Sensorsimulation, verschiedene Formen der Betriebsobjektsimulation und dynamische Prozesssimulation;

2) Die der Simulation entsprechenden Daten und Anmerkungen werden gerendert und generiert;

3) Etablieren Sie eine automatisierte Kette, die in Aspekten wie dem verkörperten intelligenten Entwurf und der Schulung großer Modelle auf Sim2Real migriert werden kann. Dabei müssen mindestens die folgenden grundlegenden technischen Schwellenwerte überwunden werden:

Kontrollierbare verkörperte Physiksimulation auf niedriger Ebene

Effizientes multimodales Training großer Modelle und kontinuierliches Lernen

Behandeln Sie effektiv die Unterschiede zwischen synthetischen und realen Datendomänen

Kostengünstiger Erwerb riesiger digitaler Assets

F: Welche praktischen Ergebnisse ergeben sich auf der Grundlage des gerade erwähnten Sim2Real-KI-Technologiepfads in allen Dimensionen?

Jacqui: Kuandimensional hat von Grund auf eine verkörperte Intelligenz-Engine DexVerse™ aufgebaut, die Module wie physikalische Simulation, Datenrendering und -generierung, automatische Annotationsberechnung, Modelldesign und Training umfasst. Dieser Motor erfordert keine Beteiligung von Forschungs- und Entwicklungspersonal.Das SDK kann automatisch KI-Modell-SDKs für verkörperte Intelligenzaufgaben in der gesamten Kette generieren. Die Geschwindigkeit der Datengenerierung entspricht der Geschwindigkeit der Trainingsiteration des KI-Modells, sodass überhaupt keine Daten gespeichert werden müssen Unabhängig davon, wie viele Trainingsdaten gesammelt werden, gelten sie nicht mehr als verkörperte Intelligenz. Ein quantitativer Standard für die Implementierung.Derzeit unterstützt DexVerse™ die Implementierung der Software- und Hardwareprodukte von Kuaodi in mehreren Szenarien.



Wie oben gezeigt, geht DexVerse™ 2.0 noch einen Schritt weiter:

Erstens kann DexVerse™ 2.0 bei einem Geschäftsszenario mit klaren Grenzen und einer Roboter-Hardwarekonfiguration ein großes Sprachmodell verwenden, um die beteiligten Roboterfähigkeiten und Unterfähigkeiten automatisch zu zerlegen.

Zweitens kann DexVerse™ 2.0 für jede Fähigkeit oder Unterfähigkeit automatisch digitale Assets wie Objekte und Szenen generieren, die für die Simulation erforderlich sind, und auf der Grundlage dieser Assets simulieren und rendern, um Datenstreifen für den Roboterbetriebsprozess im virtuellen Raum zu generieren.

Anschließend wird das verkörperte intelligente 3D-VLA-Modell (Vision Language Action) durch Datengenerierung im virtuellen Raum trainiert.

Schließlich kann das trainierte Modell die Roboterontologie in ausgewählten Geschäftsszenarien steuern, um verschiedene Roboterfähigkeitsoperationen auf universelle Weise abzuschließen.



Durch die DexVerse™ Embodied Intelligence Engine 2.0 wird die gesamte Kette der Aufgabenzerlegung, Szenengenerierung, Trainingskonfigurationsgenerierung und Modellschulung automatisiert, und das trainierte Modell wird in die reale Maschine importiert, um den Roboter bei der Fertigstellung des Zusammenbaus des Hirsches zu unterstützen Bausteine.

视频链接:https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650927069&idx=1&sn=32b8072ec663f02350d310f082511ebb&chksm=84e42ba3b393a2b5a5 ca60fb8582ae4320820f4eb88e827a2f5830eedcc274e6a904482c6f59&token=263296417&lang=zh_CN#rd

Durch diesen vollautomatischen Motor dreht sich das Schwungrad für Universalroboter zum Üben verkörperter intelligenter Fertigkeiten/Unterfertigkeiten am effizientesten und fördert so die Implementierung von Universalrobotern in mehr Szenarien.Kuanwei wird mit weiteren Industrieparteien zusammenarbeiten, um das Ökosystem zu öffnen und eine Win-Win-Kooperation zu erreichen, um gemeinsam die schnelle Entwicklung von Chinas verkörperter Intelligenz und allgemeiner Roboterindustrie zu fördern.

F: Warum hat sich Kuaodi für einen selbst entwickelten Motor entschieden? Was sind die Unterschiede zwischen der dimensionalen DexVerse™-Engine und NVIDIAs Omniverse™?

Jacqui:Das Konzept des Aufbaus einer dimensionalen Embodied-Intelligence-Engine unterscheidet sich völlig von Engines wie NVIDIAs Omniverse™.

Wenn es sich bei Omniverse™ um eine horizontale Erweiterung handelt, die verschiedene Sektoren wie Robotik, wissenschaftliches Rechnen und KI für die Wissenschaft abdeckt und gleichzeitig die KI-Rechenleistungsprodukte von NVIDIA bedient, dannDas dimensionale DexVerse™ ist eine durchgängige vertikale Durchdringung, und die iterative Weiterentwicklung der Engine dient der Umsetzung verkörperter intelligenter Fertigkeitsaufgaben in vertikalen Szenarien.

Derzeit befindet sich Sim2Real AI noch in der Phase der innovationsgetriebenen Produktgeschäftsumsetzung. Alle Aspekte des Forschungs- und Entwicklungsprozesses von der physischen Simulation über die Datenwiedergabe und -generierung bis hin zur automatischen Anmerkungsberechnung können nur durch die Implementierung unterstützt werden Intelligentes Modelldesign und Training, Punkt für Punkt. Nur durch die Bewältigung wichtiger Probleme und die Beherrschung des Know-hows kann das Produkt wirklich in Geschäftsszenarien implementiert werden.

Der L1-L5-Pfad der verkörperten intelligenten Geschäftsimplementierung

F: Was ist Ihrer Meinung nach der Implementierungspfad für verkörperte Intelligenz von der Technologie über das Produkt bis hin zur kommerziellen Implementierung?

Jacqui:Die Essenz der verkörperten Intelligenz besteht darin, allen Arten von Robotern allgemeine Betriebsfähigkeiten in verschiedenen Anwendungsszenarien zu verleihen, indem sie eine Roboterfähigkeitsbibliothek erlernen, die verschiedene verallgemeinerbare Fähigkeiten enthält. Daher muss ihre Kommerzialisierung auf Industrie, Landwirtschaft, Handel und Privat-/Geschäftszielen basieren Szenarien mit Grenzen wie Familien, „Beginnen Sie mit dem Ende im Hinterkopf“ und gestalten Sie den Produktwert und die kommerzielle Umsetzung, indem Sie gemeinsame Fähigkeiten für Roboter in unabhängigen Geschäftsszenarien etablieren.

Technisch gesehen muss die verkörperte Intelligenz Sim2Real AI nutzen, um die automatisierte Kette des Aufgabenverständnisses, der Generierung digitaler Assets, der Generierung von Datensimulationen und des KI-Modelltrainings zu öffnen, um das Lernen universeller Roboteraufgaben auf effizienteste Weise zu erreichen und anwendbare Software- und Hardwareprodukte zu bilden für verschiedene Geschäftsszenarien, einschließlich verkörperter intelligenter SoCs, intelligenter Sensoren, universeller Robotersteuerungen usw.

Auf diesem Weg muss die verkörperte Intelligenz zunächst relativ ausgereifte Hardware-Ontologien wie Roboterarme und zusammengesetzte Roboter befähigen. Mit der ausgereiften Massenproduktion universeller Ontologien wie geschickten Händen und humanoiden Robotern werden die Gesamtfähigkeiten weiter verbessert und ein größerer kommerzieller Wert erzielt generiert werden.



Frage: Basierend auf den von Ihnen vorgeschlagenen fünf Stufen der äußerst vielseitigen verkörperten Intelligenz L1–L5: Auf welcher Stufe befindet sich Interdimensional derzeit?

Jacqui:Basierend auf der selbst entwickelten DexVerse™-Intelligenz-Engine hat Kuandimen umfassende Funktionen wie das Verstehen von Szenarioaufgaben, die Generierung digitaler Assets, die Generierung von Datensimulationen und das Training von KI-Modellen etabliert, um Anwendungsszenarien wie intelligente Fertigung und intelligente Landwirtschaft zu bedienen hat ein umfassendes Netzwerk gebildet, das intelligente Vision-Sensoren, PickWiz-Software, Verbundroboter und andere integrierte intelligente Produkte umfasst.

Derzeit hat Kuanwei das Geschäftsmodell „Simulation to Reality“ in mehr als 30 Branchen implementiert, darunter Autoteile, 3C-Fertigung, neue Energie, Haushaltsgeräte, Chemie und Logistik. Es hat mit Unternehmen wie GAC und Midea zusammengearbeitet , Haier, Viele branchenführende Kunden, darunter Panasonic und Lens Technology.

Bezogen auf L1-L5 in der obigen Abbildung hat Kuandimension die Entwicklung der L1-Stufe der verkörperten Intelligenz abgeschlossen und bewegt sich stetig in Richtung der L2-Stufe, die eine der wenigen auf der Welt ist.

F: Wie wird Ihrer Meinung nach die endgültige ökologische Kette verkörperter Intelligenz und humanoider Roboter aussehen? Wird Kuan Dimension komplette (humanoide) Roboterhardware herstellen?

Jacqui: Die universelle Roboter-Endökokette besteht aus Herstellern humanoider Körper, Komponentenherstellern, Herstellern visueller und taktiler Sensoren, Anbietern verkörperter intelligenter Chips und Lösungen usw. Die dimensionale DexVerse™-Intelligenz-Engine wird eine entscheidende Rolle beim technologischen Weg, der Produktform, der Geschäftsumsetzung des Szenarios usw. spielen, während die Industriekette durch die Sim2Real-KI-Komplettkettenfunktionen von DexVerse™ ihren endgültigen Zustand erreicht , es wird mit dem Ziel vor Augen beginnen, von einem kommerziellen Closed-Loop-Ansatz zur Förderung einheitlicher Standards für verkörperte intelligente Roboter in Bezug auf Hardwarekonfiguration, Sensorauswahl, datenmodale Paradigmen und multimodale große Modelle.

Kuandimal hat verkörperte intelligente Produkte wie zusammengesetzte Roboter, intelligente visuelle Sensoren und PickWiz-Software entwickelt. Im Zuge der Implementierung weiterer Geschäftsszenarien wird Kuandimal zunächst die relativ ausgereiften mobilen/radfüßigen Chassis + duale Roboterarme ermöglichen schließlich mit Herstellern humanoider Roboterontologien zusammenarbeiten, um eine umfassende Implementierung allgemeiner verkörperter Intelligenz zu erreichen.