Nachricht

Der Erste auf der Welt!Untersuchung von fast 400 Dokumenten im Pengcheng-Labor

2024-07-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Die AIxiv-Kolumne ist eine Kolumne, in der Machine Heart akademische und technische Inhalte veröffentlicht. In den letzten Jahren hat die Kolumne „Heart of the Machine AIxiv“ mehr als 2.000 Berichte erhalten, die Spitzenlabore großer Universitäten und Unternehmen auf der ganzen Welt abdecken und so den akademischen Austausch und die Verbreitung wirksam fördern. Wenn Sie hervorragende Arbeiten haben, die Sie teilen möchten, können Sie gerne einen Beitrag leisten oder uns für die Berichterstattung kontaktieren. E-Mail-Adresse: [email protected]; [email protected]

Verkörperte Intelligenz ist der einzige Weg, allgemeine künstliche Intelligenz zu erreichen. Ihr Kern besteht darin, komplexe Aufgaben durch die Interaktion intelligenter Agenten mit dem digitalen Raum und der physischen Welt zu erledigen. In den letzten Jahren haben multimodale Großmodelle und Robotertechnologie große Fortschritte gemacht, und die verkörperte Intelligenz ist zu einem neuen Schwerpunkt des globalen Technologie- und Industriewettbewerbs geworden. Allerdings fehlt derzeit eine Übersicht, die den aktuellen Stand der Entwicklung der verkörperten Intelligenz umfassend analysieren kann. daher,Das Institut für Multiagenten und verkörperte Intelligenz des Pengcheng-Labors arbeitet mit Forschern des HCP-Labors der Sun Yat-sen-Universität zusammen, eine umfassende Analyse der neuesten Entwicklungen in der verkörperten Intelligenz,Startete die weltweit erste Überprüfung der verkörperten Intelligenz im Zeitalter multimodaler großer Modelle.

Diese Überprüfung untersuchte fast 400 Dokumente und führte eine umfassende Analyse der Forschung zur verkörperten Intelligenz aus mehreren Dimensionen durch.In dieser Rezension werden zunächst einige Vertreter vorgestelltVerkörperte Roboter und verkörperte Simulationsplattformen bietet eine ausführliche Analyse seines Forschungsschwerpunkts und seiner Grenzen. Anschließend werden vier Hauptforschungsinhalte gründlich analysiert: 1)verkörperte Wahrnehmung,2)verkörperte Interaktion,3)verkörperte Intelligenzund 4)Migration von der virtuellen zur Realität Diese Forschungsinhalte umfassen modernste Methoden, grundlegende Paradigmen und umfassende Datensätze. Darüber hinaus untersucht die Rezension die Herausforderungen, denen sich verkörperte Agenten in digitalen Räumen und physischen Welten gegenübersehen, und betont deren Bedeutung für die aktive Interaktion in dynamischen digitalen und physischen Umgebungen. Abschließend fasst die Rezension die Herausforderungen und Grenzen der verkörperten Intelligenz zusammen und diskutiert ihre möglichen zukünftigen Richtungen. Mit dieser Rezension soll eine grundlegende Referenz für die Forschung zur verkörperten Intelligenz bereitgestellt und damit verbundene technologische Innovationen gefördert werden. Darüber hinaus wurde in dieser Rezension auch eine Liste mit verkörperten Geheimdienstpapieren auf Github veröffentlicht. Verwandte Artikel und Code-Repositories werden kontinuierlich aktualisiert, also achten Sie bitte darauf.



Papieradresse: https://arxiv.org/pdf/2407.06886

Liste der verkörperten Intelligenzpapiere: https://github.com/HCPLab-SYSU/Embodied_AI_Paper_List

1. Das vergangene und gegenwärtige Leben verkörperter Intelligenz

Das Konzept der verkörperten Intelligenz wurde erstmals von Alan Turing im 1950 eingeführten Embodied-Turing-Test vorgeschlagen, um festzustellen, ob ein Agent Intelligenz (Intelligenz) zeigen kann, die nicht auf die Lösung abstrakter Probleme in einer virtuellen Umgebung (digitaler Raum) beschränkt ist. Der Körper ist der Grundlage verkörperter Intelligenz, die sowohl im digitalen Raum als auch in der physischen Welt existiert und in Form verschiedener Einheiten verkörpert ist, darunter nicht nur Roboter, sondern auch andere Geräte, und die in der Lage ist, mit der Komplexität und Unverständlichkeit der physischen Welt umzugehen. Daher wird die Entwicklung verkörperter Intelligenz als grundlegender Weg zur Erlangung allgemeiner künstlicher Intelligenz angesehen. Es ist besonders wichtig, sich mit der Komplexität der verkörperten Intelligenz auseinanderzusetzen, ihren aktuellen Entwicklungsstand einzuschätzen und ihre zukünftige Entwicklung zu berücksichtigen.Heutzutage umfasst verkörperte Intelligenz viele Schlüsseltechnologien wie Computer Vision, Verarbeitung natürlicher Sprache und Robotik, von denen die repräsentativste istVerkörperte Wahrnehmung, verkörperte Interaktion, verkörperte Intelligenz und Transfer von der virtuellen zur Realität . Bei verkörperten Aufgaben müssen verkörperte Agenten die menschlichen Absichten in Sprachanweisungen vollständig verstehen, die Umgebung proaktiv erkunden, multimodale Elemente aus virtuellen und physischen Umgebungen umfassend wahrnehmen und geeignete Operationen ausführen, um komplexe Aufgaben zu erledigen. Der schnelle Fortschritt multimodaler Modelle zeigt eine größere Vielfalt, Flexibilität und Generalisierungsfähigkeiten als herkömmliche Deep-Reinforcement-Learning-Methoden in komplexen Umgebungen. Mit hochmodernen visuellen Encodern vorab trainierte visuelle Darstellungen liefern präzise Schätzungen von Objektkategorien, Posen und Geometrien und ermöglichen es verkörperten Modellen, komplexe und dynamische Umgebungen umfassend wahrzunehmen. Leistungsstarke große Sprachmodelle ermöglichen es Robotern, Anweisungen in menschlicher Sprache besser zu verstehen und bieten eine praktikable Möglichkeit, visuelle und sprachliche Darstellungen für verkörperte Roboter aufeinander abzustimmen. Weltmodelle weisen erhebliche Simulationsfähigkeiten und ein gutes Verständnis physikalischer Gesetze auf und ermöglichen es verkörperten Modellen, die Physik und reale Umgebungen vollständig zu verstehen. Diese Fortschritte ermöglichen es der verkörperten Intelligenz, komplexe Umgebungen umfassend wahrzunehmen, auf natürliche Weise mit Menschen zu interagieren und Aufgaben zuverlässig auszuführen. Die folgende Abbildung zeigt die typische Architektur eines verkörperten Agenten.



Rahmenwerk der verkörperten Intelligenz

In dieser Rezension geben wir einen umfassenden Überblick über aktuelle Fortschritte in der verkörperten Intelligenz, darunter: (1)verkörperter Roboter——Hardwarelösungen für verkörperte Intelligenz in der physischen Welt (2)Verkörperte Simulationsplattform——Ein digitaler Raum für die effiziente und sichere Schulung verkörperter Agenten (3)verkörperte Wahrnehmung—— Den 3D-Raum aktiv wahrnehmen und mehrere Sinnesmodalitäten integrieren (4)verkörperte Interaktion——Interagieren Sie effektiv und vernünftig mit der Umgebung und verändern Sie die Umgebung sogar, um bestimmte Aufgaben zu erledigen (5)verkörperte Intelligenz——Verwenden Sie multimodale große Modelle, um abstrakte Anweisungen zu verstehen, sie in eine Reihe von Unteraufgaben aufzuteilen und sie dann Schritt für Schritt auszuführen.Migration von der virtuellen zur Realität ——Im digitalen Raum erlernte Fähigkeiten auf die physische Welt übertragen und verallgemeinern. Die folgende Abbildung zeigt den Systemrahmen der verkörperten Intelligenz vom digitalen Raum bis zur physischen Welt. Ziel dieser Rezension ist es, umfassendes Hintergrundwissen, Forschungstrends und technische Erkenntnisse zur verkörperten Intelligenz bereitzustellen.



Die Gesamtstruktur dieser Rezension

2. Verkörperte Roboter

Verkörperte Intelligenz interagiert aktiv mit der physischen Umgebung und deckt ein breites Spektrum verkörperter Formen ab, darunter Roboter, intelligente Haushaltsgeräte, intelligente Brillen und autonome Fahrzeuge. Unter ihnen haben Roboter als eine der bekanntesten verkörperten Formen große Aufmerksamkeit erregt. Je nach Anwendungsszenario werden Roboter in verschiedenen Formen entwickelt, um ihre Hardwarefunktionen zur Erledigung spezifischer Aufgaben voll auszunutzen. Wie in der folgenden Abbildung dargestellt, können verkörperte Roboter im Allgemeinen unterteilt werden in: (1) Roboter mit fester Basis, wie z. B. Roboterarme, die häufig in der Laborautomatisierungssynthese, im Bildungswesen, in der Industrie und in anderen Bereichen eingesetzt werden; sind hocheffizient. Sie sind bekannt für ihre Mobilität und werden häufig in den Bereichen Logistik, Lagerhaltung und Sicherheitsinspektionen eingesetzt. (3) Raupenroboter mit starken Geländefähigkeiten und Mobilität haben ihr Potenzial in der Landwirtschaft, im Baugewerbe und bei der Katastrophenhilfe gezeigt. Vierbeiner Der für seine Stabilität und Anpassungsfähigkeit bekannte Roboter eignet sich ideal für die Ortung in komplexem Gelände, bei Rettungseinsätzen und für militärische Anwendungen. (5) Humanoide Roboter, bei denen ihre geschickten Hände der Schlüssel sind, werden häufig in der Dienstleistungsbranche, im Gesundheitswesen und in kollaborativen Umgebungen eingesetzt. (6) Bionische Roboter führen Aufgaben in komplexen und dynamischen Umgebungen aus, indem sie die effektiven Bewegungen und Funktionen natürlicher Organismen simulieren.



Verschiedene Formen verkörperter Roboter

3. Verkörperte intelligente Simulationsplattform

Simulationsplattformen für verkörperte Intelligenz sind für die verkörperte Intelligenz von entscheidender Bedeutung, da sie kostengünstige Experimentiermöglichkeiten, die Möglichkeit zur Gewährleistung der Sicherheit durch die Simulation potenziell gefährlicher Szenarien, die Skalierbarkeit für Tests in verschiedenen Umgebungen und die Fähigkeit bieten, schnell Prototypen von Designfunktionen zu erstellen, die das Allgemeingültige ermöglichen Forschungsgemeinschaft, stellen eine kontrollierte Umgebung für präzise Forschung bereit, generieren Daten für Training und Bewertung und stellen einen standardisierten Benchmark für den Algorithmenvergleich bereit. Damit der Agent mit der Umgebung interagieren kann, muss eine realistische simulierte Umgebung erstellt werden. Dies erfordert die Berücksichtigung der physikalischen Eigenschaften der Umgebung, der Eigenschaften von Objekten und ihrer Wechselwirkungen. Wie in der folgenden Abbildung dargestellt, werden in dieser Überprüfung zwei Simulationsplattformen analysiert: eine allgemeine Plattform, die auf der zugrunde liegenden Simulation basiert, und eine Simulationsplattform, die auf realen Szenarien basiert.



Universelle Simulationsplattform



Simulationsplattform basierend auf realen Szenarien

4. Verkörperte Wahrnehmung

Der „Nordstern“ der zukünftigen visuellen Wahrnehmung ist verkörperungszentriertes visuelles Denken und soziale Intelligenz. Wie in der folgenden Abbildung dargestellt, müssen sich Agenten mit verkörperter Wahrnehmung nicht nur Objekte in Bildern erkennen, sondern sich in der physischen Welt bewegen und mit der Umgebung interagieren, was ein gründlicheres Verständnis des dreidimensionalen Raums und dynamischer Umgebungen erfordert. Verkörperte Wahrnehmung erfordert visuelle Wahrnehmungs- und Denkfähigkeiten, das Verstehen dreidimensionaler Beziehungen in einer Szene sowie das Vorhersagen und Ausführen komplexer Aufgaben auf der Grundlage visueller Informationen. In dieser Rezension werden aktive visuelle Wahrnehmung, visuelle 3D-Lokalisierung, visuelle Sprachnavigation, nicht-visuelle Wahrnehmung (taktile Sensoren) usw. vorgestellt.



Aktiver visueller Wahrnehmungsrahmen

5. Verkörperte Interaktion

Unter verkörperter Interaktion versteht man Szenarien, in denen ein Agent mit Menschen und der Umwelt in einem physischen oder simulierten Raum interagiert. Zu den typischen verkörperten Interaktionsaufgaben gehören die verkörperte Beantwortung von Fragen und das verkörperte Erfassen. Wie in der Abbildung unten dargestellt, muss der Agent in der verkörperten Frage-und-Antwort-Aufgabe die Umgebung aus der Ich-Perspektive erkunden, um die zur Beantwortung der Frage erforderlichen Informationen zu sammeln. Ein Agent mit autonomen Erkundungs- und Entscheidungsfähigkeiten muss nicht nur überlegen, welche Maßnahmen er ergreifen soll, um die Umgebung zu erkunden, sondern auch entscheiden, wann er mit der Erkundung aufhört, um Fragen zu beantworten, wie in der folgenden Abbildung dargestellt.



Verkörpertes Q&A-Framework

Neben Frage-und-Antwort-Interaktionen mit Menschen umfasst die verkörperte Interaktion auch die Durchführung von Operationen auf der Grundlage menschlicher Anweisungen, wie etwa das Ergreifen und Platzieren von Objekten, wodurch die Interaktion zwischen Agenten, Menschen und Objekten abgeschlossen wird. Wie gezeigt, erfordert verkörpertes Greifen ein umfassendes semantisches Verständnis, Szenenbewusstsein, Entscheidungsfindung und eine robuste Kontrollplanung. Die verkörperte Greifmethode kombiniert das traditionelle kinematische Greifen von Robotern mit groß angelegten Modellen (z. B. großen Sprachmodellen und Basismodellen der visuellen Sprache) und ermöglicht es Agenten, Greifaufgaben unter multisensorischer Wahrnehmung auszuführen, einschließlich visueller aktiver Wahrnehmung, Sprachverständnis und Argumentation.



Sprachgesteuertes interaktives Crawling-Framework

6. Verkörperte Intelligenz

Ein Agent ist definiert als eine autonome Einheit, die in der Lage ist, die Umgebung zu erfassen und Maßnahmen zu ergreifen, um bestimmte Ziele zu erreichen. Jüngste Fortschritte bei multimodalen Großmodellen haben die Anwendung von Agenten in realen Szenarien weiter erweitert. Wenn diese multimodalen großen modellbasierten Agenten in physische Einheiten verkörpert werden, sind sie in der Lage, ihre Fähigkeiten effektiv vom virtuellen Raum in die physische Welt zu übertragen und so zu verkörperten Agenten zu werden. Damit verkörperte Agenten in der informationsreichen und komplexen realen Welt agieren können, wurden sie mit leistungsstarken multimodalen Wahrnehmungs-, Interaktions- und Planungsfähigkeiten entwickelt. Wie in der folgenden Abbildung dargestellt, umfasst ein verkörperter Agent normalerweise die folgenden Prozesse, um eine Aufgabe abzuschließen:

(1) Zerlegen Sie abstrakte und komplexe Aufgaben in spezifische Unteraufgaben, dh eine verkörperte Aufgabenplanung auf hoher Ebene.

(2) Führen Sie diese Unteraufgaben schrittweise durch, indem Sie die verkörperten Wahrnehmungs- und Interaktionsmodelle effektiv nutzen oder indem Sie die strategischen Funktionen des Grundmodells nutzen, das als verkörperte Aktionsplanung auf niedriger Ebene bezeichnet wird.

Es ist erwähnenswert, dass bei der Missionsplanung erst nachgedacht werden muss, bevor gehandelt wird, und daher oft im digitalen Raum betrachtet wird. Im Gegensatz dazu muss die Aktionsplanung effektive Interaktionen mit der Umgebung berücksichtigen und diese Informationen an den Missionsplaner zurückgeben, um die Missionsplanung anzupassen. Daher ist es für verkörperte Agenten von entscheidender Bedeutung, ihre Fähigkeiten vom digitalen Raum auf die physische Welt auszurichten und zu verallgemeinern.



Verkörpertes Agenten-Framework basierend auf multimodalen großen Modellen

7. Migration von der virtuellen zur Realität

Unter Sim-to-Real-Anpassung in der verkörperten Intelligenz versteht man den Prozess der Übertragung von Fähigkeiten oder Verhaltensweisen, die in einer simulierten Umgebung (digitaler Raum) erlernt wurden, auf die reale Welt (physische Welt). Der Prozess umfasst die Validierung und Verbesserung der Wirksamkeit von in der Simulation entwickelten Algorithmen, Modellen und Steuerungsstrategien, um sicherzustellen, dass sie in der physischen Umgebung stabil und zuverlässig funktionieren. Um eine Anpassung von der Simulation an die Realität zu erreichen, sind verkörperte Weltmodelle, Datenerfassungs- und Trainingsmethoden sowie verkörperte Steuerungsalgorithmen drei Schlüsselelemente. Die folgende Abbildung zeigt fünf verschiedene Sim-to-Real-Paradigmen.



Fünf Optionen für die Migration von der virtuellen zur Realität

8. Herausforderungen und zukünftige Entwicklungsrichtungen

Obwohl sich die verkörperte Intelligenz rasant weiterentwickelt, steht sie vor mehreren Herausforderungen und bietet spannende Zukunftsrichtungen:

(1)Hochwertiger Roboterdatensatz . Die Beschaffung ausreichender Roboterdaten aus der realen Welt bleibt eine große Herausforderung. Das Sammeln dieser Daten ist zeitaufwändig und ressourcenintensiv. Sich ausschließlich auf simulierte Daten zu verlassen, wird das Problem der Lücke zwischen Simulation und Realität verschärfen. Die Erstellung vielfältiger realer Robotik-Datensätze erfordert eine enge und umfassende Zusammenarbeit zwischen den Institutionen. Darüber hinaus ist die Entwicklung realistischerer und effizienterer Simulatoren von entscheidender Bedeutung, um die Qualität der Simulationsdaten zu verbessern. Um ein universelles verkörpertes Modell zu erstellen, das szenario- und aufgabenübergreifende Anwendungen im Bereich der Robotik erreichen kann, ist es notwendig, umfangreiche Datensätze zu erstellen und hochwertige simulierte Umgebungsdaten zur Unterstützung realer Daten zu verwenden.

(2)Effektive Nutzung menschlicher Demonstrationsdaten . Um menschliche Demonstrationsdaten effizient zu nutzen, müssen von Menschen demonstrierte Aktionen und Verhaltensweisen genutzt werden, um Robotersysteme zu trainieren und zu verbessern. Dieser Prozess umfasst das Sammeln, Verarbeiten und Lernen aus großen, hochwertigen Datensätzen, wobei Menschen die Aufgaben ausführen, die der Roboter lernen muss. Daher ist es wichtig, große Mengen unstrukturierter, multi-labelter und multimodaler menschlicher Demonstrationsdaten in Kombination mit Action-Label-Daten effektiv zu nutzen, um verkörperte Modelle zu trainieren, die in relativ kurzer Zeit eine Vielzahl von Aufgaben erlernen können. Durch die effiziente Nutzung menschlicher Demonstrationsdaten können Robotersysteme ein höheres Maß an Leistung und Anpassungsfähigkeit erreichen und so komplexe Aufgaben in dynamischen Umgebungen besser ausführen.

(3)Komplexe Umgebungserkennung . Unter komplexer Umgebungserkennung versteht man die Fähigkeit verkörperter Agenten, komplexe reale Umgebungen in physischen oder virtuellen Umgebungen wahrzunehmen, zu verstehen und darin zu navigieren. Bei unstrukturierten offenen Umgebungen stützen sich aktuelle Arbeiten in der Regel auf den Aufgabenzerlegungsmechanismus des vorab trainierten LLM und nutzen umfangreiches gesundes Menschenverstandswissen für die einfache Aufgabenplanung, es mangelt jedoch an spezifischem Szenenverständnis. Die Verbesserung des Wissenstransfers und der Verallgemeinerung in komplexen Umgebungen ist von entscheidender Bedeutung. Ein wirklich vielseitiges Robotersystem sollte in der Lage sein, Anweisungen in natürlicher Sprache in einer Vielzahl unterschiedlicher und unsichtbarer Szenarien zu verstehen und auszuführen. Dies erfordert die Entwicklung anpassbarer und skalierbarer verkörperter Agentenarchitekturen.

(4)Aufgabenausführung über große Entfernungen . Die Ausführung eines einzelnen Befehls erfordert in der Regel, dass der Roboter eine weitreichende Aufgabe ausführt, beispielsweise einen Befehl wie „Küche putzen“, der das Umordnen von Gegenständen, das Fegen des Bodens, das Abwischen von Tischen und andere Aktivitäten umfasst. Für den erfolgreichen Abschluss dieser Aufgaben muss der Roboter in der Lage sein, eine Reihe von Aktionen auf niedriger Ebene über einen längeren Zeitraum zu planen und auszuführen. Obwohl aktuelle Aufgabenplaner auf hoher Ebene erste Erfolge gezeigt haben, scheitern sie in verschiedenen Szenarien häufig aufgrund mangelnder Anpassung an verkörperte Aufgaben. Die Bewältigung dieser Herausforderung erfordert die Entwicklung effizienter Planer mit starken Wahrnehmungsfähigkeiten und umfassendem Wissen über den gesunden Menschenverstand.

(5)Kausale Entdeckung . Bestehende datengesteuerte verkörperte Agenten treffen Entscheidungen auf der Grundlage von Korrelationen innerhalb der Daten. Diese Modellierungsmethode kann es dem Modell jedoch nicht ermöglichen, den kausalen Zusammenhang zwischen Wissen, Verhalten und Umwelt wirklich zu verstehen, was zu voreingenommenen Strategien führt. Dies macht es schwierig, sie in realen Umgebungen interpretierbar, robust und zuverlässig zu betreiben. Daher muss verkörperte Intelligenz auf Weltwissen basieren und über autonome kausale Argumentationsfähigkeiten verfügen.

(6)Fortlaufendes Lernen . Bei Robotikanwendungen ist kontinuierliches Lernen für den Einsatz von Roboterlernstrategien in unterschiedlichen Umgebungen von entscheidender Bedeutung, dieser Bereich bleibt jedoch noch wenig erforscht. Während einige neuere Forschungsarbeiten Unterthemen des kontinuierlichen Lernens untersucht haben, wie z. B. inkrementelles Lernen, schnelle Bewegungsanpassung und Lernen durch Mensch-Computer-Interaktion, sind diese Lösungen normalerweise für eine einzelne Aufgabe oder Plattform konzipiert und haben das zugrunde liegende Modell noch nicht berücksichtigt. Offene Forschungsfragen und mögliche Ansätze umfassen: 1) das Mischen unterschiedlicher Anteile früherer Datenverteilungen bei der Feinabstimmung auf die neuesten Daten, um katastrophales Vergessen zu mildern, 2) die Entwicklung effizienter Prototypen aus früheren Verteilungen oder Kursen für das Inferenzlernen für neue Aufgaben, 3) die Verbesserung der Trainingsstabilität und Stichprobeneffizienz von Online-Lernalgorithmen, 4) Identifizierung prinzipieller Methoden zur nahtlosen Integration von Modellen mit großer Kapazität in Kontrollrahmen, möglicherweise durch hierarchisches Lernen oder langsam-schnelle Kontrolle, um Echtzeit-Schlussfolgerungen zu erreichen.

(7)Einheitlicher Bewertungsmaßstab . Obwohl es viele Benchmarks für die Bewertung von Low-Level-Kontrollstrategien gibt, unterscheiden sich diese häufig erheblich in ihren Bewertungsfähigkeiten. Darüber hinaus sind die in diesen Benchmarks enthaltenen Objekte und Szenen häufig auf den Simulator beschränkt. Um verkörperte Modelle vollständig zu bewerten, sind Benchmarks erforderlich, die mehrere Fähigkeiten unter Verwendung realistischer Simulatoren abdecken. Im Hinblick auf die Aufgabenplanung auf hoher Ebene bewerten viele Benchmarks die Planungsfähigkeiten anhand von Frage-und-Antwort-Aufgaben. Ein idealerer Ansatz wäre jedoch eine umfassende Bewertung der Ausführungsfähigkeiten von Missionsplanern auf hoher Ebene und von Kontrollstrategien auf niedriger Ebene, insbesondere bei der Durchführung von Langzeitmissionen und der Messung der Erfolgsraten, anstatt sich ausschließlich auf die Bewertung von Planern allein zu verlassen. Dieser umfassende Ansatz ermöglicht eine umfassendere Bewertung der Fähigkeiten verkörperter intelligenter Systeme.

Kurz gesagt: Verkörperte Intelligenz ermöglicht es intelligenten Agenten, verschiedene Objekte im digitalen Raum und in der physischen Welt wahrzunehmen, zu erkennen und mit ihnen zu interagieren, was ihre Bedeutung für die Verwirklichung allgemeiner künstlicher Intelligenz demonstriert. Diese Übersicht bietet einen umfassenden Überblick über verkörperte Roboter, verkörperte Simulationsplattformen, verkörperte Wahrnehmung, verkörperte Interaktion, verkörperte Agenten, virtuelle Robotersteuerung und zukünftige Forschungsrichtungen, die für die Förderung der Entwicklung verkörperter Intelligenz wertvoll sind.

Über das Pengcheng Laboratory Institute of Multi-Agent and Embodied Intelligence

Das dem Pengcheng Laboratory angegliederte Institute of Multi-Agent and Embodied Intelligence vereint Dutzende junger Top-Wissenschaftler aus den Bereichen intelligente Wissenschaft und Robotik und stützt sich dabei auf unabhängige und kontrollierbare KI-Infrastrukturen wie Pengcheng Cloud Brain und China Computing Network engagiert sich für den Aufbau universeller Basisplattformen wie Multi-Agenten-Kollaborations- und Simulationstrainingsplattformen sowie cloudbasierter kollaborativer verkörperter multimodaler Großmodelle, die wichtige Anwendungsanforderungen wie das industrielle Internet, soziale Governance und Dienste erfüllen.