Nachricht

Figuren-KI hat den „Terminator“ erschaffen

2024-08-07

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Maschinenherzbericht

Redaktion von Machine Heart

Kann Sprachgespräche führen, VLM sehen und 20 Stunden am Tag arbeiten.

Es wird diesen Tag immer geben, aber wir haben nicht damit gerechnet, dass er so bald kommt.

Am Abend des 6. August, Pekinger Zeit, veröffentlichte Figure, ein bekanntes Startup für verkörperte Intelligenz im Silicon Valley, offiziell seinen humanoiden Roboter Figure 02 der neuen Generation.





Diese Art von Roboter sieht nicht nur wie Science-Fiction aus, sondern verfügt auch über genügend allgemeine Intelligenz, um in Echtzeit mit Menschen zu sprechen und automatisch zu lernen, wie man Teile zusammenbaut. Tatsächlich arbeitet Abbildung 02 als Praktikant im BMW-Werk in Spartanburg und es fühlt sich an, als wären wir in die Zukunft getreten.



Das Figure-Engineering- und Design-Team hat eine komplette Neugestaltung der Figure 02-Hardware und -Software durchgeführt. Bei Schlüsseltechnologien wie künstlicher Intelligenz, Bildverarbeitung, Batterien, elektronischen Geräten, Sensoren und Aktoren wurden erhebliche Fortschritte erzielt.

Herzstück der Maschine

,Daumen hoch

539

Insbesondere enthält Abbildung 02 hauptsächlich die folgenden Funktionen:

  • Sprachgespräch in Echtzeit: Abbildung 02 Möglichkeit, mit Menschen über integrierte Mikrofone und Lautsprecher zu sprechen, die an ein benutzerdefiniertes großes OpenAI-Modell angeschlossen sind;
  • Kamera: KI-Bildverarbeitungssystem mit 6 RGB-Kameras;
  • Manipulator: Der Manipulator der vierten Generation mit 16 Freiheitsgraden und der gleichen Stärke wie Menschen;
  • Integriertes VLM: Unterstützung von Roboterkameras für schnelles visuelles Denken mit gesundem Menschenverstand;
  • Akku mit großer Kapazität: Ein maßgeschneiderter 2,25-kWh-Akku im Rumpf des Roboters liefert mehr als 50 % der Leistung;
  • CPU/GPU: Im Vergleich zur Vorgängergeneration haben sich die Onboard-Computing- und KI-Argumentationsfähigkeiten um das Dreifache erhöht.

Umfassende Verbesserung: allgemein + humanoid + praktisch

Die vielleicht größte Änderung bei diesem Upgrade besteht darin, dass Figure 02 wirklich bereit ist, auf Sprachbefehle zu reagieren.

In der erstaunlichen Technologiedemo des letzten Jahres fragte ein Mensch, der vor Abbildung 01 stand, den Roboter: „Kannst du mir etwas zu essen bringen?“ Er erkannte nicht nur, dass das Objekt davor ein Apfel war, er verstand auch, dass es sich um Äpfel handelte kann direkt gegessen werden, also reichte er der Person vor ihm den Apfel und sagte: „Natürlich, nimm ihn und iss ihn.“

Im März dieses Jahres kündigte OpenAI an, mit Figure zusammenzuarbeiten, um verkörperte Intelligenz zu entwickeln, die es humanoiden Robotern ermöglicht, in Echtzeit zu kommunizieren und effektiv zu kommunizieren. Unterstützt durch OpenAI kann Figure die Voice-to-Speech-Funktionen von Robotern schnell iterieren. Figure gab an, dass Figure 02 aufgrund der erheblichen Steigerung der endseitigen Rechenleistung nun verschiedene Aufgaben in der realen Welt völlig autonom ausführen kann.

In Abbildung 02 profitiert die Implementierung des Sprachschlussfolgerns von Robotern hauptsächlich vom eingebauten Mikrofon und Lautsprecher, die mit dem benutzerdefinierten KI-Modell verbunden sind, das in Zusammenarbeit mit OpenAI trainiert wurde.



Das Navigationssystem von Figure 02 verwendet ein VLM (Visual Language Model), das es der Kamera des Roboters ermöglicht, semantische Forschung und schnelles visuelles Denken mit gesundem Menschenverstand durchzuführen. VLM ist eine neue Richtung im intelligenten Fahren, die derzeit von vielen neuen Automobilherstellern untersucht wird. Im Bereich der Robotik kann diese Methode offensichtlich auch bei vielen Aufgaben bahnbrechende Ergebnisse erzielen.



Man kann sagen, dass die Batterielebensdauer eine der größten Herausforderungen für den praktischen Einsatz humanoider Roboter ist. Abbildung 02 verfügt über einen maßgeschneiderten Akku mit einer Kapazität von 2,25 KWh im Rumpf des Roboters, der mehr als 50 % mehr Energie liefern kann als Abbildung 01 und dadurch die Laufzeit des Roboters maximiert. Brett Adcock, der Gründer und CEO von Figure AI, sagte, er hoffe, dass Figure 02 jeden Tag mehr als 20 Stunden effektive Arbeit leisten könne.



Wir können sehen, dass das Erscheinungsbild von Abbildung 02 integrierter geworden ist, da es eine neue Exoskelettstruktur annimmt. Im Vergleich zu Abbildung 01 hat sich das Erscheinungsbild des Roboters umfassender verändert. Darüber hinaus verfügt es über ein integriertes Verkabelungsdesign. Die integrierte Verkabelung bietet folgende Vorteile:

  • höhere Zuverlässigkeit
  • Versteckte Drähte
  • Engere Verpackung



Von Abbildung 01 zu Abbildung 02 hat sich das Erscheinungsbild stark verändert.

Zusätzlich zur besseren Verkabelung hat Figure 02 kundenspezifische Kabelklemmen und Anschlüsse entwickelt, um die Zuverlässigkeit des Roboters zu erhöhen.



Um die Welt wie Menschen zu verstehen, verwendet Figure 02 Multikameras und KI-gesteuerte visuelle Systeme, um Wahrnehmung und Argumentation durchzuführen. Er verfügt über insgesamt 6 integrierte RGB-Kameras am Kopf, am Vorder- und Hinterkörper, die dem Roboter visuelle Fähigkeiten verleihen, die über die des Menschen hinausgehen.



Endlich gibt es flinke Finger. Abbildung 02 ist mit einem Manipulator der vierten Generation ausgestattet, der über 16 Freiheitsgrade verfügt und die gleiche Stärke wie der Mensch hat. Die gesamte Hand enthält mechanische, elektrische, Steuerungs- und Sensortechnologien.



Brett Adcock sagte, dass die KI-Daten-Engine, während der Roboter weiterläuft, Daten für Trainingsmodelle sammelt und organisiert, um die Leistung kontinuierlich zu verbessern.



Wenn man so ein wunderbares Aussehen von Abbildung 02 sieht, muss man an Musks Optimus Prime denken. Im Vergleich zu den beiden weiß ich nicht, wer besser ist.



Einige Internetnutzer sagten: „Abbildung 02 läutet den Beginn einer neuen Ära ein. Dies ist derzeit der fortschrittlichste Roboter der Welt, und die Zukunft ist da.“



Startup-Unternehmen Abbildung: Die Hälfte des Silicon Valley investiert

Figure wurde 2022 von Brett Adcock gegründet und ist ein in den USA ansässiges Robotikunternehmen, das sich auf die Entwicklung humanoider Roboter spezialisiert hat. Ziel des Unternehmens ist es, universelle humanoide Roboter zu entwickeln, die einen positiven Einfluss auf die Menschheit haben und ein besseres Leben für zukünftige Generationen schaffen.

Nach der Explosion der generativen KI-Technologie sind viele Robotikunternehmen entstanden, die auf verkörperte Intelligenz abzielen, und Figure ist unter ihnen besonders auffällig. Im März 2023 verließ Figure den Stealth-Modus und brachte den Roboter-Prototyp Figure 01 auf den Markt, der wie Menschen aussieht und sich bewegt. Hierbei handelt es sich um einen zweibeinigen Roboter, der für manuelle Arbeit konzipiert ist und zunächst für die Logistik- und Lagerbranche gedacht ist.

Im Mai 2023 sammelte das Unternehmen 70 Millionen US-Dollar von Investoren unter der Führung von Parkway Venture Capital ein.

Im Oktober desselben Jahres veröffentlichte Figure ein Video des zweibeinigen Roboters Figure 01 beim Gehen.



Im Januar dieses Jahres hat Abbildung 01 gelernt, Kaffee zu kochen.



Am 18. Januar 2024 gab Figure eine Partnerschaft mit BMW bekannt, um humanoide Roboter in Automobilfabriken einzusetzen. Zu diesem Zeitpunkt soll Abbildung 01 in der Lage sein, Aufgaben in der realen Welt autonom zu erledigen.



Bild 01 Arbeiten im BMW-Werk.

Im März dieses Jahres gab Figure den Abschluss einer erstaunlichen Serie-B-Finanzierung in Höhe von 675 Millionen US-Dollar bekannt, wodurch sich der Unternehmenswert auf 2,6 Milliarden US-Dollar erhöhte. Zu den Investoren zählen Microsoft, Intel, OpenAI Startup Fund, Amazon Industrial Innovation Fund, Nvidia, Bezos, „Mr. Mu's“ Ark Investment, Parkway Venture Capital, Align Ventures usw.

Gleichzeitig kündigte Figure auch eine Partnerschaft mit OpenAI an, einschließlich der Entwicklung eines speziellen KI-Modells für Figures humanoiden Roboter durch OpenAI, damit sein Roboter Sprache verarbeiten und darüber nachdenken kann.

Am 13. März kann Figure 01 mithilfe der OpenAI-Technologie ein umfassendes Gespräch mit Menschen führen.

Vom aufrechten Gehen über das Erledigen komplexer Aufgaben bis hin zum natürlichen Umgang mit Menschen. Diese technischen Highlights sind auch einer der wichtigen Gründe, warum Figure eine Kooperationsvereinbarung mit OpenAI geschlossen hat, das schon immer in den Bereich der Robotik zurückkehren wollte – um die Forschung von OpenAI mit der Robotik-Erfahrung von Figure zu kombinieren, um KI-Modelle der nächsten Generation für humanoide Roboter zu entwickeln .

Nach der heutigen Veröffentlichung von Figure 02 hat uns die Kombination aus hochintegrierter Hardware und KI-Technologien der nächsten Generation wie VLM einen Schritt näher an humanoide Roboter mit wirklich universellen Fähigkeiten gebracht.

Wird die physische Welt bald auch Veränderungen durch KI mit sich bringen?

Referenzinhalt:

https://x.com/Figure_robot/status/1820791819023909031

https://www.youtube.com/watch?v=0SRVJaOg9Co

https://www.therobotreport.com/figure-02-humanoid-robot-is-ready-to-get-to-work/