Nachricht

Ein chinesischer Doktorand aus Yale nach 2000 machte eine Schulpause, um ein Unternehmen zu gründen, und entwickelte einen humanoiden Roboter, der Kleidung waschen und Burger zubereiten kann

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Text |. Wang Qin

Herausgeber|Qiu Xiaofen, Su Jianxun

Obwohl die Geschichte von Ivy-League-Studenten, die die Schule abbrechen, um ein Unternehmen zu gründen, nichts Neues ist, ist es dieses Mal die Generation nach 2000, die die Schule abbricht, um ein Unternehmen zu gründen. Er ist auch ein chinesischer akademischer Tyrann, der in Top veröffentlicht hat Veröffentlichungen und Konferenzen und ging direkt nach Yale – der AI Large Model and Embodied Intelligence Competition ist so beliebt geworden, dass bereits das Gefühl der Dringlichkeit besteht: „Ich werde alt, wenn ich kein Unternehmen gründe.“

Yang Fengyu Fred Yang, gebürtig aus Jiangsu, schloss sein Studium in Yale mit einem Vollstipendium ab. Er ist der Gründer des verkörperten Geheimdienstunternehmens UniX AI (UniX Technology Company). Burger zubereiten und Geschirr spülen.


Fred Yang, Gründer des humanoiden Roboterunternehmens UniX AI

Obwohl er schon in jungen Jahren sein eigenes Unternehmen gründete, war Yang Fengyus Entscheidung, die Schule abzubrechen und ein Unternehmen zu gründen, nicht spontan. Erstens wollte er schon während seiner Schulzeit ein Unternehmen gründen, und als Student hatte er einige „kleine“ unternehmerische Projekte. Zweitens sagte er, dass die Anzahl der von ihm veröffentlichten Arbeiten ausreichte, um einen Doktortitel zu erlangen, und dass eine Pause keine riskante Entscheidung sei. Darüber hinaus hat er seit seinem Studium akademische Kontakte im Bereich der verkörperten Intelligenz in China aufgebaut. Nachdem er sein Unternehmen gegründet hatte, suchte er im ganzen Land nach hochrangigen Mitarbeitern in der Robotikbranche .

Jetzt hat das von ihm gegründete UniX AI-Unternehmen Wang Hesheng, einen angesehenen Professor an der Shanghai Jiao Tong University und Generalvorsitzenden der führenden Robotikkonferenz IROS2025, als Chefwissenschaftler eingeladen.

Obwohl er Artikel in führenden internationalen Fachzeitschriften veröffentlicht und den Titel „Outstanding Undergraduate Scientist“ der North American Computer Society gewonnen hat, stieß Fred Yang als junges Gesicht, das zunächst nach China zurückkehrte, um ein Unternehmen zu gründen, bei der Rekrutierung von Mitarbeitern häufig auf Hindernisse. Als wir zum ersten Mal ein Team zusammenstellten und einige erfahrene Experten einluden, die zwanzig Jahre älter waren als wir selbst, mussten wir das Reetdachhaus dreimal besuchen und uns sogar mehr als acht Stunden am Stück unterhalten.

Derzeit kann der von UniX AI entwickelte humanoide Roboter mit Rädern und zwei Armen als Haushaltsroboter automatisch die Kleidung identifizieren, die Sie in jeder Ecke des Hauses herumwerfen, sie automatisch aufheben und zum Waschen zur Waschmaschine bringen. und kann Ihnen auch Kleidung geben, nachdem Sie mit dem Essen fertig sind. Sie räumen Geschirr weg, spülen Geschirr und reinigen den Boden.


Der UniX-KI-Roboter kann Tofu pflücken

Für Heimszenarien sind die Bedienfähigkeiten von Roboterhänden von entscheidender Bedeutung. Der von UniX AI selbst entwickelte Drei-Finger-Greifer kann Kugelschreiber und Tofu halten. UniX AI gab bekannt, dass die erste Charge von 100 humanoiden Robotern im September in Massenproduktion gehen wird.

Das Folgende ist ein Gespräch zwischen „Intelligence Emergence“ und Fred Yang, dem Gründer von UniX AI, einem verkörperten Geheimdienstunternehmen.

Entstehung von Intelligenz: Derzeit gibt es in der Branche keine einheitliche Definition von humanoiden Robotern, und verschiedene Unternehmen haben von Anfang an unterschiedliche technische Wege verfolgt, und einige Unternehmen stellen humanoide Roboter her, beispielsweise die Radroboter Ihres Unternehmens Zweiarmige Form. Was halten Sie von verschiedenen technischen Wegen?

Fred Yang : Dieser Markt ist groß genug und verschiedene Unternehmen sind in unterschiedlichen Szenarien verwurzelt. Jeder entwirft seine eigene mechanische Struktur und die gesamten Software- und Hardwarelösungen basierend auf dem Anwendungsszenario. In diesem Stadium ist es nicht schwierig, für jede technische Lösung ein Anwendungsszenario zu finden. Ich denke, es gibt kein Richtig oder Falsch. Jeder betrachtet es aus der Perspektive der Bedürfnisse.

Smart Emergence: Warum haben Sie sich für die Konfiguration Rad + Arme entschieden?

Fred Yang : Lassen Sie uns zuerst über die Arme sprechen. In einer Familienszene ist die Fähigkeit, die Hände zu bedienen, das Wichtigste. Die Höhe vieler Dinge im Wohnraum ist auf den Menschen abgestimmt. Unser bionischer humanoider Arm verfügt über 7 Freiheitsgrade (was so verstanden werden kann, dass der Arm 7 Gelenke hat) und kann viele menschenähnliche Operationen ausführen.

Bezüglich des Radtyps wählen wir unter Berücksichtigung der Bewegungsgenauigkeit und Sicherheit zunächst den Radtyp für den Einstieg in die Heimszene aus. Jeder entwirft immer noch seine eigenen Hardwarelösungen basierend auf unterschiedlichen Nutzungsszenarien.


Bedienfunktionen für UniX-KI-Roboter


Entstehung von Intelligenz: Arbeiten Sie derzeit gleichzeitig an Hardware und Software?

Fred Yang : Unsere Kernlogik basiert auf dem Szenario. Hardware und Software sind uns gleichermaßen wichtig.

Entstehung von Intelligenz: Im Allgemeinen konzentrieren sich Unternehmen, die sich mit verkörperter Intelligenz befassen, auf das Gehirn, das Kleinhirn und den Hardware-Körper.

Fred Yang: Wir machen sowohl Software als auch Hardware, aber wenn wir uns auf Gehirn, Kleinhirn und Hardware konzentrieren, konzentrieren wir uns mehr auf die Hardware- und Kleinhirnebene.

Hardware ist die Basis des Algorithmus. Software und Hardware sind stark gekoppelt, und die Hardware muss der Szene folgen. In der Heimszene verfügt beispielsweise unser selbst entworfener Drei-Finger-Greifer über zwei Modi (Drei-Finger-Modus und Zwei-Finger-Modus). Die drei Finger können in zwei Finger gedreht werden, mit denen kleine Kugelschreiber gehalten werden können oder sogar Tofu.

Darüber hinaus ist es in diesem Stadium auch wichtig, ein solides Fundament im Kleinhirn zu legen. In Bezug auf das Problem der „Generalisierbarkeit“, das allen am Herzen liegt, kann der Generalisierungsprozess in drei Phasen unterteilt werden: von begrenzten Szenarien einer einzelnen Aufgabe über offene Szenarien einer einzelnen Aufgabe bis hin zu offenen Szenarien offener Aufgaben.

(Hinweis: Zum Beispiel von der Fähigkeit, eine einzelne Aufgabe wie Wäschewaschen in einer bestimmten häuslichen Umgebung zu erledigen, über die Fähigkeit, Wäsche in häuslichen Umgebungen mit unterschiedlichen räumlichen Umgebungen zu waschen, bis hin zur Fähigkeit, Wäsche zu waschen, zu kochen und Kindern Nachhilfe zu geben verschiedene räumliche Umgebungen und andere Aufgaben)

Jetzt arbeitet jeder in der Branche immer noch hart von der ersten bis zur zweiten Phase. In dieser Phase wird hauptsächlich die Fähigkeit des Kleinhirns getestet. Wenn wir später offene Szenarien durchführen (dritte Stufe), planen wir im Wesentlichen auf Gehirnebene (Aufgabenplanung), aber jetzt besteht die erste Aufgabe darin, eine solide Grundlage auf der Kleinhirnebene zu legen und zuerst die operative Ebene zu lösen.


Der humanoide KI-Roboter UniX schnappt sich Kleidung

Intelligenzentstehung: Eines Ihrer Forschungsergebnisse ist UniTouch, ein großes multimodales taktiles Modell. Was ist visuelle Taktilität und was ist ein großes taktiles Modell? Welche Bedeutung hat die visuelle Haptik für die Weiterentwicklung der humanoiden Robotertechnologie?

Fred Yang : Berührung ist im Roboter-Betriebssystem und sogar im menschlichen Betriebssystem sehr wichtig. Aus menschlicher Sicht ist Berührung die instinktivste Art der Wahrnehmung, und Feedback wird durch echte Interaktion mit der physischen Welt erhalten. Nehmen Sie ein kleines Beispiel: Die Suche nach Schlüsseln aus einer Tasche. Im Allgemeinen verlassen sich Menschen nicht auf das Sehen, sondern hauptsächlich auf die Berührung.

Aus der Sicht eines Roboters reicht es aufgrund von Einschränkungen in der mechanischen Struktur und Sensorauswahl oft nicht aus, sich allein auf das Sehen zu verlassen. Lassen Sie den Roboter beispielsweise den Flaschenverschluss greifen. Wenn der Roboterarm ihn greift, wird er bereits vom Roboterarm selbst blockiert.

Zu diesem Zeitpunkt können Sie sich nur auf das taktile Feedback verlassen, um die endgültige Erfassung und Überprüfung abzuschließen. Diese Situation tritt besonders deutlich beim Betrieb verformbarer Objekte auf. Bei Kontakt mit einem verformbaren Objekt ändert sich die Form des Objekts und die Informationen, die der visuelle Prior liefern kann, sind sehr begrenzt. Er muss sich auf sehr lokale, aber hochsensible taktile Informationen verlassen, um Aufgaben wahrzunehmen und auszuführen.

Gleichzeitig liefert die Berührung andere Informationen, die das Sehen nicht liefern kann, beispielsweise Kraft. Vision kann dem Roboter die Greifposition anzeigen, jedoch nicht die Greifstärke ermitteln. Auch einfache Kraftsensoren haben ihre Grenzen: Vor dem Zerdrücken eines Bechers ist aus Sicht der Kraft keine Veränderung erkennbar, selbst wenn an der Becherwand leichte Risse entstanden sind. Aber zu diesem Zeitpunkt kann der taktile Sensor die winzigen Risse erfassen und feststellen, ob sie beim nächsten Arbeitsgang zerstört werden.

Ich habe zuvor einen Artikel veröffentlicht und das weltweit erste groß angelegte taktile multimodale Modell erstellt, das taktile Informationen mit visuellen Informationen und anderen sprachmodalen Informationen integriert. Jede Modalität hat ihre eigenen Grenzen, und auch das Sehen hat seine eigenen Grenzen, aber durch die Hinzufügung taktiler Informationen kann jede Modalität einander ergänzen.

Derzeit beschäftigen sich auch viele Wettbewerber mit Haptik, konzentrieren sich jedoch noch auf die Hardwareebene, beispielsweise taktile Sensoren. Wenn UniX AI jedoch auf Heimanwender ausgerichtet sein soll, muss die Hardware eine Lebensdauer von 3-5 Jahren haben. Viele hochpräzise taktile Sensoren können die kommerziellen Anforderungen in Bezug auf die Lebensdauer derzeit noch nicht erfüllen.


Der UniX-KI-Roboter öffnet die Waschmaschine

Entstehung der Intelligenz: Ihre erste Charge von 100 humanoiden Robotern wird ab September in Massenproduktion hergestellt. Diese Zahl ist für Hersteller humanoider Roboter relativ groß. Wie wird die Lieferkette verwaltet?

Fred Yang : Die Massenproduktion konzentriert sich hauptsächlich auf die Lieferkette. Wir verfügen über einige Supply-Chain-Experten von Mercedes-Benz und Haier, die Erfahrung in der Supply-Chain-Fertigung und Kostenkontrolle haben. Es gibt auch eine Gruppe von Mitgliedern der Lieferkette mit Erfahrung in der Massenproduktion aus der traditionellen Robotik, Unterhaltungselektronik, Automobilindustrie und Luft- und Raumfahrtindustrie.

Intelligence Emergence: Wie baut man ein Team auf?

Fred Yang : Das Gebiet der Robotik kann nicht mit nur einem Technologie-Stack gelöst werden. Es erfordert die umfassende Zusammenarbeit von Hardware und Software sowie vielfältige Teamhintergründe. Die gesamte Branche der verkörperten Intelligenz ist sehr neu und unser Algorithmenteam ist im Wesentlichen sehr jung. Es handelt sich im Wesentlichen um Doktoranden und Postdoktoranden, die im In- und Ausland in den Bereichen Robotik oder künstliche Intelligenz arbeiten.

Was die Hardware angeht, konzentrieren wir uns derzeit auf Heimszenarien, wobei die Sicherheit sicherlich der wichtigste Faktor ist. Unser Team besteht aus Heimservice-Robotern, die Aufgaben zur Vermeidung von Hindernissen in komplexen Umgebungen in verschiedenen Häusern ausführen, wie z. B. das Aufwickeln von Drähten, schwebenden Hindernissen usw. Für Hardware im Zusammenhang mit verkörperter Intelligenz, einschließlich der Arme und Beine humanoider Roboter, verfügen wir auch über hochqualifizierte Wissenschaftler, die für die Hardware-Entwicklung verantwortlich sind.

Smart Emergence: Sie sind sehr jung und nach 2000 geboren. Ein so großes Team erfordert starke operative Fähigkeiten. Wie rekrutiert man Leute?

Fred Yang : Am Anfang war es wirklich schwierig, Leute zu rekrutieren. Ich habe meinen Bachelor-Abschluss an der University of Michigan und meinen Doktortitel in Yale. Ich bin im Ausland bekannt und habe schnell einige Freunde gefunden, die sich mit Algorithmen befassen Und wenn ich nach China zurückkomme, sind die Leute mit uns nicht vertraut, und ich stoße auch auf viele Hindernisse. Bevor jedes wichtige Mitglied hinzukam, unterhielt ich mich sehr lange mit ihnen. Für Talente muss man den Geist haben, „das Reetdachhaus dreimal zu besuchen“.

Entstehung von Intelligenz: Es ist nicht einfach, humanoide Roboter zu implementieren. Die meisten davon befinden sich noch in der Phase, in der sie an wissenschaftliche Forschungsinstitute verkauft werden. Sie sagten, dass dies möglich sei Ein Schritt, und es werden dieses Jahr 100 Einheiten in Massenproduktion hergestellt.

Fred Yang : Die Massenproduktion von humanoiden Robotern auf Rädern ist nicht so schwierig wie die von zweibeinigen humanoiden Robotern. Mittlerweile hat eigentlich jeder unterschiedliche Meinungen zur Definition humanoider Roboter. Für zweibeinige humanoide Roboter liegt meiner Meinung nach noch ein weiter Weg vor uns. Sie sind noch nicht vollständig für die Markteinführung bereit, da einige Sicherheitsprobleme noch nicht gelöst sind. Aber das Wichtigste zu Hause ist die Fähigkeit, die Hände zu bedienen, daher war die erste Robotergeneration, die wir auf den Markt brachten, ein Roboter mit Rädern und zwei Armen. Der Roboter mit Rädern ist eine relativ ausgereifte Technologie.

Die Geschwindigkeit der Produktiteration ist wichtig. Es ist schwierig, ein qualitativ hochwertiges Produkt der ersten Generation herzustellen. Wir produzieren zunächst schnell eine Version eines relativ stabilen, zuverlässigen und kostengünstigen Roboters, bringen ihn in großem Maßstab auf den Markt und führen dann eine schnelle Iteration durch. Wir haben intern immer gesagt, dass drei Generationen qualitativ hochwertige Produkte produzieren.

Bei unseren ersten 100 Einheiten handelt es sich hauptsächlich um Saatgutanwender, die bereit sind, „die Ersten zu sein, die Krabben essen“.


Der UniX-KI-Roboter reinigt Tische

Smart Emergence: Haben Sie bereits TO C-Kunden? Gab es frühe Kontakte?

Fred Yang : Die einzelnen Nutzer waren zu Beginn hauptsächlich einige Freunde aus unserem Umfeld, einige Freunde aus der Technologiebranche und Technikbegeisterte, die sehr an hochmodernen Produkten interessiert waren, ähnlich der Zielgruppe, die bereit war, Tesla zu kaufen, als es zum ersten Mal auf den Markt kam . Eine Klasse, die gerne mit Technologie experimentiert. Wir werden auch einige Fokusgruppen (Fokusgruppeninterviews) durchführen, um die spezifischen Bedürfnisse der Zielgruppen zu verstehen.

Entstehung von Intelligenz: Im Vergleich zu Robotern in vertikalen Szenarien (z. B. kommerzielle Dienstleistungen, Lagerlogistik, Sicherheitsinspektionen usw.) sind universelle humanoide Roboter in Heimszenarien viel schwieriger zu implementieren und erfordern viel höhere Generalisierungsfähigkeiten der Roboter. Ihren Informationen zufolge verfügt der humanoide UniX-KI-Roboter über Funktionen wie Wäschewaschen, Essensassistent, Putzen und Nachhilfe für Kinder bei Hausaufgaben. Wie ist die Umsetzungssituation?

Fred Yang : Das ultimative Ziel humanoider Roboter ist natürlich die Hoffnung, dass Roboter alles können, aber sie müssen Bissen für Bissen essen und die Dinge einzeln erledigen. Auch in der Familienszene wird es Schritt für Schritt umgesetzt, von der begrenzten Szene einer einzelnen Aufgabe über die offene Szene einer einzelnen Aufgabe bis hin zur offenen Szene offener Aufgaben.

Unsere Produkte verfügen derzeit über mehrere ausgereifte Szenarien, z. B. Wäschewaschen, Hilfe beim Einsammeln von Geschirr und Spülen nach dem Essen, 3D-Reinigungsfunktionen usw. Nehmen Sie als Beispiel die Wäschefunktion. Der erste Schritt des Roboters Wanda besteht darin, Objekte zu finden und eine dreidimensionale Karte zu erstellen Selbstentwickelte Greifer eignen sich vielseitig zum Greifen flexibler Gegenstände. Der dritte Schritt ist der Einsatz einer Waschmaschine.

Es ist nicht schwierig, Waschmaschinen allgemein zu nutzen (Roboter können verschiedene Arten von Waschmaschinen bedienen, um diese Aufgabe zu erledigen).

Entstehung von Intelligenz: Warum sollte man nach China zurückkehren, um ein Unternehmen zu gründen? Haben Sie schon einmal darüber nachgedacht, in den USA ein Unternehmen zu gründen?

Fred Yang: Ich definiere mich nicht so, dass ich nach China zurückkehre, um ein Unternehmen zu gründen, oder ein Unternehmen in den Vereinigten Staaten gründe. Wir haben Teams in den Vereinigten Staaten und in China, aber wir nutzen einfach unterschiedliche Standortvorteile. Die Vereinigten Staaten verfügen über ein erstklassiges Algorithmenteam und China über Partner in den Bereichen Struktur und Hardware. Wir haben auch ein Team in Shenzhen und haben in Shanghai ein Forschungs- und Entwicklungszentrum eingerichtet, in dem viele Kollegen arbeiten.