Nachricht

Eine weitere Untersuchung der Implementierung verkörperter Intelligenz im industriellen Bereich

2024-08-07

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Produziert |. Huxiu Think Tank

Autor |. Huang Siyu

Headerbild |. Visual China

Im gegenwärtigen Zeitalter des industriellen Wandels und des Zustroms neuer Produktivität bringt die verkörperte Intelligenz eine Reihe hochmoderner Technologien wie große Modelle, multimodale große Modelle, visuelle/taktile kleine Modelle usw. in Fabriken und macht sich auf den Weg eine praktische Reise im Bereich der industriellen Fertigung. Allerdings stellen komplexe und vielfältige Industrieszenarien die verkörperte Intelligenz vor große Herausforderungen. Mit welcher Szene soll man beginnen? Wie kann ich frei zwischen verschiedenen Szenen wechseln? Wie erhält man die umfangreichen und qualitativ hochwertigen Daten, die für seine intelligenten Systeme erforderlich sind?

Daher lud der Huxiu Think Tank 502 Online-Kollegen am 30. Juli 2024 um 19 Uhr einYin Zhi, Chefberater der Shanghai Artificial Intelligence Technology Association, Fu Yihui, Direktor von Tashan Technology Ecology, und Dr. Zhao He, CTO von Weiyi Intelligent Manufacturing, diskutierten gemeinsam die innovativen Anwendungen großer Modelle im Bereich der verkörperten Intelligenz und tauschten praktische Anwendungsfälle von verkörperter Intelligenz und humanoiden Robotern aus.

1. Integration verkörperter Intelligenz und großer Modelle und technischer Herausforderungen

Der beste Träger verkörperter Intelligenz sind humanoide Roboter, deren Wachstum auf großen Modellen beruht

Die Kombination aus großen Modellen und verkörperter Intelligenz hat bestimmte Ergebnisse erzielt und bietet weitreichende Aussichten. Yin Zhi, Chefberater der Shanghai Artificial Intelligence Technology Association, sagte, dass große Modelle als Robotergehirne mit Planungs- und Argumentationsfähigkeiten verwendet werden können und Ziele in Unterziele zerlegen und verwandte Funktionen aufrufen können. Die Richtung hat großes Potenzial.

Dr. Zhao He, CTO von Weiyi Intelligent Manufacturing, glaubt, dass nicht-humanoide Roboter aufgrund der Art ihrer Arbeit in Lebensszenarien möglicherweise besser geeignet sind.

Das große Modell untergräbt die Mensch-Computer-Interaktionsmethode und ermöglicht es Menschen und Maschinen, auf natürliche Weise wie Text, Stimme und Bilder zu kommunizieren. Dies ist ein großer Durchbruch. Große Modelle ermöglichen eine effiziente Interaktion und ermöglichen es Robotern, neue Aufgaben zu erlernen und spezifische Anforderungen und Betriebsspezifikationen zu erhalten.

Fu Yihui, ökologischer Direktor von Tashan Technology, stimmt zu, dass große Modelle verkörperte Intelligenz stärken können. Er sagte, dass humanoide Roboter die besten Träger verkörperter Intelligenz seien und ihr Wachstum von der Entwicklung großer Modelle abhänge. Der Bau eines humanoiden Roboters, der wie ein Mensch denkt und sich bewegt, basiert nicht nur auf großen Modellen, sondern erfordert auch Deep Learning, Bewegungssteuerungsalgorithmen und allgemeine Wahrnehmung, wie z. B. taktile Wahrnehmung, visuelle Wahrnehmung und die Fähigkeit, komplexe Umgebungen und logisches Denken zu verstehen.

Die kürzlich erwähnte räumliche Intelligenz basiert darauf, Robotern zu ermöglichen, die Welt zu sehen, wodurch Roboter die Welt besser verstehen, Wissen erlernen und Maßnahmen ergreifen können, während sie die Welt beobachten. Unter dieser allgemeinen Prämisse ist das Erreichen der verkörperten Wahrnehmung real2sim (der Prozess der Anwendung eines trainierten Modells in einer Simulationsumgebung auf eine reale Umgebung), die es dem Roboter ermöglicht, die Welt besser wahrzunehmen, die Voraussetzung dafür, ein flexiblerer Roboter zu werden.

Die Einbettung großer Modelle in verkörperte Intelligenz erfordert ein Gleichgewicht zwischen Energieverbrauch und Umsatz

Einige Zuschauer fragten: „Wenn ein großes Modell in einen intelligenten Roboter eingebettet ist, ist dann zusätzliche Hardware-Unterstützung erforderlich? Ist es notwendig, Leistung und Energieverbrauch neu auszubalancieren?“

Dr. Zhao He denkt, das ist eine gute Frage. Bei der Einbettung intelligenter Roboter in große Modelle müssen die Hardwareunterstützung und das Gleichgewicht zwischen Leistung und Energieverbrauch berücksichtigt werden. Verkörperte Intelligenz im weitesten Sinne, einschließlich des Menschen, muss den Energieverbrauch mit den erzielten Vorteilen in Einklang bringen. Beispielsweise verbraucht das menschliche Gehirn wenig Energie, ist aber intelligent. Allerdings können die Rechenleistung und der Energieverbrauch aktueller großer Modelle während des Trainings und der Inferenz den Anforderungen intelligenter Roboter nicht gerecht werden.

Die zukünftige Entwicklungsrichtung besteht darin, erstens den Rechenleistungs- und Energieverbrauch großer Modelle durch Technologie deutlich zu reduzieren, zweitens die Modellarchitektur und das Paradigma zu verbessern und drittens spezielle Chips wie ASIC zu entwickeln, um die Intelligenzdichte zu erhöhen Das heißt, die Intelligenz auf dem Chip pro Flächeneinheit kann durch Software-Härtung und die Verwendung des entwickelten dedizierten Chips zur Modellbegründung bis zu einem gewissen Grad effektiv auf verkörperte intelligente Roboter angewendet werden.

Multimodale große Modelle werden ein wichtiges Modul für verkörperte Intelligenz sein, um technologische Durchbrüche wie Kontrolle und Entscheidungsfindung zu erzielen.

In Bezug auf Schlüsseltechnologien wie Kontrolle, Entscheidungsfindung und Navigation verkörperter Intelligenz ist Yin Zhi der Ansicht, dass das aktuelle Problem von Robotern, die von großen Sprachmodellen angetrieben werden, darin besteht, dass sie Informationen in Text umwandeln und diese dann verarbeiten müssen Ein vorübergehender Übergang. In Zukunft sollten Roboter in der Lage sein, die native Wahrnehmungsumgebung zu verstehen. Es ist nicht erforderlich, die Sprache zu verwenden, um Kontrollentscheidungen und Navigation zu treffen, und es wird viel Logik in der Vision geben.

In Zukunft könnten große Modelle multimodale Systeme nutzen, um die Intelligenzfähigkeiten zu verbessern, wobei Module genau wie das menschliche Gehirn für verschiedene Funktionen verantwortlich sind. Derzeit gibt es möglicherweise mehrere kleine Modelle, die jeweils unterschiedliche Funktionen steuern. Multimodale große Modelle sind ein Trend, aber es wird Zeit brauchen, um die intelligenten Fähigkeiten zu verbessern, indem kleine Modelle mit großen Modellen kombiniert werden Abhängig von der Entwicklung großer Modelle mangelt es derzeit an multimodalen nativen großen Modelldaten.

Zhao He wies darauf hin, dass die Einführung der visuellen Servosteuerung in Industrierobotern die zugrunde liegenden Steuerungs- und übergeordneten Aufgaben öffnen und die Anwendungskosten in Bezug auf die Navigation erheblich senken kann. Voraussetzung hierfür ist die Wahrnehmung, einschließlich multimodaler Informationen B. Berührung und Temperatur, aber die Wirksamkeit der multimodalen Informationsintegration stellt größere technische Herausforderungen dar, ist aber eine positive Entwicklungsrichtung. Es wird ein revolutionärer Fortschritt sein, Maschinen das Verständnis menschlicher Absichten und Aufgabenanforderungen durch multimodalen Mehrpersonendialog und vollständige flexible Tangenten zu ermöglichen. Es kann auch grundlegende intelligente Standards für intelligentere Industrieroboter bereitstellen und eine standardisierte Produktion und flexible Anpassung vor Ort erreichen. .

Fu Yihui stimmte dem Standpunkt von Dr. Dabei sind taktile Daten und die Fusion multimodaler Wahrnehmungsdaten der Schlüssel zum Durchbrechen der verkörperten Wahrnehmung. Große multimodale Modelle mit taktilen Sensordaten helfen Robotern bei der Interaktion in komplexen Szenen. Obwohl in einigen Szenen nach viel Training herkömmliche Algorithmen implementiert werden können, wird es immer noch Szenen geben, die nicht trainiert wurden, und es ist schwierig, niedrige Anforderungen abzudecken. Wahrscheinlichkeitsszenen. Probleme mit geringer Generalisierungsfähigkeit.

2. Implementierungsszenarien und Werteausdruck verkörperter Intelligenz im industriellen Bereich

Anwendungsszenarien für die industrielle Fertigung beginnen mit der Lösung flexibler Tangenten

Industrieroboter werden seit langem eingesetzt, aber die meisten von ihnen sind automatisiert. Es gibt Probleme wie komplexes Debuggen, hohe Kosten und geringe Effizienz. Der Kern der Intelligenz besteht darin, das Problem flexibler Tangenten zu lösen. Zhao He berichtete über eine Reihe spezifischer industrieller Anwendungsfälle, beispielsweise in der Montagelinie, und half Kunden dabei, die Probleme hoher Kosten für Linienkürzungen und Schwierigkeiten bei der Anpassung von Produktionslinien zu lösen. Ursprünglich brauchten drei Ingenieure fast eine Woche, um die Produktionslinie so anzupassen, dass die gesamte Produktionslinie voll ausgelastet ist. Der Einsatz intelligenter Industrierobotertechnologie soll diese Situation verbessern.

Im Rahmen des Qualitätsprüfungsprozesses haben wir einer großen Fabrik mit mehr als 3.000 Mitarbeitern eine auf KI-Technologie basierende Maschine zur Qualitätsprüfung zur Verfügung gestellt und so mehr als 2.000 Qualitätsprüfer erfolgreich ersetzt. Dadurch konnten nicht nur die Arbeitskosten, sondern auch die Leistung der Maschine gesenkt werden war der manuellen Arbeit nicht unterlegen und kann 24 Stunden am Tag ununterbrochen arbeiten.

Um im Nachbearbeitungsprozess nach der Fehlererkennung die Effizienz- und Qualitätsprobleme zu lösen, die durch blindes Tippen der Arbeiter im Reparaturprozess von Druckgussteilen entstehen, werden mithilfe intelligenter Industrierobotertechnologie mehrere Roboter zu einer Reihe kombiniert Vorgänge wie Fehlererkennung, Trajektorienplanung und Polieren lösen die Einschränkungen des manuellen Betriebs und wirken sich positiv auf den Prozessablauf großer Druckgussteile aus.

Verkörperte Intelligenz und leistungsstarke flexible Tangentenfähigkeiten werden die Produktionseffizienz in der industriellen Fertigung verbessern

Die Verbesserung der Unternehmenseffizienz spiegelt sich in zwei Aspekten wider: Arbeitskosten sowie Produktions- und Betriebseffizienz. Fu Yihui wies darauf hin, dass aus Sicht der Arbeitskosten der Preis für Roboter den Knotenpunkt für die Kommerzialisierung darstellen könnte. Die Industrie für humanoide Roboter könnte größer sein als der Markt für die Automobilindustrie. Was die Produktionseffizienz betrifft, können Roboter 24 Stunden am Tag arbeiten und ihre Lerneffizienz ist weitaus höher als die von Menschen. Durch optimierte Entscheidungsfindung und präzise Steuerung können sie die Effizienz von Fabrik- oder Handelsabläufen verbessern.

Zhao He glaubt, dass der erste häufige Schwachpunkt in der Fertigungsindustrie menschliche Probleme sind, wie etwa die Schwierigkeit, qualifizierte Arbeitskräfte zu rekrutieren und zu halten. Unternehmen hoffen, ihre Abhängigkeit von Arbeitskräften zu verringern und die Kosten zu senken. Weiyi Intelligent Manufacturing hat für eine große Fabrik mit mehr als 3.000 Mitarbeitern eine auf KI-Technologie basierende Qualitätsinspektionsmaschine für das Erscheinungsbild entwickelt, die 2.000 Qualitätsinspektionsarbeiter ersetzt und die Arbeitskosten senkt. Die Maschinenleistung ist nicht schlechter als die von Menschen und sie kann rund um die Uhr betrieben werden Stunden pro Tag.

Zweitens sind die Kosten für den flexiblen Linienschnitt hoch, die Produktions-, Liefer- und Marketingmodelle haben sich geändert und die Zahl der Kleinserien und Mehrserienbestellungen hat zugenommen. Das traditionelle Produktionsmodell kann die Marktnachfrage nicht erfüllen müssen über schnelle, kostengünstige und flexible Schneidfunktionen verfügen, um die neuen Probleme in der Fertigungsindustrie zu bewältigen und Unternehmen in die Lage zu versetzen, ihre Produktionseffizienz zu verbessern.

Priorisieren Sie die Umsetzung gefährlicher Szenarien und geben Sie mit zunehmender Generalisierungsfähigkeit komplexere Szenarien ein.

Es gibt unterschiedliche Meinungen darüber, in welchen Szenarien zunächst verkörperte intelligente Roboter eingesetzt werden sollten. Yin Zhi ist davon überzeugt, dass in der Fertigungsindustrie integrierte intelligente Geräte wie Roboterarme, Logistikroboter usw. weit verbreitet sind und in Zukunft verstärkt Serviceroboter in den Montage-, Logistik- und Lagerverbindungen der Fertigungsindustrie zum Einsatz kommen werden Auch Szenarien wie selbstfahrende Autos sind eine Kategorie. Er war der Meinung, dass wir mit Arbeiten beginnen sollten, zu denen Menschen nicht bereit sind, für die sie nicht geeignet sind oder die gefährlich und langweilig sind.

Fu Yihui ist der Ansicht, dass es nicht einfach in der Reihenfolge Industrie, Handel und Familie verstanden werden kann. Die ersten, die umgesetzt werden sollten, sollten diejenigen mit relativ einzelnen Szenarien und Fähigkeitsanforderungen sein, beispielsweise in der Automobilproduktionslinie, der Installation und der Verkabelung von Kabelbäumen im Auto sind immer noch auf Handarbeit angewiesen, und humanoide Roboter müssen in Geschäftsszenarien eine taktile und vielseitige Lösung für die Wahrnehmung sein, z und Aufladen usw. gibt es auch gefährliche oder spezielle Anwendungsszenarien, die Menschen, die gefährliche Arbeiten verrichten, ersetzen und schließlich dem Humanoiden folgen können. Mit verbesserten Generalisierungsfähigkeiten werden Roboter in komplexere Szenarien der Zusammenarbeit und Interaktion zu Hause eintreten.

Durch schnelles Akquise-Lernen und verbesserte Generalisierungsfähigkeiten können viele komplexe Szenenprobleme gelöst werden.

Um die Verallgemeinerung und allgemeine Fähigkeit verschiedener Fähigkeiten zu verbessern, um in verschiedenen Szenarien Anwendung zu finden, ging Fu Yihui von der Perspektive der taktilen Wahrnehmung aus, sammelte taktilbezogene Daten anhand realer Szenen und förderte Simulationstraining, um die geschickte Bedienung und die Verallgemeinerungsfähigkeit des Roboters zu verbessern In industriellen Szenarien ist es bei komplexen und vielfältigen erfassten Objekten notwendig, die Verallgemeinerung der taktilen oder Greiffähigkeiten zu verbessern, um das Problem zu lösen.

Zhao He glaubt, dass es für Roboter derzeit keine Möglichkeit gibt, alles ohne Lernen zu erledigen. In industriellen Szenarien spiegeln sich Verallgemeinerung und allgemeine Fähigkeiten in der Grundintelligenz wider, das heißt, durch Technologien wie große Modelle können Roboter schnell neue Aufgabenfähigkeiten erlernen Wenn diese Fähigkeit realisiert werden kann, wird es einen revolutionären Fortschritt für den Einsatz intelligenter Industrieroboter in der Industrie darstellen.

Fu Yihui glaubt, dass humanoide Roboter die Fähigkeit benötigen, in einer Gedankenkette zu denken und über einen gewissen Grad an Verallgemeinerung verfügen, um den Bedürfnissen von Robotern in verschiedenen Szenarien gerecht zu werden. Beispielsweise integriert Google RT2 LLM und Visual Transformer, um auf der Grundlage der Beurteilung der Umgebung und Absicht optimale Aktionsstrategien zu entwickeln, um die Ausführungsfähigkeiten des Roboters zu verbessern.

3. Erforschung von Datenerfassungs- und Trainingsmethoden für verkörperte Intelligenz

Ein Publikum fragte, wie man an große Datenmengen gelangen könne. Gibt es innovative Möglichkeiten, diese zu erhalten? Zhao He glaubt, dass die Entwicklung des industriellen Internets objektiv Daten für die Geburt großer Industriemodelle gesammelt hat. Bei der tatsächlichen Umsetzung sollten die Sammlung, Organisation, Automatisierung und der intelligente Betrieb von Daten in Produkte und Dienstleistungen implementiert werden.

Derzeit gibt es keine ausgereifte und allgemein akzeptierte Trainingsmethode für verkörperte Intelligenz. Am Beispiel intelligenter Industrieroboter wird erwartet, dass große Modelle durch Methoden wie künstliches Videosehen Aufgaben verstehen und Steueranweisungen generieren können.

Bei den Trainingsmethoden für verkörperte Intelligenz geht es eher darum, verkörperte Intelligenz in einer Simulationsumgebung zu trainieren oder Simulationen und generierte Daten für das Training zu nutzen. Denn die Verwendung tatsächlicher Daten zum Trainieren verkörperter intelligenter Modelle oder intelligenter Roboter birgt das Problem der schwierigen Datenerfassung und des unzureichenden Datenvolumens.

Yin Zhi schlug vor, dass es professionelle Drittanbieter von Datendiensten wie Datenannotationsunternehmen gibt, die sich in Zukunft zu KI-Trainern oder Dienstleisterunternehmen entwickeln könnten. In China sind die Vorteile bei den Arbeitskosten relativ offensichtlich und es wird erwartet, dass sich dort eine Industrie für multimodale Daten und intelligente Schulungsdienste bilden wird.

Gib Worte

Obwohl die Integration verkörperter Intelligenz und großer Modelle zu bestimmten Ergebnissen geführt hat, bedarf es noch weiterer Forschung, wie das Gleichgewicht zwischen Energieverbrauch und Umsatz weiter optimiert und die ausgereifte Anwendung multimodaler großer Modelle realisiert werden kann. Von der Lösung wichtiger flexibler Tangentenprobleme über die Verbesserung der Generalisierungsfähigkeiten zur Anpassung an komplexe und vielfältige Industrieumgebungen bis hin zur Etablierung ausgereifter und effektiver Schulungsmethoden oder der vollständigen Nutzung der Vorteile von Datendiensten Dritter – all dies sind Faktoren, die die weit verbreitete Anwendung fördern der verkörperten Intelligenz im industriellen Bereich.

Während der gesamten Veranstaltung nahmen Online-Teilnehmer aktiv am interaktiven Austausch teil, darunter Personen von Audi China, NIO, Ideal, Dongfeng, Schneider Electric, Amazon Cloud Technology, Horizon Robotics, Huawei Terminal, Baidu, China Telecom und anderen Unternehmen Institutionen wie CICC Capital, Dingjie Software Ventures, China Software Group, Yizhuang State Investment und China Unicom Industrial Internet of Things. Das Publikum und die Gäste führten ausführliche Gespräche, tauschten praktische Erfahrungen aus und diskutierten über geschäftliche Kooperationen und schlossen dieses 502-Online-Peer-Seminar erfolgreich ab.

Um weitere Praxisaktivitäten im Bereich Digital- und KI-Innovation zu verfolgen, folgen Sie uns bitte.Tiger Sniff Think TankSchließen Sie die Registrierung ab, um unsere Inhaltsaktualisierungen und Veranstaltungsbenachrichtigungen zu erhalten.

Über Huxiu Think Tank: Huxiu Think Tank ist eine neue Forschungsdienstleistungsorganisation, die sich auf Unternehmensdigitalisierung und KI-Innovationspraxis konzentriert. Sie bietet aufschlussreiche Forschungsberichte, Fallauswahlen und Online-Meetings und Online-Meetings für beide Parteien im Prozess der industriellen Intelligenz Es werden Aktivitäten und Besuchsdienste angeboten, um die kluge Entscheidungsfindung von Unternehmensleitern in den Bereichen Intelligenz und Digitalisierung zu unterstützen. Die Kernwerte, die wir bieten: zeitnahe und qualitativ hochwertige Einblicke, Verständnis für Technologie, Branche, Kollegen und Gegner; Bereitstellung wichtiger Referenzen für Entscheidungsträger bei technologischen und produktstrategischen Entscheidungen, industrieller Planung und Lösungsauswahl; Verstehen Sie Spitzentechnologien und den Entwicklungsstand der betroffenen Branchen sowie zukünftige Trends