Новости

Еще одно исследование применения воплощенного интеллекта в промышленной сфере

2024-08-07

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Произведено | Аналитический центр Хусю

Автор | Хуан Сию

Изображение заголовка | Визуальный Китай

В современную эпоху промышленной трансформации и притока новых производительных сил воплощенный интеллект приносит на фабрики ряд передовых технологий, таких как большие модели, мультимодальные большие модели, небольшие визуальные/тактильные модели и т. д. на практическом пути в области промышленного производства. Однако сложные и разнообразные промышленные сценарии создают серьезные проблемы для воплощенного интеллекта. С какой сцены начать? Как я могу свободно переключаться между разными сценами? Как получить обширные и качественные данные, необходимые для интеллектуальных систем?

Поэтому в 19:00 30 июля 2024 года онлайн-коллеги из Huxiu Think Tank 502 пригласилиИнь Чжи, главный консультант Шанхайской ассоциации технологий искусственного интеллекта, Фу Ихуэй, директор Tashan Technology Ecology, и доктор Чжао Хэ, технический директор Weiyi Intelligent Manufacturing, совместно обсудили инновационные применения больших моделей в области воплощенного интеллекта и поделились практическими примерами применения воплощенного интеллекта и человекоподобных роботов.

1. Интеграция встроенного интеллекта, крупных моделей и технических задач

Лучшим носителем воплощенного интеллекта являются роботы-гуманоиды, рост которых зависит от крупных моделей.

Сочетание крупных моделей и воплощенного интеллекта дало определенные результаты и имеет широкие перспективы. Инь Чжи, главный консультант Шанхайской ассоциации технологий искусственного интеллекта, сказал, что большие модели могут использоваться в качестве роботизированных мозгов с возможностями планирования и рассуждения, а также могут разлагать цели на подцели и вызывать соответствующие функции. направление имеет большой потенциал.

Доктор Чжао Хэ, технический директор Weiyi Intelligent Manufacturing, считает, что в промышленных сценариях из-за характера их работы негуманоидные роботы могут быть более подходящими, в жизненных сценариях это может быть лучшей формой;

Большая модель подрывает метод взаимодействия человека и компьютера, позволяя людям и машинам общаться естественными способами, такими как текст, голос и изображения. Машина может понимать намерения человека и выполнять операции. Это крупный прорыв. Большие модели обеспечивают эффективное взаимодействие, позволяя роботам осваивать новые задачи и получать конкретные требования и эксплуатационные характеристики.

Фу Ихуэй, экологический директор компании Tashan Technology, согласен с тем, что большие модели могут расширить возможности воплощенного интеллекта. Он сказал, что гуманоидные роботы являются лучшими носителями воплощенного интеллекта, и их рост зависит от разработки крупных моделей. Создание роботов-гуманоидов, которые думают и двигаются, как люди, не только опирается на большие модели, но также включает в себя глубокое обучение, алгоритмы управления движением и общее восприятие, такое как тактильное восприятие, визуальное восприятие, а также способность понимать сложную среду и логические рассуждения.

Недавно упомянутый пространственный интеллект основан на том, чтобы позволить роботам видеть мир, позволяя роботам лучше понимать мир, изучать знания и предпринимать действия, наблюдая за миром. Таким образом, согласно этой предпосылке, достижение воплощенного восприятия real2sim (процесс применения обученной модели в среде моделирования к реальной среде), позволяющее роботу лучше воспринимать мир, является необходимым условием для того, чтобы стать более гибким роботом.

Встраивание крупных моделей в встроенный интеллект требует баланса между потреблением энергии и доходами.

Некоторые зрители спросили: «Если большая модель встроена в интеллектуального робота, требует ли она дополнительной аппаратной поддержки? Нужно ли менять баланс производительности и энергопотребления?»

Доктор Чжао Хэ считает, что это хороший вопрос. При внедрении интеллектуальных роботов в большие модели необходимо учитывать аппаратную поддержку и баланс между производительностью и энергопотреблением. Воплощенный интеллект в широком смысле, включая человека, должен сбалансировать потребление энергии с получаемыми преимуществами. Например, человеческий мозг потребляет мало энергии, но умен. Однако текущая большая модель потребляет вычислительную мощность и энергию во время обучения и вывода, что не может удовлетворить потребности интеллектуальных роботов.

Будущее направление развития: во-первых, значительно снизить вычислительную мощность и энергопотребление больших моделей с помощью технологий; во-вторых, улучшить архитектуру и парадигму модели, в-третьих, разработать специальные чипы, такие как ASIC, для увеличения плотности интеллекта; то есть интеллект чипа на единицу площади. В этой степени, благодаря усилению программного обеспечения, разработанный специальный чип используется для рассуждений моделей и т. д., так что технологию больших моделей можно эффективно применять к воплощенным интеллектуальным роботам.

Мультимодальные большие модели станут важным модулем воплощенного интеллекта для достижения технологических прорывов, таких как контроль и принятие решений.

Что касается ключевых технологий, таких как управление, принятие решений и навигация воплощенного интеллекта, Инь Чжи считает, что текущая проблема роботов, управляемых большими языковыми моделями, заключается в том, что им необходимо преобразовывать информацию в текст, а затем обрабатывать ее. временный переход. В будущем роботы смогут понимать родную среду восприятия. Для принятия управляющих решений и навигации не нужно будет использовать язык, и в видении будет много логики.

В будущем большие модели могут использовать мультимодальные системы для расширения интеллектуальных возможностей, модули которых будут отвечать за различные функции, такие как человеческий мозг. В настоящее время может существовать несколько небольших моделей, управляющих различными функциями. Большие модели командных роботов представляют собой переходную форму. Мультимодальные большие модели являются тенденцией, но для этого потребуется время. Сначала можно улучшить интеллектуальные возможности путем объединения малых моделей с большими моделями. Это зависит от того, при разработке больших моделей по-прежнему не хватает мультимодальных собственных данных больших моделей.

Чжао Хэ отметил, что с точки зрения управления внедрение визуального сервопривода в промышленных роботах может открыть основные задачи управления и верхнего уровня, что значительно снижает затраты на приложения с точки зрения навигации, предпосылкой является восприятие, включая мультимодальную информацию; такие как прикосновение и температура, но эффективность мультимодальной информации. Интеграция сопряжена с более серьезными техническими проблемами, но это позитивное направление развития. Предоставление машинам возможности понимать намерения человека и требования задач посредством мультимодального диалога с несколькими людьми и полных гибких касательных будет революционным прогрессом. Это также может обеспечить базовые интеллектуальные стандарты для более интеллектуальных промышленных роботов и обеспечить стандартизированное производство и гибкую адаптацию на месте. .

Фу Ихуэй согласился с точкой зрения доктора Чжао Хэ. Он упомянул, что при создании тактильных датчиков для роботов-гуманоидов они сталкиваются с проблемой объединения тактильных и визуальных данных, а также с такими проблемами, как высокоточное восприятие, сложное принятие решений. Создание и надежность. Среди них тактильные данные и объединение данных мультимодального восприятия являются ключом к прорыву через воплощенное восприятие. Мультимодальные большие модели с данными тактильного зондирования помогают роботам взаимодействовать в сложных сценах. Хотя традиционные алгоритмы могут реализовать некоторые сцены после длительного обучения, все еще существуют необученные сцены, и трудно охватить сцены с низкой вероятностью. способность.

2. Сценарии реализации и выражение ценности воплощенного интеллекта в промышленной сфере.

Сценарии применения в промышленном производстве начинаются с решения гибких касательных.

Промышленные роботы используются уже давно, но большинство из них автоматизированы. Существуют такие проблемы, как сложная отладка, высокая стоимость и низкая эффективность. Суть интеллекта заключается в решении проблемы гибких касательных. Чжао Хэ рассказал о ряде конкретных случаев промышленного применения, например, на сборочной линии, помогая клиентам решать проблемы высоких затрат на резку и трудностей с настройкой производственных линий. Первоначально трем инженерам потребовалась почти неделя, чтобы настроить производственную линию и заставить ее работать на полную мощность. Ожидается, что использование интеллектуальных технологий промышленных роботов улучшит эту ситуацию.

В процессе проверки качества мы предоставили машине для контроля качества внешнего вида, основанной на технологии искусственного интеллекта, крупному заводу с более чем 3000 человек, успешно заменив более 2000 работников по контролю качества. Это не только снизило затраты на рабочую силу, но и снизило производительность машины. не уступал ручному труду и мог работать круглосуточно.

В процессе постобработки после обнаружения дефекта, чтобы решить проблемы эффективности и качества, вызванные слепым набором текста рабочими в процессе ремонта литья под давлением, используется технология интеллектуальных промышленных роботов для объединения нескольких роботов для формирования серии операций, таких как для обнаружения дефектов, планирования траектории и полировки. Интеллектуальная рабочая станция устраняет ограничения ручного управления и оказывает положительное влияние на технологический процесс крупного литья под давлением.

Воплощенный интеллект и мощные гибкие возможности повысят эффективность промышленного производства.

Повышение корпоративной эффективности отражается в двух аспектах: стоимость рабочей силы и эффективность производства и эксплуатации. Фу Ихуэй отметил, что с точки зрения затрат на рабочую силу, когда цена на роботов сможет лучше покрыть затраты на рабочую силу, это станет узлом коммерциализации. Индустрия гуманоидных роботов может быть больше, чем рынок автомобильной промышленности. С точки зрения эффективности производства роботы могут работать 24 часа в сутки, а их эффективность обучения намного выше, чем у людей. Благодаря оптимизированному принятию решений и точному контролю они могут повысить эффективность заводских или коммерческих операций.

Чжао Хэ считает, что первой общей проблемой в обрабатывающей промышленности являются человеческие проблемы, такие как трудности с наймом и удержанием квалифицированных работников. Компании надеются уменьшить свою зависимость от рабочей силы и снизить затраты. Weiyi Intelligent Manufacturing создала машину для контроля качества внешнего вида на основе технологии искусственного интеллекта для крупного завода с численностью более 3000 человек, заменив 2000 работников по контролю качества, снизив затраты на рабочую силу, а производительность машины не хуже, чем у людей, и она может работать 24 часа в сутки. часов в день.

Во-вторых, стоимость гибкой линии резки высока, модели производства, поставок и маркетинга изменились, а заказы на мелкосерийные и многосерийные поставки возросли. Традиционная модель производства не может удовлетворить рыночный спрос на интеллектуальное производственное оборудование, такое как интеллектуальные промышленные роботы. необходимы быстрые и недорогие гибкие возможности резки, чтобы справиться с ситуацией. Новые болевые точки в обрабатывающей промышленности дают предприятиям возможность повысить эффективность производства.

Отдавайте приоритет реализации опасных сценариев и вводите более сложные сценарии по мере увеличения способности к обобщению.

Существуют разные мнения относительно сценариев, в которых воплощения интеллектуальных роботов следует внедрять в первую очередь. Инь Чжи считает, что в обрабатывающей промышленности широко используется встроенное интеллектуальное оборудование, такое как роботизированное оружие, логистические роботы и т. д., и в будущем сервисные роботы будут более широко использоваться в сборочных, логистических и складских звеньях обрабатывающей промышленности. также становятся все более распространенными, включая дома, торговые центры, сообщества и т. д. Сценарии, беспилотные автомобили также являются категорией. Он считал, что нам следует начинать с работ, которые люди не хотят выполнять, которые для выполнения не подходят или которые опасны и скучны.

Фу Ихуэй считает, что это нельзя просто рассматривать в порядке промышленности, торговли и семьи. В первую очередь следует реализовать те, которые имеют относительно единые сценарии и требования к возможностям. Например, на линии производства автомобилей установка и подключение электрооборудования. жгуты проводов в автомобилях по-прежнему зависят от ручного труда, а роботы-гуманоиды должны быть тактильными и многофункциональными решениями для объединения модального восприятия в бизнес-сценариях, таких как аптеки, заменяющие клерков, чтобы взять лекарства, замену и пополнение запасов в супермаркетах, заправку на заправочных станциях и т. д. зарядка и т. д., существуют также опасные или специальные сценарии применения, которые могут заменить людей, занятых на опасной работе, и в конечном итоге последовать за гуманоидом. Возможности обобщения робота расширены, и он войдет в более сложные сценарии домашнего сотрудничества и взаимодействия.

Благодаря быстрому обучению и улучшенным возможностям обобщения он сможет решать многие сложные проблемы сцены.

Что касается улучшения обобщения и общей способности различных навыков для применения в различных сценариях, Фу Ихуэй начал с точки зрения тактильного восприятия, собирал тактильные данные с помощью реальных сцен и продвигал обучение моделированию, чтобы улучшить ловкость работы робота и способность к обобщению. В промышленных условиях, когда мы сталкиваемся со сложными и разнообразными захватываемыми объектами, для решения проблемы необходимо улучшить обобщение тактильных или хватательных способностей.

Чжао Хэ считает, что в настоящее время роботы не могут делать все без обучения. В промышленных сценариях обобщение и общие способности отражаются в базовом интеллекте, то есть с помощью таких технологий, как большие модели, роботы могут быстро освоить новые навыки выполнения задач. эта возможность может быть реализована, это будет революционным достижением в применении интеллектуальных промышленных роботов в промышленности.

Фу Ихуэй считает, что гуманоидным роботам необходима способность мыслить цепочкой и обладать определенной степенью обобщения, чтобы удовлетворять потребности роботов в различных сценариях. Например, Google RT2 объединяет LLM и визуальный преобразователь для интеграции датчиков и управления. На основе оценки окружающей среды и намерений он может разрабатывать оптимальные стратегии действий для улучшения исполнительских способностей робота.

3. Исследование методов сбора данных и обучения воплощенному интеллекту.

Один из слушателей спросил, как получить большие объемы данных. Существуют ли какие-либо инновационные способы их получения? Чжао Хэ считает, что развитие промышленного Интернета объективно накопило данные для рождения крупных промышленных моделей. В реальной реализации сбор, организация, автоматизация и интеллектуальная обработка данных должны быть реализованы в продуктах и ​​услугах в качестве основных моментов.

В настоящее время не существует зрелого и широко распространенного метода тренировки воплощенного интеллекта. Если взять в качестве примера интеллектуальных промышленных роботов, ожидается, что крупные модели смогут понимать задачи и генерировать инструкции управления с помощью таких методов, как искусственное видеовидение.

Что касается методов обучения воплощенного интеллекта, то речь идет больше о тренировке воплощенного интеллекта в среде моделирования или использовании моделирования и сгенерированных данных для обучения. Потому что использование реальных данных для обучения воплощенных интеллектуальных моделей или интеллектуальных роботов сопряжено с проблемой сложности сбора данных и недостаточного объема данных.

Инь Чжи предположил, что существуют сторонние профессиональные поставщики услуг передачи данных, такие как компании, занимающиеся аннотированием данных, которые в будущем могут превратиться в инструкторов по искусственному интеллекту или компании-поставщики услуг. В Китае преимущества в затратах на рабочую силу относительно очевидны, и ожидается, что в Китае сформируется индустрия мультимодальных данных и интеллектуальных услуг обучения.

Дайте слова

Хотя интеграция встроенного интеллекта и больших моделей дала определенные результаты, способы дальнейшей оптимизации баланса между потреблением энергии и доходами и реализации зрелого применения мультимодальных больших моделей все еще требуют дальнейших исследований. От решения ключевых проблем гибкой касательной до улучшения возможностей обобщения для адаптации к сложным и разнообразным промышленным средам, создания зрелых и эффективных методов обучения или полного использования преимуществ сторонних сервисов обработки данных — все это факторы, которые способствуют широкому применению воплощенного интеллекта в промышленной сфере.

На протяжении всего мероприятия онлайн-участники активно участвовали в интерактивном обмене мнениями, в том числе представители Audi China, NIO, Ideal, Dongfeng, Schneider Electric, Amazon Cloud Technology, Horizon Robotics, Huawei Terminal, Baidu, China Telecom и других компаний. такие учреждения, как CICC Capital, Dingjie Software Ventures, China Software Group, Yizhuang State Investment и China Unicom Industrial Internet of Things. Зрители и гости провели углубленные диалоги, обменялись практическим опытом, обсудили деловое сотрудничество и успешно завершили 502-й онлайн-семинар.

Чтобы отслеживать больше мероприятий в области инноваций в области цифровых технологий и искусственного интеллекта, подписывайтесь на нас.Аналитический центр Tiger SniffЗавершите регистрацию, чтобы получать обновления нашего контента и уведомления о событиях.

О аналитическом центре Huxiu: Huxiu Think Tank — это новая исследовательская организация, специализирующаяся на цифровизации предприятий и инновационной практике искусственного интеллекта. Она предоставляет подробные исследовательские отчеты, подборку кейсов, а также онлайн-встречи и онлайн-встречи для сторон A и B в процессе промышленной разведки. Следующие мероприятия и услуги по посещению предоставляются для поддержки принятия мудрых решений руководителями компаний в области разведки и цифровизации. Основные ценности, которые мы предоставляем: своевременная и качественная информация, понимание технологий, отрасли, коллег и оппонентов; предоставление важных рекомендаций лицам, принимающим решения в области технологий и стратегических решений по продуктам, промышленному планированию и выбору решений; полная помощь рынку; понять передовые технологии и состояние развития затронутых отраслей и будущие тенденции