소식

산업 현장에서 구현된 지능의 구현에 대한 또 다른 탐구

2024-08-07

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


제작 | 후시우 싱크탱크

저자 | 황시위

헤더 이미지 | 비주얼 중국

산업 변혁과 새로운 생산성의 유입 시대에 체화된 지능은 대형 모델, 다중 모드 대형 모델, 시각/촉각 소형 모델 등 일련의 첨단 기술을 공장에 도입하고 산업 제조 분야의 실제 여행. 그러나 복잡하고 다양한 산업 시나리오는 구현된 지능에 심각한 문제를 야기합니다. 어떤 장면부터 시작해야 할까요? 다른 장면 사이를 자유롭게 전환하려면 어떻게 해야 합니까? 지능형 시스템에 필요한 광범위하고 고품질의 데이터를 얻는 방법은 무엇입니까?

따라서 2024년 7월 30일 오후 7시, Huxiu Think Tank 502 온라인 동료들이 초대되었습니다.Shanghai Artificial Intelligence Technology Association 수석 컨설턴트 Yin Zhi, Tashan Technology Ecology 이사 Fu Yihui, Weiyi Intelligent Manufacturing CTO Zhao He 박사에서는 구현지능 분야에서 대형 모델의 혁신적인 적용에 대해 공동으로 논의하고, 구현지능과 휴머노이드 로봇의 실제 적용 사례를 공유했습니다.

1. 구체화된 지능과 대형 모델 및 기술적 과제의 통합

구체화된 지능을 가장 잘 전달하는 것은 휴머노이드 로봇이며, 이 로봇의 성장은 대형 모델에 의존합니다.

대형 모델과 구체화된 지능의 결합은 특정 결과를 달성했으며 광범위한 전망을 가지고 있습니다. 상하이 인공지능기술협회(Shanghai Artificial Intelligence Technology Association)의 수석 컨설턴트인 Yin Zhi는 대형 모델이 계획 및 추론 능력을 갖춘 로봇 두뇌로 사용될 수 있으며, 목표를 하위 목표로 분해하고 관련 기능을 호출할 수 있다고 말했습니다. 방향은 큰 잠재력을 가지고 있습니다.

Weiyi Intelligent Manufacturing의 CTO인 Zhao He 박사는 산업 시나리오에서 작업의 특성으로 인해 비인간형 로봇이 생활 시나리오에 더 적합할 수 있으며 더 나은 형태일 수 있다고 믿습니다.

대형 모델은 인간과 컴퓨터의 상호작용 방식을 뒤집어, 인간과 기계가 문자, 음성, 그림 등 자연스러운 방식으로 소통할 수 있게 해준다. 대형 모델은 효율적인 상호 작용을 제공하여 로봇이 새로운 작업을 학습하고 특정 요구 사항 및 작동 사양을 얻을 수 있도록 합니다.

Tashan Technology의 생태학 이사인 Fu Yihui는 대형 모델이 구현된 지능을 강화할 수 있다는 데 동의합니다. 그는 휴머노이드 로봇이 구현된 지능을 전달하는 최고의 전달자이며 이들의 성장은 대형 모델의 개발에 달려 있다고 말했습니다. 인간처럼 생각하고 움직이는 휴머노이드 로봇을 구축하려면 대형 모델뿐만 아니라 딥러닝, 모션 제어 알고리즘, 촉각 인식, 시각적 인식, 복잡한 환경 이해 능력, 논리적 추론 등 전반적인 인식도 필요합니다.

최근 언급되는 공간지능은 로봇이 세상을 볼 수 있게 함으로써 로봇이 세상을 관찰하면서 세상을 더 잘 이해하고, 지식을 학습하고, 행동할 수 있도록 하는 것을 기반으로 한다. 따라서 이러한 일반적인 전제 하에서, 로봇이 세상을 더 잘 인식할 수 있도록 하는 구체화된 인식 real2sim(시뮬레이션 환경에서 훈련된 모델을 실제 환경에 적용하는 프로세스)을 달성하는 것이 보다 유연한 로봇이 되기 위한 전제 조건입니다.

대형 모델을 구체화된 지능에 포함하려면 에너지 소비와 수익의 균형이 필요합니다.

일부 시청자들은 "지능형 로봇에 대형 모델이 내장된다면 추가적인 하드웨어 지원이 필요한가? 성능과 에너지 소비의 균형을 재조정해야 하는가"라고 질문하기도 했다.

Zhao 박사는 이것이 좋은 질문이라고 생각합니다. 지능형 로봇을 대형 모델에 내장할 때는 하드웨어 지원과 성능과 에너지 소비 간의 균형을 고려해야 합니다. 인간을 포함한 넓은 의미의 구체화된 지능은 에너지 소비와 얻을 수 있는 이점의 균형을 맞춰야 합니다. 예를 들어, 인간의 두뇌는 전력을 거의 소비하지 않지만 똑똑합니다. 그러나 훈련 및 추론 중 현재 대형 모델의 컴퓨팅 성능과 에너지 소비는 지능형 로봇의 요구 사항을 충족할 수 없습니다.

향후 개발 방향은 첫째, 기술을 통해 대형 모델의 컴퓨팅 성능과 에너지 소비를 크게 줄이는 것, 둘째, 모델 아키텍처 및 패러다임을 개선하는 것, 셋째, 지능 밀도를 높이기 위해 ASIC과 같은 특수 칩을 개발하는 것입니다. 즉, 단위 면적당 칩에 대한 지능화는 소프트웨어 강화 및 모델 추론을 위한 개발된 전용 칩의 사용을 통해 구현된 지능형 로봇에 어느 정도 효과적으로 적용될 수 있습니다.

다중 모드 대형 모델은 제어 및 의사 결정과 같은 기술적 혁신을 달성하기 위한 구체화된 지능의 중요한 모듈이 될 것입니다.

제어, 의사 결정, 구현된 지능 탐색 등 핵심 기술 측면에서 Yin Zhi는 대규모 언어 모델로 구동되는 로봇의 현재 문제는 정보를 텍스트로 변환한 후 처리해야 한다는 점이라고 믿습니다. 미래에는 로봇이 기본 인식 환경을 이해할 수 있어야 하며 제어 결정과 탐색을 위해 언어를 거칠 필요가 없으며 비전에는 많은 논리가 포함될 것입니다.

미래에는 대형 모델이 다중 모드 시스템을 사용하여 지능 기능을 향상할 수 있으며, 모듈은 인간의 두뇌와 마찬가지로 다양한 기능을 담당할 수 있습니다. 현재는 서로 다른 기능을 제어하는 ​​여러 소형 모델이 있을 수 있습니다. 대형 모델 명령 로봇은 다중 모드 대형 모델이 추세이지만 소형 모델과 대형 모델을 결합하여 지능적인 기능을 향상시키는 데는 시간이 걸릴 수 있습니다. , 대형 모델 개발에 따라 현재 다중 모드 기본 대형 모델 데이터가 부족합니다.

Zhao He는 제어 측면에서 산업용 로봇에 시각적 서보 기능을 도입하면 기본 제어 및 상위 수준 작업을 개방하여 탐색 측면에서 응용 비용을 크게 줄일 수 있으며 전제는 다중 모드 정보를 포함한 인식이라고 지적했습니다. 터치, 온도 등이 있지만 다중 모드 정보의 효율성 통합에는 더 큰 기술적 과제가 있지만 긍정적인 개발 방향입니다. 다중 모드 다중 대화와 완전한 유연한 접선을 통해 기계가 인간의 의도와 작업 요구 사항을 이해하도록 허용하는 것은 혁신적인 발전이 될 것입니다. 또한 보다 지능적인 산업용 로봇을 위한 기본적인 지능형 표준을 제공하고 표준화된 생산과 현장의 유연한 적응을 달성할 수 있습니다. .

Fu Yihui는 휴머노이드 로봇에 촉각 센서를 제공할 때 촉각 데이터와 시각 데이터의 융합 문제는 물론 고정밀 인식, 복잡한 의사 결정 등의 문제에 직면한다고 Zhao He 박사의 관점에 동의했습니다. 그 중 촉각 데이터와 멀티모달 인식 데이터 융합이 체화된 인식을 돌파하는 핵심이다. 촉각 감지 데이터를 갖춘 대규모 다중 모드 모델은 로봇이 복잡한 장면에서 상호 작용하는 데 도움이 됩니다. 많은 훈련을 거친 후 일부 장면에서는 기존 알고리즘을 구현할 수 있지만 여전히 훈련되지 않은 장면이 있을 수 있으며 낮은 수준을 커버하기 어렵습니다. 확률 장면의 일반화 능력이 낮은 문제.

2. 산업현장에서 구현지능의 구현 시나리오와 가치 표현

산업 제조 애플리케이션 시나리오는 유연한 접선을 해결하는 것부터 시작됩니다.

산업용 로봇은 오랫동안 사용되어 왔지만 대부분이 자동화되어 있어 복잡한 디버깅, 높은 비용, 낮은 효율성 등의 문제가 있습니다. 지능의 핵심은 유연한 접선 문제를 해결하는 것입니다. Zhao He는 조립 라인과 같은 다양한 특정 산업 적용 사례를 공유하여 고객이 높은 라인 절단 비용과 생산 라인 조정의 어려움 문제를 해결할 수 있도록 지원했습니다. 원래는 3명의 엔지니어가 전체 생산 라인을 최대 용량으로 가동하기 위해 생산 라인을 조정하는 데 거의 일주일이 걸렸습니다. 지능형 산업용 로봇 기술을 사용하면 이러한 상황이 개선될 것으로 예상됩니다.

품질 검사 과정에서는 3,000명 이상의 대규모 공장에 AI 기술을 기반으로 한 외관 품질 검사기를 공급하여 2,000명 이상의 품질 검사 인력을 대체하는 데 성공했으며, 인건비 절감은 물론 기계의 성능도 향상시켰습니다. 육체 노동보다 열등하지 않았고, 24시간 쉬지 않고 일할 수 있었습니다.

결함 검출 후 후처리 공정에서는 다이캐스팅 부품 수리 공정에서 작업자의 블라인드 타이핑으로 인해 발생하는 효율성 및 품질 문제를 해결하기 위해 지능형 산업용 로봇 기술을 사용하여 여러 로봇을 결합하여 일련의 로봇을 구성합니다. 결함 감지, 궤적 계획 및 연마와 같은 작업 지능형 워크스테이션은 수동 작업의 한계를 해결하고 대형 다이 캐스팅의 프로세스 흐름에 긍정적인 영향을 미칩니다.

구현된 지능과 강력하고 유연한 탄젠트 기능으로 산업 제조 생산 효율성이 향상됩니다.

기업 효율성 향상은 인건비와 생산 및 운영 효율성이라는 두 가지 측면에 반영됩니다. Fu Yihui는 인건비 측면에서 볼 때 로봇 가격이 인건비를 더 잘 감당할 수 있다면 휴머노이드 로봇 산업이 자동차 산업 시장보다 더 커질 수 있다고 지적했습니다. 생산 효율성 측면에서 로봇은 24시간 작업이 가능하며 학습 효율성도 인간보다 훨씬 높다. 최적화된 의사결정과 정밀한 제어를 통해 공장이나 상업 운영의 효율성을 높일 수 있다.

Zhao He는 제조 산업의 첫 번째 공통적 문제점은 숙련된 인력 채용 및 유지의 어려움과 같은 인간 문제라고 믿습니다. 기업은 노동 의존도를 줄이고 비용을 절감하기를 희망합니다. Weiyi Intelligent Manufacturing은 3,000명이 넘는 대규모 공장을 위해 AI 기술을 기반으로 외관 품질 검사 기계를 만들었고, 2,000명의 품질 검사 작업자를 대체하여 인건비를 절감했으며, 기계 성능은 인간보다 나쁘지 않으며 24개를 작동할 수 있습니다. 하루에 몇 시간.

둘째, 유연한 라인 절단 비용이 높고 생산, 공급 및 마케팅 모델이 변경되었으며 소규모 배치 및 다중 배치 주문이 증가했습니다. 기존 생산 모델은 지능형 산업용 로봇과 같은 지능형 생산 장비를 충족할 수 없습니다. 이러한 상황에 대처하려면 빠르고 저렴하며 유연한 라인 절단 능력이 필요합니다. 이는 제조 산업의 새로운 문제점을 해결하여 기업이 생산 효율성을 향상할 수 있도록 지원합니다.

위험한 시나리오의 구현을 우선적으로 수행하고, 일반화 능력이 높아질수록 더욱 복잡한 시나리오에 진입합니다.

구현형 지능형 로봇을 어떤 방식으로 먼저 구현해야 하는지에 대해서는 의견이 엇갈린다. Yin Zhi는 제조 산업이 로봇 팔, 물류 로봇 등과 같은 구현된 지능형 장비를 널리 사용해 왔으며 앞으로는 제조 산업의 조립, 물류 및 창고 링크에서 더 많이 사용될 것이라고 믿습니다. 또한 주택, 쇼핑몰, 커뮤니티 등을 포함하여 점점 일반화되고 있습니다. 시나리오, 자율주행차도 하나의 카테고리입니다. 그는 인간이 하기 싫고, 하기 적합하지 않으며, 위험하고 지루한 일부터 시작해야 한다고 느꼈습니다.

Fu Yihui는 단순히 산업, 상업, 가족의 순서로 이해할 수는 없다고 생각합니다. 가장 먼저 구현해야 하는 것은 상대적으로 단일한 시나리오와 기능 요구 사항을 갖는 것입니다. 예를 들어 자동차 생산 라인, 설치 및 배선에서. 차량 내 와이어링 하니스는 여전히 수작업에 의존하고 있으며, 휴머노이드 로봇은 약을 사러 점원을 교체하는 약국, 슈퍼마켓 교체 및 보충, 주유소 급유와 같은 비즈니스 시나리오에서 촉각 및 다목적 기능을 갖추어야 합니다. 충전 등 위험한 작업에 종사하는 사람들을 대체하고 결국 휴머노이드를 따라갈 수 있는 위험하거나 특수한 응용 시나리오도 있습니다. 강화된 일반화 기능을 통해 로봇은 더욱 복잡한 홈 협업 및 상호 작용 시나리오에 들어갈 것입니다.

신속한 획득 학습과 향상된 일반화 기능을 통해 여러 가지 복잡한 장면 문제를 해결할 수 있습니다.

다양한 시나리오에 적용하기 위해 다양한 기술의 일반화 및 일반 능력을 향상시키는 방법과 관련하여 Fu Yihui는 촉각 인식의 관점에서 시작하여 실제 장면을 통해 촉각 관련 데이터를 수집하고 시뮬레이션 교육을 촉진하여 로봇의 능숙한 작동 및 일반화 능력을 향상시켰습니다. 산업 시나리오에서 복잡하고 다양한 물체를 잡을 때 문제를 해결하려면 촉각 또는 파악 능력의 일반화를 개선해야 합니다.

Zhao He는 현재 로봇이 학습하지 않고 모든 것을 할 수 있는 방법은 없다고 생각합니다. 산업 시나리오에서는 일반화 및 일반 능력이 기본 지능에 반영됩니다. 즉, 대형 모델과 같은 기술을 통해 로봇은 새로운 작업 기술을 빠르게 배울 수 있습니다. 이러한 능력이 실현될 수 있다면 이는 산업용 지능형 로봇을 산업계에 적용하는 데 혁명적인 발전이 될 것입니다.

Fu Yihui는 휴머노이드 로봇이 다양한 시나리오에서 로봇의 요구 사항을 충족하려면 일련의 사고 방식으로 사고하고 어느 정도 일반화할 수 있는 능력이 필요하다고 믿습니다. 예를 들어 Google RT2는 LLM과 Visual Transformer를 통합하여 감지와 제어를 통합하며, 환경과 의도를 판단하여 로봇의 실행 능력을 향상시키는 최적의 행동 전략을 세울 수 있습니다.

3. 체화지능을 위한 데이터 수집 및 훈련 방법 탐색

청중이 대량의 데이터를 얻는 방법에 대해 질문했습니다. 이를 얻는 혁신적인 방법이 있습니까? Zhao He는 산업 인터넷의 발전이 대규모 산업 모델의 탄생을 위한 객관적인 데이터 축적을 가져왔다고 믿습니다. 실제 구현에서는 데이터의 수집, 구성, 자동화 및 지능적인 운영이 핵심 포인트로 제품과 서비스에 구현되어야 합니다.

현재, 구체화된 지능을 위한 성숙하고 널리 받아들여지는 훈련 방법은 없습니다. 지능형 산업용 로봇을 예로 들면, 대형 모델이 인공 비디오 비전과 같은 방법을 통해 작업을 이해하고 제어 명령을 생성할 수 있을 것으로 예상됩니다.

구체화된 지능을 위한 훈련 방법의 측면에서는 시뮬레이션 환경에서 구체화된 지능을 훈련시키거나 훈련을 위해 시뮬레이션 및 생성된 데이터를 사용하는 것에 관한 것입니다. 실제 데이터를 활용해 구현된 지능형 모델이나 지능형 로봇을 훈련시키는 것은 데이터 수집이 어렵고 데이터 양이 부족하다는 문제가 있기 때문입니다.

Yin Zhi는 데이터 주석 회사와 같은 제3자 전문 데이터 서비스 제공업체가 미래에 AI 트레이너나 서비스 제공업체로 발전할 수 있다고 제안했습니다. 중국에서는 인건비 측면에서 우위가 상대적으로 뚜렷하며, 다중 모드 데이터 및 지능형 교육 서비스 산업이 형성될 것으로 예상됩니다.

말을 줘

구현된 지능과 대형 모델의 통합이 특정 결과를 달성했지만 에너지 소비와 수익 간의 균형을 더욱 최적화하고 다중 모드 대형 모델의 성숙한 적용을 실현하는 방법은 여전히 ​​지속적인 연구가 필요합니다. 주요 유연한 접선 문제 해결부터 복잡하고 다양한 산업 환경에 적응하기 위한 일반화 능력 향상, 성숙하고 효과적인 교육 방법 확립, 타사 데이터 서비스의 장점 활용에 이르기까지 모두 광범위한 응용을 촉진하는 요소입니다. 산업 현장에서 구현된 지능의 핵심입니다.

행사 내내 온라인 참가자들은 Audi China, NIO, Ideal, Dongfeng, Schneider Electric, Amazon Cloud Technology, Horizon Robotics, Huawei Terminal, Baidu, China Telecom 및 기타 기업의 사람들을 포함하여 쌍방향 교류에 적극적으로 참여했습니다. CICC Capital, Dingjie Software Ventures, China Software Group, Yizhuang State Investment 및 China Unicom Industrial Internet of Things와 같은 기관입니다. 청중과 내빈들은 깊이 있는 대화와 실무 경험을 교환하고 비즈니스 협력에 대해 논의하며 이번 502 온라인 동료 세미나를 성공적으로 마무리했습니다.

더 많은 디지털 및 AI 혁신 실천 활동을 추적하려면 당사를 팔로우하세요.타이거 스니프 싱크탱크콘텐츠 업데이트와 이벤트 알림을 받으려면 등록을 완료하세요.

Huxiu Think Tank 소개: Huxiu Think Tank는 기업 디지털화 및 AI 혁신 실천에 중점을 둔 새로운 연구 서비스 조직으로 산업 지능 과정에서 통찰력 있는 연구 보고서, 사례 선택, 온라인 회의 및 온라인 회의를 제공합니다. 인텔리전스 및 디지털화 분야에서 기업 경영진의 현명한 의사결정을 지원하기 위한 활동 및 방문 서비스를 제공합니다. 우리가 제공하는 핵심 가치: 시기적절하고 고품질의 통찰력, 기술, 산업, 동료 및 상대방에 대한 이해, 기술 및 제품 전략 결정, 산업 계획 및 솔루션 선택에 있어 의사 결정자에게 중요한 참고 자료 제공; 첨단기술과 영향산업의 발전현황 및 미래 동향을 이해한다.