소식

'엔드 투 엔드(end-to-end)' 전환을 통해 이상적인 스마트 드라이빙 도로가 올바른 방향으로 갈 수 있을까요?

2024-08-28

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

이 글은 deep diving atom의 835번째 원작입니다.


스마트 드라이빙에 대한 길고 힘든 자체 연구 끝에 마침내 스마트 드라이빙을 향한 이상적인 길이 올바른 길로 들어서는 것 같습니다.

최근에이상적인 자동차'엔드투엔드 자율주행' 주체 조직을 설립하기로 내부 결정, 팀 수가 200명을 초과하고 회사의 다른 지능형 팀이 프로젝트를 유연하게 지원해야 합니다. 이는 이 이상적인 개혁이 잔인했다는 것을 증명하기에 충분하다.

엔드투엔드 솔루션은 '지능형 정상궤도 주행'이라는 말은 거대 기업 때문이 아니다.테슬라xian yong 및 기타 신에너지 차량 회사가 이를 개발하고 있지만 이는 실제로 현재 모든 기술 경로 중에서 가장 신뢰할 수 있는 접근 방식입니다.

그리고 가장 중요한 것은,"end-to-end"는 현재의 모든 기술 경로 중에서 가장 한계를 돌파할 수 있는 기술이 되었습니다.

코드로 지원되는 기존 스마트 드라이빙 솔루션의 '룰 제어'는 이제 거의 끝나가고 있습니다. 앞으로는 코드 사이에 bug가 쉽게 생성될 뿐이고, 자동차의 메모리와 작동 효율성에도 영향을 미칠 것입니다. . 게다가 이제 모두가 비용을 절감하고 있습니다. lidar, 고정밀 지도, 센서, 카메라의 비용은 매우 높으며, 엔드투엔드 비용 이점도 엄청납니다.

결국 기본 논리는 ai가 운전하도록 훈련하고 데이터를 공급하는 것입니다.

둘 다 엔드투엔드 솔루션이지만 이상에도 나름의 차이점이 있습니다.

최근 'li auto 지능형 운전 여름 컨퍼런스'에서 li auto는 엔드투엔드 자율주행 기술 아키텍처를 공개적으로 시연했습니다.이는 엔드투엔드 모델, vlm 시각적 언어 모델 및 월드 모델의 세 부분으로 구성됩니다.. li xiang은 늦어도 내년 초까지 li auto가 엔드투엔드 + vlm 자율주행 솔루션을 공식적으로 출시할 것이라고 말했습니다.

사실 end-to-end는 일반적으로 "데이터 푸시"라고 불리는 템플릿 개념일 뿐이지만 데이터를 얻는 모델은 상당히 다릅니다. 예를 들어 tesla는 bev+변압기 모델을 사용합니다.샤오펑xngp는 신경망 xnet + 대형 제어 모델 xplanner + 대형 언어 모델 xbrain으로 구성된 모델을 사용합니다.

그러나 "모델 수가 적을수록 출력이 더 정확해집니다."

그렇지 않나요? 모델과 데이터가 많을수록 출력이 더 정확해지는 것이 사실이 아닐까요?

이 문제를 명확하게 설명하려면 많은 전문 용어가 필요합니다. 모델 간의 "명시적 출력"은 일부 정보의 손실로 이어질 것입니다. 간단히 말해서 "솔리테어" 게임이 더 많이 퍼진 것과 같습니다. 그 말은 결국 더 많은 정보를 잃게 될 것이고, 결국 주제에서 벗어날 가능성이 더 높으며, 가장 정확한 것은 두 사람이 함께 플레이하는 것입니다.

one-model은 모든 스마트 드라이빙 기업이 추구하는 길이다. 이상적인 목표는 지난 2년 안에 달성하는 것이지만, 완전히 달성하고 운전을 시작하려면 3~5년이 더 걸릴 수도 있다.

지난 3~5년 동안 다들 데이터의 양을 비교해왔다.

이전에 말했듯이, 엔드투엔드 기본 논리는 ai를 어떻게 더 스마트하게 만드는가를 훈련하는 것입니다. 그러면 데이터만 공급할 수 있습니다.

즉, 지난 3~5년 동안 모두가 비교하고 있는 것은 '자원', 즉 데이터 자원이다.

머스크는 엔드투엔드 모델의 훈련량에 대해 정확한 설명을 한 적이 있습니다.

"100만 개의 비디오 사례로 훈련하는 것만으로는 충분하지 않습니다. 200만 개는 약간 더 좋고, 300만 개는 wow를 느낄 것이며, 1,000만 개에 도달하면 믿을 수 없게 됩니다."

1,000만 개의 영상을 학습한 지능형 주행 솔루션은 올해 말까지 달성하는 이상적인 목표입니다.

데이터를 얻으려면 자신의 사용자의 주행 데이터에 의존해야 하고, 둘째, 트레이닝 칩에 의존해야 합니다.

머스크는 지난 4월 nvidia h100ai 칩을 구매하여 원래 구매량을 35,000에서 85,000으로 늘렸습니다.

그러다가 최근 엔비디아 칩을 고가에 구입하기 시작했습니다.

데이터와 더불어 컴퓨팅 파워도 지능형 주행 능력에 영향을 미치는 중요한 요소다. 현재 자동차 칩의 컴퓨팅 성능은 orin의 한계로 간주됩니다.

컴퓨팅 성능 측면에서 화웨이는 여전히 3.5eflops의 컴퓨팅 성능을 갖춘 중국 최초의 계층이지만 xiaopeng은 0.6eflops에 불과합니다.니오약간 더 나은 1.4eflops, 이상적으로는 2.4eflops를 달성했습니다.

"li xiaowei" 전선에서는 이상이 업계 리더 수준에 접근했습니다.

다양한 관점에서 이상형은 이번 '종료전'을 위해 병력을 모집하고 충분한 식량과 풀을 준비할 준비가 되어 있다.

이상적으로는 엔드투엔드 모델을 따라잡는 것이 너무 시급하기 때문에 스마트 드라이빙을 위한 준비는 이전보다 훨씬 더 많다.

"그림이 있는 noa"와 "그림이 없는 noa"는 모두 게임에 늦게 진입한 게임으로, 올해 7월에야 ad max 사용자에게 공식 출시되었습니다. tesla fsd가 중국에 진출하려는 중요한 순간에 우리가 엔드투엔드 모델을 개발하지 않으면 우리는 다시 한 번 업계에서 뒤처지게 될 것입니다.

투자를 늘리고 팀을 구축함으로써 li auto의 엔드투엔드 모델에 대한 강조가 회사 내 최고 수준에 배치되었다고 할 수 있으며, 목표는 스마트 주행 경로를 소위 " 올바른 길로."

"규칙 제어"가 가능한 기존의 전통적인 코드 솔루션은 한때 "올바른 길"이었고 엔드 투 엔드는 현재로서는 "가장 유망한" 솔루션일 뿐입니다.

다음에 어떤 새로운 기술 경로가 나타날지는 아무도 모릅니다.엔드투엔드 솔루션에 막대한 투자를 하는 것은 돈 낭비일 수 있지만 어떤 자동차 회사도 이 기회를 놓칠 수는 없습니다.

이상형은 모든 준비를 마쳤으나 그 중 하나일 뿐, 추세를 따라가는 것이 '올바른 길'을 논하기에는 이르다.