소식

ideal lang xianpeng과의 대화: 우리는 이미 tesla보다 앞서 있습니다.

2024-08-31

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

tesla ceo elon musk는 2023년 tesla의 지능형 운전 소프트웨어 fsd v12의 생방송을 시작했습니다. 영상 속 tesla는 최신 엔드투엔드 기술을 기반으로 하며 소프트웨어는 다수의 엔지니어 규칙 코드를 삭제하고 대신 주요 신경망 알고리즘. 이 차량은 자율 비전과 신경망을 기반으로 속도를 늦추고 신호등과 도로 위의 모든 행위자를 식별하고 자율적인 결정을 내릴 수 있는 위치를 나타냅니다.

이후 이 기술은 업계, 기술 애호가, 심지어 일반 자동차 소비자들로부터 큰 논의와 관심을 불러일으켰습니다.

이는 지능형 주행을 위한 새로운 패러다임 회복입니다. 현재까지도 중국 시장에는 다음과 같은 의견이 많이 나오고 있습니다.

엔드투엔드(end-to-end) 기술의 등장으로 스마트 드라이빙을 추구하는 많은 자동차 회사들의 출발선이 평준화되었으며, 이제 모두가 다시 출발점에 서서 데이터와 컴퓨팅 파워의 장거리 경주를 시작하고 있습니다.

엔드투엔드 기술은 강력한 데이터의 영향을 받습니다. 모델 구축과 데이터 수집의 양, 특히 효과적인 품질 데이터의 수집은 기술의 빠른 반복에 영향을 미칩니다.

중국 시장에서는 '홈 필드 어드벤티지'를 갖춘 독립 완성차 업체들이 스마트 드라이빙을 위한 또 다른 장거리 경쟁에 돌입했다. 동시에 이 단계에서 테슬라의 fsd 선두가 무산될 것이라는 의견도 많다.

li auto의 지능형 운전 r&d 부사장인 lang xianpeng 박사도 다음과 같이 믿습니다.기술적 아키텍처 측면에서 ideal의 최신 솔루션은 tesla의 솔루션과 크게 다르지 않으며 조금 앞서 있습니다. 이상적으로는 vlm 모델과 시스템 2가 있기 때문에 tesla는 엔드투엔드 시스템 1만 보유합니다.

li auto의 엔드투엔드 모델은 엔드투엔드가 통합된 one model이며, 이는 시장에 나와 있는 다른 자동차 회사의 엔드투엔드와 약간 다릅니다.

기존의 엔드투엔드 기술은 인공지능 모델과 기계적인 자가 학습만을 사용해 시각적 '입력' 끝부터 지능형 주행 시스템 및 차량의 최종 제어에 이르는 지능형 주행 프로세스의 인식, 계획 및 제어 모듈을 대체합니다. . 구동의 "출력" 측면은 모델에 의해 완전히 처리됩니다. 순수한 "end-to-end" 기술은 이 과정에서 더 이상 규칙 기반 코드를 설정하지 않고 완전한 블랙박스가 됩니다.

그러나 tesla, huawei 및 xpeng과 같은 상대적으로 앞선 제조업체를 포함하여 시장에 나와 있는 많은 자동차 회사는 여전히 보안 중복성을 담당하는 특정 기본 알고리즘을 설정하고 있습니다. 인식 및 계획 제어는 상대적으로 독립적인 모듈일 수 있으며 인터페이스는 여전히 수동으로 정의하고 연결해야 합니다.

통합된 엔드투엔드 one 모델은 인식 및 계획 제어 모듈을 하나로 묶기 위한 것이며 내부적으로는 시스템 1이라고 하며 엔드투엔드 결정을 신속하게 실행하는 드라이버와 비슷합니다.

과거 지능형 운전 분야의 엔드 투 엔드 애플리케이션은 상한이 높지만 하한이 낮은 문제에 직면하는 경우가 많았습니다. 예를 들어, 업계 선두주자인 tesla는 미국 캘리포니아주에서 매우 원활하게 테스트를 진행했으며 거의 ​​인간 운전자처럼 행동했습니다. 그러나 일단 익숙하지 않은 지역에 들어서면 설명하기 어려운 규제 결정을 내리게 됩니다.

이것이 엔드투엔드의 단점 중 하나입니다.

이상적인 접근 방식은 vlm 시각적 언어 모델인 system 2를 도입하고 한 단계 더 발전하는 것입니다.

이상적으로 vlm 시각적 언어 모델은 자동차 측 칩에 성공적으로 배포된 세계 최초의 대형 모델이며 복잡한 시나리오에서 논리적 사고와 의사 결정을 처리할 수 있는 능력을 갖추고 있습니다.

one model end-to-end 외에도 system 2 - vlm은 계획 및 의사 결정에서 system 1을 지원하는 또 다른 모델 알고리즘 세트입니다. vlm을 기반으로 하는 시스템 2는 복잡한 환경을 이해하는 능력, 내비게이션 지도를 읽는 능력, 교통 규칙을 이해하는 능력을 제공할 수 있습니다.

lang xianpeng은 이 조합에 대해 보다 대중적인 설명을 제시했습니다. 시스템 1은 운전자와 같고 시스템 2는 운전 학교 강사와 같습니다. 시스템 1은 작업을 수행하기 위해 전적으로 자체 시각적 인식에 의존합니다. 시스템 2는 시스템 1에 상기시키고 알리기 위해 오랜 기간 동안 지식을 축적해야 합니다.

이 개념을 최초로 제안한 것은 li auto의 지능형 주행을 위한 고급 알고리즘 전문가인 zhan kun과 그의 팀이었습니다. 인지심리학자이자 노벨상 수상자인 다니엘 카너먼(daniel kahneman)의 예를 따라 그는 인간의 뇌에는 두 가지 시스템이 있다고 생각합니다. 첫 번째 시스템은 경험과 직관에 기반을 두고 있고, 두 번째 시스템은 종합적으로 학습하고 지식을 축적하는 시스템입니다.

두 시스템은 이상적인 지능형 주행 전체를 지원하며, 이는 이상적인 지능형 주행 솔루션을 다른 자동차 회사와 완전히 다르게 만듭니다.

미국 시장에서는 tesla fsd가 컴퓨팅 성능과 데이터 측면에서 선두를 달리고 있습니다.

하지만 중국 시장에서는 더 앞서 나가기 위해 '중국 테슬라 스마트 드라이빙 로드'를 재창조하는 것이 이상적인 전략인 것으로 보인다.

랑셴펑(lang xianpeng)은 이렇게 말했다.중국의 훈련 컴퓨팅 능력과 훈련 데이터 측면에서 우리는 적어도 지금부터는 tesla보다 앞서 있다고 믿습니다. tesla는 여전히 데이터 규정 준수 및 훈련 컴퓨팅 능력 측면에서 중국에서 일부 제약을 받고 있기 때문입니다. 중국에서 지어야 한다.

ideal은 또한 데이터 테스트 프로세스에 월드 모델 시스템을 도입합니다.

ideal은 월드 모델이 차세대 ideal 지능형 운전의 대규모 및 고속 반복을 지원하고 자동화된 ai 기능 평가 시스템을 제공하며 재구성 기술을 사용하여 사용자가 직면한 문제 시나리오를 '잘못된 질문 세트'로 전환한다고 말했습니다. , 생성 기술을 사용하여 사용자를 "잘못된 질문 세트"로 변환합니다. 두 가지 기술은 모델 평가 중에 잘못된 질문이 더 이상 잘못 수행되지 않도록 보장하며 일반화 기능도 뛰어납니다. .

ideal one model+vlm+world 모델의 기술 솔루션을 기반으로 하여 차세대 ideal 지능형 운전 제품을 '감독 자율 주행'의 새로운 단계로 끌어올립니다.

ideal은 orin-x 칩에 vlm을 배포한 최초의 회사이자 듀얼 시스템 아키텍처를 채택한 최초의 자동차 회사입니다. 중국에서는 이미 아이디얼의 판매량이 100만대에 육박하고 있어 유효데이터의 비중이 늘어날 수밖에 없다. li auto의 현재 누적 훈련 마일리지는 22억 킬로미터를 초과했으며, 2024년 말까지 30억 킬로미터를 초과할 것으로 예상됩니다. li auto의 현재 훈련 컴퓨팅 성능은 5.39 eflops에 도달했으며, 2024년 말까지 8 eflops를 초과할 것으로 예상됩니다. 2024.

그러나 업계에서는 여전히 엔드투엔드 기술의 적용과 전망을 두고 논쟁을 벌이고 있습니다. 어떤 사람들은 스마트 드라이빙이 500억 달러 없이는 달성될 수 없다고 생각하는 반면, 다른 사람들은 적어도 앞으로 몇 년 안에 엔드투엔드 기술이 구현될 것이라고 믿습니다. 규칙 기반 모델 알고리즘과 단일 모듈 기능은 여전히 ​​병렬이고, 순수한 엔드 투 엔드는 여전히 헛소리입니다.

이상적인 사용자 경험 그룹의 테스트 결과는 이 경로의 현재 합리성을 어느 정도 확인했습니다. 어쨌든 li auto는 이 단계를 주도적으로 수행했습니다.

li auto 지능형 운전 r&d 부사장 lang xianpeng 박사와 li auto 지능형 운전 수석 알고리즘 전문가 zhan kun

다음은 li auto의 지능형 운전 연구 개발 담당 부사장인 dr. lang xianpeng과 li auto 지능형 운전의 수석 알고리즘 전문가 zhan kun과의 대화 내용을 요약한 것입니다. 대화는 원래 의미를 수정하지 않고 편집되었습니다.

질문: 시장의 모든 사람들이 엔드투엔드(end-to-end)라고 말합니다. 실제 엔드투엔드는 무엇입니까?

잔 쿤:end-to-end는 이름에서 알 수 있듯이 초기 입력 끝부터 최종 출력 끝까지 작업을 수행하는 것을 의미하며 중간에 다른 프로세스가 사용되지 않습니다. 입력에서 출력까지의 과정을 end-to-end라고 합니다. end-to-end의 본질적인 의미는 이 의미를 충족하는 한 end-to-end라고 할 수 있습니다.

이제 이상적인 자동차는 직접 센서 입력을 통해 모델 추론이 완료된 후 궤적 계획을 직접 사용하여 자동차를 완벽하게 통합하는 것입니다. 그 사이에 다른 단계가 있습니다. 중간에 두 개의 모델을 나누는 엔드투엔드(end-to-end) 방식도 있는데, 신호를 모델 간 연결로 사용하고, 인식 결과를 제어 모델에 입력한다. 그리고 그것들은 모듈식 end-to-end 모델로 결합됩니다. 이것은 end-to-end라고도 할 수 있지만, 우리는 그러한 end-to-end가 실제로 end-to-end가 아니라고 믿습니다. . li auto의 end-to-end 자체는 중간정보의 손실을 해결하고자 하는데, 중간에 인공정보 소화 과정을 추가하면 효율성이 그다지 높지 않거나 성능의 상한이 제한될 수 있다고 생각합니다. 엔드 투 엔드(end-to-end) 통합이 더 필수적인 엔드 투 엔드(end-to-end)라는 것입니다.

질문: tesla에서 영감을 얻었나요? 기존 모듈과 비교해 차이점이 있나요?

잔 쿤:tesla는 2023년 초에 엔드투엔드(end-to-end)를 언급한 적이 있으며, musk는 트위터를 통해 입력부터 출력까지 자동차를 직접 제어하는 ​​완전한 모델을 구현한다고 밝혔습니다. 2016년 엔비디아가 엔드투엔드(end-to-end)를 언급하고 논문을 발표한 모델이 있었는데 효과는 보통이었고 문제만 해결했을 뿐이었기 때문입니다. 특히 간단한 시나리오에서는 당시의 컴퓨팅 성능과 모델 규모를 고려할 때 모두가 이 경로가 실행 불가능하다고 생각했습니다.

2023년에는 새로운 트랜스포머 아키텍처에 초대형 컴퓨팅 성능이 추가돼 새로운 패러다임이 부활할 수도 있다. end-to-end는 tesla가 처음 제안한 것은 아니지만 더욱 성장하는 방향으로 나아가고 있습니다. 이를 보고 우리도 내부적으로도 이전 모듈형 모델에 비해 다양한 정보의 중복성을 줄이기 위해 엔드 투 엔드(end-to-end) 접근 방식이 더 중요하다고 생각하고 있습니다. 그래프 없는 모델에서는 모듈식 엔드투엔드에 가깝습니다. 실제로는 모듈식 엔드투엔드 모델인 지각형 대형 모델이 있습니다. 그럼에도 불구하고 우리는 end-to-end 모델에는 여전히 규칙이 필요하고, 여전히 모듈로 나누어진 데이터와 모듈로 나누어진 정책 작업이 있다는 것을 발견했습니다.

이번에 우리는 새로운 솔루션에 대한 논의와 구상에서 엔드투엔드 솔루션이 더욱 철저하고 필수적이어야 한다고 제안했습니다. li auto는 매우 풍부한 데이터를 보유하고 있으며, 이 데이터가 우리가 일을 잘 수행하는 데 도움이 될 수 있다고 믿습니다. 이것이 우리의 장점입니다. 그래서 우리는 더 까다롭고 어려운 엔드 투 엔드 통합 아키텍처를 선택했습니다. 그 상한은 매우 높지만, 데이터 비율과 훈련 방법을 포함하여 점수 모듈을 훈련하기가 더 어렵다는 단점이 있습니다. 탐험과 발굴에 대한 많은 노하우가 있었지만 우리는 여전히 어렵지만 올바른 길을 선택했습니다.

질문: 현재 많은 브랜드가 리더라고 주장하고 있으며 li auto도 지능형 운전의 첫 번째 단계에 진입했다고 말하고 있습니다. 시장에서 이들 회사의 엔드투엔드 기술 수준을 어떻게 평가할 수 있습니까?

랑 셴펑:기술적인 관점에서 볼 때, 일반 소비자들은 사진이 있든 없든, 엔드투엔드든 비엔드투엔드든 상관하지 않습니다. 모두가 궁극적으로 주목하는 것은 제품과 사용 경험입니다. 제품의 가치도 마찬가지입니다. 그러므로 우리는 누구와도 경쟁하려고 하지 않고, 사용자들에게 더 나은 제품과 서비스를 제공하고자 합니다. 과거에는 고정밀 지도와 함께 고속 noa를 사용했는데, 고속 noa 경험이 사용자의 요구를 충족시켰습니다. 다음으로 우리는 도시 noa를 만드는 과정에서 많은 방법을 시도했습니다. 매우 간단한 아이디어 중 하나는 지도를 사용하여 도시 noa를 만드는 것이었습니다. 그러나 도시의 고정밀 지도를 제공할 수 있는 지도 딜러가 없다는 것을 알게 되었습니다. 밝은 이미지를 제공하세요. 그러나 우리는 라이트 그래프가 실현 가능하지 않다고 생각합니다. 반복 그래프가 필요하면 적시성과 실제로 사용할 수 있는지 여부에 대한 문제가 발생하기 때문입니다. 오늘 이용 가능한 장소가 내일 이용 가능하지 않을 것이라고 사용자가 느끼게 해서는 안 됩니다.

결국 사진 없이 그냥 하기로 결정했습니다. 기존의 picture-less 솔루션은 수많은 매뉴얼 룰과 실제 차량 테스트를 포함하는 인지, 플래닝, 서브모듈 솔루션을 기반으로 하여 예산 투자는 말할 것도 없고 시간적인 면에서도 매우 어려웠습니다. 모델이 반복되면 1년 내내 다양한 ​​조건을 거쳐 실행하려고 하면 1~2년 안에는 불가능하고 사용자는 그렇게 오래 기다릴 수 없습니다. 그래서 우리는 엔드투엔드 + vlm 기술 아키텍처를 반복했습니다. 이 기술 솔루션은 본질적으로 설계된 것이 아니라 자체적으로 성장한 것입니다.

더불어 오늘은 월드모델의 내용을 소개해 드렸습니다. 제 생각에는 이 기능이 자율주행의 빠른 반복을 달성하는 데 가장 중요하고 필요한 보장입니다.기존 방식으로 모델을 반복하려면 많은 양의 차량, 사람, 시간을 테스트해야 했지만 이제는 생성 및 재구성 기술을 사용하여 과거에 문제가 발생한 장면을 수집하고 잘못된 장면 시나리오 라이브러리를 구축합니다.각 릴리스 이전에는 간단한 오답에 대해 1천만 킬로미터 이상의 테스트가 수행되었으며 이는 무작위 도로 테스트가 아닌 효과적인 오답 모음입니다. 또한, 수천만 건의 시나리오 테스트인 시나리오를 생성하고 시뮬레이션할 수도 있습니다. 이러한 방식의 모델 반복은 이제 원래 차량이나 도로 테스트 방법보다 훨씬 더 안정적이며 일년 내내 다양한 ​​시나리오를 다룰 수 있습니다. 이것이 우리의 접근 방식입니다. 다른 브랜드에서도 이런 방식을 사용하는지 여부는 알 수 없지만 우리는 전적으로 사용자의 요구에 기반을 두고 있습니다. 우리는 기술을 위해서가 아니라 이 기술이 실제로 사용자의 요구를 해결하고 더 나은 제품 경험을 가져올 수 있기 때문에 기술을 반복합니다.

질문: 얼마 전 누군가가 "500억 없이는 스마트 드라이빙이 불가능하다"는 생각을 내놓았는데요.

랑 셴펑:500억에 대해서는 일회성 투자인지, 장기 투자인지 판단해야 합니다. 오늘 말씀드린 것처럼 우리는 스마트 드라이빙 연구개발에 10년 연속 투자한다면 매년 10억 달러를 투자하게 됩니다. 500억 달러를 넘어설 것이다.

엔드 투 엔드 + vlm 기술 아키텍처는 분수령입니다.이전까지 우리는 자율주행을 위해 전통적인 방식을 계속 사용하고 있었습니다. 이번 세대부터 본격적으로 자율주행을 위해 인공지능을 활용하게 되었습니다. 다음으로, 자율주행 연구개발에 있어서 핵심 경쟁은 모델을 훈련시키기 위한 더 많은 더 나은 데이터와 그에 맞는 컴퓨팅 파워가 있는지 여부입니다. 컴퓨팅 파워와 데이터 획득은 얼마나 많은 돈을 쓰고 얼마나 많은 자원을 투자하느냐에 따라 달라집니다. 훈련 데이터, 훈련 마일리지 등 이런 것 중 일부는 돈으로 살 수 없습니다. 각 자동차 회사는 자체 데이터를 보유하고 있으며 이를 서로 공유하지 않습니다.

투자가 필요한 또 다른 것은 컴퓨팅 파워입니다.현재 5억 3900만 eflops의 컴퓨팅 파워는 올해 말까지 8억 eflops가 될 것으로 예상됩니다. 이는 더 이상 10억 위안이 아니라 20억 위안의 비용으로 연간 20억 위안을 소비하게 됩니다. 향후 l4 단계에 진입하면 연간 데이터 증가와 컴퓨팅 성능 증가가 기하급수적으로 늘어날 것이며, 이는 매년 최소 10억 달러(60~70억 위안)가 필요하다는 것을 의미합니다. 그리고 5년 후에도 계속해서 반복해야 할 것입니다. 이 수준에서는 회사의 이익과 이익이 투자를 뒷받침하지 못하면 매우 어려울 것입니다. 그러므로 이제 우리는 자율주행에 몇억 달러가 투자되는지에 관심을 가질 필요가 없습니다. 대신 본질부터 시작하여 충분한 컴퓨팅 성능과 데이터 지원이 있는지 확인한 다음 얼마만큼의 돈을 투자해야 하는지 살펴보겠습니다. .

질문: 데이터 양이 그다지 크지 않을 때 모델의 보안을 어떻게 보장할 수 있습니까? 개념적 관점에서 볼 때 우리도 이제 일종의 "2-모델"입니까?

랑 셴펑:'보안'은 조율 문제가 있는지, 독립된 보안 모듈이 있는지 등 많은 관심을 받은 이슈다. 모두가 이런 문제를 안고 있는 이유는 모두가 과거 비ai 자율주행 연구개발의 관점에서 생각하고 있기 때문이다. 예를 들어, 나는 말을 탔습니다. 그는 차에 안장이 있는지 묻곤 했습니다. ai 관행이 무엇인지, ai가 아닌 관행이 무엇인지 모두가 실제로 이해하지 못했기 때문입니다. 이것이 첫 번째 요점입니다.

둘째, 이제 많은 사람들이 엔드투엔드 모델이 있다고 말하지만 실제 엔드투엔드 모델은 여전히 ​​두 가지 기능, 즉 데이터가 충분한지, 컴퓨팅 성능이 충분한지 여부에 달려 있습니다. 그렇지 않으면 end-to-end가 ai 접근 방식이기 때문에 진정한 end-to-end를 달성하기 어려울 것이라고 생각합니다.

셋째, 엔드투엔드 기능의 상한과 하한이 매우 높습니다. 비유를 하자면, cnn(심층 신경망 모델)이 나오기 전에는 모두가 우리에게 익숙한 이미지 분류 작업과 같은 일부 작업을 수행하기 위해 여전히 전통적인 기계 학습 방법을 사용하고 있었습니다. 그러나 cnn이 나오자마자 그들은 10% 이상의 개선을 억제했습니다. 제가 표현하고 싶은 것은 모든 사람이 엔드투엔드 기능을 진정으로 이해하지 못했기 때문에 내부 베타 사용자에게 이를 서두르지 않을 것이라는 것입니다.

ai가 아닌 방법을 사용할 때는 수직 제어 세부 사항 측면에서 많은 시나리오를 고려해야 합니다. 이처럼 장면 규칙을 설계할 때 특정 상황에서 어떤 작업을 수행해야 하는지 규정하기 위해 많은 조건을 설정해야 합니다. 조건. 하지만 엔드투엔드 모델의 첫 번째 버전을 훈련했을 때 모든 교차로나 세로 제어가 필요한 조건에서 매우 편안하다는 것을 알았습니다. 우리는 특별한 상황을 디버깅하지 않았습니다. 모델이 스스로 훈련하는 능력이었습니다. 시나리오가 너무 다양하고 모든 시나리오에 대해 규칙을 정하는 것이 불가능하기 때문에 규칙을 만들 때 큰 문제가 있음을 알 수 있습니다. 그러나 ai를 사용하여 엔드투엔드 모델을 구축하면 여기에 마법의 힘이 있다는 것을 알게 될 것입니다. ai에 데이터를 제공하면 실제로 이 사람들의 운전 경험을 배울 수 있을 뿐만 아니라 상한선까지 배울 수 있습니다. 그러나 이는 모델을 크게 개선할 수도 있습니다. 개선의 하한선입니다. 여전히 한계가 있지만, 이를 해결하는 방식은 더 이상 규칙을 정하는 것이 아니라 더 많은, 더 나은 데이터를 제공하는 것입니다.

마찬가지로, 우리는 제어 모듈에 대해서도 생각할 필요가 없는 전략을 가지고 있습니다. 엔드-투-엔드 센서 입력은 궤적 출력에 입력되고 궤적 출력은 조향 및 제동 모듈에 제공되기 때문입니다. 예를 들어 급격한 180° 회전을 계획하는 경우 제약 조건이 구현되지만 이전 접근 방식에 비해 무시할 수 있는 유사한 규칙이 거의 없습니다.

동시에 안전의 수익성과 능력의 상한선을 향상시켰습니다. 고품질의 데이터를 지속적으로 제공하는 것이 우리의 접근 방식이며, 안전 운전 습관을 많이 배울 것입니다.

질문: 엔드투엔드 + vlm 데이터가 깨끗한지 어떻게 확인하나요?

잔 쿤:엔드투엔드를 하든 vlm을 하든 데이터가 가장 중요하며, 대형 모델에서는 항상 고품질 데이터를 강조해 왔습니다.따라서 첫 번째 단계는 데이터 원본을 정리하는 것입니다.우리의 운전 데이터 선택은 매우 엄격합니다. 운전 위반 여부, 오랫동안 줄을 눌렀는지 여부, 정차 여부 등 다양한 차원을 포함하고 가중치가 적용되는 각 자동차 소유자에 대한 내부 점수를 보유하고 있습니다. 운전대를 중간 또는 급하게 돌릴 때, 불편함을 느낄 때 등 다양한 지표를 바탕으로 점수를 바탕으로 상위 3%의 사용자를 '경력 운전자'로 선정한다. 이상적인 대규모 데이터의 경우 처음 3%도 매우 큰 양의 데이터입니다. 최소한 우리가 얻는 데이터가 표준화되고 편안하며 합리적이라는 것을 보장할 수 있습니다. 데이터가 엔드투엔드(end-to-end)로 제공되는 경우.

두 번째 수준의 심사도 있습니다. 모델 훈련 과정에서 일부 시나리오에서는 모델 샘플을 일치시키고 분류해야 하며, 평가 모델, 평가 방법 및 일부 규칙이 있습니다. 데이터를 정리하고 각 데이터 유형을 매우 상세한 태그로 분류할 수 있습니다.

마지막 계층에서는 훈련 과정에서 어떤 샘플이 학습하기 어려운지 파악하고 강화 학습 및 대조 학습을 위한 일부 합성 데이터를 의도적으로 구성하는 것을 포함하여 학습 전략을 조정합니다. 전체 엔드투엔드 데이터와 vlm 데이터가 잘 검증되고 정리되어 결과 모델이 더 좋아지도록 데이터의 학습 방법을 일부 조정합니다. 이 과정은 하룻밤 사이에 일어나지 않습니다.

랑 셴펑:또 다른 문제, 즉 더티 데이터 문제가 있습니다. 훈련을 위한 데이터 양은 여전히 ​​상대적으로 큽니다. 나중에 아주 작은 더티 데이터가 있더라도 ai 능력 훈련에는 전체 효과를 오염시킬 수 있는 얼룩이 없기 때문에 정확한 데이터의 양이 충분히 크면 문제가 없습니다. 약간의 간섭이 있을 것입니다. 데이터도 크게 중요하지 않습니다.

질문: 지난 몇 년 동안 스마트 드라이빙의 기술 전쟁은 빠르게 변화했으며 여러 번의 주요 반복을 거쳤습니다. 엔드투엔드 + vlm이 장기적인 활력을 갖춘 프레임워크가 될까요?

랑 셴펑:end-to-end + vlm은 인간의 사고와 인지를 시뮬레이션하는 아키텍처입니다. 왜냐하면 우리가 인공지능을 할 때 궁극적으로 의인화 또는 인간 유사성을 달성하기를 희망하기 때문입니다. 나는 "생각하기, 빠르고 느리게"라는 책을 읽고 많은 영감을 받았고, 마침내 사람들이 어떻게 인지하고 생각하는지 알고 싶었습니다. 우리는 현재의 인공 지능 프레임워크가 매우 합리적이라고 생각하며, 이후에도 그것을 보고 매우 기쁩니다. 우리가 이를 제안한 이후 업계의 많은 기업들이 이중 시스템 이론의 이점을 언급하기 시작했으며 후속 조치를 시도하고 있습니다. 더욱이 이중 시스템 이론은 자율주행에 활용될 수 있을 뿐만 아니라 미래 인공지능, 심지어 지능형 로봇의 패러다임이기도 하다. 자율주행은 바퀴 달린 지능형 로봇이라고 할 수 있지만, 그 작동 범위는 도로이다. 따라서 장기적인 역량이 있다고 생각하지만 기술 개발은 끝이 없습니다. 우리는 첨단 기술에 대한 예리한 인식을 유지하고 새로운 기술이 있으면 추적할 것입니다.

질문: 이상형은 현재 나와 테슬라의 스마트 드라이빙 사이에 큰 격차가 있다고 느끼고 있는데, 언제 따라잡을 수 있을까?

랑 셴펑:작년에는 반년도 안 된다고 답했는데, 올해는 좀 덜할 수도 있겠네요. 첫째, 기술 아키텍처 측면에서 우리는 tesla와 크게 다르지 않으며 조금 앞서 있습니다. 왜냐하면 우리는 vlm과 시스템 2를 갖고 있는 반면 tesla는 엔드투엔드 시스템 1만 가지고 있기 때문입니다. 둘째, 중국의 훈련 컴퓨팅 파워와 훈련 데이터 측면에서 우리는 적어도 지금부터는 우리가 tesla보다 앞서 있다고 믿습니다. 왜냐하면 tesla는 여전히 데이터 규정 준수 및 훈련 측면에서 중국에서 일부 제약을 받고 있기 때문입니다. 중국에서는 여전히 컴퓨팅 파워를 구축해야 합니다. 이런 관점에서 볼 때, 중국에 있는 우리와 tesla 사이의 격차는 그리 크지 않을 수도 있습니다. 우리는 또한 tesla가 함께 참여하고, 서로에게서 배우고, 스스로 발전하는 데 집중할 수 있기를 바랍니다.

질문: 지능형 주행을 위한 ai 경로가 별로 옳지 않다는 견해가 있는데, l2는 저비용이나 범용성에 더 중점을 두지만 l4는 보편성을 달성한 후에야 이 경로가 작동할 수 있다고 생각하지 않습니다. 안전이 해결되었으니 양산차도 l4가 가능한가요?

랑 셴펑:첫 번째,우리는 모든 것이 사용자의 요구와 사용자 가치에서 시작되어야 한다고 믿습니다.li auto가 만드는 모든 제품은 사용자 가치를 초과하거나 만족시켜야 합니다. 우리는 사용자가 가치 있다고 생각할 때만 만듭니다. 우리는 사용자에게 자율주행에 대한 수요가 있어야 한다고 믿기 때문에 사용자가 청두에서만 l4를 운전할 수 있고 다른 곳에서는 운전할 수 없도록 설계하는 것은 불가능합니다.

둘째, 진보적이거나 도약적인 기술 경로를 통해 각 브랜드는 자체 기술 경로를 논의하고 선택할 수 있습니다.그러나 li auto는 확실히 사용자 요구를 충족하는 기술 경로를 선택할 것입니다.이제 우리는 자율주행을 위해 인공지능을 사용하기로 선택했습니다. 이전에는 운전 보조라고 불렸던 이 시스템은 사람의 운전을 보조했으며 주제는 사람이었습니다. 하지만 엔드투엔드 + vlm 단계 이후에는 자동차가 스스로 운전할 것이라고 믿습니다. 완전한 모델을 훈련한 후에는 모델이 자동차를 잘 운전할 수 있게 됩니다. 자동차가 작동하지 않는 곳이나 인수해야 한다는 메시지가 나타나면 감독하겠습니다. 그러나 주제는 자동차이고 사람이어야 합니다. 이 수준에 도달하면 자율주행에 대한 사용자의 요구가 우리의 논리입니다.

질문: li auto는 고급 스마트 운전에 대한 요금을 청구할 계획이 있습니까?

랑 셴펑:스탠다드와 프리는 모두 아이디얼이 스마트 드라이빙 첫날부터 내놓은 전략이다. '감독 자율주행'은 ad max 소유자 모두에게 무료다. 배송량이 상대적으로 좋고 회사 운영도 안정적이다. 스마트 드라이빙 연구개발에 투자할 자원도 충분하다. 배송량은 우리에게 매우 중요한 지표입니다. 이는 배송량에 관한 것뿐만 아니라 자율 주행을 위한 더 많은 차량 훈련 마일을 제공할 수도 있습니다.