Руководитель Li Auto: Если мы в будущем не будем инвестировать 1 миллиард долларов США в вычислительные мощности каждый год, нас вытеснят

2024-08-08

Примечание редактора: редакционный отдел Tencent Automotive называет волну электрификации последнего десятилетия «бурной эрой» автомобильной промышленности Китая. Теперь, в 2024 году, в историческом узле, известном как «Год умного вождения», мы ничего не можем с этим поделать. но интересно: Какого технического пути будут придерживаться основные игроки отрасли? Как построить соответствующие конкурентные барьеры? Tencent Auto специально запустила серию интеллектуального планирования вождения. С помощью интервью, реальных тестов, горизонтальных обзоров, обзоров и других методов компания стремится стать у истоков истории и получить более глубокое понимание огромных изменений, которые могут произойти в автомобильной промышленности. в ближайшие десять лет, предоставляя тем самым читателям и отрасли больше информации. Комплексное руководство по содержанию может оставить ценные исторические сноски для отрасли.

Новости Tencent «Дальний свет»

Автор Ао Дун

Редактор Ши Дин

«Сквозные» (E2E) решения становятся признанными лучшими решениями для интеллектуального вождения в отрасли. Однако, когда люди пытаются рассеять туман и узнать правду, кажется, что существует десять тысяч «сквозных». «конечные» решения глазами 10 000 автомобильных компаний. Комплексные».

В декабре прошлого года,ТеслаПосле запуска FSD V12 и предложения комплексного решения, вскоре после этого термин «сквозное соединение» получил широкое распространение в кругах интеллектуального вождения;Сяопэн,горизонт,НИОДругие компании предложили комплексные решения. В конце июля Хэ Сяопэн, председатель и генеральный директор Xpeng Motors, заявил, что Xpeng Motors — единственная автомобильная компания в мире, которая добилась сквозного массового производства. большие модели.

5 июля,идеальная машина Была выпущена новая архитектура технологии автономного вождения, основанная на сквозной модели, модели визуального языка VLM и модели мира. Первая версия была представлена тысячам тестовых пользователей в конце июля. Ли Сян объявил в июне этого года, что план будет полностью реализован не раньше первой половины этого года и не раньше первой половины следующего года.

По словам Лан Сяньпэна, вице-президента по исследованиям и разработкам в области интеллектуального вождения компании Li Auto, вышеупомянутый архитектурный проект был вдохновлен теорией системы «быстро-медленно», упомянутой лауреатом Нобелевской премии Даниэлем Канеманом в книге «Думай, быстро и медленно», и имитирует человеческое мышление и мышление в области автономного вождения, чтобы сформировать более разумное и более человечное решение для вождения.

Быстрая система, а именно Система 1, реализована в рамках сквозной модели, получает входные данные датчика и напрямую выводит траекторию движения для управления транспортным средством. Медленная система, а именно Система 2, реализована с помощью модели визуального языка VLM. После получения входных данных от датчика она выводит информацию для принятия решений в Систему 1 после логического мышления. Способность автономного вождения, состоящая из двух систем, также будет обучена и проверена. использование модели мира в облаке.

Сравнивая горизонтально с аналогами в отрасли, Ланг Сяньпэн подчеркнул, что сквозная модель Li Auto — это первая сквозная модель One Model, которая сильно отличается от других сегментированных моделей: «Единая модель — это то, где данные датчиков выводят траекторию. напрямую. Никаких других правил или моделей посередине не существует, и другие сквозные требования, возможно, придется связать с некоторыми правилами».

Судя по публичной информации, в отрасли считают, что Xpeng Motors и Huawei сегментированы сквозно. Сквозная крупномасштабная модель, используемая Xpeng Motors в массовом производстве, состоит из нейронной сети XNet + крупномасштабной модели управления XPlanner + крупномасштабной языковой модели XBrain, составляющей комплексную систему восприятия Huawei; Конечная система использует GOD (общее обнаружение объектов, общее распознавание препятствий) большое восприятие. Сеть, часть принятия решений и планирования использует сеть PDP (предсказание-планирование решения, предварительное решение и планирование) для реализации предварительного решения и планирования сети.

В прошлом интеллектуальные системы вождения можно было разделить на несколько основных модулей: «Восприятие», «Прогнозирование», «Планирование» и «Управление». Несколько модулей отвечали за разные задачи. Это также называли эрой правил автономного вождения. Если быть точным, то сегодняшняя сквозная модель — это большая модель искусственного интеллекта. Она может использовать технологию глубокого обучения для непосредственного генерирования выходных результатов на основе исходных входных данных. Входные данные — это данные, полученные с помощью таких датчиков, как камеры и лидар. выходные результаты и ускорение. Поведение при вождении, такое как замедление и торможение.

На практике вышеупомянутые идеи не могут быть реализованы за один шаг. С технической стороны необходимо решить ряд сложных вопросов, таких как архитектура модели, данные и инженерная проверка. С точки зрения пользовательского опыта, конечная цель комплексного решения — быть бесконечно близким к «опытному водителю» и даже превзойти водителя-ветерана, постоянно исследуя верхний предел возможностей. нет вывода в отрасли, когда эта цель может быть достигнута.

По мнению Цзя Пэна, руководителя отдела исследований и разработок технологий интеллектуального вождения Li Auto, мы сейчас находимся в необитаемой стране интеллектуального вождения: «Никто еще не сказал, как это делается, и все «слепы». и пытаюсь понять слона». Однако он считает, что смысл сквозного подхода не означает одну модель и две модели. Его величайшее значение состоит в том, чтобы существенно изменить весь процесс исследований и разработок. система действительно максимально похожа на человеческую». Те же навыки вождения».

Хотя комплексное решение считается оптимальным решением для интеллектуального вождения, оно все еще находится на ранней стадии, и в отрасли не существует четкого определения или стандарта оценки. Лан Сяньпэн считает, что отечественные производители автомобилей в настоящее время находятся на одной стартовой линии, но если вы посмотрите на One Model, Ideal может оказаться впереди. По его мнению, комплексное решение Li Auto в настоящее время является лучшим решением для реализации искусственного интеллекта в физическом мире, «поскольку оно очень хорошо имитирует механизмы человеческого познания и мышления и действительно позволяет системе использовать возможности человеческого мышления». и мышление. Способность понимать мир является преимуществом дуальных систем».

В долгосрочной перспективе сквозное соревнование может стать соревнованием и соревнованием финансовой мощи. Лан Сяньпэн считает, что рано или поздно ведущие игроки обязательно будут двигаться в сквозном направлении, и разрыв к тому времени обязательно увеличится. В эпоху искусственного интеллекта все будут бороться за две вещи: 1. Достаточно ли их. высококачественные продукты; 2. Имеется ли достаточная вычислительная мощность для обучения?

«В конечном итоге все конкурируют за вычислительную мощность и данные, но порог для этих двух вещей очень высок. Если финансовых резервов недостаточно для покрытия ежегодных расходов на обучение, вы не сможете играть в более поздний вариант. L3 или L4. Если говорить об автомобилях, то если количество предприятий невелико, данные не смогут удовлетворить спрос на обучение», — сказал Лан Сяньпэн, по предварительным оценкам, текущие идеальные ежегодные инвестиции в обучение составляют 1. миллиардов юаней, и ожидается, что в будущем стоимость достигнет 1 миллиарда долларов США в год». Это просто стоимость обучения вычислительной мощности, не включая другие затраты на персонал, поэтому, если вы не можете тратить 1 миллиард долларов США в год обучения, вы можете быть исключены из будущих соревнований по автономному вождению».

Ниже приведены выдержки (отредактированные) разговоров между Tencent News «High Beam» и другими СМИ, а также Лан Сяньпэном и Цзя Пэном:

Все «слепят и трогают слона», а Идеал сдал лучший план

Вопрос: Каковы возможности перехода от традиционных технологий интеллектуального вождения к комплексным технологиям? Каковы преимущества и недостатки предложенного Лили технического решения по сравнению с Tesla, Huawei и Xpeng?

Лан Сяньпэн: Что касается преимуществ этого решения системной архитектуры, нам следует начать с наших мыслей об автономном вождении в августе и сентябре прошлого года. В прошлом году мы провели три поколения технологических исследований и разработок, начиная с разработки высокоскоростных систем, а затем переходя к автономному вождению в городах. В городах мы впервые использовали NPN (Neural PriorNet, нейронная сеть), решение со сценариями. а затем преобразовать в текущее решение без графиков, а затем выполнить итерацию к текущему комплексному решению.

В ходе этого процесса мы обнаружили, что это решение все еще имеет очень большой недостаток или проблему для автономного вождения на более поздних уровнях L3 и L4. Проблема в том, что мы, люди, можем понять неизвестные сцены и места, в которых никогда не бывали, а те, кто нормально водит машину, могут просто немного к этому привыкнуть. Но независимо от того, является ли это текущим комплексным решением или решением без изображений, по сути, именно увиденные сцены или обработанные данные могут работать лучше. Если есть новая сцена, он, возможно, не сможет ее правильно обработать, но если мы хотим полностью передать машину системе, чтобы она управляла вместо людей, то наша система должна иметь возможность справляться с неизвестными сценами, как с людьми. .

Приведу простой пример: наши светофоры отличаются от светофоров в других местах. Светофоры в Тяньцзине представляют собой светофоры типа индикатора прогресса, но в других местах у нас есть либо лампочки, либо обратный отсчет. Это очень странно. понимать. Но я считаю, что если кто-нибудь с нормальным здравым смыслом поедет в Тяньцзинь и увидит такую штуку, установленную на перекрестке, то подумает, что это светофор, и остановится и запустится нормально по указаниям светофора. Итак, нам нужно, чтобы система также имела такое понимание сцены или способность логически рассуждать такого рода знания. Как получить эту способность? В это время мы увидели теорию дуальных систем, которая является хорошим объяснением механизма человеческого познания. Быстрая система обеспечивает своевременную обработку ответов, а медленная система соответствует сложному мышлению и логическим суждениям. Вместе они образуют систему. механизм человеческого познания и мышления, поэтому мы хотим подумать о том, как теорию этой системы можно применить к автономному вождению.

Так что же именно Система 1 использует для систематизации? В конце концов мы решили реализовать систему, применив сквозную модель, и система 2 была реализована с использованием большой модели визуального языка VLM. Это два наших конкретных метода реализации. После предварительных исследований и разработок мы внедрили эти две системы на наши настоящие серийные автомобили.Мы считаем, что на данный момент это лучшее решение для реализации искусственного интеллекта в физическом мире, поскольку оно очень хорошо имитирует человеческое познание и механизмы мышления и действительно позволяет системе мыслить и понимать мир, как люди. система.

Наша двойная система имеет некоторые уникальные особенности. Во-первых, наша сквозная модель — это первая сквозная модель One Model, которая сильно отличается от других сегментированных моделей. Во-вторых, наша модель VLM — это первая модель, которую можно установить на автомобиль и производить серийно. Другие модели можно обучать и тестировать на собственных обучающих кластерах, но фактическое использование серийных автомобилей, таких как Orin X, заканчивается. первым оптимизировал чип и развернул его на автомобиле, и эта модель достаточно большая, с 2,2 миллиарда параметров. Это уже большая модель в практическом смысле. Наша двойная система также является первой, которую мы предложили и внедрили, от архитектуры системы до реализации, у нас есть некоторые свои преимущества и характеристики.

Вопрос: С помощью сквозной модели визуальной речи может ли это решение поддерживать разработку уровней L3 и L4?

Лан Сяньпэн:По крайней мере, с нынешней точки зрения, я думаю, это должно быть возможно с точки зрения методов, но будь то две модели сквозного плюс VLM, или две модели в одной, или модель с большими параметрами, или другие структуры, Я думаю, что это можно сделать медленно, но я думаю, что общая идея должна быть в порядке.

Вопрос: Как разделены Система 1 и Система 2?

Цзя Пэн: У нас две модели, две Орины, потому что машиной нужно управлять в реальном времени. Хотя VLM имеет большое количество параметров, его нельзя контролировать каждые одну-две секунды. Сейчас мы оптимизировали его до уровня квазиреального времени около 3,4 Гц, с задержкой около трёхсот миллисекунд. Он принимает решения каждый момент и выдает два решения, например, одно замедлиться или уступить дорогу, а второе даст ориентировочную траекторию, например, направляюсь ли я в ту полосу или в ту полосу. Эти две части информации будут. могут быть непосредственно введены в модель, а затем результаты будут получены одновременно. Это примерно структура. Система 1 не полностью учитывает мнение системы 2. Система 2 расширяет возможности принятия решений системой 1.

Система 1 играет главную роль, а Система 2 является лишь справочником или консультацией для особых ситуаций. При достижении L4 Система 2 будет играть более важную роль. Это не означает, что Система 2 постоянно управляет автомобилем. действительно играет роль. Она играет очень важную роль в принятии решений и суждениях. В некоторых неизвестных сценариях способность Системы 2 определяет, сможете ли вы достичь уровня L4, но базовая способность Системы 1 является необходимой гарантией для L3.

Вопрос: Будут ли эти две системы объединены в одну в будущем?

Цзя Пэн: Это следующий шаг в нашем предварительном исследовании. Фактически, текущая идея заключается в массовом производстве двух моделей. В настоящее время Wutu 6.0 доступен по всей стране. Мы считаем, что комплексный набор + VLM может быть лучше по всей стране. Теперь, забегая вперед, как сделать L4 серийным? Наша идея может заключаться в том, чтобы сделать модель больше по размеру и мощности, и в то же время увеличить частоту кадров, или есть шанс, что это не эти два? модели могут быть объединены в одну. Пусть модель сама решит, использовать ли Систему 1 или Систему 2. Так что если в будущем появятся чипы с большей вычислительной мощностью и лучшими платформами, это может сыграть большую роль.

Вопрос: Почему VLM нельзя назвать сквозным? По-моему, он тоже сквозной.

Цзя Пэн: Если вычислительная мощность в будущем будет достаточно велика, сама VLM сможет работать в режиме реального времени, например, с частотой более десяти или даже 20 Гц. Возможно, она также сможет обеспечить сквозное быстрое реагирование, но в настоящее время VLM таковым является. на самом деле несколько раундов вопросов и ответов, я хочу спросить, как я могу управлять им в таких условиях работы? Почему он открывается таким образом и какие результаты после открытия?

Лан Сяньпэн: Фактически, с нашей точки зрения, пока это модель, основанная исключительно на данных, она является сквозной. Ее входные данные — это данные, а выходные данные — результат. Однако результатом является траектория в первой системе. , а результат во второй системе — Принятие Решений, еще раз подчеркну, есть большая разница между сквозным и сквозным множеством моделей, или одной моделью и сквозным.потому чтоКак и в случае с единой моделью, которую мы в идеале создаем здесь, выходные данные датчиков выводятся непосредственно из траектории, без каких-либо промежуточных правил или моделей. Возможно, потребуется объединить другие сквозные требования с некоторыми правилами.

Вопрос: Каков сейчас верхний предел возможностей системы?

Лан Сяньпэн: Теперь VLM должна стоять на границе нейтральной зоны. В дальнейшем каждой компании, включая нас, придется делать это от начала до конца, но я считаю, что мы первая компания, которая это сделает. Мы все еще в этом. У нас будет собственное исследование. В процессе мы обнаружим улучшение производительности, вызванное масштабом данных. Мы еще не увидели верхнего предела. Мы все еще исследуем границу между улучшением данных и улучшением производительности и еще не достигли ее.

У нас есть анализ. Вычислительная мощность чипа ограничена, поэтому масштаб параметров имеет ограничения. Теперь у нас есть сквозной масштаб параметров около 300 миллионов. Какой объем обучения может быть масштабирован примерно на 300 миллионов. потреблять ведь есть верхний предел. Невозможно лить его в него бесконечно.

Цзя Пэн: Хотя вычислительная мощность возросла, для больших моделей более серьезным узким местом современных автомобильных чипов является пропускная способность памяти. Мы действительно дошли до относительно необитаемого места. Никто больше не сказал, как это делается впритык, и все «слепят и пытаются разобраться в слоне».

Наша сквозная модель достигает траектории, и после траектории добавляются некоторые карманы безопасности, потому что до того, как модель достигнет верхнего предела, есть еще некоторые вещи, с которыми нужно разобраться, например, сильно повернуть руль, и пусть он избавиться от этого. Это то, что мы планируем.

Наибольшее значение сквозного подхода заключается в том, что он существенно меняет весь процесс исследований и разработок.

Вопрос: Как определить, что интегрированная модель более мощная и продвинутая, чем сегментированная? Каков потолок окончательной сквозной разработки? Будут ли в будущем более мощные модели?

Лан Сяньпэн:Прежде всего, я не думаю, что есть что-то хорошее или плохое, независимо от того, подходит оно или нет. Если вы хотите реализовать уровни автономного вождения L3, 4 и выше, я думаю, что эта интегрированная сквозная модель — это то, что вам нужно. модель, которую вы должны выбрать, потому что это не так. Но выбор этой модели больше связан с выбором более продвинутого итеративного процесса и метода исследований и разработок, сегментированных и некоторых предыдущих режимов. Они также очень подходят для вождения с поддержкой уровня L2.

Из конца в конец его изменение не так просто, как одна модель и две модели, но все его мышление, процесс и способ ведения дел претерпели огромные изменения. В нем нет никаких правил. кормить ее высококачественными данными, а также проводить обучение для улучшения возможностей модели, чтобы она могла лучше планировать и принимать решения.

Затем мне нужно провести разумные итерации в рамках модели. Самый важный способ — найти данные более высокого качества. Эти данные должны быть достаточно большими по количеству и достаточно хорошими по качеству. Сейчас мы практически достигли уровня в 3 миллиона параметров, и наш выбор данных очень специфичен. Прежде всего, мы ездим с нашей командой разработчиков и командой субъективной оценки. Все эти люди — опытные водители, и у них очень хороший опыт вождения.

Они работали с нами над разработкой набора стандартов для опытных водителей, таких как их безопасные условия вождения и стиль вождения. После того, как итерации были завершены в нескольких измерениях, мы использовали это правило, чтобы сравнить его с существующими 80 владельцами автомобилей Вана. просмотр, и мы хотим, чтобы те, у кого балл 90 или выше, этот клип необходимо просмотреть.Поскольку у нас есть эта база, мы можем отфильтровать 1 миллион или 10 миллионов высококачественных фрагментов. На первый взгляд может показаться, что это только 10 миллионов, но на самом деле это отфильтровано из 1,2 миллиарда километров данных. Это возможно. что эти немногие Это одни из данных о десятках миллионов километров.

Когда мы проверяем данные, у нас есть собственная цепочка инструментов. Речь идет не только о выборе, но у нас также есть некоторые собственные соотношения и рецепты данных, что также очень важно.

Вопрос: Некоторые компании говорят, что многие предыдущие данные невозможно использовать в сквозную эпоху. Они сейчас переживают самое болезненное: они сносят прежние мосты, строят новые, строят систему безопасности. что может их проверить, что вы думаете об этом заявлении?

Лан Сяньпэн: На мой взгляд, его заявление непоследовательно. Он имеет в виду, что данные не так уж важны, но его заявление также показывает, что данные важны. На самом деле, в идеале мы это давно поняли. Что самое главное в автономном вождении? Это финансирование талантов? Я думаю, что это данные. Без данных не будет основы для будущего обучения и проверки алгоритмов.

Мы накапливаем данные и создаем нашу платформу данных с момента поставки первого автомобиля в 2019 году.отИдеал L9 Вначале мы все были матрешками. Матрешки очень полезны для автономного вождения. Все характеристики камер и места установки одинаковы. Хотя есть небольшие различия в длине, мы можем полностью использовать эти данные. Но у некоторых производителей могут быть автомобили или внедорожники, и датчики могут быть разными, поэтому для них это действительно может стать проблемой.

Вопрос: Некоторые говорят, что сквозное внедрение упростит процесс разработки интеллектуального вождения и снизит трудозатраты. Что вы думаете?

Лан Сяньпэн:Если мы воспользуемся этим решением, нам действительно не понадобится так много людей. Весь сквозной процесс исследований и разработок просто означает выбор данных, моделей обучения, моделей оценки и моделей мира. Модель мира внутренне называется Системой 3. — это экзаменационная система. Возможности Системы 1 и Системы 2 оцениваются и сертифицируются нашей Системой 3. Но ранее наша оценка и тестирование этой системы автономного вождения проводились людьми, независимо от того, проводились ли они при проведении крупных дорожных испытаний или при проведении дорожных испытаний. Автомобиль оценивают люди, но люди не могут его оценить.

По всей стране пролегают миллионы километров дорог, которые меняются в течение года. Люди не могут проезжать по ним. Они не похожи на скоростные дороги. Скоростные дороги в Пекине мало чем отличаются от скоростных автомагистралей в Гуандуне. в городских условиях охватить их действительно сложно. Итак, у нас есть Система 3, которая поможет нам протестировать возможности Системы 1 и Системы 2. После теста, если мы пройдем итерацию и выйдем в онлайн, начнется следующий раунд.

В этом процессе, помимо потребности в людях, участвующих в разработке этих системных платформ, на самом деле в реальной работе задействовано не так много людей, что значительно сократит использование людей. Для оптимизированного управления внутри нашей организации. использование людей также будет иметь много преимуществ. Поэтому некоторые из наших следующих корректировок на самом деле основаны на изменениях в этом бизнесе. Это не корректировки ради корректировок, как все себе представляют.

Вопрос: С точки зрения потребителей и пользователей, когда будет внедрена сквозная технология, какой вид обновления будет виден в этом опыте?

Лан Сяньпэн:С точки зрения пользователя, независимо от того, используете ли вы сквозные или другие технологии, это не зависит от ваших технических решений и маршрутов. Пользователям просто нужно испытать это на себе, поэтому, когда мы продвигаем комплексный продукт плюс VLM для всех. пользователей в будущем, мы надеемся, что было бы здорово дать пользователям почувствовать себя очень опытным водителем за рулем.

Пользователям не обязательно знать, что это за технология, но если им интересно, у нас может быть много ссылок.Мы не будем переоценивать, какие технические решения мы используем для пользователей. Мы только сообщаем пользователям, какой у них опыт работы с продуктом.

Вопрос: Если сквозная технология будет официально предоставлена непосредственно пользователям, что, по вашему мнению, является хорошим стандартом? Когда его можно будет официально запустить?

Цзя Пэн: Я думаю, что стандартом является пользовательский опыт. Почему нам нужно иметь 1000 ранних пользователей вместо того, чтобы самим ставить перед собой какие-то цели по поглощению. Если есть 1000 пользователей и 10 000 пользователей, их опыт очень хорош, я думаю, его можно продвигать, или он может превзойти опыт тех, кто не работает? -версия изображения. Среди тех, кто в настоящее время участвует в раннем тестировании, мы провели некоторые оценки и обнаружили, что его опыт, стабильность и безопасность соответствуют стандартам.

Вопрос: Благодаря этому прогрессивному плану он превратится в «Одну модель»? Является ли одна модель единственным правильным направлением?

Цзя Пэн: С нашей точки зрения, Одна Модель сквозная. Другие говорят, что она не сквозная. Однако, если кто-то захочет добавить ее таким образом, то это нормально, мы делаем это сегментами без. картинка. В то время мы называли это моделью восприятия и моделью прогнозного планирования. Но вы также можете дать ей сегментированную модель.

Значение сквозного подхода не означает одну модель и две модели. Его главное значение заключается в том, что он существенно меняет весь процесс исследований и разработок. Благодаря эпохальному процессу искусственного интеллекта вы можете по-настоящему создать свою систему. Иметь человеческие способности к вождению.

Раньше это называлось просто функцией. У меня была функция проезда пандусов и пунктов взимания платы за проезд, но теперь у меня есть навыки вождения опытного водителя. Возможно, вы сможете испытать наш сквозной опыт позже. Конечно, я много ездил на этой машине, можно сказать, что на первой версии мы ездили неуклюже, а сейчас ездим на ней очень хорошо. Часто удивляемся некоторым характеристикам и возможностям этой модели.

При наличии 800 000 данных он не сможет пересечь кольцевую развязку, но при наличии 1 миллиона он внезапно сможет однажды пересечь кольцевую развязку. На самом деле мы не собирали для него какие-то данные по кольцевой развязке намеренно, мы просто сохранили. кормить его просто данными. Это похоже на обучение ребенка: какой урок он пойдет сегодня и какой урок он пойдет завтра. Вдруг однажды он придет и научит вас нескольким словам на английском языке.

Комплексные исследования и разработки отличаются от предыдущих исследований и разработок. В предыдущих исследованиях и разработках я знал, что вы будете такими же в будущем, потому что именно такими я вас и разработал. Сквозная модель имеет свою способность расти и развиваться, или вы можете только раскрыть ее возможности, но не можете спроектировать ее возможности. Я думаю, это очень большая разница.

Вопрос: Сталкивались ли вы с какими-либо серьезными проблемами в сквозном процессе?

Лан Сяньпэн: На самом деле проблем много. Самое главное, что мы заранее провели предварительную исследовательскую работу. Это одна из них.

Во-вторых, от идеалов компании до понимания и познания нашей командой интеллектуального вождения, я думаю, что понимание искусственного интеллекта является последовательным и очень глубоким. Самая большая проблема заключается в том, имеют ли все одинаковое понимание и понимание этого вопроса, считают ли некоторые люди, что он радикален, другие, что он консервативен, или некоторые люди считают этот план надежным или ненадежным.

На самом деле я потратил много времени, объясняя, как мы шаг за шагом перешли от NPN к безграфическому и сквозному подходу. Этот процесс представляет собой процесс обнаружения и решения проблем. После когнитивного выравнивания принятие решений происходит очень быстро, и сильные способности Ли Авто к исполнению — это то, чему мы научились и накопили за последние несколько лет.

С точки зрения организации и эффективности построение цепочки инструментов, управляемых данными, или инфраструктуры этой системы за последние пять лет очень важно. Даже несмотря на то, что сейчас у нас есть люди, вычислительные мощности и данные, если у вас их нет. завершено Вы не можете эффективно управлять эффективной цепочкой инструментов. Я должен использовать автоматизированную инфраструктуру замкнутого цикла данных для выполнения сбора данных, аннотирования образцов, автоматического аннотирования, автоматического обучения, а затем автоматической оценки и автоматизированной итеративной разработки. Мы начали с этого контента. Итерации продолжались с момента появления первого автомобиля в 2019 году, поэтому возможность создания идеальной инфраструктуры с замкнутым контуром данных является абсолютно первоклассной в отрасли.

Те, кто не сможет ежегодно инвестировать 1 миллиард долларов США в вычислительные мощности, будут исключены.

Вопрос: Вы как-то упомянули, что идеальный опыт умного вождения отстает на полгода от Tesla. Как вы пришли к такому выводу?

Лан Сяньпэн: Начиная с Tesla FSD V12.3, мы регулярно ездим в Соединенные Штаты, чтобы протестировать его. Мы пробовали его как на западном, так и на восточном побережье. Это то, что мы сами подытожили. Фактически, Tesla в настоящее время очень хорошо себя чувствует на западном побережье США, потому что в настоящее время у нее больше всего данных в Калифорнии. Но когда вы доберетесь до Бостона и Нью-Йорка, вы обнаружите, что его производительность резко упадет, особенно после прибытия в Нью-Йорк, его MPI (пробег за вмешательство) в основном достиг примерно 10 или 11. Фактически, уровень поглощения в Нью-Йорке. Ситуация в Йорке примерно такая же, как в Нью-Йорке. Действия отечественных лидеров не увеличили разрыв между поколениями. Но даже условия дорожного движения в Нью-Йорке гораздо менее сложны, чем в Шанхае и Гуанчжоу, Китай, поэтому мы осмеливаемся сделать такой вывод или сказать это.

С другой стороны, Tesla (в США) может получить много информации, которая недоступна в Китае, например, картографическую информацию. Фактически, Google предоставил много подобных дорожных карт. Внутренние навигационные карты не будут. дать вам эту информацию. Тесла На самом деле, я получил этот опыт на очень хорошей основе.Вот почему мы сказали, что если FSD появится в Китае, его действительно следует протестировать сейчас в Шанхае. Я думаю, что ему потребуется много работы, включая карты, потому что он не может получить столько обширной информации на карте, а это необходимо. внести много изменений, поэтому мы приняли такое решение.

Вопрос: Цель Ideal в этом году — стать абсолютным лидером в области интеллектуального вождения. Какие параметры используются для ее определения?

Лан Сяньпэн: Я думаю, что в конечном итоге все сводится к объему. Будет ли наша модель AD Max лидировать на рынке по объему продаж в этом году? На самом деле это самый хардкорный показатель. Я смотрю только на машины Макса, а не на общее количество. В этом месяце я продал 50 000 машин, но если AD Max продает только 10 000, это означает, что то, что я сделал с AD Max, было провалом. Но если я скажу, что добился успеха, доля Макса будет неудачной. под кайфом.

За месяц с момента запуска 6.0 до сквозного запуска наших автовладельцев стало больше заходить в магазин, и продажи тоже выросли. Доля заказов наших пользователей на AD MAX выросла с 37% в мае до 49%. Для модели L9 75% заказов приходится на AD MAX. Я думаю, это наиболее убедительно, когда пользователи действительно платят за ваш продукт.

Что касается нас внутри компании, у нас также было размышление на совещании по стратегии в марте этого года, то есть нам не следует слишком много внимания уделять конкуренции. Почему в первой половине этого года все жаловались на среднее качество нашей первой версии без изображений? На самом деле проблема в то время заключалась в том, что мы слишком много внимания уделяли конкурентам. В то время мы считали Huawei очень хорошей компанией. конкурентный эталон, а его уровень поглощения и показатели продукта стали нашими. На самом деле, глядя только на эти показатели, наша версия неплохая, но пользовательский опыт не очень хороший, поэтому мы, наконец, изменили ее на пользовательский опыт и оценку, а не просто смотрели на индикаторы, но индикаторы — это справочная информация. Это то, что нужно видеть.

Вопрос: После того, как Tesla FSD будет запущена и решит некоторые проблемы с дорожными условиями Китая, некоторые ведущие автомобильные компании могут оказаться на одной стартовой линии. Над чем все будут работать в это время?

Лан Сяньпэн: Это также связано с некоторыми нашими последующими планами, начиная от конца до конца, все действительно будут использовать искусственный интеллект для автономного вождения. Я верю, что рано или поздно ведущие игроки обязательно это сделают. Как только вы войдете в это направление, разрыв между всеми определенно увеличится. Вместо того, чтобы быть помощником водителя, как сейчас, вы думаете, что кто-то с 7000 юанями сможет это сделать, верно? Вы можете сделать это с 1 Орином, вы можете сделать это с 2 Оринами, вы можете сделать это с 4 Оринами, но если вы действительно достигнете эпохи искусственного интеллекта, каждый на самом деле будет делать две вещи.

Первый — достаточно ли у вас качественных данных, а второй — есть ли у вас кластер с достаточной обучающей вычислительной мощностью, чтобы соответствовать ему. Итак, в конце концов, всем приходится бороться за вычислительные мощности и данные, но порог для них. Две вещи очень высоки. Если резервов капитала вашей компании недостаточно для покрытия ваших ежегодных расходов на обучение, вы не сможете играть в более поздние уровни L3 или L4. Если в вашей автомобильной компании не так много таких автомобилей, ваши данные фактически не могут. поддержать ваши потребности в обучении.

Первоначально мы оценили, что текущие идеальные ежегодные инвестиции в обучение составляют 1 миллиард юаней. По нашим оценкам, будущие затраты составят 1 миллиард долларов США в год. Это только вычислительная мощность обучения, не включая другой персонал и прочее. расходы. Итак, если вы не можете тратить 1 миллиард долларов США в год на обучение, вы можете быть исключены из будущих соревнований по автономному вождению.

Вопрос: Один миллиард долларов США в год, как это вычислить?

Лан Сяньпэн:Это наиболее прямо с точки зрения параметров модели. На примере Tesla FSD V12.3-12.5 расширяет модель в 5 раз, а вычислительная мощность также увеличивается в 5 раз. имеет от 300 до 400 миллионов параметров, а затем VLM. Это 2,2 миллиарда параметров. К поколению Thor его вычислительная мощность была значительно улучшена. Модель не может оставаться неизменной. Естественно, чтобы увеличить верхний предел для L3 и L4. вычислительная мощность обучения также должна быть удвоена. Я думаю, в этом есть логика.

Вопрос: Находятся ли сейчас отечественные производители на одной стартовой линии сквозного пути?

Лан Сяньпэн: Отечественные производители находятся на одной стартовой линии, но я думаю, если вы посмотрите на модель One, Ideal может оказаться впереди.На основе One Model мы впервые выпустили нашу собственную версию Bird Egg, и это был относительно крупный выпуск и доставка для тысяч людей, и каждый действительно испытал на себе это сквозное улучшение производительности. и опыт, вызванный подобными вещами, ранее не был показан. Мое суждение сейчас основано на этом основании.

Вопрос: Что касается вопросов вычислительной мощности и покупки карты, поддерживает ли это компания?

Лан Сяньпэн: Наша компания также очень поддерживает нас. Теперь Ли Сян время от времени приходит и спрашивает: «Лан Бо, твоей карты еще достаточно?» Если вам не хватает, попросите кого-нибудь помочь вам решить эту проблему, я скажу «да» и спасибо. Хотя мы преуспеваем во всех аспектах нашей деятельности, я думаю, что Ли Сян относительно хорошо разбирается в искусственном интеллекте. Поэтому нас особо не беспокоят вычислительные мощности и т. д. Когда я захочу утвердить бюджет, думаю, он это учтет.

Вопрос: Вы упомянули, что не каждая автомобильная компания может осуществлять автономное вождение. С точки зрения вычислительной мощности, какой резерв необходим для соответствия стандарту входного билета?

Лан Сяньпэн: Теперь, когда мы реализовали наши идеалы, нам необходимо затратить вычислительную мощность в размере 1 миллиарда юаней в год. Если у вас его нет, либо скорость вашей итерации будет низкой, либо ваш продукт не будет достаточно конкурентоспособным. В будущем мы думаем, что для таких инвестиций в вычислительные мощности может потребоваться 1 миллиард долларов США в год. Мы, наверное, сами подсчитали, что сейчас у нас около 15 000 карт, и это уже довольно напряженная ситуация, когда я координирую распределение карт. день, но со временем я думаю, что количество параметров модели увеличится как минимум в 3-4 раза (входные данные), что кажется более разумным. Поскольку сама вычислительная мощность значительно улучшилась, ее пропускная способность и объем памяти также значительно улучшились. Я думаю, что это в основном соответствует ощущению небольшого 100 000 A100, что может составлять около 3 миллиардов флопов вычислительной мощности.

Вопрос: Бесконечны ли такого рода инвестиции, или будет установлен верхний предел, или в какой-то момент они могут стабилизироваться. Как обеспечить баланс коммерциализации?

Цзя Пэн: За последние два года параметры модели увеличились с десятков миллиардов до триллионов, а то и 10 триллионов параметров. Это очень крутая кривая, но в последнее время все снова задумались об одном, чем больше, тем лучше, и теперь она начинает немного сжиматься. Может быть, для изготовления каких-то больших моделей в профессиональных сферах не требуется столько параметров, как длина. поскольку качество данных достаточное. Хорошо, количество параметров моей модели, возможно, не должно быть таким большим. Это кривая HYPE. Через некоторое время она может снова упасть, но я думаю, что в конечном итоге она достигнет стабильного состояния. это количество параметров модели или вычислительная мощность, это будет. Есть такой процесс, все сначала быстро полезут в гору, а потом в конце концов, возможно, немного вернутся, а потом дойдут до реальной практичности. Это такой процесс.

Вопрос: В первой половине соревнований по электротехнике Tesla,БИДТеперь, когда отстающие соперники остались далеко позади, как будут выглядеть соревнования по умному вождению во второй половине?

Лан Сяньпэн:Первая половина посвящена электрификации, а вторая половина определенно посвящена интеллекту. Далее вы обязательно увидите некоторые из наших инвестиций и производительности в интеллект. Комплексное решение — это только начало.

Новости

Руководитель Li Auto: Если мы в будущем не будем инвестировать 1 миллиард долларов США в вычислительные мощности каждый год, нас вытеснят

Все «слепят и трогают слона», а Идеал сдал лучший план

Наибольшее значение сквозного подхода заключается в том, что он существенно меняет весь процесс исследований и разработок.

Те, кто не сможет ежегодно инвестировать 1 миллиард долларов США в вычислительные мощности, будут исключены.

Введение

моя контактная информация