расходы в 1 миллиард долларов в год — это только начало. могут ли «мифические» сквозные «лучшие практики» в области автономного вождения в китае принести прибыль?

2024-09-17

автор｜хуа вэй

ожидается, что менее чем через полгодатесла fsd официально войдет в китай. 5 сентября tesla объявила, что fsd будет запущен в китае и европе в первом квартале 2025 года.

не так давно комплексная версия tesla fsd v12 после своего запуска получила высокую оценку в отрасли и за ее пределами. даже те, кто много раз откровенно «ссорился» с теслойxpeng моторспредседатель хэ сяопэн также опубликовал сообщение, в котором отметил, что автономное вождение tesla «показало себя очень хорошо», и взволнованно заявил, что «2025 год станет моментом chatgpt для полностью автономного вождения!»

крупные модели, представленные gpt, оказывают глубокое влияние на модель программных исследований и разработок в области автономного вождения благодаря своей беспрецедентной скорости инноваций и технической архитектуре, и мировая индустрия быстро реагирует на это увлечение. судя по нынешнему фокусу отечественных автомобильных компаний, сквозные технологии также стали их направлением в области технологий автономного вождения следующего поколения.

компании, занимающиеся автономным вождением легковых автомобилей, такие как huawei, xpeng, pony.ai, momenta, jiji technology и horizon, активно следуют этому примеру и запустили комплексные решения и модели для автономного вождения для массового производства. что касается коммерческих автомобилей, zero one automobile также объявила четкий план по выпуску комплексной большой модели на этом автомобиле.идеальная машинаоснователь и генеральный директор ли сян также публично заявил, что li auto достигнет уровня автономного вождения l4 в течение трех лет, опираясь на комплексные и мировые модели.

даже рынок автономного вождения l4, который ранее переживал «волну холода», восстановился благодаря появлению сквозных технологий. прекрасным примером является компания wayve, которая использовала эту техническую концепцию для получения финансирования в размере 1 миллиарда долларов сша. лю юйдун, инвестиционный менеджер chentao capital, сказал: «комплексное открытие открывает вторую кривую роста для коммерциализации l4».

tesla, которая совершила скачок в возможностях fsd благодаря сквозным возможностям, также объявила, что 10 октября запустит модель robotaxi. хэ сяопэн также публично сообщил, что xpeng motors запустит robotaxi в 2026 году. однако недавние действия и ожидания автомобильных компаний и производителей беспилотного вождения по достижению массового производства l4 с помощью комплексных решений заставили многих специалистов по автономному вождению задаться вопросом: не является ли сквозное вождение слишком «мифическим»?

почему сквозные автомобили становятся «высшим классом» в сфере умного вождения?

сквозная технология появилась не просто так в последние два года. еще в 2017 году многие компании изучали возможность этого технического маршрута. в этом году «сквозная технология» стала популярной в сфере автономного вождения и считается убийственной технологией в отрасли. помимо инноваций, привносимых большими языковыми моделями, такими как chatgpt, она также неотделима от своей собственной. очарование».

«рождение комплексной модели — единственный способ для технологии автономного вождения привести к крупномасштабной коммерциализации». лу тяньчэн, соучредитель и технический директор pony.ai, сказал, что это одно из самых больших преимуществ. комплексной модели является то, что она может. обобщение может увеличить скорость коммерциализации автономного вождения и ускорить популяризацию автономного вождения.

по словам ван паньцюя, руководителя отдела интеллектуального вождения в zero one automobile, традиционные сквозные системы автономного вождения не только хуже обобщаются, чем сквозные, но и при расширении на новые сценарии, многие из ранее использовавшихся правил основанные на решениях. если это потерпит неудачу, вновь добавленный код ухудшит ремонтопригодность системы, что приведет к увеличению предельных затрат.

кроме того, традиционные системы автономного вождения имеют два недостатка. во-первых, это сложность архитектуры. многомодульная система не только требует более высоких затрат на разработку, но и имеет более низкий предел производительности, поскольку каждому модулю выделяется меньше вычислительных ресурсов. связь между модулями также создает множество инженерных проблем оптимизации. вторая проблема — высокая стоимость, вызванная сложной архитектурой. каждый модуль требует разработки, обслуживания, управления проектами и интеграции. это также причина, по которой размер команды традиционных компаний, занимающихся автономным вождением, очень велик.

«по моему мнению, сквозное решение может очень хорошо решить эти проблемы». ван паньцю сказал, что с архитектурной точки зрения сквозное соединение имеет только один модуль, который может хорошо решать сложные архитектурные проблемы, а также обладает возможность снижения затрат и повышения эффективности. сквозное обобщение, основанное на данных и даже знаниях, очень сильное и, вероятно, будет быстро внедрено в массовое производство. оно может не только снизить стоимость адаптации l2 к различным моделям, но и помочь l4 сократить время адаптации. к разным сценариям.

кроме того, лу тяньчэн отметил, что самым большим преимуществом сквозного соединения является предотвращение потери информации между различными модулями и функциями. мао цзимин, вице-президент по разработкам jiji technology, также рассказал об этом аспекте и объяснил, что эффективная передача информации между модулями включает в себя проблему эффективной передачи информации. интерфейсы восходящих и нисходящих модулей определяют верхний предел передачи информации. но каким бы сложным ни был дизайн интерфейса, произойдет потеря информации. комплексное унифицированное модульное решение не страдает от такой потери информации, что помогает улучшить конечный эффект алгоритма.

в то же время мао цзимин также рассказал о других преимуществах сквозной архитектуры. во-первых, что касается ошибок модуля, поскольку сквозное соединение находится под одним модулем, эффект усиления ошибок от нескольких модулей отсутствует, и верхний предел общих возможностей алгоритма интеллектуального вождения может быть максимизирован. во-вторых, в многомодульной архитектуре каждый модуль имеет свой собственный ритм исследований и разработок и цели оптимизации, которые не всегда могут быть строго согласованы с глобальными целями оптимизации всей интеллектуальной системы вождения, что приводит к потенциально неэффективной оптимизации и пустой трате ресурсов на исследования и разработки; конец. сквозная архитектура имеет только один модуль, а цели оптимизации ясны и унифицированы, что позволяет эффективно избежать этого внутреннего процесса оптимизации.

другой момент заключается в том, что компоненты модульной архитектуры естественным образом легко образуют несколько управляемых правилами «доменов», что приводит к ряду проблем обслуживания и дилеммам разрешения крайних случаев, а также сквозным, как в типичной архитектуре, полностью управляемой данными; подскажет разработчикам стать более активными и начать рассматривать и решать проблемы, используя парадигму мышления, основанную на данных и моделях, улучшая когнитивный уровень всей команды алгоритмов.

«в целом эффективность разработки комплексной системы выше, а потребление ресурсов меньше». инженерные ресурсы и переориентация ресурсов компании. переход к высокой плотности кадров в аспектах, связанных с данными, и инвестиции в накопление данных.

стоит отметить, что большое внимание также привлекла ценность для пользователя, которую обеспечивает сквозное соединение. лю юйдун отметил, что, во-первых, с точки зрения обработки сценариев с длинным хвостом, сквозная система может охватывать более экстремальные сценарии, чем исходная система, например возможности обработки здравого смысла. во-вторых, поведение системы автономного вождения более антропоморфно и может также способствовать укреплению доверия между потребителями и системой. в целом она больше похожа на человека-водителя в сценарии с сильным игровым процессом.

верхний предел высок, а нижний предел низок. наступил ли уже «конец» автономного вождения?

несмотря на то, что сквозные технические преимущества значительны, и многие автомобильные компании и компании, занимающиеся беспилотным вождением, активно следят за сквозными приложениями, в отрасли по-прежнему существуют разные мнения о так называемой «модели конечного этапа игры». ."

такие стойкие приверженцы, как ван паньцюй, сказали: «я считаю, что сквозное управление должно быть окончательной формой реализации автономного вождения, но сквозное соединение — это всего лишь техническая основа, но на самом деле существует много вариантов конкретных методов реализации, и отрасль еще не достигла консенсуса».

рационалисты, такие как мао цзимин, отмечали, что комплексное решение имеет характеристики «высокого верхнего предела, но низкого нижнего предела». с точки зрения непрофессионала, если все сделано хорошо, можно добиться хороших результатов, но если все сделано плохо, это будет хуже, чем традиционные решения. по мнению мао цзимина, выбор комплексного решения зависит от конкретного сценария применения. для автономного вождения l5 сквозное управление является единственным решением, но для l2 и l3 сквозное движение является лишь одним из возможных решений; более того, комплексное приложение необходимо сочетать с другими техническими решениями.

«комплексный подход обеспечивает хороший технический путь для быстрой и широкомасштабной популяризации автономного вождения. является ли это финалом, еще предстоит проверить времени». лу тяньчэн также придерживается аналогичной точки зрения, полагая, что как l2, так и l4. автономное вождение уже реализуются, но качество реализации и объем реализации имеют разные требования и стандарты к технологии.

для автономного вождения уровня l2 в настоящее время лучшим вариантом является сквозная технология; для автономного вождения уровня l4 сквозная технология может помочь быстро открыть новые области. однако к l4 предъявляются более высокие требования к безопасности, которые должны быть более чем в 10 раз выше, чем у водителей-людей. поэтому в дополнение к сквозному использованию также необходимо включить инструкции с высокой детерминированностью, основанные на намерениях вождения и сценариях применения. например, правила дорожного движения, предпочтения вождения и т. д.

лю юйдун сделал более осторожный вывод: «в настоящее время сквозное движение — это обозримый конец автономного вождения в будущем, но существуют различные возможности для долгосрочного развития технологий. точно так же, как мы сделали три года назад. появится такая технология, как chatgpt, и через два-три года может появиться новая техническая архитектура, которая разрушит нынешнюю chatgpt».

100% сквозного еще не появилось, что такое "лучшая практика"?

хотя еще не ясно, является ли сквозное решение окончательным решением для автономного вождения, его практическое применение явно стало консенсусным решением в индустрии интеллектуального вождения. тем не менее, в отрасли до сих пор существует много разногласий относительно выбора пути создания сквозных технологий автономного вождения.

в настоящее время zero one automotive движется вперед по сквозному маршруту, основанному на мультимодальных моделях большого языка. она добилась результатов не только в некоторых общедоступных наборах данных, но и в автономном вождении, проводимом шанхайской лабораторией искусственного интеллекта. совместно с cvpr и другими в этом году в international challenge, благодаря чисто визуальному решению для автономного вождения, она заняла второе место среди 143 международных команд на сквозной трассе автономного вождения.

ван паньцю считает, что сквозная модульность эквивалентна ранней стадии исследования и может быть реализована быстрее. в настоящее время научные круги и промышленность также имеют относительно зрелые решения. принятие сквозного технического маршрута, основанного на мультимодальных больших моделях, потенциально может превратить автономное вождение в прибыльный бизнес, и только базовая модель с сильным обобщением может обеспечить внедрение и интеграцию знаний, необходимых в области автономное вождение.

проще говоря, сильное обобщение крупных моделей принесет преимущества в производительности всей комплексной системе, а также позволит в будущем добиться прибыльного автономного вождения высокого класса в крупномасштабном массовом производстве. более того, в будущем эти два сквозных технических маршрута на основе мультимодальных больших моделей и моделей мира могут повторно использоваться друг с другом.

лю юйдун сказал, что в принципе одна модель ближе к форме agi в других областях, в то время как модель мира в настоящее время в основном является инструментом для генерации данных, и потребуется больше времени, чтобы увидеть, можно ли ее использовать в качестве системы автономного вождения. . в ближайшие два года появятся два основных типа комплексных решений: одно — модульное, типичным представителем является uniad шанхайской лаборатории искусственного интеллекта, другое — основанное на мультимодальных больших моделях; . сквозные модели, такие как lingo-2 от wayve и недавно выпущенный drivevlm от lili.

что касается модели мира, мао цзмимин придерживался иной точки зрения. он считает, что модель мира является разумным комплексным решением. основываясь на модели мира, алгоритм интеллектуального вождения способен понимать ситуацию и делать разумные прогнозы о будущем, а также принимать решения на основе этой информации. это решение, которое больше соответствует логике человеческого мышления.

чжу чжэн, сооснователь и главный научный сотрудник jiji technology, далее добавил, что обучение одной модели требует очень много ресурсов и времени, а также предъявляет очень высокие требования к масштабу и качеству данных. сквозной метод использует возможности прогнозирования модели для принятия решений о восприятии сцены и поведении вождения, что более соответствует поведению и привычкам человека при вождении. по его словам, в настоящее время джиджи имеет комплексную базовую прототипную систему, основанную на мировой модели, и совместно проверяет ее с производителем автомобилей, а некоторый прогресс будет обнародован в ближайшее время.

в августе прошлого года pony.ai объединил три традиционных модуля восприятия, прогнозирования и управления в единую комплексную модель автономного вождения. теперь она одновременно установлена в автономных такси l4 и легковых автомобилях с системой помощи при вождении l2. . по мнению лу тяньчэна, как модульная сквозная модель, так и одна модель в настоящее время находятся на ранних стадиях и еще не проверены для массового производства и поставки. ожидается, что в ближайшие 1–2 года сквозной технический маршрут перейдет от разногласий к консенсусу.

«в долгосрочной перспективе сквозное сквозное соединение в конечном итоге примет форму одной модели». мао цзимин сказал, что в текущей ситуации «двухэтапное» сквозное соединение используется компаниями. такие как huawei и xiaopeng, все еще являются полу-сквозной реализацией или находятся в сквозном переходном состоянии, а не в законченном состоянии.

не так давно,крайнийгенеральный директор автомобильной промышленности ся ипин также публично заявил: «никто на рынке не является по-настоящему комплексным, все это маркетинговые уловки». понятно, что нынешнее комплексное интеллектуальное решение для вождения jiyue также использует «двухступенчатую систему». «техническая архитектура.

атрибут «черный ящик» является недоразумением и может быть аналогичен серому или белому ящику.

ряд преимуществ комплексного решения проистекает из его архитектуры, которая объединяет несколько модулей, но такая конструкция также делает систему ближе к «черному ящику», чем к первоначальному понятному «белому ящику», поэтому в нем больше «необъяснимости». ".

лу тяньчэн считает, что необъяснимость — естественный недостаток сквозной системы, но ограничит ли она развитие сквозной технологии автономного вождения, зависит от ситуации. для l2 неинтерпретируемость не влияет на сквозные приложения. например, модульная сквозная версия по-прежнему сохраняет каждый основной функциональный модуль, а промежуточные выходные функции могут быть дополнительно извлечены в интерпретируемые данные.

для l4 требования к безопасности и определенности намного выше, чем у l2. поэтому необходимо включать в модель регулярные инструкции, такие как правила дорожного движения, предпочтения вождения и т. д., чтобы помочь сквозной модели автономного вождения лучше понимать намерения вождения. в то же время возможности модели также необходимо усовершенствовать для вывода движущих намерений во внешний мир для дальнейшего улучшения интерпретируемости.

по мнению чжу чжэна, хотя сквозное соединение действительно представляет собой черный ящик с точки зрения уровня продукта и окончательной формы исследований и разработок, с точки зрения инженеров и дизайнеров продуктов, включая пользователей, сквозное соединение можно сделать похожим на серый ящик. коробка или белая коробка.

во-первых, сквозное модульное соединение выделяет три модуля восприятия, прогнозирования и планирования. любой результат планирования может быть связан с предыдущим промежуточным модулем. во-вторых, одна модель может выдавать модульные промежуточные результаты. маркировка результатов для промежуточного контроля может улучшить сходимость одной модели, а смоделированные промежуточные результаты также можно показать инженерам или пользователям. в-третьих, самое важное в модели мира — это ее способность прогнозировать, а результаты ее прогнозирования также могут быть связаны с шаблонными промежуточными результатами.

мао цзимин сказал, что нынешнее сквозное заявление о «черном ящике» является непониманием деталей обучающего вывода всей модели. пока познание ниокр представлено в форме, которую можно объяснить извне, оно больше не является черным ящиком.

ван паньцюй также считает, что предложение необъяснимости отражает доверие общества к технологии, то есть достигает ли производительность самой технологии стандарта, приемлемого для всех. с развитием управления данными, проектирования алгоритмов, безопасности больших моделей и других связанных технологий в ближайшие один-два года произойдет огромный скачок в сквозной производительности и надежности. благодаря крупномасштабному тестированию производительности и полной проверке его интерпретируемость больше не будет критической проблемой.

наступает «пик» сквозного онбординга, и коммерческие автомобили будут запускаться быстрее

«масштабный запуск модульной сквозной системы состоится в течение прошлого года, а сквозная реализация на основе больших языковых моделей займет еще 1-2 года». ван паньцю отметил, что l4 автономное вождение коммерческого транспорта. транспортные средства должны быть быстрее, чем легковые автомобили. причина в том, что высокопроизводительные системы автономного вождения, которые могут производиться массово в больших количествах, очень сложно реализовать в сценариях. цикл легко замкнуть, а также удобно выполнить асимптотику сцены.

лю юйдун настроен более оптимистично, полагая, что в следующем году сквозная модульная модель и одна сквозная модель начнут продвигаться более интенсивно. кроме того, лю юйдун сказал, что с точки зрения радикального уровня технологического развития и сбора талантов, скорости технологических итераций и сложности технологического применения фактическое время внедрения комплексных коммерческих и пассажирских автомобилей может быть одинаковым. , но объем реализации легковых автомобилей будет больше, чем коммерческих автомобилей, и коммерческие автомобили будут медленно развиваться на более поздних этапах.

«эти препятствия необходимо преодолеть перед сквозным массовым производством. первое — это подготовка вычислительной мощности транспортного средства, второе — итерация сквозного алгоритма, третье — масштаб облачных данных. четвертый — масштаб вычислительной мощности, третий — итерация сквозного алгоритма. пятый — план проверки», — сказал мао цзимин.

по его мнению, tesla и ведущие отечественные oem-производители и компании, такие как wei xiaoli и huawei, уже оснащены всеми тремя аспектами вычислительной мощности транспортных средств, масштабирования облачных данных и масштабирования мощности облачных вычислений. с конца этого года до первой половины следующего года сквозные алгоритмы нескольких ведущих автомобильных компаний смогут быть запущены в больших масштабах, начиная со второй половины следующего года, отрасль откроется; в результате непрерывного массового производства и запуска.

идти от начала до конца, означает ли это «начать сначала»?

разработка и внедрение комплексных систем, несомненно, принесет технологическую революцию в общее решение интеллектуального вождения. итак, требуется ли свержение предыдущей технологии, чтобы выйти на сквозной рынок?

лю юйдун считает, что первоначальная технология автономного вождения не будет полностью ниспровергнута и будет использовать общие алгоритмы и программное обеспечение.

первая — это часть восприятия. многие части сквозной обработки информации о камерах теперь используют методы bev, такие как магистральная сеть или кодер. вторая часть — это регулирование и контроль. некоторые оригинальные ноу-хау в области регулирования и контроля можно перенести в сквозную систему. в-третьих, это инфраструктура данных. это важная возможность, которая понадобится предприятиям для сквозных операций в будущем. компании, которые могут внедрить решения bev, также имеют относительно мощную инфраструктуру данных.

по мнению мао цзмина, будет ли оно отменено, зависит от того, каким было предыдущее техническое решение. он сказал, что сквозное ядро представляет собой мультимодальную большую модель, управляемую исключительно данными, если предыдущее техническое решение определенной компании по интеллектуальному вождению имеет много правил, то эти правила по сути будут отменены, если предыдущее техническое решение уже было отменено. большая часть кода была изменена на модельно-управляемую, поэтому существует высокая вероятность того, что эту часть кода можно будет повторно использовать в той или иной форме.

следует подчеркнуть, что изменения в модели исследований и разработок, вызванные сквозным алгоритмом, находятся в центре внимания каждой oem-компании и компании по автономному вождению, и это также самое болезненное место.

ван паньцюй также сказал, что помимо завершения модели необходимо выполнить дополнительную работу с данными: во-первых, необходимо реконструировать замкнутую систему данных и эффективность ее итерации, а во-вторых, сквозную работу. тестирование и проверка, датчики всей платформы моделирования. входные данные должны быть очень реалистичными, что в настоящее время является очень сложной технической проблемой. но с точки зрения затрат на рабочую силу общая стоимость комплексной системы интеллектуального вождения ниже, чем стоимость комплексной системы, поскольку в комплексной системе всего несколько модулей. , и основной команды из 20-30 инженеров должно быть достаточно.

кроме того, мао цзимин отметил, что от традиционной модульной архитектуры к сквозной модели структура затрат на решения для интеллектуального вождения также изменится: затраты на рабочую силу большого количества экспертов по исследованиям и разработкам, которые пишут различные правила, перейдут на аспект данных. это хорошо для oem-производителей с возможностями массового производства. благодаря более низкой стоимости сбора данных общая стоимость решений для интеллектуального вождения фактически значительно снизится.

что касается инвестиций в вычислительную мощность, лу тяньчэн сказал, что в краткосрочной перспективе покупка чипов большой вычислительной мощности действительно приведет к увеличению текущих затрат. но в долгосрочной перспективе, как только сквозная технология станет зрелой и начнет применяться, первоначальные инвестиционные затраты постепенно уменьшатся.

инвестиции в чистую сквозную вычислительную мощность меньше, чем в модульную архитектуру, которая составляет как минимум 100–200 миллионов в год.

«если вы хотите, чтобы сквозная модель достигла относительно хорошего уровня обучения, вам потребуются как минимум 100–200 миллионов инвестиций в вычислительную мощность в год, а количество легковых автомобильных дорожек определенно будет еще более впечатляющим. ."

по словам ван паньцюя, требуемая сквозная вычислительная мощность делится на два аспекта: обучение и развертывание. развертывание эквивалентно тому, сколько контроллеров домена необходимо приобрести. эта стоимость фиксирована и относительно невелика по сравнению со стоимостью одного автомобиля. наибольшие затраты — это стоимость обучения, которую можно разделить на два типа: самостоятельное создание и приобретение карт или сотрудничество с поставщиками облачных услуг. для автомобильных компаний с относительно большими заказами создание собственных центров обработки данных является экономически эффективным вариантом, но для автомобильных компаний с менее крупными заказами или на ранних стадиях исследований и разработок лучшим выбором будет аренда серверов у поставщиков облачных услуг;

ранее лан сяньпэн, вице-президент по интеллектуальному вождению компании li auto, публично сообщил, что в настоящее время li auto ежегодно тратит 1 миллиард юаней на обучение вычислительной мощности, и ожидается, что в будущем она будет тратить 1 миллиард долларов сша каждый год. «если мы не сможем тратить 1 миллиард долларов сша в год на обучение, мы можем вылететь из будущих соревнований по автономному вождению».

что касается масштаба вычислительной мощности, лу тяньчэн считает, что если это просто сквозное обучение модели автономного вождения, то его смогут поддержать сотни графических процессоров с большой вычислительной мощностью. если потребуются долгосрочные инвестиции и будет обеспечено сквозное качество, масштаб обучающих вычислительных мощностей каждой компании по автономному вождению в основном будет на уровне тысяч калорий, и автомобильные компании будут инвестировать больше.

мао цзимин привел более конкретные требования к сквозной вычислительной мощности: для всей системы требуется как минимум два nvidia orin или один nvidia thor. он сказал, что требования к вычислительной мощности чистой сквозной системы меньше, чем общие требования к вычислительной мощности модульной архитектуры. однако, помимо основной системы, сквозная система массового производства часто имеет обходную систему. , а его требования к вычислительной мощности в целом такие же, как и у предыдущей модульной архитектуры. архитектурно эквивалент.

однако ван паньцю считает, что с увеличением возможностей вычислительных чипов на стороне транспортных средств вычислительная мощность не станет препятствием для сквозного внедрения в будущем. лу тяньчэн придерживается той же точки зрения, говоря, что от классической архитектуры к сквозной общее количество кодов будет значительно сокращено, а потребление вычислительных ресурсов, обеспечиваемое сквозной нейронной сетью, не обязательно будет значительно меньше. улучшен по сравнению с моделью bev.

«стремление к более высокой вычислительной мощности обусловлено скорее улучшением параметров модели и ее производительностью, а не сквозным преобразованием». соответствующие компании должны больше думать. самое главное — как в полной мере использовать существующие вычислительные ресурсы чипов для повышения эффективности использования.

новости

расходы в 1 миллиард долларов в год — это только начало. могут ли «мифические» сквозные «лучшие практики» в области автономного вождения в китае принести прибыль?

введение

моя контактная информация