Вэй Сяоли из конца в конец: разные формы, но радости и печали переплетаются
2024-08-19
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
В китайском Интернете Маска часто высмеивают как «Первородного Бога».ТеслаБез открытого исходного кода Китай не сможет создать чистый электромобиль», — ненавидит страну партия.Однако в области интеллектуального вождения Tesla действительно долгое время играла роль маяка, указывающего направление перспектив отрасли, проводя День искусственного интеллекта для обмена техническими подробностями (примечание: маяков может быть более одного).Но начиная с прошлого года Tesla отменила AI Day и только объявила о технологическом прогрессе и больше не говорила о технологическом внедрении. Что осталось для внешнего мира, так это частые хорошие новости о том, что FSD использует комплексные технические решения. В этом году различные компании, занимающиеся интеллектуальным вождением, открыли комплексные упражнения, данные Теслой, и внезапно обнаружили в колонке ответов строку маленьких слов: Решите проблему.Процесс опущен.Как сделать сквозные без справочных ответов? Подкреплены ли исследования и разработки комплексного интеллектуального вождения разумной бизнес-моделью?Впервые вопрос был задан Вэй Сяоли, представителю новых сил автомобилестроения.01
Откройте черный ящик
С прошлого года по первую половину этого года основной темой соревнований среди отечественных игроков в области умного вождения было соревнование за скорость открытия города с тактикой «моря людей» в рамках традиционной модульной технологической архитектуры.В ходе этого процесса команда умных водителей Вэй Сяоли расширилась до тысячи человек (или более), которые день и ночь обучают, тестируют и проверяют, чтобы преодолеть угловой случай.Tesla FSD проверила сквозной эффект, дав каждому возможность освободиться от дублирования работы.Но цена заключается в том, что каждый модуль традиционного стека технологий интеллектуального вождения может быть протестирован и проверен, в то время как комплексная система интеллектуального вождения представляет собой черный ящик, которому известны только результаты, но не процесс.Вэй Сяоли движется в направлении сквозного подхода, и общие проблемы, с которыми они сталкиваются, следующие:В функции с жесткими требованиями безопасности, такой как умное вождение, полный черный ящик недопустим. Необходимо найти способ открыть этот черный ящик и понять, «почему система хочет это сделать», или хотя бы сделать его вывод относительно. контролируемый.СяопэнВыбором является сегментированный сквозной прогрессивный маршрут, а его техническим решением является перцептивная нейронная сеть XNet + нейронная сеть планирования XPlanner + модель визуального языка XBrain, которая фокусируется на понимании сцены.Xpeng сегментирован от начала до конца
В сквозной технологической цепочке сегментированная сквозная технологическая цепочка в настоящее время находится ниже по течению.Радикалы считают, что сегментированная сквозная обработка по-прежнему не выходит за рамки традиционных решений. Хотя и восприятие, и планирование реализовали нейронные сети, один ключевой момент не изменился — интерфейс, соединяющий две нейронные сети, по-прежнему остается человеческим. определенный интерфейс. Это означает потерю информации и большое количество ручных аннотаций. Весь процесс не способствует глобальной оптимизации и автоматизации.Но преимущества сегментированного сквозного соединения также имеются: существуют интерфейсы, определяемые человеком, а это означает, что на выходе будут промежуточные результаты, понятные человеку, что удобно для проверки и обнаружения проблем и не повлияет на весь организм. , например, при обнаружении проблем. Нет необходимости переобучать всю сеть. Совместное обучение двух меньших моделей менее сложно и требует меньше вычислительных ресурсов, чем обучение одной большой сквозной модели.Что еще более важно, этот метод теоретически легче поддерживать нижний предел интеллектуальных характеристик вождения.30 июля, после запуска системы интеллектуального вождения Xpeng XNGP, которая была полностью открыта по всей стране, Хэ Сяопэн сказал: «Здания нужно строить слой за слоем. Возможно, развитие возможно семимильными шагами, но риск будет чрезвычайно велик. высокий."Это предложение было истолковано как наставление дружественным бизнесменам.В начале июля на своей летней конференции Lili представила разрабатываемое одноэтапное комплексное решение: 4D One Model end-to-end. При одноэтапном сквозном восприятии и планировании упаковываются в нейронную сеть с сотнями миллионов параметров, а важнейшими данными обучения становятся видеоролики опытных водителей. Это решение поддерживает передачу информации без потерь и имеет более высокую степень автоматизации потока данных. Оно более радикально, чем сквозные решения Xiaopeng и Huawei.Однако у этого сквозного решения есть такие проблемы, как слабое обобщение, плохая интерпретируемость и нестабильные нижние пределы. По этой причине Ideal подключил к конечному результату VLM (модель Vision-Language) со шкалой в 2,2 миллиарда параметров. Концевая модель. Большая модель. Эта модель лучше понимает сложные сцены дорожного движения и текстовые знаки дорожного движения и может служить основой для принятия решений по вождению в сквозной модели, улучшая производительность интеллектуальной системы вождения.идеальныйСквозной+VLMРешение для быстрой и медленной системы интеллектуального вожденияВ августе комплексное решение для быстрого и медленного двухсистемного интеллектуального вождения Ideal + VLM запустило внутреннее тестирование с участием тысячи человек для профессиональных пользователей, и официальные лица планируют запустить его для обычных пользователей в конце этого года или в начале следующего года. .До этого Ideal не лидировал по восприятию пользователями Zhijia, что негативно сказывалось на продажах (особенно на фонеСпроси мирчас). Комплекс End-to-end + VLM в идеале определяется как ключевая битва за интеллектуальное вождение, способность обгонять в поворотах и становиться в первый эшелон.В отличие,НИООн придерживается консервативного и радикального подхода к сквозному процессу.NIO консервативен в том смысле, что в настоящее время его сквозное использование очень ограничено и не используется для городского NoA, а только для функций активной безопасности. 11 июля NIO начал продвигать AEB с помощью комплексного решения для решения проблемы недостаточного покрытия сценариев AEB в традиционных решениях.Радикальная сторона NIO заключается в том, что интеллектуальное вождение, которое будет запущено позднее в этом году, похоже, готово пропустить нынешнюю популярную тенденцию сквозной адаптации и перейти непосредственно к следующему этапу: адаптации мировой модели.Мировая модель — это новейшая методология, найденная в индустрии умного вождения. На CVPR, крупнейшей конференции по искусственному интеллекту в 2023 году, Tesla продемонстрировала результаты исследований и разработок мировой модели Wayve.ai, стартап, известный в отрасли своей мировой моделью автономного вождения GAIA-1, привлек 1 миллиард долларов США. Май этого года.Изучив огромное количество реальных видео сцен вождения, модель мира может прогнозировать и генерировать видео сцен вождения в течение определенного времени в будущем, чтобы принимать правильные решения о вождении. Его суть – пространственно-временная дедукция. Это похоже на поведение человека при вождении. Опытные водители мысленно прогнозируют и делают выводы о поведении других участников дорожного движения и изменениях в дорожном потоке и на этой основе планируют действия по вождению.Что выходит за рамки нынешней сквозной модели мира, так это то, что ее основная задача — не только указать запланированный путь, но и «предсказать изменения пикселей в сцене вождения». Эта чрезвычайно сложная задача заставит модель не только изучить поведение отличных водителей, но и освоить обширные знания о дорожном движении и физике.То, что Вейлай предложил в NIO IN, — это еще более сложная «модель мира PLUS». Она более сложна и имеет больше выходных измерений, а это означает, что путем сравнения ее с истинным значением можно сформировать больше сигналов контроля, что ускоряет обучение нейронов. сетях, а также снизить уровень «черного ящика» работы системы. Но цена — более высокая сложность разработки.модель мира НИО,Есть многоВыходные данные задачи прогнозирования
Для справки: для обучения модели мира GAIA-1, которая используется только для демонстрации и выводит только запланированные пути и видео, Wayve.ai использовала 4700 часов видеоданных и обучалась в течение 15 дней со 160 блоками A100. Модель мира, которую NIO хочет обучить, требует данных и вычислительных ресурсов, которые более чем на порядок выше.После завершения обучения еще одной сложной проблемой становится то, как сжать и запихнуть сложную и огромную модель мира в Orin-X, который имеет очень ограниченную вычислительную мощность и пропускную способность, обеспечивая при этом точность и скорость работы.В настоящее время Вэй Сяоли, который впервые пробует сквозное соединение (даже если оно будет принято с осторожностью), ощущает эффект «повышения верхнего предела и понижения нижнего предела» сквозного перехода к различной степени.Например, последняя версия Xpeng, XNGP, получила беспрецедентные возможности разворота, но отзывы показали, что ее интеллектуальные характеристики вождения на высоких скоростях ухудшились.Комплексное решение + VLM компании Ideal, которое проходит внутреннее тестирование, имеет высокий верхний предел и нестабильный нижний предел.Комплексный AEB, предложенный NIO, не только позволяет избежать ложных срабатываний в нестандартных сценариях, таких как слепые зоны на поворотах, но и подвергся критике со стороны пользователей за увеличение ложного торможения.02
Исследования и разработки L4, перспективы L2?
Когда нижний предел трудно уловить, автомобильные компании неизменно обращаются к комплексному подходу, главным образом потому, что верхний предел сквозного подхода приведет к значительному улучшению пользовательского опыта и соответствующим бизнес-возможностям.Но по мере того, как автомобильные компании все активнее участвуют в сквозных проектах, в их головах остается вопрос: можно ли рассчитать соотношение затрат и результатов при разумном вождении?Чтобы продавать больше FSD, в марте этого года Tesla снизила цену подписки со 199 долларов США в месяц до 99 долларов США в месяц (цена выкупа была снижена с 12 000 долларов США до 8 000 долларов США). Однако в мае этого года зарубежное консалтинговое агентство проанализировало информацию о платежах по кредитным картам 3500 пользователей и пришло к выводу, что коэффициент конверсии FSD составляет всего 2%, что побудило Маска опровергнуть слухи о X, что «коэффициент конверсии далеко больше 2%, пожалуйста».Но более 2% недостаточно. Tesla строит суперкомпьютерный кластер на своем заводе в Техасе, объем производства которого, как ожидается, достигнет 100 000 карт H100/H200. При льготной цене в 25 000 долларов США за H100 капитальные затраты только на приобретение вычислительных карт превысят 2,5 миллиарда долларов США (их расширение). построить его как дата-центр и продолжать эксплуатировать выше) и стоитАбонентская плата FSD для 2,08 миллиона автомобилей Tesla на целый год。Бизнес-модель умного вождения отечественных автомобильных компаний еще менее оптимистична.Затраты Xiaopeng на исследования и разработки в области искусственного интеллекта в этом году составят 3,5 миллиарда юаней. В этом месяце компания Ideal установила порог финансирования интеллектуального вождения в размере 1 миллиарда долларов США. Однако как XNGP от Xpeng, так и NOA от Ideal входят в стандартную комплектацию высококлассных моделей. покупка. NIO не приняла бесплатную стратегию. Высококлассная функция умного вождения NOP+ стоит 380 юаней в месяц. На короткое время она принесла доход, но теперь новые автомобили поставляются с 1-2-летним периодом бесплатного использования NOP+.Включая Tesla, интеллектуальное вождение высокого класса в стране и за рубежом все еще находится на стадии убытков и зарабатывания денег.Противоречие заключается в том, что после вступления в конкуренцию с городским NOA и перехода к сквозной парадигме интенсивность исследований и разработок интеллектуального вождения этих компаний фактически была ориентирована на автономное вождение L3 и даже L4, но основной рынок по-прежнему считает их ценность «не стоящими дополнительных затрат на программное обеспечение».Чтобы устранить этот «разрыв между ожидаемой и фактической стоимостью», наиболее многообещающим способом является выход на крупнейший рынок автономного вождения L4 — Robotaxi.В 2018 году Morgan Stanley оценил Robotaxi Waymo в 80 миллиардов долларов США. Самый большой поклонник Маска, Му Цзе из Ark Investment, в июне этого года дал прогноз, что выручка Tesla Robotaxi «по консервативным оценкам» достигнет 603 миллиардов долларов США в 2029 году, что увеличит рыночную стоимость Tesla к тому времени до 7 триллионов долларов.До этого Маск объявил в Твиттере, что в августе запустит модель Роботакси (ужеперенесено на 10 октября).03
Доходы от бизнеса еще не были чудеснымиДелать «Роботакси» или нет, стал горячим вопросом перед Вэй Сяоли в этом году.Для Xpeng, наиболее близкого к Tesla, ответ — ДА. В июле Хэ Сяопэн публично заявил, что Xpeng Motors запустит Robotaxi в 2026 году.Хэ Сяопэн считает, что аппаратные требования Robotaxi гораздо сложнее, чем предполагалось, но комбинация комплексных алгоритмов программного обеспечения и больших моделей, которая может быстро расти, достаточна для решения проблемы автономного вождения L4. Цель Хэ Сяопина для команды состоит в том, чтобы во второй половине 2025 года опыт XNGP был сопоставлен с Robotaxi от Google Waymo.Однако производство автомобилей само по себе уже является бизнесом с тяжелыми активами, поскольку строится большое количество роботакси и эксплуатируетсяПлатформа для вызова беспилотных такси бесконечно удлинит бизнес-цепочку и цикл возврата инвестиций.В этом году Google инвестировала в Waymo 5 миллиардов долларов США, и Xpeng не может быть таким богатым.С июня по июль Хэ Сяопэн посетил генерального директора Didi Ченг Вэя и генерального директора Uber Дару Хосровшахи. Он сказал, что Xpeng не хочет управлять Robotaxi, но надеется экспортировать модели и технологии автономного вождения глобальным партнерам.Роботакси Uber теперь сотрудничает с Hyundai
Подход автомобильных компаний к комплексному роботакси вызвал негативную реакцию со стороны многих практиков автономного вождения L4, в том числе бывшего генерального директора TuSimple Хоу Сяоди, технического директора Pony.ai Лу Тяньчэна и президента Цинчжоу Чжихан Хоу Цуна. Некоторые из них гневно раскритиковали сквозную мифологию автомобильных компаний, а некоторые заявили, что соответствующие системы возможностей автомобильных компаний не являются надежными, но основные аргументы остаются прежними:Хотя автомобильные компании в области интеллектуального вождения высокого класса быстро развиваются, они, по сути, разрабатываются в рамках вспомогательного вождения. Основные цели, которые вызывают беспокойство, — это удобство использования и стоимость. Самым важным для Robotaxi является надежность и безопасность. Из-за разных целей им сложно использовать одно и то же программное и аппаратное обеспечение, а автомобильным компаниям сложно плавно перейти от интеллектуального вождения высокого класса к роботакси [1][2][3].Это играет на сердце Ли Биня. В интервью от 27 июляОн ясно дал понять, что «не считает Роботакси захватывающим достижением или бизнес-моделью», и сердито сказал:«Ценность умного вождения не в том, чтобы исключить тяжелую работу современных шоферов и таксистов».Другая причина, по которой он не испытывает оптимизма по поводу роботакси, заключается в том, чтоИз-за ограниченных дорожных ресурсов и государственного регулирования роботакси не может запускаться неограниченно, что затрудняет создание бизнес-модели с высокой маржинальной прибылью, такой как облачные сервисы программного обеспечения.Ли Бинь всегда настаивал на том, что люди захотят иметь собственный автомобиль, поэтому цель NIO Smart Driving — помочь водителям высвободить энергию и снизить количество аварий. Ключевое слово бизнес-направления — эффект масштаба — продажа большего количества автомобилей. обычные пользователи, а также пользователи с достаточной платой за подписку будут взимать плату за подписку за интеллектуальное вождение высокого класса, что снижает затраты и увеличивает доход.Однако перед лицом дорогостоящего интеллектуального вождения совокупное количество пользователей NIO, составляющее менее 600 000, по-прежнему недостаточно, и экспорт возможностей интеллектуального вождения стал вариантом. Жэнь Шаоцин, человек, отвечающий за интеллектуальное вождение NIO, недавно выразил готовность NIO впервые открыть свои решения для интеллектуального вождения другим автомобильным компаниям, точно так же, как NIO открыта к замене аккумуляторов.Напротив, для Чжицзя «технические суждения Ли Сяна радикальны, а бизнес-стратегия консервативна».В этом году на Автомобильном форуме в Чунцине Ли Сян заявил, что сочетание комплексной системы + VLM позволит достичь уровня автономного вождения L4 в течение трех лет. Но разница в том, что Ideal никогда не думал о бизнесе «Роботакси». Даже до сих пор компания Ideal не проявила никакого интереса к взиманию платы за программное обеспечение для умного вождения. Логотип на ее официальном сайте по-прежнему гласит: «Умное вождение для всех сценариев, нулевая абонентская плата на всю жизнь».Это связано с идеальной конкурентной ситуацией. В прошлом году идеалы столкнулисьХунмэн Чжисин, продажи оказались под значительным давлением. Самым острым копьем Хунмэн Чжисина являются интеллектуальные возможности вождения ADS от Huawei.В то время, когда Хунмэн Чжисин набирает обороты с помощью Huawei ADS 3.0 (цена выкупа составляет около 10 000 юаней) во всех сферах жизни, что еще больше оказывает давление на Ideal, интеллектуальный диск Ideal AD MAX, который проще в использовании, чем раньше, но бесплатен, может помочь захватите больше Несколько заказов. В отличие от Xpeng и NIO, идеальный KPI для разумного вождения — не получение операционного дохода, а обслуживание продаж.Однако, поскольку отечественная автомобильная промышленность выходит на стадию нокаута, бизнес Вэй Сяоли по умному вождению не может оставаться в состоянии поиска друзей в течение длительного времени.Стоимость карты обучения начинается от 100 000 юаней, а стоимость рабочей силы команды из тысячи человек — от 1 миллиарда в год. Будучи одним из самых дорогих предприятий Вэй Сяоли, Чжицзя встал на более ресурсоемкий путь для достижения больших результатов. успех, но он все еще полон неуверенности в том, сможет ли он также пожинать плоды чудесных усилий.[1] Хоу Сяоди, осторожный храбрый человек, Цзяцзы Гуаннянь
[2] Разговор с Лу Тяньчэном о Роботакси: «Чем мощнее L2, тем дальше он от L4», Tencent Auto
[3] Tesla делает роботакси простым | Разговор с Хоу Цуном, соучредителем Qingzhou Zhihang, Yunjian Insight