Новости

Таксисты, не паникуйте. Программисты в индустрии умного вождения быстрее потеряют работу из-за ИИ.

2024-07-17

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Наступил ли уже «момент GPT» умного вождения?


Автор | Цао Сыци
редактировать|

Каждая новая технология проходит разные стадии от рождения до продвижения, а также сталкивается с разными мнениями. Чтобы найти оптимальное техническое решение, разработчики могут отказаться от многих лет напряженной работы, в то время как коммерческие организации больше сосредоточены на оценке сроков внедрения технологии, чтобы получить максимальную выгоду в нужный момент.

Что касается интеллектуального вождения, у отечественных производителей хостов когда-то были глубокие когнитивные различия. Сторонники считают, что это может принести опыт «далеко вперед», в то время как противники выражают свое презрение, делая такие замечания, как «техническая вонь» и «автономное вождение — это мошенничество».

В 2024 году, с официальным запуском версии FSD V12 программного обеспечения для интеллектуального вождения Tesla, основанного на «сквозной схеме», отношение китайских автопроизводителей к интеллектуальному вождению наконец начало сходиться.

Взяв за пример Вэй Сяоли, представителя новых сил в автомобилестроении, различные компании явно начали внедрять «сквозные» технологии.

Компания Xiaopeng предложила внедрить сквозные большие модели в интеллектуальные системы вождения и заявила, что в этом году она инвестирует 4,2 миллиарда юаней в разведку и данные обучения с целью достижения «внутреннего OTA один раз в два дня» в будущем. Это повышение эффективности, которое было невозможно себе представить в прошлом, когда люди полагались на поддержку сотен тысяч строк интеллектуального кода вождения.

NIO также недавно реструктурировала свой отдел исследований и разработок в области интеллектуального вождения, объединив традиционные команды по восприятию и масштабированию в большие команды по моделированию. Основная задача также заключается в продвижении итераций парадигмы на основе нейронных сетей.

Даже идеал, который в прошлом высмеивали как «заводской сбор», в последнее время часто используется для придания импульса интеллектуальным исследованиям и разработкам. Генеральный директор Ли Сян лично разработал «сквозную» платформу исследований и разработок и представил теорию быстрого и медленного мышления нобелевских экономистов, чтобы проиллюстрировать, что его команда нашла способ решить проблему автономного вождения.

Так почему же это так волшебно — позволить различным производителям переходить от отсутствия консенсуса к консенсусу? Как это изменило парадигму индустрии интеллектуального вождения и какие возможности и коррективы это принесет?

01

Наступил момент GPT для разумного вождения

Важная причина, по которой отечественные производители быстро пришли к консенсусу, заключается в том, что Tesla взяла на себя инициативу в предоставлении завидного комплексного листа ответов.

В марте этого года Tesla официально выпустила версию программного обеспечения для интеллектуального вождения FSD V12.3. Самым большим изменением в этой версии является переключение всей интеллектуальной системы вождения с кода, написанного людьми, на большую модель искусственного интеллекта, основанную на нейронных сетях. Маск использует «Вход видео для управления выходом», чтобы описать эту новую рабочую парадигму, а именно: ИИ напрямую выводит операции вождения на основе дорожной информации, которую он «видит», что в отрасли часто называют «сквозным». в конец).

В прошлом месяце Хэ Сяопэн испытал версию FSD V12.3.6 в Калифорнии. По его словам, FSD "очень плавно справляется со многими дорожными условиями". Это самое большое преимущество нейронных сетей искусственного интеллекта по сравнению с сетями, управляемыми кодом: они могут значительно улучшить возможности обобщенного обучения интеллектуальных систем вождения в разных городах и в разных дорожных условиях.

В переводе на рекламно-маркетинговую фразу, более знакомую отечественному потребителю, это так: его можно открыть по всей стране (глобально).


Huawei запустила слоган «Доступно по всей стране» в сентябре прошлого года Источник: Geek Park |

Конечно, на данном этапе этот вывод — всего лишь доброе пожелание. В реальном процессе работы также требуется полная поддержка и обучение инфраструктуры ИИ, такой как данные, алгоритмы и вычислительная мощность, чтобы приблизиться к цели: «ИИ станет таким же умным, как водитель-человек».

Но для аналогов версия FSD V12 значит очень многое. Он подтверждает, что нейронные сети действительно могут заменить написанный человеком код и даже делать это лучше и эффективнее.

Это означает, что не нужно ждать N лет, момент ChatGPT в индустрии интеллектуального вождения действительно наступил. Подумайте о том, что однажды сказал Али Чжан Юн: «Все программное обеспечение стоит переделать с помощью ИИ». FSD V12 дал коллегам новое направление и уверенность: все комплексы технологий интеллектуального вождения можно полностью переделать.

Когда была выпущена бета-версия FSD V12, Маск сказал, что эта версия сжала 300 000 строк кода предыдущей версии до 2 000 строк, что эквивалентно менее чем одному проценту.

Соревнования по умному вождению в новом стеке технологий не перерастут в более антиинновационные и инволюционные игры, чем все остальные. Если эффективность ИИ действительно сможет достичь того, что, по словам Хэ Сяопэна, является внутренним OTA каждые два дня, то человеческая морская тактика написания правил одно за другим и исправления ошибок может быть объявлена ​​полностью устаревшей.

Так индустрия умного вождения все еще нуждается в таком количестве программистов? Автор не может дать точный ответ, но можно с уверенностью сказать, что содержание работы программистов умного вождения также претерпит ряд изменений. Программисты, которые могут писать только правила if else, скорее всего, будут заменены ИИ раньше, чем водители такси и онлайн-заказчиков.

02

в ловушке данных

В «Отчете о комплексных исследованиях индустрии автономного вождения», опубликованном инвестиционной организацией Chentao Capital в прошлом месяце, только 13% из более чем 30 респондентов в индустрии автономного вождения выразили относительно осторожную выжидательную позицию в отношении конца. -до конца технологии, а остальные выразили более позитивный настрой «предварительных исследований» или даже «полного обязательства». Комплексное решение стало консенсусом среди практиков отрасли.

Но на самом деле в настоящее время не существует ни одной компании (включая Tesla), которая могла бы достичь «сквозного фундаментализма». То есть все аспекты автономного вождения сосредоточены в одной большой модели, чтобы действительно достичь тех же «входных визуальных сигналов и выходных операций педали и рулевого колеса», что и у людей.

Основные усилия большинства отечественных OEM-производителей на данном этапе направлены на открытие модулей восприятия и принятия решений. Ключом к этому является отказ от ручного определения результатов между модулями и использование векторов признаков для передачи информации без потерь.


Схематическая диаграмма эволюции архитектуры комплексного автономного вождения Источник изображения: Chentao Capital

До появления сквозного подхода традиционная архитектура автономного вождения зародилась в области робототехники и была разделена на различные модули, такие как восприятие, планирование и контроль. Разные модули разрабатываются разными командами, и информация в основном передается между модулями через определяемые вручную интерфейсы. В качестве простейшего примера можно представить явление того, пересекает ли транспортное средство линию, в традиционном модуле восприятия, используя простейший компьютерный двоичный язык.

Самым большим преимуществом открытия модулей восприятия и принятия решений является то, что они могут охватывать больше «сцен в оттенках серого», которые не могут быть точно описаны правилами в реальном мире. Например, когда вы едете, вам не нужно знать точную скорость автомобиля впереди или пересекает ли он линию. Вам нужно только обращать внимание на изменения относительного положения.

Исходя из этого, основываясь на теории генеративного ИИ, ожидается, что модель нейронной сети также сможет генерировать интеллект после большого количества входных данных и становиться агентом ИИ.

В основе всего этого лежат данные, которые представляют собой обучающий материал, «подаваемый» в модель. Однако, в отличие от больших текстовых языковых моделей, интеллектуальным моделям вождения нелегко найти достаточно общедоступных видеоданных в качестве учебных материалов.

Вышеупомянутый «Отчет о комплексных исследованиях отрасли автономного вождения» показывает, что самый большой общедоступный набор данных в настоящее время содержит только 1200 часов данных. По словам Маска, в 2023 году Tesla вложила почти 40 000 часов в видеообучение на ранних этапах сквозного обучения.

По сравнению с другими автомобильными компаниями главное преимущество данных Tesla заключается в большом количестве выпускаемых серийно автомобилей.

В настоящее время Tesla поставила более 6 миллионов автомобилей по всему миру. Однако среди новых сил Китая, активно внедряющих интеллектуальное вождение, количество автомобилей массового производства составляет лишь часть от Tesla. В сочетании с единым минималистским SKU и полностью встроенным интеллектуальным оборудованием для вождения сбор данных становится проще.

Предыдущая обычная практика в Китае обычно основывалась на ручном сборе дорожной информации. Однако для обучения умной сквозной модели также необходимо охватить достаточно данных из пограничных сценариев (коннер-кейсов). Поскольку возникновение краевых сцен носит случайный характер, некоторые производители заявляют, что только около 2% ограниченных данных можно получить только путем ручного сбора данных.

Кроме того, по сравнению с Tesla, отечественные производители зачастую имеют более сложные артикулы. Между разными моделями из-за различий в размерах транспортных средств, расположении датчиков и т. д. соответствующие параметры модели также необходимо перенастроить.

Взяв за пример серию Huawei, компания Hongmeng Zhixing продемонстрировала сильные возможности продаж терминалов за последний год или около того. Однако для различных марок и моделей автомобильных сервисов Huawei по-прежнему требуются инженеры после комплексного внедрения. работа по согласованию и доставке. То же самое относится и к Weilai, у которого есть 2 бренда и 9 моделей. Они реорганизовали команду интеграции в команду доставки.


После выпуска Sora Маск написал в Твиттере, что Tesla использует искусственный интеллект для имитации реального вождения. Источник изображения: снимок экрана X

Есть мнение, что видеопродукция Wensheng, представленная Sora, может стать источником материала для сквозных моделей. Но даже для Маска обучение ИИ с помощью контента, созданного ИИ, еще не получило публичного признания. В конце концов, данные слишком важны для обучения модели. Знаете, Маск, который всегда был крайне скуп на затраты на рабочую силу, также нанял команду из 1000 человек в Нью-Йорке для аннотирования дорожных видеоданных Tesla.

03

Не позволяйте Маску «завести в канаву»

Кажется, что переход на сквозной подход — это естественно, но удаление 300 000 строк кода, демонтаж и реорганизация прошлой организационной структуры — определенно непростое решение. На самом деле, даже Маск встал на этот путь случайно. Инженер, впервые предложивший ему в конце 2022 года изучить ChatGPT для построения нейронной сети интеллектуального вождения, был практически переведен Лао Ма для решения других задач после приобретения Twitter.

После обучения сквозной модели соответствующая система поддержки (включая вычислительные мощности и т. д.) также должна быть достаточно эффективной. В интервью Tencent Deep Web Жэнь Шаоцин, вице-президент по исследованиям и разработкам интеллектуального вождения NIO, заявил, что навязывание сквозных услуг без базовых возможностей эквивалентно использованию «яда».

Он сказал: «Если ваша исходная структура кода достаточно ясна, объем вашего (отладочного) теста может составлять всего 1%. Раньше вам требовалось три дня, чтобы повторно протестировать 1%, но теперь, извините, вам придется повторно протестировать 100%». через три дня. Итак. Ваша система проверки данных должна быть достаточно эффективной.

Но не позволяйте Тесле прямо сбить вас с пути. End-to-end в данный момент только доказывает, что у него есть возможность повысить эффективность работы, но не доказывает, что это окончательное решение для автономного вождения.

Это согласуется с пониманием отрасли того, может ли закон масштабирования привести к AGI (общему искусственному интеллекту) в физическом мире: несомненно, что генеративный искусственный интеллект может обладать более высоким интеллектом, но может ли он понимать физические законы и автоматически. Для приложений в вождении , робототехники и других областях, в академическом сообществе нет правил. В «Отчете о комплексных исследованиях в отрасли автономного вождения» более половины практиков не верят, что сквозное решение является окончательным решением для технологии автономного вождения.

Для OEM-производителей, которые разрабатывают собственные системы интеллектуального вождения, наиболее прагматичным подходом на данном этапе является ставка на комплексное внедрение возможностей интеллектуального вождения как можно быстрее, проще и с минимальными затратами. Что касается подписки на программное обеспечение для умного вождения, то это может занять более длительный путь. Ведь на китайском рынке оборудование часто продается лучше, чем программное обеспечение и услуги.

Конечно, существует высокая вероятность того, что не многие люди захотят стать такими новаторскими игроками, как Маск. Если оставить хорошую недорогую модель без исследований и разработок и сделать большую ставку на Роботакси, рыночная стоимость упадет на сотни миллиардов долларов, если релиз задержится. Большинство обычных игроков просто надеются, что, оснащенное комплексным программным обеспечением для интеллектуального вождения, оно поможет оборудованию продаваться лучше. Конечно, если бы его можно было продать подороже, это было бы самое замечательное.

*Источник изображения заголовка: Visual China.

Эта статья является оригинальной статьей Гика Пака. Для перепечатки свяжитесь с Гиком Джуном в WeChat geekparkGO.

Компьютерщик спросил

Роль программистов в индустрии интеллектуального вождения будущего.

Какие изменения могут произойти?

16 июля. Лэй Цзюнь написал: 19 июля, в эту пятницу вечером, в 19:00 я проведу пятую ежегодную речь Лэй Цзюня. Тема — «Мужество», и я расскажу о тонкостях создания автомобиля, а также о взлетах и ​​падениях. последние три года.

Ставьте лайк и подписывайтесьВидеоаккаунт Geek Park