notícias

Motoristas de táxi, não entrem em pânico. Os programadores do setor de direção inteligente perderão seus empregos para a IA mais cedo.

2024-07-17

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


O “momento GPT” da direção inteligente já chegou?


Autor | Cao Siqi
editar|

Cada nova tecnologia passará por diferentes estágios, desde o nascimento até a promoção, e também enfrentará diversas vozes. Para encontrar a solução técnica ideal, os desenvolvedores podem desistir de anos de esforços, enquanto as organizações comerciais estão mais focadas em avaliar o momento da implementação da tecnologia, a fim de maximizar os benefícios no momento certo;

Em relação à condução inteligente, os fabricantes nacionais já tiveram profundas diferenças cognitivas. Os defensores acreditam que isso pode trazer uma experiência “muito avançada”, enquanto os oponentes expressaram seu desdém fazendo comentários como “é um fedor de tecnologia” e “a direção autônoma é uma farsa”.

Em 2024, com o lançamento oficial da versão FSD V12 do software de direção inteligente da Tesla baseado em "ponta a ponta", as atitudes das montadoras chinesas em relação à direção inteligente finalmente começaram a convergir.

Tomando como exemplo Wei Xiaoli, um representante das novas forças na fabricação de automóveis, várias empresas começaram claramente a buscar tecnologia "ponta a ponta".

Xiaopeng propôs introduzir grandes modelos ponta a ponta em sistemas de direção inteligentes e afirmou que investirá 4,2 bilhões de yuans em inteligência e dados de treinamento este ano, com o objetivo de alcançar "OTA interna uma vez a cada dois dias" no futuro. Esta é uma melhoria de eficiência inimaginável no passado, que dependia de humanos para manter centenas de milhares de linhas de código de direção inteligente.

A NIO também reestruturou recentemente seu departamento de P&D de direção inteligente, fundindo as equipes tradicionais de percepção e escala em grandes equipes modelo. O núcleo também é promover iterações de paradigma baseadas em redes neurais.

Mesmo o ideal que no passado foi ridicularizado como “escolha de fábrica” tem sido frequentemente utilizado para impulsionar a investigação e o desenvolvimento inteligentes nos últimos tempos. O CEO Li Xiang desenvolveu pessoalmente a plataforma de pesquisa e desenvolvimento "ponta a ponta" e apresentou a teoria do pensamento rápido-lento dos economistas do Nobel para ilustrar que sua equipe encontrou uma maneira de resolver o caso conner da direção autônoma.

Então, por que é tão mágico permitir que vários fabricantes passem do não-consenso para o consenso de ponta a ponta? Como mudou o paradigma da indústria da condução inteligente e que oportunidades e ajustes trará?

01

O momento GPT para uma condução inteligente chegou

Uma razão importante pela qual os fabricantes nacionais formaram rapidamente um consenso é que a Tesla assumiu a liderança no fornecimento de uma invejável folha de respostas de ponta a ponta.

Em março deste ano, a Tesla lançou oficialmente a versão FSD V12.3 do software de direção inteligente. A maior mudança nesta versão é mudar o poder de todo o sistema de direção inteligente, do código escrito por humanos para um grande modelo de IA baseado em redes neurais. Musk usa "Video in to Control out" para descrever este novo paradigma de trabalho, ou seja: a IA gera diretamente as operações de direção com base nas informações rodoviárias que "vê", o que é frequentemente chamado de "ponta a ponta" na indústria -. até o fim).

No mês passado, He Xiaopeng experimentou a versão FSD V12.3.6 na Califórnia. Em suas palavras, o FSD “lida com muitas condições de estrada com muita suavidade”. Esta é a maior vantagem das redes neurais de IA em comparação com as baseadas em código: podem melhorar significativamente as capacidades de aprendizagem generalizada dos sistemas de condução inteligentes em diferentes cidades e sob diferentes condições de estrada.

Traduzido em uma frase publicitária e de marketing mais familiar aos consumidores domésticos, é: pode ser aberto em todo o país (globalmente).


Huawei lançou o slogan “Disponível em todo o país” em setembro do ano passado Fonte: Geek Park |

É claro que esta conclusão é apenas um bom desejo nesta fase. No processo de operação real, também requer a bênção e o treinamento completos da infraestrutura de IA, como dados, algoritmos e poder de computação, para chegar perto do objetivo de "a IA se tornar tão inteligente quanto os motoristas humanos".

Mas para os pares, a versão FSD V12 significa muito. Ele verifica que as redes neurais podem realmente substituir o código escrito por humanos e até fazê-lo melhor e com mais eficiência.

Isso significa que não há necessidade de esperar N anos, o momento ChatGPT na indústria de direção inteligente realmente chegou. Pense no que Ali Zhang Yong disse uma vez: vale a pena refazer todo software com IA. O FSD V12 deu aos pares uma nova direção e confiança: todas as pilhas de tecnologia de condução inteligente podem ser refeitas de ponta a ponta.

Quando a versão beta do FSD V12 foi lançada, Musk disse que esta versão comprimia as 300.000 linhas de código da versão anterior para 2.000 linhas, o que equivale a menos de um por cento.

A competição de condução inteligente na nova pilha de tecnologia não evoluirá para mais jogos anti-inovação e involução do que qualquer outra pessoa. Se a eficiência da IA ​​puder realmente atingir o que He Xiaopeng disse ser um OTA interno a cada dois dias, então a tática do mar humano de escrever regras uma por uma e corrigir bugs pode ser declarada completamente obsoleta.

Então, a indústria de direção inteligente ainda precisa de tantos programadores? O autor não pode dar uma resposta precisa, mas o certo é que o conteúdo do trabalho dos programadores de direção inteligente também sofrerá uma série de mudanças. Os programadores que só conseguem escrever regras caso contrário provavelmente serão substituídos pela IA antes dos motoristas de táxi e de carona on-line.

02

preso em dados

No "Relatório de pesquisa da indústria de direção autônoma de ponta a ponta", divulgado pela instituição de investimento Chentao Capital no mês passado, apenas 13% dos mais de 30 entrevistados na indústria de direção autônoma expressaram uma atitude relativamente cautelosa de "esperar para ver" em relação ao fim tecnologia ponta a ponta, e os demais expressaram uma atitude mais positiva de “pré-pesquisa” ou mesmo de “compromisso total”. De ponta a ponta tornou-se um consenso entre os profissionais do setor.

Mas, na verdade, atualmente não existe nenhuma empresa (incluindo a Tesla) que possa alcançar o “fundamentalismo de ponta a ponta”. Ou seja, todos os aspectos da condução autônoma estão concentrados no mesmo modelo grande para realmente alcançar os mesmos "sinais visuais de entrada e operações de pedal e volante de saída" que os humanos.

Os principais esforços da maioria dos OEMs nacionais nesta fase são abrir os módulos de percepção e tomada de decisão. A chave para isso é cancelar a definição manual de resultados entre módulos e usar vetores de recursos para transmitir informações sem perdas.


Diagrama esquemático da evolução da arquitetura da direção autônoma ponta a ponta Fonte da imagem: Chentao Capital |

Antes de ponta a ponta, a arquitetura tradicional de direção autônoma originou-se no campo da robótica e foi dividida em diferentes módulos, como percepção, planejamento e controle. Diferentes módulos são desenvolvidos por diferentes equipes e as informações são transferidas principalmente entre módulos por meio de interfaces definidas manualmente. Para dar o exemplo mais simples, o fenômeno de um veículo estar atravessando a linha pode ser representado no módulo de percepção tradicional usando a linguagem binária de computador mais simples.

O maior benefício de abrir os módulos de percepção e tomada de decisão é que ele pode cobrir mais “cenas em tons de cinza” que não podem ser descritas com precisão pelas regras do mundo real. Por exemplo, quando você está dirigindo, você não precisa saber a velocidade precisa do carro da frente ou se ele está cruzando a linha. Você só precisa prestar atenção às mudanças de posição relativa.

Nesta base, com base na teoria da IA ​​generativa, espera-se que o modelo de rede neural também possa gerar inteligência após uma grande quantidade de entradas e se tornar um agente de IA.

A base de tudo isso vem dos dados, que são o material de treinamento “alimentado” ao modelo. No entanto, ao contrário dos grandes modelos de linguagem baseados em texto, não é fácil para os modelos de condução inteligentes encontrar dados de vídeo públicos suficientes como materiais de treinamento.

O mencionado "Relatório de Pesquisa da Indústria de Condução Autônoma de Ponta a Ponta" mostra que o maior conjunto de dados públicos atualmente possui apenas 1.200 horas de dados. De acordo com Musk, em 2023, a Tesla investiu quase 40.000 horas de treinamento em vídeo nos estágios iniciais de ponta a ponta.

Em comparação com outras montadoras, a principal vantagem dos dados da Tesla reside no grande número de carros produzidos em massa.

Atualmente, a Tesla entregou mais de 6 milhões de veículos em todo o mundo. No entanto, entre as novas forças da China que implementam ativamente a condução inteligente, o número de veículos produzidos em massa é apenas uma fração do da Tesla. Juntamente com o SKU minimalista consistente e o hardware de condução inteligente totalmente pré-integrado, a coleta de dados se torna mais fácil.

A prática comum anterior na China geralmente dependia da aquisição manual de informações rodoviárias. No entanto, para treinar um modelo inteligente de ponta a ponta, você também precisa tentar cobrir dados suficientes de cenários extremos (casos conner). Como a ocorrência de cenas de borda é muito aleatória, alguns fabricantes afirmaram que apenas cerca de 2% dos dados limitados podem ser obtidos apenas pela coleta manual de dados.

Além disso, em comparação com a Tesla, os fabricantes nacionais costumam ter SKUs mais complexos. Entre diferentes modelos, devido a diferenças no tamanho do veículo, layout do sensor, etc., os parâmetros relevantes no modelo também precisam ser realinhados.

Tomando a série Huawei como exemplo, Hongmeng Zhixing demonstrou fortes capacidades de vendas de terminais no ano passado. No entanto, para diferentes marcas e modelos de serviços de BU de automóveis da Huawei, os engenheiros ainda são necessários após a implementação de ponta a ponta. trabalho de alinhamento e entrega. O mesmo vale para Weilai, que possui 2 marcas e 9 modelos. Eles reorganizaram a equipe de integração em equipe de entrega.


Após o lançamento de Sora, Musk twittou que Tesla usa IA para simular direção no mundo real |

Há uma visão de que os produtos de vídeo Wensheng representados pela Sora podem se tornar a fonte de material para modelos ponta a ponta. Mas mesmo para Musk, treinar IA com conteúdo gerado por IA ainda não foi reconhecido publicamente. Afinal, os dados são muito importantes para o treinamento do modelo. Você sabe, Musk, que sempre foi extremamente mesquinho com os custos trabalhistas, também contratou uma equipe de 1.000 pessoas em Nova York para anotar os dados de vídeo rodoviário de Tesla.

03

Não seja “levado para a vala” por Musk

Parece que mudar de ponta a ponta é algo natural, mas excluir 300.000 linhas de código e desmantelar e reorganizar a estrutura organizacional anterior definitivamente não é uma decisão fácil de tomar. Na verdade, até Musk embarcou nesse caminho por acidente. O engenheiro que lhe propôs pela primeira vez no final de 2022 aprender ChatGPT para construir uma rede neural de condução inteligente foi quase transferido por Lao Ma para resolver outros problemas após a aquisição do Twitter.

Depois de treinar o modelo ponta a ponta, o sistema de suporte correspondente (incluindo poder computacional, etc.) também deve ser suficientemente eficiente. Em entrevista ao "Tencent Deep Web", Ren Shaoqing, vice-presidente de pesquisa e desenvolvimento de direção inteligente da NIO, disse que forçar serviços ponta a ponta sem recursos básicos é o mesmo que usar "veneno".

Ele disse: "Se sua estrutura de código original for clara o suficiente, seu volume de teste (de depuração) pode ser de apenas 1%. Costumava levar três dias para testar novamente 1%, mas agora sinto muito, você precisa testar novamente 100% em três dias. Portanto, seu sistema de verificação de dados deve ser eficiente o suficiente.”

Mas não se deixe levar diretamente para a vala pela Tesla. O ponta a ponta neste momento apenas prova que tem a possibilidade de melhorar a eficiência do trabalho, mas não prova que é a solução definitiva para a condução autónoma.

Isto é consistente com o entendimento da indústria sobre se a Lei de Escala pode levar à AGI (Inteligência Artificial Geral) no mundo físico: é certo que a inteligência artificial generativa pode ter inteligência superior, mas se pode compreender as leis físicas e automaticamente Para aplicações na condução , robótica e outras áreas, não existem regras na comunidade acadêmica. No "Relatório de Pesquisa da Indústria de Condução Autônoma de Ponta a Ponta", mais da metade dos profissionais não acreditam que de ponta a ponta seja a solução definitiva para a tecnologia de direção autônoma.

Para os OEM que desenvolvem a sua própria condução inteligente, a abordagem mais pragmática nesta fase é confiar na implementação ponta a ponta das capacidades de condução inteligente da forma mais rápida, fácil e económica possível. Quanto à assinatura do software de direção inteligente, a viagem pode ser mais longa. Afinal, no mercado chinês, o hardware costuma vender melhor do que software e serviços.

É claro que há uma grande probabilidade de que poucas pessoas queiram se tornar jogadores inovadores como Musk. Se você deixar um bom modelo de baixo custo sem pesquisa e desenvolvimento e fizer uma grande aposta no Robotaxi, o valor de mercado cairá centenas de bilhões de dólares se o lançamento for adiado. Os jogadores mais comuns só esperam que, equipado com software de direção inteligente de ponta a ponta, ele possa ajudar o hardware a vender melhor. Claro, se puder ser vendido mais caro, isso seria a coisa mais maravilhosa.

*Fonte da imagem do cabeçalho: Visual China

Este artigo é um artigo original de Geek Park. Para reimpressão, entre em contato com Geek Jun no WeChat geekparkGO.

Geek perguntou

O papel dos programadores na futura indústria de direção inteligente,

Que mudanças podem ocorrer?

16 de julho. Lei Jun postou: Às 19h do dia 19 de julho, nesta sexta-feira à noite, farei o 5º discurso anual de Lei Jun. O tema é “Coragem” e falarei sobre os meandros da construção de um carro e os altos e baixos de. últimos três anos.

Curta e sigaConta de vídeo do Geek Park