Wei Xiaoli de ponta a ponta: formas diferentes, mas as alegrias e tristezas estão interligadas
2024-08-19
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Na Internet chinesa, Musk é frequentemente ridicularizado como o "Deus Original" para zombar "TeslaSem código aberto, a China não será capaz de construir um carro elétrico puro”, afirmou o partido que odeia o país.No entanto, no campo da condução inteligente, a Tesla tem desempenhado um papel de farol na direção das perspectivas da indústria por um longo tempo, realizando o AI Day para compartilhar detalhes técnicos (nota: pode haver mais de um farol).Mas a partir do ano passado, Tesla cancelou o AI Day e apenas anunciou o progresso tecnológico e não falou mais sobre implementação tecnológica. O que restou para o mundo exterior foram as frequentes boas notícias do FSD usando soluções técnicas de ponta a ponta. Este ano, várias empresas de direção inteligente abriram os exercícios completos dados pela Tesla e, de repente, encontraram uma linha de pequenas palavras na coluna de resposta: Resolva o problemaO processo é omitido.Como fazer de ponta a ponta sem respostas de referência? A investigação e o desenvolvimento da condução inteligente de ponta a ponta são apoiados por um modelo de negócio razoável?A questão foi colocada primeiro a Wei Xiaoli, o representante das novas forças fabricantes de automóveis.01
Abra a caixa preta
Do ano passado ao primeiro semestre deste ano, o tema principal da competição entre os jogadores nacionais de direção inteligente foi competir pela velocidade de abertura da cidade com um mar de táticas de pessoas sob a arquitetura de tecnologia modular tradicional.Durante esse processo, a equipe de direção inteligente de Wei Xiaoli se expandiu para mil pessoas (ou mais), treinando, testando e verificando dia e noite para conquistar o Corner Case.Tesla FSD verificou o efeito de ponta a ponta, dando a todos a oportunidade de se libertarem da duplicação de trabalho.Mas o preço é que cada módulo da pilha de tecnologia de condução inteligente tradicional pode ser testado e verificado, enquanto o sistema de condução inteligente de ponta a ponta é uma caixa preta que conhece apenas os resultados, mas não o processo.Wei Xiaoli está avançando de ponta a ponta e os problemas comuns que eles enfrentam são:Em uma função com fortes requisitos de segurança, como a direção inteligente, uma caixa preta completa é inaceitável. É necessário encontrar uma maneira de abrir essa caixa preta e entender “por que o sistema quer fazer isso”, ou pelo menos fazer sua saída relativamente. controlável.XiaopengA escolha é uma rota progressiva segmentada ponta a ponta, e sua solução técnica é a rede neural perceptual XNet + rede neural de planejamento XPlanner + modelo de linguagem visual XBrain que foca na compreensão da cena.Xpeng segmentado de ponta a ponta
Na cadeia de tecnologia ponta a ponta, a segmentação ponta a ponta está atualmente a jusante.Os radicais acreditam que a segmentação ponta a ponta ainda não foge ao escopo das soluções tradicionais. Embora tanto a percepção quanto o planejamento tenham implementado redes neurais, um ponto-chave não mudou: a interface que conecta as duas redes neurais ainda é humana. interface definida. Isso significa perda de informações e uma grande quantidade de anotações manuais. Todo o processo não conduz à otimização e automação globais.Mas as vantagens da segmentação ponta a ponta também estão aqui: existem interfaces definidas por humanos, o que significa que serão produzidos resultados intermediários que os humanos podem entender, o que é conveniente para verificar e localizar problemas e não afetará todo o corpo , como detectar problemas, não há necessidade de treinar novamente toda a rede. Treinar dois modelos menores juntos é menos difícil e consome menos recursos computacionais do que treinar um modelo grande de ponta a ponta.Mais importante ainda, este método é teoricamente mais fácil de manter o limite inferior do desempenho de condução inteligente.Em 30 de julho, após o lançamento da direção inteligente XNGP da Xpeng, que foi totalmente inaugurada em todo o país, He Xiaopeng disse: “Os edifícios precisam ser construídos camada por camada. Pode ser possível desenvolver-se aos trancos e barrancos, mas o risco será extremamente. alto."Esta frase foi interpretada como uma advertência aos empresários amigos.No início de julho, Lili apresentou uma solução ponta a ponta de um estágio em desenvolvimento em sua conferência de verão: 4D One Model ponta a ponta. Em um estágio completo, a percepção e o planejamento são empacotados em uma rede neural com centenas de milhões de parâmetros, e os vídeos de condução de motoristas experientes tornam-se os dados de treinamento mais importantes. Esta solução suporta transmissão de informações sem perdas e possui um maior grau de automação no fluxo de dados. É mais radical do que as soluções ponta a ponta da Xiaopeng e Huawei.No entanto, esta solução ponta a ponta tem problemas como generalização fraca, fraca interpretabilidade e limites inferiores instáveis. Por esta razão, a Ideal conectou um VLM (Modelo de Linguagem de Visão) com uma escala de 2,2 bilhões de parâmetros ao final. modelo de ponta. Este modelo tem uma compreensão mais forte de cenas de trânsito complexas e sinais de texto de trânsito e pode fornecer uma referência para decisões de direção no modelo ponta a ponta, melhorando o desempenho do sistema de direção inteligente.idealPonta a ponta + VLMSolução de condução inteligente com sistema rápido e lentoEm agosto, a solução de direção inteligente de sistema duplo rápido e lento + VLM da Ideal iniciou um teste interno de milhares de pessoas para usuários profissionais. As autoridades esperam lançá-la para usuários comuns no final deste ano ou no início do próximo ano. .Antes disso, a Ideal não era líder na percepção do usuário sobre Zhijia, o que teve um impacto negativo nas vendas (especialmente contraPergunte ao mundohora). Ponta a ponta + VLM é idealmente definido como uma batalha chave pela capacidade de direção inteligente para ultrapassar nas curvas e se tornar o primeiro escalão.Em contraste,NIOAdota uma atitude conservadora e radical de ponta a ponta.A NIO é conservadora na medida em que a sua utilização atual de ponta a ponta é muito limitada e não é utilizada para NoA urbana, apenas para funções de segurança ativa. Em 11 de julho, a NIO começou a impulsionar o AEB usando uma solução ponta a ponta para resolver o problema de cobertura insuficiente de cenários AEB em soluções tradicionais.O lado radical da NIO é que a direção inteligente que será lançada ainda este ano parece estar pronta para pular a atual tendência popular de integração ponta a ponta e ir diretamente para o próximo estágio: integração do modelo mundial.O modelo mundial é a metodologia mais recente encontrada na indústria de direção inteligente. Na CVPR, a principal conferência de inteligência artificial de 2023, a Tesla demonstrou os resultados de pesquisa e desenvolvimento do modelo mundial Wayve.ai, uma start-up conhecida na indústria por seu modelo mundial de direção autônoma GAIA-1, arrecadou US$ 1 bilhão em. Maio deste ano.Ao aprender grandes quantidades de vídeos reais de cenas de direção, o modelo mundial pode prever e gerar vídeos de cenas de direção dentro de um determinado período de tempo no futuro para tomar decisões de direção corretas. Sua essência é a dedução do espaço-tempo. Isto é semelhante ao comportamento de condução humano. Motoristas experientes irão prever e deduzir o comportamento de outros participantes do trânsito e as mudanças no fluxo de tráfego em suas mentes, e planejar as operações de direção com base nisso.O que vai além do atual modelo mundial de ponta a ponta é que sua tarefa principal não é apenas fornecer um caminho planejado, mas também “prever mudanças de pixel na cena de direção”. Esta tarefa extremamente difícil forçará o modelo não apenas a aprender o comportamento de excelentes motoristas, mas também a aprender amplo conhecimento de trânsito e física.O que Weilai propôs no NIO IN é um “modelo mundial PLUS” ainda mais difícil. É mais complexo e tem mais dimensões de saída, o que significa que mais sinais de supervisão podem ser formados comparando-os com o valor real, acelerando o treinamento do neural. redes e também reduzir o nível de caixa preta de operação do sistema. Mas o preço é uma maior dificuldade de desenvolvimento.Modelo mundial NIO,Existem muitosA saída da tarefa de previsão de
Para referência, para treinar o modelo mundial GAIA-1, que é usado apenas para demonstração e só produz caminhos e vídeos planejados, Wayve.ai utilizou 4.700 horas de dados de vídeo e treinou por 15 dias com 160 blocos de A100. O modelo mundial que a NIO deseja treinar requer dados e recursos computacionais que são mais do que uma ordem de magnitude superiores.Após a conclusão do treinamento, como compactar e inserir um modelo de mundo complexo e enorme no Orin-X, que tem capacidade de computação e largura de banda muito limitadas, ao mesmo tempo que garante precisão e velocidade de execução, é outro problema complexo.Atualmente, Wei Xiaoli, que está experimentando de ponta a ponta pela primeira vez (mesmo que seja adotado com cautela), sente o efeito de “aumentar o limite superior e diminuir o limite inferior” de ponta a ponta para graus variados.Por exemplo, a versão mais recente do Xpeng, XNGP, ganhou capacidades de inversão de marcha sem precedentes, mas o feedback mostrou que o seu desempenho de condução inteligente em altas velocidades regrediu.A solução ponta a ponta + VLM da Ideal, que está em testes internos, tem um limite superior alto e um limite inferior flutuante.O AEB ponta a ponta que a NIO promoveu não apenas tem o desempenho de evitar ao máximo sondas fantasmas em cenários fora do padrão, como pontos cegos em curvas, mas também tem sido criticado pelos usuários por um aumento na falsa frenagem.02
Pesquisa e desenvolvimento L4, perspectivas L2?
Quando o limite inferior é difícil de compreender, as empresas automóveis invariavelmente recorrem ao extremo-a-extremo, em grande parte porque o limite superior do extremo-a-extremo trará melhorias suficientes na experiência do utilizador e correspondentes oportunidades de negócio.Mas à medida que as empresas automóveis se envolvem cada vez mais no processo de ponta a ponta, uma questão permanece nas suas mentes: será que a relação insumo-produto da condução inteligente pode ser calculada?Para vender mais FSD, a Tesla reduziu seu preço de assinatura de US$ 199/mês para US$ 99/mês (o preço de aquisição foi reduzido de US$ 12.000 para US$ 8.000) em março deste ano. No entanto, em maio deste ano, uma agência estrangeira de consultoria de dados analisou as informações de pagamento com cartão de crédito de 3.500 usuários e julgou que a taxa de conversão do FSD era de apenas 2%, o que levou Musk a refutar o boato no X de que "a taxa de conversão está longe mais de 2%, por favor."Mas muito mais de 2% não é suficiente. A Tesla está construindo um cluster de supercomputação em sua fábrica no Texas que deverá atingir 100.000 placas H100/H200. A um preço preferencial de US$ 25.000 por H100, o gasto de capital apenas para a compra de placas de computação excederá US$ 2,5 bilhões (expandindo-o). de construí-lo como um data center e continuar a operá-lo é maior) e vale a penaTaxa de assinatura FSD para 2,08 milhões de veículos Tesla durante um ano inteiro。O modelo de negócios de condução inteligente das montadoras nacionais é ainda menos otimista.As despesas de P&D de Xiaopeng para IA este ano são de 3,5 bilhões de yuans. Este mês, a Ideal estabeleceu o limite de financiamento para direção inteligente em US$ 1 bilhão. No entanto, tanto o XNGP da Xpeng quanto o NOA da Ideal vêm de fábrica com modelos de última geração. comprar. A NIO não adotou uma estratégia gratuita. A função de direção inteligente de ponta NOP + custa 380 yuans por mês. Ela gerou receita por um breve período, mas agora os carros novos vêm com um período de uso gratuito de 1 a 2 anos de NOP +.Incluindo a Tesla, a direção inteligente de ponta no país e no exterior ainda está em fase de perder e ganhar dinheiro.A contradição é que depois de entrar na competição da NOA urbana e mudar para o paradigma ponta a ponta, a intensidade da pesquisa e desenvolvimento de direção inteligente dessas empresas foi na verdade orientada para a direção autônoma L3 e até mesmo L4, mas o mercado convencional ainda considera o seu valor “não compensa o custo extra do software de condução assistida L2 paga”.Para resolver esta “lacuna entre o valor esperado e o valor real”, parece que a forma mais promissora é entrar no maior mercado de condução autónoma L4, o Robotaxi.Em 2018, o Morgan Stanley avaliou o Robotaxi da Waymo em US$ 80 bilhões. O maior fã de Musk, Mu Jie da Ark Investment, previu em junho deste ano que a receita da Tesla Robotaxi atingirá “conservadoramente” US$ 603 bilhões em 2029, aumentando o valor de mercado da Tesla para atingir 7 trilhões de dólares até então.Antes disso, Musk anunciou no Twitter que lançaria um modelo Robotaxi em agosto (jáadiado para 10 de outubro).03
Os retornos dos negócios ainda não foram milagrososFazer ou não o Robotaxi se tornou uma questão importante antes de Wei Xiaoli este ano.Para a Xpeng, que é a mais próxima da Tesla, a resposta é SIM. Em julho, He Xiaopeng revelou publicamente que a Xpeng Motors lançará o Robotaxi em 2026.He Xiaopeng acredita que os requisitos de hardware do Robotaxi são muito mais complexos do que se imaginava, mas a combinação de algoritmo de software de ponta a ponta + modelo grande que pode crescer rapidamente é suficiente para resolver a direção autônoma L4. O objetivo de He Xiaopeng para a equipe é que, no segundo semestre de 2025, a experiência do XNGP seja comparada com o Robotaxi do Google Waymo.No entanto, a própria fabricação de automóveis já é um negócio com muitos ativos, construindo um grande número de Robotáxis e operando umUma plataforma autônoma de chamada de táxi prolongará infinitamente a cadeia de negócios e o ciclo de retorno do investimento.O Google investiu US$ 5 bilhões na Waymo este ano, e é impossível para a Xpeng ser tão rica.De junho a julho, He Xiaopeng visitou o CEO da Didi, Cheng Wei, e o CEO da Uber, Dara Khosrowshahi. Ele disse que a Xpeng não quer operar o Robotaxi, mas espera exportar modelos e tecnologia de direção autônoma para parceiros globais.Robotaxi da Uber, agora em parceria com a Hyundai
A abordagem das montadoras ao Robotaxi de ponta a ponta atraiu a reação de muitos profissionais de direção autônoma L4, incluindo o ex-CEO da TuSimple, Hou Xiaodi, o CTO da Pony.ai, Lou Tiancheng, e o presidente da Qingzhou Zhihang, Hou Cong. Alguns deles criticaram furiosamente a mitologia de ponta a ponta das empresas automobilísticas, e alguns disseram que os sistemas de capacidade relevantes das empresas automobilísticas não são sólidos, mas os argumentos centrais permanecem os mesmos:Embora a condução inteligente de ponta das empresas automobilísticas tenha progredido rapidamente, ela é essencialmente projetada no âmbito da condução assistida. Os principais objetivos de preocupação são a usabilidade e o custo. O mais importante para o Robotaxi é a confiabilidade e a segurança. Os objetivos diferentes tornam difícil para os dois usarem o mesmo software e hardware, e é difícil para as montadoras fazerem uma transição suave da direção inteligente de ponta para o Robotaxi [1][2][3].Isso toca o coração de Li Bin. Em entrevista em 27 de julho,Ele deixou claro que “não acha que Robotaxi seja uma conquista ou modelo de negócio emocionante” e disse com raiva:“O valor da direção inteligente não é eliminar o trabalho árduo dos motoristas e taxistas de hoje.”Outra razão pela qual ele não está otimista em relação ao robotaxi é porqueDevido aos recursos rodoviários limitados e às regulamentações governamentais, o robotaxi não pode ser lançado ilimitadamente, o que torna difícil ter um modelo de negócios com altos retornos marginais, como serviços de software em nuvem.Li Bin sempre insistiu que as pessoas vão querer ter seu próprio carro, então o objetivo do NIO Smart Driving é ajudar os motoristas a liberar energia e reduzir acidentes. A palavra-chave da rota comercial é efeito de escala - vender mais carros para. usuários comuns e usuários com taxas de assinatura suficientes serão cobradas taxas de assinatura para direção inteligente de última geração, diluindo custos e obtendo receitas.No entanto, face à condução inteligente de alto custo, a escala cumulativa de utilizadores da NIO inferior a 600.000 ainda não é suficiente, e a exportação de capacidades de condução inteligente tornou-se uma opção. Ren Shaoqing, responsável pela condução inteligente da NIO, expressou recentemente a vontade da NIO de abrir as suas soluções de condução inteligente a outras empresas automóveis pela primeira vez, tal como a abertura da NIO à troca de baterias.Em contraste, o “julgamento técnico de Li Xiang é radical e a estratégia de negócios é conservadora” para Zhijia.Li Xiang deixou claro no Chongqing Automobile Forum deste ano que a combinação de ponta a ponta + VLM alcançará o nível de direção autônoma L4 dentro de três anos. Mas a diferença é que a Ideal nunca pensou no negócio Robotaxi. Mesmo até agora, a Ideal não demonstrou nenhum interesse em cobrar por software de direção inteligente. O logotipo em seu site oficial ainda é “direção inteligente em todos os cenários, zero taxas de assinatura vitalícias”.Isso está relacionado à situação competitiva ideal. No ano passado, os ideais enfrentaramHong Meng Zhixing, as vendas sofreram uma pressão significativa. A lança mais afiada de Hongmeng Zhixing são as capacidades de direção inteligente ADS da Huawei.No momento em que Hongmeng Zhixing está surgindo com Huawei ADS 3.0 (o preço de compra é de cerca de 10.000 yuans) em todas as esferas da vida, pressionando ainda mais a Ideal, o drive inteligente AD MAX da Ideal, que é mais fácil de usar do que antes, mas gratuito, pode ajudar pegue mais vários pedidos. Ao contrário do Xpeng e do NIO, o KPI de direção inteligente ideal não é obter receita operacional, mas atender às vendas.No entanto, à medida que a indústria automobilística nacional entra na fase eliminatória, o negócio de direção inteligente de Wei Xiaoli não pode permanecer em estado de fazer amigos por muito tempo.O custo de um cartão de treinamento começa em 100.000 yuans e o custo de mão de obra de uma equipe de mil pessoas começa em 1 bilhão por ano. Como um dos negócios mais caros de Wei Xiaoli, Zhijia embarcou em um caminho que exige mais recursos para realizar milagres. ., mas ainda há incertezas sobre se também poderá colher os frutos de esforços milagrosos.[1] Hou Xiaodi, o homem corajoso e cauteloso, Jiazi Guangnian
[2] Conversando com Lou Tiancheng sobre Robotaxi: "Quanto mais poderoso o L2, mais longe ele está do L4", Tencent Auto
[3] Tesla simplifica o Robotaxi | Conversa com Hou Cong, cofundador da Qingzhou Zhihang, Yunjian Insight