notícias

Conversa com Hou Cong, cofundador da Qingzhou Zhihang: Tesla acha que Robotaxi é muito simples

2024-08-15

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Comparado com o Robotaxi, a estabilidade do sistema de co-condução humano-veículo é mais importante hoje.

 

Texto | Wang Hailu

Sempre houve uma disputa entre duas rotas na indústria de direção autônoma. Empresas de direção autônoma representadas pelo Google Waymo eTeslaAs montadoras representadas pela empresa subiram pelas encostas sul e norte da mesma montanha. O topo da montanha não tem motorista e o cenário de negócios mais atraente é o Robotaxi (táxi autônomo).

Embora tanto as vendas quanto o preço das ações mostrem que a Tesla está subindo a montanha mais rápido. Mas quando o fundador Musk propôs que o Tesla Robotaxi fosse lançado em outubro deste ano, ainda causou muita polêmica.

Hou Cong, cofundador e presidente da Qingzhou Zhihang, é um dos que duvidam. "Nunca entendi muito bem. A história do Robotaxi foi contada por tantos anos e nunca foi realizada. Por que as pessoas ainda querem acreditar em Musk?"

Embora o sistema de direção inteligente FSD V12 da Tesla baseado em tecnologia ponta a ponta tenha um desempenho superior, Hou Cong acredita que ainda está longe de ser um verdadeiro Robotaxi. Ele citou casualmente um problema que o sistema não conseguia resolver: "O que devo fazer se o carro ficar preso no meio da estrada? Você pede ao dono do carro para pegar um táxi e liberar o carro?"

As estradas urbanas são complexas, as pessoas e os veículos se misturam e há muitos cenários de jogo que a inteligência artificial de hoje não consegue lidar. A frota Robotaxi fortemente armada da Waymo não conseguiu sair da área de demonstração. Hou Cong acredita que é impossível para Tesla atender aos requisitos da Robotaxi confiando apenas em câmeras.

Os quatro cofundadores da Qingzhou Zhihang são todos da Waymo. Hou Cong ingressou no Google assim que se formou, primeiro trabalhando em um compilador, e depois transferido para a equipe de projeto de veículos autônomos do laboratório Google X para trabalhar no sistema de percepção.

Yu Qian, cofundador e CEO da Qingzhou Zhihang, também fazia parte do grupo de percepção na época e era colega do mesmo departamento de Hou Cong. Os dois também são ex-alunos da Universidade Tsinghua.

Hou Cong formou-se em automação e foi transferido para o departamento de informática como estudante de pós-graduação. Mas antes de conseguir meu diploma, fui para o Instituto de Tecnologia da Geórgia, nos Estados Unidos, para fazer doutorado. Ele se descreveu como tendo pouco interesse em pesquisa acadêmica pura e mais anseio pela prática de engenharia técnica, então foi para o Google depois de concluir seu doutorado.

Em 2016, o Google desmembrou sua equipe de projeto de carros autônomos e fundou a Waymo, que é controlada diretamente pela Alphabet, controladora do Google. Hou Cong e Yu Qian se tornaram os primeiros engenheiros da Waymo.

Hou Cong é responsável pela otimização de desempenho e tem muito contato com diversos departamentos, por isso conheceu Dafang e Wang Kun, que na época faziam planejamento e simulação na Waymo. Em 2019, quatro engenheiros chineses cofundaram a Qingzhou Zhihang.

Já não era o momento mais quente para a indústria da condução autónoma. A empresa de direção autônoma da China, Pony.ai, está estabelecida há 3 anos e Tucson está estabelecida há 5 anos. As empresas de direção autônoma que usam Robotaxi ou caminhões pesados ​​​​não tripulados como cenários de pouso já tiraram a maior parte dos recursos do mercado. Qingzhou escolheu um caminho com menos concorrentes e menos capital: microônibus não tripulados.

Hou Cong disse que não fez o Robotaxi naquela época porque achou que o Robotaxi seria implementado muito lentamente. Waymo começou a operar uma frota Robotaxi em Phoenix, Arizona, em 2016, e parece estar presa em inúmeros casos até hoje.

Os custos da mão-de-obra doméstica são baixos e as estradas são mais complexas, tornando mais difícil fazer Robotaxi. Hou Cong foi experimentar o Carrot Run do Baidu em junho deste ano e sua experiência foi mediana. Ele disse sem rodeios: “A situação atual de Carrot Run é impossível para Waymo operar neste estado”.

Qingzhou está construindo um microônibus sem motorista. A princípio, pensei que esse cenário seria mais fácil de implementar do que o Robotaxi. No entanto, depois de realizar operações piloto em 10 cidades, incluindo Suzhou, Pequim e Wuhan, descobriram que tinham simplificado demasiado o problema. É difícil ganhar dinheiro com autocarros e os regulamentos têm demorado a ser implementados.

No início, Qingzhou confiou na experiência e no acúmulo de tecnologia da equipe fundadora para obter com sucesso investimentos de capital de primeira linha, como IDG, Lenovo Ventures, Meituan Longzhu Capital e Yunfeng Fund. Mas em 2021, os investidores começaram a prestar atenção às capacidades hematopoiéticas e o caminho de financiamento para empresas de condução autónoma L4 tornou-se cada vez mais difícil.

Em nítido contraste, o preço das ações da Tesla disparou mais uma vez em 2021. A taxa de penetração de novos veículos energéticos na China está a aumentar rapidamente e as funções de condução inteligentes tornaram-se características padrão dos veículos eléctricos. Em meados daquele ano, Qingzhou deu meia-volta e passou de L4 para L2+ para fornecer soluções de direção inteligentes para veículos elétricos.

Em agosto daquele ano, a Tesla apresentou o BEV (Bird'sEyeView, visão panorâmica) pela primeira vez no AI DAY.

) e o modelo Transformer combinam as informações de percepção de diferentes ângulos de câmera em uma imagem de cima para baixo, tornando mais fácil para o sistema compreender e prever as condições da estrada. As empresas nacionais de veículos elétricos inteligentes seguiram o exemplo e reescreveram os algoritmos de detecção. Qingzhou transformou-se resolutamente neste momento e tornou-se um dos primeiros fornecedores de condução inteligente na China a produzir BEVs.

Este sistema é implementado no chip Horizon J5. O CTO da Horizon, Huang Chang, Hou Cong e Yu Qian são ex-alunos da Tsinghua, e Yu Qian é pesquisador sênior da University of Southern California. Devido a esta origem e reconhecimento de tecnologia e conceitos, o Horizonte 2022 procurou a cooperação com parceiros ecológicos e deu-se bem com Qingzhou.

No final de 2022, Qingzhou lançou uma solução de teste NOA (sistema de direção assistida de navegação) urbana e de alta velocidade baseada no chip Horizon J5. Depois disso, a Horizon recomendou que Qingzhoucarro ideal

A Ideal começou a desenvolver seu próprio sistema de direção inteligente usando chips Horizon em 2021, e posteriormente planejou duas soluções de sistema, AD Max e AD Pro, baseadas em chips NVIDIA OrinX e Horizon J5.

No segundo semestre de 2023, a Ideal decidiu concentrar seus recursos internos de P&D no AD Max e entregar o sistema AD Pro a um fornecedor para manutenção e atualizações. Qingzhou aproveitou a oportunidade.

Depois que Qingzhou assumiu, ela trabalhou com a equipe Ideal para otimizar o sistema e lançou aos usuários uma versão do sistema baseada na arquitetura de algoritmo de Qingzhou em maio deste ano.

Hou Cong finalmente conseguiu o que queria fazer, praticar engenharia e entregar os produtos que desenvolveu aos usuários. Ao mesmo tempo, ele também sentiu profundamente a grande responsabilidade.

Em maio deste ano, o modelo Lili AD Pro contava com 400.000 proprietários. Quanto mais pessoas usam um sistema e quanto mais frequentemente ele é usado, mais problemas serão expostos. Mas quanto mais pessoas usam e maior a frequência de uso, isso significa apenas que o produto é melhor.

Em comparação com a realização anterior da direção sem motorista e a construção do Robotaxi, manter a estabilidade do sistema de direção assistida onde uma pessoa e um carro dirigem juntos e garantir a segurança ao dirigir de centenas de milhares de usuários são desafios que Qingzhou está mais disposta a enfrentar hoje.

Tesla acha que Robotaxi é simples Conversa com Hou Cong, cofundador da Qingzhou Zhihang |,Insight Yunjian,50 minutos

A seguir está uma conversa entre Insight e Qingzhou Zhihang CTO Hou Cong (editado):

Quatro engenheiros da Waymo iniciam um negócio

Insight: Seus quatro cofundadores eram todos engenheiros da Waymo. Por que vocês se reuniram para iniciar um negócio?

Hou Cong:No início, Yu Qian (cofundador e CEO da Qingzhou) me abordou e pensamos que poderíamos fazer isso. Naquela época, a Waymo não tinha tantos chineses, então encontramos algumas pessoas que consideramos experientes e capazes.

Naquela época, eu estava fazendo otimização de desempenho e design de arquitetura na Waymo, fazia parte da mesma equipe que Yu Qian e tinha cooperação comercial com os três.

Insight: como você divide o trabalho e decide quem faz o quê?

Hou Cong:A direção de nós quatro é particularmente coincidente, Yu Qian e eu fazemos a percepção, mas eu faço o sistema e ele faz o algoritmo. Dafang (cientista-chefe) faz o planejamento e Wang Kun (COO) faz a simulação. São quatro direções diferentes.

Yu Qian e Dafang são mais como cientistas. Meu interesse é por engenharia, o que significa colocar a tecnologia em prática, com foco na prática e nos produtos. Então fui para a indústria assim que me formei.

Yunjian Insight: Apresente brevemente sua experiência inicial?

Hou Cong:Minha graduação foi no Departamento de Automação da Universidade de Tsinghua. Após a formatura, fui para o Departamento de Ciência da Computação para fazer pós-graduação. Trabalhei em visão por mais de um ano, mas desisti antes de terminar meus estudos. Fui para os Estados Unidos para fazer doutorado. Depois de me formar em 2013, fui para o Google.

Quando fui para o Google pela primeira vez, trabalhei como compilador. Depois de trabalhar lá por um ano, fui emprestado para a equipe de infraestrutura para trabalhar em GPUs. Talvez tenha sido porque fiz algumas otimizações na CPU naquela época, o que foi reconhecido por Jeff Dean (cientista-chefe do Google), e posteriormente recomendado ao grupo de GPU.

Mais tarde, esse grupo se desenvolveu muito bem, trabalhando em alguns compiladores para TPU, além do desenvolvimento de algumas bibliotecas subjacentes no Google Brain (arquitetura do Google para treinamento de redes neurais) e XLA (compilador de aprendizado profundo do Google) foi o que eles fizeram.

Posteriormente, o trabalho da GPU chegou ao fim e o laboratório Google X teve a oportunidade de otimizarmos o sistema de percepção dos veículos autônomos. Naquela época existia um projeto chamado “20%”, que significava gastar 20% do seu tempo em um projeto.

Foi Zhu Jiajun quem me ligou naquela hora. Mais tarde, ele fundou a Nuro (uma empresa de direção autônoma). Trabalho no grupo de percepção há mais de três anos.

Insight: como é trabalhar na Waymo?

Hou Cong:Mais parecido com o Google. Era propriedade do Google X antes de se tornar independente em 2017. O Google fabrica principalmente software e o Google X fabrica hardware. Há todo tipo de coisas estranhas no escritório, incluindo braços robóticos, tornos e muitos equipamentos.

O trabalho realizado lá é semelhante ao do Google, onde todos enfatizam a autodireção, a cooperação e são movidos por OKRs. Cria um bom ambiente cultural, onde todos esperam fazer melhor, e alguém projetará o sistema de desempenho para que pessoas com fortes habilidades possam emergir da competição. É verdade que o limite é relativamente alto e muitas pessoas do Google podem não conseguir entrar.

Yunjian Insight: engenheiros da Waymo?

Hou Cong:Quanto mais para trás você vai, mais ele se enrola. O período mais movimentado foi provavelmente os dois anos após nossa partida. Eles estavam sob muita pressão para fazer o que tinham que fazer em São Francisco. Quando estávamos aqui ninguém obrigava, mas era comum eu fazer hora extra à noite e ao meio-dia. Às vezes, todos enviavam e-mails com perguntas no meio da noite.

Yunjian Insight: A que horas é o horário de folga?

Hou Cong:Não existem regras.

Yunjian Insight: Posso sair do trabalho às 3h30?

Hou Cong:Pode. Sou daquelas pessoas que chega tarde e sai tarde. Costumo ir lá depois das 10 horas, jantar e trabalhar um pouco antes de sair, basicamente indo das 10 às 9.

Insight: os engenheiros chineses são as pessoas que mais trabalham na Waymo?

Hou Cong:No geral, eles são definitivamente mais trabalhadores, mas os americanos também são, na verdade, trabalhadores. Cria o tipo de ambiente cultural em que todos se sentem confortáveis ​​fazendo as coisas. Eles não precisam se preocupar com muitas coisas complicadas e só precisam se concentrar em fazer bem o seu trabalho.

Acho que a eficiência do trabalho é bastante alta. Algumas equipes desenvolverão pessoas preguiçosas depois de muito tempo, mas o Waymo estava se desenvolvendo de forma relativamente rápida naquela época, então não vi isso acontecer.

Yunjian Insight: Foi a OpenAI, e não o Google, que tornou os modelos grandes populares. Qual você acha que é o motivo?

Hou Cong:Existem algumas políticas internas nas grandes empresas, e muitas vezes elas tomam decisões com hesitação e às vezes não ousam apostar. Sinto que sempre que o Google faz alguma coisa, fica particularmente preocupado com o risco da opinião pública e, por vezes, é bastante conservador.

Insight: Você se sente muito confortável trabalhando na Waymo. Você deixou a Waymo em 2019 para iniciar um negócio.

Hou Cong:Às vezes não é bom estar muito confortável e você pensará em muitos problemas da vida. Você pode ver como serão os próximos 10 ou 20 anos. Definitivamente, não falta dinheiro no Vale do Silício e você pode comprar uma boa casa. Então, o que você está procurando? De fato, existe um teto de carreira. Devido ao ambiente cultural e linguístico, é difícil para você participar do nível de tomada de decisão da empresa. Definitivamente não é como na China. Se você quer fazer grandes coisas, na América você é mais um jogador do que um tomador de decisões.

Meu carro está preso no cruzamento, quem vai me resgatar?

Insight: Quando você estava na Waymo, a Waymo já havia iniciado a operação experimental do Robotaxi.

Hou Cong:Está preso em alguns casos secundários. Foi para Phoenix em 2016. Acontece que eu estava lá naquela época. Havia menos pessoas e carros lá, as estradas eram largas, o tempo estava bom e não chovia com frequência. Mas a procura também é baixa. Phoenix não consegue acertar as contas. É um local de operação de teste, não um local comercial. Assim, em 2018, a Waymo mudou totalmente seu foco para São Francisco.

Um sistema que estava funcionando bem em Phoenix na época foi completamente arruinado em São Francisco. A taxa de aquisição era extremamente alta e não podia ser controlada. Naquela época, ainda havia um limite técnico. Claro, tinha a ver com a distribuição de dados. Não coletamos muitos dados em São Francisco. São Francisco tem encostas muito íngremes, geralmente variando de 30 a 40 graus. Incluindo suas regras de trânsito (diferentes), pessoas e veículos interagem com frequência, então o problema da Waymo na época era lidar com alguns casos esquivos.

Waymo é muito cauteloso e não ousará abrir até que seja muito seguro. Mas pela situação atual de Carrot Kuaishou, e eu também andei nos carros deles, é impossível para a Waymo operar neste estado.

Yunjian Insight: Quando você experimentou o Carrot Run do Baidu, que problemas encontrou?

Hou Cong:Eu fui em junho. Há um problema com a sensação corporal e uma sensação de frustração. Waymo é realmente melhor do que a direção humana. É muito confortável frear, dar partida e virar. É a experiência de um motorista de concierge.

Em segundo lugar, Carrot Run é extremamente conservador. Por exemplo, ao fazer meia-volta, os solavancos são particularmente fortes e você é constantemente perturbado pelos carros ao redor. Havia outro lugar onde um caminhão de trabalho estava preso atrás e o seguia lentamente, sem dar a volta.

A julgar pela configuração básica do sensor, não é uma solução L4 muito séria. Waymo está armado até os dentes, equipado com 5 lidars, 30 câmeras e radares de ondas milimétricas de 6 milímetros. Carrot Run definitivamente não fez isso. Isto também está relacionado com a situação da China. Os custos laborais da China são demasiado baixos e estará longe de obter retornos comerciais.

As empresas nacionais podem ser forçadas a adotar soluções de baixo custo. Porém, o baixo custo fará com que seu teto técnico seja inferior aos demais, dificultando a solução de casos extremos.

A China está num dilema L4, com pessoas baratas e um ambiente complicado. Os participantes do trânsito têm pouca previsibilidade e um grande número de campos de jogo. O projeto das estradas não é tão padronizado.

A construção doméstica não é tão padronizada. O carro de Meituan caiu em um buraco antes, você culpou Meituan? Se a equipe de construção não colocasse o cone, as pessoas poderiam ver um buraco na frente dele, mas o carro de Meituan não esperaria que houvesse um buraco. Mas nos Estados Unidos, se alguém cair, terá de processar o governo ou a unidade social. Este mecanismo definitivamente não é o caso na China. Acho que a China estará muito atrasada no desenvolvimento do L4 do que os Estados Unidos.

Yunjian Insight: O que você acha do Robotaxi de Tesla?

Hou Cong:Então eu não reconheço. Acho que é possível lançar um modelo, por exemplo, sem volante, ou com algumas configurações adicionais em relação à versão atual do carro para o usuário. Mas a sua atual pilha de tecnologia não está orientada para L4. Depois de começar a operar um Robotaxi, muitos problemas surgirão.

L4 está naturalmente relacionado às operações. Ele também pode resolver alguns problemas técnicos por meio de operações. Tesla não possui tal sistema operacional.

Yunjian Insight: O cenário imaginado pela Tesla é que os proprietários de automóveis possam pegar um Uber quando o carro estiver parado.

Hou Cong:O que devo fazer se meu carro ficar preso no meio da estrada? Quem vai resgatar este carro? Deixar o dono do carro pegar um táxi e resgatar o carro? Estas são questões muito práticas.

O carro com certeza ficará preso e, contanto que você faça isso muito, com certeza haverá algumas cenas. Ou você é muito cauteloso, ou não sabe interagir com as pessoas, ou até fica preso entre os carros.

Por exemplo, se dois Tesla Robotaxi se morderem, este problema será difícil de resolver. Quando não há sinal vermelho em um cruzamento, todos os carros tentam ocupar o cruzamento e acabam ficando presos uns nos outros, incapazes de se mover.

Na verdade, nunca entendi muito bem. A história do Robotaxi foi contada há tantos anos e nunca foi realizada. Por que todos ainda estão dispostos a acreditar em Musk? Admiro muito Musk e acho que ele faz outras coisas muito bem. Mas ele se gabava um pouco do Robotaxi e subestimou a dificuldade do assunto.

Yunjian Insight: Até que ponto você acha que o efeito do Tesla FSD V12 é comparado ao Robotaxi de nível L4?

Hou Cong:Nem perto. Deixe-me dar um exemplo ao contrário. Por que a Waymo projetou seu carro assim? Possui vários tipos de câmeras, uma é normal; outra é para uso noturno e possui forte capacidade de visão noturna; outra é para imagens térmicas; Possui câmeras de categoria cinco.

Tesla possui apenas um tipo de câmera. Você acha que Waymo é estúpido? Não é estúpido. Depois de ver muitos casos extremos, ele não tem escolha a não ser resolver esse problema por meio de hardware. Você tem que quebrar o software, não é muito fácil de usar. Especialmente nos Estados Unidos, é muito escuro à noite e muitos lugares não têm iluminação pública.

Se a Tesla for para a estrada com sua configuração atual, incluindo Carrot Run, um profissional que é profissional em cometer erros terá muitas maneiras de cometer erros porque seu hardware tem muitas falhas.

Insight: você já experimentou o FSD V12 nos Estados Unidos?

Hou Cong:Eu experimentei isso quando fui lá em março deste ano, e novamente em maio, e abriu todos os dias.

Para ser sincero, não acho o V12 incrível, só acho que sua praticidade ficou melhor. Na cidade, principalmente nos cruzamentos, o manuseio mudou significativamente em relação ao V11. Principalmente bom, mas não perfeito.

O Tesla V11 já faz um ótimo trabalho na rodovia. Os cruzamentos na cidade são muito conservadores e desumanos, o que torna tudo estranho. Há um monte de carros atrás de você, então avance devagar. Depois de olhar por muito tempo, ele se moveu muito lentamente. Por ter pontos cegos, esse comportamento não é típico dos humanos. Além disso, ao virar, o volante girará repentinamente, o que o deixará em pânico.

Yunjian Insight: A atual solução técnica ponta a ponta da Tesla também precisa continuar a resolver casos difíceis?

Hou Cong:O caso secundário deve ser resolvido. Ponta a ponta integra informações de vários módulos principais de algoritmos tradicionais e usa essas informações para treinar um melhor resultado.

O limite superior de ponta a ponta é alto e o limite inferior é inferior no início porque tem pouca controlabilidade. Antigamente o sistema era dividido em módulos e cada módulo definia uma interface. Siga os padrões e nada de estranho aparecerá. Basicamente, o uso de regras pode resolver vários problemas de uma só vez.

Não existe esse conceito de ponta a ponta. Só podemos usar dados mais diversos para resolver o problema do limite inferior. Já vi muitas situações como essa e finalmente sei como resolvê-las.

Yunjian Insight: O modelo ponta a ponta é equivalente a uma caixa preta. Se ocorrer um problema, como encontrá-lo e resolvê-lo?

Hou Cong:Não deve ser a chamada caixa negra. Se você extrapolar a partir dos resultados de produção, os resultados da percepção e do planejamento estão todos lá, portanto, deve fazer uso total de sua experiência anterior para formar um novo modelo. Este modelo tem um certo grau de controlabilidade, por exemplo, esta parte é percepção, aquela parte é previsão e aquela parte é planejamento, mas ainda precisa distinguir diferentes etapas.

Insight: Quando você estima que o FSD será lançado na China?

Hou Cong:próximo ano. Isso deveria ter sido feito há quase um ano. Não tenho certeza sobre os detalhes, mas está começando a recrutar engenheiros de algoritmos, o que significa que já começou. Não diz que serão gastos internamente 10 mil milhões de dólares? Construa várias instalações.

Insight: Então, o que precisa ser feito para que o DEO seja implementado na China?

Hou Cong:Construa um data center e adapte seus algoritmos internamente. Porque afinal o cenário doméstico é complicado. Esperamos especialmente ver o FSD chegar à China, porque é uma referência e, se investir mais, deverá ser o mais rápido.

Yunjian Insight: As montadoras nacionais têm alguma estratégia de resposta?

Hou Cong:Tudo o que podemos fazer é perseguir. Afinal, acho que os players nacionais têm algumas vantagens na instalação do lidar. Adicionar lidar definitivamente tornará esse problema mais fácil.

Yunjian Insight: É possível que o Robotaxi da Tesla não tenha os sensores atuais, mas seja equipado com lidar ou mais câmeras de alta definição?

Hou Cong:certo. Isso definitivamente reduziria a dificuldade, mas poderia ser inconsistente com o seu conceito.

Tesla só pode esperar pelo desenvolvimento contínuo da IA ​​(inteligência artificial) agora. Acho que essa possibilidade existe, mas as pessoas têm que resolver vários tipos de problemas na hora de dirigir. Você está interagindo com o mundo real e não está testando sua habilidade de dirigir, mas algumas coisas instintivas.

Em segundo lugar, ao conduzir, as pessoas verificarão o ambiente do carro e julgarão as possibilidades através da sua própria compreensão do ambiente circundante. Por exemplo, se você encontrar um cachorro, ele desaparecerá conforme você avança. Nesse momento, você pode sair do carro e verificar se o cachorro está na frente. Numa cena como esta, a percepção humana se expande num instante. Se o carro não tiver um design relevante, na verdade é mais perigoso.

Yunjian Insight: Você acha que a Tesla pode fazer o Robotaxi se depender apenas dos recursos de software?

Hou Cong:Isto é muito desafiador e os requisitos para IA são muito elevados. Acho que definitivamente pode ser feito a longo prazo, mas o processo não é o que imaginei. A IA existe há décadas e foi mostrada em um grande número de filmes de ficção científica, mas não foi realmente resolvida até agora. Às vezes, você pode facilmente pensar nisso de maneira muito simples.

Yunjian Insight: Tesla planeja expandir o cluster de poder de computação Dojo para 100 EFLOPS (unidades de poder de computação) em outubro deste ano. A diferença entre outras empresas automobilísticas e a Tesla é de ordem de magnitude. O que você acha da lacuna?

Hou Cong:Isso é um investimento pesado. A Tesla costumava ter margens de lucro muito altas. Ela vende tantos carros em todo o mundo que é acessível e o preço de suas ações também tem um suporte relativamente forte. Os fabricantes nacionais de automóveis são tão grandes que é impossível investir tantos recursos. É por isso que os Estados Unidos criaram primeiro o grande modelo, mas não a China? Envolve muito investimento e leva muitos anos para queimar dinheiro, e a lógica de investimento por trás disso é diferente.

Yunjian Insight: Atualmente você está reservando poder de computação para operações ponta a ponta?

Hou Cong:Nós também estamos fazendo isso, mas de uma maneira diferente. Se seguirmos a abordagem de Tesla e custarmos dezenas de milhares de dólares para o A100, obviamente não podemos pagar por isso. Alguns milhares de dólares seriam um fardo enorme. Faremos algumas restrições com base em nossos produtos, então o investimento será bem menor.

Insight: se os investidores lhe derem dinheiro suficiente, que caminho você escolherá?

Hou Cong:Se houver dinheiro suficiente, iremos nessa direção. Mas não há ses. Todo mundo conhece a situação atual e o mercado é assim.

De microônibus sem motorista à direção assistida

Yunjian Insight: Quando você começou, a direção autônoma não era mais tão popular no mercado de capitais. Você encontrou algum desafio com financiamento?

Hou Cong:Definitivamente não é tão fácil como era nos primeiros dias. O financiamento na fase inicial era geralmente de várias centenas de milhões, mas quando chegou até nós foi muito mais difícil. No entanto, acho que isso é bom para a nossa transição para L2. Se você arrecadar muito dinheiro no estágio inicial, será difícil fazer a transição para L2. Sua avaliação ficará aqui.

Yunjian Insight: Naquela época, muitas pessoas já estavam iniciando negócios com direção autônoma. Por que você acha que ainda há uma chance?

Hou Cong:Tecnicamente falando, achamos que estamos um pouco avançados. Conhecemos L4 melhor que outros. Em segundo lugar, o L4 tem a possibilidade de ser implementado em muitos cenários, não apenas em robotáxis e caminhões pesados. Naquela época, se você quisesse arrecadar muito dinheiro, poderia construir um caminhão pesado ou um robotáxi. Mas achamos que há oportunidades em outras direções. Este tipo de veículos de média e baixa velocidade, sejam microônibus, distribuição logística, veículos de operação, veículos de saneamento, veículos de vendas ou aplicações em alguns ambientes fechados, como terminais de mineração ou algumas fábricas, embora o mercado seja relativamente pequeno, acreditamos que sua comercialização ainda é relativamente pequena. Aquele (Robotáxi) é mais rápido e tem requisitos técnicos mais baixos.

Yunjian Insight: Por que você construiu um microônibus sem motorista quando iniciou seu negócio?

Hou Cong:Porque a dificuldade é baixa. O cenário imaginado naquela época era de microcirculação, ou seja, um cenário relativamente fixo de veículos de média e baixa velocidade, não apenas micro-ônibus, mas também veículos logísticos e de trabalho.

Yunjian Insight: Microônibus autônomos nunca foram comercializados. Qual você acha que é o principal motivo?

Hou Cong:É também uma questão de modelo de negócio e de quem paga por isso.

Yunjian Insight: Você se transformará em direção assistida para automóveis de passageiros em 2021. O que o inspirou a tomar essa decisão?

Hou Cong:Ainda sinto que a implementação do negócio L4 é relativamente lenta, requer grandes investimentos, tem um caminho lento e tem um ciclo longo. Se continuarmos assim, poderemos ter algumas dificuldades financeiras. Acreditamos que devemos encontrar algumas soluções que possam ser comercializadas rapidamente para que possamos seguir em frente. L2++ Este mercado é adequado.

A nova energia está a desenvolver-se muito rapidamente em 2021, o preço das ações da Tesla disparou novamente, a taxa de penetração de novos veículos energéticos na China continua a aumentar e a procura por uma condução inteligente continua a aumentar. Acontece que a nossa tecnologia é relativamente fácil de aplicar às funções de condução assistida e podemos comercializá-la a curto prazo.

Yunjian Insight: Por que você não quis fazer L2 no primeiro dia de abertura de um negócio?

Hou Cong:Não esperava que L2 fosse tão rápido. Naquela época, a Tesla ainda não havia lançado uma solução forte. O Hardware 3.0 havia acabado de ser lançado. Em 2019, nossa equipe fundadora, Wang Kun, comprou um Tesla que ficou muito chocado (depois de experimentá-lo). Para ser sincero, saí do Waymo com alguns preconceitos contra soluções de visão, que considero pouco confiáveis, porque o Waymo é baseado principalmente em lidar.

Na verdade, nossa tecnologia de fabricação de microônibus é totalmente baseada no Robotaxi. Sei que muitos dos meus amigos operam microônibus ou logística de baixa velocidade, que são rotas técnicas completamente diferentes do Robotaxi. Então fizemos a transição para L2 muito rapidamente. Algumas empresas próprias não têm essa capacidade e, se insistirem em seguir nessa direção, haverá grandes problemas com toda a estrutura.

Microônibus não tripulado de Qingzhou Zhihang

Yunjian Insight: Quando você optou pela direção assistida para automóveis de passageiros, como era o cenário da indústria?

Hou Cong:Nós nos transformamos após o primeiro AI Day da Tesla, então devemos ir na direção do BEV. Estabelecemos várias regras para nós mesmos. Em primeiro lugar, não construiremos L2 de baixo custo. É um oceano vermelho e a competição já é acirrada. de forma alguma.

Estávamos transformando naquela época e discutimos se deveríamos refazer o planejador. A conclusão foi que deveríamos manter nossas vantagens e não refazer, porque no futuro o que faremos deve ser soluções de médio a alto padrão. o poder de computação é garantido até certo ponto.

Insight: quais ajustes você fez no algoritmo de L4 para L2?

Hou Cong:A mudança na percepção será maior, desde soluções baseadas em nuvem de pontos laser até soluções baseadas em visão. Felizmente, usamos BEV para fabricá-lo imediatamente, então fomos a primeira empresa no país a fabricar BEV no J5.

Trabalhamos juntos em NOA de alta velocidade e urbano. Achamos que não há diferença no sistema de percepção. A alta velocidade e a cidade estão integradas, mas a configuração será diferente. Por exemplo, o alcance de detecção e o poder de computação serão um tanto simplificados, mas a arquitetura e o algoritmo serão os mesmos.

Insight: Como você cooperou com a Horizon?

Hou Cong:Temos algumas conexões. Yu Qian, eu e seu CTO Huang Chang somos todos da Universidade de Tsinghua. Trabalhei no Laboratório de Visão da Universidade Tsinghua por um ano e meio e estive no mesmo laboratório que Huang Chang. Yu Qian e Huang Chang receberam diplomas de doutorado no sul da Califórnia e são colegas estudantes.

No início de 2022, a Horizon esperava cultivar alguns parceiros ecológicos e decidimos trabalhar juntos.

Yunjian Insight: Ouvi dizer que Yu Kai empurrou você em direção ao seu ideal?

Hou Cong:Sim, o irmão Kai nos apoia muito e também o apoiamos o suficiente para ajudá-los a estabelecer um padrão.

Yunjian Insight: Há um problema de poder de computação insuficiente da CPU ao usar o Horizon J5 como BEV Transformer. Como você usou o J5 para fazer isso?

Hou Cong:Apenas não use o Transformer. O BEV Transformer foi promovido pela Tesla, mas há muitas maneiras no mundo acadêmico de mapear recursos de imagem para o espaço BEV. Transformer é apenas um método. Usamos um método mais adequado para J5 e o efeito é muito bom.

Insight: O Horizon J6 de próxima geração mudará para a solução BEV Transformer?

Hou Cong:Olhando para o desempenho de custo, se o uso do Transformer consumir muito poder de computação, mas produzir muito pouco resultado, consideraremos tudo. Mas definitivamente usaremos o Transformer para implementar algumas coisas, incluindo negócios de ponta a ponta, sem mapas e algum processamento de mapas. O valor de usar o Transformer nesta área é muito grande.

Quanto mais pessoas usarem, maior será o desafio.

Insight: Atualmente você está desenvolvendo o sistema AD Pro ideal. Há algum desafio?

Hou Cong:A maior dificuldade é que sua base de usuários é muito grande e seus requisitos são muito elevados. Quanto mais pessoas o usarem, mais problemas ele exporá, dada uma certa probabilidade. Quando você tem apenas milhares ou dezenas de milhares de usuários, isso pode acontecer uma vez por mês ou uma vez a cada poucos meses. Mas se centenas de milhares de pessoas o utilizarem, isso poderá acontecer uma vez por semana ou vários dias. Isso também tem a ver com a cobertura do usuário. Quanto melhor o produto, mais pessoas o usam e mais problemas ele exporá. É definitivamente um desafio garantir que o sistema não tenha problemas de estabilidade ou segurança.

Insight: Qual é o problema difícil que você resolveu recentemente?

Hou Cong:Identificar semáforos é, na verdade, um problema difícil. Em tantos cruzamentos em todo o país, a aparência, as regras e a relação entre semáforos e estradas são todas diferentes. Algumas luzes são simples luzes vermelhas, amarelas e verdes, algumas estão em duas fileiras, também há luzes muito longas com setas dentro, e há luzes para bicicletas e ônibus no interior, e algumas luzes têm formas estranhas.

Considere também o fundo claro, como à noite. Devido às limitações do sensor, pode ser difícil distinguir as formas das setas e dos círculos quando houver superexposição. E quando há interferência de muitas luzes de fundo, isso terá um impacto maior no sistema.

Além disso, a luz LED pisca constantemente, o que pode interferir na identificação. Hoje em dia as câmeras já vêm equipadas com função antiestroboscópica, mas mesmo assim as frequências de algumas luzes podem não corresponder.

Yunjian Insight: O problema de identificação de semáforos também deve ser encontrado por outros sistemas.

Hou Cong:Mesmo. Os princípios são semelhantes, mas como o hardware é diferente, os métodos serão diferentes. Quanto mais fortes forem as capacidades do seu hardware, mais métodos você poderá usar. O ponto mais importante é quantas situações diferentes em todo o país os dados cobrem.

Insight: Qual é o limite superior dos recursos do modelo AD Pro baseado no Horizon J5?

Hou Cong:Funciona melhor na rodovia.

Yunjian Insight: Yu Kai mencionou anteriormente que o poder de computação da CPU do chip J5 era insuficiente devido ao investimento insuficiente de recursos naquele ano. Mas a NVIDIA investe sempre à frente da curva.

Hou Cong:Todo mundo tem ideias diferentes. A NVIDIA está se tornando de ponta, mas seus custos existem e ela não pode continuar. É mais adequado para o modo de auto-estudo. A ecologia é relativamente completa e o custo de desenvolvimento é relativamente baixo. Mas se você quiser fazer um modelo econômico, ainda terá que escolher um chip mais econômico.

Insight: você usa apenas chips Horizon?

Hou Cong:O objetivo do design do nosso sistema é ser capaz de se adaptar a uma variedade de chips. Para atingir esse objetivo, fizemos alguns sacrifícios. Podemos não maximizar o papel de cada chip em 100%, mas é bom o suficiente. Talvez seja melhor investir mais, mas o retorno marginal é muito baixo. A Horizon é a nossa plataforma e parceiro mais importante agora, e com certeza iremos desenvolvê-la. Mas o nosso sistema não foi concebido apenas para o horizonte.

Nossos microônibus sempre usaram NVIDIA. Quando eu estava trabalhando no L4 no início, usei NVIDIA Xavier para acesso ao Sensor e também executei alguns algoritmos. NVIDIA Orin será lançado em 2022 e seremos os primeiros usuários. Naquela época, cooperamos com um fabricante e migramos o sistema de computadores industriais para NVIDIA Orin em um mês. Este parceiro é uma empresa de renome internacional. Ela relatou esta situação à NVIDIA. A NVIDIA destacou isso na conferência GTC daquele ano. Cooperamos com duas empresas automotivas.XiaopengeMuito kryptoniano) em paralelo, o primeiro a usar chips Orin duplos da Nvidia.

Insight: O que você acha da transição da Nvidia da fabricação de chips para a fabricação de soluções de direção autônoma?

Hou Cong:Ela precisa construir um projeto modelo para ajudá-la a ver o futuro dos chips com mais precisão. Quanto poder de computação é necessário e quais funções o sistema precisa devem ser conhecidas.

Na verdade, publicou um artigo completo há seis ou sete anos, mas nunca conseguiu trabalhar nele. Wu Xinzhou foi punido no passado, mas não completamente. Julgo que talvez seja melhor criar um modelo. Se isto for bem feito, poderá ser transformado numa solução padronizada e poderemos avançar um passo mais.

Depois de construir o projeto do protótipo, você também pode ajudá-lo a vender chips.

Yunjian Insight: É necessária muita mão de obra para entregar cada modelo que fabrica? Ou é uma solução geral que pode ser usada para todos os carros?

Hou Cong:Depende de como o sistema o identifica. Na verdade, isso é muito crítico. A Huawei, por exemplo, definitivamente espera se tornar um superfornecedor e reduzir custos de entrega. Os sensores da Huawei são todos definidos por si só, mas geralmente os fabricantes de automóveis irão substituí-los de acordo com a sua própria cadeia de abastecimento. Em primeiro lugar, não altera a câmera, e até a posição de instalação é relativamente padrão. As câmeras frontal e traseira de seu modelo são colocadas juntas em um módulo. Desta forma, a posição de instalação é relativamente fixa e os custos de adaptação subsequentes são reduzidos. As localizações aproximadas de SUVs e sedãs são as mesmas e os modelos são iguais, portanto o custo de entrega deve ser baixo.

Eu não quero mais ser o Nível 1

Yunjian Insight: Você acabou de dizer que tudo que Tesla fez foi certo, exceto Robotaxi, incluindo a fabricação de seus próprios chips?

Hou Cong:certo. Ele fabrica dois chips próprios, um para o carro e outro para o off-line. Em 2019, o veículo não tinha um chip de alto poder de computação. Foi capaz de fazer BEV tão cedo por causa desse chip.

O chip Orin da Nvidia não será lançado até 2022, mas a Tesla já produziu um BEV em 2021, liderando o mercado por mais de um ano. Ela usou primeiro os chips da Mobileye e, mais tarde, o Drive PX da Nvidia. Os preços da Nvidia não conseguiram cair, então ela teve que fabricar os seus próprios para reduzir custos.

Yunjian Insight: Então, é razoável que as montadoras aprendam com a Tesla e desenvolvam seus próprios chips?

Hou Cong:Tesla tem tamanho para fazer isso. Outros fabricantes de automóveis aprenderam desta forma, o que pode não estar correto.

Yunjian Insight: As montadoras, as empresas de chips e os fornecedores de soluções de direção autônoma estão atualmente reinventando a roda. Como você acha que a divisão da indústria evoluirá no futuro?

Hou Cong:Deixe o mercado provar tudo. O objectivo de fazer isto não é necessariamente simples. Pode haver outros objectivos, tais como moldar a imagem das marcas tecnológicas, incluindo a gestão do valor de mercado e a atracção de talentos.

Teoricamente falando, em termos de segurança e custo da cadeia de abastecimento, as montadoras têm certas vantagens em chips autodesenvolvidos, mas o custo geral deve ser considerado. O maior problema em fazer um chip é que você simplesmente o fabrica e descobre que existe um novo algoritmo e que seu hardware está lento. Todo mundo corre para fazer esse algoritmo e seu chip não pode ser usado.

Insight: você está falando sobre o Horizon J5?

Hou Cong:J5 é um estudo de caso. Mas acho que não é só o J5, aquela geração de chips, desde que não sejam universais, todos têm esse problema.

Yunjian Insight: A arquitetura técnica está estabilizada agora?

Hou Cong:Não. O Transformer também está sendo desafiado agora e existem tecnologias novas e mais eficientes. Haverá também um processo de convergência.

Yunjian Insight: É razoável que os fabricantes de chips desenvolvam soluções de direção inteligentes?

Hou Cong:Não creio que a vantagem seja óbvia. Quando os fabricantes de automóveis cooperam com os fabricantes de chips, eles podem esperar obter alguma ajuda, o que envolve algum desenvolvimento subjacente, seja drivers, software subjacente, processamento de sinais de sensores ou raciocínio de rede neural. No entanto, o custo para os fabricantes de chips fornecerem tais serviços. é bastante alto e não pode atender todas as residências.

A menos que você consiga tornar a cadeia de suprimentos muito madura, mas isso leva tempo. É difícil para as empresas iniciantes de chips atingirem tal maturidade nesta área, e elas devem se conter. Alguns parceiros ecológicos podem dominar o mercado. No entanto, os fabricantes de automóveis também têm necessidades de autodesenvolvimento e não querem depender de parceiros ecológicos. Também leva tempo para que os parceiros ecológicos cresçam e é impossível preencher rapidamente este mercado.

Neste momento, os fabricantes de chips certamente sentirão que podem resolver esses problemas fazendo eles próprios.

Insight: quantas pessoas você precisa para concluir um projeto?

Hou Cong:De modo geral, o primeiro projeto é o que exige mais mão-de-obra e o investimento diminui à medida que os projetos avançam.

Insight: quantos projetos você pode realizar ao mesmo tempo agora?

Hou Cong:Dois ou três projetos. O investimento actual num único projecto ainda não é o ideal. Após o quinto projeto, basicamente cada projeto requer apenas algumas dezenas de pessoas para ser concluído, e não há problema em realizar cinco ou seis projetos.

Yunjian Insight: Os fornecedores de direção autônoma deveriam contratar mais pessoas para assumir mais projetos ou deveriam controlar o tamanho de sua equipe e assumir apenas um número limitado de projetos?

Hou Cong:Observe os objetivos estratégicos. Se você quer ocupar o mercado, ampliar a escala, continuar captando recursos, abrir o capital e assumir mais projetos dessa forma de destaque. Outro tipo é estabelecer primeiro benchmarks, cultivar capacidades, padronizar produtos e depois copiá-los rapidamente. Começa com apenas um ou dois projetos, estabelecendo primeiro benchmarks, mas os produtos são padronizados e não haverá muita customização para divulgação posterior. Essa é outra ideia.

Insight: Por que você escolheu o segundo caminho?

Hou Cong:Porque quanto mais recebermos agora, mais perderemos, e o negócio está sob grande pressão operacional. Achamos que o mercado final deve ser limitado a apenas alguns fornecedores e que a padronização dos produtos deve ser bem feita.

Insight: À medida que esta indústria evolui, que papel você desempenhará na cadeia no futuro?

Hou Cong:Desenvolveremos pelo menos um ou dois chips em uma determinada categoria de produtos de médio a alto padrão e forneceremos uma solução padronizada. Poderemos eventualmente nos tornar uma empresa de nível 2. Fazemos algoritmos e entrega de software, mas não fazemos o conjunto completo. Existe um fornecedor de sistema que resolve essas coisas.

Insight: por que você não faz o nível 1?

Hou Cong:Não fazemos sistema Tier 1, mas fazemos software Tier 1 (sistema Tier 2). O sistema Tier 1 requer muito hardware, o investimento é muito grande e o lucro é relativamente pequeno. Também consideraremos esta direção, mas atualmente o Nível 2 é mais viável.

Yunjian Insight: O nível 1 é responsável por ser o controlador de domínio?

Hou Cong:Ainda tenho que fazer entregas. Será mais intensivo em mão de obra, o que não é nossa vantagem.

Insight: Quais são suas vantagens?

Hou Cong:Ainda fazendo algoritmos e produtos. Acho que Qingzhou não é uma empresa geneticamente capaz de atingir hardware de nível 1. É um tipo diferente de empresa, como Desay SV e Joyson Electronics.

Insight: Mas sua cooperação com a Ideal é que você é o Nível 1 do Horizon.

Hou Cong:Somos como software Tier 1. O nível 1 ainda existirá por um tempo no curto prazo, mas eventualmente será padronizado. Depois disso, fabricaremos nosso próprio hardware ou faremos o nível 2.

Yunjian Insight: Então, na sua opinião, no futuro, os fornecedores de soluções de direção inteligente irão cooperar com empresas automotivas, sistema Tier 1, algoritmo Tier 2 e chip Tier 2?

Hou Cong:certo.

Yunjian Insight: O chip Tier 2 não pode fazer o trabalho do algoritmo Tier 2?

Hou Cong:Veja se ele é melhor nisso do que nós.

Yunjian Insight: Se ele fornece um algoritmo padronizado, então os chips Tier 2 também deveriam querer fazê-lo.

Hou Cong:Por que ele tem que fazer isso sozinho? Apenas coopere conosco.