notícias

Hou Xiaodi, o homem corajoso e cauteloso

2024-08-06

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Agora não é hora de competição na indústria de direção autônoma.


Texto | Tian Siqi
Fonte do artigo|Jia Zi Guangnian (ID: jazzyear)

Ao mesmo tempo que a Tesla anunciou o seu relatório financeiro do segundo trimestre, Musk anunciou oficialmente que o lançamento do seu produto Robotaxi seria adiado do início de agosto para o início de outubro. Hou Xiaodi, que tal como Musk tem o seu negócio enraizado no Texas, confirmou mais uma vez a sua identidade de “profeta”.

Anteriormente, Hou Xiaodi era mais conhecido por sua jornada da confiança à suspeita, da cooperação à separação, com a TuSimple, a “primeira empresa de condução autônoma” que ele cofundou.

Depois de abrir o capital em abril de 2021, o patrimônio líquido de Hou Xiaodi já ultrapassou US$ 1 bilhão. No entanto, com o lançamento de investigações e supervisão por parte do Comité de Investimento Estrangeiro nos Estados Unidos (CIFUS), Tucson passou por uma turbulenta mudança de gestão. Hou Xiaodi foi primeiro promovido do cargo de CTO a CEO e foi demitido pelo conselho de administração em outubro de 2022, então ele e outro cofundador destituíram o antigo conselho de administração por meio de uma supervotação 10 dias depois, mas ele nunca foi; capaz de retornar à gestão da empresa em março de 2023, Hou Xiaodi finalmente anunciou sua saída completa de Tucson.

Antes do fechamento do capital em fevereiro de 2024, o preço das ações de Tucson também despencou de um máximo de quase US$ 80 para menos de US$ 1.

Algumas pessoas dizem que a relação entre Hou Xiaodi e Tucson é como o papel de Oppenheimer no Projeto Manhattan no passado. Tal como Oppenheimer teve de enfrentar dúvidas e escrutínio de todos os lados nos anos do pós-guerra, as decisões e acções de Hou Xiaodi na Tucson Future são sempre colocadas sob uma lupa, e cada escolha que ele faz pode tornar-se controversa.

Mesmo assim, Hou Xiaodi ainda tem orgulho de dizer a "Jiazi Guangnian" que Tucson é a primeira empresa no mundo a testar caminhões pesados ​​totalmente sem motorista em estradas abertas e alcançou a primeira metade do jogo de direção sem motorista - fazendo Não há sistema redundante de segurança.

Em maio deste ano, a CIFUS chegou a um acordo com Tucson. De acordo com o anúncio de Tucson, esta investigação não encontrou nenhuma violação por parte da empresa, incluindo a anteriormente comentada “transferência de tecnologia”. Depois de deixar Tucson, Hou Xiaodi mais uma vez se dedicou ao empreendedorismo de caminhões sem motorista de nível L4 e fundou uma nova empresa Bot.Auto nos Estados Unidos.

Quando a condução assistida L2 substituiu gradualmente a condução sem condutor L4 na opinião pública, Hou Xiaodi insistiu na investigação e desenvolvimento do L4 e conduziu nesta estrada prudente e corajosa. Mas ele vê a direção diferente da corrente principal como uma oportunidade emocionante: "Ou você se torna um bom aluno com 100 pontos todos os dias, ou aproveita uma oportunidade única na vida para impactar uma visão revolucionária, mesmo que haja é maior incerteza e menos consenso da indústria, também estou disposto a fazer um milagre com uma pequena probabilidade. Claro, nossa equipe tem habilidades únicas e trabalha em conjunto, acredito que podemos alcançar esse milagre.”

A sua visão revolucionária é fazer com que os camiões sem condutor operem a um custo por quilómetro inferior ao dos humanos, com base no conceito de Transporte como Serviço (TaaS), criando assim mais valor social. Do ponto de vista financeiro, o ponto central para a realização dos sonhos foi inicialmente determinado como o primeiro semestre de 2026.

Nesta entrevista exclusiva, Hou Xiaodi comentou acontecimentos do setor como o adiamento do Robotaxi e a saída da “Carrot Run” nacional, e fez diversos julgamentos que não podem agradar a todos, como “O público tem muitas críticas sobre a direção autônoma , porque todos Todos eles pensam que podem dirigir.

Coagida pela torrente dos tempos, a história de Hou Xiaodi e TuSimple está destinada a se tornar uma reviravolta trágica e trágica. Isto lembrou-lhe que a criação e a proteção são igualmente importantes e a proteção é mais difícil, por isso desta vez ele escolheu o papel de guardião. “No passado, eu me colocava muito em posições técnicas e ser muito habilidoso equivale a uma beleza encobrindo todas as falhas”, disse Hou Xiaodi, “mas agora ainda tenho que me transformar em um guerreiro hexagonal para proteger o empresa em todos os aspectos”.

A seguir está a entrevista completa, editada e organizada:


Desafios de segurança do Robotaxi e L4

Jiazi Guangnian: Em primeiro lugar, gostaria de parabenizá-lo por mais uma vez se tornar um verdadeiro profeta no que diz respeito ao adiamento do Robotaxi.

Hou Xiaodi: Então todos deveriam se acostumar com isso. Eu já disse que a lei de escala não é a resposta e me oponho firmemente ao direito de escala. Por exemplo, na conferência GTC, todos sentiram que a NVIDIA era onipotente, mas eu senti que a melhoria de desempenho da NVIDIA na computação de ponta atingiu seu limite.

Costumo deitar água fria no entusiasmo das pessoas, o que reflete essencialmente a minha atitude diferente em relação às expectativas futuras. Se você quer uma previsão ousada, basta ter uma atitude otimista. Mas se você quiser uma previsão precisa, baseie-a no conhecimento e na lógica. Tomemos como exemplo a física do ensino médio. Os civis podem falar sobre a água se transformando em óleo ou máquinas de movimento perpétuo, mas contanto que você tenha aprendido a conservação de massa e energia e depois ouça sobre máquinas de movimento perpétuo, saberá que elas estão enganando. .

Para mim, quando vejo uma previsão, o que realmente preciso pensar é no suporte teórico por trás do problema. A tendência futura de desenvolvimento da tecnologia é restringida pelas leis da física e da matemática. Devemos respeitar estas restrições.

Jiazi Guangnian: Você disse antes que o Robotaxi de Musk não pode ser construído, e agora seu lançamento foi adiado novamente, o que confirma parcialmente sua afirmação. O que você acha da decisão de adiar?

Hou Xiaodi: O desempenho atual do Robotaxi está longe do verdadeiro L4. Há alguns meses, um amigo meu elogiou tanto Tesla que sugeri que ele fizesse um teste no Waymo. Como resultado, ele me disse naquele dia: “Xiaodi, andei em Waymo. Tesla é realmente um lixo”.

(Observação: Waymo é uma empresa autônoma de propriedade da Alphabet, controladora do Google, e lançou serviços de táxi sem motorista na Califórnia, Texas e outros lugares.)

Robotaxi não é lançado corrigindo um ou dois bugs e atrasando-o por dois meses. Por isso continuo prevendo: 10 de outubro ainda não será o momento em que o Robotaxi será realmente lançado, e mesmo no próximo ano não será o momento em que poderá ser aplicado. Na melhor das hipóteses, não haverá pistas de quando o Robotaxi será realmente lançado em outubro.

Jiazi Guangnian: Por que você acha que o Tesla Robotaxi não pode ser feito depois de andar no Waymo?

Hou Xiaodi: O comportamento de Waymo pode lhe dar maior certeza. Quando testei o Tesla da minha esposa, que é a versão mais recente do FSD, vi que muitos saltos de comportamento eram muito graves e não foram projetados na perspectiva de minimizar a responsabilidade por acidentes de trânsito. pobre e me faz sentir que não está no nível L4.

Além da essência técnica, existe também a essência comercial. Há uma piada sobre o que aconteceria se alguém morresse enquanto dirigia um FSD em um Tesla? Minha resposta é um trocadilho: não é da conta deles. Em termos de divisão de responsabilidades, Tesla afirma definitivamente que o condutor é totalmente responsável (o sistema avisa claramente que ao utilizar o FSD, o condutor deve manter as mãos no volante do início ao fim e continuar a prestar atenção às condições da estrada) , e não tem nada a ver conosco; em segundo lugar, este não é o seu modelo de negócio. O negócio da Tesla é vender carros, e o FSD é o valor agregado da venda de carros. Se você quiser considerar como vender mais carros, você não pode se aprofundar em uma área limitada como L4 e resolver todos os casos extremos (situações extremas) nesta área.

Jiazi Guangnian: Então você acha que a lógica não é minimizar os acidentes de trânsito, mas maximizar os interesses comerciais e, ao mesmo tempo, minimizar a responsabilidade da Tesla.

Hou Xiaodi: A primeira é minimizar a responsabilidade da Tesla e a segunda é maximizar os interesses comerciais. Existem agora três casos, melhor caso (melhor caso), caso médio (caso médio) e pior caso (pior caso). Tesla otimiza o melhor cenário. A condução assistida em si tem o seu próprio valor. Desde que os consumidores a reconheçam, a sua missão foi alcançada.

Jiazi Guangnian: Musk não apresentou muitos detalhes sobre como buscar a aprovação regulatória na reunião de relatório financeiro, mas sempre enfatizou que Tesla é uma solução chamada universal, que pode ser melhor do que a solução mais localizada de Waymo, Waymo, que é muito frágil. .

Hou Xiaodi: Este é um sofisma típico. Como você define vulnerabilidade? Posso viajar pelo mundo, posso fazer isso em todas as cidades, mas você só pode fazer isso em uma pequena área, então você fica vulnerável. Mas a questão da competição L4 era se poderíamos ter um bom desempenho nesta pequena área limitada. Como resultado, ele disse, eu não compito com você nisso, eu compito com você naquilo. Isso equivale a perguntar quem é mais bonito, eu ou o Sr. Xu do norte da cidade. Ele insiste que eu não sou mais bonito do que quem sou mais inteligente. é mais inteligente que você e mais bonito que você? Ele também disse que eu corri rápido. De qualquer forma, não quero competir abertamente num ambiente limitado.

Não existe uma tecnologia única que possa ser utilizada para a condução sem condutor em qualquer parte do mundo, tal como não existe um único atleta nos Jogos Olímpicos que possa ser utilizado tanto para corridas de longa como de curta distância. Se você estiver fazendo uma cena limitada, faça-a bem. Se você quer vender carros em todo o mundo, não construa uma marca de automóveis, apenas diga que é L2+. Não gosto de confundir as massas através do marketing, quanto mais alto o barulho, mais pressão há sobre as pessoas sérias.

Jiazi Guangnian: Atualmente, os desafios técnicos da L4 ainda são relativamente grandes. A que níveis especificamente se referem?

Hou Xiaodi: De modo geral, não é difícil para quem consegue dominar, mas não é difícil para quem é difícil. Acho que nossa equipe pode superar as dificuldades que outros enfrentaram, uma por uma, e fazer alguma inovação e desenvolvimento adicional com base no papel.

O núcleo do L4 sem driver é como completar um sistema estável, especialmente usando módulos instáveis ​​para completar um sistema estável. Por exemplo, se a câmera não conseguir detectar um objeto em um quadro, esse tipo de coisa certamente acontecerá. Como garantir que nosso sistema não entre em colapso é a chave.

A maneira estúpida é reduzir o tempo de falha de 100.000 quilômetros para o tempo de falha de 1 milhão de quilômetros, para que o sistema fique estável. A maneira inteligente é inovar no nível da arquitetura, de modo que, se um módulo falhar, haverá outros módulos para encobri-lo. Implementamos mais algumas camadas de planos de cobertura em andamento para que possamos lidar com a falha do sistema a qualquer momento. As aeronaves da aviação civil são um sistema redundante típico. As aeronaves geralmente possuem dois motores, projetados para serem funcionalmente seguros e independentes um do outro. A segurança do sistema é alcançada através de uma arquitetura mais avançada, e não através da criação de um mecanismo único que nunca falha.

Jiazi Guangnian: Isso é para nos prepararmos para a redundância de segurança.

Hou Xiaodi: Especificamente, é para tornar possível a redundância de segurança na engenharia. No actual nível tecnológico, a utilização de componentes maduros fornecidos pelo ecossistema da indústria para construir um sistema seguro e redundante é a tarefa mais importante da condução autónoma.

Algumas pessoas também dizem que L2 pode evoluir gradualmente para L4, mas não concordo com isso. Nossa pesquisa L4 gasta 70% do nosso tempo em sistemas redundantes. Não importa quão boa seja a função L2, ela só pode completar no máximo três funções de L4, e os 70% restantes das funções não foram tocados. A Tesla não é uma empresa L4, mas sim uma empresa L2+, e muitos dos seus projetos não são para fins de segurança ou redundância.


Transporte como serviço

Jiazi Guangnian: Você sempre aderiu à rota L4, mas agora a indústria e o público parecem estar discutindo mais a direção assistida L2 do que a direção autônoma.

Hou Xiaodi: O sucesso do Bot.Auto e eu não tem nada a ver com o fato de ele ser popular. Não precisamos da aprovação de todos. Se conseguirmos realmente criar valor económico ou mesmo valor social, isso é suficiente.

A rota técnica é determinada por leis objetivas, e a correção da rota tem pouco a ver com o fato de ser um consenso. Especialmente no domínio da condução autónoma. O público tem muitas críticas sobre a direção autônoma, não porque todos sejam praticantes sem motorista, mas porque todos pensam que podem dirigir. Se você pensar em um “consenso” sobre tecnologia sem motorista discutido por um grupo de motoristas humanos, ele conteria muitas coisas não confiáveis. Se realmente desenvolvermos de acordo com o julgamento do público, será um beco sem saída.

Em comparação com as pessoas que sabem dirigir, há muito menos pessoas que sabem dirigir foguetes. Portanto, o campo da fabricação de foguetes é relativamente sortudo e não houve muitas tragédias em que o consenso leigo orientasse a rota técnica dos especialistas. Com base nessa ideia, o campo LLM é a área mais atingida por esse tipo de “ruído de rota”.

Esse tipo de ruído no trajeto, por sua vez, causa grande impacto nos praticantes de direção autônoma e até os prejudica. Deveríamos suportar a pressão e resistir ao ruído e ater-nos aos objectivos de longo prazo, ou deveríamos dizer primeiro o que os investidores gostam de dizer e obter financiamento e sobreviver para cumprir os objectivos de curto prazo? A maioria das pessoas realmente escolhe o último.

Torne-se um bom aluno com 100 pontos todos os dias ou aproveite uma oportunidade única na vida para impactar uma visão revolucionária. Há maior incerteza e menos consenso na indústria, e estou disposto a fazer milagres com uma pequena probabilidade. É claro que toda a nossa equipe tem habilidades únicas e trabalhamos juntos como um só, acredito que podemos realizar esse milagre.

Quem investe naquilo que os investidores gostam e fala todos os dias sobre pontos de vista consensuais está apenas aproveitando o processo de abertura de um negócio. Mas não gosto do processo de abertura de um negócio, só vejo o resultado final. No final, é a luz da esperança de que esta causa possa ser concluída com sucesso e esta visão última que me atrai. Para conseguirmos fazer as coisas, temos de respeitar as leis inevitáveis ​​da ciência e dos negócios, e não precisamos de atender à percepção pública. Em muitos casos, temos mesmo de resistir à tremenda pressão provocada por ir contra a percepção pública e aderir à verdade.

Jiazi Guangnian: Se algo for diferente da percepção pública, isso aumenta o seu apelo para você?

Hou Xiaodi: É diferente do mainstream. O próximo trabalho essencial é um processo de busca da verdade baseado em fatos. Se, no final das contas, essa “cognição diferenciada” for lógica, então pode-se dizer que ela tem grande valor e potencial. Mas descobrir percepções diferentes não significa que haja novas oportunidades! Claro que eu ficaria animado. Um exemplo típico é que todas as empresas que fabricam caminhões sem motorista nos Estados Unidos são SaaS, que é o modelo Software as a Service (Software como Serviço). Claro, eles também podem empacotá-lo como Hardware como serviço (hardware como serviço) sem alterar o medicamento. Em essência, eles estão vendendo produtos semiacabados. Nós, Bot.Auto, somos a única empresa que opera Transporte como Serviço e comercializamos serviços de transporte.

Jiazi Guangnian: Como definir o Transporte como um Serviço?

Hou Xiaodi: Se você tiver a mercadoria, eu a transportarei até você. Nossos clientes não precisam saber se a mercadoria é transportada por condução não tripulada ou tripulada. De qualquer forma, a capacidade de transporte é suficiente e o frete é acessível. Outros estão vendendo software de direção autônoma. O problema é que existem apenas 20 clientes nos Estados Unidos que podem comprar software de direção autônoma.

Jiazi Guangnian: Sob o conceito de Transporte como Serviço, qual é a sua visão revolucionária?

Hou Xiaodi: Deixe o custo operacional por quilômetro de direção autônoma ser inferior ao dos humanos.

Jiazi Guangnian: Quando isso poderá ser realizado?

Hou Xiaodi: No primeiro semestre de 2026. Ainda faltam dois anos para trabalhar duro novamente.

Jiazi Guangnian: Este momento é um consenso da indústria?

Hou Xiaodi: Claro que não é um consenso. Outros não acreditam e os colegas não têm a capacidade de indicar um momento. Por exemplo, a história contada pela Waabi (uma empresa de condução autônoma fundada em 2021) é que a simulação é a melhor do mundo. Tudo é igual ao mundo real e não há problemas que a simulação não possa resolver. Mas não acredito nesta história, porque o último 1% dos problemas de simulação são os mais difíceis. O absolutismo neste ponto não está em consonância com a eficiência económica.

Claro, este é apenas o meu julgamento técnico e o julgamento do caminho derivado. Para ser justo, todos vivem de acordo com suas próprias crenças, e o processo de iniciar um negócio consiste em concretizar suas crenças.

Jiazi Guangnian: Você disse que muitas pessoas apontam o dedo para a direção autônoma porque acham que podem dirigir. Isso é semelhante a como, após o vestibular, todos apontam para questões dissertativas em vez de discutir questões de matemática?

Hou Xiaodi: Isso mesmo. A maioria das pessoas consegue ver as semelhanças nos fenômenos L2/L4, mas não consegue ver a lacuna na arquitetura e no design do sistema entre L2/L4. Aviões e foguetes estão voando no céu. Um leigo pode facilmente ver que os aviões estão voando cada vez mais rápido e substituirão os foguetes em dois dias. Mas se você estudou física, sabe que os aviões não podem voar para fora da atmosfera, mas os foguetes podem. Os que estão de fora confiam em extrapolações excessivamente otimistas, enquanto os verdadeiros que estão dentro retornam ao essencial da física.

Jiazi Guangnian: Domestic Carrot Run tem se tornado muito popular recentemente e as pessoas estão criticando muito, tanto no nível técnico quanto no social. Você prestou atenção em como ele está funcionando?

Hou Xiaodi: Em primeiro lugar, devo confirmar que isso é bom e quero aplaudir o Baidu. Os primeiros promotores que estão no centro das atenções enfrentarão enormes mal-entendidos por parte do público. Educar o público sobre esse processo é benéfico para todo o setor.

Mas ainda devo dizer que as discussões a nível social são extremamente chatas, extremamente desordenadas e extremamente ineficazes. Alan Kay (vencedor do Prêmio Turing em 2003) disse que as pessoas sempre superestimam os avanços tecnológicos de curto prazo, mas subestimam o impacto da tecnologia a longo prazo. Qual será o impacto da implantação de 400 carros autônomos sobre os motoristas de táxi? O lançamento de 400 veículos hoje tem um bom efeito, mas se alguém está preocupado com o lançamento de 40.000 veículos amanhã, isso é puramente infundado. Actualmente, ninguém tem capacidade para promovê-lo em tão grande escala. Este é precisamente o problema da produção técnica que a condução sem condutor precisa de resolver.

Pensar que a condução autónoma será possível amanhã é um sinal de que estamos a sobrestimar os avanços a curto prazo. Ao mesmo tempo, o público tende a subestimar o impacto a longo prazo. Por exemplo, a nossa estrutura fiscal e os nossos hábitos de viagem mudarão no futuro? Como o planejamento urbano mudou? Mais áreas suburbanas podem tornar-se habitáveis ​​e as pessoas podem trabalhar enquanto se deslocam. Esse é o impacto real a longo prazo a considerar.

Jiazi Guangnian: Como você disse antes, vamos imaginar tudo o que existe na ficção científica. Mas há tantas coisas que podem ser feitas com os telemóveis agora que basicamente não estavam escritas em romances há 100 anos, mas que de facto trouxeram mudanças significativas no nosso estilo de vida.

Hou Xiaodi: As invenções tecnológicas são avanços pontuais na complexa rede da sociedade humana, e avanços pontuais podem induzir um grande número de mudanças complexas relacionadas. As limitações da imaginação humana podem tornar impossível pensar com clareza sobre tantos fatores relacionados, por isso não podemos criticar os romances de ficção científica por não serem suficientemente específicos. Temos de admitir que estas ligações são muito complexas e é difícil para nós prever como será a forma social devido às novas tecnologias, mas não devemos ir a extremos no nosso pensamento e levantar questões de desemprego quando surge uma nova tecnologia. fora. Como indivíduo social, pode haver risco de desemprego, quer existam novas tecnologias ou não. Na sociedade como um todo, as novas tecnologias trazem mudanças sociais mais amplas. Esta mudança inclui o surgimento de novas indústrias, o declínio de indústrias antigas e a migração de empregos. Não é de forma alguma um problema de desemprego simples e bruto.


De ponta a ponta, baseado em regras e princípios

Jiazi Guangnian: Como você entende as soluções ponta a ponta que estão sendo promovidas atualmente na indústria de direção autônoma?

Hou Xiaodi: Muitas coisas são ditas indiscriminadamente por pessoas que não conhecem o setor, gerando confusão de conceitos. É como se você dissesse ao Guns N' Roses que sou fã de heavy metal e que você é meu favorito. O Guns N' Roses deve estar preocupado com você, porque eles não são heavy metal, mas hard rock. AC/DC também é hard rock, Judas Priest, Black Sabbath e Metallica são heavy metal.

As pessoas sempre me perguntam, você é de ponta a ponta? Para manter o rigor acadêmico, não somos apenas de ponta a ponta. Mas o que ele realmente quer perguntar é: você adotou tecnologia mais avançada? Claro que sim. A situação atual é que “ponta a ponta” não é um conceito acadêmico, mas sim um portador emocional. Pessoas que não têm conhecimento podem facilmente atribuir seus sonhos inacabados e negócios inacabados no campo do aprendizado de máquina ao conceito técnico específico de "ponta a ponta".

Jiazi Guangnian: Então você acha que o conceito de ponta a ponta "ocupou o ninho da pega" e as pessoas irão igualar ponta a ponta com alta precisão.

Hou Xiaodi: A vantagem de ponta a ponta é que você pode pensar em parte da rede neural como modular, e a largura de banda de comunicação e conexão entre os módulos é muito alta. A segunda vantagem é que a propagação de erros pode ser alcançada durante o treinamento do módulo e os erros podem ser transmitidos para módulos anteriores. Por exemplo, o treinamento no planejamento de movimento pode afetar diretamente a percepção. Mas o fim não é o mesmo que os meios. Você não precisa ficar obcecado com a tecnologia específica de “ponta a ponta”. Muitas outras tecnologias também possuem essas características.

E tenho que criticar a ideia de que “o conexionismo resolve tudo”. Sempre existe um equívoco de que todas as redes neurais devem ser de ponta a ponta. Se eu adicionar algo que não seja uma rede neural, não serei suficientemente puro e revolucionário. As três principais escolas de inteligência artificial – conexionismo, behaviorismo e simbolismo, cada uma tem os seus próprios pontos fortes. Uma doutrina não pode resolver todos os problemas.

Nesse sentido, gosto muito do estilo do DeepMind, como o AlphaGeometry, que resolveu muito bem o problema recentemente, IMO. Do AlphaGo ao AlphaGeometry, o DeepMind sempre foi inclusivo. Ele traz à tona o que há de melhor em todos os gêneros de inteligência artificial. Não se envolverá em disputas doutrinárias, mas sim trabalhará em sistemas para, em última análise, resolver problemas.

(Nota: DeepMind do Google usou os dois sistemas AlphaProof e AlphaGeometry2 para atingir o nível de medalhista de prata na Olimpíada Internacional de Matemática de 2024)

Jiazi Guangnian: A falta de explicabilidade de ponta a ponta é um grande obstáculo?

Hou Xiaodi: Sim! O que é ainda mais escandaloso é que algumas pessoas empacotam a falta de explicabilidade de uma forma da qual não se envergonham, mas da qual me oponho ainda mais. Musk diz com facilidade todos os dias que não escreveremos mais código. Mas suas palavras são publicidade e marketing. A prática da engenharia é muito mais complexa do que ele disse. Apenas um NaN (não é um número) causado pela não convergência durante o processo de treinamento, quantos engenheiros foram mortos?

O treinamento real de uma rede ponta a ponta ainda é um modelo de desenvolvimento "estilo oficina" cheio de metafísica e que requer polimento manual por "mestres" nesta fase, em vez do modelo de desenvolvimento de uma fábrica automatizada. Depois de ver quais detalhes precisam ser melhorados, você deve primeiro congelar outras partes irrelevantes da rede, depois preparar uma quantidade "apropriada" de dados de treinamento, como um chef chinês fritando, e então continuar a treinar, testar e iterar.

O argumento mais extremo que ouvi é que a distância de condução autônoma pode ser conquistada, o que é um caso extremo de dezenas de milhões de quilômetros e muito poder de computação. Isso é típico de viver em seu próprio mundo de fantasia. Se a pessoa responsável por ouvir a história (investidor) tem uma atitude subjetiva tão forte em primeiro lugar - se existe um caminho, existe um bom, e deve haver um ruim abaixo - então pense em como a pessoa responsável por contar a história (empreendedor) pode se concentrar. Com a abordagem “baseada em dados” e “de ponta a ponta”, fabricamos visões ultrajantes. Os dois se complementam e é assim que as bolhas são criadas.

Jiazi Guangnian: Existem muitas montadoras no setor que afirmam que suas soluções ponta a ponta serão colocadas no mercado em breve.

Hou Xiaodi: Musk está falando sobre um conjunto de palavras que não podem ser falsificadas no curto prazo. Não pergunte por que o Robotaxi de ponta a ponta ainda não pode ser feito. Basta perguntar, não se preocupe, estamos treinando a próxima versão. Simplesmente não temos capacidade de computação ou dados. Certa vez, postei uma foto no WeChat Moments mostrando uma cenoura pendurada na frente de um burro. Este é o estado dos acionistas da Robotaxi e da Tesla.


Fonte da imagem:X

Além disso, Musk é uma pessoa de sucesso. Acreditar em Musk e segui-lo também é politicamente correto no atual círculo de capital de risco. Por outro lado, este conjunto de palavras infalsificáveis ​​é fácil de usar e adequado para todas as idades. Equipes técnicas de segunda e terceira categoria podem descrever perfeitamente sua lacuna técnica como uma lacuna em dados e poder de computação. Se os dados não forem suficientes e o poder de computação não for suficiente, você será solicitado a enviar dinheiro! Este é o circuito fechado perfeito.

Jiazi Guangnian: Existem outras escolas além da deles? Você acha que ainda é uma escola mais tradicional e baseada em regras?

Hou Xiaodi: Baseado em regras em si é um conceito pouco claro. As pessoas podem ser muito subjetivas sobre o que é baseado em regras. Isso facilita o abuso e eventualmente se torna uma “arma” para expressar emoções subjetivas, em vez de uma “ferramenta” para explorar a lógica objetiva. Meu ex-colega e ex-cientista-chefe de Tucson, Wang Naiyan, mencionou princípios baseados em vez de regras em seu blog, com o qual concordo.

Todo mundo estigmatizou o método baseado em regras, como se todo método baseado em regras consistisse em dezenas de milhares de if elses. Mas se você tiver que argumentar, a própria rede neural é, na verdade, um enorme sistema baseado em regras. Abra o interior da rede, que contém operadores lineares e operadores não lineares. Cada operador não linear é uma implementação específica de if else, e a rede neural é um enorme sistema baseado em regras composto por bilhões de if elses.

Se alguém na indústria escreve dezenas de milhares de if elses em uma linguagem de programação, é simplesmente porque seu nível de implementação de engenharia é muito baixo. Os sistemas baseados em regras não deveriam permitir a existência de dezenas de milhares de if elses em nenhuma circunstância. Este é o resultado final. A segunda conclusão é que, por exemplo, quando um veículo pode cruzar a linha dupla amarela, uma, duas ou três condições devem ser claramente definidas. No meu caso, isso é chamado de baseado em regras. Eu tenho esse ponto de vista forte. Enquanto eu ainda estiver liderando a equipe para fazer a direção autônoma L4, nosso sistema deve incluir regras ou princípios. Eu não permitiria que um sistema L4 completamente sem princípios fosse colocado na estrada. Este é o resultado final da segurança.

A base do nosso sistema é um modelo básico. Mas, com base nisso, enfatiza o design e a implementação da interpretabilidade. Internamente chamamos esta estrutura de Fundação para todos (F2A). ‍

Jiazi Guangnian: Você tem buscado uma explicabilidade completa.

Hou Xiaodi: L4 deve ser interpretável e não pode confiar apenas em caixas pretas de dados pouco claros.

Existem três elementos aqui: requisitos, métodos de design e implementação de engenharia. A interpretabilidade é um requisito, seja baseado em princípios ou em aprendizagem, é um método de design e escrever if-else é uma implementação de engenharia. A demanda existe objetivamente. Não negue a demanda só porque o método tem limitações. É por isso que eu disse que L4 deve ser interpretável.

Entre diferentes métodos de design, é provável que exista eu entre vocês e você entre mim. Seu valor está em destacar as principais contradições, e não em argumentar - se você argumentar, todas as redes neurais são sistemas baseados em regras. No final, a lacuna de qualidade na implementação da engenharia é maior do que a lacuna entre humanos e cães. Não podemos usar uma implementação de engenharia deficiente para negar o papel orientador dos métodos de design.


O que caminhões e robôs têm em comum

Jiazi Guangnian: Quais são as diferenças entre os desafios técnicos de caminhões e automóveis de passageiros? Por que achamos que o progresso dos camiões autónomos é mais lento do que o dos automóveis de passageiros?

Hou Xiaodi: Os caminhões estão mais próximos da comercialização. É por isso que continuarei trabalhando com caminhões não tripulados depois de deixar Tucson. Os caminhões recebem menos atenção do que os carros, principalmente por causa do VC. Todo mundo gosta de investir em coisas com as quais tem contato diário, como robôs humanóides, mas as regras de trânsito para caminhões são muito mais claras do que para carros, e eles conseguem definir corretamente o que é. circunstâncias que eu deveria. Que tipo de comportamento você tem é o mais importante para mim.

Jiazi Guangnian: Deixe-me começar fazendo uma digressão: qual robô você acha que tem mais perspectivas comerciais?

Hou Xiaodi: A busca atual por robôs humanóides é como: Veja, a tecnologia melhorou, então devemos olhar para este campo, há uma escassez de mão de obra, devemos olhar para este campo; Atualmente, o robô companheiro com o qual todos concordam ainda está longe. O mercado atual de aplicativos para robôs está nas fábricas. Muitos profissionais pensam o mesmo que eu. Os primeiros cenários de aplicação de robôs são determinados cenários. Então, por que precisamos de pernas? Mas as pernas são de fato um ponto de comunicação popular que pode fazer com que o público tenha associações ilimitadas com a ficção científica.

Jiazi Guangnian: Em outras palavras, VC está mais preocupado com produtos to-C, como carros, e produtos legais, como robôs humanóides, que não parecem legais o suficiente. Mas os investidores que se aproximam de você estão pelo menos um pouco interessados ​​em caminhões. Que tipo de pessoas são e quais são suas características?

Hou Xiaodi: Os investidores que se concentram em caminhões são mais pragmáticos. Hoje, as pessoas ainda prestam atenção aos carros sem motorista e mais pessoas olham para caminhões do que para carros. Nos últimos anos, mais pessoas olhavam para carros. Agora que o foco se estreitou, os investidores que conseguem dedicar-se ao negócio da condução autónoma de camiões concentram-se em saber se este pode ser rentável. Isso é muito simples. Basta olhar para os custos operacionais. Com o avanço da tecnologia, podemos obter lucros em alguns anos.

Jiazi Guangnian: Podemos dizer que os VCs que só gostam de ver carros agora estão olhando para robôs?

Hou Xiaodi: Hoje em dia, as pessoas pensam que os caminhões sem motorista podem, até certo ponto, ser considerados robôs. O robô não tem necessariamente pernas e braços e pode funcionar em uma fábrica. Pode ser uma caixa suspensa e circular em vias públicas. Alguns dos critérios de avaliação para robôs podem ser colocados na direção autônoma, então os caminhões autônomos podem atendê-los, e as empresas de direção autônoma são muito baratas em comparação com as empresas de robôs.

Jiazi Guangnian: Quais dos custos atuais são relativamente elevados?

Hou Xiaodi: Posso dar um exemplo de telefone Android. Eu mesmo sou usuário do Android há muitos anos. Os usuários do Android nos primeiros anos usaram essa autodestruição - “Se não estão carregando, estão piscando”. No entanto, à medida que os sistemas de telefonia móvel amadurecem, os eventos de manutenção, como carregamento e flashing, tornam-se cada vez menos frequentes, e a condução autônoma L4 também passará por tal processo.

A nossa principal tarefa é tornar a manutenção diária mais barata, mais curta e mais automatizada. Embora a Bot.Auto tenha a tecnologia líder mundial, não nos anunciamos como uma empresa de tecnologia, mas como uma empresa operacional pragmática. Utilizamos a tecnologia mais avançada do mundo para realizar bem as operações. Não somos um grupo de grandes cientistas algorítmicos. Somos apenas profissionais práticos no setor de logística de frete. O valor criado pela tecnologia deve refletir-se nas operações, e não na beleza da tecnologia em si.

Jiazi Guangnian: Especificamente, como garantir que a manutenção seja mais fácil?

Hou Xiaodi: Por exemplo, ele consegue detectar se a câmera está suja? Quando você limpa a câmera? Quem vai limpar isso? Como limpar isso? Quanto tempo leva para ficar limpo após a limpeza? Provavelmente existem milhares de outras perguntas como esta. Com base na experiência passada, queremos pensar em fazer isto novamente com uma nova tecnologia automatizada sem intervenção do condutor.

Esta indústria enfrenta basicamente dois tipos de problemas. O primeiro tipo de problema é como construir um sistema redundante de segurança. Esta é a primeira metade do jogo. Naquela época, Tucson foi o primeiro e único no mundo a concluí-lo. Há poucos dias (empresa americana de caminhões autônomos) Kodiak completou um teste de motorista no deserto, mas foi em velocidade muito baixa, não em estrada aberta e não teve muita interação com outros veículos. ponto foi o hardware redundante, acho que também deveria aplaudir. Mas Tucson é o único veículo no mundo que completou testes de caminhões pesados ​​totalmente sem motorista em estradas abertas.


Fonte da imagem: TuSimple

Depois de concluída a primeira metade, você terá um sistema que funciona muito bem, mas também é muito caro. No segundo semestre, precisamos de considerar tornar mais baratos os sistemas caros. É isso que estamos a fazer actualmente.

Jiazi Guangnian: Você prestará atenção às tendências de outros caminhões autônomos?

Hou Xiaodi: Conheço um pouco sobre as tendências do setor, mas não presto atenção do ponto de vista da concorrência. Agora simplesmente não é hora de competir. Existem três fases na indústria: alpinismo, corrida e boxe. Estamos todos na primeira fase. A primeira fase termina quando uma empresa eleva os custos operacionais dos carros autônomos à paridade com os dos motoristas humanos. A segunda fase terminará quando a capacidade adicional proporcionada pela condução autónoma exceder a atual escassez de camionistas. Na terceira fase, há competição direta.

Por exemplo, há uma montanha de neve na terra que ninguém jamais escalou. Quero ser a primeira pessoa no mundo a escalar até o topo. Devo correr para escalá-la agora? Não, quero fazer exercícios, examinar o terreno e escalar quando tudo estiver pronto. Isso não tem nada a ver com o fato de eu saber que outros também querem desafiar esta montanha de neve.


A maioria quer recrutar verdadeiros crentes

Jiazi Guangnian: Quantas pessoas existem no Bot.Auto agora?

Hou Xiaodi: Mais de 40 pessoas.

Jiazi Guangnian: Você disse antes que acha que as empresas autônomas não precisam de muitas pessoas. Assim como as empresas de nível modelo, não é algo que exige muita mão de obra.

Hou Xiaodi: Nos últimos anos, precisávamos de muitas pessoas porque não havia nada no ecossistema. Mas agora já não é bárbaro e a maioria das “rodas” de que necessitamos tornaram-se populares. A maturidade das unidades de computação, sensores, etc. é muito maior do que nos anos anteriores. Existem inúmeras plataformas de código aberto disponíveis para treinamento paralelo de grandes modelos, e também existem diversos recursos computacionais na nuvem. A oferta suficiente de “rodas” nos fará repensar a estrutura organizacional.

Há cinco anos, pensei que uma empresa como a Midjourney, ou seja, uma empresa com 10 pessoas que pudesse criar produtos com milhões de utilizadores, seria impossível. Mas agora haverá cada vez mais empresas deste tipo, com menos pessoas focadas no mercado. núcleo no produto.

Jiazi Guangnian: Então será tão fácil quanto comprar um host de computador. Quem você mais gostaria de recrutar nesta situação?

Hou Xiaodi: O que mais quero é recrutar verdadeiros crentes.

Jiazi Guangnian: Como definir o verdadeiro crente?

Hou Xiaodi: A tecnologia é muito importante, mas a batalha pelo campeonato e pelo vice-campeonato nas Olimpíadas geralmente não é determinada pela tecnologia. O empreendedorismo é uma corrida de longa distância, não um sprint. Muitas empresas autônomas morrem de doenças agudas, e não crônicas. Devemos garantir que a empresa seja estável e sobreviva por muito tempo. Quanto a um engenheiro, já não é tão importante se ele resolve um problema específico de engenharia em uma semana ou em uma semana e meia.

Em segundo lugar, quando o capital for muito abundante, terei uma mentalidade de espírito livre e serei movido de forma mais inesperada pelo individualismo. Um projeto de hobby pode alcançar grandes resultados. Assim como o Google sempre disse que o Gmail foi incubado por seu sistema de 20%. O Google disse uma vez que cada engenheiro pode gastar livremente 20% de seu tempo de trabalho).

Mas agora o custo de obtenção de capital é muito elevado, a Reserva Federal não reduz as taxas de juro e o financiamento é muito difícil. Precisamos de nos transformar a nível empresarial, de baixo para cima para cima, de momentos individuais de brilho intelectual para uma estratégia empresarial organizada. Neste caso, a liberdade e o tempo concedidos aos indivíduos serão cada vez menores, o que na verdade está relacionado com a escassez de recursos.

Jiazi Guangnian: Isso é verdade apenas na indústria de direção autônoma ou essa tendência se aplica a todo o campo tecnológico?

Hou Xiaodi: Acho que é toda a indústria de tecnologia. Algumas outras empresas que conheço não dão aos seus funcionários muito espaço para se expressarem. Para ser honesto, também precisamos de avaliar até que ponto a ostentação do sistema dos 20% por parte da Google foi apenas para publicidade.

Jiazi Guangnian: No entanto, as empresas modelo ou equipes estelares mais populares agora não parecem ter muitas pessoas. Elas têm no máximo uma dúzia de pessoas, com um ou dois gênios como líderes de equipe, e criaram produtos muito bons, como. Sora e Pika.

Hou Xiaodi: Na verdade, o que a maioria das pessoas na maioria das empresas fez foi um ou dois passos além da tese, especialmente no nível do software puro. Algumas pessoas também dizem que são todas conchas do modelo Llama. Não concordo com essas afirmações extremas, mas, neste caso, o lampejo de habilidade pessoal não trouxe mudanças radicais.

Jiazi Guangnian: Então você espera que as pessoas que você recruta possam implementar as ideias apresentadas pela empresa de cima a baixo.

Hou Xiaodi: Há cinco anos, abriríamos alguns projetos especiais para atender funcionários famosos, mas agora não o faço. Nosso principal valor é saber se os custos operacionais podem ser menores. Você não pode dizer que publiquei ótimos artigos, mas quero fazer um trabalho de pesquisa básica e preciso de um ambiente livre. Talvez as empresas no passado tivessem o mesmo estatuto de liberdade que as instituições académicas, mas este não tem sido o caso nos últimos anos.

Jiazi Guangnian: Isso fará com que os candidatos pensem que você é muito autoritário.

Hou Xiaodi: Se ele quer liberdade na pesquisa, pode escolher o círculo acadêmico. Ou ele deveria encontrar uma grande empresa com capital e já com monopólio. Nossa pequena empresa deve ter a mentalidade de viver à beira da falência. Mesmo que tenhamos acabado de arrecadar dinheiro, devemos saber que o dinheiro se esgotará muito rapidamente. pesquisar.

Além disso, gostaria de compartilhar uma ideia de governança corporativa “de cima para baixo”. Isso não tem nada a ver com tecnologia. Como uma pequena empresa, como usar profissionais.

Tomemos os advogados como exemplo. Os advogados são divididos em duas categorias, uma é a de consultores jurídicos corporativos e a outra é a de advogados de contencioso. Os assuntos jurídicos corporativos muitas vezes dirão que isso não é compatível e que é arriscado, mas se você não incorporar essas sugestões na estratégia corporativa de cima para baixo, mas aceitar todas elas, então haverá muito pouco que você poderá fazer no final .Os advogados de contencioso litigam ações judiciais todos os dias e vivem uma vida lambendo sangue, então eles não vão te dizer o que não pode ser feito. Eles vão dizer que há riscos se você fizer isso, mas o risco é maior se você não fizer isso. , então você ainda precisa fazer isso. Um bom advogado contencioso não lhe dará avisos de risco, mas fornecerá diretamente uma estratégia geral de cima para baixo.

Se você confiar demais em “profissionais fazendo coisas profissionais” sem ter sua própria espinha dorsal estratégica de cima para baixo, você facilmente entrará em um estado em que não buscará mérito, mas não buscará falhas. Mas as startups sempre nadam contra a corrente, e entrar nesse estado é muito perigoso e pode levar à morte. A essência da sobrevivência de uma pequena empresa é ver se ela consegue criar milagres na direção geral da empresa.

Jiazi Guangnian: De CTO de Tucson nos primeiros dias a CEO e agora iniciando a Bot.Auto, qual é a transição mais difícil?

Hou Xiaodi: Agora precisamos fortalecer nosso estudo em finanças, assuntos jurídicos, financiamento e relações públicas. Eu costumava pensar que bastava que os profissionais fizessem coisas profissionais, mas agora penso que preciso desenvolver uma estratégia central para reunir todos os níveis. Assim como diferentes músicos tocando instrumentos diferentes, todos eventualmente retornam à melodia principal pela qual o maestro é responsável. A empresa precisa de um líder assim, que possa compreender profundamente a visão e a missão da empresa e permitir que todas as partes se movam na mesma direção. Esta é a mudança que o CEO precisa fazer.

Agora eu mesmo capto menos detalhes. Se um problema algorítmico não puder ser resolvido até um mês depois, antes eu poderia simplesmente bater a mesa e ir para a batalha, mas agora isso nunca mais acontecerá. Se você não conseguir terminar, eu não farei isso sozinho. Mas dedicarei mais tempo à orientação geral e sincronizarei com todos os princípios e estratégias.

Jiazi Guangnian: Desde o momento em que você iniciou seu negócio até agora, houve alguma outra mudança nos objetivos e princípios nos quais você sempre acreditou?

Hou Xiaodi: Deixe-me começar com o que permanece inalterado. Eu disse antes que há três razões pelas quais a condução autônoma é necessária. Primeiro, o meu trabalho deve ser significativo, capaz de melhorar a produtividade e ser desafiador; segundo, deve ser orientado pela tecnologia, e a tecnologia traz criação de valor; terceiro, o modelo de negócios deve ser simples e não posso nem dizer não para mim mesmo; Modelo de negócios claro. Esses três pontos ainda são os mesmos até eu fazer o Bot.Auto agora.

O que mudou é que no passado eu me colocava demais em posições técnicas. Ser habilidoso equivale a uma beleza encobrir todos os defeitos. Mas agora ainda quero me transformar em um guerreiro hexagonal e proteger a empresa em todos os aspectos. Para evitar morrer por uma doença aguda, precisamos pensar cuidadosamente em todos os aspectos. Ao mesmo tempo, a empresa precisa de uma estratégia de longo prazo que possa caminhar em uma direção e utilizar estratégias para unir os colaboradores.

Na minha experiência anterior, desempenhei a função de CTO na maior parte do tempo. Senti que a empresa estava indo na direção errada e me tornei CEO, apenas para perceber que foi difícil recuperar dos problemas dos "Trinta Anos de Wanli" anteriores. Como desta vez podemos desempenhar plenamente as funções de CEO desde o início, devemos garantir que a empresa esteja sempre no caminho estratégico correto desde o início.

*A Sra. A também ajudou na entrevista para este artigo.


Contato de cooperação com a mídia WeChat ID |ciweimeijiejun

Se quiser se comunicar conosco, você pode responder "juntar-se ao grupo" em segundo plano para ingressar na comunidade.