noticias

Hou Xiaodi, el valiente cauteloso

2024-08-06

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Ahora no es el momento de competir en la industria de la conducción autónoma.


Texto |
Fuente del artículo | Jia Zi Guangnian (ID: jazzyear)

Al mismo tiempo que Tesla anunció su informe financiero del segundo trimestre, Musk anunció oficialmente que el lanzamiento de su producto Robotaxi se pospondría desde principios de agosto hasta principios de octubre. Hou Xiaodi, que al igual que Musk tiene su negocio arraigado en Texas, ha vuelto a confirmar su identidad como "profeta".

Anteriormente, Hou Xiaodi era más conocido por su viaje de la confianza a la sospecha, de la cooperación a la separación, con TuSimple, la "primera empresa de conducción autónoma" que cofundó.

Después de salir a bolsa en abril de 2021, el patrimonio neto de Hou Xiaodi superó los mil millones de dólares. Sin embargo, con el inicio de las investigaciones y la supervisión del Comité de Inversión Extranjera en Estados Unidos (CIFUS), Tucson ha experimentado un turbulento cambio de gestión. Hou Xiaodi fue ascendido por primera vez del puesto de CTO a CEO y fue despedido por la junta directiva en octubre de 2022, luego él y otro cofundador destituyeron a la antigua junta directiva mediante una supervotación 10 días después, pero nunca lo fue; capaz de regresar a la dirección de la empresa en marzo de 2023, Hou Xiaodi finalmente anunció su salida total de Tucson.

Antes de salir de la lista en febrero de 2024, el precio de las acciones de Tucson también se desplomó de un máximo de casi 80 dólares a menos de 1 dólar.

Algunas personas dicen que la relación entre Hou Xiaodi y Tucson es como el papel de Oppenheimer en el Proyecto Manhattan en el pasado. Así como Oppenheimer tuvo que enfrentar dudas y escrutinio de todos lados en los años de la posguerra, las decisiones y acciones de Hou Xiaodi en Tucson Future siempre están bajo la lupa, y cada elección que toma puede volverse controvertida.

Aun así, Hou Xiaodi todavía se enorgullece de decirle a "Jiazi Guangnian" que Tucson es la primera empresa del mundo en probar camiones pesados ​​totalmente autónomos en carreteras abiertas y ha logrado la primera mitad del juego de la conducción sin conductor: hacer No hay Sistema redundante de seguridad.

En mayo de este año, CIFUS llegó a un acuerdo con Tucson. Según el anuncio de Tucson, esta investigación no encontró ninguna violación por parte de la empresa, incluida la "transferencia de tecnología" que se rumoreaba anteriormente. Después de dejar Tucson, Hou Xiaodi una vez más se dedicó al espíritu empresarial de camiones sin conductor de nivel L4 y estableció una nueva empresa, Bot.Auto, en los Estados Unidos.

Cuando la conducción asistida L2 reemplazó gradualmente a la conducción autónoma L4 en la opinión pública, Hou Xiaodi insistió en la investigación y el desarrollo de L4 y condujo por este camino prudente y valiente. Pero ve la dirección diferente de la corriente principal como una oportunidad emocionante: "O te conviertes en un buen estudiante con 100 puntos cada día, o aprovechas una oportunidad única en la vida para impactar una visión revolucionaria, incluso si hay "Hay mayor incertidumbre y menos consenso de la industria. También estoy dispuesto a hacer un milagro con una pequeña probabilidad. Por supuesto, nuestro equipo tiene habilidades únicas y trabaja en conjunto, creo que podemos lograr este milagro".

Su visión revolucionaria es hacer que los camiones sin conductor operen a un costo por kilómetro más bajo que los humanos basándose en el concepto de Transporte como Servicio (TaaS), creando así más valor social. Desde el punto de vista financiero, el nodo para la realización de los sueños se fijó inicialmente como el primer semestre de 2026.

En esta entrevista exclusiva, Hou Xiaodi comentó sobre eventos de la industria como el aplazamiento de Robotaxi y la salida del "Carrot Run" nacional, y emitió muchos juicios que no pueden complacer a todos, como "El público tiene muchas críticas sobre la conducción autónoma". , porque todos creen que pueden conducir”.

Obligada por el torrente de los tiempos, la historia de Hou Xiaodi y TuSimple está destinada a convertirse en un giro trágico y trágico. Esto le recordó que la creación y la protección son igualmente importantes y la protección es más difícil, por lo que esta vez eligió el papel de guardián. "En el pasado, me ponía demasiado en posiciones técnicas, y ser muy hábil equivale a una belleza que cubre todos los defectos", dijo Hou Xiaodi, "pero ahora todavía tengo que convertirme en un guerrero hexagonal para proteger el empresa en todos los aspectos".

La siguiente es la entrevista completa, editada y organizada:


Desafíos de seguridad de Robotaxi y L4

Jiazi Guangnian: En primer lugar, me gustaría felicitarlo por convertirse una vez más en un verdadero profeta en relación con el aplazamiento de Robotaxi.

Hou Xiaodi: Entonces todos deberían acostumbrarse. Tengo muchas predicciones. He dicho antes que la ley de escala no es la respuesta y me opongo firmemente a la ley de escala. Por ejemplo, en la conferencia GTC, todos sintieron que NVIDIA era omnipotente, pero yo sentí que la mejora del rendimiento de NVIDIA en la computación de borde había llegado a su límite.

A menudo vierto un jarro de agua fría sobre el entusiasmo de la gente, lo que esencialmente refleja mi actitud diferente hacia las expectativas futuras. Si desea una predicción audaz, simplemente tenga una actitud optimista. Pero si quieres una predicción precisa, básala en el conocimiento y la lógica. Tomemos como ejemplo la física de la escuela secundaria. Los civiles pueden hablar de que el agua se convierte en petróleo o de máquinas de movimiento perpetuo, pero siempre que hayas aprendido la conservación de la masa y la energía, y luego escuches sobre las máquinas de movimiento perpetuo, sabrás que están engañando. .

Para mí, cuando veo una predicción, lo que realmente necesito pensar es en el sustento teórico detrás del problema. La futura tendencia de desarrollo de la tecnología está restringida por las leyes de la física y las matemáticas. Debemos respetar estas restricciones.

Jiazi Guangnian: Antes dijiste que el Robotaxi de Musk no se puede construir y ahora su lanzamiento se ha retrasado nuevamente, lo que verifica parcialmente tu afirmación. ¿Qué opinas de la decisión de posponerlo?

Hou Xiaodi: El rendimiento actual de Robotaxi está lejos del verdadero L4. Hace unos meses, un amigo mío elogió tanto a Tesla que le sugerí que hiciera una prueba en Waymo. Como resultado, ese día me dijo: "Xiaodi, he viajado en Waymo. Tesla es realmente una basura".

(Nota: Waymo es una empresa de conducción autónoma propiedad de Alphabet, la empresa matriz de Google, y ha lanzado servicios de taxi sin conductor en California, Texas y otros lugares).

Robotaxi no se lanza corrigiendo uno o dos errores y retrasándolo dos meses. Así que sigo prediciendo: el 10 de octubre todavía no será el momento en que Robotaxi se lance realmente, e incluso el próximo año no será el momento en que se pueda aplicar. En el mejor de los casos, no habrá pistas sobre cuándo se lanzará Robotaxi en octubre.

Jiazi Guangnian: ¿Por qué crees que no se puede hacer Tesla Robotaxi después de viajar en Waymo?

Hou Xiaodi: El comportamiento de Waymo puede brindarte una mayor certeza. Cuando probé el Tesla de mi esposa, que es la última versión de FSD, vi que muchos cambios de comportamiento eran muy severos y no estaban diseñados desde la perspectiva de minimizar la responsabilidad por accidentes de tránsito. pobre y me hace sentir que no está realmente en el nivel L4.

Además de la esencia técnica, también está la esencia comercial. Hay un chiste sobre ¿qué pasa si alguien muere mientras conduce un FSD en un Tesla? Mi respuesta es un juego de palabras: no es asunto de ellos. En términos de división de responsabilidades, Tesla definitivamente afirma que el conductor es totalmente responsable (el sistema indica claramente que al usar FSD, el conductor debe mantener las manos en el volante de principio a fin y seguir prestando atención a las condiciones de la carretera). y no tiene nada que ver con nosotros; en segundo lugar, este no es su modelo de negocio, el negocio de Tesla es vender automóviles, y FSD es el valor agregado de la venta de automóviles. Si desea considerar cómo vender más automóviles, no puede profundizar en un área limitada como L4 y resolver todos los casos extremos (situaciones extremas) en esta área.

Jiazi Guangnian: Entonces cree que su lógica no es minimizar los accidentes de tráfico, sino maximizar los intereses comerciales y minimizar la responsabilidad de Tesla.

Hou Xiaodi: El primero es minimizar la responsabilidad de Tesla y el segundo es maximizar los intereses comerciales. Ahora hay tres casos, el mejor de los casos (mejor caso), el caso promedio (caso promedio) y el peor de los casos (peor caso). Tesla optimiza el mejor de los casos. La conducción asistida en sí misma tiene su propio valor. Mientras los consumidores la reconozcan, su misión se habrá cumplido.

Jiazi Guangnian: Musk no presentó muchos detalles sobre cómo buscar la aprobación regulatoria en la reunión del informe financiero, pero siempre enfatizó que Tesla es una solución llamada universal, que puede ser mejor que la solución más localizada de Waymo, que es demasiado frágil. .

Hou Xiaodi: Esto es un sofisma típico. ¿Cómo se define la vulnerabilidad? Puedo viajar por todo el mundo, puedo hacerlo en cada ciudad, pero sólo puedes hacerlo en un área pequeña, por lo que eres vulnerable. Pero la cuestión de la competencia L4 era si podríamos hacerlo bien en esta pequeña área limitada. Como resultado, dijo, no compito con ustedes en esto, compito con ustedes en aquello. Esto equivale a preguntar quién es más hermoso, yo o el Sr. Xu del norte de la ciudad. Él insiste en que yo no soy más hermoso que quién soy más inteligente. ¿Qué debo hacer si el Sr. Xu del norte de la ciudad? ¿Es más inteligente que tú y más hermosa que tú? También dijo que corrí rápido. De todos modos, no quiero competir abiertamente en un entorno limitado.

No existe una única tecnología que pueda utilizarse para la conducción sin conductor en ningún lugar del mundo, al igual que no existe un solo atleta en los Juegos Olímpicos que pueda utilizarse para carreras de larga y corta distancia. Si estás haciendo una escena limitada, hazlo bien. Si desea vender automóviles en todo el mundo, no cree una marca de automóviles, simplemente diga que es L2+. No me gusta confundir a las masas con el marketing, cuanto más ruido hay, más presión hay sobre la gente seria.

Jiazi Guangnian: En la actualidad, los desafíos técnicos de L4 siguen siendo relativamente grandes. ¿A qué niveles se refieren específicamente?

Hou Xiaodi: En términos generales, no es difícil para quienes pueden dominarlo, pero no es difícil para quienes son difíciles. Creo que nuestro equipo puede superar las dificultades que otros han visto una por una y realizar algunas innovaciones y desarrollos adicionales basados ​​en el documento.

El núcleo de L4 sin controlador es cómo completar un sistema estable, especialmente utilizando módulos inestables para completar un sistema estable. Por ejemplo, si la cámara no detecta un objeto en un cuadro, este tipo de cosas definitivamente sucederá. Cómo garantizar que nuestro sistema no colapse es la clave.

La forma estúpida es reducir el tiempo de falla de 100.000 kilómetros a un tiempo de falla de 1 millón de kilómetros, para que el sistema sea estable. La forma inteligente es innovar a nivel de arquitectura, de modo que si un módulo falla, habrá otros módulos para cubrirlo. Implementamos algunas capas más de planes de cobertura en progreso para que podamos manejar la falla del sistema en cualquier momento. Los aviones de aviación civil son un sistema redundante típico. Los aviones suelen tener dos motores, que están diseñados para ser funcionalmente seguros e independientes entre sí. La seguridad del sistema se logra a través de una arquitectura más avanzada, no creando un único motor que nunca falla.

Jiazi Guangnian: Eso es para prepararse para la redundancia de seguridad.

Hou Xiaodi: Específicamente, es para lograr la redundancia de seguridad en ingeniería. En el nivel tecnológico actual, utilizar componentes maduros proporcionados por el ecosistema industrial para construir un sistema seguro y redundante es la tarea más importante de la conducción autónoma.

Algunas personas también dicen que L2 puede convertirse gradualmente en L4, pero yo no estoy de acuerdo con esto. Nuestra investigación L4 dedica el 70% de nuestro tiempo a sistemas redundantes. No importa qué tan buena sea la función L2, solo puede completar como máximo tres funciones de L4, y el 70% restante de las funciones no se ha tocado. Tesla no es una empresa L4, sino una empresa L2+, y muchos de sus diseños no tienen fines de seguridad o redundancia.


El transporte como servicio

Jiazi Guangnian: Usted siempre se ha adherido a la ruta L4, pero ahora la industria y el público parecen estar hablando más de la conducción asistida L2 que de la conducción autónoma.

Hou Xiaodi: El éxito de Bot.Auto y el mío no tiene nada que ver con si es o no convencional. No necesitamos la aprobación de todos. Si realmente podemos crear valor económico o incluso valor social, es suficiente.

La ruta técnica está determinada por leyes objetivas, y la corrección de la ruta tiene poco que ver con si hay consenso. Especialmente en el ámbito de la conducción autónoma. El público critica mucho la conducción autónoma, no porque todo el mundo sea un practicante sin conductor, sino porque todo el mundo cree que puede conducir. Si se piensa en un "consenso" sobre la tecnología sin conductor discutido por un grupo de conductores humanos, contendría muchas cosas poco fiables. Si realmente nos desarrollamos según el juicio del público, será un callejón sin salida.

En comparación con las personas que saben conducir, hay muchas menos personas que saben conducir cohetes. Por lo tanto, el campo de la fabricación de cohetes es relativamente afortunado y no ha habido muchas tragedias en las que el consenso de los legos guíe la ruta técnica de los expertos. Según esta idea, el campo LLM es el área más afectada por este tipo de "ruido de ruta".

Este tipo de ruido en la ruta, a su vez, tiene un gran impacto en los practicantes de la conducción autónoma e incluso les perjudica. ¿Deberíamos soportar la presión, resistir el ruido y ceñirnos a objetivos a largo plazo, o deberíamos decir primero lo que a los inversores les gusta decir y obtener financiación y sobrevivir para alcanzar objetivos a corto plazo? De hecho, la mayoría de la gente elige lo último.

O conviértase en un buen estudiante con 100 puntos todos los días o aproveche una oportunidad única en la vida para impactar una visión revolucionaria. Hay mayor incertidumbre y menos consenso en la industria, y estoy dispuesto a hacer milagros con una pequeña probabilidad. Por supuesto, todo nuestro equipo tiene habilidades únicas y trabajamos juntos como uno solo, creo que podemos lograr este milagro.

Aquellos que invierten en lo que les gusta a los inversores y hablan de opiniones consensuadas todos los días simplemente disfrutan del proceso de iniciar un negocio. Pero no disfruto el proceso de iniciar un negocio, sólo veo el resultado final. Al final, lo que me atrae es la luz de la esperanza de que esta causa pueda completarse con éxito y esta visión definitiva. Para hacer las cosas, debemos respetar las leyes inevitables de la ciencia y los negocios, y no necesitamos atender a la percepción pública. En muchos casos, incluso tenemos que resistir la tremenda presión que supone ir en contra de la percepción pública y apegarnos a la verdad.

Jiazi Guangnian: Si algo es diferente a la percepción pública, ¿aumenta su atractivo para usted?

Hou Xiaodi: Es diferente de la corriente principal. Es sólo el comienzo. El siguiente trabajo esencial es un proceso de búsqueda de la verdad basado en hechos. Si al final esta "cognición diferenciada" es lógica, entonces se puede decir que tiene un gran valor y potencial. ¡Pero descubrir diferentes percepciones no significa que haya nuevas oportunidades! Por supuesto que estaría emocionado. Un ejemplo típico es que todas las empresas que fabrican camiones sin conductor en Estados Unidos son SaaS, que es el modelo de Software como Servicio (Software as a Service). Por supuesto, también pueden empaquetarlo como Hardware como servicio (hardware como servicio) sin cambiar el medicamento. En esencia, están vendiendo productos semiacabados. Nosotros, Bot.Auto, somos la única empresa que opera Transporte como Servicio y vendemos servicios de transporte.

Jiazi Guangnian: ¿Cómo definir el Transporte como Servicio?

Hou Xiaodi: Si tiene la mercancía, se la transportaré. Nuestros clientes no necesitan saber si la mercancía se transporta mediante conducción no tripulada o tripulada. De todos modos, la capacidad de transporte es suficiente y el flete es asequible. Otros venden software de conducción autónoma. El problema es que sólo hay 20 clientes en Estados Unidos que pueden comprar software de conducción autónoma.

Jiazi Guangnian: Bajo el concepto de Transporte como Servicio, ¿cuál es su visión revolucionaria?

Hou Xiaodi: Que el coste operativo por kilómetro de la conducción autónoma sea inferior al de los humanos.

Jiazi Guangnian: ¿Cuándo se podrá realizar?

Hou Xiaodi: En el primer semestre de 2026. Todavía quedan dos años para volver a trabajar duro.

Jiazi Guangnian: ¿Es este momento un consenso de la industria?

Hou Xiaodi: Por supuesto que no es un consenso. Otros no lo creen y los colegas no tienen la capacidad de dar un punto temporal. Por ejemplo, la historia contada por Waabi (una empresa de conducción autónoma fundada en 2021) es que la simulación es la mejor del mundo. Todo es como el mundo real y no hay problemas que la simulación no pueda resolver. Pero no creo en esta historia, porque el último 1% de los problemas de simulación son los más difíciles. El absolutismo en este punto no está en consonancia con la eficiencia económica.

Por supuesto, este es solo mi juicio técnico y el juicio de ruta derivada. Para ser justos, cada uno vive según sus propias creencias y el proceso de iniciar un negocio consiste en hacer realidad sus creencias.

Jiazi Guangnian: Usted dijo que muchas personas señalan con el dedo la conducción autónoma porque creen que pueden conducir. ¿Es esto similar a cuando, después del examen de ingreso a la universidad, todos señalan las preguntas de ensayo en lugar de discutir las preguntas de matemáticas?

Hou Xiaodi: Así es. La mayoría de las personas pueden ver las similitudes en los fenómenos L2/L4, pero no pueden ver la brecha en la arquitectura y el diseño del sistema entre L2/L4. Aviones y cohetes vuelan en el cielo. Un profano puede ver fácilmente que los aviones vuelan cada vez más rápido y que reemplazarán a los cohetes en dos días. Pero si has estudiado física, sabrás que los aviones no pueden salir de la atmósfera, pero los cohetes sí. Los de afuera se basan en extrapolaciones demasiado optimistas, mientras que los verdaderos de dentro regresan a lo esencial de la física.

Jiazi Guangnian: Domestic Carrot Run ha sido muy popular recientemente y la gente lo critica mucho tanto a nivel técnico como social. ¿Has prestado atención a cómo funciona?

Hou Xiaodi: En primer lugar, debo confirmar que esto es algo bueno. Quiero aplaudir a Baidu. Los primeros promotores que sean el centro de atención se enfrentarán a grandes malentendidos por parte del público. Educar al público sobre este proceso es beneficioso para toda la industria.

Pero todavía tengo que decir que las discusiones a nivel social son extremadamente aburridas, extremadamente desordenadas y extremadamente ineficaces. Alan Kay (ganador del Premio Turing 2003) dijo que la gente siempre sobreestima los avances a corto plazo de la tecnología a corto plazo, pero subestima el impacto a largo plazo de la tecnología. ¿Qué impacto tendrá el despliegue de 400 coches autónomos en los taxistas? El lanzamiento de 400 vehículos hoy tiene un buen efecto, pero si a alguien le preocupa que mañana se lancen 40.000 vehículos, es totalmente infundado. En la actualidad, nadie tiene la capacidad de promoverlo a tan gran escala. Éste es precisamente el problema técnico de la productización que la conducción sin conductor debe resolver.

Pensar que la conducción autónoma será posible mañana es una señal de sobreestimar los avances a corto plazo. Al mismo tiempo, el público tiende a subestimar el impacto a largo plazo. Por ejemplo, ¿cambiarán en el futuro nuestra estructura fiscal y nuestros hábitos de viaje? ¿Cómo ha cambiado la planificación urbana? Es posible que más áreas suburbanas se vuelvan habitables y la gente pueda trabajar mientras viaja. Ése es el verdadero impacto a largo plazo a considerar.

Jiazi Guangnian: Como dijiste antes, imaginaremos todo lo que hay en la ciencia ficción. Pero ahora hay tantas cosas que se pueden hacer con los teléfonos móviles que básicamente no estaban escritas en novelas hace 100 años, pero que de hecho han provocado cambios significativos en nuestros estilos de vida.

Hou Xiaodi: Los inventos tecnológicos son avances de un solo punto en la compleja red de la sociedad humana, y los avances de un solo punto pueden inducir una gran cantidad de cambios complejos relacionados. Las limitaciones de la imaginación humana pueden hacer imposible pensar con claridad sobre tantos factores relacionados, por lo que no podemos criticar las novelas de ciencia ficción por no ser lo suficientemente específicas. Tenemos que admitir que estas conexiones son muy complejas y nos resulta difícil predecir cómo será la forma social debido a las nuevas tecnologías, pero no debemos ir a los extremos en nuestro pensamiento y plantear problemas de desempleo cuando llega una nueva tecnología. afuera. Como individuo social, puede haber riesgo de desempleo, haya o no nueva tecnología. Como sociedad en su conjunto, las nuevas tecnologías traen cambios sociales más amplios. Este cambio incluye el surgimiento de nuevas industrias, el declive de industrias antiguas y la migración del empleo. No es en modo alguno un problema de desempleo simple y crudo.


De extremo a extremo, basado en reglas y principios

Jiazi Guangnian: ¿Cómo entiende las soluciones integrales que se están promoviendo actualmente en la industria de la conducción autónoma?

Hou Xiaodi: Personas que no conocen la industria dicen muchas cosas indiscriminadamente, lo que genera confusión de conceptos. Es como si le dijeras a Guns N' Roses que soy fanático del heavy metal y que tú eres mi favorito. Guns N' Roses debe estar preocupado por ti, porque no son heavy metal sino hard rock. AC/DC también es hard rock, Judas Priest, Black Sabbath y Metallica son heavy metal.

La gente siempre me pregunta, ¿eres de punta a punta? Para mantener el rigor académico, en realidad no solo trabajamos de principio a fin. Pero lo que en realidad quiere preguntar es: ¿Han adoptado tecnología más avanzada? Por supuesto que sí. La situación actual es que "de extremo a extremo" no es un concepto académico, sino un portador emocional. Las personas que no tienen conocimientos pueden fácilmente atribuir sus sueños y asuntos pendientes en el campo del aprendizaje automático al concepto técnico específico de "de un extremo a otro".

Jiazi Guangnian: Entonces crees que el concepto de extremo a extremo ha "ocupado el nido de las urracas", y la gente equiparará extremo a extremo con alta precisión.

Hou Xiaodi: La ventaja de un extremo a otro es que se puede considerar que parte de la red neuronal es modular, y el ancho de banda de comunicación y conexión entre módulos es muy alto. La segunda ventaja es que se puede lograr la propagación de errores durante el entrenamiento del módulo y los errores se pueden transmitir a módulos anteriores. Por ejemplo, el entrenamiento en planificación de movimiento puede afectar directamente la percepción. Pero el fin no es lo mismo que los medios. No es necesario obsesionarse con la tecnología específica de "de extremo a extremo". Muchas otras tecnologías también tienen tales características.

Y tengo que criticar la idea de que “el conexionismo lo soluciona todo”. Siempre existe la idea errónea de que todo de un extremo a otro debe ser una red neuronal. Si agrego algo que no es una red neuronal, no será lo suficientemente puro y revolucionario. Las tres principales escuelas de inteligencia artificial: el conexionismo, el conductismo y el simbolismo, tienen cada una sus propias fortalezas. Una doctrina no puede resolver todos los problemas.

En este sentido, me gusta mucho el estilo de DeepMind, como AlphaGeometry, que en mi opinión ha resuelto muy bien el problema recientemente. Desde AlphaGo hasta AlphaGeometry, DeepMind siempre ha sido inclusivo. Saca lo mejor de todos los géneros de inteligencia artificial. No se involucrará en disputas doctrinales, sino que trabajará en sistemas para, en última instancia, resolver los problemas.

(Nota: DeepMind de Google utilizó los dos sistemas AlphaProof y AlphaGeometry2 para alcanzar el nivel de medallista de plata en la Olimpiada Internacional de Matemáticas de 2024)

Jiazi Guangnian: ¿Es la falta de explicabilidad de un extremo a otro un obstáculo importante?

Hou Xiaodi: ¡Sí! Lo que es aún más escandaloso es que algunas personas presentan la falta de explicabilidad de una manera de la que no se avergüenzan, pero sí se enorgullecen de ello. Musk dice con tranquilidad todos los días que ya no escribiremos código. Pero sus palabras son publicidad y marketing. La práctica de la ingeniería es mucho más compleja de lo que dijo. Solo un NaN (no es un número) causado por la falta de convergencia durante el proceso de capacitación, ¿cuántos ingenieros han muerto?

El entrenamiento real de una red de extremo a extremo sigue siendo un modelo de desarrollo "estilo taller" que está lleno de metafísica y requiere un pulido manual por parte de "maestros" en esta etapa, en lugar del modelo de desarrollo de una fábrica automatizada. Una vez que vea qué detalles deben mejorarse, primero debe congelar otras partes irrelevantes de la red, luego preparar una cantidad "apropiada" de datos de capacitación como un chef chino salteando, y luego continuar entrenando, probando e iterando.

El argumento más extremo que he escuchado es que se puede conquistar la distancia de conducción autónoma, lo cual es un caso de esquina que requiere decenas de millones de kilómetros y una gran potencia informática. Esto es típico de vivir en tu propio mundo de fantasía. Si la persona responsable de escuchar la historia (inversor) tiene una actitud subjetiva tan fuerte en primer lugar (si hay una manera, hay una buena y debe haber una mala debajo), entonces piense en cómo la persona responsable de contar la historia (emprendedor) puede centrarse en Con el enfoque "basado en datos" y "de extremo a extremo", hemos fabricado visiones escandalosas. Los dos se complementan y así se crean las burbujas.

Jiazi Guangnian: Hay muchas empresas automotrices en la industria que dicen que sus soluciones integrales se lanzarán pronto al mercado.

Hou Xiaodi: Musk habla de un conjunto de palabras que no pueden falsificarse a corto plazo. No preguntes por qué no se puede realizar Robotaxi de extremo a extremo todavía. Solo pregunta, no te preocupes, estamos entrenando la próxima versión. Simplemente no tenemos suficiente potencia informática ni datos. Una vez publiqué una foto en WeChat Moments que mostraba una zanahoria colgada frente a un burro. Este es el estado de los accionistas de Robotaxi y Tesla.


Fuente de la imagen:X

Además, Musk es una persona exitosa. Creer en Musk y seguir a Musk también es políticamente correcto en el círculo actual del capital riesgo. Por otro lado, este conjunto de palabras infalsables es fácil de usar y adecuado para todas las edades. Los equipos técnicos de segunda y tercera categoría pueden describir perfectamente su brecha técnica como una brecha en datos y potencia informática. Si los datos no son suficientes y la potencia informática no es suficiente, ¡se le pedirá que envíe dinero! Este es el circuito cerrado perfecto.

Jiazi Guangnian: ¿Hay otras escuelas además de la de ellos? ¿Crees que sigues siendo una escuela más tradicional basada en reglas?

Hou Xiaodi: El concepto de basado en reglas en sí mismo no está claro. La gente puede ser muy subjetiva acerca de lo que es un concepto basado en reglas. Esto hace que sea fácil abusar de él y, eventualmente, se convierte en un "arma" para expresar emociones subjetivas en lugar de una "herramienta" para explorar la lógica objetiva. Mi ex colega y ex científico jefe de Tucson, Wang Naiyan, mencionó en su blog el sistema basado en principios en lugar de reglas, con lo cual estoy de acuerdo.

Todo el mundo ha estigmatizado el método basado en reglas, como si cada método basado en reglas constara de decenas de miles de "si no". Pero si hay que discutir, la red neuronal en sí es en realidad un enorme sistema basado en reglas. Abra el interior de la red, que contiene operadores lineales y operadores no lineales. Cada operador no lineal es una implementación específica de if else, y la red neuronal es un enorme sistema basado en reglas compuesto por miles de millones de if else.

Si alguien en la industria escribe decenas de miles de if elses en un lenguaje de programación, es simplemente porque su nivel de implementación de ingeniería es demasiado bajo. Los sistemas basados ​​en reglas no deberían permitir que existan decenas de miles de if elses bajo ninguna circunstancia. Este es el resultado final. La segunda conclusión es que, por ejemplo, cuando un vehículo puede cruzar la doble línea amarilla, se deben establecer claramente una, dos o tres condiciones. Esto se llama en mi caso basado en reglas. Tengo este fuerte punto de vista. Mientras siga liderando el equipo para hacer conducción autónoma L4, nuestro sistema debe incluir reglas o principios. No permitiría que se pusiera en marcha un sistema L4 que no se basa completamente en principios. Éste es el resultado final de la seguridad.

La base de nuestro sistema es un modelo básico. Pero sobre esta base, enfatiza el diseño y la implementación de la interpretabilidad. Internamente llamamos a este marco Fundación a todos (F2A). ‍

Jiazi Guangnian: Usted ha estado buscando una explicación total.

Hou Xiaodi: L4 debe ser interpretable y no puede basarse simplemente en cajas negras de datos poco claros.

Aquí hay tres elementos: requisitos, métodos de diseño e implementación de ingeniería. La interpretabilidad es un requisito, ya sea que esté basada en principios o en el aprendizaje, es un método de diseño y escribir si no es una implementación de ingeniería. La demanda existe objetivamente. No la niegues sólo porque el método tiene limitaciones. Por eso dije que L4 debe ser interpretable.

Entre diferentes métodos de diseño, es probable que esté yo entre ustedes y usted entre mí. Su valor radica en resaltar las principales contradicciones, no en discutir; si se discute, todas las redes neuronales son sistemas basados ​​​​en reglas. Al final, la brecha de calidad en la implementación de la ingeniería es más amplia que la brecha entre humanos y perros. No podemos utilizar una mala implementación de la ingeniería para negar el papel orientador de los métodos de diseño.


Qué tienen en común los camiones y los robots

Jiazi Guangnian: ¿Cuáles son las diferencias entre los desafíos técnicos de los camiones y los turismos? ¿Por qué creemos que el avance de los camiones autónomos es más lento que el de los turismos?

Hou Xiaodi: Los camiones están más cerca de la comercialización. Esta es la razón por la que continuaré trabajando en camiones no tripulados después de dejar Tucson. Los camiones reciben menos atención que los automóviles, principalmente debido al VC. A todos les gusta invertir en cosas con las que entran en contacto a diario, como robots humanoides, pero las reglas de tránsito para los camiones son mucho más claras que para los automóviles y pueden definir correctamente bajo qué. circunstancias en las que debería hacerlo. El tipo de comportamiento que haces es lo más importante para mí.

Jiazi Guangnian: Permítanme comenzar haciendo una digresión. ¿Qué robot cree que tiene más perspectivas comerciales?

Hou Xiaodi: La búsqueda actual de robots humanoides es como: Verá, la tecnología ha mejorado, por lo que deberíamos examinar este campo, hay escasez de mano de obra, deberíamos prestar atención a este campo; En la actualidad, el robot compañero con el que todo el mundo puede estar de acuerdo todavía está lejos. El mercado de aplicaciones actual para robots está en las fábricas. Muchos profesionales piensan lo mismo que yo. Los primeros escenarios de aplicación de robots son ciertos escenarios. Entonces, ¿por qué necesitamos piernas? Pero las piernas son de hecho un punto de comunicación popular que puede hacer que el público tenga asociaciones ilimitadas con la ciencia ficción.

Jiazi Guangnian: En otras palabras, VC está más preocupado por los productos to-C, como los automóviles, y los productos geniales, como los robots humanoides, que no se ven lo suficientemente geniales. Pero los inversores que se acercan a usted están al menos algo interesados ​​en los camiones. ¿Qué tipo de personas son y cuáles son sus características?

Hou Xiaodi: Los inversores que se centran en los camiones son más pragmáticos. Hoy en día, la gente sigue prestando atención a los coches sin conductor, y más gente mira los camiones que los coches. En los últimos años, más gente miraba los coches. Ahora que el enfoque se ha reducido, los inversores que pueden dedicarse al negocio de la conducción autónoma de camiones se centran en si puede ser rentable. Eso es muy sencillo. Sólo nos fijamos en los costos operativos. Con el avance de la tecnología, podemos obtener ganancias en unos pocos años. Todos estos son cálculos muy sencillos.

Jiazi Guangnian: ¿Podemos decir que los capitalistas de riesgo a quienes sólo les gusta ver automóviles ahora miran robots?

Hou Xiaodi: Hoy en día, la gente piensa que los camiones sin conductor pueden considerarse hasta cierto punto robots. El robot no necesariamente tiene piernas y brazos y puede correr en una fábrica. Puede ser una caja colgante y correr por la vía pública. Algunos de los criterios de evaluación de los robots se pueden asignar a la conducción autónoma, luego los camiones autónomos pueden cumplirlos y las empresas de conducción autónoma son muy baratas en comparación con las empresas de robots.

Jiazi Guangnian: ¿Cuáles de los costos actuales son relativamente altos?

Hou Xiaodi: Puedo darte un ejemplo de un teléfono Android. Yo mismo soy usuario de Android desde hace muchos años. Los usuarios de Android en los primeros años utilizaron esta autodestrucción: "Si no se están cargando, están parpadeando". Sin embargo, a medida que los sistemas de telefonía móvil maduran, los eventos de mantenimiento como la carga y el parpadeo se vuelven cada vez menos frecuentes, y la conducción autónoma L4 también experimentará ese proceso.

Nuestra principal tarea es hacer que el mantenimiento diario sea más barato, más corto y más automatizado. Aunque Bot.Auto tiene la tecnología líder en el mundo, no nos promocionamos como una empresa de tecnología, sino como una empresa operativa pragmática. Utilizamos la tecnología más avanzada del mundo para realizar bien las operaciones. No somos un grupo de elevados científicos algorítmicos. Simplemente somos profesionales con los pies en la tierra en la industria de la logística de carga. El valor creado por la tecnología debe reflejarse en las operaciones, no en lo hermosa que es la tecnología en sí.

Jiazi Guangnian: Específicamente, ¿cómo garantizar que el mantenimiento sea más fácil?

Hou Xiaodi: Por ejemplo, ¿puede detectar si la cámara está sucia? ¿Cuándo limpias la cámara? ¿Quién lo borrará? ¿Cómo limpiarlo? ¿Cuánto tiempo se tarda en permanecer limpio después de limpiarse? Probablemente haya miles de preguntas más como ésta. Basándonos en experiencias pasadas, queremos pensar en hacer esto nuevamente con nueva tecnología automatizada sin intervención del conductor.

Esta industria enfrenta básicamente dos tipos de problemas. El primer tipo de problema es cómo construir un sistema redundante de seguridad. Esta es la primera mitad del juego. En ese momento, Tucson fue el primero y único en el mundo en completarlo. Hace unos días (la empresa estadounidense de camiones autónomos) Kodiak completó una prueba de conducción en el desierto, pero fue a muy baja velocidad, no en una carretera abierta y no tuvo mucha interacción con otros vehículos. El punto fue el hardware redundante, creo que también debería dar un aplauso. Pero el Tucson es el único vehículo en el mundo que ha completado pruebas de camiones pesados ​​totalmente sin conductor en carreteras abiertas.


Fuente de la imagen: TuSimple

Una vez completada la primera mitad, tendrá un sistema que funciona muy bien, pero también es muy caro. En la segunda mitad, debemos considerar abaratar los sistemas costosos. Esto es lo que estamos haciendo actualmente.

Jiazi Guangnian: ¿Prestará atención a las tendencias de otros camiones autónomos?

Hou Xiaodi: Conozco un poco las tendencias de la industria, pero no presto atención desde la perspectiva de la competencia. Simplemente ahora no es el momento de competir. Hay tres etapas en la industria: montañismo, carrera y boxeo. Todos estamos en la primera etapa. La primera fase termina cuando una empresa equipara los costos operativos de los vehículos autónomos con los de los conductores humanos. La segunda fase finalizará cuando la capacidad adicional proporcionada por la conducción autónoma supere la actual escasez de camioneros. En la tercera etapa hay competencia directa.

Por ejemplo, hay una montaña nevada en la tierra que nadie ha escalado nunca. Quiero ser la primera persona en el mundo en escalar hasta la cima. ¿Debería apresurarme a escalarla ahora? No, quiero hacer ejercicio, inspeccionar el terreno y escalar cuando todo esté listo. Esto no tiene nada que ver con si sé que otros también quieren desafiar esta montaña nevada.


La mayoría quiere reclutar verdaderos creyentes

Jiazi Guangnian: ¿Cuántas personas hay ahora en Bot.Auto?

Hou Xiaodi: Más de 40 personas.

Jiazi Guangnian: Usted dijo antes que cree que las empresas de conducción autónoma no necesitan mucha gente, al igual que las empresas de nivel modelo, no es algo que requiera mucha mano de obra.

Hou Xiaodi: En los últimos años, necesitábamos mucha gente porque no había nada en el ecosistema. Pero ahora ya no es una barbaridad y la mayoría de las “ruedas” que necesitamos se han vuelto populares. La madurez de las unidades informáticas, sensores, etc. es mucho mayor que en años anteriores. Hay innumerables plataformas de código abierto disponibles para el entrenamiento paralelo de modelos grandes, y también hay varios recursos informáticos en la nube. El suministro suficiente de "ruedas" nos hará repensar la estructura organizativa.

Hace cinco años, pensé que una empresa como Midjourney, es decir, una empresa con 10 personas que puede crear productos con millones de usuarios, sería imposible. Pero ahora habrá cada vez más empresas de este tipo, con menos personas centradas en el. núcleo en el producto.

Jiazi Guangnian: Entonces será tan fácil como comprar una computadora host. ¿A quién le gustaría más reclutar en esta situación?

Hou Xiaodi: Lo que más deseo es reclutar verdaderos creyentes.

Jiazi Guangnian: ¿Cómo definir al verdadero creyente?

Hou Xiaodi: La tecnología es muy importante, pero la batalla por el campeonato y el segundo puesto en los Juegos Olímpicos no suele estar determinada por la tecnología. El espíritu empresarial es una carrera de larga distancia, no una carrera de velocidad. Muchas empresas de vehículos autónomos mueren a causa de enfermedades agudas, no crónicas. Debemos asegurarnos de que la empresa sea estable y sobreviva durante mucho tiempo. En cuanto a un ingeniero, ya no es tan importante si resuelve un problema de ingeniería específico en una semana o en una semana y media.

En segundo lugar, cuando el capital sea muy abundante, tendré una mentalidad de espíritu libre y me guiaré más inesperadamente por el individualismo. Un proyecto de hobby puede lograr grandes cosas, tal como Google siempre dijo que Gmail fue incubado por su sistema del 20% (Nota: Google dijo una vez que cada ingeniero puede dedicar libremente el 20% de su tiempo de trabajo).

Pero ahora el coste de obtener capital es muy alto, la Reserva Federal no reduce los tipos de interés y la financiación es muy difícil. Necesitamos transformarnos a nivel corporativo, desde abajo hacia arriba hacia abajo, desde momentos individuales de brillantez intelectual hasta una estrategia corporativa organizada. En este caso, la libertad y el tiempo que se les da a los individuos serán cada vez menores, lo que en realidad está relacionado con la escasez de recursos.

Jiazi Guangnian: ¿Es esto cierto sólo en la industria de la conducción autónoma o esta tendencia se aplica a todo el campo tecnológico?

Hou Xiaodi: Creo que es toda la industria tecnológica. Algunas otras empresas que conozco no dan a sus empleados mucho espacio para expresarse. Para ser honesto, también debemos sopesar hasta qué punto el alarde del sistema del 20% por parte de Google fue sólo para publicidad.

Jiazi Guangnian: Sin embargo, las empresas modelo o equipos estrella más populares ahora no parecen tener mucha gente. Tienen como máximo una docena de personas, con uno o dos genios como líderes de equipo, y han fabricado muy buenos productos, como por ejemplo. Sora y Pika.

Hou Xiaodi: De hecho, lo que la mayoría de la gente en la mayoría de las empresas ha hecho es uno o dos pasos más allá de la tesis, especialmente en el nivel de software puro. Algunas personas también dicen que todos son caparazones modelo Llama. No estoy de acuerdo con declaraciones tan extremas, pero en este caso, el destello de habilidad personal no provocó cambios trascendentales.

Jiazi Guangnian: Entonces esperas que las personas que contratas puedan implementar las ideas expuestas por la empresa de arriba a abajo.

Hou Xiaodi: Hace cinco años, abríamos algunos proyectos especiales para atender a empleados estrella, pero ahora no lo hago. Nuestro valor principal es si los costos operativos pueden ser más bajos. No se puede decir que haya publicado algunos artículos excelentes, pero quiero hacer un trabajo de investigación básica y necesito una atmósfera libre. Quizás en el pasado las empresas hubieran tenido el mismo estatus de libertad que las instituciones académicas, pero este no ha sido el caso en los últimos años.

Jiazi Guangnian: Esto hará que los candidatos piensen que usted es demasiado autoritario.

Hou Xiaodi: Si quiere libertad en la investigación, puede elegir el círculo académico. O debería encontrar una gran empresa con capital y que ya sea un monopolio. Nuestra pequeña empresa debe tener la mentalidad de vivir al borde de la quiebra. Incluso si acabamos de recaudar dinero, debemos saber que el dinero se agotará muy rápidamente. Con esta mentalidad, realmente no tenemos la libertad de hacerlo. investigación.

Además, me gustaría compartir una idea de gobierno corporativo “de arriba hacia abajo”. Esto no tiene nada que ver con la tecnología. Como pequeña empresa, cómo utilizar a los profesionales.

Tomemos como ejemplo a los abogados. Los abogados se dividen en dos categorías, uno es asesor legal corporativo y el otro es abogado litigante. Los asuntos legales corporativos a menudo le dirán que esto no es conforme y que es riesgoso, pero si no incorpora estas sugerencias en la estrategia corporativa de arriba hacia abajo, pero las acepta todas, al final será muy poco lo que pueda hacer. Los abogados litigantes litigan demandas todos los días y viven una vida de lamiendo sangre, por lo que no le dirán lo que no se puede hacer. Dirán que hay riesgos si lo hace, pero el riesgo es mayor si no lo hace. , así que todavía tienes que hacerlo. Un buen abogado litigante no le advertirá de riesgos, sino que le brindará directamente una estrategia general de arriba hacia abajo.

Si confía demasiado en "profesionales que hacen cosas profesionales" sin tener su propia columna vertebral estratégica de arriba hacia abajo, fácilmente entrará en un estado en el que no busca méritos, pero tampoco fallas. Pero las startups siempre van contra la corriente y entrar en ese estado es muy peligroso y puede provocar la muerte. La esencia de la supervivencia de una pequeña empresa es ver si puede crear milagros en la dirección general de la empresa.

Jiazi Guangnian: De ser el CTO de Tucson en los primeros días a convertirse en el CEO y ahora comenzar Bot.Auto, ¿cuál es la transición más difícil?

Hou Xiaodi: Ahora necesitamos fortalecer nuestros estudios en finanzas, asuntos legales, financiamiento y relaciones públicas. Solía ​​pensar que era suficiente que los profesionales hicieran cosas profesionales, pero ahora creo que necesito desarrollar una estrategia central para unir todos los niveles. Al igual que diferentes músicos que tocan diferentes instrumentos, todos eventualmente regresan a la melodía principal de la que es responsable el director. La empresa necesita un líder así, que pueda comprender profundamente la visión y la misión de la empresa y permitir que todas las partes avancen en la misma dirección. Éste es el cambio que el director ejecutivo debe realizar.

Ahora yo mismo capto menos detalles. Si un problema algorítmico no se puede resolver hasta un mes después, antes podría simplemente dar un portazo y ir a la batalla yo mismo, pero ahora esto nunca volverá a suceder. Si no puedes terminarlo, no lo haré yo mismo. Pero dedicaré más tiempo a la dirección general y sincronizaré con todos los principios y estrategias.

Jiazi Guangnian: Desde el momento en que comenzó su negocio hasta ahora, ¿ha habido otros cambios en los objetivos y principios en los que ha creído durante mucho tiempo?

Hou Xiaodi: Permítanme comenzar con lo que permanece sin cambios. Dije antes que hay tres razones por las que se necesita la conducción autónoma. Primero, mi trabajo debe ser significativo, capaz de mejorar la productividad y ser desafiante; segundo, debe estar impulsado por la tecnología, y la tecnología genera valor; tercero, el modelo de negocio debe ser simple y ni siquiera puedo decirme que no; . Modelo de negocio claro. Estos tres puntos siguen siendo los mismos hasta que haga Bot.Auto ahora.

Lo que ha cambiado es que en el pasado me ponía demasiado en posiciones técnicas. Ser hábil equivale a que una belleza cubra todos los defectos. Pero ahora todavía quiero convertirme en un guerrero hexagonal y proteger a la empresa en todos los aspectos. Para evitar morir a causa de una enfermedad aguda, debemos pensar detenidamente en todos los aspectos. Al mismo tiempo, la empresa necesita una estrategia a largo plazo que pueda avanzar en una dirección y utilizar estrategias para unir a los empleados.

En mi experiencia anterior, desempeñé el rol de CTO la mayor parte del tiempo. Sentí que la empresa iba en la dirección equivocada y me convertí en director ejecutivo, sólo para darme cuenta de que había sido difícil recuperarse de los problemas de los anteriores "Treinta años de Wanli". Dado que en este momento podemos desempeñar plenamente las funciones de CEO desde el principio, debemos asegurarnos de que la empresa esté siempre en el camino estratégico correcto desde el principio.

*La Sra. A también ayudó en la entrevista para este artículo.


Contacto de cooperación con los medios WeChat ID |ciweimeijiejun

Si desea comunicarse con nosotros, puede responder "unirse al grupo" en segundo plano para unirse a la comunidad.