noticias

Conversación con Hou Cong, cofundador de Qingzhou Zhihang: Tesla cree que Robotaxi es demasiado simple

2024-08-15

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

En comparación con Robotaxi, la estabilidad del sistema de conducción de vehículos humanos es más importante hoy en día.

 

Texto | Wang Hailu

Siempre ha habido una disputa entre dos rutas en la industria de la conducción autónoma. Empresas de conducción autónoma representadas por Google Waymo, yteslaLas empresas automovilísticas representadas por la empresa subieron desde las laderas sur y norte de la misma montaña. La cima de la montaña no tiene conductor y el escenario comercial más atractivo es el Robotaxi (taxi autónomo).

Aunque tanto las ventas como el precio de las acciones muestran que Tesla está escalando la montaña más rápido. Pero cuando el fundador Musk propuso que Tesla Robotaxi se lanzaría en octubre de este año, todavía causó mucha controversia.

Hou Cong, cofundador y presidente de Qingzhou Zhihang, es uno de los que dudan. "Nunca lo he entendido del todo. La historia de Robotaxi se ha contado durante tantos años y nunca se ha realizado. ¿Por qué la gente todavía quiere creer en Musk?", dijo Hou Cong.

Aunque el sistema de conducción inteligente FSD V12 de Tesla, basado en tecnología de extremo a extremo, tiene un rendimiento superior, Hou Cong cree que todavía está lejos de ser un Robotaxi real. Casualmente citó un problema que el sistema no podía manejar: "¿Qué debo hacer si el auto se queda atascado en medio de la carretera? ¿Le pide al dueño del auto que tome un taxi y lo libere?"

Las carreteras urbanas son complejas, las personas y los vehículos se mezclan y hay muchos escenarios de juego que la inteligencia artificial actual no puede manejar. La flota Robotaxi fuertemente armada de Waymo no logró salir del área de demostración. Hou Cong cree que es imposible que Tesla cumpla con los requisitos de Robotaxi confiando únicamente en las cámaras.

Los cuatro cofundadores de Qingzhou Zhihang son todos de Waymo. Hou Cong se unió a Google tan pronto como se graduó, primero trabajó en un compilador y luego fue transferido al equipo de proyecto de vehículos autónomos del laboratorio Google X para trabajar en el sistema de percepción.

Yu Qian, cofundador y director ejecutivo de Qingzhou Zhihang, también estaba en el grupo de percepción en ese momento y era colega en el mismo departamento que Hou Cong. Los dos también son alumnos de la Universidad de Tsinghua.

Hou Cong se especializó en automatización y fue transferido al departamento de informática como estudiante de posgrado. Pero antes de poder obtener mi título, fui al Instituto de Tecnología de Georgia en los Estados Unidos para estudiar un doctorado. Se describió a sí mismo como alguien que tenía poco interés en la investigación académica pura y más anhelo por la práctica de la ingeniería técnica, por lo que fue a Google después de graduarse de su doctorado.

En 2016, Google escindió su equipo de proyecto de vehículos autónomos y estableció Waymo, que está controlada directamente por la empresa matriz de Google, Alphabet. Hou Cong y Yu Qian se convirtieron en los primeros ingenieros de Waymo.

Hou Cong es responsable de la optimización del rendimiento y tiene mucho contacto con varios departamentos, por lo que conoció a Dafang y Wang Kun, quienes estaban haciendo planificación y simulación en Waymo en ese momento. En 2019, cuatro ingenieros chinos cofundaron Qingzhou Zhihang.

Ya no era el momento más caluroso para la industria de la conducción autónoma. La empresa china de conducción autónoma Pony.ai se estableció hace 3 años y Tucson se estableció hace 5 años. Las empresas de conducción autónoma que utilizan Robotaxi o camiones pesados ​​​​no tripulados como escenarios de aterrizaje ya se han llevado la mayor parte de los fondos del mercado. Qingzhou eligió un camino con menos competidores y menos capital: los minibuses no tripulados.

Hou Cong dijo que no hizo Robotaxi en ese momento porque pensó que Robotaxi se implementaría demasiado lentamente. Waymo comenzó a operar una flota de Robotaxi en Phoenix, Arizona, en 2016, y parece estar estancada en innumerables casos hasta el día de hoy.

Los costos de mano de obra nacional son bajos y las carreteras son más complejas, lo que dificulta la realización de Robotaxi. Hou Cong fue a experimentar Carrot Run de Baidu en junio de este año y su experiencia fue promedio. Dijo sin rodeos: "La situación actual de Carrot Run es imposible para Waymo operar en este estado".

Qingzhou está construyendo un minibús sin conductor. Al principio pensé que este escenario sería más fácil de implementar que Robotaxi. Sin embargo, después de realizar operaciones piloto en 10 ciudades, incluidas Suzhou, Beijing y Wuhan, descubrieron que habían simplificado demasiado el problema. Es difícil ganar dinero con los autobuses y las regulaciones han tardado en implementarse.

En los primeros días, Qingzhou se basó en los antecedentes y la acumulación de tecnología del equipo fundador para obtener con éxito inversiones de capital de primer nivel como IDG, Lenovo Ventures, Meituan Longzhu Capital y Yunfeng Fund. Pero en 2021, los inversores empezaron a prestar atención a las capacidades hematopoyéticas y el camino de financiación para las empresas de conducción autónoma L4 se volvió cada vez más difícil.

En marcado contraste, el precio de las acciones de Tesla se ha vuelto a disparar en 2021. La tasa de penetración de vehículos de nueva energía en China está aumentando rápidamente y las funciones de conducción inteligente se han convertido en características estándar de los vehículos eléctricos. A mediados de ese año, Qingzhou dio un giro y se transformó de L4 a L2+ para ofrecer soluciones de conducción inteligente para vehículos eléctricos.

En agosto de ese año, Tesla presentó por primera vez BEV (Bird'sEyeView, vista de pájaro) en el AI DAY.

) y el modelo Transformer combinan la información de percepción desde diferentes ángulos de la cámara en una imagen de arriba hacia abajo, lo que facilita que el sistema comprenda y prediga las condiciones de la carretera. Las empresas nacionales de vehículos eléctricos inteligentes han seguido su ejemplo y reescrito los algoritmos de detección. Qingzhou se transformó resueltamente en este momento y se convirtió en uno de los primeros proveedores de conducción inteligente en China en producir BEV.

Este sistema está implementado en el chip Horizon J5. El CTO de Horizon, Huang Chang, Hou Cong y Yu Qian son ex alumnos de Tsinghua, y Yu Qian es investigador principal de la Universidad del Sur de California. Debido a este origen y reconocimiento de tecnologías y conceptos, Horizonte 2022 buscó la cooperación con socios ecológicos y se llevó bien con Qingzhou.

A finales de 2022, Qingzhou lanzó una solución de prueba NOA (sistema de conducción asistida por navegación) urbana y de alta velocidad basada en el chip Horizon J5. Después de eso, Horizon recomendó a Qingzhouauto ideal

Ideal comenzó a desarrollar su propio sistema de conducción inteligente utilizando chips Horizon en 2021 y posteriormente planificó dos soluciones de sistema, AD Max y AD Pro, basadas en chips NVIDIA OrinX y Horizon J5.

En la segunda mitad de 2023, Ideal decidió centrar sus recursos internos de I+D en AD Max y entregar el sistema AD Pro a un proveedor para su mantenimiento y actualizaciones. Qingzhou aprovechó esta oportunidad.

Después de que Qingzhou asumió el control, trabajó con el equipo de Ideal para optimizar el sistema y lanzó una versión del sistema basada en la arquitectura del algoritmo de Qingzhou para los usuarios en mayo de este año.

Hou Cong finalmente logró lo que quería hacer: ejercer la ingeniería y entregar los productos que desarrolló a los usuarios. Al mismo tiempo, también sintió profundamente la gran responsabilidad.

En mayo de este año, el modelo Lili AD Pro tiene 400.000 propietarios. Cuanta más gente utilice un sistema y cuanto más frecuentemente se utilice, más problemas quedarán expuestos. Pero cuanta más gente lo use y mayor sea la frecuencia de uso, solo significa que el producto es mejor.

En comparación con la realización de la conducción sin conductor y la construcción de Robotaxi antes, mantener la estabilidad del sistema de conducción asistida en el que una persona y un automóvil conducen juntos y garantizar la seguridad de conducción de cientos de miles de usuarios son desafíos que Qingzhou está más dispuesto a afrontar en la actualidad.

Tesla cree que Robotaxi es simple Conversación con Hou Cong, cofundador de Qingzhou Zhihang,Yunjian Insight,50 minutos

La siguiente es una conversación entre Insight y el CTO de Qingzhou Zhihang, Hou Cong (editada):

Cuatro ingenieros de Waymo inician un negocio

Insight: Sus cuatro cofundadores eran todos ingenieros de Waymo. ¿Por qué se reunieron para iniciar un negocio?

Hou Cong:Al principio, Yu Qian (cofundador y director ejecutivo de Qingzhou) se acercó a mí y pensamos que podíamos hacerlo. En ese momento, Waymo no tenía tantos chinos, por lo que encontramos algunas personas que pensamos que tenían experiencia y eran capaces.

En ese momento, estaba haciendo optimización del rendimiento y diseño de arquitectura en Waymo, estaba en el mismo equipo que Yu Qian y tenía cooperación comercial con los tres.

Insight: ¿Cómo se divide el trabajo y se decide quién hace qué?

Hou Cong:La dirección de nosotros cuatro es particularmente coincidente. Yu Qian y yo hacemos la percepción, pero yo hago el sistema y él el algoritmo. Dafang (científico jefe) realiza la planificación y Wang Kun (director de operaciones) realiza la simulación. Son cuatro direcciones diferentes.

Yu Qian y Dafang son más bien científicos. Mi interés es la ingeniería, lo que significa poner la tecnología en práctica, centrándome en la práctica y los productos. Así que me dediqué a la industria tan pronto como me gradué.

Yunjian Insight: ¿Presenta brevemente tu experiencia inicial?

Hou Cong:Mi título universitario fue del Departamento de Automatización de la Universidad de Tsinghua. Después de graduarme, fui al Departamento de Ciencias de la Computación para estudiar un posgrado. Trabajé en visión durante más de un año, pero lo abandoné antes de terminar mis estudios. Fui a los Estados Unidos para estudiar un doctorado. Después de graduarme en 2013, entré a Google.

Cuando entré por primera vez a Google, trabajé como compilador. Después de trabajar allí durante un año, me prestaron al equipo de infraestructura para trabajar en GPU. Tal vez fue porque hice algunas optimizaciones en la CPU en ese momento, que fueron reconocidas por Jeff Dean (científico jefe de Google) y luego recomendadas al grupo de GPU.

Posteriormente, ese grupo se desarrolló muy bien, trabajando en algunos compiladores para TPU, además del desarrollo de algunas bibliotecas subyacentes bajo Google Brain (la arquitectura de Google para entrenar redes neuronales), y XLA (el compilador de aprendizaje profundo de Google) fue lo que hicieron.

Más tarde, el trabajo de la GPU llegó a su fin y el laboratorio Google X nos dio la oportunidad de optimizar el sistema de percepción de los vehículos autónomos. En ese momento, había un proyecto llamado "20%", que significaba dedicar el 20% de tu tiempo a un proyecto.

Fue Zhu Jiajun quien me llamó en ese momento. Posteriormente fundó Nuro (una empresa de conducción autónoma). Trabajo en el grupo de percepción desde hace más de tres años.

Insight: ¿Cómo es trabajar en Waymo?

Hou Cong:Más bien Google. Era propiedad de Google X antes de independizarse en 2017. Google fabrica principalmente software y Google X fabrica hardware. Hay todo tipo de cosas extrañas en la oficina, incluidos brazos robóticos, tornos y muchos equipos.

El trabajo realizado allí es similar al de Google, donde todos enfatizan el autocontrol, la cooperación y se guían por los OKR. Crea un buen ambiente cultural, donde todos esperan hacerlo mejor, y alguien diseñará el sistema de desempeño para que personas con grandes habilidades puedan emerger de la competencia. Es cierto que el umbral es relativamente alto y es posible que muchas personas de Google no puedan ingresar.

Yunjian Insight: ¿Los ingenieros de Waymo?

Hou Cong:Cuanto más atrás vayas, más se rizará. El período de mayor actividad fue probablemente los dos años posteriores a nuestra partida. Estaban bajo mucha presión para hacer lo que tenían que hacer en San Francisco. Cuando estábamos aquí nadie te obligaba, pero era común que yo trabajara horas extras por la noche y al mediodía. A veces, todos enviaban correos electrónicos haciendo preguntas en medio de la noche.

Yunjian Insight: ¿A qué hora es el tiempo libre?

Hou Cong:No hay reglas.

Yunjian Insight: ¿Puedo salir del trabajo a las 3:30?

Hou Cong:Poder. Soy de esas personas que llega tarde y se va tarde. Normalmente voy allí después de las 10, ceno y trabajo un rato antes de irme, básicamente voy de 10 a 9.

Perspectiva: ¿Son los ingenieros chinos las personas que más trabajan en Waymo?

Hou Cong:En general, definitivamente son más trabajadores, pero los estadounidenses en realidad también son trabajadores. Crea el tipo de entorno cultural en el que todos se sienten cómodos haciendo las cosas. No necesitan preocuparse por muchas cosas complicadas y sólo necesitan concentrarse en hacer bien su trabajo.

Creo que la eficiencia del trabajo es bastante alta. Algunos equipos desarrollarán personas perezosas después de mucho tiempo, pero Waymo se estaba desarrollando relativamente rápido en ese momento, así que no vi que esto sucediera.

Yunjian Insight: Fue OpenAI, no Google, lo que hizo populares los modelos grandes. ¿Cuál crees que es la razón?

Hou Cong:Existen algunas políticas internas en las grandes empresas, que a menudo toman decisiones con vacilación y, en ocasiones, no se atreven a arriesgarse. Siento que cada vez que Google hace algo, se preocupa especialmente por el riesgo para la opinión pública y, a veces, es bastante conservador.

Insight: Te sientes muy cómodo trabajando en Waymo. Dejaste Waymo en 2019 para iniciar un negocio. ¿Cuál fue tu principal fuerza motriz?

Hou Cong:A veces no es bueno estar demasiado cómodo y pensarás en muchos problemas de la vida. Puedes ver cómo serán los próximos 10 o 20 años. Definitivamente no hay escasez de dinero en Silicon Valley y puedes comprar una buena casa. Entonces, ¿qué buscas? De hecho, existe un límite profesional debido al entorno cultural y lingüístico, es difícil para usted participar en el nivel de toma de decisiones de la empresa. Definitivamente no es como en China. Si quieres hacer grandes cosas, en Estados Unidos eres más un jugador que una persona que toma decisiones.

Mi auto está atascado en la intersección, ¿quién me rescatará?

Insight: Cuando estabas en Waymo, Waymo ya había iniciado la operación de prueba de Robotaxi. ¿Dónde estaba estancado en ese momento?

Hou Cong:Está atascado en algunas esquinas. Fue a Phoenix en 2016. Yo estaba allí en ese momento. Había menos personas y automóviles allí, las carreteras eran anchas, hacía buen tiempo y no llovía con frecuencia. Pero la demanda también es baja. Phoenix no puede ajustar cuentas. Es un sitio de operaciones de prueba, no un sitio comercial. Entonces, en 2018, Waymo cambió completamente su enfoque a San Francisco.

Un sistema que en ese momento funcionaba bien en Phoenix quedó completamente arruinado en San Francisco. La tasa de adquisición era extremadamente alta y no se podía manejar en absoluto. En ese momento todavía había un límite técnico. Por supuesto, tenía que ver con la distribución de datos. No recopilamos muchos datos en San Francisco. San Francisco tiene pendientes muy pronunciadas, que a menudo oscilan entre 30 y 40 grados. Incluyendo sus reglas de tránsito (diferentes), las personas y los vehículos interactúan con frecuencia, por lo que el problema de Waymo en ese momento era lidiar con algunos casos extremos.

Waymo es muy cauteloso y no se atreverá a abrir hasta que sea muy seguro. Pero la situación actual de Carrot Kuaishou y yo también hemos viajado en sus autos, es imposible que Waymo opere en este estado.

Yunjian Insight: Cuando probaste Carrot Run de Baidu, ¿qué problemas encontraste?

Hou Cong:Fui en junio. Hay un problema con la sensación corporal y una sensación de frustración. Waymo es realmente mejor que la conducción humana. Es muy cómodo frenar, arrancar y girar. Es la experiencia de un conductor de coche de conserje.

En segundo lugar, Carrot Run es extremadamente conservador. Por ejemplo, al girar en U, los baches son especialmente fuertes y los coches que te rodean te molestan constantemente. Había otro lugar donde un camión de trabajo estaba atrapado detrás y lo seguía lentamente sin dar vueltas.

A juzgar por la configuración básica del sensor, no es una solución L4 muy seria. Waymo está armado hasta los dientes, equipado con 5 lidares, 30 cámaras y 6 radares de ondas milimétricas. Carrot Run definitivamente no hizo esto. Esto también está relacionado con la situación de China. Los costos laborales de China son demasiado bajos y estará muy lejos de lograr beneficios comerciales.

Las empresas nacionales pueden verse obligadas a adoptar soluciones de bajo costo. Sin embargo, el bajo coste hará que su techo técnico sea más bajo que otros, lo que dificultará la resolución de casos extremos.

China se encuentra en un dilema L4, con gente barata y un entorno complicado. Los participantes del tráfico tienen poca previsibilidad y una gran cantidad de campos de juego. El diseño de carreteras no está tan estandarizado.

La construcción nacional no está tan estandarizada. El auto de Meituan cayó a un hoyo antes, ¿culpaste a Meituan? Si el equipo de construcción no hubiera puesto el cono, la gente podría ver un hoyo frente a él, pero el auto de Meituan no esperaría que hubiera un hoyo. Pero en Estados Unidos, si alguien cae, tiene que demandar al gobierno o a la unidad social. Este mecanismo definitivamente no es el caso en China. Creo que China estará mucho más retrasada que Estados Unidos en el desarrollo de la L4.

Yunjian Insight: ¿Qué opinas del Robotaxi de Tesla?

Hou Cong:Entonces no lo reconozco. Creo que es posible lanzar un modelo, por ejemplo, sin volante o con algunas configuraciones adicionales en comparación con la versión de usuario actual del coche. Pero su paquete tecnológico actual no está orientado a L4. Una vez que empieces a operar un Robotaxi, surgirán muchos problemas.

L4 está naturalmente relacionado con las operaciones. También puede resolver algunos problemas técnicos a través de las operaciones. Tesla no tiene dicho sistema operativo.

Yunjian Insight: El escenario previsto por Tesla es que los propietarios de automóviles puedan tomar un Uber cuando su automóvil esté inactivo.

Hou Cong:¿Qué debo hacer si mi auto se queda atascado en medio de la carretera? ¿Quién va a rescatar este coche? ¿Dejar que el dueño del auto tome un taxi y rescate el auto? Éstas son cuestiones muy prácticas.

El auto definitivamente se atascará y, siempre que lo hagas mucho, definitivamente habrá algunas escenas. O eres demasiado cauteloso, o no sabes cómo interactuar con la gente, o incluso te quedas atrapado entre los coches.

Por ejemplo, si dos Tesla Robotaxi se muerden, este problema será difícil de resolver. Cuando no hay luz roja en una intersección, todos los autos intentan ocupar la intersección y eventualmente se quedan atrapados entre sí, sin poder moverse en absoluto.

De hecho, nunca lo he entendido del todo. La historia de Robotaxi se ha contado durante tantos años y nunca se ha realizado. ¿Por qué todo el mundo sigue dispuesto a creerle a Musk? Admiro mucho a Musk y creo que hace otras cosas muy bien. Pero alardeaba un poco de Robotaxi y subestimaba la dificultad del asunto.

Yunjian Insight: ¿Hasta qué punto crees que se compara el efecto del Tesla FSD V12 con el Robotaxi de nivel L4?

Hou Cong:Ni siquiera cerca. Permítanme dar un ejemplo al revés. ¿Por qué Waymo diseñó así su coche? Tiene varios tipos de cámaras, una es una cámara normal, otra es para uso nocturno y tiene fuertes capacidades de visión nocturna; otra es para luces LED y hay una cámara de punto ciego con flash infrarrojo; Tiene cámaras de categoría cinco.

Tesla sólo tiene un tipo de cámara. ¿Crees que Waymo es estúpido? No es estúpido después de ver demasiados casos extremos, no tiene más remedio que resolver este problema mediante hardware. Tienes que atravesar el software, no es muy fácil de usar. Especialmente en los Estados Unidos, está muy oscuro por la noche y muchos lugares no tienen alumbrado público.

Si Tesla sale a la carretera con su configuración actual, incluido Carrot Run, un profesional que sea profesional en cometer errores tendrá muchas formas de cometer errores porque su hardware tiene demasiados defectos.

Insight: ¿Ha experimentado FSD V12 en los Estados Unidos?

Hou Cong:Lo experimenté cuando fui allí en marzo de este año, y nuevamente en mayo, y abría todos los días.

Para ser honesto, no creo que V12 sea sorprendente, solo creo que su practicidad ha mejorado. En ciudad, especialmente en las intersecciones, el manejo ha cambiado significativamente en comparación con el V11. Mayormente bueno, pero no perfecto.

El Tesla V11 ya hace un gran trabajo en carretera. Las intersecciones en la ciudad son muy conservadoras e inhumanas, lo que la hace incómoda. Hay un montón de autos detrás de ti, así que avanza lentamente. Después de mirarlo durante mucho tiempo, se movió muy lentamente. Debido a que tiene puntos ciegos, este comportamiento no es propio de los humanos. Además, al girar, de repente hará girar el volante, lo que te hará entrar en pánico.

Yunjian Insight: ¿La actual solución técnica integral de Tesla también necesita continuar resolviendo casos extremos?

Hou Cong:El caso de la esquina debe resolverse. De un extremo a otro integra información de varios módulos importantes de algoritmos tradicionales y utiliza esta información para entrenar un mejor resultado.

El límite superior de un extremo a otro es alto y el límite inferior es más bajo al principio porque tiene poca controlabilidad. En el pasado, el sistema se dividía en módulos y cada módulo definía una interfaz. Sigue los estándares y no aparecerá nada extraño. Básicamente, el uso de reglas puede resolver una serie de problemas a la vez.

No existe tal concepto de extremo a extremo. Solo podemos utilizar datos más diversos para resolver el problema del límite inferior. He visto suficientes situaciones como esta y finalmente sé cómo resolverlas.

Yunjian Insight: El modelo de un extremo a otro es equivalente a una caja negra. Si ocurre un problema, ¿cómo encontrarlo y resolverlo?

Hou Cong:No debe ser la llamada caja negra. Si se extrapolan los resultados de su producción, todos los resultados de la percepción y la planificación están ahí, por lo que debe aprovechar al máximo su experiencia previa para formar un nuevo modelo. Este modelo tiene un cierto grado de controlabilidad, por ejemplo, esta parte es percepción, esa parte es predicción y esa parte es planificación, pero aún necesita distinguir diferentes etapas.

Insight: ¿Cuándo estima que se lanzará FSD en China?

Hou Cong:al año que viene. Debería haberse hecho hace casi un año. No estoy seguro de los detalles, pero está empezando a contratar ingenieros de algoritmos, lo que significa que ha comenzado. ¿No dice que se gastarán 10 mil millones de dólares a nivel nacional? Construir diversas instalaciones.

Insight: Entonces, ¿qué se necesita hacer para que la FSD se implemente en China?

Hou Cong:Construir un centro de datos y adaptar sus algoritmos a nivel nacional. Porque el panorama interno es complicado al fin y al cabo. Esperamos especialmente que FSD llegue a China, porque es un punto de referencia y, si invierte más, debería ser el más rápido.

Yunjian Insight: ¿Tienen las empresas automotrices nacionales alguna estrategia de respuesta?

Hou Cong:Todo lo que podemos hacer es perseguir. Creo que, después de todo, los jugadores nacionales tienen algunas ventajas al instalar LIDAR. Agregar lidar definitivamente facilitará este problema.

Yunjian Insight: ¿Es posible que el Robotaxi de Tesla no tenga los sensores actuales, pero esté equipado con lidar o más cámaras de alta definición?

Hou Cong:bien. Eso definitivamente reduciría la dificultad, pero podría ser inconsistente con su concepto.

Tesla ahora sólo puede esperar el desarrollo continuo de la IA (inteligencia artificial). Creo que esta posibilidad existe, pero la gente tiene que solucionar varios tipos de problemas al conducir. Estás interactuando con el mundo real y no se trata de poner a prueba tu capacidad de conducción, sino algunas cosas instintivas.

En segundo lugar, al conducir, la gente comprobará el entorno del coche y juzgará las posibilidades a través de su propia comprensión del entorno circundante. Por ejemplo, si encuentras un perro, este desaparecerá a medida que avanzas. En este momento, puedes salir del auto y comprobar si el perro está delante. En una escena como ésta, la percepción humana se expande en un instante. Si el coche no tiene un diseño relevante, en realidad es más peligroso.

Yunjian Insight: ¿Crees que Tesla puede fabricar Robotaxi si se basa únicamente en las capacidades del software?

Hou Cong:Esto es un gran desafío y los requisitos para la IA son muy altos. Creo que definitivamente se puede lograr a largo plazo, pero el proceso no es lo que imaginaba. La IA ha existido durante décadas y se ha mostrado en una gran cantidad de películas de ciencia ficción, pero hasta ahora no se ha resuelto realmente. A veces se puede pensar que es demasiado simple.

Yunjian Insight: Tesla planea expandir el grupo de potencia informática Dojo a 100 EFLOPS (unidades de potencia informática) en octubre de este año. La diferencia entre otras empresas automotrices y Tesla es de órdenes de magnitud. ¿Qué opinas de la brecha?

Hou Cong:Esto es una inversión pesada. Tesla solía tener márgenes de beneficio muy altos. Vende tantos automóviles en todo el mundo que es asequible y el precio de sus acciones también tiene un apoyo relativamente fuerte. Los fabricantes de automóviles nacionales son tan grandes que es imposible invertir una cantidad tan grande de recursos. ¿Por qué Estados Unidos fabricó primero el modelo grande, pero no China? Implica una gran inversión, se necesitan muchos años para gastar dinero y la lógica de inversión detrás de esto es diferente.

Yunjian Insight: ¿Está reservando actualmente potencia informática para operaciones de un extremo a otro?

Hou Cong:Nosotros también lo estamos haciendo, pero de otra manera. Si seguimos el enfoque de Tesla y cuestamos decenas de miles de dólares por el A100, obviamente no podemos permitírnoslo. Unos pocos miles de dólares serían una carga enorme. Haremos algunas restricciones en función de nuestros productos, por lo que la inversión será mucho menor.

Insight: Si los inversores te dan suficiente dinero, ¿qué camino elegirás?

Hou Cong:Si hay suficiente dinero, iremos en esta dirección. Pero no hay condiciones. Todo el mundo conoce la situación actual y el mercado es así.

De los minibuses sin conductor a la conducción asistida

Yunjian Insight: Cuando usted empezó, la conducción autónoma ya no era tan popular en el mercado de capitales. ¿Ha encontrado algún desafío con el financiamiento?

Hou Cong:Definitivamente no es tan fácil como lo era al principio. La financiación inicial solía ser de varios cientos de millones, pero cuando se trataba de nosotros, era mucho más difícil. Sin embargo, creo que esto es bueno para nuestra transición a la L2. Si recauda mucho dinero en la etapa inicial, será difícil hacer la transición a L2. Su valoración quedará aquí.

Yunjian Insight: En ese momento, muchas personas ya estaban iniciando negocios en el ámbito de la conducción autónoma. ¿Por qué cree que todavía existe una posibilidad?

Hou Cong:Técnicamente hablando, creemos que estamos algo avanzados. Conocemos L4 mejor que otros. En segundo lugar, L4 tiene la posibilidad de implementarse en muchos escenarios, no sólo en robotaxi y camiones pesados. En ese momento, si querías recaudar mucho dinero, podías construir un camión pesado o un robotaxi. Pero creemos que hay oportunidades en otras direcciones. Este tipo de vehículos de media y baja velocidad, ya sean minibuses, distribución logística, vehículos de operación, vehículos sanitarios, vehículos de venta o aplicaciones en algunos escenarios cerrados, como terminales mineras o algunas fábricas, aunque el mercado es relativamente pequeño, creemos que su comercialización es todavía relativamente pequeña. Ese (Robotaxi) es más rápido y tiene menores requisitos técnicos.

Yunjian Insight: ¿Por qué construyó un minibús sin conductor cuando comenzó su negocio?

Hou Cong:Porque la dificultad es baja. El escenario previsto en aquel momento era el de una microcirculación, o un escenario relativamente fijo, de vehículos de media y baja velocidad, no sólo minibuses, sino también vehículos logísticos y de trabajo.

Yunjian Insight: Los minibuses autónomos nunca se han comercializado. ¿Cuál crees que es la razón principal?

Hou Cong:También es una cuestión de modelo de negocio y de quién lo paga.

Yunjian Insight: Se transformará en conducción asistida para turismos en 2021. ¿Qué le inspiró a tomar esta decisión?

Hou Cong:Sigo sintiendo que la implementación empresarial L4 es relativamente lenta, requiere una gran inversión, tiene un camino lento y un ciclo largo. Si seguimos por este camino, es posible que tengamos algunas dificultades financieras. Creemos que debemos encontrar algunas soluciones que puedan comercializarse rápidamente para que podamos seguir avanzando. L2++ Este mercado es adecuado.

Las nuevas energías se están desarrollando muy rápidamente en 2021, el precio de las acciones de Tesla se ha disparado nuevamente, la tasa de penetración de vehículos de nuevas energías en China continúa aumentando y la demanda de conducción inteligente continúa aumentando. Da la casualidad de que nuestra tecnología es relativamente fácil de aplicar a las funciones de conducción asistida y podemos comercializarla en el corto plazo.

Yunjian Insight: ¿Por qué no quisiste hacer L2 el primer día de iniciar un negocio?

Hou Cong:No esperaba que L2 fuera tan rápido. En ese momento, Tesla aún no había lanzado una solución sólida. En ese momento, acababa de lanzar Hardware 3.0. En 2019, nuestro equipo fundador Wang Kun compró un Tesla. Me sentí demasiado sorprendido (después de experimentarlo). Para ser honesto, salí de Waymo con algunos prejuicios contra las soluciones de visión, que pensaba que no eran confiables, porque Waymo se basa principalmente en lidar.

De hecho, nuestra tecnología para fabricar minibuses se basa completamente en Robotaxi. Sé que muchos de mis amigos operan minibuses o logística de baja velocidad, que son rutas técnicas completamente diferentes a Robotaxi. Entonces hicimos la transición a L2 muy rápidamente. Algunas empresas no tienen esta capacidad y si insisten en ir en esta dirección, habrá grandes problemas con toda la estructura.

Minibús no tripulado de Qingzhou Zhihang

Yunjian Insight: Cuando recurrió a la conducción asistida para turismos, ¿cómo era el panorama de la industria?

Hou Cong:Nos transformamos después del primer Día de la IA de Tesla, por lo que debemos ir en dirección al BEV. Nos hemos fijado varias reglas. En primer lugar, no construiremos L2 de gama baja. Es un océano rojo y la competencia ya es feroz. Al final, la competencia sigue siendo de costos, lo que no coincide con nuestra pila de tecnología. en absoluto.

Estábamos transformándonos en ese momento y discutimos si debíamos rehacer el planificador. La conclusión fue que debíamos mantener nuestras ventajas y no rehacerlo, porque en el futuro lo que estamos haciendo deben ser soluciones de gama media a alta. la potencia informática está garantizada hasta cierto punto.

Insight: ¿Qué ajustes ha realizado en el algoritmo de L4 a L2?

Hou Cong:El cambio de percepción será mayor, desde soluciones basadas en nubes de puntos láser hasta soluciones basadas en visión. Afortunadamente, utilizamos BEV para hacerlo de inmediato, por lo que fuimos la primera empresa del país en fabricar BEV en J5.

Trabajamos juntos en el NOA urbano y de alta velocidad. Creemos que no hay diferencia en el sistema de percepción. La alta velocidad y la ciudad están integradas, pero la configuración será diferente. Por ejemplo, el rango de detección y la potencia informática se simplificarán un poco, pero la arquitectura y el algoritmo serán los mismos.

Insight: ¿Cómo cooperaste con Horizon?

Hou Cong:Tenemos algunas conexiones. Yu Qian, yo y su director de tecnología, Huang Chang, somos todos de la Universidad de Tsinghua. Trabajé en el Laboratorio de Visión de la Universidad de Tsinghua durante un año y medio y estuve en el mismo laboratorio que Huang Chang. Yu Qian y Huang Chang recibieron títulos de doctorado en el sur de California y son compañeros de estudios.

A principios de 2022, Horizon esperaba encontrar algunos socios ecológicos y decidimos trabajar juntos.

Yunjian Insight: ¿Escuché que Yu Kai te empujó hacia tu ideal?

Hou Cong:Sí, el hermano Kai nos apoya mucho y nosotros también lo apoyamos lo suficiente como para ayudarlos a establecer un punto de referencia.

Yunjian Insight: Existe un problema de potencia informática de la CPU insuficiente al utilizar Horizon J5 como transformador BEV. ¿Cómo utilizó J5 para hacerlo?

Hou Cong:Simplemente no uses Transformer. Tesla promocionó BEV Transformer, pero hay muchas formas en el mundo académico de mapear características de imágenes en el espacio BEV. Transformer es solo un método. Usamos un método que es más adecuado para J5 y el efecto es muy bueno.

Información: ¿El Horizon J6 de próxima generación cambiará a la solución BEV Transformer?

Hou Cong:En cuanto al rendimiento de los costos, si el uso de Transformer consume mucha potencia informática pero produce muy poca producción, lo consideraremos todo. Pero definitivamente usaremos Transformer para implementar algunas cosas, incluido el negocio sin mapas de un extremo a otro y algo de procesamiento de mapas. El valor de usar Transformer en esta área es bastante grande.

Cuanta más gente lo utilice, mayor será el desafío.

Insight: Actualmente está desarrollando el sistema AD Pro ideal. ¿Hay algún desafío?

Hou Cong:La mayor dificultad es que su base de usuarios es muy grande y sus requisitos muy altos. Cuanta más gente lo utilice, más problemas expondrá, dada una cierta probabilidad. Cuando sólo tienes miles o decenas de miles de usuarios, esto puede ocurrir una vez al mes o una vez cada pocos meses. Pero si cientos de miles de personas lo utilizan, puede ocurrir una vez a la semana o varios días. Esto también tiene algo que ver con la cobertura de usuarios. Cuanto mejor sea el producto, más personas lo usarán y más problemas expondrá. Definitivamente es un desafío garantizar que el sistema no tenga ningún problema de estabilidad o seguridad.

Insight: ¿Cuál es un problema difícil que has resuelto recientemente?

Hou Cong:Identificar los semáforos es en realidad un problema difícil. En tantas intersecciones de todo el país, la apariencia, las reglas y la relación entre los semáforos y las carreteras son todas diferentes. Algunas luces son simples luces rojas, amarillas y verdes, algunas están en dos filas, también hay luces muy largas con flechas en el interior, y hay luces para bicicletas y autobuses en el interior, y algunas luces tienen formas extrañas. Es temporal.

Considere también el fondo claro, como por ejemplo de noche. Debido a las limitaciones del sensor, puede resultar difícil distinguir las formas de flechas y círculos cuando están sobreexpuestos. Y cuando hay interferencias de muchas luces de fondo, tendrá un mayor impacto en el sistema.

Además, la luz LED parpadea constantemente, lo que puede interferir con la identificación. Hoy en día, las cámaras ya están equipadas con función antiestroboscópica, pero aun así, las frecuencias de algunas luces pueden no coincidir.

Yunjian Insight: Otros sistemas también deberían enfrentar el problema de identificar los semáforos.

Hou Cong:Mismo. Los principios son similares, pero debido a que el hardware es diferente, los métodos serán diferentes. Cuanto más fuertes sean sus capacidades de hardware, más métodos podrá utilizar. El punto más importante es cuántas situaciones diferentes en todo el país cubren los datos.

Insight: ¿Cuál es el límite superior de las capacidades del modelo AD Pro basado en Horizon J5?

Hou Cong:Funciona mejor en la carretera.

Yunjian Insight: Yu Kai mencionó antes que la potencia informática de la CPU del chip J5 fue insuficiente debido a la insuficiente inversión de recursos ese año. Pero NVIDIA siempre invierte por delante de la curva.

Hou Cong:Cada uno tiene ideas diferentes. NVIDIA se va a la gama alta, pero sus costes están ahí y no puede continuar. Es más adecuado para el modo de autoaprendizaje. La ecología es relativamente completa y el costo de desarrollo es relativamente bajo. Pero si desea crear un modelo rentable, aún debe elegir un chip más rentable.

Insight: ¿Utilizas sólo chips Horizon?

Hou Cong:El objetivo del diseño de nuestro sistema es poder adaptarnos a una variedad de chips. Para lograr este objetivo, hemos hecho algunos sacrificios. Puede que no maximicemos el papel de cada chip al 100%, pero es lo suficientemente bueno. Quizás sería mejor invertir más, pero el rendimiento marginal es muy bajo. Horizon es ahora nuestra plataforma y socio más importante y definitivamente lo aprovecharemos. Pero nuestro sistema no está diseñado sólo para el horizonte.

Nuestros minibuses siempre han utilizado NVIDIA. Cuando estaba trabajando en L4 al principio, usé NVIDIA Xavier para el acceso al sensor y también ejecuté algunos algoritmos. NVIDIA Orin se lanzará en 2022 y seremos los primeros usuarios. En ese momento, cooperamos con un fabricante y en un mes migramos el sistema de las computadoras industriales a NVIDIA Orin. Este socio es una empresa de renombre internacional. Informó de esta situación a NVIDIA. NVIDIA lo destacó en la conferencia GTC de ese año. Cooperamos con dos empresas de automóviles (.Xiaopengymuy kryptoniano) en paralelo, el primero en utilizar los chips duales Orin de Nvidia.

Insight: ¿Qué opinas sobre la transición de Nvidia de fabricar chips a crear soluciones de conducción autónoma?

Hou Cong:Tiene que construir un proyecto modelo que le ayude a ver el futuro de los chips con mayor precisión. Se debe tener conocimiento de cuánta potencia informática se requiere y qué funciones necesita el sistema.

De hecho, publicó un artículo completo hace seis o siete años, pero nunca pudo trabajar en él. Wu Xinzhou fue castigado en el pasado, pero no del todo. Considero que puede ser mejor crear un modelo, si se hace bien, se puede convertir en una solución estandarizada y podemos avanzar un paso más.

Después de construir el proyecto prototipo, también puedes ayudarlo a vender chips.

Yunjian Insight: ¿Se requiere mucha mano de obra para entregar cada modelo que fabrica? ¿O es una solución general que se puede utilizar para todos los coches?

Hou Cong:Depende de cómo lo identifique el sistema. Esto es realmente muy crítico. Huawei, por ejemplo, espera convertirse en un superproveedor y reducir los costes de envío. Todos los sensores de Huawei están definidos por sí mismos, pero generalmente los fabricantes de automóviles los reemplazan según su propia cadena de suministro. En primer lugar, no cambia la cámara, e incluso la posición de instalación es relativamente estándar. Las cámaras delantera y trasera de este modelo están colocadas juntas en un módulo. De esta manera, la posición de instalación queda relativamente fija y se reducen los costes de adaptación posteriores. Las ubicaciones aproximadas de los SUV y los sedanes son las mismas y los modelos son los mismos, por lo que el costo de envío debe ser bajo.

Ya no quiero ser el Nivel 1

Yunjian Insight: ¿Acabas de decir que todo lo que hizo Tesla estuvo bien, excepto Robotaxi, incluida la fabricación de sus propios chips?

Hou Cong:bien. Fabrica dos chips propios, uno para el automóvil y otro para el modo fuera de línea. En 2019, el vehículo no tenía un chip de potencia informática tan alta. Pudo hacer BEV tan temprano gracias a este chip.

El chip Orin de Nvidia no se lanzará hasta 2022, pero Tesla ya produjo un BEV en 2021, liderando el mercado por más de un año. Primero utilizó los chips de Mobileye y luego el Drive PX de Nvidia. Los precios de Nvidia no han podido bajar, por lo que tuvo que fabricar los suyos propios para reducir costos.

Yunjian Insight: Entonces, ¿es razonable que las empresas automotrices aprendan de Tesla y desarrollen sus propios chips?

Hou Cong:Tesla tiene el tamaño para hacer esto. Otros fabricantes de automóviles han aprendido de esta manera, lo que puede no ser correcto.

Yunjian Insight: Las empresas de automóviles, las empresas de chips y los proveedores de soluciones de conducción autónoma están reinventando la rueda actualmente. ¿Cómo cree que evolucionará la división de la industria en el futuro?

Hou Cong:Dejemos que el mercado lo pruebe todo. El propósito de hacer esto no es necesariamente simple. Puede haber otros propósitos, como dar forma a la imagen de las marcas de tecnología, incluida la gestión del valor de mercado y la atracción de talentos.

En teoría, en términos de seguridad y costo de la cadena de suministro, las empresas de automóviles tienen ciertas ventajas en los chips de desarrollo propio, pero se debe considerar el costo general. El mayor problema al crear un chip es que lo creas y descubres que hay un nuevo algoritmo y que tu hardware es lento. Todo el mundo se apresura a hacer ese algoritmo y su chip no se puede utilizar.

Insight: ¿Estás hablando de Horizon J5?

Hou Cong:J5 es un estudio de caso. Pero creo que no es sólo el J5, esa generación de chips, siempre que no sean universales, todos tienen este problema.

Yunjian Insight: ¿Se ha estabilizado la arquitectura técnica ahora?

Hou Cong:No. Los transformadores también están siendo desafiados ahora y existen tecnologías nuevas y más eficientes. También habrá un proceso de convergencia.

Yunjian Insight: ¿Es razonable que los fabricantes de chips desarrollen soluciones de conducción inteligentes?

Hou Cong:No creo que la ventaja sea obvia. Cuando los fabricantes de automóviles cooperan con los fabricantes de chips, pueden esperar obtener algo de ayuda, lo que implica algún desarrollo subyacente, ya sean controladores, software subyacente, procesamiento de señales de sensores o razonamiento de redes neuronales. Sin embargo, el costo para los fabricantes de chips de proporcionar dichos servicios. es bastante alto y no puede servir a todos los hogares.

A menos que se pueda hacer que la cadena de suministro madure mucho, pero esto lleva tiempo. Es difícil para las nuevas empresas de chips alcanzar tal madurez en este ámbito y deben contenerse. O unos pocos socios ecológicos pueden dominar el mercado. Sin embargo, los fabricantes de automóviles también tienen necesidades de autodesarrollo y no quieren depender de socios ecológicos. También se necesita tiempo para que los socios ecológicos crezcan y es imposible llenar rápidamente este mercado.

En este momento, los fabricantes de chips definitivamente sentirán que pueden resolver estos problemas haciéndolo ellos mismos.

Insight: ¿Cuánta mano de obra necesitas para completar un proyecto?

Hou Cong:En términos generales, el primer proyecto es el que requiere más mano de obra y la inversión disminuye a medida que avanzan los proyectos.

Insight: ¿Cuántos proyectos puedes hacer al mismo tiempo ahora?

Hou Cong:Dos o tres proyectos. La inversión actual en un solo proyecto aún no es óptima. Después del quinto proyecto, básicamente cada proyecto solo requiere unas pocas docenas de personas para completarlo, y no hay problema para hacer cinco o seis proyectos.

Yunjian Insight: ¿Deberían los proveedores de conducción autónoma contratar a más personas para que se encarguen de más proyectos, o deberían controlar el tamaño de su personal y asumir solo un número limitado de proyectos?

Hou Cong:Mire los objetivos estratégicos. Si desea ocupar el mercado, ampliar la escala, continuar recaudando fondos, cotizar en bolsa y emprender más proyectos de esta manera de alto perfil. Otro tipo es establecer primero puntos de referencia, cultivar capacidades, estandarizar productos y luego copiarlos rápidamente. Comienza con sólo uno o dos proyectos, estableciendo puntos de referencia primero, pero los productos están estandarizados y no habrá mucha personalización para una promoción posterior. Esta es otra idea.

Insight: ¿Por qué elegiste la segunda ruta?

Hou Cong:Porque cuanto más recibamos ahora, más perderemos y el negocio está bajo una gran presión operativa. Consideramos que el mercado final debe limitarse a unos pocos proveedores y que la estandarización de los productos debe realizarse bien.

Insight: A medida que esta industria evolucione, ¿qué papel desempeñará en la cadena en el futuro?

Hou Cong:Al menos desarrollaremos uno o dos chips en una determinada categoría de productos de gama media a alta y proporcionaremos una solución estandarizada. Es posible que eventualmente nos convirtamos en una empresa de nivel 2. Hacemos algoritmos y entrega de software, pero no hacemos el conjunto completo. Hay un proveedor de sistemas que resume estas cosas.

Insight: ¿Por qué no haces el Nivel 1?

Hou Cong:No hacemos el Nivel 1 del sistema, pero sí el Nivel 1 del software (Nivel 2 del sistema). El nivel 1 del sistema requiere mucho hardware, la inversión es bastante grande y las ganancias son relativamente escasas. También consideraremos esta dirección, pero actualmente el Nivel 2 es más factible.

Yunjian Insight: ¿Es el Nivel 1 responsable de ser el controlador de dominio?

Hou Cong:Todavía tengo que hacer entregas. Requerirá más mano de obra, lo cual no es nuestra ventaja.

Insight: ¿Cuáles son sus ventajas?

Hou Cong:Sigo haciendo algoritmos y productos. Creo que Qingzhou no es una empresa genéticamente capaz de alcanzar hardware de nivel 1. Es un tipo de empresa diferente, como Desay SV y Joyson Electronics.

Insight: Pero su cooperación con Ideal es que usted es el Nivel 1 de Horizon.

Hou Cong:Somos como software Tier 1. El Nivel 1 seguirá existiendo por un tiempo en el corto plazo, pero eventualmente se estandarizará. Después de eso, fabricaremos nuestro propio hardware o crearemos el Nivel 2.

Yunjian Insight: Entonces, en su opinión, en el futuro, los proveedores de soluciones de conducción inteligente cooperarán con las empresas de automóviles, el sistema de nivel 1, el algoritmo de nivel 2 y el chip de nivel 2.

Hou Cong:bien.

Yunjian Insight: ¿No puede el chip de nivel 2 hacer el trabajo del algoritmo de nivel 2?

Hou Cong:A ver si es mejor que nosotros en esto.

Yunjian Insight: Si proporciona un algoritmo estandarizado, entonces los chips de Nivel 2 también deberían querer hacerlo.

Hou Cong:¿Por qué tiene que hacerlo él mismo? Simplemente coopere con nosotros.