noticias

La figura AI creó el “Terminator”

2024-08-07

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Informe del corazón de la máquina

Departamento editorial de Machine Heart

Capaz de tener conversaciones de voz, visión VLM y trabajar 20 horas al día.

Siempre habrá este día, pero no esperábamos que llegara tan pronto.

En la tarde del 6 de agosto, hora de Beijing, Figura, una conocida startup de inteligencia encarnada en Silicon Valley, lanzó oficialmente su robot humanoide de nueva generación Figura 02.





Además de parecer de ciencia ficción, este tipo de robot también tiene suficiente inteligencia general como para poder hablar con humanos en tiempo real y aprender automáticamente a ensamblar piezas. De hecho, la Figura 02 está trabajando como pasante en la fábrica de BMW en Spartanburg y parece que hemos dado un paso hacia el futuro.



El equipo de ingeniería y diseño de Figure completó un rediseño completo del hardware y software de Figure 02. Se han logrado avances significativos en tecnologías clave como la inteligencia artificial, la visión, las baterías, los dispositivos electrónicos, los sensores y los actuadores.

Corazón de la máquina

,Pulgares hacia arriba

539

En concreto, la Figura 02 incluye principalmente las siguientes características:

  • Conversación de voz en tiempo real: Figura 02 Capaz de hablar con personas a través de micrófonos y parlantes integrados conectados a un modelo grande de OpenAI personalizado;
  • Cámara: Sistema de visión AI impulsado por 6 cámaras RGB;
  • Manipulador: El manipulador de cuarta generación con 16 grados de libertad y la misma fuerza que los humanos;
  • VLM integrado: Admite cámaras robóticas para un razonamiento visual rápido y de sentido común;
  • Batería de gran capacidad: Un paquete de baterías personalizado de 2,25 KWh en el torso del robot proporciona más del 50 % de energía;
  • Procesador/GPU: En comparación con la generación anterior, las capacidades de computación a bordo y razonamiento de IA se han multiplicado por 3.

Mejora integral: general + humanoide + práctica.

Quizás el mayor cambio en esta actualización es que la Figura 02 está realmente lista para responder a comandos de voz.

En la sorprendente demostración tecnológica del año pasado, un humano parado frente a la Figura 01 le preguntó al robot: "¿Puedes traerme algo de comer?". No sólo reconoció que el objeto frente a él era una manzana, sino que también entendió que eran manzanas. Se puede comer directamente, así que le entregó la manzana a la persona que tenía delante y le dijo: "Por supuesto, tómala y cómela".

En marzo de este año, OpenAI anunció que cooperaría con Figure para desarrollar inteligencia incorporada, permitiendo a los robots humanoides tener capacidades de conversación efectivas y en tiempo real. Con el respaldo de OpenAI, Figure puede iterar rápidamente las capacidades de voz a voz del robot. Figure afirmó que debido al aumento significativo en la potencia informática final de la Figura 02, ahora puede realizar diversas tareas en el mundo real con total autonomía.

En la Figura 02, la implementación del razonamiento del habla del robot se beneficia principalmente del micrófono y el altavoz integrados conectados al modelo de IA personalizado entrenado en cooperación con OpenAI.



El sistema de navegación de la Figura 02 utiliza un VLM (modelo de lenguaje visual), que permite a la cámara del robot realizar investigaciones basadas en semántica y razonamiento visual rápido de sentido común. VLM es una nueva dirección en la conducción inteligente que actualmente están estudiando muchas fuerzas nuevas en la fabricación de automóviles. En el campo de la robótica, este método obviamente también puede lograr resultados revolucionarios en muchas tareas.



Se puede decir que la duración de la batería es uno de los mayores desafíos que enfrenta el uso práctico de robots humanoides. La Figura 02 tiene un paquete de baterías personalizado con una capacidad de 2,25 KWh en el torso del robot, que puede proporcionar más del 50% más de energía que la Figura 01, maximizando así el tiempo de funcionamiento del robot. Brett Adcock, fundador y director ejecutivo de Figure AI, dijo que esperan que Figure 02 pueda lograr más de 20 horas de trabajo efectivo todos los días.



Podemos ver que la apariencia de la Figura 02 se ha vuelto más integrada porque adopta una nueva estructura de exoesqueleto. En comparación con la Figura 01, el diseño de la apariencia del robot ha cambiado más completamente. Además, también adopta un diseño de cableado integrado. El cableado integrado tiene los siguientes beneficios:

  • mayor confiabilidad
  • Cables ocultos
  • Embalaje más ajustado



De la Figura 01 a la Figura 02, la apariencia ha cambiado mucho.

Además de un mejor cableado, Figura 02 diseñó terminales y conectores de cables personalizados para aumentar la confiabilidad del robot.



Para comprender el mundo como los humanos, la Figura 02 utiliza sistemas visuales multicámaras + impulsados ​​por IA para realizar la percepción y el razonamiento. Tiene un total de 6 cámaras RGB integradas en la cabeza, el torso delantero y el torso trasero, lo que le brinda al robot capacidades visuales más allá de las de los humanos.



Por último, hay dedos ágiles. La Figura 02 está equipada con un manipulador de cuarta generación, que tiene 16 grados de libertad y tiene la misma fuerza que los humanos. Puede realizar diversas tareas complejas. Toda la mano contiene tecnologías mecánicas, eléctricas, de control y de sensores.



Brett Adcock dijo que a medida que el robot continúe funcionando, el motor de datos de IA recopilará y organizará datos para entrenar modelos para mejorar continuamente el rendimiento.



Al ver la apariencia tan maravillosa de la Figura 02, la gente no puede evitar pensar en el Optimus Prime de Musk. Comparado con los dos, no sé quién es mejor.



Algunos internautas dijeron: "La Figura 02 presagia el comienzo de una nueva era. Actualmente, este es el robot más avanzado del mundo y el futuro está aquí".



Figura de empresa emergente: la mitad de Silicon Valley está invirtiendo

Fundada en 2022 por Brett Adcock, Figure es una empresa de robótica con sede en EE. UU. que se especializa en el desarrollo de robots humanoides. El objetivo de la empresa es desarrollar robots humanoides universales que tengan un impacto positivo en la humanidad y creen una vida mejor para las generaciones futuras.

Después de la explosión de la tecnología de IA generativa, han surgido muchas empresas de robótica que apuntan a la inteligencia incorporada, y Figura es particularmente llamativa entre ellas. En marzo de 2023, Figure salió del modo sigiloso y lanzó el prototipo de robot Figura 01, que se ve y se mueve como humanos. Se trata de un robot bípedo diseñado para trabajos manuales, dirigido inicialmente al sector de la logística y el almacenamiento.

En mayo de 2023, la empresa recaudó 70 millones de dólares de inversores liderados por Parkway Venture Capital.

En octubre del mismo año, Figure publicó un vídeo del robot bípedo Figure 01 caminando.



En enero de este año, la Figura 01 aprendió a hacer café.



El 18 de enero de 2024, Figure anunció una asociación con BMW para implementar robots humanoides en plantas de fabricación de automóviles. En este momento, se dice que la Figura 01 puede completar tareas en el mundo real de forma autónoma.



Figura 01 Trabajando en la fábrica de BMW.

En marzo de este año, Figure anunció la finalización de una asombrosa financiación Serie B de 675 millones de dólares, lo que eleva la valoración de la empresa a 2.600 millones de dólares. Los inversores incluyen Microsoft, Intel, OpenAI Startup Fund, Amazon Industrial Innovation Fund, Nvidia, Bezos, "Mr. Mu's" Ark Investment, Parkway Venture Capital, Align Ventures, etc.

Al mismo tiempo, Figure también anunció una asociación con OpenAI, incluida la construcción de un modelo de IA especializado para el robot humanoide de Figure, de modo que su robot pueda procesar y razonar sobre el lenguaje.

El 13 de marzo, con la ayuda de la tecnología OpenAI, la Figura 01 podrá mantener una conversación integral con los humanos.

Desde caminar erguido y completar tareas complejas hasta interactuar de forma natural con las personas. Estos aspectos técnicos destacados son también una de las razones importantes por las que Figure ha llegado a un acuerdo de cooperación con OpenAI, que siempre ha querido volver al campo de la robótica, para combinar la investigación de OpenAI con la experiencia en robótica de Figure para desarrollar modelos de IA de próxima generación para robots humanoides. .

Después del lanzamiento de la Figura 02 hoy, la combinación de hardware altamente integrado y tecnologías de inteligencia artificial de próxima generación, como VLM, nos ha acercado un paso más a los robots humanoides con capacidades verdaderamente universales.

Pronto, ¿el mundo físico también marcará el comienzo de los cambios provocados por la IA?

Contenido de referencia:

https://x.com/Figure_robot/status/1820791819023909031

https://www.youtube.com/watch?v=0SRVJaOg9Co

https://www.therobotreport.com/figure-02-humanoid-robot-is-ready-to-get-to-work/