notícias

Estudante chinês de doutorado em Yale pós-2000 fez uma pausa na escola para abrir um negócio e desenvolveu um robô humanóide que pode lavar roupas e fazer hambúrgueres

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Texto | Wang Qin

Editor|Qiu Xiaofen, Su Jianxun

Embora a história de estudantes da Ivy League que abandonaram a escola para iniciar um negócio não seja novidade, desta vez é a vez da geração pós-2000 abandonar a escola para iniciar um negócio. Ele também é um tirano acadêmico chinês que publicou no topo. publicações e conferências, e fui direto para Yale - A competição de grandes modelos de IA e inteligência incorporada tornou-se tão popular que já existe um senso de urgência de que "estarei velho se não começar um negócio".

Yang Fengyu Fred Yang, natural de Jiangsu, nascido em 2000, formou-se em Yale com bolsa integral. Ele é o fundador da empresa de inteligência incorporada UniX AI (UniX Technology Company). faça hambúrgueres e lave pratos.


Fred Yang, fundador da empresa de robôs humanóides UniX AI

Embora ele tenha começado seu próprio negócio tão jovem, a decisão de Yang Fengyu de abandonar a escola e abrir um negócio não foi por impulso. Em primeiro lugar, ele queria abrir um negócio quando estava no ensino médio e teve alguns projetos empreendedores de “pequena escala” quando era estudante de graduação. Em segundo lugar, disse que o número de artigos que publicou foi suficiente para obter o doutorado e que fazer uma pausa não era uma decisão arriscada. Além disso, vem acumulando recursos empresariais. Ele vem acumulando contatos acadêmicos na área de inteligência incorporada na China desde a graduação. Depois de iniciar seu negócio, procurou pessoas seniores na indústria de robótica em todo o país para formar uma equipe. .

Agora, a empresa UniX AI que ele fundou convidou Wang Hesheng, um ilustre professor da Universidade Jiao Tong de Xangai e presidente geral da principal conferência de robótica IROS2025, como seu cientista-chefe.

Embora tenha publicado artigos nas principais revistas internacionais e ganhado o título de Outstanding Undergraduate Scientist da North American Computer Society, como um jovem que regressou à China para iniciar um negócio, Fred Yang encontrou frequentemente obstáculos ao recrutar pessoas. Quando montamos uma equipe pela primeira vez e convidamos alguns especialistas seniores, vinte anos mais velhos que nós, para participar, tivemos que visitar a casa de palha três vezes e até conversar por mais de oito horas seguidas.

Atualmente, o robô humanóide com rodas + dois braços desenvolvido pela UniX AI, como um robô de serviço doméstico, pode identificar automaticamente as roupas que você joga em todos os cantos da casa, recolhê-las automaticamente e levá-las à máquina de lavar para lavar, e também pode lhe dar roupas depois de terminar de comer. Você guarda a louça, lava a louça e limpa o chão.


Robô UniX AI pode colher tofu

Para cenários domésticos, as capacidades operacionais das mãos robóticas são críticas. A pinça de três dedos desenvolvida pela UniX AI pode conter canetas esferográficas e tofu. A UniX AI disse que seu primeiro lote de 100 robôs humanóides será produzido em massa em setembro.

A seguir está uma conversa entre “Intelligence Emergence” e Fred Yang, fundador da UniX AI, uma empresa de inteligência incorporada.

Surgimento da inteligência: Atualmente não existe uma definição unificada de robôs humanóides na indústria, e diferentes empresas têm diferentes caminhos técnicos. Algumas empresas fabricam robôs humanóides bípedes desde o início, e algumas empresas fabricam robôs humanóides, como os robôs com rodas da sua empresa. Forma de dois braços. O que você acha dos diferentes caminhos técnicos?

Fred Yang : Este mercado é suficientemente grande e diferentes empresas estão enraizadas em diferentes cenários. Cada um projeta sua própria estrutura mecânica e soluções gerais de software e hardware com base no cenário de aplicação. Nesta fase não é difícil encontrar um cenário de aplicação para cada solução técnica. Acho que não existe certo ou errado. Todo mundo considera isso do ponto de vista das necessidades.

Smart Emergence: Por que você escolheu a configuração roda + braços?

Fred Yang : Vamos falar primeiro dos braços. Em uma cena familiar, o mais importante é a capacidade de operar as mãos. A altura de muitas coisas no espaço doméstico é projetada para pessoas. Nosso braço humanóide biônico tem 7 graus de liberdade (que pode ser entendido como o braço tem 7 articulações) e pode realizar muitas operações semelhantes às humanas.

Em relação ao tipo de roda, considerando a precisão e segurança do movimento, primeiro escolhemos o tipo de roda para entrar no cenário inicial. Todos ainda projetam reversamente suas próprias soluções de hardware com base em diferentes cenários de uso.


Capacidades operacionais do robô UniX AI


Emergência da Inteligência: Atualmente você está trabalhando em hardware e software ao mesmo tempo?

Fred Yang : Nossa lógica central é baseada no cenário. Hardware e software são igualmente importantes para nós.

Emergência da Inteligência: Geralmente, as empresas que estão envolvidas na inteligência incorporada terão seu próprio foco no cérebro, cerebelo e corpo de hardware.

Fred Yang: Fazemos software e hardware, mas se nos concentrarmos no cérebro, cerebelo e hardware, nos concentraremos mais nos níveis de hardware e cerebelo.

O hardware é a base do algoritmo. Software e hardware são altamente acoplados e o hardware deve acompanhar a cena. Por exemplo, na cena doméstica, nossa pinça de três dedos autoprojetada tem dois modos (modo de três dedos e modo de dois dedos. Os três dedos podem ser girados em dois dedos, que podem ser usados ​​para segurar pequenas canetas esferográficas). ou até mesmo tofu, espere.

Além disso, também é importante estabelecer uma base sólida no cerebelo nesta fase. Em relação à questão da "generalização" que preocupa a todos, o processo de generalização pode ser dividido em três etapas: desde cenários limitados de uma única tarefa, até cenários abertos de uma única tarefa, até cenários abertos de tarefas abertas.

(Observação: por exemplo, desde ser capaz de fazer uma única tarefa, como lavar roupa em um determinado ambiente doméstico, até ser capaz de lavar roupa em ambientes domésticos com diferentes ambientes espaciais, até ser capaz de lavar roupa, cozinhar e dar aulas particulares às crianças. diferentes ambientes espaciais e outras tarefas)

Agora, todos na indústria ainda estão trabalhando duro do primeiro ao segundo estágio. Este estágio testa principalmente a capacidade do cerebelo. Se abrirmos cenários mais tarde (o terceiro estágio), estaremos essencialmente planejando (planejamento de tarefas) no nível do cérebro, mas agora a primeira tarefa é estabelecer uma base sólida no nível do cerebelo e resolver primeiro o nível operacional.


Robô humanóide UniX AI agarra roupas

Emergência da Inteligência: Um dos resultados de sua pesquisa é o UniTouch, um grande modelo tátil multimodal. O que é tatilidade visual e o que é um grande modelo tátil? Qual o significado da sensação ao toque visual no avanço da tecnologia de robôs humanóides?

Fred Yang : O toque é muito importante no sistema operacional do robô e até mesmo no sistema operacional humano. Do ponto de vista humano, o toque é o modo de percepção mais instintivo e o feedback é obtido através da interação real com o mundo físico. Tomemos um pequeno exemplo, procurando chaves em uma bolsa. De modo geral, as pessoas não confiam na visão, mas principalmente no toque.

Do ponto de vista de um robô, devido a limitações na estrutura mecânica e na seleção de sensores, confiar apenas na visão muitas vezes não é suficiente. Por exemplo, deixe o robô agarrar a tampa da garrafa. A tampa da garrafa é muito pequena. Quando o braço do robô a agarra, ela já está bloqueada pelo próprio braço do robô.

Neste momento, você só pode contar com feedback tátil para concluir a captura e verificação final. Esta situação é particularmente proeminente na operação de objetos deformáveis. Ao entrar em contato com um objeto deformável, a forma do objeto muda e a informação que o anterior visual pode fornecer é muito limitada. Ele deve contar com informações táteis muito locais, mas altamente sensíveis, para perceber e completar tarefas.

Ao mesmo tempo, o toque fornece outras informações que a visão não pode fornecer, como a força. A visão pode fornecer ao robô a posição de preensão, mas não pode determinar a força de preensão. Sensores de força simples também têm limitações. Por exemplo, antes de esmagar um copo, nenhuma mudança pode ser vista na perspectiva da força, mesmo que tenham surgido pequenas rachaduras na parede do copo. Mas, neste momento, o sensor tátil pode capturar as pequenas rachaduras e determinar se a próxima operação irá esmagá-las.

Publiquei um artigo antes e fiz o primeiro modelo multimodal tátil em grande escala do mundo, integrando informações táteis com informações visuais e outras informações modais de linguagem. Cada modalidade tem suas limitações, e a visão também tem suas limitações, mas com a adição de informações táteis, cada modalidade pode se complementar.

Atualmente, muitos concorrentes também estão praticando a sensação ao toque, mas ainda se concentram no nível de hardware, como sensores táteis. No entanto, se a IA UniX for orientada para utilizadores domésticos, o hardware deve ter uma vida útil de 3 a 5 anos. Nesta fase, muitos sensores tácteis de alta precisão ainda não foram capazes de satisfazer as necessidades comerciais em termos de vida útil.


Robô UniX AI abre máquina de lavar

Surgimento da inteligência: Seu primeiro lote de 100 robôs humanóides será produzido em massa a partir de setembro. Este número é relativamente grande para fabricantes de robôs humanóides. Como a cadeia de suprimentos é gerenciada?

Fred Yang : A produção em massa concentra-se principalmente na cadeia de abastecimento. Temos alguns especialistas em cadeia de abastecimento da Mercedes-Benz e Haier, que têm experiência em fabricação de cadeia de abastecimento e controle de custos. Há também um grupo de membros da cadeia de suprimentos com experiência em produção em massa de robótica tradicional, eletrônicos de consumo, indústria automotiva e indústria aeroespacial.

Emergência de Inteligência: Como você constrói uma equipe?

Fred Yang : O campo da robótica não pode ser resolvido com apenas uma pilha de tecnologia. Requer a cooperação geral de hardware e software, bem como experiências de equipe diversificadas. Toda a indústria de inteligência incorporada é muito nova e nossa equipe de algoritmos é muito jovem. Eles são basicamente PhDs e pós-doutorandos que trabalham em robótica ou inteligência artificial no país e no exterior.

Em termos de hardware, estamos atualmente focados em cenários domésticos e a segurança é definitivamente o fator mais importante. Nossa equipe conta com membros de robôs de atendimento domiciliar para realizar tarefas de desvio de obstáculos em ambientes complexos em diferentes residências, como fios enrolados, obstáculos suspensos, etc. Para hardware relacionado à inteligência incorporada, incluindo braços e pernas de robôs humanóides, também temos cientistas altamente capacitados como responsáveis ​​pelo desenvolvimento de hardware.

Emergência Inteligente: Você é muito jovem e nasceu depois de 2000. Uma equipe tão grande exige fortes habilidades operacionais. Como você recruta pessoas?

Fred Yang : Foi muito difícil recrutar pessoas no início. Meu curso de graduação é na Universidade de Michigan e meu doutorado em Yale. Sou bem conhecido no círculo de inteligência incorporada no exterior, então rapidamente encontrei alguns amigos no exterior que estão fazendo algoritmos, mas o robô precisa combinar software; e hardware. Quando volto para a China, as pessoas não nos conhecem, também bati em muitas paredes. Antes de cada membro importante ingressar, tive uma longa conversa com eles. Para talentos, é preciso ter o espírito de “visitar a cabana de palha três vezes”.

Surgimento da inteligência: Não é fácil implementar robôs humanóides. Atualmente, a maioria deles ainda está em fase de venda para institutos de pesquisa científica. Na verdade, é muito difícil expandir a escala. um passo, e 100 unidades serão produzidas em massa este ano.

Fred Yang : A produção em massa de robôs humanóides com rodas não é tão difícil quanto a de robôs humanóides bípedes. Agora, todos têm opiniões diferentes sobre a definição de robôs humanóides. Para robôs humanóides bípedes, acho que ainda há um caminho a percorrer. Eles ainda não estão totalmente prontos para serem lançados no mercado porque existem alguns problemas de segurança que ainda não foram resolvidos. Mas o mais importante em casa é a capacidade de operar as mãos, então a primeira geração de robôs que lançamos foi um robô com rodas + dois braços. O robô com rodas é uma tecnologia relativamente madura.

A velocidade da iteração do produto é importante. É difícil fabricar um produto de alta qualidade na primeira geração. Primeiro, produzimos rapidamente uma versão de um robô relativamente estável, confiável e econômico, lançamos-no no mercado em grande escala e, em seguida, iteramos rapidamente. Sempre dissemos internamente que três gerações produzem produtos de alta qualidade.

Nossas 100 unidades iniciais são principalmente usuários de sementes que desejam ser “os primeiros a comer caranguejos”.


Robô UniX AI limpa mesas

Smart Emergence: Você já tem clientes TO C? Houve contatos iniciais?

Fred Yang : Os usuários individuais no início eram principalmente alguns amigos ao nosso redor, alguns amigos da indústria de tecnologia e entusiastas da tecnologia que estavam muito interessados ​​em produtos de ponta. Semelhante ao grupo-alvo que estava disposto a comprar o Tesla quando foi lançado. . Uma turma que gosta de experimentar tecnologia. Faremos também alguns grupos focais (entrevistas em grupos focais) para compreender as necessidades específicas dos grupos-alvo.

Emergência de inteligência: Comparados com robôs em cenários verticais (como serviços comerciais, logística de armazenamento, inspeções de segurança, etc.), os robôs humanóides universais em cenários domésticos são muito mais difíceis de implementar e exigem capacidades de generalização muito maiores dos robôs. Suas informações dizem que o robô humanóide UniX AI tem funções como lavanderia, assistente de jantar, limpeza e tutoria de crianças com lição de casa. Como está a situação de implementação?

Fred Yang : O objetivo final dos robôs humanóides é, obviamente, esperar que os robôs possam fazer tudo, mas eles têm que comer um pedaço de cada vez e fazer as coisas uma por uma. Na cena familiar também é implementado passo a passo, desde a cena limitada de uma única tarefa, até a cena aberta de uma única tarefa e, finalmente, até a cena aberta de tarefas abertas.

Nossos produtos possuem atualmente diversos cenários maduros, como lavar roupas, ajudar a recolher a louça e lavar a louça após as refeições, funções de limpeza 3D, etc. Tomemos como exemplo a função de lavanderia. O primeiro passo do robô Wanda será encontrar objetos e construir um mapa tridimensional de forma independente. As garras desenvolvidas pela própria empresa são versáteis para agarrar objetos flexíveis. O terceiro passo é usar uma máquina de lavar.

Não é difícil usar máquinas de lavar de forma generalizada (os robôs podem operar diferentes tipos de máquinas de lavar, podemos chamar diferentes modelos pequenos para realizar esta tarefa).

Emergência da Inteligência: Por que optar por retornar à China para iniciar um negócio? Você já pensou em abrir um negócio nos Estados Unidos?

Fred Yang: Não me defino como retornar à China para iniciar um negócio ou iniciar um negócio nos Estados Unidos. Temos equipes nos Estados Unidos e na China, mas apenas aproveitamos diferentes vantagens de localização. Os Estados Unidos têm uma equipe de algoritmos de ponta e a China tem parceiros em estrutura e hardware. Também temos uma equipe em Shenzhen e montamos um centro de P&D em Xangai, com muitos colegas trabalhando lá.