notizia

Lo studente di dottorato di Yale dopo il 2000 è tornato in Cina per avviare un'impresa e ha sviluppato un robot umanoide in grado di lavare i vestiti e preparare hamburger

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Testo |.WangQin

Redattore|Qiu Xiaofen, Su Jianxun

Sebbene la storia dell'imprenditorialità degli studenti dell'Ivy League non sia una novità, questa volta è il turno della generazione post-2000 di avviare un'impresa. È anche uno studioso cinese che ha pubblicato nelle migliori pubblicazioni e ha vinto un dottorato di ricerca diretto a Yale - AI Modello di grandi dimensioni e intelligenza incarnata La concorrenza è così accesa che c'è già un senso di urgenza: "Sarò vecchio se non avrò un'impresa".

Yang Fengyu Fred Yang, originario di Jiangsu, nato nel 2000, si è laureato a Yale con una borsa di studio completa. È il fondatore della società di intelligenza incarnata UniX AI (UniX Technology Company). preparare hamburger e lavare i piatti. Nonostante abbia avviato un'attività in così giovane età, Yang Fengyu non ha avviato l'attività per impulso.

Prima di tutto, voleva avviare un'impresa quando era al liceo, e quando era studente universitario aveva alcuni progetti imprenditoriali "su piccola scala". In secondo luogo, ha accumulato risorse imprenditoriali. Ha accumulato contatti accademici nel campo dell’intelligenza incarnata in Cina fin da quando era studente universitario. Dopo aver avviato la sua attività, ha cercato figure senior nel settore della robotica in tutto il paese per formare una squadra .



Ora, la società UniX AI da lui fondata ha invitato Wang Hesheng, un illustre professore dell’Università Jiao Tong di Shanghai e presidente generale della conferenza di robotica IROS2025, come suo capo scienziato.

Sebbene abbia pubblicato articoli sulle migliori riviste internazionali e abbia vinto il titolo di Outstanding Undergraduate Scientist della North American Computer Society, da giovane volto tornato in Cina per avviare un'impresa, Fred Yang ha spesso incontrato ostacoli nel reclutamento di persone. Quando abbiamo creato una squadra per la prima volta e invitato alcuni esperti senior che avevano vent'anni più di noi a unirsi a noi, abbiamo dovuto visitare il cottage dal tetto di paglia tre volte e persino chiacchierare per più di otto ore alla volta.

Attualmente, il robot umanoide con ruote + due bracci sviluppato da UniX AI, come robot per servizi domestici, può identificare automaticamente i vestiti che getti in ogni angolo della casa, raccoglierli automaticamente e portarli in lavatrice per il lavaggio, e può anche darti dei vestiti dopo aver finito di mangiare. Metti via i piatti, lavi i piatti e pulisci i pavimenti.



Il robot AI di UniX può raccogliere il tofu

Per gli scenari domestici, le capacità operative delle mani dei robot sono fondamentali. La pinza a tre dita sviluppata internamente da UniX AI può contenere penne a sfera e tofu. UniX AI ha affermato che il suo primo lotto di 100 robot umanoidi sarà prodotto in serie a settembre.

Quella che segue è una conversazione tra "Intelligence Emergence" e Fred Yang, fondatore di UniX AI, una società di intelligence incarnata.

Emersione dell'intelligenza: attualmente non esiste una definizione unificata di robot umanoidi nel settore e diverse aziende hanno percorsi tecnici diversi. Alcune aziende producono robot umanoidi bipedi fin dall'inizio e alcune aziende producono robot umanoidi, come i robot su ruote della tua azienda + Forma a due bracci. Cosa ne pensi dei diversi percorsi tecnici?

Fred Yang : Questo mercato è abbastanza ampio e diverse aziende sono radicate in scenari diversi. Ognuno progetta la propria struttura meccanica e le soluzioni software e hardware complessive in base allo scenario applicativo. In questa fase non è difficile trovare uno scenario applicativo per ciascuna soluzione tecnica. Penso che non ci sia giusto o sbagliato. Tutti lo considerano dal punto di vista dei bisogni.

Smart Emergence: Perché hai scelto la configurazione ruota + bracci?

Fred Yang : Parliamo prima delle braccia. In una scena familiare, la cosa più importante è la capacità di azionare le mani. L'altezza di molte cose nello spazio domestico è progettata per le persone. Il nostro braccio umanoide bionico ha 7 gradi di libertà (che possono essere intesi come il braccio ha 7 articolazioni) e può eseguire molte operazioni simili a quelle umane.

Per quanto riguarda il tipo di ruota, considerando la precisione e la sicurezza del movimento, scegliamo prima il tipo di ruota per entrare nella scena domestica. Tutti continuano a progettare in modo inverso le proprie soluzioni hardware in base a diversi scenari di utilizzo.



Funzionalità operative del robot AI UniX


Emergenza dell'intelligenza: stai attualmente lavorando su hardware e software contemporaneamente?

Fred Yang : La nostra logica di base si basa sullo scenario. Hardware e software sono ugualmente importanti per noi.

Emergenza dell'intelligenza: in generale, le aziende impegnate nell'intelligenza incarnata si concentreranno sul cervello, sul cervelletto e sul corpo hardware.

Fred Yang: Facciamo sia software che hardware, ma se ci concentriamo sul cervello, sul cervelletto e sull'hardware, ci concentriamo maggiormente sui livelli dell'hardware e del cervelletto.

L'hardware è la base dell'algoritmo. Software e hardware sono altamente accoppiati e l'hardware deve seguire la scena. Ad esempio, nella scena domestica, la nostra pinza a tre dita autoprogettata ha due modalità (modalità a tre dita e modalità a due dita). Le tre dita possono essere ruotate in due dita, che possono essere utilizzate per tenere piccole penne a sfera o anche il tofu aspetta.

Inoltre, in questa fase è anche importante gettare solide basi nel cervelletto. Per quanto riguarda la questione della "generalizzabilità" che preoccupa tutti, il processo di generalizzazione può essere suddiviso in tre fasi: da scenari limitati di un singolo compito, a scenari aperti di un singolo compito, a scenari aperti di compiti aperti.

(Nota: ad esempio, dall'essere in grado di svolgere una singola attività come il bucato in un determinato ambiente domestico, all'essere in grado di fare il bucato in ambienti domestici con ambienti spaziali diversi, all'essere in grado di fare il bucato, cucinare e dare lezioni ai bambini in diversi ambienti spaziali e altri compiti)

Ora tutti nel settore stanno ancora lavorando duramente dalla prima fase alla seconda fase. Questa fase mette alla prova principalmente l'abilità del cervelletto. Se in un secondo momento realizziamo scenari aperti (la terza fase), stiamo essenzialmente pianificando (pianificazione delle attività) a livello cerebrale, ma ora il primo compito è gettare solide basi a livello del cervelletto e risolvere prima il livello operativo.



Il robot umanoide UniX AI afferra i vestiti

Emergenza dell'intelligenza: Uno dei risultati della tua ricerca è UniTouch, un grande modello tattile multimodale. Cos'è la tattilità visiva e cos'è un modello tattile di grandi dimensioni? Che significato ha l’ottica visiva nel progresso della tecnologia dei robot umanoidi?

Fred Yang : Il tocco è molto importante nel sistema operativo del robot e anche nel sistema operativo umano. Dal punto di vista umano, il tatto è la modalità di percezione più istintiva e il feedback si ottiene attraverso l'interazione reale con il mondo fisico. Per fare un piccolo esempio, per cercare le chiavi in ​​una borsa, in generale, le persone non si affidano alla vista, ma si affidano principalmente al tatto.

Dal punto di vista di un robot, a causa delle limitazioni nella struttura meccanica e nella selezione dei sensori, fare affidamento solo sulla visione spesso non è sufficiente. Ad esempio, lascia che il robot afferri il tappo della bottiglia. Il tappo della bottiglia è molto piccolo Quando il braccio del robot lo afferra, è già bloccato dal braccio del robot stesso.

Al momento possiamo fare affidamento solo sul feedback tattile per completare l'acquisizione e la verifica finale. Questa situazione è particolarmente evidente nel funzionamento di oggetti deformabili. Quando si contatta un oggetto deformabile, la forma dell'oggetto cambia e le informazioni che la vista può fornire sono molto limitate. Deve fare affidamento su informazioni tattili molto locali, ma altamente sensibili per percepire e completare le attività.

Allo stesso tempo, il tatto fornisce altre informazioni che la vista non può fornire, come la forza. La visione può fornire al robot la posizione di presa, ma non può indicare la forza di presa. Anche i semplici sensori di forza presentano dei limiti. Ad esempio, prima di schiacciare una tazza, non si nota alcun cambiamento dal punto di vista della forza, anche se sono comparse leggere crepe sulla parete della tazza. Ma in questo momento, il sensore tattile può catturare le piccole crepe e determinare se l'operazione successiva le schiaccerà.

Ho già pubblicato un articolo e realizzato il primo modello tattile multimodale su larga scala al mondo, integrando informazioni tattili con informazioni visive e altre informazioni modali linguistiche. Ogni modalità ha i suoi limiti e anche la visione ha i suoi limiti, ma con l'aggiunta di informazioni tattili, ciascuna modalità può completarsi a vicenda.

Attualmente molti concorrenti si stanno dedicando anche al settore tattile, ma si concentrano ancora sul livello hardware, come i sensori tattili. Tuttavia, se UniX AI deve essere orientato agli utenti domestici, l’hardware deve avere una durata di 3-5 anni. In questa fase, molti sensori tattili ad alta precisione non sono ancora stati in grado di soddisfare le esigenze commerciali in termini di durata.



Il robot UniX AI apre la lavatrice

Emerge l'intelligenza: il vostro primo lotto di 100 robot umanoidi sarà prodotto in serie a partire da settembre. Questo numero è relativamente elevato per i produttori di robot umanoidi. Come fa l'intelligenza artificiale Unix? Come viene gestita la catena di fornitura?

Fred Yang : La produzione di massa si concentra principalmente sulla catena di fornitura. Disponiamo di alcuni esperti della catena di fornitura di Mercedes-Benz e Haier, che hanno esperienza nella produzione della catena di fornitura e nel controllo dei costi. Esiste anche un gruppo di membri della catena di fornitura con esperienza nella produzione di massa nel campo della robotica tradizionale, dell'elettronica di consumo, dell'industria automobilistica e dell'industria aerospaziale.

Emergenza dell'intelligence: come si costruisce una squadra?

Fred Yang : Il campo della robotica non può essere risolto con un solo stack tecnologico, ma richiede la cooperazione complessiva di hardware e software, nonché team con background diversificati. L’intero settore dell’intelligenza incarnata è molto nuovo e il nostro team di algoritmi è molto giovane. Si tratta fondamentalmente di dottorandi e dottorandi che lavorano nel campo della robotica o dell’intelligenza artificiale in patria e all’estero.

In termini di hardware, al momento ci stiamo concentrando sugli scenari domestici e la sicurezza è sicuramente il fattore più importante. Il nostro team è composto da robot di servizio domestico che eseguono compiti di evitamento degli ostacoli in ambienti complessi in case diverse, come cavi tortuosi, ostacoli sospesi, ecc. Per l’hardware relativo all’intelligenza incarnata, comprese le braccia e le gambe dei robot umanoidi, disponiamo anche di scienziati altamente capaci come responsabili dello sviluppo dell’hardware.

Smart Emergence: sei molto giovane e sei nato dopo il 2000. Un team così numeroso richiede forti capacità operative. Come recluti le persone?

Fred Yang : All'inizio è stato davvero difficile reclutare persone. La mia laurea è presso l'Università del Michigan e il mio dottorato di ricerca è a Yale. Sono ben noto nel circolo dell'intelligence incarnata all'estero, quindi ho trovato rapidamente alcuni amici all'estero che stanno sviluppando algoritmi, ma il robot deve combinare software e hardware. Quando torno in Cina, le persone non ci conoscono e ho anche incontrato molti muri. Prima che ogni membro importante si unisse, ho avuto una lunga chiacchierata con loro. Per i talenti, bisogna avere lo spirito di "visitare il cottage dal tetto di paglia tre volte".

Emersione dell'intelligenza: non è facile implementare i robot umanoidi. Al momento, la maggior parte di essi è ancora nella fase di vendita a istituti di ricerca scientifica. In realtà è piuttosto difficile espanderne la scala un passo ed è di livello consumer, 100 unità saranno prodotte in serie quest'anno.

Fred Yang : La produzione di massa di robot umanoidi su ruote non è così difficile come quella dei robot umanoidi bipedi. Ora in realtà ognuno ha opinioni diverse sulla definizione di robot umanoide. Per quanto riguarda i robot umanoidi bipedi, penso che ci sia ancora molta strada da fare. Non sono ancora del tutto pronti per essere lanciati sul mercato perché ci sono alcuni problemi di sicurezza che non sono ancora stati risolti. Ma la cosa più importante a casa è la capacità di azionare le mani, quindi la prima generazione di robot che abbiamo lanciato era un robot con ruote e due bracci. Il robot con ruote è una tecnologia relativamente matura.

La velocità di iterazione del prodotto è importante. È difficile realizzare un prodotto di alta qualità nella prima generazione. Per prima cosa produciamo rapidamente una versione di un robot relativamente stabile, affidabile ed economicamente vantaggioso, la lanciamo sul mercato su larga scala e quindi iteriamo rapidamente. Abbiamo sempre detto internamente che tre generazioni producono prodotti di alta qualità.

Le nostre prime 100 unità sono principalmente utilizzatori di sementi disposti a essere "i primi a mangiare i granchi".



Il robot UniX AI pulisce i tavoli

Smart Emergence: hai già clienti TO C? Ci sono stati contatti precoci?

Fred Yang : All'inizio i singoli utenti erano principalmente alcuni amici intorno a noi, alcuni amici del settore tecnologico e appassionati di tecnologia che erano molto interessati a prodotti all'avanguardia, proprio come il gruppo target che era disposto ad acquistare Tesla al momento del lancio Una classe a cui piace sperimentare con la tecnologia. Faremo anche alcune interviste di focus group per comprendere le esigenze specifiche del gruppo target.

Emersione dell'intelligenza: rispetto ai robot negli scenari verticali (come servizi commerciali, logistica di magazzino, ispezioni di sicurezza, ecc.), i robot umanoidi universali negli scenari domestici sono molto più difficili da implementare e richiedono capacità di generalizzazione molto più elevate dei robot. Le tue informazioni dicono che il robot umanoide UniX AI ha funzioni come lavanderia, assistente alla mensa, pulizia, tutoraggio dei bambini con i compiti, ecc. Com'è la situazione dell'implementazione?

Fred Yang : L'obiettivo finale dei robot umanoidi è, ovviamente, sperare che i robot possano fare tutto, ma devono mangiare il cibo un boccone alla volta e fare le cose una per una. Anche nella scena familiare si realizza passo dopo passo, dalla scena limitata di un unico compito, alla scena aperta di un unico compito, e infine alla scena aperta di compiti aperti.

I nostri prodotti attualmente hanno diversi scenari maturi, come lavare i vestiti, aiutare a raccogliere i piatti e lavare i piatti dopo i pasti, funzioni di pulizia 3D, ecc. Prendiamo ad esempio la funzione lavanderia. Puoi gettare i vestiti in vari posti. Il primo passo del robot Wanda sarà trovare oggetti e costruire una mappa tridimensionale in modo indipendente. Il secondo passo sarà prendere i vestiti Le pinze sviluppate internamente sono versatili per la presa di oggetti flessibili. Il terzo passo è utilizzare una lavatrice.

Non è difficile utilizzare le lavatrici in modo generalizzato (i robot possono azionare diversi tipi di lavatrici. Possiamo chiamare diversi piccoli modelli per completare questo compito).

Emergenza dell'intelligence: perché scegliere di tornare in Cina per avviare un'impresa? Hai mai pensato di avviare un’attività negli Stati Uniti?

Fred Yang: Non mi definisco come il ritorno in Cina per avviare un'impresa o l'avvio di un'attività negli Stati Uniti. Abbiamo team negli Stati Uniti e in Cina, ma sfruttiamo semplicemente i diversi vantaggi legati alla posizione. Gli Stati Uniti hanno un team di algoritmi di prim’ordine e la Cina ha partner in termini di struttura e hardware. Abbiamo anche un team a Shenzhen e abbiamo creato un centro di ricerca e sviluppo a Shanghai, con molti colleghi che lavorano lì.