Новости

Китайский аспирант Йельского университета после 2000 года взял перерыв в школе, чтобы начать бизнес, и разработал робота-гуманоида, который может стирать одежду и готовить гамбургеры.

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Текст | Ван Цинь

Монтажер|Цю Сяофэнь, Су Цзяньсюнь

Хотя в истории студентов Лиги Плюща, бросивших школу, чтобы начать бизнес, нет ничего нового, на этот раз настала очередь поколения после 2000 года бросить школу, чтобы начать бизнес. Он также китайский академический тиран, публиковавшийся в топе. публикации и конференции, и отправился прямиком в Йельский университет — конкурс больших моделей искусственного интеллекта и воплощенного интеллекта стал настолько популярным, что уже появилось ощущение срочности: «Я состарюсь, если не начну бизнес».

Ян Фэнью Фред Ян, уроженец провинции Цзянсу, 2000 года рождения, окончил Йельский университет с полной стипендией. Он является основателем воплощенной разведывательной компании UniX AI (UniX Technology Company). готовить гамбургеры и мыть посуду.


Фред Янг, основатель компании UniX AI, занимающейся роботами-гуманоидами.

Хотя он начал свой собственный бизнес в столь юном возрасте, решение Ян Фэнъюя бросить школу и начать бизнес не было спонтанным. Прежде всего, он хотел начать бизнес, когда учился в старшей школе, и, когда он был студентом, у него было несколько «небольших» предпринимательских проектов. Во-вторых, он заявил, что количества опубликованных им статей достаточно, чтобы получить степень доктора философии, и сделать перерыв не было рискованным решением. Более того, он накапливал предпринимательские ресурсы. Он накапливал академические контакты в области воплощенного интеллекта в Китае, еще будучи студентом. После начала своего бизнеса он искал высокопоставленных людей в индустрии робототехники по всей стране, чтобы сформировать команду. .

Теперь основанная им компания UniX AI пригласила Вана Хешэна, выдающегося профессора Шанхайского университета Цзяо Тонг и генерального председателя ведущей конференции по робототехнике IROS2025, в качестве своего главного ученого.

Хотя он публиковал статьи в ведущих международных журналах и получил звание выдающегося ученого-студента от Североамериканского компьютерного общества, будучи молодым человеком, который впервые вернулся в Китай, чтобы начать бизнес, Фред Ян часто сталкивался с препятствиями при наборе людей. Когда мы впервые сформировали команду и пригласили присоединиться к ней некоторых старших экспертов, которые были на двадцать лет старше нас, нам пришлось три раза посетить коттедж с соломенной крышей и даже болтать более восьми часов за раз.

В настоящее время колесный + двухрукий робот-гуманоид, разработанный UniX AI, в качестве робота для домашнего обслуживания может автоматически идентифицировать одежду, которую вы разбрасываете в каждом углу дома, автоматически подбирать ее и относить в стиральную машину для стирки. а также может дать вам одежду после того, как вы закончите есть, уберете посуду, помоете посуду и почистите полы.


Робот UniX AI может собирать тофу

Для домашних сценариев оперативные возможности рук робота имеют решающее значение. Трехпальцевый захват, разработанный UniX AI, позволяет удерживать шариковые ручки и тофу. UniX AI заявила, что ее первая партия из 100 роботов-гуманоидов будет запущена в серийное производство в сентябре.

Ниже приводится разговор между «Intelligence Emergence» и Фредом Янгом, основателем UniX AI, воплощенной разведывательной компании.

Появление интеллекта: в настоящее время в отрасли не существует единого определения роботов-гуманоидов, и разные компании используют разные технические пути. Некоторые компании с самого начала производят двуногих роботов-гуманоидов, а некоторые компании производят роботов-гуманоидов, например, колесных роботов вашей компании. Двуручная форма. Что вы думаете о различных технических путях?

Фред Янг : Этот рынок достаточно велик, и разные компании ориентированы на разные сценарии. Каждый проектирует свою собственную механическую конструкцию и общие программные и аппаратные решения в зависимости от сценария применения. На этом этапе нетрудно найти сценарий применения каждого технического решения. Я думаю, что нет правильного или неправильного. Каждый рассматривает это с точки зрения потребностей.

Smart Emergence: Почему вы выбрали конфигурацию «руль + рычаги»?

Фред Янг : Давайте сначала поговорим об руках. В семейной сцене самое важное — это умение управлять руками. Высота многих вещей в домашнем пространстве рассчитана на людей. Наша бионическая гуманоидная рука имеет 7 степеней свободы (что можно понять, поскольку рука имеет 7 суставов) и может выполнять множество операций, подобных человеческим.

Что касается типа колеса, учитывая точность и безопасность движения, мы сначала выбираем тип колеса для выхода на домашнюю сцену. Все до сих пор перепроектируют свои собственные аппаратные решения, исходя из различных сценариев использования.


Возможности работы робота UniX AI


Появление интеллекта: Вы сейчас работаете над аппаратным и программным обеспечением одновременно?

Фред Янг : Наша основная логика основана на сценарии. Аппаратное и программное обеспечение одинаково важны для нас.

Появление интеллекта. Как правило, компании, занимающиеся воплощением интеллекта, уделяют особое внимание мозгу, мозжечку и аппаратному обеспечению тела. Есть ли у вас собственный фокус?

Фред Янг: Мы занимаемся как программным, так и аппаратным обеспечением, но если мы сосредоточимся на мозге, мозжечке и аппаратном обеспечении, мы больше уделяем внимание аппаратному и мозжечковому уровням.

Аппаратное обеспечение является основой алгоритма. Программное и аппаратное обеспечение тесно связаны, и аппаратное обеспечение должно следовать за ситуацией. Например, в домашней сцене наш трехпальцевый захват собственной разработки имеет два режима (режим трех пальцев и режим двух пальцев). Три пальца можно превратить в два пальца, которые можно использовать для удержания небольших шариковых ручек. или даже тофу, подожди.

Кроме того, на этом этапе также важно заложить прочный фундамент мозжечка. Что касается вопроса «обобщаемости», который волнует всех, то процесс генерализации можно разделить на три этапа: от ограниченных сценариев одной задачи, к открытым сценариям одиночной задачи, к открытым сценариям открытых задач.

(Примечание: например, от способности выполнять одну задачу, например, стирку, в определенной домашней обстановке, до возможности стирать в домашней обстановке с различным пространственным окружением, до способности стирать, готовить и обучать детей различные пространственные среды и другие задачи)

Сейчас все в отрасли все еще усердно работают от первого этапа до второго. Этот этап в основном проверяет способности мозжечка. Если мы делаем открытые сценарии позже (третий этап), то мы, по сути, планируем (планируем задачи) на уровне мозга, но сейчас первая задача — заложить прочный фундамент на уровне мозжечка и решить сначала операционный уровень.


Гуманоидный робот UniX AI хватает одежду

Появление интеллекта: Одним из результатов вашего исследования является UniTouch, большая мультимодальная тактильная модель. Что такое визуальная тактильность и что такое большая тактильная модель? Какое значение визуальная тактильность имеет для развития технологий гуманоидных роботов?

Фред Янг : Сенсорное управление очень важно в операционной системе робота и даже в операционной системе человека. С человеческой точки зрения прикосновение — это наиболее инстинктивный способ восприятия, а обратная связь достигается посредством реального взаимодействия с физическим миром. Приведу небольшой пример: в поисках ключей в сумке люди, вообще говоря, не полагаются на зрение, а в основном полагаются на осязание.

С точки зрения робота, из-за ограничений механической конструкции и выбора датчиков, полагаться только на зрение зачастую недостаточно. Например, позвольте роботу схватить крышку от бутылки. Крышка от бутылки очень маленькая. Когда рука робота захватывает ее, она уже заблокирована самой рукой робота.

В настоящее время мы можем полагаться только на тактильную обратную связь для завершения окончательного захвата и проверки. Эта ситуация особенно заметна при эксплуатации деформируемых объектов. При контакте с деформируемым объектом форма объекта меняется, и информация, которую может предоставить зрительный априор, очень ограничена. Для восприятия и выполнения задач он должен полагаться на очень локальную, но высокочувствительную тактильную информацию.

В то же время прикосновение предоставляет другую информацию, которую не может предоставить зрение, например, силу. Система Vision может указать роботу положение захвата, но не может определить силу захвата. Простые датчики силы также имеют ограничения. Например, перед раздавливанием чашки не видно никаких изменений с точки зрения силы, даже если на стенках чашки появились небольшие трещины. Но в это время тактильный датчик может уловить крошечные трещины и определить, раздавит ли их следующая операция.

Ранее я опубликовал статью и создал первую в мире крупномасштабную тактильную мультимодальную модель, объединяющую тактильную информацию с визуальной информацией и другой языковой модальной информацией. У каждой модальности есть свои ограничения, и у зрения тоже есть свои ограничения, но с добавлением тактильной информации каждая модальность может дополнять друг друга.

В настоящее время многие конкуренты также используют тактильные технологии, но они по-прежнему уделяют особое внимание аппаратному уровню, например тактильным датчикам. Однако, если UniX AI будет ориентирован на домашних пользователей, срок службы оборудования должен составлять 3-5 лет. На данном этапе многие высокоточные тактильные датчики еще не способны удовлетворить коммерческие потребности с точки зрения срока службы.


Робот UniX AI открывает стиральную машину

Появляется информация: ваша первая партия из 100 роботов-гуманоидов будет запущена в массовое производство, начиная с сентября. Это число относительно велико для производителей роботов-гуманоидов. Как Unix AI делает это? Как управляется цепочка поставок?

Фред Янг : Массовое производство в основном ориентировано на цепочку поставок. У нас есть эксперты по цепочке поставок из Mercedes-Benz и Haier, которые имеют опыт в производстве цепочек поставок и контроле затрат. Существует также группа участников цепочки поставок с опытом массового производства в области традиционной робототехники, бытовой электроники, автомобильной и аэрокосмической промышленности.

Intelligence Emergence: Как построить команду?

Фред Янг : Область робототехники не может быть решена с помощью одного технологического стека. Она требует общего взаимодействия аппаратного и программного обеспечения, а также разнообразного опыта команды. Вся индустрия воплощенного интеллекта очень молода, и наша команда по алгоритмам очень молода. В основном это доктора наук и постдоки, работающие в области робототехники или искусственного интеллекта в стране и за рубежом.

Что касается аппаратного обеспечения, в настоящее время мы концентрируемся на домашних сценариях, и безопасность, безусловно, является наиболее важным фактором. В нашей команде есть роботы, обслуживающие дом, которые выполняют задачи по предотвращению препятствий в сложных условиях в разных домах, таких как намотки проводов, подвешенные препятствия и т. д. Что касается оборудования, связанного с воплощенным интеллектом, включая руки и ноги роботов-гуманоидов, у нас также есть высококвалифицированные ученые, отвечающие за разработку оборудования.

Smart Emergence: Вы очень молоды и родились после 2000 года. Такая большая команда требует сильных оперативных навыков. Как вы набираете людей?

Фред Янг : Поначалу было действительно сложно набирать людей. Я получил степень бакалавра в Мичиганском университете, а докторскую степень — в Йельском университете. Я хорошо известен в кругах воплощенного интеллекта за границей, поэтому я быстро нашел друзей за границей, которые занимаются алгоритмами, но роботу нужно комбинировать программное обеспечение. и оборудование. Когда я возвращаюсь в Китай, люди с нами не знакомы, я также натыкаюсь на множество стен. Прежде чем к нам присоединились все важные члены, я очень долго с ними беседовал. Для талантов нужно иметь дух «трижды посетить коттедж с соломенной крышей».

Появление интеллекта: внедрить роботов-гуманоидов непросто. В настоящее время большинство из них все еще находятся на стадии продажи научно-исследовательским институтам. На самом деле довольно сложно расширить масштабы. Вы сказали, что это можно сделать. один шаг, и в этом году будет произведено 100 единиц потребительского класса. Как вы это сделали?

Фред Янг : Массовое производство колесных роботов-гуманоидов не так сложно, как двуногих роботов-гуманоидов. На самом деле у всех разные мнения относительно определения человекоподобных роботов. Я думаю, что в отношении двуногих роботов-гуманоидов еще есть куда двигаться. Они еще не полностью готовы к выпуску на рынок, поскольку существуют некоторые проблемы безопасности, которые еще не решены. Но самое главное в домашних условиях — это умение управлять руками, поэтому первое поколение роботов, которые мы выпустили, было колесный + двурукий робот. Колесный робот — это относительно зрелая технология.

Скорость итерации продукта важна. Сложно сделать качественный продукт в первом поколении. Мы сначала быстро производим версию относительно стабильного, надежного и экономически эффективного робота, выводим его на рынок в больших масштабах, а затем быстро повторяем. Внутри компании мы всегда говорили, что три поколения производят качественную продукцию.

Наши первоначальные 100 единиц — это в основном потребители семян, которые готовы «первыми съесть крабов».


Робот UniX AI убирает столы

Smart Emergence: У вас уже есть клиенты TO C? Были ли первые контакты?

Фред Янг : Вначале отдельными пользователями были в основном наши друзья, друзья из технологической отрасли и энтузиасты технологий, которые были очень заинтересованы в передовых продуктах. Аналогично целевой группе, которая была готова купить Tesla, когда она была впервые запущена. . Класс, который любит экспериментировать с технологиями. Мы также проведем несколько интервью в фокус-группах, чтобы понять конкретные потребности целевой группы.

Появление интеллекта: по сравнению с роботами в вертикальных сценариях (таких как коммерческие услуги, складская логистика, проверки безопасности и т. д.), универсальных гуманоидных роботов в домашних сценариях гораздо сложнее реализовать и они требуют от роботов гораздо более высоких возможностей обобщения. В вашей информации говорится, что робот-гуманоид UniX AI имеет такие функции, как стирка, помощник в столовой, уборка, обучение детей домашним заданиям и т. д. Как обстоят дела с реализацией?

Фред Янг : Конечная цель роботов-гуманоидов — это, конечно, надеяться, что роботы могут все, но им приходится есть пищу по кусочкам и делать что-то одно за другим. В семейной сцене это также реализуется шаг за шагом, от ограниченной сцены с одним заданием к открытой сцене с одним заданием и, наконец, к открытой сцене с открытыми задачами.

В настоящее время наши продукты имеют несколько готовых сценариев, таких как стирка одежды, помощь в сборе посуды и мытье посуды после еды, функции 3D-уборки и т. д. Возьмем в качестве примера функцию стирки. Вы можете бросать одежду в разные места. Первым шагом робота Ванды будет поиск предметов и самостоятельное построение трехмерной карты. Вторым шагом будет захват одежды с помощью UniX AI. Захваты собственной разработки универсальны для захвата гибких предметов. Третий шаг — использование стиральной машины.

Использовать стиральные машины в обобщенном виде несложно (роботы могут управлять разными типами стиральных машин). Для выполнения этой задачи можно вызвать разные небольшие модели.

Появление интеллекта: почему вы решили вернуться в Китай, чтобы начать бизнес? Вы когда-нибудь задумывались о том, чтобы начать бизнес в США?

Фред Янг: Я не считаю себя человеком, возвращающимся в Китай, чтобы начать бизнес, или начинающим бизнес в Соединенных Штатах. У нас есть команды в США и Китае, но мы просто пользуемся различными преимуществами местоположения. В США есть лучшая команда по разработке алгоритмов, а в Китае есть партнеры по структуре и оборудованию. У нас также есть команда в Шэньчжэне, и мы создали центр исследований и разработок в Шанхае, где работает много коллег.