после того, как google потратил 7 лет на проект по высадке на луну и потерпел неудачу, генеральный директор alphabet: должны ли машины быть похожими на людей?

2024-09-16

ханс петер брондмо, бывший генеральный директор alphabet. в 2016 году он присоединился к google и отвечал за разработку роботов. в то время самыми популярными вещами были социальные сети и мобильный интернет. воплощенный интеллект был подобен воздушному замку: все жаждали его, но он был слишком далеко.

даже у самого брондмо задача, когда он присоединился, не была большим проектом, а потому, что google приобрела одну за другой 9 компаний по робототехнике, и ему нужно было организовать персонал и технологии этих компаний.

эти инженеры-роботы в конечном итоге были интегрированы в лабораторию google x, известную как «фабрика посадки на луну».

«фабрика посадки на луну» уже семь лет активно занимается робототехникой. позже, с появлением больших языковых моделей, будущее воплощенного интеллекта никогда не было таким блестящим. однако google решила закрыть проект everyday robots. , которая возлагала большие надежды на эту лабораторию.

недавно брондмо написал длинную статью для журнала wired, в которой рассказывает о своем пути в google и задает вопрос, над которым он долго думал: должны ли машины быть похожими на «людей»?

ниже приводится файл readme брондмо, составленный и сокращенный.

роботы сложны, сложны «приземлиться на луну»

google

X 被故意设在距离办公区域几英里外的独立建筑中，以培养自己的文化，让人们能够跳出传统思维模式进行思考。

мы прилагаем много усилий, чтобы побудить наших участников идти на риск, быстро экспериментировать и даже «праздновать неудачу», потому чтонеудача означает лишь то, что цели, которые мы ставим, чрезвычайно высоки.

когда я присоединился, в лаборатории уже разрабатывались waymo, google glass и другие проекты, которые звучали как научная фантастика, например, летающие ветряные мельницы и воздушные шары, которые достигнут стратосферы и принесут интернет в недостаточно обслуживаемые районы.

что отличает project x от других стартапов кремниевой долины, так это то, что участников x поощряют мыслить масштабно и долгосрочно. фактически, чтобы проект можно было считать удачным, у x есть набор «формул» для его оценки.

во-первых, проект должен продемонстрировать, что проблема, которую он решает, затрагивает сотни миллионов или даже миллиарды людей. во-вторых, должна существовать прорывная технология, которая предоставит нам новые способы решения проблем. наконец, должно быть радикальное решение для бизнеса или продукта, которое может показаться на грани безумия, но не является полностью невыполнимым.

дайте ии «тело»

трудно представить кого-либо, более подходящего для управления x, чем астро теллер, чей титул буквально был «капитан лунного выстрела». внутри здания google x — переоборудованного трехэтажного универмага — вы всегда можете найти астро на своих фирменных роликовых коньках.

добавьте к его хвосту дружелюбную улыбку и, конечно же, имя «астро», и вы почувствуете, что попали в сериал hbo «силиконовая долина».

когда мы с астро впервые сели, чтобы обсудить, что нам следует делать с приобретенной google робототехнической компанией, мы согласились, что нам следует принять меры, но что?

до сих пор большинство полезных роботов были большими, неразумными и опасными, их размещали на фабриках и складах и требовали тщательного наблюдения или запирания, чтобы защитить людей от вреда.как мы можем создать роботов, которые будут одновременно полезны и безопасны в повседневной жизни?это требует нового подхода.

другими словами, мы даем ии тело в физическом мире, и если и есть место, где можно реализовать проект такого масштаба, то я уверен, что это x.

это займет много времени, много терпения, опробование сумасшедших идей и множество неудачных попыток.потребуются крупные прорывы в области искусственного интеллекта и робототехники, которые, вероятно, будут стоить миллиарды долларов (да, миллиарды).

конвергенция искусственного интеллекта и робототехники неизбежна, и мы чувствуем, что многие вещи, которые до сих пор существовали только в научной фантастике, вот-вот станут реальностью.

это действительно тяжело

примерно каждую неделю я разговариваю с мамой по телефону, и она всегда начинает с одного и того же вопроса: «когда придут роботы?»

она даже не здоровается, просто хочет знать, когда наш робот придет ей на помощь. я отвечал: «мама, это займет некоторое время», а она говорила: «им лучше поторопиться!»

ганс петер брондмо

моя мать живет в осло, норвегия, где отличное государственное здравоохранение; работники, осуществляющие уход, приходят к ней домой три раза в день, чтобы помочь ей с различными делами и домашними делами, в основном связанными с ее запущенной болезнью паркинсона.

хотя эти воспитатели позволяли ей жить одной в собственном доме, моя мать хотела, чтобы робот помогал ей с мелочами, с которыми теперь было слишком неловко справиться, или просто давал руку, на которую можно было бы время от времени опереться.

«вы ведь знаете, что робототехника — это системная проблема?» — спросил меня джефф с вопросительным взглядом. джефф бингхэм — худощавый, серьезный парень с докторской степенью в области биоинженерии. он вырос на ферме и был известен тем, что знал почти все.

важный момент, который пытается подчеркнуть джефф:робот — очень сложная система, и его общая производительность зависит от его самого слабого звена.。

например, если подсистема, отвечающая за зрение, испытывает трудности с распознаванием объектов перед собой под прямыми солнечными лучами, робот может внезапно «ослепнуть» и перестать работать, когда в окно светит солнечный свет.

или, если навигационная система не распознает лестницу, робот может упасть с лестницы, поранив себя и, возможно, невинных прохожих. таким образом, создать робота, который сможет жить и работать вместе с нами, сложно. действительно, очень сложно.

на протяжении десятилетий люди пытались запрограммировать различные формы роботов для выполнения даже простых задач, таких как взятие чашки со стола или открытие двери, но эти программы всегда оказывались чрезвычайно уязвимыми к малейшим изменениям в окружающей среде. потерпит неудачу.

как только вы начнете обо всем этом думать, вы поймете, что если вы не зафиксируете все так, чтобы все было в фиксированном, заданном положении, а свет был правильным и никогда не менялся, то это просто вопрос: взять зеленое яблоко, положить в стеклянную чашу на кухонном столе становится почти невозможной головоломкой — именно поэтому роботы на фабриках заперты, и все, от освещения до размещения предметов, над которыми они работают, можно решить. как и ожидалось, им это не нужно. беспокоиться о столкновении с людьми.

реальному миру не хватает предсказуемости, как этому солнечному лучу.и мы даже не коснулись действительно сложных частей, таких как перемещение по захламленным пространствам, в которых мы живем и работаем.

как понять обучающихся роботов

но, судя по всему, вам нужно всего 17 экспертов по машинному обучению.

по крайней мере, так сказал мне ларри пейдж — одно из его классических, трудно понимаемых открытий.

я пытаюсь доказать, что мы не можем создать инфраструктуру аппаратного и программного обеспечения, используя всего лишь небольшую группу исследователей машинного обучения.

он неодобрительно махнул рукой и сказал: «вам нужно всего 17».

я в замешательстве. почему не 11? или 23? должно быть, я что-то пропустил.

в конечном счете, есть два основных способа применения ии в робототехнике. первый — гибридный подход, при котором различные части системы управляются ии, а затем объединяются посредством программирования.

при таком подходе подсистема зрения может использовать ии для идентификации и классификации мира, который она видит. создав список видимых объектов, робот получает этот список и использует методы кода для действий с ним.

например, если написана программа для взятия яблока со стола, система машинного зрения, управляемая искусственным интеллектом, обнаружит яблоко, и программа выберет из списка «тип: apple», а затем с помощью управляющего программного обеспечения задаст вопрос. робот, чтобы дотянуться до него.

другой подход — сквозное обучение (e2e), при котором делается попытка изучить всю задачу. такие вещи, как «взять предмет» или даже более комплексные усилия, такие как «наведение порядка на столе». процесс обучения достигается за счет предоставления роботу большого количества обучающих данных – так же, как люди учатся выполнять физическую задачу.

если вы попросите маленького ребенка взять чашку, возможно, ему придется узнать, что такое чашка и что в ней может быть жидкость. играя с чашкой, он неоднократно опрокидывал ее, проливая при этом много молока. но с помощью моделирования, подражания другим и большого количества игровой практики они всегда могут научиться делать это, даже не задумываясь о шагах.

постепенно я понял,если мы в конечном итоге не докажем, что роботы могут научиться выполнять задачи непрерывно, все остальное не будет иметь значения.только тогда у нас появится реальный шанс на то, что роботы будут надежно выполнять эти задачи в хаотичном и непредсказуемом реальном мире, что позволит нам действительно стать звездой.

речь идет не о числе «17», а обольшие прорывы требуют небольших команд, а не армия инженеров. очевидно, что робот — это нечто большее, чем его ии-мозг, нам все еще необходимо спроектировать и построить физического робота.

однако ясно, что успешная сквозная миссия заставит нас поверить (на языке программы высадки на луну), что мы можем избежать земного притяжения.

однорукий робот

питер пастор — немецкий робототехник, получивший докторскую степень в области робототехники в университете южной калифорнии. в те редкие моменты, когда ему не нужно работать, питер пытается догнать свою девушку и заняться кайтсерфингом. в лаборатории он проводил большую часть своего времени, управляя 14 запатентованными роботизированными руками, которые позже были заменены семью промышленными роботизированными руками kuka. мы называем эту конфигурацию «механической фермой рук».

эти роботизированные руки работают круглосуточно, постоянно пытаясь достать из коробки предметы, такие как губки, кубики lego, маленькие желтые уточки или пластиковые бананы. первоначально их запрограммировали перемещать захват в виде когтя в коробку из произвольного положения над ним, закрывать захват, подтягивать вверх и смотреть, поймают ли они что-нибудь. над коробкой находится камера, которая фиксирует объекты внутри коробки, движения роботизированной руки и успешность ее выполнения.

это обучение продолжалось несколько месяцев. вначале вероятность успеха робота составляла всего 7%. но каждый раз, когда робот добивается успеха, он получает положительное подкрепление. для роботов это по сути означает, что так называемые «веса» в нейронной сети корректируются на основе различных результатов, чтобы положительно подкрепить желаемое поведение и отрицательно подкрепить нежелательное поведение. в конце концов, руки научились успешно захватывать предметы более чем в 70 процентах случаев.

однажды питер показал мне видео, на котором роботизированная рука не только точно хватает желтый кубик lego, но и отталкивает другие предметы, чтобы получить более четкий угол захвата.

я знал, что это стало настоящим поворотным моментом: роботизированная рука не была явно запрограммирована на выполнение этого действия с использованием традиционной эвристики.это приобретается через обучение。

но даже так – семи роботам понадобилось несколько месяцев, чтобы научиться ловить маленькую желтую уточку? это далеко не достаточно. даже сотен роботов и нескольких лет практики недостаточно, чтобы научить их выполнять первые полезные, реальные задачи. поэтому мы создали облачный симулятор и создали более 240 миллионов экземпляров виртуальных роботов в 2021 году.

думайте об этом симуляторе как о гигантской видеоигре с достаточно реалистичной физической моделью, позволяющей имитировать вес объектов или трение поверхности.

тысячи виртуальных роботов используют каналы своих виртуальных камер и виртуальные тела (смоделированные по образцу реальных роботов) для выполнения задач, таких как взятие чашки со стола.

они будут работать одновременно, миллионы раз пытаясь и терпя неудачу, собирая данные для обучения алгоритмов ии. как только роботы достаточно хорошо работают в симуляциях, эти алгоритмы передаются физическим роботам для окончательного обучения в реальных условиях, чтобы они могли реализовать недавно изученные действия.

я всегда думаю об этом процессе моделирования как о роботе, который всю ночь спит во сне, а затем просыпается, узнав что-то новое.

дурак, проблема в данных

когда мы впервые проснулись и увидели chatgpt, это показалось волшебством. система на базе искусственного интеллекта действительно может писать полные абзацы, отвечать на сложные вопросы и формировать постоянные разговоры. но в то же время мы также понимаем его фундаментальные ограничения: чтобы добиться этого, нам нужно потреблять много данных.

роботы уже используют большие языковые модели для понимания инструкций и визуальные модели для понимания того, что они видят, благодаря чему их демонстрационные видеоролики на youtube выглядят потрясающе.

но научить роботов жить и работать автономно вместе с нами — не менее огромная проблема с данными. несмотря на то, что существуют методы моделирования и другие способы создания обучающих данных,маловероятно, что робот однажды «проснется» с высокой степенью возможностей. скорее, он будет полагаться на базовую модель, которая сможет управлять всей системой.

мы до сих пор не уверены, насколько сложные задачи мы можем научить роботов выполнять с помощью ии. я только что пришел к выводу, что, за исключением этих очень узких, четко определенных задач, чтобы заставить роботов учиться чему-либо, могут потребоваться тысячи или даже миллионы роботов, неоднократно выполняющих задачи в реальном мире и собирающих достаточно данных для сквозного обучения. конечные модели. другими словами, не ждите, что роботы в ближайшее время выйдут из-под нашего контроля и начнут делать то, на что они не запрограммированы.

должны ли они действительно быть похожими на нас?

лошади очень эффективны при ходьбе и беге на четырех ногах, но мы проектируем автомобили с колесами; человеческий мозг — чрезвычайно эффективный биологический компьютер, а компьютеры на базе чипов далеки от производительности нашего мозга. почему у автомобилей нет ног и почему компьютеры не моделируют нашу биологию?

целью создания робота не должно быть просто имитация.

я узнал об этом на днях, когда был на встрече с техническими руководителями everyday robots. мы сидели за столом переговоров и обсуждали, должны ли у нашего робота быть ноги или колеса.

такие дискуссии часто имеют тенденцию перерастать в религиозные дебаты, а не в основанные на фактах или научные дискуссии. некоторые люди очень настаивают на том, что роботы должны выглядеть как люди, и на это есть веская причина: мы проектируем нашу среду обитания и работу так, чтобы в ней могли разместиться люди, и у нас есть ноги, так что, возможно, у роботов тоже должны быть ноги.

примерно через 30 минут заговорил винсент дюро, самый старший технический менеджер в зале. «я подумал, что если я смогу куда-то добраться, то и робот сможет туда добраться», — просто сказал он, сидя в инвалидной коляске.

в комнате воцарилась тишина, и спор закончился.

на самом деле ноги робота сложны как механически, так и электронно. они движутся не очень быстро, делают робота нестабильным и не очень энергоэффективны по сравнению с колесами.

сегодня, когда я вижу компании, пытающиеся создать роботов-гуманоидов — роботов, которые стремятся имитировать человеческую форму и функции, — я часто задаюсь вопросом, не является ли это ограничением воображения.

существует так много проектов, которые могут восполнить человеческие недостатки, и зачем же настаивать на их имитации?слова винсента напоминают нам, что мы должны уделять первоочередное внимание самым трудным и наиболее значимым проблемам.в everyday robots мы стараемся сделать наших роботов максимально простыми, потому что чем раньше робот сможет выполнять реальные задачи, тем быстрее мы сможем собирать ценные данные.

каково это – быть окруженным роботами?

я сидел за своим столом, когда однорукий робот с закругленной прямоугольной головой перевернулся, позвал меня по имени и спросил, хочу ли я, чтобы он убрался. я сказал да и отошел в сторону.

через несколько минут он подобрал несколько пустых бумажных стаканчиков, прозрачную чашку ледяного чая из starbucks и пластиковую обертку от энергетического батончика kind. он сложил предметы в мусорный лоток, прикрепленный к основанию, затем повернулся ко мне, кивнул и перешел к следующему столу.

эта услуга по уборке столов представляет собой важную веху: она показывает, что мы добились значительного прогресса в решении нерешенной части головоломки робототехники. роботы начинают надежно использовать искусственный интеллект для распознавания людей и объектов!

бенджи холсон — инженер-программист и бывший кукловод, возглавляющий команду разработчиков сервиса. он всегда выступал за гибридный подход и не против сквозных задач обучения, но предпочитает подход «пусть сделают что-нибудь полезное сейчас».

я привык к тому, что роботы передвигаются и выполняют работу по дому, например, убирают мой стол. время от времени я вижу новых посетителей или инженеров, только что присоединившихся к команде, с выражением удивления и радости на лицах, наблюдающих за занятой фигурой робота.

с их точки зрения я понял, насколько все это было ново. как сказал наш руководитель отдела дизайна рис ньюман (со своим валлийским акцентом), когда однажды увидел проходящего мимо робота: «разве это не немного странно, что это стало нормой?»

все заканчивается, это только начало

в конце 2022 года дискуссии о «сквозных» и «гибридных методах» все еще активны.

питер и его команда вместе с нашими коллегами из google brain усердно работали над применением обучения с подкреплением, имитационного обучения и архитектуры transformer для решения множества задач робототехники. они добились значительного прогресса в демонстрации того, как роботы могут обучаться общим, надежным и устойчивым способом.

тем временем команда разработчиков приложений под руководством бэйнджи объединяет модели искусственного интеллекта с традиционным программированием для создания прототипов и создания роботизированных сервисов, которые можно будет развернуть в среде людей.

тем временем сотрудничество с танцовщицей кэти над мультироботизированной установкой, которая стала известна как project starling, изменило мое отношение к этим машинам.

я заметил, что людей эти роботы привлекали с чувством удивления, радости и любопытства. это позволило мне понять, как роботы, перемещающиеся среди нас, и звуки, которые они издают, могут вызывать глубокие человеческие эмоции; это станет одним из ключевых факторов, приветствуем ли мы их в нашей повседневной жизни.

другими словами, мы находимся на пороге реализации нашей самой большой ставки: роботов на базе искусственного интеллекта. ии дает им возможность понимать язык, который они слышат (разговорный и письменный), и переводить его в действия или понимать то, что они видят (изображения с камеры), и переводить это в сцены и объекты, которыми они могут манипулировать.

после более чем семи лет работы у нас есть парк роботов, развернутых во многих зданиях google. однотипный робот выполняет ряд услуг: автоматически протирает столы в столовой, проверяет конференц-залы, сортирует мусор и многое другое.

однако в январе 2023 года, через два месяца после того, как openai выпустила chatgpt, google закрыл everyday robots, сославшись на общие проблемы с затратами.

хотя это действительно было дорогостоящим и длительным мероприятием, оно все равно стало шоком для всех участников. в конце концов робот и несколько сотрудников были переведены в google deepmind для продолжения исследований.

огромная проблема, которую нам предстоит решить, — это глобальные демографические изменения: старение населения, сокращение рабочей силы и нехватка рабочей силы. и нашей прорывной технологией – мы знали об этом в 2016 году – будет искусственный интеллект. радикальное решение: полностью автономные роботы, способные помочь нам в решении задач, возникающих в нашей повседневной жизни.

робот не пришел вовремя, чтобы помочь моей матери, и она скончалась в начале 2021 года. мои разговоры с ней в конце ее жизни укрепили мою веру в то, что будущие версии everyday robots в конечном итоге появятся. и чем раньше это произойдет, тем лучше.

итак, вопрос в том, как происходят эти изменения и будущее? меня это одновременно беспокоит и интересует.

новости

после того, как google потратил 7 лет на проект по высадке на луну и потерпел неудачу, генеральный директор alphabet: должны ли машины быть похожими на людей?

введение

моя контактная информация