новости

Google: телефоны Android, послушайте меня, искусственный интеллект должен это делать

2024-08-14

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Автор | Синьсинь
редактировать |

На месяц раньше Apple компания Google продемонстрировала все возможности телефонов с AI+ в своем новом телефоне Pixel.

13 августа по местному времени Google выпустила новые аппаратные продукты, такие как Pixel 9, Pixel 9 Pro, складной экран второго поколения Pixel 9 Fold, умные часы и наушники. По сравнению с аппаратным обеспечением людей больше беспокоит, как Google, как менеджер системы Android, будет использовать встроенный искусственный интеллект для телефонов Android, когда мобильные телефоны AI+ настолько популярны.

Почти 10 месяцев назад Google выпустила первое поколение мобильных телефонов с искусственным интеллектом. Менее года назад гигант снова обновил свой портфель продуктов Gemini, Android и Pixel. На этот раз основной акцент сделан на «У меня есть то, что мне нужно». у конкурентов." "модель.

С тех пор как OpenAI запустил голосовой режим ChatGPT и были раскрыты функции искусственного интеллекта iPhone следующего поколения от Apple, Google не желает отставать в том, что могут делать его коллеги, включая голосовые разговоры с искусственным интеллектом, поиск информации на скриншотах и ​​т. д. В то же время Google продолжает интегрировать искусственный интеллект в свою собственную экосистему приложений.

Кто является лидером в области мобильных телефонов с искусственным интеллектом? Google должен конкурировать с Apple?

В ответ OpenAI

Близнецы Live онлайн

Gemini является краеугольным камнем различных продуктов Google в области искусственного интеллекта и помощником по умолчанию на мобильных телефонах Google серии Pixel 9. Главной темой конференции было то, какие обновления есть у Gemini при интеграции в мобильные телефоны.

Близнецов на телефонах Google Pixel можно вызвать, нажав кнопку питания. По словам руководителей Google, начиная с сегодняшнего дня пользователи смогут отображать наложения Gemini над используемыми ими приложениями, чтобы задавать вопросы о том, что происходит на экране. Например, пользователи могут задавать вопросы о видео на YouTube, которое они смотрят, или создавать изображения непосредственно из наложений Gemini и перетаскивать их в такие приложения, как Gmail и Google Messages.

Google также планирует подключить Gemini к большему количеству приложений «в ближайшие недели», включая Calendar, Keep и YouTube Music. Среди особенностей — попросить Близнецов «составить плейлист из песен, которые напоминают мне о конце 90-х». «Сфотографировать афишу концерта и попросить Близнецов проверить наличие мест в этот день — даже установить напоминания о покупке билетов». найдите рецепт в Gmail и попросите его добавить ингредиенты в список покупок в Keep».


Gemini использует снимки экрана для извлечения информации и взаимодействия с другими приложениями. Источник изображения: Google |

В дополнение к этим интегрированным функциям Google также официально запустила Gemini Live. Эту функцию можно назвать ответом Google на расширенный голосовой режим GPT-4o, запущенный OpenAI. Эта функция ранее была представлена ​​на конференции разработчиков ввода-вывода Google в 2024 году и будет официально представлена ​​сегодня.

Пользователи могут использовать свои мобильные телефоны для ведения голосовых разговоров с Gemini, генеративным чат-ботом Google. Они могут прерывать разговор на полпути и задавать дополнительные вопросы, а разговор можно приостановить и возобновить в любое время. Некоторые примеры конкретного использования включают в себя возможность Gemini Live сопровождать вас при подготовке к собеседованиям, репетиции выступлений и непринужденной беседе на интересующие вас темы.


Gemini Live, очевидно, стремится протестировать голосовое взаимодействие GPT-4o|Источник изображения: Google

Итак, есть ли у Gemini Live какие-либо преимущества перед голосовым режимом ChatGPT?

Говорят, что архитектура генеративной модели ИИ, поддерживающая Live — Gemini 1.5 Pro и Gemini 1.5 Flash, имеет более длинное «контекстное окно», что означает, что они могут обрабатывать и анализировать большие объемы данных перед генерацией ответа. теория Разговоры могут длиться часами.

Gemini Live также работает без помощи рук, позволяя пользователям продолжать голосовые разговоры в фоновом режиме приложения или когда телефон заблокирован, используя на выбор 10 новых голосов.

Однако стоит отметить, что Gemini Live еще не запустила функцию «мультимодального ввода», которая, как сообщается, будет запущена «позже в этом году».

Несколько месяцев назад Google выпустил заранее записанное видео, показывающее, как Gemini Live может распознавать окружение пользователя по фотографиям и видео, снятым камерой телефона, и реагировать, например, указывая на сломанную деталь велосипеда или объясняя, что происходит на экране компьютера. . Функциональность фрагмента кода, ни один из которых не был продемонстрирован вживую.

Более того, Gemini Live доступен подписчикам Gemini Advanced на телефонах Android и не является бесплатным. В настоящее время он доступен только на английском языке, но Google заявляет, что «в ближайшие недели» он будет расширен на большее количество языков, а также на iOS через приложение.


Демонстрация Gemini Live в прямом эфире руководителей Google|Источник изображения: Google

Опыт работы с Google Gemini и руководитель Google Assistant сказал: «Google находится на ранних стадиях изучения способов, которыми могут быть полезны помощники на базе искусственного интеллекта — и, как и телефоны Pixel, Gemini будет становиться все лучше и лучше».

Кроме того, что касается вопросов конфиденциальности, руководители экосистемы Google Android заявили, что Gemini поддерживает сотни моделей мобильных телефонов от десятков производителей устройств, и при обработке пользовательских данных данные не покидают телефон.

«Gemini может помочь составить ежедневный план тренировок на основе электронного письма от вашего личного тренера или написать профиль работы, используя ваше резюме на Google Диске. Только Gemini может сделать все это таким безопасным и универсальным способом без необходимости Данные передаются стороннему поставщику искусственного интеллекта, о котором вы можете не знать или которому вы не доверяете», — сказал Самир Самат, президент экосистемы Google Android.

«Поскольку Android — первая мобильная операционная система, имеющая на устройстве большую мультимодальную модель искусственного интеллекта под названием Gemini Nano, ваши данные никогда не покидают ваш телефон при обработке некоторых наиболее деликатных случаев использования».

ИИ дополнительно интегрирован в Android

Самым большим преимуществом Google в продвижении телефонов с искусственным интеллектом, несомненно, являются многочисленные инструменты приложений и экосистема Android. Сейчас у Google миллиарды пользователей Android, и для этого явно больше места, чем для приложения-чат-бота.

В прошлом году серия Google Pixel 8, ставшая первым смартфоном, ориентированным на искусственный интеллект, представила различные функции искусственного интеллекта. Например, пользователи могут удалять, перемещать или редактировать отдельные элементы на фотографии, перемещать выражения между фотографиями, чтобы получить лучшую составную фотографию, выполнять поиск по скриншотам или «обведенной части» экрана и многое другое.

Все эти функции впервые появились в серии Pixel 8 и с тех пор распространились по всей экосистеме Android.

Функция Google «поиск по кругу» впервые появилась на телефоне Samsung Galaxy AI. Будучи партнером Google по экосистеме Android, телефоны Samsung также добавили множество аналогичных функций искусственного интеллекта. Вышеупомянутый AI-помощник Gemini также появляется в Samsung Galaxy Z Fold6, Motorola Razr+ и других мобильных телефонах.

В то же время другие производители также объявили, что выпустят собственный искусственный интеллект для мобильных телефонов. Наибольшее внимание в последние несколько месяцев привлекла Apple. Тем же направлением и концепцией является интеграция собственной экосистемы приложений.

Можно сказать, что почти за год «мобильные телефоны с искусственным интеллектом» стали основной точкой зрения рынка на мобильные телефоны, а не только на мобильные телефоны Google. Как использовать ИИ, чтобы заставить людей сиять, — задача для Google. В настоящее время, как и в случае с выпуском ИИ-телефона Pixel 8 первого поколения, основной продукцией Google по-прежнему являются различные гаджеты с функциями ИИ.

На мероприятии Made By Google в этом году были представлены ключевые новые функции искусственного интеллекта Google:

  • «Добавить меня» позволяет даже человеку, делающему фотографию, включить себя в групповое фото;

  • «Pixel Studio», генератор изображений с искусственным интеллектом, очень похожий на предстоящее приложение Apple Image Playground;

  • «Пиксельные скриншоты», которые сканируют галерею пользователя в поисках снимков экрана и превращают их в базу данных, удобную для поиска;

  • «Заметки о вызовах» позволяют сохранять сводную информацию в истории вызовов. После активации этой функции все участники разговора получат уведомление.

Среди них, если вы хотите реализовать функцию «Добавить меня», фотограф сначала делает фотографию без себя, а затем фотографом становится другой человек и делает еще одну фотографию. Pixel объединит две фотографии, чтобы все были на одной фотографии, поэтому нет необходимости просить незнакомца сделать фотографию.


Функция группового фото|Источник изображения: Google

Основным преимуществом позиционирования Google серии Pixel 9 также является камера с искусственным интеллектом, которую компания называет «первой в мире камерой, управляемой искусственным интеллектом». Руководители Google также заявили, что «Pixel был первым телефоном, который использовал Night Sight для фото и видео, а теперь это также первый телефон, позволяющий снимать потрясающие панорамные пейзажи и городские пейзажи в условиях низкой освещенности». На пресс-конференции руководители Google также заявили. сравнил фотографии, сделанные на Pixel 9 Pro XL, с фотографиями Apple iPhone 15 Pro Max.


Мобильный телефон Google против эффекта ночной фотографии на мобильном телефоне Apple|Источник: Google

Складной Pixel 9 Pro Fold со сверхбольшим экраном также оснащен функцией «Made You Look», которую можно использовать, чтобы привлечь внимание пользователей и заставить их улыбнуться в камеру. При использовании этой функции разверните телефон, и на одной стороне внешнего экрана будет воспроизводиться привлекательная визуальная анимация, например ярко-желтая курица, или другие забавные анимации.


Особенности экрана, которые привлекают внимание пользователей|Источник изображения: Google

После съемки фотографии есть также инструменты для редактирования фотографий, а в редакторе Magic Editor Google Photos в этом году появилось несколько новых функций. Например, функция «Автокадр» используется для коррекции угла наклона фотографий, а генеративный искусственный интеллект используется для заполнения промежутков вокруг объекта и создания более широкого поля зрения. Также имеется функция «Переосмыслить». После описания желаемого эффекта в текстовом поле вы можете использовать генеративный AI для P-изображения, например, превратить траву на земле в полевые цветы, добавить воздушный шар к определенной части изображения. небо и т. д.

Кроме того, Google последовала примеру Apple и запустила функцию «Спутниковая SOS» для использования в чрезвычайных ситуациях. Эта функция позволяет пользователям связываться со службами экстренной помощи и делиться информацией о местоположении, когда нет сотовой связи. По словам руководителей Google, серия Pixel 9 станет «первыми телефонами Android, которые смогут использовать спутниковую SOS».


Функция спутникового SOS|Источник изображения: Google

С функциональной точки зрения связка Pixel 9+ Gemini не сильно опережает нынешних отечественных производителей Android с точки зрения ИИ. Но следует отметить, что, в отличие от Apple, у Google есть собственные системы и терминалы, а также большие модели и облачные вычисления. На данный момент это единственная компания среди всех компаний, которая действительно завершила замкнутый цикл в «мягком, аппаратном и облачном». ядро облака».

Как только произойдет прорыв в области искусственного интеллекта терминалов, у Google, который готов ко всему, будет гораздо больше шансов «снова сделать его великим», чем у его конкурентов.

Возможно, Google не хватает просто больших амбиций.

*Источник изображения заголовка: Google.

Эта статья является оригинальной статьей Гика Пака. Для перепечатки свяжитесь с Гиком Джуном в WeChat geekparkGO.