новости

Версия Her от Google отменена: потребовалось 3 попытки и смена телефонов, прежде чем это удалось... Пользователь сети: Мне потребовалось всего 10 секунд, чтобы сделать это вручную

2024-08-14

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Цзинь Лэй родом из храма Аофэй.
Кубиты | Публичный аккаунт QbitAI

Переворот, большой переворот.

Сегодня рано утром Google-версия Her—Близнецы в прямом эфиреОфициально выпущен.

В конце концов, это, очевидно, эталон для GPT-4o от OpenAI, который, можно сказать, привлек внимание технологического круга.

В демо-версии, опубликованной на официальном сайте,Фото: вопросы и ответыЭффект от функции следующий:



Общая функция, которую он реализует, — с помощью мобильного телефона фотографировать афиши концертов и позволять Gemini проверять календарь пользователя, чтобы узнать, подходит ли расписание для участия.

А также на основе этого можно выполнить ряд последующих операций, в том числе проверку тарифов в фиксированное время и т. д.

Однако... когда дело дошло до выездной демонстрационной сессии пресс-конференции, стиль картины полностью изменился.

Пожалуйста, посмотрите видеомагнитофон:



Адрес видео: https://mp.weixin.qq.com/s/90pixdMaLew4lUjzjeA6jA

  • Первый раз: не удалось.
  • Второй раз: не удалось.
  • Третий раз: сменил телефон и все прошло успешно.

Хм... На лице младшего брата невооруженным глазом можно увидеть немного паники.



Даже известное технологическое издание TechCrunch включило такие смайлы:



Некоторые пользователи сети даже включили режим горячих комментариев:

Я могу выполнить поиск в календаре за 10 секунд.



Конечно, это всего лишь небольшой эпизод сегодняшнего проекта Made by Google.

Для получения дополнительной информации о Gemini Live продолжим чтение ниже.

Полное изображение Google-версии Her

Как мы только что упомянули, функции Gemini Live и GPT-4o очень похожи.

Помимо «вопросов и ответов по фотографиям», он также может вести разговоры в реальном времени и даже прерывать Близнецов во время процесса ответа.

Понятно, что функции Gemini Live в настоящее время доступны для подписчиков уровня Advanced в системе Android (только на английском языке).

В ближайшие недели эта функция будет расширена на большее количество языков и станет доступна для iOS.

существоватьзвуки диалогаС другой стороны, Gemini Live запустила10 видовДля выбора доступны новые звуки, а эффект следующий:



Адрес видео: https://mp.weixin.qq.com/s/90pixdMaLew4lUjzjeA6jA

существоватьдействоватьС другой стороны, поскольку Gemini полностью интегрирован в систему, его можно вызвать, просто нажав и удерживая кнопку питания или сказав «Эй, Google».

Например, при написании электронного письма позвольте Близнецам помочь вам создать подходящую картинку. Эффект следующий:



Однако зарубежные СМИ неоднозначно отзываются об этой особенности.

Например, писатель из The Verge написал вПерсональный тестНазвание, данное позже, ——

Gemini Live быстрее Google, но более неуклюжий.



Конкретная причина заключалась в том, что автомобильная аудиосистема автора внезапно вышла из строя во время трехдневной поездки.

Поиск решения с помощью оригинального Google Assistant занял не менее пяти минут, а Gemini Live — всего 15 секунд.

Однако непрерывная речь Gemini Live во время разговора и метод взаимодействия, требующий от пользователей активного перебивания, заставили автора почувствовать себя неловко.

Он считает:

Голос и манера говорить настолько человечны, что мне неудобно перебивать их.
Во взаимодействие с Gemini Live вложено больше эмоций, чем в его использование в качестве инструмента решения проблем.

По совпадению, для Близнецов живут вБегайте в облакеГазета Wall Street Journal также дала резкую оценку по этому поводу:

Прогресс в диалоге, регресс в функциональности.



С технической точки зрения GPT-4o представляет собой комплексную систему, но, судя по контенту, опубликованному Google, Gemini Live — это не так.

Вместо этого интегрированы системы STT, VAD, LLM и TTS:



Кроме того, Gemini Live также появляется в новой серии мобильных телефонов Pixel, выпущенной Google.

Включая Pixel 9 Pro Fold, Pixel 9, Pixel 9 Pro и Pixel 9 Pro XL.



Что касается функций искусственного интеллекта, в телефоны Google Pixel добавлена ​​функция под названием"Добавь меня"функция.

Технологии дополненной реальности (AR) и искусственного интеллекта можно использовать для «сочетания» персонажей на двух разных фотографиях вместе.



Почему Google не может догнать OpenAI?

Хотя выпуск Gemini Live от Google на этот раз является ответом на OpenAI GPT-4o, с тех пор, как началась эра больших моделей, мы можем увидеть очень очевидную тенденцию:

Google не может идти в ногу с OpenAI.

Сначала OpenAI стала пионером в самый критический момент выпуска ChatGPT, но впоследствии Google выпустил Bard, который на этот раз был очень похож на Gemini Live, и впоследствии отменён.

За последние полтора года кажется, что OpenAI лидирует по выпуску всех основных моделей и приложений.

С другой стороны, в Google мало того, что технология демонстрирует медленные темпы даже с точки зрения общественного мнения, OpenAI затмила крупнейшее ежегодное мероприятие Google (конференцию I/O) новостью о кадровой смене (отставке Ильи).

Так почему же Google терпит неудачу в эпоху больших моделей?

В этом отношении,Бывший генеральный директор GoogleЭрик Шмидт (служивший с 2001 по 2011 год) выразил свое мнение в своей последней речи в Стэнфорде:

Google придает большое значение балансу между работой и личной жизнью, например, позволяя сотрудникам работать из дома.
Но в стартапах они работают очень усердно.



Адрес видео: https://mp.weixin.qq.com/s/90pixdMaLew4lUjzjeA6jA

Некоторые пользователи сети даже сообщили эту новость:

Мой брат — ведущий программист искусственного интеллекта в Google. У него 3 работы с полной занятостью, и он проводит в Google только 2 часа в день.



Итак, что вы думаете об этом, пожалуйста, оставьте сообщение в области комментариев, чтобы обсудить.

Справочные ссылки:
[1]https://x.com/techcrunch/status/1823410187404743131?s=46&t=6eepxw1G6XRQ7VO0ANjJWg
[2]https://x.com/GoogleDeepMind/status/1823409674739437915
[3]https://blog.google/products/gemini/made-by-google-gemini-ai-updates/
[4]https://x.com/alexkehr/status/1823480786349383879?s=46&t=6eepxw1G6XRQ7VO0ANjJWg
[5]https://www.theverge.com/2024/8/13/24219736/gemini-live-hands-on-pixel-event
[6]https://blog.google/products/pixel/google-pixel-9-new-ai-features/#pixel9phones