Моя контактная информация
Почта[email protected]
2024-08-14
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Цзинь Лэй родом из храма Аофэй.
Кубиты | Публичный аккаунт QbitAI
Переворот, большой переворот.
Сегодня рано утром Google-версия Her—Близнецы в прямом эфиреОфициально выпущен.
В конце концов, это, очевидно, эталон для GPT-4o от OpenAI, который, можно сказать, привлек внимание технологического круга.
В демо-версии, опубликованной на официальном сайте,Фото: вопросы и ответыЭффект от функции следующий:
Общая функция, которую он реализует, — с помощью мобильного телефона фотографировать афиши концертов и позволять Gemini проверять календарь пользователя, чтобы узнать, подходит ли расписание для участия.
А также на основе этого можно выполнить ряд последующих операций, в том числе проверку тарифов в фиксированное время и т. д.
Однако... когда дело дошло до выездной демонстрационной сессии пресс-конференции, стиль картины полностью изменился.
Пожалуйста, посмотрите видеомагнитофон:
Адрес видео: https://mp.weixin.qq.com/s/90pixdMaLew4lUjzjeA6jA
Хм... На лице младшего брата невооруженным глазом можно увидеть немного паники.
Даже известное технологическое издание TechCrunch включило такие смайлы:
Некоторые пользователи сети даже включили режим горячих комментариев:
Я могу выполнить поиск в календаре за 10 секунд.
Конечно, это всего лишь небольшой эпизод сегодняшнего проекта Made by Google.
Для получения дополнительной информации о Gemini Live продолжим чтение ниже.
Как мы только что упомянули, функции Gemini Live и GPT-4o очень похожи.
Помимо «вопросов и ответов по фотографиям», он также может вести разговоры в реальном времени и даже прерывать Близнецов во время процесса ответа.
Понятно, что функции Gemini Live в настоящее время доступны для подписчиков уровня Advanced в системе Android (только на английском языке).
В ближайшие недели эта функция будет расширена на большее количество языков и станет доступна для iOS.
существоватьзвуки диалогаС другой стороны, Gemini Live запустила10 видовДля выбора доступны новые звуки, а эффект следующий:
Адрес видео: https://mp.weixin.qq.com/s/90pixdMaLew4lUjzjeA6jA
существоватьдействоватьС другой стороны, поскольку Gemini полностью интегрирован в систему, его можно вызвать, просто нажав и удерживая кнопку питания или сказав «Эй, Google».
Например, при написании электронного письма позвольте Близнецам помочь вам создать подходящую картинку. Эффект следующий:
Однако зарубежные СМИ неоднозначно отзываются об этой особенности.
Например, писатель из The Verge написал вПерсональный тестНазвание, данное позже, ——
Gemini Live быстрее Google, но более неуклюжий.
Конкретная причина заключалась в том, что автомобильная аудиосистема автора внезапно вышла из строя во время трехдневной поездки.
Поиск решения с помощью оригинального Google Assistant занял не менее пяти минут, а Gemini Live — всего 15 секунд.
Однако непрерывная речь Gemini Live во время разговора и метод взаимодействия, требующий от пользователей активного перебивания, заставили автора почувствовать себя неловко.
Он считает:
Голос и манера говорить настолько человечны, что мне неудобно перебивать их.
Во взаимодействие с Gemini Live вложено больше эмоций, чем в его использование в качестве инструмента решения проблем.
По совпадению, для Близнецов живут вБегайте в облакеГазета Wall Street Journal также дала резкую оценку по этому поводу:
Прогресс в диалоге, регресс в функциональности.
С технической точки зрения GPT-4o представляет собой комплексную систему, но, судя по контенту, опубликованному Google, Gemini Live — это не так.
Вместо этого интегрированы системы STT, VAD, LLM и TTS:
Кроме того, Gemini Live также появляется в новой серии мобильных телефонов Pixel, выпущенной Google.
Включая Pixel 9 Pro Fold, Pixel 9, Pixel 9 Pro и Pixel 9 Pro XL.
Что касается функций искусственного интеллекта, в телефоны Google Pixel добавлена функция под названием"Добавь меня"функция.
Технологии дополненной реальности (AR) и искусственного интеллекта можно использовать для «сочетания» персонажей на двух разных фотографиях вместе.
Хотя выпуск Gemini Live от Google на этот раз является ответом на OpenAI GPT-4o, с тех пор, как началась эра больших моделей, мы можем увидеть очень очевидную тенденцию:
Google не может идти в ногу с OpenAI.
Сначала OpenAI стала пионером в самый критический момент выпуска ChatGPT, но впоследствии Google выпустил Bard, который на этот раз был очень похож на Gemini Live, и впоследствии отменён.
За последние полтора года кажется, что OpenAI лидирует по выпуску всех основных моделей и приложений.
С другой стороны, в Google мало того, что технология демонстрирует медленные темпы даже с точки зрения общественного мнения, OpenAI затмила крупнейшее ежегодное мероприятие Google (конференцию I/O) новостью о кадровой смене (отставке Ильи).
Так почему же Google терпит неудачу в эпоху больших моделей?
В этом отношении,Бывший генеральный директор GoogleЭрик Шмидт (служивший с 2001 по 2011 год) выразил свое мнение в своей последней речи в Стэнфорде:
Google придает большое значение балансу между работой и личной жизнью, например, позволяя сотрудникам работать из дома.
Но в стартапах они работают очень усердно.
Адрес видео: https://mp.weixin.qq.com/s/90pixdMaLew4lUjzjeA6jA
Некоторые пользователи сети даже сообщили эту новость:
Мой брат — ведущий программист искусственного интеллекта в Google. У него 3 работы с полной занятостью, и он проводит в Google только 2 часа в день.
Итак, что вы думаете об этом, пожалуйста, оставьте сообщение в области комментариев, чтобы обсудить.
Справочные ссылки:
[1]https://x.com/techcrunch/status/1823410187404743131?s=46&t=6eepxw1G6XRQ7VO0ANjJWg
[2]https://x.com/GoogleDeepMind/status/1823409674739437915
[3]https://blog.google/products/gemini/made-by-google-gemini-ai-updates/
[4]https://x.com/alexkehr/status/1823480786349383879?s=46&t=6eepxw1G6XRQ7VO0ANjJWg
[5]https://www.theverge.com/2024/8/13/24219736/gemini-live-hands-on-pixel-event
[6]https://blog.google/products/pixel/google-pixel-9-new-ai-features/#pixel9phones