Google-версия Her опережает игру! Вызовите Близнецов одним щелчком мыши, разрушив 5,2 миллиарда терминалов по всему миру

Google-версия Her опережает игру! Вызовите Близнецов одним щелчком мыши, разрушив 5,2 миллиарда терминалов по всему миру.

2024-08-14

Новый отчет мудрости

Редактор: Редакционный отдел

[Введение в новую мудрость]Google-версия Her дебютирует раньше OpenAI? Голосовая модель Gemini Live от Google скоро будет доступна на 3 миллиардах устройств Android и 2,2 миллиарда iOS по всему миру. Хотя живая демонстрация все же была немного отменена, Google был полон решимости больше не ждать и был полон решимости победить OpenAI и бороться с Apple!

OpenAI, его просто заблокировали?

Вслед за «Her» OpenAI компания Google также официально объявила о выпуске голосовой функции искусственного интеллекта!

Только что в программной речи «Сделано Google» Google объявил о запуске Gemini Live, голосового режима. Gemini Live скоро будет доступен в мобильном приложении Gemini.

Гонка вооружений между Google и OpenAI началась снова.

Взгляните на OpenAI. «Она», которая была новаторской три месяца назад, все еще молчит. Этот ритм наверняка подвергнется цензуре со стороны Google.

Рик Остерло, руководитель присутствующего в Google, также многозначительно сказал: «Мы слышали слишком много обещаний об искусственном интеллекте и лозунгов о его предстоящем запуске. Сегодня мы хотим показать реальный прогресс!»

Кроме того, в ходе презентации Google также подробно продемонстрировала, как Gemini будет более глубоко интегрирована в Android, приложения и новые устройства Pixel.

В серии мобильных телефонов Pixel 9, выпущенных за один раз, Google также исследовал новую форму «мобильных телефонов с искусственным интеллектом»: какая форма продукта с искусственным интеллектом на стороне устройства будет создана в результате интеграции Gemini, Android и Pixel.

Теперь, с Android на базе искусственного интеллекта, сможет ли Google победить Apple?

Google «Она» тоже здесь

По словам Google, Gemini Live — это новый способ мобильного общения.

Если мы хотим провести мозговой штурм, какую работу мы можем найти, исходя из наших навыков и образования, Близнецы могут немедленно поговорить с нами в режиме реального времени.

Это ощущение похоже на наличие в кармане заботливого помощника, который может пообщаться в любой момент.

И, как и OpenAI, голосовая функция Google также позволяет пользователям общаться с ним на естественном разговорном языке, а его ответы также используют человеческий голос и ритм.

Пожалуйста, послушайте аудио ниже. Несколько мужских и женских голосов имеют очень естественные тембры.

Чтобы дать нам максимально естественный опыт, Google запустил 10 голосов на одном дыхании, и мы можем выбрать свой любимый тон и стиль по своему желанию.

Кроме того, Gemini Live также поддерживает функцию громкой связи. Даже если приложение Gemini работает в фоновом режиме или телефон заблокирован, мы все равно можем разговаривать с ним, как при обычном телефонном звонке.

Кроме того, мы можем прервать его и сменить тему в любой момент — выглядит знакомо, правда? Правильно, он может делать все, что может делать голос OpenAI.

Расширенная голосовая функция OpenAI «Her», ошеломившая всех в мае, все еще находится в стадии разработки. В конце прошлого месяца она была лишь выборочно открыта для небольшого числа участников альфа-тестирования.

По скорости Google явно превосходит OpenAI.

Gemini Live теперь доступен на устройствах Android за 19,99 долларов США в месяц через приложение Google Gemini.

Английская версия в настоящее время открыта, а версия iOS и поддержка большего количества языков будут запущены в ближайшие несколько недель.

С другой стороны, с точки зрения масштаба пользователей, расширенный голосовой режим Google также охватит более широкий круг потенциальных пользователей, чем OpenAI.

Знаете, сейчас в мире более 3 миллиардов пользователей Android и 2,2 миллиарда пользователей iOS.

Частично причина сбоя голосовой функции OpenAI может быть связана с ненормальной работой ИИ в тесте красной команды.

Полностью ли Google решил эти проблемы безопасности? Пока никто не знает, но очевидно, что Google, который не хочет уступать другим, на этот раз решил выложиться на все сто.

Но он перевернулся дважды

Единственным недостатком является то, что во время живой демонстрации Gemini Live были некоторые сбои.

Когда исполнительный директор Google Дэйв Ситрон продемонстрировал новые функции Gemini для подключения Google Calendar, Tasks и Keep к новым телефонам Android, он не ожидал, что это произойдет дважды подряд.

Сначала он использовал свой мобильный телефон, чтобы снять рекламный плакат показа мод Сабрины Карпентер в Сан-Франциско, а затем попросил Близнецов: «Проверьте мое расписание, чтобы узнать, свободен ли я посетить показ мод Сабрины Карпентер».

В первом ответе Близнецы сказали, что что-то пошло не так, и ей пришлось попробовать еще раз.

Когда я только что попробовал выполнить шаги во второй раз, Близнецы так и не получили ответа.

Только в третий раз (было заменено другое устройство) результаты наконец были подведены, и публика разразилась аплодисментами.

Переосмысление AI Assistant

В своей речи компания Google заявила: «С помощью Gemini они переосмыслили то, что значит быть по-настоящему полезным для человека личным помощником — более естественным, разговорным и интуитивным.

Подключите больше приложений

Каковы наиболее важные ключевые слова для хорошего помощника по искусственному интеллекту?

соединять.

Gemini именно такой: он будет интегрироваться со всеми приложениями и инструментами Google, которые мы используем для выполнения больших и малых задач.

И в отличие от других помощников нам не придется тратить время на переключение между приложениями и сервисами.

В ближайшие недели Google также запустит новые расширения, включая Keep, Tasks, Utilities и YouTube Music.

Какая еда изображена на картинке? Спросите Gemini, и он вам все перечислит.

Предположим, теперь мы хотим устроить званый обед, Близнецы могут использовать свои различные боевые искусства——

В Gmail он может найти рецепт лазаньи, который кто-то нам прислал, затем добавить ингредиенты в список покупок Keep, а затем попросить Gemini составить для нас плейлист, попросив его «напомнить мне о конце 90-х».

В предстоящем расширении календаря Google мы можем напрямую сфотографировать афишу концерта и спросить Близнецов: свободен ли я в этот день? Если ответ «да», мы также можем попросить Gemini помочь нам установить напоминания и подготовиться к получению билетов.

Попросите Близнецов написать профессору электронное письмо с просьбой об отпуске и попросить продлить срок еще на несколько дней, просто поговорив.

Вызов Близнецов одним щелчком мыши

Теперь Gemini полностью интегрирован в пользовательский интерфейс Android.

Только в Android мы можем испытать такую плавную контекстную осведомленность.

Пока у нас есть телефон Android, независимо от того, что мы хотим сделать, Близнецы могут появиться, когда это необходимо.

Нажмите и удерживайте кнопку питания или скажите «Эй, Google», чтобы вызвать Близнецов!

Если вы используете YouTube, вы можете задавать Gemini вопросы о видео.

Например, предположим, что мы создаем путеводитель по поездкам за границу и только что просмотрели видеоблог о путешествиях. Нажмите «Спросить об этом видео», и он перечислит все рестораны, которые появляются в видео, и добавьте их на Карты Google. сделаю это один за другим.

Глядя на изображение ниже, изображения, созданные Gemini, можно напрямую перетаскивать в Gmail и Сообщения Google.

Я думаю, вы осознали всю красоту этой операции…

Поскольку в Gemini реализована глубокая интеграция с Android, ИИ может делать больше, чем просто читать содержимое экрана и взаимодействовать со многими приложениями, которые мы уже используем.

Gemini 1.5 Flash с искусственным интеллектом

Однако есть две проблемы: LLM, который может лучше интерпретировать естественный язык и обрабатывать задачи, часто означает, что для выполнения даже простых задач требуется больше времени.

А если ИИ проявит неожиданное поведение или предоставит неточную информацию, это тоже будет головная боль.

Для этого компания Google специально представила новую модель — Gemini 1.5 Flash.

Он отвечает быстрее и качество его ответов выше.

В ближайшие месяцы Google также глубже интегрирует эту модель с Google Home, Phone и Messages.

Google заявляет, что сегодня мы официально достигли переломного момента, когда полезность помощников с искусственным интеллектом намного перевешивает их проблемы.

На основе Imagen 3 генерируйте изображения за 2 секунды.

На встрече Google также запустила новое приложение для создания фотографий с использованием искусственного интеллекта — Pixel Studio.

Достаточно всего нескольких слов, чтобы создать красивую картинку.

Самое главное, что это приложение для локальной генерации изображений, созданное на основе Imagen 3, которое может генерировать различные изображения в течение 2 секунд.

Также сегодня был опубликован технический отчет Imagen 3. Технические подробности можно найти в 32-страничном документе.

Адрес статьи: https://arxiv.org/pdf/2408.07009.

Первый ИИ-телефон стоит 20 криптоновых долларов в месяц

Все эти возможности искусственного интеллекта были встроены в новейшее оборудование мобильных телефонов Google.

На мероприятии Google представила в общей сложности четыре телефона с искусственным интеллектом — Pixel 9, Pixel9 Pro, Pixel9 Pro XL и складной экран второго поколения Pixel 9 Pro Fold.

Что вы не должны пропустить в новой серии Pixel 9, так это возможности камеры на базе искусственного интеллекта.

В Google заявили, что алгоритм обработки изображений — HDR+pipeline — был полностью перестроен, что позволяет сделанным фотографиям иметь лучший контраст, тени, экспозицию, резкость, цвет и т. д.

Ниже приведены новые возможности редактирования изображений с использованием искусственного интеллекта в телефонах серии Pixel 9:

Добавь меня

Часто ли вы сталкиваетесь с тем, что во время семейных посиделок, тимбилдинга и семейных поездок вы берете на себя ответственность фотографировать, но на фотографиях не хватает только вас?

Однако в будущем вам не придется беспокоиться об этом.

Функция Google «Добавить меня» может компенсировать ваши сожаления.

Сначала необходимо сделать групповое фото. Затем лицо, ответственное за съемку, взаимодействует с человеком на фотографии и делает фотографию, включая «фотографа».

В настоящее время Pixel использует технологию дополненной реальности в реальном времени, чтобы помочь второму человеку скомпоновать фотографию так, чтобы она соответствовала композиции первой фотографии.

Наконец, Pixel затем объединяет два изображения, чтобы все были на одной фотографии, включая «фотографа».

Переосмыслить

Еще одна функция Reimagine проста для понимания.

В настоящее время возможность Magic Editor позволяет вам описать желаемый эффект прямо в текстовом поле.

ИИ может воплотить ваши идеи в реальность.

Например, вы можете изменить фон на фотографии, вулканы, закаты, полярное сияние и другие сцены и играть с ними как угодно.

Авто Рамка

Автоматическая композиция — это новая функция в Magic Editor, которая позволяет перекомпоновать уже снятые фотографии.

Он может даже увеличивать ваши фотографии и создавать пустые фоны с помощью искусственного интеллекта.

Увеличение масштаба

Zoom Enhance может автоматически заполнять промежутки между пикселями и точно прогнозировать детали для достижения высококачественных эффектов увеличения при съемке.

Реализация возможностей искусственного интеллекта неотделима от мощных чипов серии Pixel 9.

Самый мощный процессор искусственного интеллекта: Google Tensor G4

В новом мобильном телефоне используется недавно разработанный процессор Google — Google Tensor G4.

В Google заявили: «Чип Tensor G4 — наш самый быстрый и мощный чип на данный момент».

На основе прошлогоднего Tensor G3 Google объединилась с Samsung для создания полузаказного процессора Tensor G4 на основе 4-нм техпроцесса с использованием ядер ЦП и графического процессора, предоставленных Arm.

В то же время он также использует собственные модули Google для улучшения функций искусственного интеллекта, фотографии и безопасности.

Сообщается, что по сравнению с двумя предыдущими поколениями, G4 увеличил скорость просмотра веб-страниц на 20%, скорость запуска приложений на 17%, а ежедневное потребление энергии от батареи приложений увеличилось на 20%.

Что касается процессора, G4 оснащен 1 ядром Cortex-X4, работающим на частоте 3,1 ГГц, 3 ядрами Cortex-A720, работающими на частоте 2,6 ГГц, и 4 ядрами Cortex-A520, работающими на частоте 1,95 ГГц.

Для сравнения, Tensor G3 имеет одно ядро Cortex-X3 с частотой 2,91 ГГц, четыре ядра Cortex-A715 с частотой 2,37 ГГц и четыре ядра Cortex-A510 с частотой 1,70 ГГц.

Хотя у Tensor G4 на одно ядро меньше, все ядра работают на 200–300 МГц выше.

Согласно опубликованным оценкам Geekbench, Tensor G4 набрал 2005 баллов в одноядерном тесте и 4835 баллов в многоядерном тесте. Для сравнения, Tensor G3 набрал 1751 балл в одноядерном тесте и 4208 баллов в многоядерном тесте. Разница в производительности составляет 14%.

Что касается графического процессора, Tensor G4 использует тот же графический процессор ARM Mali-G715, что и прошлогодний Tensor G3, но частота была увеличена с 890 МГц до 940 МГц. Это означает, что производительность графического процессора Tensor G4 должна быть немного выше, чем у Tensor G3.

Поддержка новых функций искусственного интеллекта

Искусственный интеллект, конечно, является одной из главных движущих сил проекта Tensor.

Обновленный Tensor G4 призван расширить возможности новейших функций Gemini и вычислительной фотографии.

Модели Gemini Nano, которые можно запускать локально (самая большая версия имеет 3,5 миллиарда параметров), могут выводить контент со скоростью 45 токенов/с.

Хотя TPU Google уже работает быстро, он не опережает своих конкурентов с точки зрения обработки токенов.

Для сравнения, Qualcomm Snapdragon 8 Gen 3 может выводить 15 токенов в секунду при обработке 10 миллиардов параметров; MediaTek Dimensity 9300 может обрабатывать 7 миллиардов параметров при 20 токенах в секунду.

Однако уникальные возможности искусственного интеллекта серии Pixel 9, возможно, не полностью зависят от нового чипа, а скорее являются результатом других факторов.

ИИ также требует больших объемов памяти и доступа к быстрым и большим пулам памяти для запуска более сложных моделей.

Pixel 9 поставляется с 12 ГБ оперативной памяти, а серия Pro — до 16 ГБ.

В Google заявили, что для обеспечения более плавной работы искусственного интеллекта компания впервые выделила «выделенную часть оперативной памяти для запуска Gemini на устройстве», чтобы другие приложения не могли использовать память.

Однако Google не раскрыла, какая часть средств была выделена на задачи ИИ.

Хотя сам чип не претерпел серьезных обновлений с точки зрения искусственного интеллекта, он все же может улучшить работу искусственного интеллекта и добавить новые функции за счет оптимизации управления оперативной памятью.

Ссылки:

https://blog.google/products/gemini/made-by-google-gemini-ai-updates/

https://x.com/TechCrunch/status/1823410187404743131

https://venturebeat.com/ai/googles-ai-surprise-gemini-live-speaks-like-a-human-takeing-on-chatgpt-advanced-voice-mode/

https://www.androidauthority.com/google-tensor-g4-explained-3466184/

новости

Google-версия Her опережает игру! Вызовите Близнецов одним щелчком мыши, разрушив 5,2 миллиарда терминалов по всему миру.

Введение

Моя контактная информация