новости

В этой статье, более добросовестной, чем OpenAI, суммируются 11 основных моментов пресс-конференции Google.

2024-08-14

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Только что на Х группу людей трахнул Брат СтроберриOpenAIПревью, когда у тебя сумасшедший менталитет.

Google несетСделаноGoogle24Пресс-конференция здесь.

OpenAI даже опубликовала блог через несколько минут после пресс-конференции, чтобы раскритиковать Google. Это был такой плохой блог, и они даже позволили своему AI Strawberry выступать в роли Риддлера в течение двух дней.

Нынешний OpenAI действительно похож на плач волка. У меня больше нет никаких ожиданий и доверия к нему. Единственными двумя ругательствами, которые звучали каждый раз, были ХХХ, ХХ!

И у Google все еще есть несколько дополнительных сюрпризов, без каких-либо ожиданий.

Я суммировал 11 основных моментов. Прочитав эту статью, вы закончили просмотр пресс-конференции.

1. Google хочет реконструировать Android на базе Gemini.

Они дали определение слову AI OS. Google хочет сделать AI OS доступной каждому.

В настоящее время они поддерживают 45 языков в более чем 200 странах и регионах, его можно использовать на сотнях моделей мобильных телефонов от десятков производителей устройств и поддерживают миллиарды устройств по всему миру.

2. Распознавание изображений Близнецов на мобильном телефоне отменено.

Первое, что они продемонстрировали, — это возможности Gemini по распознаванию изображений.

Поскольку ИИ является мультимодальным, распознавание захвата изображений, по-видимому, становится обязательной функцией. Лучшим тестом на способность распознавания фотографий является информационно-емкий контент, такой как инструкции и расписания съемки. Необходимо не только распознать изображение, но и понять текстовое содержание и дать ответ.

Парень, делавший демо, сфотографировалбумажный плакат концерта, расписание туров выше. Ведущий попросил Близнеца проверить его расписание и выбрать время, когда он сможет пойти на шоу Сабрины Карпентер.

Однако в живых демо-версиях обязательно будут ошибки, и вот они.

Первые два раза, когда Близнецы фотографировали, живая демонстрация позорно провалилась. За Тихим океаном я дважды чувствовал себя неловко на месте происшествия. . . = =

На этой демонстрации также особо упоминалось, что использовался мобильный телефон Samsung Galaxy S24 Ultra. Может ли быть так, что Samsung проявляет свою силу?

Сцену сменили на другое устройство и попробовали еще раз. К счастью, содержимое картинки удалось распознать в третий раз.

Близнецы прямо назвали вполне конкретную дату: там будет Сабрина.9 ноября 2024 г.Приехать в Сан-Франциско и пойти на шоу, если у ведущего нет других планов на день.

Наконец начались аплодисменты, и ребята заметно вздохнули с облегчением.

3. Межпрограммное взаимодействие очень удобно.

Gemini теперь может понимать и анализировать видеоконтент прямо на вашем телефоне.

Во время просмотра видео вы можете позвонить Gemini, чтобы обобщить для вас ключевые моменты или ответить на ваши вопросы по содержанию видео.

Например, после просмотра ночью видео о еде на YouTube вам не нужно читать картинки одну за другой. Список продуктов, которые появляются в видео, генерируется автоматически и добавляется в личный список «что попробовать». .

Хорошие новости для гурманов.

Вы также можете создавать списки достопримечательностей или предложения маршрутов для некоторых видеороликов о путешествиях на YouTube.

Как человек, которому необходимо, чтобы фоновая музыка появлялась даже во время прогулки,

Вы также можете попросить Gemini создать «плейлист K-pop, подходящий для прогулок по Сеулу», который рекомендует подходящую музыку в зависимости от сцены, настроения или типа деятельности, описанной пользователем.

Делает поиск музыки более интуитивным и личным.

4Скорость записи очень высокая, эффект хороший.

Gemini также может помочь вам написать электронное письмо на мобильном телефоне всего за несколько секунд.

Младший брат продемонстрировал два сценария: первый — написать домовладельцу вежливое письмо-напоминание с просьбой отремонтировать модуль питания дома.

Второй — написать профессору письмо с извинениями за отсутствие на работе по болезни (кажется, я уже делал подобное раньше).

Кроме того, у Gemini также есть интерактивный дизайн, который позволяет пользователям редактировать текст и отправлять электронные письма.

Увидев, что Близнецы завершили письмо с извинениями всего за несколько секунд, я почти не смог сдержать смех.

5. Эффект разговора в реальном времени Gemini Live неплох, но это только TTS с малой задержкой.

Google запустил функцию разговора в реальном времени, похожую на GPT4o, которую можно прервать в любой момент. Они называют ее Gemini Live.

На выбор предлагается 10 тонов.

Демо-девушка долго болтала с Gemini Live. Качество звука хорошее и задержка достаточно низкая, но на самом деле это похоже на малолатентный TTS, а не на родную мультимодальную большую модель GPT4o.

Потому что нет демонстрации эмоционального понимания и выражения, по мнению гугла, если оно и есть, то обязательно покажут безумно. Кроме того, в некоторых более длинных ответах задержка все равно может явно ощущаться.

Так что на самом деле это разговор TTS с малой задержкой.

В настоящее время он доступен только подписчикам Gemini Advanced. Он стоит 20 долларов в месяц и доступен немедленно.

6.Pixel 9 — первый мобильный телефон, оснащенный мультимодальной системой Gemini Nano.

Это самая мощная модель искусственного интеллекта, когда-либо выпущенная на телефоне, она в три раза мощнее, чем предыдущая модель искусственного интеллекта, использовавшаяся в Pixel 8 Pro.

Процессор Pixel 9 (TPU и Tensor G4) может генерировать до 45 слов за одну секунду, что вдвое быстрее, чем раньше.

Обычный Pixel 9 имеет 12 ГБ памяти, а версия Pro — больше — 16 ГБ. И самое интересное в них то, что у них наконец-то появилась функция спутниковой связи. . .

Могу сказать только одно: мы далеко впереди!

На этот раз выпущены три моноблока и один складной телефон. Обычная линейка включает базовый Pixel 9 с 6,3-дюймовым дисплеем, Pixel 9 Pro XL с 6,8-дюймовым экраном и новый, 6,3-дюймовый Pixel 9 Pro меньшего размера.

Честно говоря, мне кажется, что это немного некрасиво. . .

Также есть новая ширма.Pixel 9 Pro Fold.

Еще уродливее. . .

7. Заметки о звонках помогут вам записать ключевую информацию во время телефонного звонка.

Теперь «помощник по вызову» Pixel стал более мощным, добавив функцию «Заметки о вызовах».

После завершения разговора вам будет предоставлена ​​полностью конфиденциальная сводка разговора. Это упрощает доступ к номерам телефонов, времени, деталям и другой информации, которую вы не хотите забыть, даже если во время разговора у вас нет ручки и бумаги.

Более того, весь этот процесс выполняется локально, и проблем с конфиденциальностью практически нет.

Мальчик привел пример: недавно он подумывал о том, чтобы сменить прическу, но его парикмахер не смог сделать прическу, которую он хотел, поэтому он порекомендовал мне другую парикмахерскую.

Но проблема в том, что он забыл записать номер телефона магазина. С помощью заметок о вызовах вы можете легко отследить вызов.

7. Функция создания скриншотов, похожая на Recall, немного странная.

Есть сцена, знакомая каждому: вы видите на своем телефоне что-то, что хотите запомнить. Может быть, вы записываете это в уме или делаете снимок экрана и сохраняете.

Но часто вы либо забываете то, что хотите запомнить, либо не можете найти это, когда вам это нужно.

Потом они сделали новый продукт.

Вы можете использовать AI для быстрого поиска всех сохраненных изображений. Например, если у вас на телефоне десятки фотографий велосипедов, и если вы ищете велосипеды, они все появятся.

Вы также можете задавать более сложные вопросы, например, цену футболки, и вы увидите, что Pixel Screenshot не только нашел исходное изображение, но и предоставил мне ответ на естественном языке на основе информации, содержащейся в изображении.

8. Обычный локальный AI-рисунок Pixel Studio.

Каждый телефон Pixel 9 поставляется с новым Pixel Studio — первым генератором изображений на телефоне.

Я думаю, что эффект средний и его можно использовать.

Например, место для костра на пляже на закате кажется очень обычным.

9. Камера с искусственным интеллектом отлично подходит для групповых фотографий.

Пиксельная камера считается первой камерой с искусственным интеллектом.

Мне не понятны большинство параметров, но эта фотосцена очень интересна.

Часто у нас не получается сделать групповое фото, и всегда находится друг, который хочет стать фотографом.

Он использует простой экранный интерфейс, который поможет вам делать фотографии, например, позволяя вам передать камеру кому-то другому, чтобы вы могли поменяться местами. Затем вы можете выровнять людей на новой фотографии по их контурам на первой фотографии и сделать еще одну фотографию. Полученное изображение объединяет две фотографии вместе, создавая впечатление, будто все находятся на одной фотографии одновременно.

Это очень круто и решает главную проблему при фотографировании.

10. Новые часы и наушники.

Отправил Pixel Watch 3.

Один наушник Pixelbuds Pro 2.

Гарнитура может разбудить Близнеца и поговорить с ним в любой момент.

11. Сравните Project Aster от GPT4o.

Проект Aster был представлен на конференции Google несколько месяцев назад и стал прямым тестом собственной мультимодальной большой модели GPT4o.

Теперь, в Gemin Live, вы сможете использовать его и в будущем.Астер.

Например, вы можете поделиться своей камерой во время разговора с Близнецами, чтобы напрямую продемонстрировать проблему, с которой вы столкнулись при выполнении домашнего задания по математике, или попросить помощи на следующем этапе сборки мебели.

А приложения, которые вы используете чаще всего, интегрированы в Gemini Live, поэтому они могут помочь вам совершать действия в разговорах и сообщениях, а также получать информацию из таких приложений, как Календарь Google.

Таким образом, вы можете отправлять текстовые сообщения своим соседям, делиться подробностями о бизнесе и проверять свой календарь одновременно прямо из Gemini Live, без необходимости открывать другое приложение.

Это немного круто, комбинация GPT4o + Apple.

Жаль, это всё равно торт.

С точки зрения ИИ, комбинация с аппаратным обеспечением весьма интересна. У Gemini Live как минимум нет будущего, и ее можно использовать уже сегодня.

Это всё равно намного лучше OpenAI, который умеет только тортики рисовать.

Я надеюсь, что Google станет лучше и лучше и убьет OpenAI.

Теперь, когда вы прочитали это, если вы считаете, что это хорошо, не стесняйтесь поставить лайк, посмотреть и трижды ретвитнуть. Если вы хотите получать уведомления как можно скорее, вы также можете поставить мне звездочку ⭐ ~Спасибо, что прочитали мою статью, увидимся в следующий раз.

>/ Автор: Kazik, Wenwen, Xiaorui, Dawn_E