私の連絡先情報
郵便管理者@information.bz
2024-08-14
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
著者|ジェシカ
メール | [email protected]
今朝早く、Googleはシリコンバレーのマウンテンビューにある本社で「Made by Google 2024」カンファレンスを開催した。この年次イベントは例年通り10月に開催される予定だったが、アップルによる9月の新型iPhone発売を避けるため、事前に一般公開するために夏に変更されたと伝えられている。
噂どおり、Google の新世代 Android フラッグシップ スマートフォン Pixel 9、Pixel 9 Pro、Pixel 9 Pro XL、および折りたたみスクリーン バージョン Pixel 9 Pro Fold がすべてカンファレンスで発表され、Pixel Buds Pro 2 ワイヤレス ヘッドフォンと Pixel Watch 3 ウォッチも発表されました。
しかし、新しいハードウェア製品に加えて、Google のこだわりとゲームの最大の主役は依然としてユビキタス AI です。
公式プロモーションビデオでは、ジェミニが古い携帯電話で「別れの手紙」を書くように求められ、目を引く「Oh Hi, AI」が表示されます。
2 か月前、Apple は Apple Intelligence を正式に発表し、iPhone 16 シリーズは Apple AI に完全に適応して実行されるキーデバイスとして登場します。 「Qプロジェクト」から「ストロベリー」表現まで、OpenAIは毎日発煙弾を飛ばし、人々をパニックに陥れている。 Google は、これ以上待てないことを認識しています。新しくアップグレードされた Gemini アシスタントと十数個の新しい AI 機能を Android 上でリリースしており、それらは将来ではなくすぐに利用できるようになります。
Google のプラットフォームおよびデバイス チームを率いる Rick Osterloh 氏は、スピーチの冒頭で敵対者を陰謀しているようでした。
「AI に関しては非常に多くの期待があり、また多くの「近日登場」というスローガンがあります。今日、私たちは実際の進歩を示しており、新しい Pixel 製品、Android 機能、AI エクスペリエンス、そして Gemini の大量のライブ デモをご覧いただけます。その中心にあるのは、私たちは完全にジェミニの時代です。」
1
Gemini の新しいアップグレード: より多くのアプリケーションと対話できるようになり、Gemini Live でついに「彼女」を体験できるようになりました
Google のデバイス側 AI は、軽量マルチモーダル モデル Gemini Nano によって駆動され、より柔軟な Gemini 1.5 Flash が導入されました。現在 45 の言語をサポートし、200 以上の国と地域をカバーし、数百の携帯電話モデルで実行できます。ユーザーは写真、ビデオ、または音声コマンドを通じてそれをトリガーし、タスクを実行できます。
スマート アシスタント Gemini は、カレンダー、タスク、Google Keep、YouTube Music などのアプリケーションとリンクできるようになりました。
たとえば、サブリナ カーペンターのコンサート ポスターを偶然見た場合、Gemini を開いて写真を撮り、「彼女が今年サンフランシスコに来るとき、空いていますか?」と尋ねることができます。ジェミニは写真から関連情報を抽出し、カレンダーに接続して答えを提供します。
ここで興味深いエピソードがあります。この例を見せたとき、スタッフは 2 回連続で失敗し、ジェミニは 3 回目の質問で成功しました。しかし、それはすべてがその場での本当のテストであり、カンニングではないことを証明しているだけです。最後にジェミニが息も絶え絶えの集中力で答えると、会場からは拍手が沸き起こった。弟も安堵のため息をつき、「デモスの神に感謝します」と言いました。
ジェミニは画面に何が表示されているかを理解することもできます。食べ物屋のvlogにヨダレを垂らしているときに、Geminiに「動画内でブロガーが食べた食べ物のリストを作成する」ように直接指示すると、YouTube動画に接続して字幕から必要な情報を取得することができます。次回も同様にチェックインします。
この例としては、定期的なリマインダーを「タスク」に同期するように設定する、音楽プレイリストを作成する、パーソナライズされたメールを作成して Gmail を使用して送信するなど、数多くあります。 Gemini がより日常的なアプリケーション間で作業を調整することで、ユーザーの生産効率と生活効率がさらに向上しました。
これらのエクスペリエンスをよりスムーズかつスマートにするのは、Google が正式に開始した新しい音声機能である Gemini Live です。
正面からの GPT-4o 音声プレーヤーとして、Gemini Live を使用すると、ユーザーは Gemini と最も自然なリアルタイム インタラクションを行うことができます。模擬面接の同行、スピーキングの練習、ブレインストーミングからあらゆるコミュニケーションのニーズまで、Gemini Live は現実のチャット体験を提供できます。会話中はいつでも一時停止、中断、話題の変更が可能で、好みに応じて性別や性格の異なる 10 種類の声から選択できます。
さらに興味深いのは、今回は Google が OpenAI よりもはるかに成功していることです。
GPT-4o がまだ隠蔽され、少数のユーザーのみがベータ版を試せるようになったとき、Google は寛大にも次のように発表しました。今日から、Gemini Live の英語版 Android へのアクセスはすべての有料ユーザーに公開されます。今後数週間で iOS およびその他の言語に拡張されます。
言わないで、言わないで!
1
10 を超える AI アップデート: 自動通話概要、スクリーンショット検索、画像編集、リアルタイム翻訳...
Google は、Gemini モデルを中核として、Pixel デバイス向けのユニークで実用的な AI 機能を多数更新しました。
1. 天気アプリケーションの新バージョン: 人工知能技術を使用して天気予報の精度を向上させます。降雨の開始時刻と終了時刻を正確に予測し、パーソナライズされた天気予報を生成できるため、データを 1 つずつ確認する手間が省けます。
2. 通話メモ: この新しく開始された「通話メモ」機能は、通話終了後に会話のプライベートな概要と詳細な記録を自動的に生成します。時間や住所などの重要な情報を記録する必要があるが、手元にペンと紙がない場合は、通話メモを開くだけですべてのテキスト記録が通話記録に保存されます。 (プライバシーを保護するために、この機能は完全にローカル デバイス上で実行され、オンになると通話の双方に通知されます。)
3. ピクセル スクリーンショット: 誰もが情報を保存するために携帯電話でスクリーンショットを撮ることに慣れていますが、必要なときに何百、何千ものスクリーンショットに戻って検索することも困難です。この新しいアプリにより、情報のスクリーンショットの保存、整理、検索が簡単になります。これからチェックインしようとしている B&B のアクセス コードのスクリーンショットを持っているが、到着時には思い出せなかったとします。 Pixel Screenshots を開いて尋ねるだけで、対応するスクリーンショットをすぐに見つけて、画像内のテキスト情報を抽出できます。
4. Pixel Studio: Tensor G4 チップ上で実行されるローカル拡散モデルとクラウド Imagen 3 テキストから画像へのモデルによって駆動される、新しい AI マッピング アプリケーション。自然言語プロンプトを通じて、クリエイティブの生成、スタイル調整、個人用ステッカーなどの機能を実行できます。
Pixel スマートフォンには、写真とビデオ用に AI を活用した 2 つの素晴らしい新機能も追加されました。
1. 私を追加: この「私を追加」機能は非常に興味深いです。名前が示すように、写真にあなたを含めることができます。デモ会場のスタッフ2名がNBAスターのジミー・バトラーを招待し、カメラの電源を入れてAdd Meモードにスライドさせました。まずスタッフAがジミーと写真を撮り、次に拡張現実オーバーレイの指導の下、スタッフBが撮影しました。写真を撮るために向きを変えます。その結果、追加のカメラマンを必要とせずに、3 人の鮮明な全身写真が得られます。
2. Magic Editor: 生成 AI テクノロジーを使用して、ユーザーは Magic Editor で写真を再考して編集できます。たとえば、フレームを拡大したり、オブジェクトを移動したり、背景を変更したり、小さな領域を丸で囲んで「熱気球を追加」することもできます。
さらに、とてもキュートな Made You Look 機能: 小さな人形と一緒に写真を撮るのがいかに難しいかを親はみんな知っているので、Pixel 9 折りたたみマシンには新しい「Make You Laugh」オプションがあり、外部デバイスで興味深いアニメーション クリップを再生できるようになります。画面に表示され、子供の注目を集めます。
Google はカメラ レンズに引き続き重点を置き、特別なニーズを持つ人々やシナリオ向けに 4 つの AI の改善を行いました。
1. ガイド付きフレーム: 視覚障害のある人や弱視の人向けに特別に設計されており、ユーザーは音声ガイダンスを通じて優れた写真や自撮り写真を撮ることができます。最新のアップデートでは、オブジェクト認識、集合写真でのインテリジェントな顔フィルタリング、複雑なシーンでのフォーカス機能が向上しており、カメラ設定から直接有効にすることができます。
2. 拡大鏡: これは、AI を使用して視覚障害のあるユーザーが周囲の世界を拡大できるようにする Pixel スマートフォン専用のアプリです。新機能には、環境内で特定の単語を検索すること、ピクチャー・イン・ピクチャー・モードを使用してシーンの詳細を確認すること、ズームインする最適なレンズを選択すること、セルフィー照明を鏡として使用できることなどが含まれます。
拡大鏡を使用してメニューや空港案内標識を確認する
3. リアルタイム文字起こしデュアルスクリーン モード: 折りたたみ式携帯電話向けに特別に導入されたデュアル スクリーン モードでは、ユーザーは携帯電話をデスクトップの姿勢で置くことができ、複数の人が同時に会話のリアルタイム文字起こしを表示できます。これは、会議や夕食時の会話に非常に役立ちます。
4. リアルタイム字幕翻訳:多言語サポート、韓国語や中国語を含む7つの新しい言語翻訳が追加され、インターネット接続がなくても使用できるリアルタイム字幕とリアルタイム文字起こしの可用性が拡大しました。
さらに、Pixel スマート ウォッチには、睡眠を自動的に検出してスリープ モードを有効にし、ユーザーのランニング計画を支援し、ランニングの進捗状況を反映し、毎日のランニングの提案を提供する新機能が追加されました。また、Pixel Watch 3 センサー、AI、信号処理アルゴリズムを組み合わせて、心停止、呼吸不全、薬物の過剰摂取などによって引き起こされる脈拍消失イベントを検出する AI 脈拍検出の先駆者でもあります。
最後に、Google は進行中で近い将来リリースされる予定のいくつかのプロジェクトも明らかにしました。
1 つは、以前 I/O カンファレンスで紹介された Project Astra で、カメラを使用して周囲の環境を表示し、Gemini と対話します。その実用的なアプリケーションは、まず Gemini Live に実装され、よりエージェントのような万能 AI アシスタントになります。
もう一つはジェミニリサーチです。この機能は、複数段階の研究計画を作成し、インターネットからの複雑な情報を統合し、適切に構造化された研究レポートを自動的に生成することにより、人々がより高度な推論、計画、記憶を実行できるように設計されています。数か月以内に上級ユーザーに展開される予定で、研究効率が大幅に向上し、時間とエネルギーが節約されます。
1
4 台の Pixel 9 スマートフォン、Buds Pro 2 ヘッドフォン、スマート ウォッチ、Google が家族全員向けの AI ハードウェアを収集
アップグレードされた Gemini アシスタントやさまざまな新しい AI アプリケーションを含む、上記のすべての AI 機能は、消費者向けに Google が発売する新しい AI ハードウェア製品に統合されます。
機能と価格の全範囲を以下にまとめます。
Pixel 9 シリーズの携帯電話
Google は、Pixel 9、Pixel 9 Pro、Pixel 9 Pro XL、Pixel 9 Pro Fold の 4 つの Pixel 9 シリーズ スマートフォンをリリースしました。どちらも最新の Google Tensor G4 チップを搭載しており、さまざまな AI パフォーマンスの強化をサポートしています。
写真提供者: Sam Rutherford/Engadget
• Pixel 9: 6.3 インチ Actua ディスプレイ、12GB RAM、背面に 50MP メインカメラと 48MP ウルトラワイドカメラ、10.5MP 前面カメラ。価格は799ドルからで、オブシディアンブラック、ポーセレンホワイト、ヒイラギグリーン、ピオニーピンクの4色が用意されている。
• Pixel 9 Pro: 6.3 インチ Super Actua ディスプレイ、16 GB のメモリ、42MP 前面カメラ、3 つの背面カメラ (50MP メインカメラ、48MP 超広角カメラ、48MP 望遠カメラ)。価格は999ドルからで、オブシディアンブラック、ポーセレンホワイト、ヘーゼルナッツ、ローズからお選びいただけます。
• Pixel 9 Pro XL: 6.8 インチ Super Actua ディスプレイを搭載し、価格は 1,099 ドルからで、Pro と同じメモリ、デザイン構成、色のオプションを備えています。
• Pixel 9 Pro Fold: Google の携帯電話史上最大のディスプレイと最薄の折りたたみ式携帯電話。 16 GB のメモリ。昨年の Pixel Fold カメラ構成と同様。価格は1,799ドルから。
4 つの携帯電話はすべて、最長 7 年間のオペレーティング システムとセキュリティのアップデートを提供し、耐久性とユーザー エクスペリエンスを向上させます。
Pixel Buds Pro 2 ワイヤレス ヘッドフォン
Google は、音質と接続性が向上した新世代のワイヤレス ヘッドフォンを発売しました。Pixel Buds Pro 2 を装着しているユーザーは、携帯電話なしで Gemini と会話できます。
Pixel Watch 3 スマートウォッチ
2 つのサイズ(41 mm と 45 mm)があり、画面はより大きく、Nest カメラやドアベルのビデオ ストリーミング、Google TV リモコン機能、オフライン Google マップなど、より多くの Google エコシステム機能が統合されています。この時計は AI による運動提案も提供し、バッテリー寿命は最大 24 時間で、省電力モードをオンにすると 36 時間まで延長できます。
全体として、Google のリリースは非常に誠実なものです。
すでに数日前、公式ツイッターはネットユーザーの期待に応えて「もう隠したくない!」と述べた。
本日、当社は新しい Pixel 9 シリーズ ハードウェア製品を発表するだけでなく、さらに重要なことに、当社独自の生成 AI テクノロジーの実用化を実証します。よりスマートな Gemini アシスタントから、日常の利便性を向上させるさまざまな AI 機能に至るまで、Google は明らかに、一部の「将来のプレイヤー」を行動で叩きのめしたいと考えています。AI は単なるスローガンではなく、生活のあらゆる側面に浸透し、ユーザーが真に便利な機能を提供できるようにする必要があります。より効率的でスマートな体験をお楽しみください。
Apple の秋のカンファレンス前に発表することで、自社のニュース サイクルが増えるだけでなく、Gemini Assistant の改善に向けた時間枠も広がります。それが将来どのように機能するかは、市場に投入された後のユーザーのフィードバックに依存します。
最近の OpenAI の頭脳流出と評判の低下により、Google は Android 市場全体での存在感を強化し、Apple と真っ向から戦う準備ができているのかもしれません。