Versi Google-nya lebih unggul! Panggil Gemini dengan satu klik, menumbangkan 5,2 miliar terminal di seluruh dunia

2024-08-14

Laporan Kebijaksanaan Baru

Editor: Departemen Editorial

[Pengantar Kebijaksanaan Baru]Versi Google Debutnya Sebelum OpenAI? Model suara Google Gemini Live akan segera tersedia di 3 miliar perangkat Android dan 2,2 miliar perangkat iOS di seluruh dunia. Meskipun demonstrasi langsung masih sedikit dibatalkan, Google bertekad untuk tidak menunggu lebih lama lagi, dan bertekad untuk mengalahkan OpenAI dan melawan Apple!

OpenAI, apakah baru saja diblokir?

Segera setelah “Her” OpenAI, Google juga secara resmi mengumumkan: merilis fungsi suara AI!

Baru saja dalam pidato utama "Made by Google", Google mengumumkan peluncuran Gemini Live, sebuah mode suara. Gemini Live akan segera tersedia di aplikasi seluler Gemini.

Perlombaan senjata antara Google dan OpenAI telah dimulai lagi.

Coba lihat OpenAI, "Her" yang melakukan terobosan tiga bulan lalu masih diam. Ini adalah ritme yang pasti akan disensor oleh Google.

Rick Osterloh, pemimpin Google yang hadir, juga berkata dengan penuh arti: "Kami telah mendengar terlalu banyak janji tentang AI dan slogan-slogan yang akan datang. Hari ini, yang ingin kami tunjukkan adalah kemajuan nyata!"

Selain itu, dalam presentasi ini, Google juga mendemonstrasikan secara detail bagaimana Gemini akan terintegrasi lebih dalam ke Android, aplikasi, dan perangkat Pixel baru.

Pada ponsel seri Pixel 9 yang dirilis sekaligus, Google juga menjajaki bentuk baru "ponsel AI+": bentuk produk AI sisi perangkat seperti apa yang akan dihasilkan melalui integrasi Gemini, Android, dan Pixel.

Kini, dengan Android yang didukung AI, bisakah Google mengalahkan Apple?

"Dia" Google juga ada di sini

Menurut Google, Gemini Live adalah pengalaman percakapan seluler yang baru.

Jika kita ingin bertukar pikiran tentang pekerjaan apa yang bisa kita temukan berdasarkan keterampilan dan pendidikan kita, Gemini bisa langsung berbicara dengan kita secara real time.

Perasaan ini seperti memiliki asisten yang penuh perhatian di saku Anda yang dapat mengobrol kapan saja.

Dan seperti OpenAI, fungsi suara Google juga memungkinkan pengguna berkomunikasi dengannya dalam bahasa percakapan alami, dan responsnya juga menggunakan suara dan ritme yang mirip manusia.

Silakan dengarkan audio di bawah ini. Beberapa suara pria dan wanita memiliki warna nada yang sangat natural.

Untuk memberikan kami pengalaman paling alami, Google telah meluncurkan 10 suara dalam satu tarikan napas, dan kami dapat memilih nada dan gaya favorit kami sesuka hati.

Selain itu, Gemini Live juga mendukung fungsi handsfree. Meskipun aplikasi Gemini berada di latar belakang atau ponsel terkunci, kita tetap dapat berbicara dengannya seperti pada panggilan telepon biasa.

Selain itu, kita dapat menyelanya dan mengubah topik kapan saja - sepertinya familier, bukan? Benar sekali, ia dapat melakukan segala hal yang dapat dilakukan oleh suara OpenAI.

Fungsi suara canggih OpenAI “Her”, yang mengejutkan semua orang pada bulan Mei, masih dalam tahap pengembangan. Pada akhir bulan lalu, fungsi tersebut hanya dibuka secara selektif untuk sejumlah kecil peserta tes Alpha.

Dalam hal kecepatan, Google jelas mengalahkan OpenAI.

Gemini Live sekarang tersedia di perangkat Android seharga $19,99 per bulan melalui aplikasi Google Gemini.

Versi bahasa Inggris saat ini terbuka, dan versi iOS serta dukungan untuk lebih banyak bahasa akan diluncurkan dalam beberapa minggu ke depan.

Di sisi lain, dari segi skala pengguna, mode suara canggih Google juga akan menjangkau calon pengguna yang lebih luas dibandingkan OpenAI.

Tahukah Anda, kini terdapat lebih dari 3 miliar pengguna Android dan 2,2 miliar pengguna iOS di dunia.

Salah satu alasan kegagalan fungsi suara OpenAI mungkin terkait dengan kinerja AI yang tidak normal dalam pengujian tim merah.

Apakah Google telah menyelesaikan masalah keamanan ini sepenuhnya? Belum ada yang tahu, tapi jelas bahwa Google, yang tidak ingin ketinggalan dari yang lain, memutuskan untuk melakukan yang terbaik kali ini.

Tapi itu terbalik dua kali

Satu-satunya kelemahan adalah ada beberapa gangguan selama demonstrasi langsung Gemini Live.

Ketika eksekutif Google Dave Citron memamerkan fitur baru Gemini untuk menghubungkan Google Kalender, Tasks, dan Keep di ponsel Android baru, dia tidak menyangka akan terjadi perubahan dua kali berturut-turut.

Dia pertama kali menggunakan ponselnya untuk mengambil gambar poster promosi peragaan busana Sabrina Carpenter di San Francisco, dan kemudian bertanya kepada Gemini, "Periksa jadwal saya untuk melihat apakah saya punya waktu luang untuk menghadiri peragaan busana Sabrina Carpenter."

Dalam balasan pertama Gemini, dia mengatakan ada yang tidak beres dan dia harus mencoba lagi.

Saat saya mencoba langkah tadi untuk kedua kalinya, Gemini masih belum mendapat balasan.

Baru pada ketiga kalinya (perangkat berbeda diganti) hasilnya akhirnya diberikan, dan penonton bersorak.

Mendefinisikan ulang Asisten AI

Dalam pidatonya, Google berkata: Dengan Gemini, mereka telah memikirkan kembali apa arti asisten pribadi agar benar-benar berguna bagi manusia—lebih alami, komunikatif, dan intuitif.

Hubungkan lebih banyak aplikasi

Apa kata kunci terpenting untuk asisten AI yang baik?

menghubungkan.

Gemini seperti ini, ia akan berintegrasi dengan semua aplikasi dan alat Google yang kita gunakan untuk menyelesaikan tugas besar dan kecil.

Dan tidak seperti asisten lainnya, kita tidak perlu menghabiskan waktu untuk berpindah antara aplikasi dan layanan.

Dalam beberapa minggu mendatang, Google juga akan meluncurkan ekstensi baru, termasuk Keep, Tasks, Utilities, dan YouTube Music.

Makanan apa yang ada di gambar? Tanyakan pada Gemini dan dia akan mencantumkan semuanya untuk Anda.

Misalkan sekarang kita ingin mengadakan pesta makan malam, Gemini bisa menggunakan berbagai ilmu bela diri yang dimilikinya——

Dari Gmail, ia dapat menemukan resep lasagna yang dikirimkan seseorang kepada kami, lalu menambahkan bahan-bahannya ke daftar belanja Keep, lalu meminta Gemini untuk menyusun daftar putar untuk kami yang “mengingatkan saya pada akhir tahun 90-an”.

Di ekstensi kalender Google yang akan datang, kita bisa langsung mengambil foto poster konser dan bertanya kepada Gemini: Apakah saya ada waktu luang hari itu? Jika jawabannya ya, kita juga bisa meminta Gemini membantu kita mengatur pengingat dan bersiap untuk mengambil tiket.

Mintalah Gemini untuk menulis email kepada profesornya untuk meminta cuti, dan meminta perpanjangan tenggat waktu beberapa hari lagi, hanya dengan berbicara.

Panggil Gemini dengan satu klik

Kini, Gemini telah terintegrasi penuh ke dalam pengalaman pengguna Android.

Hanya di Android kita dapat merasakan kesadaran konteks sehalus sutra.

Selama kita memegang ponsel Android, apa pun yang ingin kita lakukan, Gemini bisa muncul saat dibutuhkan.

Tekan dan tahan tombol daya, atau ucapkan "Hai Google" untuk memanggil Gemini!

Jika Anda menggunakan YouTube, Anda dapat mengajukan pertanyaan kepada Gemini tentang video.

Misalnya, kita membuat panduan untuk bepergian ke luar negeri dan baru saja menonton blog video perjalanan. Klik "Tanyakan tentang video ini" untuk mencantumkan semua restoran yang muncul di video dan menambahkannya ke Google Maps itu satu per satu.

Melihat gambar di bawah ini, gambar yang dihasilkan oleh Gemini bisa langsung di drag and drop ke Gmail dan Google Messages.

Saya yakin Anda telah menyadari keindahan dari operasi ini——

Karena Gemini telah membangun integrasi mendalam untuk Android, AI dapat melakukan lebih dari sekadar membaca konten layar dan berinteraksi dengan banyak aplikasi yang sudah kita gunakan.

Gemini 1.5 Flash, dilengkapi dengan asisten AI

Namun, ada dua masalah: LLM yang dapat menafsirkan bahasa alami dan memproses tugas dengan lebih baik sering kali berarti bahwa tugas sederhana pun memerlukan lebih banyak waktu.

Dan jika AI menunjukkan perilaku yang tidak terduga atau memberikan informasi yang tidak akurat, hal itu juga akan memusingkan.

Untuk tujuan ini, Google secara khusus memperkenalkan model baru - Gemini 1.5 Flash.

Responsnya lebih cepat dan kualitas jawabannya lebih tinggi.

Dalam beberapa bulan mendatang, Google juga akan mengintegrasikan model tersebut lebih dalam dengan Google Home, Telepon, dan Pesan.

Google mengatakan hari ini kita secara resmi telah mencapai titik perubahan di mana kegunaan asisten AI jauh melebihi tantangan mereka.

Berdasarkan Imagen 3, hasilkan gambar dalam 2 detik

Pada pertemuan tersebut, Google juga meluncurkan aplikasi penghasil foto AI baru-Pixel Studio.

Hanya diperlukan beberapa kata cepat untuk menghasilkan gambar yang indah.

Yang paling penting adalah ini adalah APP pembuatan gambar lokal, dibangun di atas Imagen 3, yang dapat menghasilkan berbagai gambar dalam waktu 2 detik.

Juga hari ini, laporan teknis Imagen 3 juga dirilis. Detail teknisnya dapat ditemukan di makalah setebal 32 halaman.

Alamat makalah: https://arxiv.org/pdf/2408.07009

Ponsel AI pertama berharga 20 dolar kripton per bulan

Semua kemampuan AI ini telah dibangun ke dalam perangkat keras ponsel terbaru oleh Google.

Pada acara tersebut, Google merilis total empat ponsel AI – Pixel 9, Pixel9 Pro, Pixel9 Pro XL, dan layar lipat generasi kedua Pixel 9 Pro Fold.

Yang tidak boleh Anda lewatkan pada seri Pixel 9 baru adalah kemampuan kamera bertenaga AI.

Google mengatakan bahwa algoritme pemrosesan gambar - HDR+pipeline, telah sepenuhnya dibangun kembali, memungkinkan foto yang diambil memiliki kontras, bayangan, eksposur, penajaman, warna, dll yang lebih baik.

Berikut kemampuan pengeditan gambar AI baru pada ponsel seri Pixel 9:

Tambahkan Saya

Apakah Anda sering menjumpai bahwa saat kumpul keluarga, team building, dan perjalanan keluarga, Anda mengambil tanggung jawab untuk mengambil foto, namun hanya Anda yang hilang dari foto tersebut?

Namun, Anda tidak perlu khawatir tentang hal itu di kemudian hari.

Fungsi "Tambahkan Saya" Google dapat menggantikan penyesalan Anda.

Pertama, foto grup perlu diambil. Kemudian, orang yang bertanggung jawab mengambil foto tersebut berinteraksi dengan orang yang ada di dalam foto tersebut dan mengambil foto termasuk “fotografernya”.

Saat ini Pixel menggunakan teknologi AR real-time untuk memandu orang kedua menyusun foto agar sesuai dengan komposisi foto pertama.

Terakhir, Pixel kemudian menggabungkan kedua gambar tersebut untuk memastikan semua orang muncul di foto yang sama, termasuk "fotografer".

Bayangkan kembali

Fungsi Reimagine lainnya mudah dimengerti.

Saat ini, kemampuan dalam Editor Ajaib memungkinkan Anda mendeskripsikan efek yang Anda inginkan langsung di kotak teks.

AI dapat mengubah ide Anda menjadi kenyataan.

Misalnya, Anda dapat memodifikasi latar belakang foto, gunung berapi, matahari terbenam, aurora, dan pemandangan lainnya, dan memainkannya sesuka Anda.

Bingkai Mobil

Komposisi otomatis merupakan fitur baru di Magic Editor yang dapat menyusun ulang foto yang sudah diambil.

Ia bahkan dapat memperbesar foto Anda dan menghasilkan latar belakang area kosong melalui AI.

Peningkatan Zoom

Zoom Enhance dapat secara otomatis mengisi celah antar piksel dan memprediksi detail secara akurat untuk mencapai efek pembesaran pemotretan berkualitas tinggi.

Realisasi kemampuan AI tidak terlepas dari chip bertenaga di balik seri Pixel 9.

Prosesor AI paling kuat: Google Tensor G4

Ponsel baru ini menggunakan prosesor Google Tensor G4 yang dirancang baru.

Google berkata, "Chip Tensor G4 adalah chip kami yang tercepat dan terkuat hingga saat ini."

Berdasarkan Tensor G3 tahun lalu, Google bekerja sama dengan Samsung untuk membuat prosesor semi-kustom Tensor G4 berdasarkan proses 4nm, menggunakan inti CPU dan GPU yang disediakan oleh Arm.

Pada saat yang sama, ia juga menggunakan modul milik Google untuk meningkatkan fungsi AI, fotografi, dan keamanan.

Dilaporkan bahwa dibandingkan dengan dua generasi sebelumnya, G4 mengalami peningkatan kecepatan penjelajahan web sebesar 20%, kecepatan startup APP sebesar 17%, dan konsumsi daya baterai aplikasi harian meningkat hingga 20%.

Dari segi CPU, G4 dibekali dengan 1 core Cortex-X4 yang berjalan pada 3,1GHz, 3 core Cortex-A720 yang berjalan pada 2,6GHz, dan 4 core Cortex-A520 yang berjalan pada 1,95GHz.

Sebagai perbandingan, Tensor G3 memiliki satu inti Cortex-X3 pada 2,91GHz, empat inti Cortex-A715 pada 2,37GHz, dan empat inti Cortex-A510 pada 1,70GHz.

Meskipun Tensor G4 memiliki satu inti lebih sedikit, semua inti mempunyai clock 200MHz hingga 300MHz lebih tinggi.

Menurut bocoran skor Geekbench, Tensor G4 mendapat skor 2.005 dalam pengujian single-core dan 4.835 dalam pengujian multi-core. Sebagai perbandingan, Tensor G3 memperoleh skor 1.751 pada pengujian single-core dan 4.208 pada pengujian multi-core. Ada perbedaan kinerja sebesar 14%.

Sedangkan untuk GPU, Tensor G4 menggunakan GPU ARM Mali-G715 yang sama dengan Tensor G3 tahun lalu, namun frekuensinya ditingkatkan dari 890MHz menjadi 940MHz. Artinya performa GPU Tensor G4 seharusnya sedikit lebih baik dibandingkan Tensor G3.

Mendukung fungsi AI baru

AI tentu saja merupakan salah satu kekuatan pendorong utama di balik proyek Tensor.

Tensor G4 didesain ulang untuk mengaktifkan fungsi Gemini dan fotografi komputasional terbaru.

Model Gemini Nano yang dapat dijalankan secara lokal (versi terbesar memiliki 3,5 miliar parameter) dapat mengeluarkan konten dengan kecepatan 45 token/s.

Meskipun TPU Google sudah cepat, namun tidak mengungguli pesaingnya dalam hal pemrosesan token.

Sebagai perbandingan, Qualcomm Snapdragon 8 Gen 3 dapat menghasilkan 15 token per detik ketika menjalankan 10 miliar parameter; MediaTek Dimensity 9300 dapat menjalankan 7 miliar parameter dengan 20 token per detik.

Namun, kemampuan AI unik seri Pixel 9 mungkin tidak sepenuhnya bergantung pada chip baru, tetapi merupakan hasil dari faktor lain.

AI juga memerlukan memori dalam jumlah besar dan memerlukan akses ke kumpulan memori yang cepat dan besar untuk menjalankan model yang lebih kompleks.

Pixel 9 hadir dengan RAM 12 GB, dan seri Pro ditingkatkan menjadi 16 GB.

Google mengatakan bahwa untuk mencapai pengalaman AI yang lebih lancar, ini adalah pertama kalinya mereka menyisihkan "sebagian RAM khusus untuk menjalankan Gemini di perangkat" untuk mencegah aplikasi lain menggunakan memori tersebut.

Namun, Google tidak mengungkapkan berapa banyak yang dialokasikan untuk tugas AI.

Meskipun chipnya sendiri tidak mengalami peningkatan besar dalam hal AI, chip tersebut mungkin masih menghadirkan pengalaman AI yang lebih baik dan fitur-fitur baru melalui optimalisasi manajemen RAM.

Referensi:

https://blog.google/products/gemini/made-by-google-gemini-ai-updates/

https://x.com/TechCrunch/status/1823410187404743131

https://venturebeat.com/ai/googles-ai-surprise-gemini-live-speaks-like-a-human-taking-on-chatgpt-advanced-voice-mode/

https://www.androidauthority.com/google-tensor-g4-explained-3466184/

berita

Versi Google-nya lebih unggul! Panggil Gemini dengan satu klik, menumbangkan 5,2 miliar terminal di seluruh dunia

Perkenalan

Informasi kontak saya