berita

Versi Google Nya terbalik: Butuh 3 kali percobaan dan mengganti ponsel sebelum berhasil... Netizen: Hanya butuh 10 detik bagi saya untuk melakukannya secara manual

2024-08-14

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Jin Lei berasal dari Kuil Aofei
Qubit |. Akun publik QbitAI

Terguling, terguling besar.

Baru saja pagi ini, versi Google dari Her—Gemini HidupResmi dirilis.

Bagaimanapun, ini jelas merupakan benchmark untuk GPT-4o OpenAI, yang bisa dikatakan telah menarik perhatian kalangan teknologi.

Dalam demo yang dirilis di situs resminya,Tanya Jawab FotoEfek dari fungsinya adalah ini:



Fungsi umum yang diterapkannya adalah menggunakan ponsel Anda untuk mengambil foto poster konser, dan membiarkan Gemini memeriksa kalender pengguna untuk melihat apakah jadwalnya sesuai untuk partisipasi.

Dan Anda juga dapat melakukan serangkaian operasi selanjutnya berdasarkan ini, termasuk memeriksa tarif pada waktu tertentu, dll.

Namun... ketika sampai pada sesi demonstrasi konferensi pers di tempat, gaya lukisannya berubah total.

Silakan tonton VCR:



Alamat video: https://mp.weixin.qq.com/s/90pixdMaLew4lUjzjeA6jA

  • Pertama kali: gagal.
  • Kedua kalinya: gagal.
  • Ketiga kalinya: Saya mengganti telepon saya dan berhasil.

Hmm... Ekspresi adik laki-laki itu agak panik jika dilihat dengan mata telanjang.



Bahkan media teknologi ternama TechCrunch telah menyertakan emoji berikut:



Beberapa netizen bahkan mengaktifkan mode komentar panas:

Saya dapat mencari kalender saya dalam 10 detik.



Tentu saja, ini hanyalah episode kecil dari Made by Google hari ini.

Untuk informasi lebih lanjut mengenai Gemini Live, yuk lanjutkan membaca di bawah ini.

Gambaran lengkap Her versi Google

Seperti yang baru saja kami sebutkan, fungsi Gemini Live dan GPT-4o sangat mirip.

Selain "foto Q&A", ia juga dapat melakukan percakapan real-time dan bahkan mengganggu Gemini selama proses balasan.

Dapat dipahami bahwa fungsi Gemini Live saat ini terbuka untuk pelanggan Tingkat Lanjut di sistem Android (hanya dalam bahasa Inggris).

Dalam beberapa minggu mendatang, fitur ini akan diperluas ke lebih banyak bahasa dan tersedia untuk iOS.

adasuara dialogDi sisi lain, Gemini Live telah diluncurkan10 jenisSuara baru tersedia untuk dipilih, dan efeknya adalah sebagai berikut:



Alamat video: https://mp.weixin.qq.com/s/90pixdMaLew4lUjzjeA6jA

adaberoperasiDi sisi lain, karena Gemini terintegrasi penuh ke dalam sistem, Gemini dapat dipanggil hanya dengan menekan dan menahan tombol daya atau mengucapkan "Hai Google".

Misalnya saat menulis email, biarkan Gemini membantu Anda menghasilkan gambar yang cocok.



Namun, media asing memberikan ulasan beragam mengenai fitur ini.

Misalnya, seorang penulis dari The Verge menulisTes pribadiJudul yang diberikan nanti adalah—

Gemini Live lebih cepat dari Google, tetapi lebih canggung.



Alasan spesifiknya adalah sistem audio mobil penulis tiba-tiba mati selama perjalanan tiga hari.

Menemukan solusi menggunakan Google Assistant asli membutuhkan waktu setidaknya lima menit, namun Gemini Live hanya membutuhkan waktu 15 detik.

Namun ucapan Gemini Live yang terus menerus selama percakapan dan metode interaksi yang mengharuskan pengguna untuk menyela secara aktif membuat penulis merasa malu.

Dia percaya:

Suara dan cara bicaranya sangat manusiawi sehingga saya merasa tidak nyaman menyelanya.
Ada lebih banyak emosi yang diinvestasikan dalam berinteraksi dengan Gemini Live daripada menggunakannya sebagai alat pemecahan masalah.

Secara kebetulan, untuk Gemini Tinggal diJalankan di cloudThe Wall Street Journal juga memberikan penilaian tajam mengenai hal ini——

Kemajuan dalam dialog, kemunduran dalam fungsionalitas.



Khusus pada level teknis, GPT-4o merupakan sistem end-to-end, namun dilihat dari konten yang dirilis Google, Gemini Live tidak demikian.

Sebaliknya, sistem STT, VAD, LLM dan TTS terintegrasi:



Selain itu, Gemini Live juga muncul di ponsel seri Pixel baru yang dirilis Google.

Termasuk Pixel 9 Pro Fold, Pixel 9, Pixel 9 Pro, dan Pixel 9 Pro XL.



Dalam hal fungsi AI, ponsel Pixel Google telah menambahkan fitur yang disebut“Tambahkan Saya”fungsi.

Teknologi augmented reality (AR) dan AI dapat digunakan untuk "mengisi" karakter dalam dua foto berbeda secara bersamaan.



Mengapa Google tidak bisa mengejar OpenAI?

Meskipun peluncuran Gemini Live oleh Google kali ini merupakan respons terhadap OpenAI GPT-4o, sejak era model besar dimulai, kita dapat melihat tren yang sangat jelas——

Google tidak dapat mengimbangi OpenAI.

Pertama, OpenAI menjadi pionir pada titik paling kritis dari rilis ChatGPT, tetapi Google kemudian merilis Bard, yang kali ini sangat mirip dengan Gemini Live, dan kemudian dibatalkan.

Dalam satu setengah tahun terakhir, tampaknya OpenAI memimpin peluncuran semua model dan aplikasi utama.

Di sisi lain, di Google, tidak hanya teknologinya yang menunjukkan kecepatan yang lambat; bahkan dalam hal opini publik, OpenAI telah membayangi acara tahunan terbesar Google (konferensi I/O) dengan berita pergantian personel (pengunduran diri Ilya).

Lalu mengapa Google gagal di era model besar?

Dalam hal ini,Mantan CEO GoogleEric Schmidt (yang menjabat dari tahun 2001 hingga 2011) mengungkapkan pandangannya dalam pidato terbarunya di Stanford:

Google sangat mementingkan keseimbangan kehidupan kerja, seperti mengizinkan karyawan bekerja dari rumah.
Namun di startup, mereka bekerja sangat keras.



Alamat video: https://mp.weixin.qq.com/s/90pixdMaLew4lUjzjeA6jA

Beberapa netizen bahkan menyampaikan kabar tersebut:

Kakak saya adalah programmer AI terkemuka di Google. Dia memiliki 3 pekerjaan penuh waktu dan hanya menghabiskan 2 jam sehari di Google.



Jadi bagaimana pendapat Anda tentang hal ini, silakan tinggalkan pesan di kolom komentar untuk berdiskusi.

Tautan referensi:
[1]https://x.com/techcrunch/status/1823410187404743131?s=46&t=6eepxw1G6XRQ7VO0ANjJWg
[2]https://x.com/GoogleDeepMind/status/1823409674739437915
[3]https://blog.google/products/gemini/dibuat-oleh-google-gemini-ai-pembaruan/
[4]https://x.com/alexkehr/status/1823480786349383879?s=46&t=6eepxw1G6XRQ7VO0ANjJWg
[5]https://www.theverge.com/2024/8/13/24219736/gemini-live-hands-on-pixel-event
[6]https://blog.google/products/pixel/google-pixel-9-fitur-ai-baru/#pixel9phones