ini hidup kembali! versi openai yang disempurnakan, "her", secara resmi dibuka, melampaui peningkatan "tingkat produksi" gemini...

ini hidup kembali! versi openai yang disempurnakan "her" secara resmi dibuka, melampaui peningkatan "tingkat produksi" gemini...

2024-09-25

penulis｜jessica

hari ini benar-benar hari yang meriah di lingkaran ai yang sudah lama tidak terlihat!

saya sempat bingung dengan esai ai yang diposting ultraman kemarin, dan kini niat operasinya sudah jelas.

ultraman ingin menyerang musuh lamanya google. lebih tepatnya, dua model gemini yang baru saja diperbarui google hari ini: gemini-1.5-pro-002 dan gemini-1.5-flash-002.

metode snipingnya sederhana dan kasar: umumkan secara langsung bahwa fungsi suara gpt yang sangat dinantikan akan dibuka secara resmi hari ini.

dalam waktu kurang dari dua jam, google direnggut dari momen penting yang diperoleh dengan susah payah oleh google. jika saya jadi google, saya akan sangat marah.

suara tingkat lanjut gpt hadir, berbicara lebih dari 50 bahasa

openai mengatakan mode suara lanjutan chatgpt akan diluncurkan secara bertahap ke semua pengguna plus dan tim minggu ini.

sementara orang-orang menunggu dengan sabar, tim telah meningkatkan beberapa fitur, termasuk menambahkan perintah khusus, fungsi memori, 5 suara baru, dan aksen yang ditingkatkan.

karena sudah terlalu lama dibicarakan, openai membuat pernyataan khusus: "ia dapat mengatakan 'maaf, saya terlambat' dalam lebih dari 50 bahasa."

dan berikan contoh peralihan dari bahasa inggris ke bahasa mandarin: "nenek, maaf, saya terlambat. saya tidak bermaksud membuat nenek menunggu terlalu lama, bagaimana saya bisa memberikan kompensasi kepada nenek?"

——orang baik, sekarang kamu telah menjadi nenek gpt, memaksaku untuk memaafkanmu.

seperti yang dapat dilihat dalam video, mode ucapan kini diwakili oleh bola biru yang berdenyut, bukan titik animasi hitam yang digunakan openai saat mendemonstrasikan teknologi tersebut pada bulan mei.

ketika akses diberikan, sebuah prompt akan muncul di dalam aplikasi. ini akan dibuka untuk pengguna level plus dan teams terlebih dahulu, dan akan diperluas ke pengguna perusahaan dan pendidikan mulai minggu depan.

chatgpt juga menambahkan lima suara baru untuk pengalaman: arbor, maple, sol, spruce, dan vale. saat ini, ditambah breeze, juniper, cove, dan ember sebelumnya, jumlah total suara chatgpt telah mencapai 9 (jumlah suara gemini live google adalah 10).

anda mungkin juga memperhatikan bahwa nama-nama ini semuanya terinspirasi oleh alam, dari "pohon maple" dan "angin sepoi-sepoi" hingga "matahari" dan "lembah", mungkin untuk membuat penggunaannya terasa lebih alami. salah satu suara yang absen adalah sky, suara yang dipamerkan openai pada peluncuran musim semi namun ditarik karena perselisihan hukum dengan scarlett johansson, bintang film "her."

openai juga telah memperluas beberapa fitur penyesuaian chatgpt ke mode suara tingkat lanjut, termasuk fitur "perintah khusus" yang memungkinkan pengguna mempersonalisasi tanggapan, dan fitur memori yang memungkinkan chatgpt mengingat percakapan untuk referensi di masa mendatang.

misalnya, dalam video di bawah ini, di menu khusus chatgpt pada pengaturan sistem, masukkan "nama saya charlotte, dan saya tinggal di san francisco bay area". saat ditanya tentang aktivitas luar ruangan akhir pekan, gpt akan memanggil pengguna charlotte, memberikan rekomendasi yang sesuai dengan cuaca dan lalu lintas setempat.

openai mengatakan tim telah meningkatkan kecepatan respons, kelancaran, dan aksen dalam beberapa bahasa asing. suaranya menyesuaikan dengan nada percakapan, dan anda dapat membuat adegan yang mendorongnya untuk mengambil peran berbeda. penundaan suara sangat rendah dan pemahaman lebih kuat. benar-benar terasa seperti melakukan percakapan alami dengan orang lain.

namun, fungsi berbagi video dan layar yang didemonstrasikan openai empat bulan lalu belum diperbarui kali ini. saat itu, staf menanyakan gpt tentang soal matematika di kertas dan kode di layar komputer, dan memperoleh jawaban real-time melalui dialog suara alami. saat ini openai belum memberikan jadwal peluncuran fitur multimodal ini.

selain itu, mode suara lanjutan untuk sementara tidak terbuka untuk uni eropa, inggris, swiss, islandia, norwegia, liechtenstein, dan wilayah lainnya.

meski begitu, akhirnya bisa mencoba versi openai "nya" memang merupakan hal yang menarik bagi orang-orang yang sudah bosan dengan lingkaran ai. ditambah dengan pratinjau o1 yang baru saja menciptakan gelombang kegilaan, openai telah dengan kuat mengendalikan industri ini selama seminggu lagi.

kegembiraan ini juga menyebabkan semua orang menderita amnesia intermiten:

ngomong-ngomong, apa yang diposting google hari ini?

gemini 1.5 meningkatkan dua model baru, harga dikurangi setengahnya dan kecepatan ditingkatkan

pembaruan google kali ini sebenarnya sangat penting, setidaknya bagi para pengembang.

menurut google blog, kali ini mereka telah memperbarui dua model gemini tingkat produksi: gemini-1.5-pro-002 dan gemini-1.5-flash-002. yang disebut "tingkat produksi" berarti model ai telah sepenuhnya dikembangkan, diuji, dan dioptimalkan, serta siap untuk penerapan komersial. model tersebut dapat menangani sejumlah besar permintaan pengguna dan diterapkan pada layanan produk, tidak hanya untuk eksperimen atau penelitian.

sebagai peningkatan besar pada model seri gemini 1.5 yang diluncurkan pada konferensi i/o pada bulan mei tahun ini, model baru ini lebih cepat, lebih bertenaga, dan lebih hemat biaya.

sorotan utama dirangkum sebagai:

1. pengurangan harga yang signifikan: harga input dan output 1.5 pro telah turun sekitar 50%, secara signifikan mengurangi biaya pembuatan, terutama untuk tip yang lebih kecil dari token 128 ribu.

2. peningkatan kualitas secara keseluruhan: terutama peningkatan kinerja dalam matematika, pembuatan kode, konteks teks panjang, dan tugas visual sangat signifikan, termasuk peningkatan sekitar 20% dalam tes benchmark seperti math dan hiddenmath, dan peningkatan sebesar 2%-7% dalam aplikasi visual dan kode.

3. peningkatan batas kecepatan: batas kecepatan 1,5 flash dan 1,5 pro telah ditingkatkan dari 1000rpm (permintaan per menit) dan 360rpm masing-masing menjadi 2000 rpm dan 1000 rpm, sehingga memungkinkan pengembang untuk membangun dan memproses tugas lebih cepat.

4. output lebih cepat dan latensi lebih rendah: kecepatan output ditingkatkan 2 kali lipat dan latensi dikurangi 3 kali lipat, memberikan dukungan untuk skenario aplikasi yang lebih efisien.

5. respons yang lebih ringkas: gaya respons lebih ringkas, lebih murah, dan panjang keluaran dipersingkat 5% -20%. hal ini juga mengurangi jumlah penolakan dan penghindaran pada banyak topik dan mempertahankan kegunaan yang tinggi.

6. dukungan multi-modal dan konteks panjang: jendela konteks panjang 2 juta token 1.5 pro mendukung pemrosesan teks panjang dan tugas multi-modal, seperti pembuatan konten pdf 1.000 halaman atau video panjang.

7. pengaturan pemfilteran yang diperbarui: filter keamanan default model tidak lagi diterapkan secara otomatis, dan pengembang dapat menyesuaikan pengaturan keamanan model sesuai kebutuhan.

pengembang dapat mengakses dua model terbaru secara gratis melalui google ai studio dan gemini api. model baru ini juga tersedia di vertex ai untuk organisasi besar dan pelanggan google cloud.

gemini diselimuti bayang-bayang gpt

namun, dibandingkan dengan rekan-rekannya, banyak pengguna biasa yang menyatakan kekecewaannya terhadap langkah google, dan merasa bahwa ini bukanlah "rilis" yang sebenarnya.

ceo abacus.ai dan blogger terkenal bindu reddy berkata, "sayangnya, openai merilis o1 yang lulus tes iq, sementara google baru saja melakukan beberapa pembaruan kecil pada gemini 1.5. mereka memiliki sumber daya 100 kali lipat, bakat 10 kali lipat, dan 10 kali lipat kali dari semua hal, bagaimana ini bisa terjadi?”

meski beberapa pengembang masih berbicara mewakili google, misalnya, seorang netizen di forum diskusi reddit mengatakan:

“ini adalah hal yang berguna bagi orang-orang yang benar-benar membangun aplikasi dan mencoba mengurangi biaya serta meningkatkan keuntungan. aplikasi yang saya kerjakan memiliki biaya tetap per operasi, ditentukan oleh panjang token, yang membuat keuntungan saya sekitar 30% lebih banyak perbaikan. ini mungkin tidak berarti banyak bagi kebanyakan orang. saya tahu banyak orang akan marah dengan "pengumuman" dari google ini - namun sebenarnya ini adalah pembaruan yang bagus untuk para pengembang."

harganya dipotong setengahnya, kecepatannya ditingkatkan, dan penundaannya dikurangi. ini memang yang diinginkan pengembang. namun seperti yang dikatakan semua orang, daya tariknya mungkin terbatas pada komunitas pengembang.

bahkan beberapa pengembang mencemooh: "saya tidak melihat perbandingannya dengan claude atau o1, dan kami akan meluncurkan model openai dan anthropic generasi berikutnya. deepmind sebenarnya memiliki model yang jauh lebih unggul, tetapi mereka akan langsung menuju lini perusahaan, melewati volkswagen. apakah gemini mengesankan? tidak sama sekali, hanya mengecewakan.”

penamaan model yang buruk oleh google juga diejek oleh netizen, yang menganggapnya panjang dan membingungkan.

the information baru-baru ini menerbitkan artikel berjudul "mengapa pengembang ai melewatkan gemini google". melalui wawancara dengan beberapa pendiri perusahaan ai dan karyawan internal google, laporan ini menceritakan kisah tentang bagaimana gemini "ditinggalkan" oleh pengembang serta hambatan dan kesulitan yang dihadapi dalam mengejar chatgpt.

misalnya, dibandingkan dengan teknologi pesaing, panggilan gemini terlalu rumit bagi pengembang dan perusahaan. pendiri topologi aidan mclaughlin mengatakan pertama kali menggunakan api openai hanya membutuhkan waktu 30 detik, sedangkan menggunakan gemini membutuhkan waktu 4 jam. pada saat yang sama, kinerja model google yang besar berada di belakang openai dan anthropic, dan mengatasi hambatan ini tidak layak dilakukan.

dibandingkan chatgpt, ketidakpopuleran gemini di kalangan developer sepertinya sudah menjadi rahasia umum di dunia nyata.

survei pada bulan juni terhadap lebih dari 750 karyawan teknologi yang dilakukan oleh startup perangkat lunak perusahaan retool menemukan bahwa hanya 2,6% responden mengatakan mereka paling sering menggunakan gemini untuk membuat aplikasi ai, dan lebih dari 76% memilih menggunakan gpt.

data lalu lintas situs web yang dilacak oleh sameweb menunjukkan bahwa antara bulan juni dan agustus, halaman pengembang aplikasi openai menerima 82,8 juta tampilan halaman, sedangkan tampilan halaman google sebanyak 8,4 juta kali.

survei informal yang lebih kecil memberikan bukti serupa. akhir bulan lalu, pendiri finetune julian saks bertanya kepada 50 pengembang startup ai di coworking space miliknya di san francisco mengenai model ai percakapan apa yang paling sering mereka gunakan. hampir semua orang mengatakan bahwa mereka kebanyakan menggunakan model dari anthropic atau openai, dan tidak ada yang menyebut gemini.

meskipun model gemini berguna ketika menganalisis dokumen panjang atau basis kode yang panjang, banyak pengembang mengatakan bahwa pilihan model google beragam, langkah-langkahnya rumit, dan sistem pengembang berbeda dari openai dan lebih sulit digunakan. dan terkadang, berbagai layanan google bersaing satu sama lain dalam hasil penelusurannya sendiri, sehingga memudahkan orang terjebak saat mencoba mencari tahu alatnya.

gemini sering diejek karena alasan ini. brendan dolan-gavitt, seorang peneliti ai di startup keamanan xbow, menjadi viral awal bulan ini ketika dia memposting tweet yang merinci berbagai langkah yang dia ambil untuk memulai gemini melalui vertex. pengembang lain turun ke bagian komentar untuk mengungkapkan simpati mereka.

dalam lingkungan di mana "insinyur terkemuka dunia menggunakan openai, claude, atau cursor", pengembang sebenarnya tidak perlu mencoba hal lain. di sisi lain, penurunan penggunaan tidak memungkinkan gemini memperoleh masukan data sebanyak chatgpt, menyebabkan google menghadapi peta jalan yang lebih ambigu dalam meningkatkan model.

kekecewaan karena orang berharap banyak dari google

google mencoba mengubah persepsi ini, termasuk dengan menanggapi kritik terhadap gemini on x, membawa lebih banyak pakar teknis terkemuka dari perusahaan seperti openai, dan menggabungkan beberapa fungsi pengembangan yang tumpang tindih. mereka juga mempromosikan gemini dengan mengadakan acara pengembang.

hari ini, bersamaan dengan peluncuran gemini-1.5-pro-002, ada juga acara online untuk gemini for work. google menghabiskan banyak ruang untuk mempromosikan kasus aplikasi gemini saat ini di perusahaan seperti best buy, snap, ups capital, wayfair, dll. dilaporkan bahwa mereka mencoba menarik lebih banyak pelanggan korporat besar dengan menyediakan layanan "sarung tangan putih" pada tingkat tertentu.

namun dalam menghadapi pangsa pasar yang sudah mengakar, serangan balik google mungkin tidak mudah.

logan kilpatrick, pimpinan produk di ai studio, yang bertanggung jawab atas hubungan pengembang di openai sebelum bergabung pada bulan april tahun ini, mengatakan: "kenyataannya adalah openai lebih unggul dari google dalam hal alat pengembang llm api. kami harus bersaing dengan mereka upaya pengembangan saat ini di kalangan pengembang. berjuang untuk mendapatkan pangsa pasar yang mengakar.”

sebelumnya, rowan cheung, seorang blogger terkenal di kalangan ai, memperkirakan bahwa dia telah menyelesaikan wawancara tentang peningkatan besar-besaran pada model ai. hari ini, para pengembang akan mengalami hari besar.

di bawah tweet tersebut, ekspresi wajah tersenyum logan kilpatrick terlihat sedikit malu di tengah banyaknya penyesalan yang mengatakan “kenapa bukan claude opus 3.5?”

konservatif, kontroversial, dan tertinggal adalah stereotip yang ditinggalkan google, raksasa ai, di masyarakat saat ini. peluncuran gemini-1.5-pro-002 tampaknya tidak memecahkan kebuntuan tersebut.

kekecewaan masyarakat terhadap perusahaan ini berasal dari ekspektasi yang tinggi terhadap perusahaan tersebut: dengan kekuatan dan cadangan bakat yang begitu kuat, akan sangat disayangkan jika semua orang tidak dapat memberikan lebih banyak opsi "pengganti" untuk openai kepada dunia.

berita

ini hidup kembali! versi openai yang disempurnakan "her" secara resmi dibuka, melampaui peningkatan "tingkat produksi" gemini...

perkenalan

informasi kontak saya