berita

kami melakukan panggilan video ke ai dan menemukan bahwa ai sepertinya dapat membicarakan segalanya. . .

2024-08-31

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


pada konferensi openai tiga bulan lalu, saya yakin beberapa dari anda telah melihat gpt-4o seperti manusia sungguhan.kemampuan percakapan video yang halus.

ada pula project astra yang diluncurkan google yang tak kalah dengan gpt-4o dari segi kekuatannya.


pada saat itu, hampir seluruh internet membual tentang betapa hebatnya kemampuan interaktif ai telah berevolusi, dan istilah-istilah seperti epic dan next level pun digunakan.

apa yang terjadi? fungsi video call yang dijanjikan gpt-4o berulang kali tertunda dan project astra tidak terlihat selama beberapa bulan.masing-masing dari mereka hampir dibuat kesal oleh pengulas yang buruk. . .

namun, saya menemukan bahwa tampaknya ada aturan di lingkaran ai, yaitu anda tidak boleh membuat orang menunggu terlalu lama untuk hal-hal baik. soalnya, sora sudah merahasiakannya selama lebih dari setengah tahun. akibatnya, keling, luma ai, dan zhipu qingying semuanya muncul satu demi satu.

dalam dua hari terakhir, pada konferensi data mining kdd di barcelona, ​​​​zhipu tampil di hadapan komunitas akademis dan industri global.tidak hanya model dasar besar terbaru glm-4-plus yang telah dirilis, tetapi juga telah meningkatkan fungsi panggilan video zhipu qingyan.


izinkan saya menyoroti poin-poin penting untuk semua orang.dialah yang ada dalam legenda yang bisa melihat dan mengobrolkecerdasan buatanfungsi panggilan video kini tersedia langsung di aplikasi qingyan. anda dapat mengunduh aplikasi terlebih dahulu dan mengajukan uji coba.

jangan membicarakan hal lain. dibandingkan dengan openai, kecepatan zhipu sudah lebih baik dari openai. . .

oleh karena itu, segera setelah fungsi panggilan video qingyan diluncurkan, tuan bianbing adalah orang pertama yang menggunakannya. buka aplikasi qingyan, klik tombol panggil di pojok kanan bawah, lalu beralih ke video dan langsung mulai memutar ~


teman-teman juga harus tahu bahwa salah satu alasan penting mengapa gpt-4o begitu populer adalah karena ia memiliki kemampuan yang sangat kuat untuk memahami video.

kalau yang paling mendasar, kemampuan pemahaman video qingyan perlu diuji terlebih dahulu bukan?

peninjau melihat ke ruang konferensi tempat departemen editorial kami biasanya melakukan brainstorming, untuk melihat apakah mereka dapat menebak apa yang saya lakukan berdasarkan lingkungan sekitar.

coba tebak, hanya mengatakan "wow, coba tebak apa yang kamu lakukan" hampir membuatku kesulitan. namun duduk di meja di ruang konferensi tidaklah salah. gelas kertas di atas meja, remote control, dan tv di sebelahnya juga digambarkan dengan cukup akurat.

saat saya memasang lensa di komputer rekan saya, saya benar-benar dapat melihat bahwa lensa tersebut sedang mengedit video.

jangan bilang, kemampuan untuk memahami keseluruhan lingkungan di sekitar anda seperti ini hanya pernah terlihat di openai dan demo google sebelumnya. hari ini, saya pribadi mengalaminya. rasanya seperti fiksi ilmiah telah menjadi kenyataan.

selain itu, qingyan sama seperti yang ditunjukkan oleh gpt-4o.anda dapat menyela kapan saja selama percakapan.dari waktu ke waktu, dia juga akan menggunakan kata modal "aduh" dan "aduh", dan tertawa sebelum berbicara, seperti mengobrol dengan orang sungguhan.

kemudian, saya mencoba fungsi pengenalan objek tertentu untuk melihat cadangan pengetahuan qing yan.

dimulai dari pemindaian stasiun kerja yang paling sederhana, pada dasarnya tidak ada item besar seperti keyboard putih, mouse hitam, dan monitor yang hilang. arah depan, belakang, kiri, dan kanan objek juga dijelaskan dengan jelas, bahkan headphone plug-in dan tidak ada detail yang tersisa.

saya tidak bisa mengatakan 100%, tapi di tabel inisetidaknya 80%-90%semuanya dilihat oleh qing yan.

apalagi qingyan juga memiliki fungsi lain yaitupengenalan lingkaran, saya memutari stereo besar rekan saya dari kejauhan. ia mengetahui merek, model, dan bahkan tujuan spesifiknya.

meskipun ada kata-kata di speaker, semua orang harus dapat melihat dengan jelas. sulit untuk melihatnya dengan mata telanjang. saya harus mengatakan bahwa mata yang jernih sangat mudah digunakan. . .

selain itu, saya juga menemukannyapengenalan qingyan terhadap objek melampaui kategori sederhana.

misalnya, jika anda bertanya apakah pengontrol game ini dari sony atau microsoft, ia dapat menganalisisnya berdasarkan desain bentuk pengontrolnya. ini adalah xbox milik microsoft. daripada sekadar memberi tahu anda bahwa ini adalah pengontrol permainan, atau sekadar membingungkan dan tidak bisa menjelaskannya dengan jelas.

ada juga detail ponsel berfitur kuno ini, nokia, model spesifiknya adalah n95, dan model klasik 2007.

kemudian, saya meminta qingyan untuk mengidentifikasi sistem komputer, menebak usia tony dengan melihat foto tony, dan menebak nama orang dengan melihat foto selebriti. . . begini saja, sejak saya mulai menggunakan qingyan, sekarang saya ingin membuka panggilan video dan bertanya tentang apa pun yang saya tangkap.

tentu saja menyenangkan, sebenarnya ada banyak bentuk video call.skenario praktis

mari kita ambil contoh pencarian topik dan materi harian departemen editorial kita. hot spot di industri otomotif dua hari ini pada dasarnya tidak dapat dipisahkan dari chengdu auto show. saat ini, anda dapat bertanya kepada qingyan tentang chengdu auto show dan mencarinya topik selama percakapan.

terutama, saya juga menemukan bahwa qingyan memilikinyafungsi memori, saya membicarakan hal ini dengannya di panggilan video terakhir, dan saat berikutnya saya membukanya, ia muncul dan menanyakan kendaraan energi baru mana di pameran mobil yang saya ikuti.

ada juga les pr yang paling merepotkan orang tua. dulu interaksi ai masih berbasis pengambilan gambar dan upload soal, tapi kalau diganti video call sama saja dengan one-on-. satu les pekerjaan rumah dengan tutor online.

saya mencoba meminta qingyan mengerjakan beberapa soal matematika tingkat kesulitan rendah.beberapa soal aljabar sederhana di sekolah dasar dan sekolah menengah pertama hampir tidak dapat diselesaikan.

saya tidak tahu apakah anda memperhatikan bahwa ketika menyelesaikan masalah, qing yan tidak akan memberi tahu anda keseluruhan prosesnya sekaligus, juga tidak hanya memberi anda satu hasil. ini akan memandu anda langkah demi langkah, memungkinkan anda melakukan proses berpikir.

selain matematika, saya juga mencoba bahasa mandarin dan inggris satu per satucukup memadai untuk pekerjaan rumah sehari-hari, menghafal kata-kata, dan menghafal puisi-puisi kuno.

jika menurut anda adegan-adegan ini tidak cukup, mari gunakan imajinasi lagi.

saya belum punya pengalaman memasak untuk pertama kalinya, bola lampu di kamar saya rusak, dan saya tidak tahu cara menanam tanaman hijau. . . jika anda menghadapi hal serupa dalam hidup dan tidak tahu harus berbuat apa, mengapa tidak bertanya pada qing yan.

misalnya, banyak anak mungkin tidak dapat membedakan kutub positif dan negatif baterai untuk saat ini, jadi kami berpura-pura memasang baterai kalkulator secara terbalik dan mengetahui masalahnya hanya dalam beberapa kata, yang menunjukkan bahwa itu masih memiliki akal sehat dalam hidup.

bagaimanapun, saya menggunakan qingyan akhir-akhir ini. saya suka mencarinya ketika saya tidak ada pekerjaan. apalagi gadget ini sangat mumpunimemberikan nilai emosional, biarkan ia bercerita dan bercanda, dan menanggapi setiap kalimat.

mainkan blackjack dengan teman dan dia bahkan bisa bertindak sebagai wasit.

saya ingin tahu apakah kita bisa berevolusi ke titik di mana kita bisa bermain mahjong di masa depan dan membiarkan ai mengambil alih. bukankah ini lebih menarik daripada percakapan yang diketik dan bersuara asli?

sejujurnya, peningkatan besar-besaran pada qingyan ini masih memberi saya banyak kejutan, tetapi terkadang masih banyak kekurangan kecildia bisa berbicara omong kosong, salah mengidentifikasi sesuatu, dan mengeluarkan omong kosong.


misalnya, ketika saya menjadi wasit blackjack, saya pernah mengatakan bahwa angka 9 adalah angka 4 dan sekop adalah tongkat. . .

namun, hanya dengan membuat panggilan video ai tersedia di tiongkok sebelum openai dan google,zhipu juga harus kita acungkan jempol.

kali ini, fungsi panggilan video gelombang pertama hanya akan tersedia untuk beberapa pengguna. zhipu secara bertahap akan memperluas skalanya sehingga semua karyawan dapat menggunakannya sesegera mungkin. jika kalian benar-benar serakah,anda dapat mengunduh aplikasi qingyan, atau masuk ke pc (chatglm.cn) untuk mengajukan pengujian internal di situs.

selain itu, mungkin masih banyak sobat yang belum mengenal zhipu. begini saja, perusahaan ini juga bisa dikatakan yang terbaik di kalangan ai.ayam goreng populer.


apalagi tahun ini, tindakan mereka terhadap model besar sangatlah sengit. dari iterasi gila-gilaan pada model dasar yang besar hingga seringnya implementasi aplikasi model besar, tindakan zhipu tidak pernah berhenti.

pada kdd kali ini, model besar baru mereka glm-4-plus telah mengalami peningkatan besar dalam pemahaman bahasa dan teks panjang.


selain itu, zhipu bersikeras untuk membuat model open source. data menunjukkan bahwa unduhan kumulatif model open source zhipu telah dilakukanmelebihi 20 juta.

bagaimanapun, zhipu yang memimpin dalam membuat "keributan" kali ini. diperkirakan kalangan ai dalam negeri bahkan luar negeri akan segera mengantarkan gelombang produk baru yang gila.


ini tentu saja merupakan hal yang baik bagi kami para pengguna. khususnya untuk panggilan video ai, suatu bentuk interaksi baru, semakin jauh anda melangkah, semakin besar ruang lingkup imajinasi dalam skenario aplikasi.

misalnya, jika ai dipasang pada kacamata atau kalung, anda mungkin tidak memerlukan ponsel di masa mendatang, atau ai mungkin dipasang pada tongkat penyangga orang buta untuk membantu memandu jalan, atau mungkin digabungkan dengan kecerdasan yang terkandung untuk memungkinkan robot untuk benar-benar memahami apa yang dilihatnya.

meminjam kata-kata ceo zhipu zhang peng:"setidaknya kita belum melihatnya (kecerdasan buatan) langit-langit teknologi”.

anda mungkin juga memikirkan sejauh mana ai akan berkembang di masa depan dan nilai apa yang akan dihasilkannya.

tulis artikel: xixi

sunting:jiangjiang

editor seni:huanyan

gambar, sumber

kata-kata bijak yang jelas

bagian dari jaringan sumber gambar