berita

Doubao versi PC "unboxed", dari volume suara hingga dialek

2024-08-24

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Pada tanggal 22 Agustus, Tur Inovasi AI Volcano Engine dibuka di Shanghai. Acara ini menunjukkan peningkatan model bean bag dalam penilaian komprehensif, pengenalan suara, dan aspek lainnya.Kemampuan suara menjadi fokus rilis ini.

Tim model besar berfokus pada interaksi dan keluaran real-time AI percakapan Seed-ASR, pencapaian ini mungkin sebanding dengan mode suara canggih baru ChatGPT yang dirilis oleh OpenAI pada 31 Juli.

Karyawan OpenAI dapat menginterupsi chatbot dan memintanya untuk menceritakan kisahnya dengan cara yang berbeda, dan chatbot tersebut menerima interupsi tersebut dengan tenang dan menyesuaikan responsnya, menurut video yang diposting di media sosial pada saat itu.

Sederhananya, ini mendukung “berpikir dan berbicara pada saat yang sama”,Memiliki kesadaran konteks yang lebih kuat, sehingga memiliki kemampuan penalaran yang lebih baik dan hasil jawaban yang lebih akurat.

Yang mencolok adalah itukantong kacangKlaim kemampuan bicaranyaMendukung pengenalan modelbahasa mandarindan dialek Kanton, Shanghai, Sichuan, Xi'an, Hokkien, dan dialek Tionghoa lainnya.

Hal ini membuat saya bersemangat untuk membicarakannya di Hong Kong dan Sichuan.

Selanjutnya saya akan mendasarkannya pada versi 1.19.5_macDoubao AI versi PC,tesPembacaan teks AI dan pengenalan tangkapan layarSerta yang baru-baru ini populerPenayangan video AI, pengenalan dialek AIdan fungsi lainnya,Lihat perbandingan bean bag denganBerbagai model besar AI versi webHal-hal baru apa saja yang diberikan.

Seperti aturan lama, sobat yang cemas bisa langsung scroll ke bawah ke bagian ringkasan.

Pendamping membaca teks AI

Yang pertama adalah pembacaan pendamping teks AI.

Saya membuka sebuah berita, menggulir ke bawah ke bagian ringkasan, memilih paragraf yang ingin saya bantu, dan beanbag otomatis muncul.Cari, terjemahkan, tafsirkan, salindan fungsi lainnya.

adaTemukan lebih banyak keterampilanDiantaranya adalah toolbar penggambaran kata AI yang memiliki 6 fungsi seperti singkatan teks, koreksi, dan pemolesan, 3 fungsi seperti copywriting media sosial atau skrip video, dan 4 fungsi seperti menghasilkan laporan mingguan, OKR, dan kode koreksi kesalahan. 6 item termasuk ringkasan kelebihan dan kekurangan, ekstraksi item tugas, brainstorming, dll, ditambah yang sulit untuk diklasifikasikan,Ada total 22 fungsi modul dengan pengaturan atas yang dapat disesuaikan.

Saya memilih permintaan penjelasan Doubao yang paling dasar. Setelah menunggu sekitar 25 detik, saya mendapatkan konten berikut.

Terlihat bahwa Doubao pertama-tama merangkum gagasan umum, diikuti dengan penjelasan yang lebih bersifat percakapan.Yang menarik adalah ia secara aktif mengidentifikasi dan menjelaskan kata benda dari paragraf teks yang dipilih, seperti “Aturan Pareto” di atas.

Pada titik ini, masih harus dilihat apakah 22 fungsi yang disediakan oleh modul Doubao dapat menunjukkan pemahaman yang lebih mendalam dalam hal kecerdasan dan personalisasi.Namun yang jelas adalah ketika PC berjalan di latar belakang, saya tidak perlu menyalin dan menempelkannya ke jendela lain untuk mencari, atau bahkan memilih kata benda yang tepat untuk dicari atau mengajukan pertanyaan secara terpisah.

Pengenalan gambar AI

Saat saya mengambil tangkapan layar menggunakan Beanbao, munculTanya jawab, terjemahan, bean bag QQAda 3 item fungsi, jadi saya memilih soal matematika SMA dan meminta Doubao untuk menyelesaikannya dan menjawab pertanyaannya.

Doubao tidak hanya memberikan proses solusi dan jawaban atas pertanyaan di area screenshot, tetapi juga memberikan beberapa pertanyaan serupa beserta solusinya.

Namun ketika saya menggunakan Translate dan Ask Doubao, saya tidak hanya tidak dapat mengelompokkan kalimat dengan cerdas, tetapi saya juga sering membuat kesalahan.

Mengingat sulitnya pengenalan gambar, saya beralih ke teks paragraf, namun tidak ada perbaikan.

Saya mencoba lagiTanyakan tentang bean bag, bawahanAtur konten inti dalam gambarDanEkstrak teksSaya mencoba kedua modul secara terpisah.

Secara keseluruhan, kinerja fungsi inti organisasi konten sangat baik.Namun ekstraksi teksnya bahkan tidak mengenali gambar lengkapnya, dan jenis hurufnya masih tertata rapi.

AI menonton video

Fungsi menonton video dengan AI saat ini terbatas pada video situs b, dan memerlukanBuka di antarmuka DoubaoDan masuk ke akun stasiun B.

Jadi saya secara acak memilih konten season ketiga dan episode 7 "The Genre of Late Drinking", dan setelah menunggu sekitar 20 detik, saya mendapatkan konten berikut.

Terlihat bahwa pada timeline segmen video, pencocokan gambar dan teks AI kurang akurat, namunPada dasarnya segmentasi konten dapat dicapai.

Video tersebut di-dubbing dalam bahasa Jepang dengan teks bahasa Mandarin tradisional, yang mungkin agak memalukan.

Terdapat ringkasan yang jelas tentang gagasan utama di awal video, namun tidak tercermin secara jelas dalam ringkasan teks di sebelah kanan. Selain itu, di bagian "Terima Kasih kepada Orang Lain", karakter dalam video mengucapkan terima kasih kepada Ibu Ozo, bukan kepada Tuan Ushida, yang merupakan kesalahan dalam ringkasan beanbag.

Pengenalan dialek AI

Menurut pengumuman resmi, Doubao mendukung bahasa Kanton, Shanghai, Sichuan, Xi'an, dan Hokkien. Selanjutnya, mari kita lihat apakah Doubao dapat mengenali bahasa Kanton saya yang rusak (tidak ada dialek asli, hanya bahasa Kanton yang rusak yang dihasilkan selama setengah tahun). tinggal di Hong Kong), berharap untuk berbagi lebih banyak pengalaman pribumi~).

Tidak ada masalah dengan pengenalan bahasa. Doubao memahami "Saya ingin makan hot pot berbahan bubur" dan bahkan memberikan opsi pencarian "Di mana saya dapat menemukan hot pot berbahan bubur yang lezat di Beijing?", tetapi setelah pesan terkirim, pesan tersebut beralih ke antarmuka percakapan pencarian AI, dan balasan kepada saya adalah teks, bukan suara.

Selain itu, masukan dialek hanya tersedia di beranda, dan saya tidak dapat melanjutkan memasukkan dialek di antarmuka percakapan. Oleh karena itu, saya perlu kembali ke halaman beranda lagi dan lagi, dan setiap kali pesan terkirim, jendela halaman navigasi baru akan terbuka. . .

Namun, kemampuan memasukkan dialek masih merupakan terobosan besar, dan performa keseluruhannya kurang memuaskan. Dapat dipahami bahwa aplikasi Doubao mendukung balasan suara.

Saya mencoba menggunakan aplikasi selulerpengucapan dialekKalimat yang sama dimasukkan, Doubao diakhiri dengansuara mandarinJawab saya dan berikan istilah pencarian yang dipilih "Di mana saya bisa menemukan bubur hot pot yang lezat di Beijing?"

Dengan kata lain, Doubao mendukung input dialek, namun saat ini tidak mendukung interaksi dialek.Fungsi ini banyak digunakan dalam situasi menyenangkan dan bisnis, seperti mengatur notulen rapat untuk peserta dalam berbagai bahasa.

Sesi ringkasan

Dalam imajinasi saya, ada boneka elektronik AI di desktop, yang memberi saya nilai emosional seperti kucing saya, dan sangat membantu saya dalam menangani segala sesuatu tentang saya. Membangunkannya semudah Siri, namun lebih kuat dari Siri.

Pembacaan teks AI Doubao dapat digunakan di seluruh aplikasi di sisi PC, menyediakan 22 fungsi modul. Selain pemolesan teks dasar, ia juga memiliki cakupan aplikasi berbasis skenario untuk hewan sosial, pemrogram, dan pekerja media mandiri fungsi dasar yang saya bayangkan, tetapi ada juga banyak ruang untuk eksplorasi dan pertumbuhan.

Dalam hal pengenalan gambar, ia pandai memecahkan masalah dan menjawab pertanyaan, yang setara dengan pekerjaan rumah geng dan monyet di sisi PC. Namun, mengingat basis pengguna PC, Doubao diharapkan melakukan upaya mendalam dalam matematika+ tingkat lanjut. Lagi pula, jawaban atas pertanyaan dan jawaban untuk pekerjaan rumah umum dan kertas ujian lebih cepat di ponsel. Hanya dengan pertanyaan atau makalah versi elektronik akan ada permintaan untuk PC.

Fungsi segmentasi dan peringkasan video AI sangat menarik perhatian, terutama untuk video sains populer Doubao memiliki potensi yang besar. Tema humaniora dan ilmu sosial merupakan masalah umum bagi semua model utama.

Faktanya, dialek AI adalah fitur yang paling saya nantikan,Lagi pula, "pengucapan lokalnya tetap tidak berubah, dan rambut di pelipis memudar". Terkadang kampung halaman saya memiliki daftar menu yang panjang, dan terkadang yang familiar adalah "rasa itu". Namun secara keseluruhan, ekologi interaktif dialek Doubao masih perlu dikembangkan.

Dialog dialek tidak hanya mengidentifikasi sentimen kampung halaman kaum urban modern. Lebih penting lagi, teknologi menembus layar dingin dan peduli terhadap mereka yang tidak bisa berbicara bahasa Mandarin secara universal. Mereka menulis sejarah diam-diam dengan kehidupan mereka, tetapi sering kali dilupakan oleh sejarah. Mereka juga membutuhkan AI dan hal-hal yang datang dengan AI untuk semua nilai .

Ketika dialek berpindah dari pengenalan ke interaksi, Doubao juga dapat melangkah lebih jauh.