berita

master hebat kapacianli meledakkan aplikasi ai, mengatakan "mungkin chatgpt berikutnya"

2024-09-30

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

direkomendasikan oleh dewa agung kapasi wall crack!

bahkan memperkirakan hal iniaplikasi ai, dimungkinkan untuk membuka "peluang sebesar chatgpt".

ini adalah produk ai eksperimental dari google,buku catatan lm, didukung oleh gemini 1.5 pro, model google yang paling canggih saat ini.

baru-baru ini, aplikasi ini menjadi sangat populer, semua karena peluncuran fitur baru——

mengunggah file (teks, audio, video), dan ai tidak hanya dapat membantu mengekstrak poin-poin penting dalam teks, tetapi juga mengonversi file menjadi podcast percakapan yang dihasilkan ai melalui fungsi tinjauan audio, dan melakukan diskusi berdasarkan konten dokumen.

dua ai, menggunakan suara dan nada orang sungguhan, dengan penuh semangat mendiskusikan isi dokumen dan membuat kesimpulan akhir.

kapasi memasukkan kode c untuk pelatihan gpt-2 dan membuat podcast percakapan

ini sangat keren!

dan kapasi bukan satu-satunya yang menyombongkan diri. setelah menelusuri beberapa platform internet besar, umumnya netizen setuju dengan notebook lm.

kol @elvis dari industri ai juga meninggalkan pesan di area komentar kapasi:

card god mengatakan bahwa ini "mengingatkan pada momen chatgpt", yang tentunya tidak berlebihan!

benar-benar mengizinkan beberapa model untuk bekerja sama akan membuka format konten unik dan pengalaman pengguna seperti notebook lm.

bagaimana cara memainkan notebook lm?

gameplaynya sangat sederhana, cukup buka halaman uji coba dan drag and drop file yang perlu diproses.

itu bisa berupa google dokumen, tautan ke situs web atau video, atau bahkan sekadar menempelkan teks dalam jumlah besar.

setiap buku catatan mendukung pengunggahan 50 file, dan konten setiap file dibatasi hingga 500.000 kata.

di sini kita telah mengunggah dokumen system card openai o1, dan kemudian kita dapat memilih konten yang perlu dibuat.

dukungan bawaan untuk fungsi versi teks seperti tanya jawab, kuis, daftar isi, garis waktu, ringkasan, dll., serta konten audio percakapan mendalam antara dua host.

jika anda memiliki kebutuhan yang lebih dipersonalisasi, anda juga dapat mengetikkan sendiri perintahnya.

kami mencoba mengajukan pertanyaan dalam bahasa mandarin, dan hasilnya ai dapat memahaminya.

sangat disayangkan notebook lmmenjawab dalam bahasa mandarin tidak didukung, meskipun anda memintanya dengan sengaja.

jika anda memilih untuk membuat audio, anda perlu menunggu beberapa menit hingga sepuluh menit tergantung pada panjang dokumen.

luangkan waktu ini untuk mempelajari model gemini di baliknya~

notebooklm didukung oleh gemini 1.5 pro yang merupakan model besar andalan google saat ini.

gemini 1.5 pro mendukung konteks ultra-panjang 128k, yang merupakan dasar untuk menafsirkan dokumen panjang.

dalam peningkatan terbaru, kemampuan matematika dan penalaran gemini 1.5 pro melampaui versi pratinjau openai o1.

oke, audio yang dihasilkan tadi sudah diproses. teman-teman yang pandai bahasa inggris bisa datang dan mendengarkannya.

teman-teman yang tidak begitu mahir berbahasa inggris juga dapat melihat versi teks dari podcast ai yang ditranskripsi dan diterjemahkan oleh matryoshka ai untuk merasakannya.

mengunggah dokumen dan membuat konten hanyalah salah satu cara praktis dalam menggunakan notebook.

seseorang juga memperkenalkan metode bagi siswa untuk mencatat kelas dan menggunakan ai untuk memilah poin-poin penting di rumah, yang juga mendapat pujian luas.

(saya tidak bermaksud bahwa saya tidak akan mendengarkan kelas)

secara khusus, anda dapat mengikuti langkah-langkah berikut :,

gunakan ponsel anda untuk merekam selama kelas;

tidak perlu menggunakan komputer selama kelas, cukup catat poin-poin penting secara singkat (kertas dan pensil);

(setelah kelas) pindai rekaman dan catatan dan unggah ke notebooklm, dan biarkan catatan diperluas berdasarkan detail rekaman.

selain itu, anda juga dapat membuat tinjauan audio mingguan tentang poin-poin penting dari apa yang telah anda pelajari.

paradigma interaktif berbeda dari obrolan sederhana

faktanya, notebooklm tidak langsung menjadi hit setelah debutnya.

ini sudah muncul pada konferensi google i/o pada mei tahun lalu, namun pada saat itu, sebagai proyek notebook ai, disebut jugaproyek tailwind

baru pada bulan juli tahun lalu notebooklm diubah menjadi namanya saat ini.

pada awalnya, ini hanya didukung untuk pengguna di beberapa wilayah amerika serikat; fungsinya masih berkisar pada mode obrolan dasar.

notebooklm secara otomatis menghasilkan panduan dokumentasi (dari situs resmi google)

pada tanggal 11 bulan ini, notebooklm tiba-tiba mengumumkan bahwa mereka akan terbuka untuk pemain di seluruh dunia dan menambahkan fitur-fitur baru yang penting.ikhtisar audio

pengenalan resmi dari google adalah sebagai berikut:

"fitur ikhtisar audio baru mengubah dokumen, slide, bagan, dan lainnya menjadi diskusi menarik hanya dengan satu klik."

karena bentuk interaksinya sangat baru, suara ai-nya nyata, dan diskusinya benar-benar seperti podcast langsung, semua orang langsung bersenang-senang.

hingga dua hari ini, notebook lm tidak hanya mampu menggunakan video youtube sebagai input, tetapi juga mendukung lebih dari 100 bahasa.

kini, “pertunjukan cinta” kapasi menambah popularitas notebook lm.

seperti yang dikatakan kapasi, alasan utama mengapa notebook lm menjadi begitu populer adalah karena ia memberikan paradigma interaksi yang berbeda dari chat sederhana.

kapasi berkata,notebook lm menghilangkan dua hambatan utama dalam menikmati model besar:

pertama, chatting sebenarnya cukup sulit.

beberapa orang kesulitan berkomunikasi dengan orang lain dalam kesehariannya, apalagi ngobrol dengan chatbot yang harus terus bertanya.

hal yang baik tentang notebooklm adalah salah satu dari dua podcast ai yang dihasilkan akan berperan mengajukan pertanyaan dan membimbing.

mari kita masukkan dokumen, audio dan video, tunggu hingga dibuat, dan meimei ting ai akan mengobrol berdasarkan file tersebut.

kedua, membaca itu tidak mudah.

di era ledakan informasi yang terfragmentasi, jauh lebih mudah mencari posisi nyaman atau mendengarkan orang lain mendiskusikan apa yang saya butuhkan saat mengemudi daripada menaruhnya sendiri.

——bahkan jika kita melihat versi ringkas yang telah dirangkum oleh ai untuk kita (hei, ya, kami sangat malas! doge).

dalam semangat mengupayakan yang terbaik, beberapa netizen pun mengungkapkan ekspektasinya agar notebook lm bisa membawanya ke level berikutnya.

setelah mencobanya, yuchen jin, salah satu pendiri dan cto hyperbolic labs, merangkum dua batasan:

salah satunya adalahitu "tidak bisa melihat", yaitu informasi gambar dalam dokumen tidak dapat diproses.

namun, gemini di baliknya bersifat multi-modal. dibandingkan dengan notebook lm, hal ini tidak akan terlambat.

yang lainnya adalahpengguna tidak dapat mengarahkan konten podcast ai

yuchen jin memberinya dua tweet, dan menghasilkan konten audio berdurasi hampir 13 menit, tetapi secara default ditujukan untuk khalayak umum, sehingga membahas banyak konsep yang sangat mendasar.

jika anda dapat menentukan kelompok sasaran untuk menghasilkan podcast, atau berbicara tentang topik, arah, dan sudut pandang, itu benar-benar merupakan bonus tambahan.

satu hal lagi

sudah terlambat, tapi sudah terlambat, para pengembang telah memikirkannyaversi sumber terbuka dari notebooklmmengerti!

tapi untuk saat ini, saya hanya bisa memberinya pdf.

anggap saja, manusia itu sangat menarik!

di masa lalu, saya kesulitan mengubah audio menjadi teks, mengejar konversi siaran, rekaman konferensi, dll. menjadi teks.

sekarang saya mulai menggunakan model besar untuk mengubah teks menjadi podcast lagi...

menarik wow menarik wow (kepala anjing).

tautan referensi:

[1]https://notebooklm.google/

[2]https://x.com/karpathy/status/1840112692910272898

[3]https://x.com/omarsar0/status/1840145774874898506

[4]https://x.com/yuchenj_uw/status/1840203324571943403

[5]https://github.com/gabrielchua/open-notebooklm

lebih