pidato internal robin li mengungkapkan: membahas tiga kesalahpahaman kognitif utama tentang model besar, kesenjangan antar model akan semakin lebar di masa depan

2024-09-16

"dunia luar memiliki banyak kesalahpahaman tentang model-model besar," menurut laporan media baru-baru ini, pidato internal robin li terungkap. dalam komunikasi baru-baru ini dengan karyawan, robin li berbicara tentang tiga kesalahpahaman tentang model besar, meliputi persaingan model besar, efisiensi model sumber terbuka, dan agen cerdaskecenderungantunggu topik hangat.

robin li mengatakan bahwa kesenjangan antara model-model besar mungkin akan semakin besar di masa depan. ia mengatakan bahwa plafon model besar sangat tinggi, dan masih jauh dari situasi ideal. oleh karena itu, model tersebut harus terus melakukan iterasi, pembaruan, dan peningkatan dengan cepat; model tersebut harus dapat berinvestasi terus menerus selama beberapa tahun atau lebih sepuluh tahun untuk terus memenuhi kebutuhan pengguna dan mengurangi biaya.

berikut isi pidato internal tersebut

pertanyaan: beberapa orang berpikir bahwa tidak ada hambatan antara kemampuan model besar?

robin li:saya tidak setuju dengan pernyataan ini. menurut saya, dunia luar memiliki banyak kesalahpahaman tentang model-model besar. setiap kali model baru dirilis, mereka pasti ingin mengatakan betapa bagusnya model tersebut, dan mengikutinya setiap saat.sebagai perbandingan dengan gpt-4o, saya mengambil set tes atau membuat beberapa daftar dan mengatakan bahwa skor saya hampir sama, atau bahkan melebihinya di beberapa item individual, tetapi ini tidak membuktikan bahwa model yang baru dirilis ini adalah yang paling canggih. dengan openal. dibandingkan dengan modelnya, tidak ada kesenjangan yang besar.

kesenjangan antar model bersifat multidimensi, salah satu dimensinya adalah kemampuan, baik kesenjangan pada kemampuan dasar seperti kemampuan pemahaman, kemampuan pembangkitan, kemampuan penalaran logis, atau kemampuan memori;，jika anda ingin memiliki kemampuan ini atau menjawab pertanyaan-pertanyaan ini, berapa biayanya? beberapa model mungkin memiliki kecepatan inferensi yang sangat lambat. meskipun mencapai efek yang sama, pengalamannya sebenarnya tidak sebaik model paling canggih. dan untuk set tesover-fitting, setiap model yang ingin membuktikan kemampuannya akan masuk ke pemeringkatan, saat melakukan pemeringkatan, dia harus menebak apa yang diuji orang lain, dan pertanyaan mana yang bisa saya gunakan dan teknik apa yang bisa saya jawab dengan benar, jadi dari pemeringkatannya. atau test set dari kelihatannya, menurut anda kemampuannya sangat dekat, namun dalam penerapan sebenarnya masih terdapat celah yang jelas.

bagian dari hype media mandiri, ditambah dengan motivasi publisitas ketika setiap model baru dirilis, memberikan kesan kepada semua orang bahwa perbedaan kemampuan antar model relatif kecil. dalam proses penggunaan sebenarnya, saya tidak mengizinkan staf teknis kami membuat peringkat. yang benar-benar mengukur kemampuan model besar wenxin adalah apakah anda dapat memenuhi kebutuhan pengguna dalam skenario aplikasi tertentu dan apakah anda dapat menghasilkan perolehan nilai apa yang benar-benar kami pedulikan.

kita perlu melihat bahwa di satu sisi, terdapat kesenjangan yang relatif jelas antara kemampuan model, dan di sisi lain, batasannya masih sangat tinggi keadaan ideal, sehingga model tersebut juga perlu diiterasi, diperbarui, dan ditingkatkan secara terus menerus dan cepat.sekalipun anda melihat kesenjangannya tidak terlalu besar saat ini, akankah anda melihat apakah kesenjangan tersebut semakin melebar di tahun berikutnya? siapa yang dapat terus berinvestasi ke arah ini selama beberapa tahun atau bahkan lebih dari sepuluh tahun, sehingga dapat semakin memenuhi kebutuhan pengguna, memenuhi skenario, dan memenuhi kebutuhan peningkatan efisiensi atau pengurangan biaya?kesenjangan antara model-model yang berbeda tidak akan semakin kecil, namun akan semakin besar. namun, ketika mereka tidak mengetahui kebutuhan sebenarnya, mereka mungkin merasa bahwa mengerjakan soal-soal tes saja sudah cukup.

disebut memimpinterlambat dua belas bulan atau 18 bulan, menurut saya itu tidak terlalu penting. masing-masing perusahaan kita berada dalam lingkungan pasar yang sepenuhnya kompetitif. apa pun arah yang anda ambil, akan ada banyak pesaing. jika anda selalu dapat memastikan bahwa anda 12 hingga 18 bulan lebih maju dari pesaing anda, anda tidak akan terkalahkan anggaplah 12 sampai 18 orang lebih maju darimu. sebulan adalah waktu yang sangat singkat,bahkan jika anda dapat menjamin bahwa anda akan selalu berada di depan pesaing anda6 bulan, lalu menang, pangsa pasar anda mungkin70%, sedangkan lawan mungkin hanya memiliki 20% atau bahkan 10%.

t: beberapa orang mengatakan bahwa model sumber terbuka menutup kesenjangan dengan model sumber tertutup. apakah ini akan menghancurkan model bisnis perusahaan model sumber tertutup yang besar?

robin li:pertanyaan ini sangat berkaitan dengan pertanyaan sebelumnya, saya baru saja mengatakan bahwa selain kemampuan atau efek, suatu model juga harus efisien. dari segi efisiensi, model open source tidak bagus. tepatnya, model sumber tertutup harus disebut model bisnis. model komersial adalah model di mana banyak pengguna atau pelanggan berbagi sumber daya yang sama dan berbagi biaya penelitian dan pengembangan, sumber daya mesin, dan sumber daya penalaran.gpu, dan model sumber terbuka mengharuskan anda menerapkan serangkaian hal sendiri. berapa tingkat penggunaan gpu setelah penerapan? kitamodel besar wenxin3.5、4tidak peduli 0,0, tingkat penggunaannya lebih dari 90%. berapa banyak orang yang menggunakan model sumber terbuka yang anda terapkan? kami memberi tahu publik bahwa model wenxin dipanggil lebih dari 600 juta kali sehari dan jumlah token yang dihasilkan setiap hari melebihi satu triliun. model sumber terbuka manakah yang dapat mengetahui berapa banyak panggilan yang dilakukan dalam sehari dan berapa banyak token yang dihasilkannya? bagaimana biayanya dibagi jika tidak ada yang menggunakannya? bagaimana biaya inferensi dibandingkan dengan model komersial?

sebelum era model besar, semua orang sudah terbiasa dengan open source yang berarti gratis dan berbiaya rendah. saat itu, untuk produk komersial yang ada di pasaran, anda harus membayar untuk setiap versinya, seperti membeli instalasi komputerwindows, microsoft mungkin harus membebankan banyak uang darinya, tetapi anda tidak perlu mengeluarkan uang ini jika anda menjalankan linux. karena linux adalah open source, semua programmer dapat melihat kodenya. jika ada sesuatu yang tidak dilakukan dengan baik, saya dapat memperbaruinya. setelah memperbarui, saya dapat memeriksanya. semua orang menambahkan bahan bakar ke dalam api, dan anda dapat terus membuat kemajuan raksasa. namun hal ini tidak benar di era model besar, orang sering membicarakan betapa mahalnya gpu, dan daya komputasi merupakan faktor kunci yang menentukan keberhasilan atau kegagalan model besar.apakah model sumber terbuka memberi anda kekuatan komputasi? jika ini tidak memberi anda daya komputasi, bagaimana cara menggunakannya secara efisien? model open source tidak dapat menyelesaikan masalah ini.

di masa lalu, anda telah membayar daya komputasi saat membeli komputer, namun hal ini tidak berlaku untuk inferensi model besar. inferensi ini sebenarnya sangat mahal. oleh karena itu, nilai model besar open source ada pada bidang pengajaran dan penelitian. jika ingin memahami cara kerja model besar, jika tidak mengetahui kode sumbernya pasti akan ada kerugiannya bidang, ketika anda mengejar efisiensi, efeknya, ketika mengejar biaya terendah, model open source tidak memiliki keuntungan.

bertanya:bagaimana aplikasi ai akan berkembang? mengapa penekanannya pada kecerdasan?

robin li: proses pengembangan model besar harus melalui tahapan-tahapan ini, awalnya masyarakat dibantu, dan akhirnya kalau ada yang keluar, masyarakat harus lolos pemeriksaan akhiroke, itu akan dikeluarkan hanya jika bagus dalam semua aspek. ini adalah tahap copilot; lebih jauh lagi adalah kecerdasan agen. dunia luar memiliki berbagai definisi berbeda tentang agen otonomi., dengan kemampuan untuk menggunakan alat secara mandiri, berefleksi, mengembangkan diri, dll.; jika tingkat otomatisasi ini melangkah lebih jauh, ia akan menjadi apa yang disebut pekerja al, yang mampu melakukan berbagai pekerjaan mental dan fisik seperti manusia, dan seluruh aspek pekerjaan dapat diselesaikan secara mandiri. harus ada proses seperti itu.

penilaian bahwa "agen cerdas adalah arah pengembangan paling penting dari model besar" sebenarnya bersifat non-konsensus. pada konferensi baidu create, kami merilis tiga produk, agentbuilder, appbuilder, dan modelbuilder. agentbuilder dan appbuilder keduanya tentang agen. yang satu memiliki ambang batas yang lebih rendah dan yang lainnya memiliki fungsi yang lebih kuat. setelah kami jelaskan, beberapa orang akhirnya mulai memahami bahwa benda ini memang menarik, dapat menghasilkan nilai, dan dapat dibuat dengan ambang batas yang relatif rendah sehingga semua orang merasa dapat menggunakannya. sejak itu, popularitas agen cerdas secara bertahap meningkat, dan banyak orang mulai optimis terhadap arah pengembangan agen cerdas.namun saat ini, intelijen bukanlah sebuah konsensus. tidak banyak perusahaan seperti baidu yang menganggap intelijen sebagai strategi terpenting dan arah pengembangan model besar yang paling penting.

mengapa kita begitu menekankan pada agen? karena ambang batas untuk agen cerdas memang sangat rendah. tahun lalu kami mengatakan bahwa kami harus meluncurkan aplikasi dan semua orang harus membuat aplikasi apakah arah ini dapat dilakukan. kemampuan apa yang harus saya gunakan? ada banyak ketidakpastian untuk dapat menghasilkan nilai dalam skenario ini, dan semua orang tidak tahu bagaimana berpindah dari model ke aplikasi.namun agen menyediakan cara yang sangat langsung, sangat efisien, dan sangat sederhana. cukup mudah untuk membangun agen di atas model., itulah sebabnya puluhan ribu agen baru dibuat di platform wenxin setiap minggunya.

dari segi agen, kami sudah melihat trennya dan memiliki prasyarat yang relatif baik. selain kapabilitas model itu sendiri yang kuat, kami juga memiliki saluran distribusi yang baik. milik baiduapp, khususnya pencarian baidu milikimiliaran orangdalam penggunaannya, pengguna secara aktif mengungkapkan kebutuhan mereka kepada kami, agen cerdas mana yang dapat menjawab pertanyaannya dengan lebih baik dan memenuhi kebutuhannya. ini adalah proses pencocokan alami, sehingga kami dapat membantu pengembang ini mendistribusikannya.

laporan/umpan balik

berita

pidato internal robin li mengungkapkan: membahas tiga kesalahpahaman kognitif utama tentang model besar, kesenjangan antar model akan semakin lebar di masa depan

perkenalan

informasi kontak saya