berita

masih kesulitan dengan mantra ai? universitas peking-baichuan telah mengembangkan sistem rekayasa pengingat otomatis pas

2024-09-10

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

kolom aixiv adalah kolom tempat machine heart menerbitkan konten akademis dan teknis. dalam beberapa tahun terakhir, kolom heart of the machine aixiv telah menerima lebih dari 2.000 laporan, mencakup laboratorium terkemuka dari universitas dan perusahaan besar di seluruh dunia, yang secara efektif mempromosikan pertukaran dan diseminasi akademis. jika anda memiliki karya luar biasa yang ingin anda bagikan, silakan berkontribusi atau hubungi kami untuk pelaporan. email pengiriman: [email protected]; [email protected]

zheng miao, salah satu penulis pertama makalah ini, berasal dari tim penyelarasan baichuan yang dipimpin oleh zhou zenan. ia lulus dari universitas peking. minat penelitiannya mencakup model bahasa besar, pembelajaran multi-modal, dan visi komputer proyek seperti mmflow. rekan penulis pertama liang hao adalah mahasiswa doktoral di institute of frontier interdisciplinary studies di universitas peking. arah penelitiannya adalah sisi data model besar, dan penasihatnya adalah profesor zhang wentao. laboratorium gabungan sistem ai cerdas universitas peking-baichuan didirikan pada januari 2024. laboratorium ini bertujuan untuk mempelajari isu-isu penting seperti pembuatan data ilmiah dan sistematis serta strategi penilaian kualitas, pelatihan model besar, dan percepatan inferensi di seluruh proses teknis sistem model kecerdasan buatan. . laboratorium gabungan ini dipimpin oleh cui bin, profesor terhormat boya di universitas peking, dan chen weipeng, salah satu pendiri baichuan intelligence.

model bahasa besar berdasarkan arsitektur transformer mencapai hasil terobosan di berbagai bidang. rekayasa cepat memainkan peran penting dalam hal ini.

dengan kata-kata petunjuk yang baik, peneliti dan pengembang dapat memandu model agar bekerja lebih baik pada tugas tertentu. metode ini tidak hanya dapat meningkatkan performa model secara signifikan, tetapi juga meningkatkan kemampuan adaptasi model, sehingga lebih fleksibel dan efisien saat menghadapi berbagai tugas kompleks.

selain itu, proyek kata cepat juga dapat mengoptimalkan proses pembelajaran model, meningkatkan efisiensi pemrosesan masalah yang kompleks, dan mengurangi waktu pelatihan dan kebutuhan sumber daya komputasi.

dibandingkan dengan metode penyesuaian tradisional, rekayasa kata cepat dapat mengadaptasi model ke beberapa tugas hilir dengan biaya yang sangat rendah, sehingga secara signifikan menghemat sumber daya komputasi dan biaya pengumpulan data. namun, merancang kata-kata isyarat yang efektif masih merupakan tantangan bagi non-ahli dan sering kali memerlukan banyak pembelajaran dan latihan.

biasanya sulit untuk mencapai hasil ideal dengan langsung menggunakan model bahasa besar untuk proyek dorongan otomatis. perintah yang tidak tepat dapat mengganggu model dan justru menurunkan performa. oleh karena itu, sangat penting untuk mengembangkan sistem rekayasa prompt otomatis yang dapat membantu pengguna dan mudah dioperasikan.

pas: sistem rekayasa peringatan otomatis yang inovatif

untuk mengatasi tantangan ini, laboratorium gabungan universitas peking-baichuan mengusulkan sistem rekayasa cepat otomatis pas. inovasi pas adalah:

1. rancang kumpulan data perintah otomatis berkualitas tinggi

2. melakukan pembelajaran beberapa sampel dan penyaringan data pada model gpt

3. secara otomatis membuat kumpulan data cepat yang efisien dan efisien

4. menerapkan rekayasa cepat otomatis yang efektif melalui penyesuaian

pas dapat melengkapi masukan pengguna secara ringkas dan efektif, mewujudkan proyek cepat yang cepat, sederhana, dan otomatis yang mendukung tampilan streaming.

dalam beberapa pengujian benchmark, pas jauh mengungguli model sota yang ada dan membutuhkan lebih sedikit data. hasil evaluasi manual juga menunjukkan bahwa pas memiliki kinerja yang sangat baik, sehingga menunjukkan potensi besar dalam penerapan praktis.

hasil terobosan ini tidak hanya mendorong pengembangan rekayasa kata cepat, namun juga membuka jalan bagi penerapan model bahasa besar di berbagai bidang.

  • alamat makalah: https://arxiv.org/abs/2407.06027

  • pku-baichuan-mlsystemlab:

https://github.com/pku-baichuan-mlsystemlab

https://huggingface.co/pku-baichuan-mlsystemlab

metode

pelatihan pas pada dasarnya dibagi menjadi tiga langkah:

langkah 1: bangun kumpulan data masalah berkualitas tinggi

tugas pertama dalam pelatihan pas adalah membangun kumpulan data masalah berkualitas tinggi. seperti yang ditunjukkan pada gambar (a), para peneliti menyaring pertanyaan berkualitas tinggi berdasarkan kumpulan data lmsys-1m dan wildchat melalui tiga aspek berikut:

1. deduplikasi data: gunakan teknologi penyematan yang dikombinasikan dengan algoritme pengelompokan untuk menghapus data duplikat secara efektif.

2. penyaringan kualitas: gunakan model besar baichuan untuk mengevaluasi dan menyaring kualitas data.

3. jaminan keberagaman: 9.000 data pertanyaan berkualitas tinggi yang mencakup lebih dari 10 kategori akhirnya dipilih.

langkah 2: lengkapi data teknik yang cepat

pada tahap ini, para peneliti secara komprehensif menggunakan 100 data berkualitas tinggi yang dikumpulkan secara internal dan data masalah disaring pada langkah pertama, dan menggunakan metode pembelajaran beberapa langkah untuk membangun data rekayasa cepat otomatis dengan bantuan model gpt:

1. pembuatan data awal: gunakan pembelajaran singkat untuk memandu gpt dalam menghasilkan data teknis awal yang cepat.

2. kontrol kualitas: rancang langkah kritik dan gunakan pembelajaran beberapa kali lagi agar gpt mengevaluasi kualitas data yang dihasilkan.

3. pengoptimalan berulang: secara otomatis menyaring data berkualitas rendah dan membuatnya kembali untuk memastikan kualitas data melalui beberapa putaran iterasi.

4. hasil akhir: 9.000 lembar data rekayasa cepat otomatis berkualitas tinggi akhirnya diperoleh.

distribusi data

distribusi 9000 data yang dihasilkan ditunjukkan pada gambar di atas, memastikan keragaman dan keterwakilan data.

langkah 3: sempurnakan model perintah otomatis

langkah terakhir akan menggunakan kumpulan data yang diperoleh dalam dua tahap pertama untuk menyempurnakan model bahasa besar:

1. pilih model dasar: seperti qwen2-7b dan model lainnya.

2. penyempurnaan terarah: gunakan kumpulan data berkualitas tinggi untuk penyempurnaan.

3. pelatihan khusus: akhirnya, model bahasa besar diperoleh khusus untuk proyek prompt otomatis.

eksperimen dan hasil

tinjauan manual

menurut evaluasi manusia evaluator, pas menunjukkan tingkat kemenangan yang lebih tinggi di berbagai bidang dibandingkan dengan model sota (state-of-the-art) sebelumnya. tingkat kemenangan rata-rata di banyak bidang melebihi 50%, dan jumlah tingkat kemenangan dan tingkat undian mencapai lebih dari 80%.

tolok ukur evaluasi mesin

untuk mengevaluasi kinerja pas secara komprehensif, para peneliti memilih tiga benchmark: arena-hard, alpaca-eval 2.0, dan alpaca-eval 2.0 (lc).

para peneliti kemudian menerapkan pas pada enam model ai teratas, termasuk:

  • gpt-4 (tiga versi)

  • gpt-3.5

  • qwen2-72-instruksikan

  • llama3-70b-instruksikan

hasil evaluasi menunjukkan:

  • pas mencapai peningkatan yang signifikan dibandingkan kasus no-prompt dan model rekayasa auto-prompt sota sebelumnya.

  • dibandingkan dengan model bpo sebelumnya, pas menunjukkan kemampuan beradaptasi yang lebih besar, kompatibel dengan berbagai model yang sangat besar, dan mencapai peningkatan kinerja pada setiap model.

analisis efisiensi komputasi

pas tidak hanya berkinerja baik dalam hal kinerja, namun juga sangat efisien secara komputasi: dalam hal efisiensi data, pas hanya memerlukan 9000 lembar data yang telah disesuaikan untuk menunjukkan kinerja yang unggul. dalam hal efisiensi keluaran, ini dapat membatasi panjang perintah otomatis tambahan, biasanya tidak lebih dari 30 kata.

dalam hal pengalaman pengguna, pas juga memberikan keuntungan pada model besar, khususnya:

  • berbeda dengan model sebelumnya seperti bpo, pas tidak perlu mengubah pertanyaan awal pengguna, hanya perintah otomatis tambahan.

  • memberikan pengalaman pengguna yang luar biasa dengan waktu respons yang dapat dikontrol.

  • mendukung tampilan streaming seperti gpt untuk lebih meningkatkan pengalaman interaktif.

contoh: pas membantu model besar menghindari jebakan logika

“jika ada 10 burung di pohon dan salah satunya mati tertembak, berapa banyak burung yang ada di tanah?”

pertanyaan yang tampaknya sederhana ini sebenarnya menyembunyikan jebakan logis yang cerdik. saat anda melihatnya, mungkin perlu beberapa detik bagi anda untuk menyadari bahwa ada 9 burung tersisa di pohon dan hanya 1 di tanah.

seperti terlihat pada gambar, tanpa bantuan pas, gpt memberikan jawaban yang salah. sistem pas secara signifikan meningkatkan kinerja model dengan menambahkan kata-kata cepat:

di bawah bimbingan pas, putaran jawaban model yang baru menunjukkan peningkatan yang signifikan. model ini tidak hanya berhasil menghindari jebakan logis dalam pertanyaan, menunjukkan proses penalaran logis multi-langkah yang jelas, tetapi juga memberikan jawaban yang benar seluruh proses penalaran.

pembaca yang tertarik dapat membaca teks asli makalah untuk mempelajari lebih lanjut isi penelitian.