berita

NVIDIA merilis model AI baru dengan 8 miliar parameter: sangat akurat, efisien, dan dapat diterapkan pada stasiun kerja RTX

2024-08-23

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

IT House melaporkan pada tanggal 23 Agustus bahwa NVIDIA menerbitkan postingan blog pada tanggal 21 Agustus, merilis model AI bahasa kecil Mistral-NeMo-Minitron 8B, yang memiliki keunggulan akurasi tinggi dan efisiensi komputasi tinggi, serta dapat digunakan dalam data yang dipercepat GPU pusat, cloud dan Jalankan model di workstation.

NVIDIA dan Mistral AI merilis model Mistral NeMo 12B open source bulan lalu. Berdasarkan hal ini, NVIDIA sekali lagi meluncurkan model Mistral-NeMo-Minitron 8B, dengan total 8 miliar parameter, yang dapat dijalankan pada workstation yang dilengkapi dengan NVIDIA. Kartu grafis RTX.

Nvidia menyatakan memperoleh Mistral-NeMo-Minitron 8B melalui pemangkasan lebar (width-pruning) Mistral NeMo 12B dan pelatihan ulang ringan melalui penyulingan pengetahuan (distilasi pengetahuan). Hasil yang relevan dipublikasikan dalam makalah "Compact Language Models via Pruning and Knowledge Distilasi" tengah.

Pemangkasan mengecilkan jaringan saraf dengan menghilangkan bobot model yang memberikan kontribusi paling kecil terhadap akurasi. Selama proses "distilasi", tim melatih kembali model yang telah dipangkas pada kumpulan data kecil untuk meningkatkan akurasi secara signifikan yang telah berkurang akibat proses pemangkasan.

Dalam hal ukurannya, Mistral-NeMo-Minitron 8B memimpin dengan selisih yang besar pada sembilan tolok ukur populer untuk model bahasa. Tolok ukur ini mencakup berbagai tugas, termasuk pemahaman bahasa, penalaran akal sehat, penalaran matematis, merangkum, pengkodean, dan kemampuan menghasilkan jawaban otentik. IT Home melampirkan hasil tes terkait sebagai berikut: