berita

Meta merilis Llama 3.1, model open source terkuat, Zuckerberg: Ini akan menjadi titik balik bagi industri

2024-07-24

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Pada malam tanggal 23 Juli waktu Beijing, Meta secara resmi merilis model besar open source terbaru seri Llama 3.1, yang semakin mempersempit kesenjangan antara model open source dan model sumber tertutup. Llama 3.1 mencakup 3 ukuran parameter 8B, 70B, dan 450B. Model parameter 450B telah melampaui GPT-4o OpenAI dalam beberapa pengujian benchmark dan sebanding dengan model sumber tertutup terkemuka seperti Claude 3.5 Sonnet.


Pendiri dan CEO Meta Zuckerberg memposting blog di situs resminya sekaligus untuk membangun momentum untuk rilis ini. Dia mengatakan bahwa versi Llama 3.1 akan menjadi titik balik dalam industri. Sebagian besar pengembang akan mulai menggunakan open source, dan terbuka sumber AI adalah masa depan.

Ilmuwan peneliti senior NVIDIA, Jim Fan, memposting postingan di X untuk mengucapkan selamat kepada tim Meta. Ia menyebutkan, "Kekuatan GPT-4 ada di tangan kita. (Ini) adalah momen yang benar-benar bersejarah."

Dalam hal detail spesifiknya, jendela konteks model dari tiga versi Llama 3.1 telah meningkat dari 8k menjadi 128K, diperluas 16 kali, dan mendukung 8 bahasa secara bersamaan. Model Llama 3.1 -405B menggunakan lebih dari 15 triliun token untuk pelatihan, dan untuk mencapai skala pelatihan ini, tim menggunakan 16,000 GPU H100. Secara resmi, model 405B adalah model Llama pertama yang dilatih pada skala ini.

Model bahasa besar sumber terbuka sebagian besar tertinggal dibandingkan model sumber tertutup dalam hal fungsionalitas dan kinerja, “tetapi sekarang kita memasuki era baru yang dipimpin oleh sumber terbuka.”

Dalam blog resminya, Meta mengevaluasi kinerja lebih dari 150 kumpulan data benchmark dan membandingkan kinerja Llama 3.1 dengan model lainnya. Model andalan Llama 3.1 -405B dapat bersaing dengan GPT dalam serangkaian tugas seperti akal sehat, pengoperasian, dan lain-lain. dan matematika. -4, GPT-4o sebanding dengan Claude 3.5 Soneta. Selain itu, model kecil 8B dan 70B bersaing dengan model sumber tertutup dan sumber terbuka dengan jumlah parameter yang serupa.


Dalam skenario kehidupan nyata, Llama 3.1 405B dibandingkan dengan evaluasi manusia dan kinerjanya secara keseluruhan lebih baik daripada GPT-4o dan Claude 3.5 Sonnet.


Kali ini Meta juga memperbarui lisensi open source, memungkinkan pengembang untuk menggunakan keluaran model Llama (termasuk 405B) untuk pertama kalinya untuk menyempurnakan model lainnya. Saat melakukan benchmarking pada GPT-4o, para pejabat mengatakan bahwa mereka juga akan menggunakan metode kombinasi untuk mengintegrasikan fungsi gambar, video, dan suara ke dalam Llama 3, sehingga model tersebut dapat mengenali gambar dan video serta mendukung interaksi melalui suara. Namun fitur ini masih dalam pengembangan dan belum siap dirilis.

Dalam blog resminya, Meta menyebutkan total unduhan seluruh versi Llama sejauh ini telah melampaui 300 juta kali lipat.

Selain rilis model ini, Zuckerberg juga menerbitkan artikel panjang "Open Source AI Is the Path Forward" di situs resminya, yang menyebutkan pentingnya open source. Ia percaya bahwa open source bermanfaat bagi semua pengembang, Meta, dan bagi dunia.


Zuckerberg mengutip kemenangan sistem sumber terbuka Linux atas sistem sumber tertutup Unix sebagai contoh, dan percaya bahwa kecerdasan buatan akan berkembang dengan cara yang sama. “Ada beberapa perusahaan teknologi yang mengembangkan model tertutup terkemuka, namun open source dengan cepat menutup kesenjangan tersebut.” Ia menyebutkan bahwa tahun lalu, Llama 2 hanya bisa dibandingkan dengan model generasi lama. Dan tahun ini, Llama 3 kompetitif di beberapa area dan bahkan mengungguli model tercanggih di beberapa area.

Zuckerberg percaya bahwa open source dapat mendorong inovasi, mengurangi biaya, dan meningkatkan keamanan. Bagi pengembang, memanfaatkan sumber terbuka memungkinkan Anda melatih, menyempurnakan, dan menyaring model Anda sendiri. Setiap organisasi memiliki kebutuhan yang berbeda, dan kebutuhan tersebut paling baik dipenuhi dengan menggunakan model dengan ukuran berbeda yang dilatih atau disesuaikan pada data tertentu. dari.

Pada saat yang sama, pengembang tidak terkunci pada vendor tertutup untuk melindungi keamanan data. “Perangkat lunak open source cenderung lebih aman karena pengembangannya lebih transparan dan dapat ditinjau secara luas.”

Zuckerberg juga menyebutkan bahwa model open source lebih murah dan efisien. Pengembang dapat menjalankan inferensi pada Llama 3.1 405B pada infrastruktur mereka sendiri dengan biaya sekitar 50% dibandingkan menggunakan model tertutup seperti GPT-4o%, cocok untuk antarmuka pengguna dan tugas inferensi offline.

“Kecerdasan buatan open source mewakili peluang terbaik di dunia.” Dalam pandangan Zuckerberg, penggunaan teknologi ini dapat menciptakan peluang ekonomi dan keamanan terbesar.