berita

Llama 3.1, "European OpenAI" merilis model open source baru Large 2 |

2024-07-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Penulis |.Wang Yixin

Penyunting|Anita Tang

Kurang dari sehari setelah Meta merilis model besar open source terbaru Llama 3.1, startup AI asal Perancis, Mistral, datang untuk memulainya - pada tanggal 24 Juli, Mistral merilis model andalan barunya, Large 2.

Mistral AI adalah perusahaan rintisan AI Perancis yang baru berdiri selama satu tahun. Ia juga merupakan pemain AI yang memiliki pendanaan paling besar dan kompetitif di Eropa sejauh ini seperti Lianchuang Mensch. Penulis makalah model besar seperti Chinchilla telah mengusulkan teknologi inti termasuk Scaling Laws.

Hanya 4 minggu setelah didirikan pada Juni 2023, Mistral AI menerima pembiayaan sebesar 105 juta euro dengan tim yang terdiri dari 6 orang. Perusahaan ini berfokus pada penelitian dan pengembangan model-model besar open source dan telah dipuji oleh Presiden Prancis Macron sebagai "model bagi generasi baru start-up Eropa untuk bersaing dengan raksasa teknologi Amerika."

Pada bulan Desember 2023, Mistral merilis model besar open source yang disebut Mistral 8x7B, yang memiliki 56 miliar parameter. Efisiensi dan kinerjanya sebanding dengan LLaMA-65B, dan langsung menjadi hit di industri model besar. Selain itu, perusahaan juga melakukan benchmark pada ChatGPT dan meluncurkan asisten percakapan multi-bahasa yang disebut Le Chat (situs web resmi menunjukkan bahwa ini masih dalam tahap pengujian dan memerlukan registrasi dan permohonan untuk kualifikasi pengujian) untuk menunjukkan kemampuan teknis terkini perusahaan.

Mistral mengatakan bahwa Large 2 melampaui Llama 3.1 405B dalam kemampuan pembuatan kode, matematika, dan penalaran menggunakan kurang dari sepertiga parameter Llama 3.1 405B, atau 123 miliar parameter, dan mengungguli model AI terkemuka lainnya dalam menghasilkan respons yang lebih ringkas dan menghindari terlalu banyak deskripsi yang panjang. Artinya Large 2 memiliki keunggulan lebih dari segi biaya, dan pengembang dapat menjalankannya secara lokal lebih cepat.

Seperti Llama 3.1 dari Meta, Large 2 tidak memiliki kemampuan multi-modal, tetapi dalam hal akurasi dan keandalan respons dialog, ini dapat dibandingkan dengan "sedikit lebih besar" dari Llama. Mistral mengatakan, masalah halusinasi model menjadi salah satu fokus selama proses pelatihan Large 2. Selain itu, Large 2 juga meningkatkan kemampuan mengikuti perintah dan tugas percakapan, menangani instruksi yang tepat, dan percakapan multi-putaran yang panjang.

Large 2 memiliki panjang konteks 128k dan dapat menerima karakter sebanyak 300 halaman buku dalam satu percakapan. Selain itu, Large 2 mendukung berbagai bahasa dan dapat menangani bahasa Inggris, Prancis, Jerman, Spanyol, Italia, Portugis, Arab, Hindi, Rusia, Cina, Jepang, dan Korea, serta 80 bahasa kode.


Sumber: Situs web resmi Mistral

Perlu diperhatikan bahwa model Mistral bukanlah model sumber terbuka dalam pengertian tradisional, dan penggunaan komersial memerlukan pembayaran.

Saat ini, Large 2 telah memasuki platform Google, Amazon, Azure dan IBM untuk digunakan pengguna. Pengguna juga dapat merasakannya melalui "mistral-large-2407" di La Plateforme Mistral (platform komprehensif yang menyederhanakan pengembangan aplikasi AI dan menyediakan model terlatih, alat pemrosesan data, dan antarmuka API), atau mengujinya secara gratis di Le Chat.

Mistral menyelesaikan pembiayaan Seri B pada bulan Juni tahun ini, mengumpulkan total US$640 juta dan valuasi sebesar US$6 miliar. Putaran pendanaan ini dipimpin oleh General Catalyst, dan investornya juga termasuk Lightspeed Venture Partners, Andreessen Horowitz, Nvidia, Samsung Ventures, dan IBM.

Mistral AI saat ini memiliki sekitar 60 karyawan, 45 di antaranya berada di Perancis, 10 di Amerika Serikat, dan lima di Inggris. Sekitar tiga perempat karyawannya bekerja dalam pengembangan produk dan penelitian, menurut Financial Times.