berita

"momen untuk chatgpt sisi klien telah tiba", face wall intelligence meluncurkan model ai minicpm3-4b open source xiaogangpao

2024-09-06

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

it house melaporkan pada tanggal 6 september bahwa akun publik resmi face wall intelligence menerbitkan postingan blog kemarin (5 september), mengumumkan peluncuran model ai minicpm3-4b open source, mengklaim bahwa "momen untuk chatgpt sisi klien akan datang ."

minicpm3-4b adalah produk generasi ketiga dari seri minicpm. performa keseluruhannya melebihi phi-3.5-mini-instruct dan gpt-3.5-turbo-0125, dan sebanding dengan banyak model ai dengan 7 miliar hingga 9 miliar parameter.

dibandingkan dengan minicpm1.0 / minicpm2.0, minicpm3-4b memiliki keahlian yang lebih kuat dan serbaguna yang dapat digunakan untuk tujuan yang lebih luas. minicpm3-4b mendukung panggilan fungsi dan penerjemah kode.

berikut perbedaan ketiga versi struktur model (1->2->3):

ukuran daftar kata: 123k->73k->73k

jumlah lapisan model: 40->52->62

node lapisan tersembunyi: 2304->1536->2560

panjang maksimum: 4k->4k->32k

kata-kata perintah sistem: tidak didukung -> tidak didukung -> didukung

panggilan alat dan penerjemah kode: tidak didukung -> tidak didukung -> didukung

minicpm3-4b memiliki jendela konteks 32k. dengan bantuan llmxmapreduce, minicpm3-4b tidak perlu menggunakan terlalu banyak memori dan dapat menangani konteks yang secara teoritis tidak terbatas.

facewall intelligence juga merilis model minicpm-embedding rag suite dan model minicpm-reranker, dan juga merilis versi model minicpm3-rag-lora yang telah disempurnakan untuk skenario rag.