2024-09-06
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
it house raportoi 6. syyskuuta, että face wall intelligencen virallinen julkinen tili julkaisi eilen (5. syyskuuta) blogiviestin, jossa kerrottiin avoimen lähdekoodin minicpm3-4b ai -mallin lanseerauksesta ja väitti, että "asiakaspuolen chatgpt:n hetki on tulossa. ."
minicpm3-4b on minicpm-sarjan kolmannen sukupolven tuote. sen kokonaissuorituskyky ylittää phi-3.5-mini-instructin ja gpt-3.5-turbo-0125:n, ja se on verrattavissa moniin tekoälymalleihin 7–9 miljardilla parametrilla.
minicpm1.0:aan / minicpm2.0:aan verrattuna minicpm3-4b:ssä on tehokkaampi ja monipuolisempi taitosarja, jota voidaan käyttää moniin erilaisiin tarkoituksiin. minicpm3-4b tukee funktiokutsuja ja kooditulkkeja.
seuraavassa on erot mallirakenteen kolmen version välillä (1->2->3):
sanaluettelon koko: 123k->73k->73k
mallikerrosten lukumäärä: 40->52->62
piilotetut tason solmut: 2304->1536->2560
maksimipituus: 4k->4k->32k
järjestelmän kehotesanat: ei tuettu -> ei tuettu -> tuettu
työkalukutsut ja kooditulkit: ei tuettu -> ei tuettu -> tuettu
minicpm3-4b:ssä on 32 000 kontekstiikkuna. llmxmapreducen avulla minicpm3-4b ei tarvitse liikaa muistia ja pystyy käsittelemään teoreettisesti äärettömiä yhteyksiä.
facewall intelligence julkaisi myös rag-sarjan minicpm-embedding- ja minicpm-reranker-mallin sekä myös hienosäädetyn version minicpm3-rag-lora-mallista rag-skenaarioihin.