uutiset

"asiakaspuolen chatgpt:n hetki on saapunut", face wall intelligence julkaisee xiaogangpaon avoimen lähdekoodin minicpm3-4b ai -mallin

2024-09-06

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

it house raportoi 6. syyskuuta, että face wall intelligencen virallinen julkinen tili julkaisi eilen (5. syyskuuta) blogiviestin, jossa kerrottiin avoimen lähdekoodin minicpm3-4b ai -mallin lanseerauksesta ja väitti, että "asiakaspuolen chatgpt:n hetki on tulossa. ."

minicpm3-4b on minicpm-sarjan kolmannen sukupolven tuote. sen kokonaissuorituskyky ylittää phi-3.5-mini-instructin ja gpt-3.5-turbo-0125:n, ja se on verrattavissa moniin tekoälymalleihin 7–9 miljardilla parametrilla.

minicpm1.0:aan / minicpm2.0:aan verrattuna minicpm3-4b:ssä on tehokkaampi ja monipuolisempi taitosarja, jota voidaan käyttää moniin erilaisiin tarkoituksiin. minicpm3-4b tukee funktiokutsuja ja kooditulkkeja.

seuraavassa on erot mallirakenteen kolmen version välillä (1->2->3):

sanaluettelon koko: 123k->73k->73k

mallikerrosten lukumäärä: 40->52->62

piilotetut tason solmut: 2304->1536->2560

maksimipituus: 4k->4k->32k

järjestelmän kehotesanat: ei tuettu -> ei tuettu -> tuettu

työkalukutsut ja kooditulkit: ei tuettu -> ei tuettu -> tuettu

minicpm3-4b:ssä on 32 000 kontekstiikkuna. llmxmapreducen avulla minicpm3-4b ei tarvitse liikaa muistia ja pystyy käsittelemään teoreettisesti äärettömiä yhteyksiä.

facewall intelligence julkaisi myös rag-sarjan minicpm-embedding- ja minicpm-reranker-mallin sekä myös hienosäädetyn version minicpm3-rag-lora-mallista rag-skenaarioihin.