notícias

"chegou o momento do chatgpt do lado do cliente", face wall intelligence lança modelo de ia minicpm3-4b de código aberto xiaogangpao

2024-09-06

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

a it house informou em 6 de setembro que a conta pública oficial da face wall intelligence publicou uma postagem no blog ontem (5 de setembro), anunciando o lançamento do modelo de código aberto minicpm3-4b ai, alegando que "o momento do chatgpt do lado do cliente está chegando ."

minicpm3-4b é o produto de terceira geração da série minicpm. seu desempenho geral excede o de phi-3.5-mini-instruct e gpt-3.5-turbo-0125 e é comparável a muitos modelos de ia com 7 bilhões a 9 bilhões de parâmetros.

comparado ao minicpm1.0 / minicpm2.0, o minicpm3-4b possui um conjunto de habilidades mais poderoso e versátil que pode ser usado para uma ampla gama de finalidades. minicpm3-4b suporta chamadas de função e interpretadores de código.

a seguir estão as diferenças entre as três versões da estrutura do modelo (1->2->3):

tamanho da lista de palavras: 123k->73k->73k

número de camadas do modelo: 40->52->62

nós da camada oculta: 2304->1536->2560

comprimento máximo: 4k->4k->32k

palavras de prompt do sistema: não suportado -> não suportado -> suportado

chamadas de ferramentas e interpretadores de código: não suportado -> não suportado -> suportado

minicpm3-4b possui uma janela de contexto de 32k. com a ajuda do llmxmapreduce, o minicpm3-4b não precisa ocupar muita memória e pode lidar com contextos teoricamente infinitos.

facewall intelligence também lançou o modelo minicpm-embedding do conjunto rag e o modelo minicpm-reranker, e também lançou uma versão ajustada do modelo minicpm3-rag-lora para cenários rag.