minhas informações de contato
correspondênciaadmin@informação.bz
2024-09-06
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
a it house informou em 6 de setembro que a conta pública oficial da face wall intelligence publicou uma postagem no blog ontem (5 de setembro), anunciando o lançamento do modelo de código aberto minicpm3-4b ai, alegando que "o momento do chatgpt do lado do cliente está chegando ."
minicpm3-4b é o produto de terceira geração da série minicpm. seu desempenho geral excede o de phi-3.5-mini-instruct e gpt-3.5-turbo-0125 e é comparável a muitos modelos de ia com 7 bilhões a 9 bilhões de parâmetros.
comparado ao minicpm1.0 / minicpm2.0, o minicpm3-4b possui um conjunto de habilidades mais poderoso e versátil que pode ser usado para uma ampla gama de finalidades. minicpm3-4b suporta chamadas de função e interpretadores de código.
a seguir estão as diferenças entre as três versões da estrutura do modelo (1->2->3):
tamanho da lista de palavras: 123k->73k->73k
número de camadas do modelo: 40->52->62
nós da camada oculta: 2304->1536->2560
comprimento máximo: 4k->4k->32k
palavras de prompt do sistema: não suportado -> não suportado -> suportado
chamadas de ferramentas e interpretadores de código: não suportado -> não suportado -> suportado
minicpm3-4b possui uma janela de contexto de 32k. com a ajuda do llmxmapreduce, o minicpm3-4b não precisa ocupar muita memória e pode lidar com contextos teoricamente infinitos.
facewall intelligence também lançou o modelo minicpm-embedding do conjunto rag e o modelo minicpm-reranker, e também lançou uma versão ajustada do modelo minicpm3-rag-lora para cenários rag.