новости

«настал момент для клиентского chatgpt», face wall intelligence запускает модель искусственного интеллекта xiaogangpao с открытым исходным кодом minicpm3-4b

2024-09-06

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

6 сентября it house сообщил, что официальный публичный аккаунт face wall intelligence опубликовал вчера (5 сентября) сообщение в блоге, в котором объявляется о запуске модели искусственного интеллекта minicpm3-4b с открытым исходным кодом, утверждая, что «приближается момент для chatgpt на стороне клиента». ."

minicpm3-4b — это продукт третьего поколения серии minicpm. его общая производительность превышает производительность phi-3.5-mini-instruct и gpt-3.5-turbo-0125 и сравнима со многими моделями ai с 7–9 миллиардами параметров.

по сравнению с minicpm1.0/minicpm2.0, minicpm3-4b обладает более мощным и универсальным набором навыков, который можно использовать для более широкого спектра целей. minicpm3-4b поддерживает вызовы функций и интерпретаторы кода.

ниже приведены различия между тремя вариантами структуры модели (1->2->3):

размер списка слов: 123 кб-> 73 кб-> 73 кб.

количество слоев модели: 40->52->62.

узлы скрытого слоя: 2304->1536->2560.

максимальная длина: 4к->4к->32к

слова системной подсказки: не поддерживается -> не поддерживается -> поддерживается.

вызовы инструментов и интерпретаторы кода: не поддерживается -> не поддерживается -> поддерживается.

minicpm3-4b имеет контекстное окно размером 32 кб. с помощью llmxmapreduce minicpm3-4b не требует слишком много памяти и может обрабатывать теоретически бесконечные контексты.

facewall intelligence также выпустила модель minicpm-embedding пакета rag и модель minicpm-reranker, а также выпустила доработанную версию модели minicpm3-rag-lora для сценариев rag.