моя контактная информация
почта[email protected]
2024-09-06
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
6 сентября it house сообщил, что официальный публичный аккаунт face wall intelligence опубликовал вчера (5 сентября) сообщение в блоге, в котором объявляется о запуске модели искусственного интеллекта minicpm3-4b с открытым исходным кодом, утверждая, что «приближается момент для chatgpt на стороне клиента». ."
minicpm3-4b — это продукт третьего поколения серии minicpm. его общая производительность превышает производительность phi-3.5-mini-instruct и gpt-3.5-turbo-0125 и сравнима со многими моделями ai с 7–9 миллиардами параметров.
по сравнению с minicpm1.0/minicpm2.0, minicpm3-4b обладает более мощным и универсальным набором навыков, который можно использовать для более широкого спектра целей. minicpm3-4b поддерживает вызовы функций и интерпретаторы кода.
ниже приведены различия между тремя вариантами структуры модели (1->2->3):
размер списка слов: 123 кб-> 73 кб-> 73 кб.
количество слоев модели: 40->52->62.
узлы скрытого слоя: 2304->1536->2560.
максимальная длина: 4к->4к->32к
слова системной подсказки: не поддерживается -> не поддерживается -> поддерживается.
вызовы инструментов и интерпретаторы кода: не поддерживается -> не поддерживается -> поддерживается.
minicpm3-4b имеет контекстное окно размером 32 кб. с помощью llmxmapreduce minicpm3-4b не требует слишком много памяти и может обрабатывать теоретически бесконечные контексты.
facewall intelligence также выпустила модель minicpm-embedding пакета rag и модель minicpm-reranker, а также выпустила доработанную версию модели minicpm3-rag-lora для сценариев rag.