ニュース

「クライアント側 chatgpt の時が来た」、face wall intelligence が xiaogangpao オープンソース minicpm3-4b ai モデルを発表

2024-09-06

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

9 月 6 日の it house ニュースによると、face wall intelligence の公式公開アカウントは昨日 (9 月 5 日)、ブログ投稿を公開し、オープンソース minicpm3-4b ai モデルの開始を発表し、「クライアント側の chatgpt の時が来た」と主張しました。が来ます。」

minicpm3-4b は minicpm シリーズの第 3 世代製品であり、その全体的なパフォーマンスは phi-3.5-mini-instruct および gpt-3.5-turbo-0125 を上回り、70 億から 90 億のパラメーターを持つ多くの ai モデルに匹敵します。

minicpm1.0 / minicpm2.0 と比較して、minicpm3-4b はより強力で汎用性の高いスキルセットを備えており、より幅広い目的に使用できます。 minicpm3-4b は、関数呼び出しとコード インタプリタをサポートします。

モデル構造の 3 つのバージョン間の違いは次のとおりです (1->2->3)。

単語リストのサイズ: 123k->73k->73k

モデルレイヤー数: 40 -> 52 -> 62

隠れ層ノード: 2304->1536->2560

最大長: 4k->4k->32k

システムプロンプトの単語: サポートされていません -> サポートされていません -> サポートされています

ツール呼び出しとコードインタープリター: サポートされていない -> サポートされていない -> サポートされている

minicpm3-4b には 32k のコンテキスト ウィンドウがあります。 llmxmapreduce の助けにより、minicpm3-4b は大量のメモリを占有する必要がなく、理論的には無限のコンテキストを処理できます。

face wall intelligence は、rag スイートの minicpm-embedding モデルと minicpm-reranker モデルもリリースし、rag シナリオ用の minicpm3-rag-lora モデルの微調整バージョンもリリースしました。