私の連絡先情報
郵便管理者@information.bz
2024-09-06
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
9 月 6 日の it house ニュースによると、face wall intelligence の公式公開アカウントは昨日 (9 月 5 日)、ブログ投稿を公開し、オープンソース minicpm3-4b ai モデルの開始を発表し、「クライアント側の chatgpt の時が来た」と主張しました。が来ます。」
minicpm3-4b は minicpm シリーズの第 3 世代製品であり、その全体的なパフォーマンスは phi-3.5-mini-instruct および gpt-3.5-turbo-0125 を上回り、70 億から 90 億のパラメーターを持つ多くの ai モデルに匹敵します。
minicpm1.0 / minicpm2.0 と比較して、minicpm3-4b はより強力で汎用性の高いスキルセットを備えており、より幅広い目的に使用できます。 minicpm3-4b は、関数呼び出しとコード インタプリタをサポートします。
モデル構造の 3 つのバージョン間の違いは次のとおりです (1->2->3)。
単語リストのサイズ: 123k->73k->73k
モデルレイヤー数: 40 -> 52 -> 62
隠れ層ノード: 2304->1536->2560
最大長: 4k->4k->32k
システムプロンプトの単語: サポートされていません -> サポートされていません -> サポートされています
ツール呼び出しとコードインタープリター: サポートされていない -> サポートされていない -> サポートされている
minicpm3-4b には 32k のコンテキスト ウィンドウがあります。 llmxmapreduce の助けにより、minicpm3-4b は大量のメモリを占有する必要がなく、理論的には無限のコンテキストを処理できます。
face wall intelligence は、rag スイートの minicpm-embedding モデルと minicpm-reranker モデルもリリースし、rag シナリオ用の minicpm3-rag-lora モデルの微調整バージョンもリリースしました。