τα στοιχεία επικοινωνίας μου
ταχυδρομείο[email protected]
2024-09-06
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
η it house ανέφερε στις 6 σεπτεμβρίου ότι ο επίσημος δημόσιος λογαριασμός της face wall intelligence δημοσίευσε μια ανάρτηση ιστολογίου χθες (5 σεπτεμβρίου), ανακοινώνοντας την κυκλοφορία του μοντέλου ανοιχτού κώδικα minicpm3-4b ai, υποστηρίζοντας ότι "η στιγμή για το chatgpt από πλευράς πελάτη πλησιάζει ."
το minicpm3-4b είναι το προϊόν τρίτης γενιάς της σειράς minicpm η συνολική του απόδοση υπερβαίνει αυτή των phi-3.5-mini-instruct και gpt-3.5-turbo-0125 και είναι συγκρίσιμη με πολλά μοντέλα ai με 7 δισεκατομμύρια έως 9 δισεκατομμύρια παραμέτρους.
σε σύγκριση με το minicpm1.0 / minicpm2.0, το minicpm3-4b διαθέτει ένα πιο ισχυρό και ευέλικτο σύνολο δεξιοτήτων που μπορεί να χρησιμοποιηθεί για ευρύτερο φάσμα σκοπών. το minicpm3-4b υποστηρίζει κλήσεις συναρτήσεων και διερμηνείς κώδικα.
ακολουθούν οι διαφορές μεταξύ των τριών εκδόσεων της δομής του μοντέλου (1->2->3):
μέγεθος λίστας λέξεων: 123k->73k->73k
αριθμός στρώσεων μοντέλου: 40->52->62
κόμβοι κρυφού επιπέδου: 2304->1536->2560
μέγιστο μήκος: 4k->4k->32k
λέξεις προτροπής συστήματος: δεν υποστηρίζεται -> δεν υποστηρίζεται -> υποστηρίζεται
κλήσεις εργαλείων και διερμηνείς κώδικα: δεν υποστηρίζεται -> δεν υποστηρίζεται -> υποστηρίζεται
το minicpm3-4b έχει ένα παράθυρο περιβάλλοντος 32k. με τη βοήθεια του llmxmapreduce, το minicpm3-4b δεν χρειάζεται να καταλαμβάνει υπερβολική μνήμη και μπορεί να χειριστεί θεωρητικά άπειρα περιβάλλοντα.
η facewall intelligence κυκλοφόρησε επίσης το μοντέλο της σουίτας rag minicpm-embedding και το μοντέλο minicpm-reranker, και κυκλοφόρησε επίσης μια τελειοποιημένη έκδοση του μοντέλου minicpm3-rag-lora για σενάρια rag.