νέα

"η στιγμή για το chatgpt από την πλευρά του πελάτη έφτασε", η face wall intelligence λανσάρει το xiaogangpao ανοιχτού κώδικα minicpm3-4b ai μοντέλο

2024-09-06

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

η it house ανέφερε στις 6 σεπτεμβρίου ότι ο επίσημος δημόσιος λογαριασμός της face wall intelligence δημοσίευσε μια ανάρτηση ιστολογίου χθες (5 σεπτεμβρίου), ανακοινώνοντας την κυκλοφορία του μοντέλου ανοιχτού κώδικα minicpm3-4b ai, υποστηρίζοντας ότι "η στιγμή για το chatgpt από πλευράς πελάτη πλησιάζει ."

το minicpm3-4b είναι το προϊόν τρίτης γενιάς της σειράς minicpm η συνολική του απόδοση υπερβαίνει αυτή των phi-3.5-mini-instruct και gpt-3.5-turbo-0125 και είναι συγκρίσιμη με πολλά μοντέλα ai με 7 δισεκατομμύρια έως 9 δισεκατομμύρια παραμέτρους.

σε σύγκριση με το minicpm1.0 / minicpm2.0, το minicpm3-4b διαθέτει ένα πιο ισχυρό και ευέλικτο σύνολο δεξιοτήτων που μπορεί να χρησιμοποιηθεί για ευρύτερο φάσμα σκοπών. το minicpm3-4b υποστηρίζει κλήσεις συναρτήσεων και διερμηνείς κώδικα.

ακολουθούν οι διαφορές μεταξύ των τριών εκδόσεων της δομής του μοντέλου (1->2->3):

μέγεθος λίστας λέξεων: 123k->73k->73k

αριθμός στρώσεων μοντέλου: 40->52->62

κόμβοι κρυφού επιπέδου: 2304->1536->2560

μέγιστο μήκος: 4k->4k->32k

λέξεις προτροπής συστήματος: δεν υποστηρίζεται -> δεν υποστηρίζεται -> υποστηρίζεται

κλήσεις εργαλείων και διερμηνείς κώδικα: δεν υποστηρίζεται -> δεν υποστηρίζεται -> υποστηρίζεται

το minicpm3-4b έχει ένα παράθυρο περιβάλλοντος 32k. με τη βοήθεια του llmxmapreduce, το minicpm3-4b δεν χρειάζεται να καταλαμβάνει υπερβολική μνήμη και μπορεί να χειριστεί θεωρητικά άπειρα περιβάλλοντα.

η facewall intelligence κυκλοφόρησε επίσης το μοντέλο της σουίτας rag minicpm-embedding και το μοντέλο minicpm-reranker, και κυκλοφόρησε επίσης μια τελειοποιημένη έκδοση του μοντέλου minicpm3-rag-lora για σενάρια rag.