νέα

Η NVIDIA κυκλοφορεί νέο μοντέλο τεχνητής νοημοσύνης 8 δισεκατομμυρίων παραμέτρων: εξαιρετικά ακριβές, αποτελεσματικό και μπορεί να αναπτυχθεί σε σταθμούς εργασίας RTX

2024-08-23

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Το IT House ανέφερε στις 23 Αυγούστου ότι η Nvidia δημοσίευσε μια ανάρτηση ιστολογίου στις 21 Αυγούστου, κυκλοφορώντας το μοντέλο τεχνητής νοημοσύνης σε μικρή γλώσσα Mistral-NeMo-Minitron 8B, το οποίο έχει τα πλεονεκτήματα της υψηλής ακρίβειας και της υψηλής υπολογιστικής απόδοσης και μπορεί να χρησιμοποιηθεί σε δεδομένα με επιτάχυνση GPU κέντρα, σύννεφο και Εκτέλεση του μοντέλου στο σταθμό εργασίας.

Η NVIDIA και η Mistral AI κυκλοφόρησαν το μοντέλο ανοιχτού κώδικα Mistral NeMo 12B τον περασμένο μήνα. Κάρτες γραφικών RTX.

Η Nvidia δήλωσε ότι έλαβε το Mistral-NeMo-Minitron 8B μέσω κλαδέματος πλάτους (width-pruning) Mistral NeMo 12B και ελαφριάς επανεκπαίδευσης μέσω απόσταξης γνώσης (knowledge distillation). Απόσταξη» μέση.

Το κλάδεμα συρρικνώνει ένα νευρωνικό δίκτυο αφαιρώντας τα βάρη μοντέλων που συμβάλλουν λιγότερο στην ακρίβεια. Κατά τη διάρκεια της διαδικασίας «απόσταξης», η ομάδα εκπαίδευσε εκ νέου το κλαδευμένο μοντέλο σε ένα μικρό σύνολο δεδομένων για να βελτιώσει σημαντικά την ακρίβεια που είχε μειωθεί από τη διαδικασία κλαδέματος.

Για το μέγεθός του, το Mistral-NeMo-Minitron 8B προηγείται με μεγάλη διαφορά σε εννέα δημοφιλή σημεία αναφοράς για γλωσσικά μοντέλα. Αυτά τα σημεία αναφοράς καλύπτουν μια ποικιλία εργασιών, συμπεριλαμβανομένης της κατανόησης της γλώσσας, του συλλογισμού κοινής λογικής, της μαθηματικής συλλογιστικής, της σύνοψης, της κωδικοποίησης και της ικανότητας δημιουργίας αυθεντικών απαντήσεων. Το IT Home επισυνάπτει τα σχετικά αποτελέσματα δοκιμών ως εξής: