νέα

η αναβάθμιση του μοντέλου deepseek ai λανσάρει την έκδοση 2.5: συγχώνευση coder και chat, ευθυγράμμιση των ανθρώπινων προτιμήσεων κ.λπ.

2024-09-06

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

αρχικός τίτλος: η αναβάθμιση του μοντέλου deepseek ai κυκλοφόρησε στην έκδοση 2.5: συγχώνευση coder και chat, ευθυγράμμιση των ανθρώπινων προτιμήσεων, βελτιστοποίηση εργασιών γραφής και παρακολούθησης οδηγιών κ.λπ.

το it house ανέφερε στις 6 σεπτεμβρίου ότι τα δύο μοντέλα του deepseek coder v2 και του deepseek v2 chat έχουν συγχωνευθεί και αναβαθμιστεί και το αναβαθμισμένο νέο μοντέλο είναι το deepseek v2.5.

πηγή: στιγμιότυπο από χρήστες του φόρουμ linux.do

η deepseek ενημέρωσε επίσημα την τεκμηρίωση υποστήριξης api χθες (5 σεπτεμβρίου) και ανακοίνωσε τη συγχώνευση των μοντέλων deepseek coder v2 και deepseek v2 chat, αναβαθμίζοντας και λανσάροντας ένα νέο μοντέλο deepseek v2.5.

επίσημα δηλωμένο ότι είναι συμβατό προς τα εμπρός, οι χρήστες api μπορούν να έχουν πρόσβαση στο νέο μοντέλο μέσω deepseek-coder ή deepseek-chat.

το νέο μοντέλο ξεπερνά σημαντικά τα δύο μοντέλα της παλιάς έκδοσης ως προς τις γενικές δυνατότητες και τις δυνατότητες κωδικοποίησης.

το νέο μοντέλο ευθυγραμμίζει καλύτερα τις ανθρώπινες προτιμήσεις και είναι βελτιστοποιημένο σε πολλές πτυχές, όπως εργασίες γραφής και οδηγίες που ακολουθούν:

το winrate του arenahard αυξήθηκε από 68,3% σε 76,3%

το alpacaeval 2.0 lc αυξήθηκε από 46,61% σε 50,52%

το σκορ mt-bench αυξήθηκε από 8,84 σε 9,02

η βαθμολογία alignbench αυξήθηκε από 7,88 σε 8,04

το νέο μοντέλο βελτιώνει περαιτέρω τις δυνατότητες δημιουργίας κώδικα με βάση το αρχικό μοντέλο coder, βελτιστοποιεί κοινά σενάρια εφαρμογών προγραμματισμού και επιτυγχάνει τα ακόλουθα αποτελέσματα στο τυπικό σύνολο δοκιμών:

humaneval: 89%

livecodebench (ιανουάριος-σεπτέμβριος): 41%

it home σημείωση:το μοντέλο deepseek ai κυκλοφόρησε από την hangzhou deepseek artificial intelligence, μια εταιρεία που ιδρύθηκε το 2023.

η επίσημη εισαγωγή έχει ως εξής:

επικεντρωθείτε στην έρευνα των κορυφαίων μοντέλων και τεχνολογιών γενικής τεχνητής νοημοσύνης στον κόσμο και αμφισβητήστε προβλήματα αιχμής στην τεχνητή νοημοσύνη. βασισμένη σε πόρους όπως το αυτο-αναπτυγμένο πλαίσιο εκπαίδευσης, τα αυτοκατασκευασμένα ευφυή συμπλέγματα υπολογιστών και η υπολογιστική ισχύς wanka, η ομάδα του deepseek έχει κυκλοφορήσει και ανοιχτού κώδικα πολλαπλά μοντέλα μεγάλης κλίμακας με δεκάδες δισεκατομμύρια παραμέτρους μέσα σε μόλις μισό χρόνο, όπως το γενικό μοντέλο γλώσσας deepseek-llm, μεγάλο μοντέλο κώδικα deepseek-coder, και τον ιανουάριο του 2024, ανέλαβε την ηγεσία του πρώτου μεγάλου μοντέλου υπουργείου υγείας της χώρας (deepseek-moe). σε λίστες δημόσιας αξιολόγησης και πραγματικά δείγματα εξαιρετική απόδοση του μοντέλου.