το openai αναβαθμίζει το μοντέλο ai μεταγραφής ομιλίας whisper, 8 φορές πιο γρήγορα χωρίς να θυσιάζει την ποιότητα

το openai αναβαθμίζει το μοντέλο ai μεταγραφής ομιλίας whisper, καθιστώντας το 8 φορές πιο γρήγορο χωρίς να θυσιάζει την ποιότητα

2024-10-03

it house news στις 3 οκτωβρίου, το openai ανακοίνωσε την κυκλοφορία του μοντέλου μεταγραφής ομιλίας whisper large-v3-turbo στην εκδήλωση devday που πραγματοποιήθηκε την 1η οκτωβρίου, με συνολικά 809 εκατομμύρια παραμέτρους, χωρίς σχεδόν καμία απώλεια σε ποιότητα και ταχύτητα 8 φορές πιο γρήγορα από το large-v3.

το μοντέλο μεταγραφής ομιλίας whisper large-v3-turbo είναι μια βελτιστοποιημένη έκδοση του large-v3 και έχει μόνο 4 επίπεδα αποκωδικοποιητή (στρώματα αποκωδικοποιητή αντίθετα, το large-v3 έχει συνολικά 32 επίπεδα).

το μοντέλο μεταγραφής ομιλίας whisper large-v3-turbo έχει συνολικά 809 εκατομμύρια παραμέτρους, οι οποίες είναι ελαφρώς μεγαλύτερες από το μεσαίο μοντέλο 769 εκατομμυρίων παραμέτρων, αλλά πολύ μικρότερο από το μεγάλο μοντέλο παραμέτρων 1,55 δισεκατομμυρίων.

το openai λέει ότι το whisper large-v3-turbo είναι 8 φορές πιο γρήγορο από το μεγάλο μοντέλο και απαιτεί 6 gb vram σε σύγκριση με 10 gb για το μεγάλο μοντέλο.

το μοντέλο μεταγραφής ομιλίας whisper large-v3-turbo έχει μέγεθος 1,6 gb και το openai συνεχίζει να παρέχει whisper (συμπεριλαμβανομένων των βαρών κώδικα και μοντέλου) υπό την άδεια του mit.

το it house ανέφερε τα αποτελέσματα της δοκιμής awni hannun, τα οποία έδειξαν ότι στο m2 ultra, 12 λεπτά περιεχομένου μεταγράφηκαν σε 14 δευτερόλεπτα.

νέα

το openai αναβαθμίζει το μοντέλο ai μεταγραφής ομιλίας whisper, καθιστώντας το 8 φορές πιο γρήγορο χωρίς να θυσιάζει την ποιότητα

εισαγωγή

τα στοιχεία επικοινωνίας μου