моя контактная информация
почта[email protected]
2024-10-03
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
it house news 3 октября компания openai объявила о запуске модели транскрипции речи whisper big-v3-turbo на мероприятии devday, состоявшемся 1 октября, с общим количеством 809 миллионов параметров, почти без потери качества и скорости в 8 раз. быстрее, чем big-v3.
модель транскрипции речи whisper big-v3-turbo представляет собой оптимизированную версию big-v3 и имеет только 4 слоя декодера (слои декодера) по сравнению с big-v3, которая имеет в общей сложности 32 слоя.
модель транскрипции речи whisper big-v3-turbo имеет в общей сложности 809 миллионов параметров, что немного больше, чем средняя модель с 769 миллионами параметров, но намного меньше, чем большая модель с 1,55 миллиардами параметров.
openai утверждает, что whisper big-v3-turbo в 8 раз быстрее, чем большая модель, и требует 6 гб видеопамяти по сравнению с 10 гб для большой модели.
модель транскрипции речи whisper big-v3-turbo имеет размер 1,6 гб, и openai продолжает предоставлять whisper (включая веса кода и модели) по лицензии mit.
it house привел результаты теста авни ханнуна, которые показали, что на m2 ultra 12 минут контента транскрибируются за 14 секунд.