новости

openai модернизирует модель искусственного интеллекта для транскрипции речи whisper, сделав ее в 8 раз быстрее без ущерба для качества

2024-10-03

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

it house news 3 октября компания openai объявила о запуске модели транскрипции речи whisper big-v3-turbo на мероприятии devday, состоявшемся 1 октября, с общим количеством 809 миллионов параметров, почти без потери качества и скорости в 8 раз. быстрее, чем big-v3.

модель транскрипции речи whisper big-v3-turbo представляет собой оптимизированную версию big-v3 и имеет только 4 слоя декодера (слои декодера) по сравнению с big-v3, которая имеет в общей сложности 32 слоя.

модель транскрипции речи whisper big-v3-turbo имеет в общей сложности 809 миллионов параметров, что немного больше, чем средняя модель с 769 миллионами параметров, но намного меньше, чем большая модель с 1,55 миллиардами параметров.

openai утверждает, что whisper big-v3-turbo в 8 раз быстрее, чем большая модель, и требует 6 гб видеопамяти по сравнению с 10 гб для большой модели.

модель транскрипции речи whisper big-v3-turbo имеет размер 1,6 гб, и openai продолжает предоставлять whisper (включая веса кода и модели) по лицензии mit.

it house привел результаты теста авни ханнуна, которые показали, что на m2 ultra 12 минут контента транскрибируются за 14 секунд.