openai модернизирует модель искусственного интеллекта для транскрипции речи whisper: она стала в 8 раз быстрее, не жертвуя качеством

openai модернизирует модель искусственного интеллекта для транскрипции речи whisper, сделав ее в 8 раз быстрее без ущерба для качества

2024-10-03

it house news 3 октября компания openai объявила о запуске модели транскрипции речи whisper big-v3-turbo на мероприятии devday, состоявшемся 1 октября, с общим количеством 809 миллионов параметров, почти без потери качества и скорости в 8 раз. быстрее, чем big-v3.

модель транскрипции речи whisper big-v3-turbo представляет собой оптимизированную версию big-v3 и имеет только 4 слоя декодера (слои декодера) по сравнению с big-v3, которая имеет в общей сложности 32 слоя.

модель транскрипции речи whisper big-v3-turbo имеет в общей сложности 809 миллионов параметров, что немного больше, чем средняя модель с 769 миллионами параметров, но намного меньше, чем большая модель с 1,55 миллиардами параметров.

openai утверждает, что whisper big-v3-turbo в 8 раз быстрее, чем большая модель, и требует 6 гб видеопамяти по сравнению с 10 гб для большой модели.

модель транскрипции речи whisper big-v3-turbo имеет размер 1,6 гб, и openai продолжает предоставлять whisper (включая веса кода и модели) по лицензии mit.

it house привел результаты теста авни ханнуна, которые показали, что на m2 ultra 12 минут контента транскрибируются за 14 секунд.

новости

openai модернизирует модель искусственного интеллекта для транскрипции речи whisper, сделав ее в 8 раз быстрее без ущерба для качества

введение

моя контактная информация