소식

openai는 whisper 음성 전사 ai 모델을 업그레이드하여 품질 저하 없이 8배 더 빠르게 만듭니다.

2024-10-03

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

it house news는 10월 3일 openai가 10월 1일 개최된 devday 행사에서 whisper 대형 v3 터보 음성 전사 모델을 출시했다고 발표했습니다. 이 모델은 총 8억 900만 개의 매개변수로 품질과 속도가 거의 손실되지 않았습니다. large-v3보다 빠릅니다.

whisper large-v3-turbo 음성 전사 모델은 large-v3의 최적화된 버전으로 총 32개의 레이어가 있는 large-v3와 비교하여 4개의 디코더 레이어(디코더 레이어)만 있습니다.

whisper 대형-v3-터보 음성 전사 모델은 총 8억900만 개의 매개변수를 갖고 있으며 이는 매개변수 7억6900만개 중형 모델보다 약간 크지만 매개변수 15억5000만개 대형 모델보다는 훨씬 적다.

openai에 따르면 whisper large-v3-turbo는 대형 모델보다 8배 빠르며 대형 모델의 10gb에 비해 6gb의 vram이 필요합니다.

whisper 대형 v3 터보 음성 전사 모델의 크기는 1.6gb이며 openai는 mit 라이선스에 따라 whisper(코드 및 모델 가중치 포함)를 계속 제공합니다.

it house는 awni hannun 테스트 결과를 인용했는데, m2 ultra에서는 12분 분량의 콘텐츠가 14초로 복사되는 것으로 나타났습니다.