openai, whisper 음성 전사 ai 모델을 품질 저하 없이 8배 더 빠르게 업그레이드

openai는 whisper 음성 전사 ai 모델을 업그레이드하여 품질 저하 없이 8배 더 빠르게 만듭니다.

2024-10-03

it house news는 10월 3일 openai가 10월 1일 개최된 devday 행사에서 whisper 대형 v3 터보 음성 전사 모델을 출시했다고 발표했습니다. 이 모델은 총 8억 900만 개의 매개변수로 품질과 속도가 거의 손실되지 않았습니다. large-v3보다 빠릅니다.

whisper large-v3-turbo 음성 전사 모델은 large-v3의 최적화된 버전으로 총 32개의 레이어가 있는 large-v3와 비교하여 4개의 디코더 레이어(디코더 레이어)만 있습니다.

whisper 대형-v3-터보 음성 전사 모델은 총 8억900만 개의 매개변수를 갖고 있으며 이는 매개변수 7억6900만개 중형 모델보다 약간 크지만 매개변수 15억5000만개 대형 모델보다는 훨씬 적다.

openai에 따르면 whisper large-v3-turbo는 대형 모델보다 8배 빠르며 대형 모델의 10gb에 비해 6gb의 vram이 필요합니다.

whisper 대형 v3 터보 음성 전사 모델의 크기는 1.6gb이며 openai는 mit 라이선스에 따라 whisper(코드 및 모델 가중치 포함)를 계속 제공합니다.

it house는 awni hannun 테스트 결과를 인용했는데, m2 ultra에서는 12분 분량의 콘텐츠가 14초로 복사되는 것으로 나타났습니다.

소식

openai는 whisper 음성 전사 ai 모델을 업그레이드하여 품질 저하 없이 8배 더 빠르게 만듭니다.

소개

내 연락처 정보