소식

2024년 yunqi 컨퍼런스에서 공개된 대형 오디오 모델

2024-09-22

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

9월 19일, 2024년 yunqi 컨퍼런스가 항저우 윈치진에서 "yunqi 지능형 도약, 산업 나비 전환"이라는 주제로 열렸습니다. 히말라야 에베레스트 ai 오디오 멀티모달 대형 모델이 '인공지능+' 테마관에서 공개돼 많은 시민들의 관심을 끌었습니다.
지난해 말 기준으로 ximalaya는 459개 카테고리에서 4억 8,800만 개의 오디오 작품을 축적했으며, 총 콘텐츠 길이는 36억 분 이상입니다. 방대하고 다양한 온라인 오디오 콘텐츠를 통해 ai 기능을 지속적으로 발전시킬 수 있습니다. 플랫폼은 설립 초기부터 항상 ai 배포를 매우 중요하게 여겼습니다. 이번에 공개된 '에베레스트 ai 오디오 멀티모달 대형 모델'은 자체 개발한 ai 오디오 생성 대형 모델로, 심층적인 학습과 훈련을 위해 100만 시간 이상의 자체 저작권 오디오 데이터를 활용하고 있다. 출력, 자연스러운 표현, 언어 번역, 초고속 복제 등의 기술적 역량을 갖추고 있으며, 오디오북 및 기타 분야에서 널리 활용되고 있는 오디오 생성 분야에서 다차원적인 혁신을 이루었습니다.
"everest ai 디지털 인텔리전스 플랫폼 인터랙티브 체험 존"에서 참가자는 ai가 사운드 생성에 가져온 변화를 경험할 수 있습니다. 예를 들어 모든 분야 및 여러 카테고리의 535개 ai 사운드 라이브러리를 매우 빠르게 경험하여 모든 카테고리의 aigc 오디오 콘텐츠를 생성합니다. , 15초 실제 호모 사피엔스의 이미지를 신속하게 맞춤화하고, 10초 만에 음성을 복제하고, ai가 콘텐츠 제작자에게 어떻게 효율적이고 편리하게 역량을 부여하는지 경험해 보세요.
데이터에 따르면 2023년에는 모든 시나리오에서 ximalaya의 월 평균 활성 사용자가 3억 300만 명에 이를 것으로 나타났습니다. 지난해 12월 기준 플랫폼 내 aigc 콘텐츠는 2억4000만분에 달해 전체 오디오 콘텐츠의 6.6%를 차지한다. 동시에 모바일 단말기 월평균 활성 사용자의 aigc 침투율은 14.8%에 달했다. ximalaya 오디오 대형 모델은 "통합 생산 모델 생태계와 지속적으로 진화하는 생태학적 플라이휠"이라는 모델 장점을 갖추고 있으며 콘텐츠 제작, 디지털 지능 아바타, 음성 상호 작용 및 기타 시나리오에 널리 사용되어 상용화되었습니다. 앞으로도 우리는 소리에 대한 상상력을 더욱 넓히고 소리를 활용하여 더 나은 삶을 제공할 것입니다.
저자: 푸신신
글: fu xinxin 사진: 인터뷰 대상 제공 편집자: shen zhushi 편집자: fan bing
이 글을 퍼가실 때에는 출처를 꼭 밝혀주세요.
보고/피드백