新闻

音频大模型亮相2024云栖大会

2024-09-22

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

9月19日,2024云栖大会在杭州云栖小镇开幕,以“云启智跃,产业蝶变”为主题。喜马拉雅珠峰AI音频多模态大模型亮相“人工智能+”主题馆,吸引众多市民。
截至去年底,喜马拉雅已累积包含459个品类的4.88亿条音频,总内容时长超过36亿分钟。海量且多样化的在线音频内容,使其得以不断演进自身的AI能力。成立之初,平台一直重视布局AI。此次亮相的“珠峰AI音频多模态大模型”就是其自主研发的AI音频生成大模型,依托超百万小时的自有版权音频数据进行深度学习与训练,具备情感输出、自然表达、语种互译、极速克隆等技术能力,并在音频生成领域实现多维度突破,正广泛应用于有声书等领域。
在“珠峰AI数智人平台互动体验区”,参会者可以体验AI为声音创作带来的变革,比如:极速体验全领域多品类535种AI音色库生成全品类AIGC音频内容、15秒真人数智人形象快速定制、10秒声音极速克隆等等,感受AI高效便捷地赋能内容创作者。
数据显示,2023年,喜马拉雅全场景平均月活跃用户达3.03亿。截至去年12月,平台AIGC内容达2.4亿分钟,占其音频内容的6.6%。同时,移动端平均月活跃用户的AIGC渗透率已达14.8%。喜马拉雅音频大模型具备“产模一体生态系统、持续进化的生态飞轮”的模型优势,已广泛应用于内容创作、数智分身、语音交互等场景,并已实现商业化。未来,将进一步打开声音的想象力,持续用声音服务美好生活。
作者:付鑫鑫
文:付鑫鑫图:受访者提供编辑:沈竹士责任编辑:范兵
转载此文请注明出处。
举报/反馈