音频大模型亮相2024云栖大会

2024-09-22

9月19日，2024云栖大会在杭州云栖小镇开幕，以“云启智跃，产业蝶变”为主题。喜马拉雅珠峰AI音频多模态大模型亮相“人工智能+”主题馆，吸引众多市民。

截至去年底，喜马拉雅已累积包含459个品类的4.88亿条音频，总内容时长超过36亿分钟。海量且多样化的在线音频内容，使其得以不断演进自身的AI能力。成立之初，平台一直重视布局AI。此次亮相的“珠峰AI音频多模态大模型”就是其自主研发的AI音频生成大模型，依托超百万小时的自有版权音频数据进行深度学习与训练，具备情感输出、自然表达、语种互译、极速克隆等技术能力，并在音频生成领域实现多维度突破，正广泛应用于有声书等领域。

在“珠峰AI数智人平台互动体验区”，参会者可以体验AI为声音创作带来的变革，比如：极速体验全领域多品类535种AI音色库生成全品类AIGC音频内容、15秒真人数智人形象快速定制、10秒声音极速克隆等等，感受AI高效便捷地赋能内容创作者。

数据显示，2023年，喜马拉雅全场景平均月活跃用户达3.03亿。截至去年12月，平台AIGC内容达2.4亿分钟，占其音频内容的6.6%。同时，移动端平均月活跃用户的AIGC渗透率已达14.8%。喜马拉雅音频大模型具备“产模一体生态系统、持续进化的生态飞轮”的模型优势，已广泛应用于内容创作、数智分身、语音交互等场景，并已实现商业化。未来，将进一步打开声音的想象力，持续用声音服务美好生活。

作者：付鑫鑫

文：付鑫鑫图：受访者提供编辑：沈竹士责任编辑：范兵

转载此文请注明出处。

举报/反馈

新闻

音频大模型亮相2024云栖大会

简介

我的联系方式