新闻

传播大脑CTO张健:为媒体加速打通大模型落地应用最后一公里

2024-08-24

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

潮新闻客户端 记者 黄云灵

媒体融合作为国家战略整体推进的十年来,新兴技术不断赋能媒体融合发展,尤其是生成式人工智能在媒体领域发挥了越来越重要的作用。8月23日,“BIRTV2024AIGC生成式人工智能创新与应用技术交流会”在北京举办,传播大脑副总经理兼首席技术官张健受邀进行《加速推进媒体大模型的应用落地》的主题演讲。

生成式人工智能的能力与媒体行业的需求天然契合,媒体机构要加速大模型的应用落地,而打通落地环节的最后一公里,是将媒体众多复杂的多任务需求翻译为串联或并联的单任务简单指令,并在采编系统中无感融入场景化的大模型指令集能力。

那么此次大会上,张健都分享了哪些干货?

传播大脑副总经理兼首席技术官张健现场演讲。传播大脑供图

大模型在媒体行业的“专属存在感”

从2017年微软小冰AI诗集的出现,到现在GPT4、Sora等多模态大模型的不断涌现,大量深度学习方法的提出和迭代更新,掀起了AIGC的发展热潮。生成式人工智能专注于生产图片、文字、视频等内容,与媒体日常的内容生产需求完美匹配,媒体行业迎来变革机遇。

然而,随着大模型在媒体行业的广泛应用,一些问题逐渐浮出水面,如到底要不要自研底层的通用大模型?是否要做私有化部署的大模型,防止数据泄漏?大模型到底如何与媒体生产的采编系统融合?

针对这些问题,张健认为,媒体行业可不用“卷”底层大模型,做好应用更重要,“大模型的部署不是问题,算力和数据也不是困难,关键是部署后的能力如何持续提升。”

张健在会上表示,很多大模型没有充分基于特定场景下的需求去研发应用,没有针对不同用户群体的需求进行个性化设计,导致提供的服务不实用。目前大模型的应用以解决单个简单任务为主,而媒体的需求是复杂的多任务串联或并联,提示词工程的专业化也无法解决内容、流程和大模型系统割裂的现状。将媒体的多任务复杂需求翻译为单任务简单流程,并在采编系统中无感融入场景化的指令集能力是媒体大模型未来的趋势。

从通用大模型到媒体大模型的转变

在媒体创作场景下,通用大模型只能生产单一文字,无法图文并茂,生成的视频也存在版权风险。通用大模型应用显然还存在没有深入媒体业务流程,缺乏场景化适配、个性化等问题。

对此,传播大脑将新闻数据媒资库与通用大模型结合,经过微调后,打造出定位媒体垂类的传播大模型,为媒体提供智能创作、智能审校、创意设计、多模态检索、智能对话五大服务。据介绍,2024年2月,传播大模型通过生成式人工智能(大语言模型)上线备案,成为由媒体技术公司研发的首个通过备案的媒体垂类大模型。8月,传播大脑内容生成算法通过国家网信办算法备案。

传播大脑供图

张健表示,传播大模型有三大特点:“一是能利用高质量新闻数据进行训练,能有效缓解大模型内容生成的瞎编乱造,确保内容真实、安全可控;二是打通私域媒资库,借用大模型实现版权内容的快速、准确检索,确保内容素材的版权可靠;三是可以据用户角色、业务场景和内容模态,打造媒体行业最专业的大模型应用超市,确保使用简单便捷。”

正是基于以上三大特点,传播大模型也形成了自身“专业媒体知识库”、“全业务场景覆盖”、“全创作流程接入”、“多模态内容支持”的四大独特优势,为媒体加速打通大模型落地应用的最后一公里。

目前传播大模型主要聚焦在融媒客户端、内容生产平台两大类应用场景。在融媒客户端场景,传播大模型可提供个性化、智能化的语音交流以及评论服务;在内容生产场景,传播大模型能力更为丰富,可提供新闻写作、视频生成、多模态检索、AI海报生成、图片素材生成、内容智能审校等功能。

大模型在媒体行业的发展趋势

随着大模型技术的不断进步与媒体行业的融合,张健对于大模型在媒体行业的未来趋势进行了剖析,他判断,将大模型作为媒体业务发展的核心驱动力是未来媒体行业的趋势。对于媒体行业来说,要以用户为中心,以业务场景诉求为立足点,利用大模型技术,变革数字技术服务。

而传播大脑的发展目标在于打通AI落地应用的最后一公里。传播大脑将根据用户角色、业务场景和内容模态,构建下一代媒体领域的应用超市,并确保每个独立应用场景与生产端业务的紧密结合,无缝融入并优化整个媒体工作流程,从而提升媒体工作的效率和质量。

大模型技术的不断成熟与应用场景的拓展将使媒体行业迎来更高效、智能的发展新时代,传播大脑则致力于成为这一进程中的重要推动者与赋能者。

“转载请注明出处”

举报/反馈