新闻行业有了大模型标准《新闻行业大规模预训练模型》系列标准发布

2024-11-24 04:18:20
浏览次数:
返回列表

  11月21日,由新华社技术局、媒体融合生产技术与系统国家重点实验室、中国传媒大学、深圳报业集团创意智慧港科技有限责任公司、大众报业集团、南方报业传媒集团等30余家单位共同起草的《新闻行业大规模预训练模型》系列团体标准正式发布。大众报业集团结合实际研究、应用场景,积极参与了《语言模型实用性要求》《语言模型评测要求》《多模态要求》等标准的制定。

  《新闻行业大规模预训练模型》系列标准由5部分组成,从语言模型实用性要求、评测要求、安全性要求、研发数据要求和多模态要求等角度出发,为新闻行业大规模预训练模型构建出一个全面而系统的框架。

  《语言模型实用性要求》明确了预训练语言模型在完成新闻任务时的使用场景要求、效果要求以及产品化要求,为模型的实际应用提供了具体指导。

  《语言模型评测要求》规定了新闻行业预训练语言模型的评测指标和评测方法,并给出了具体的评测示例,以确保评测过程的科学性和规范性。

  《语言模型安全性要求》详细规定了各环节所涉及的安全性要求,确保新闻领域预训练模型应用,能够遵守相关法律法规。

  《研发数据要求》对用于训练、微调和评估预训练模型的所有数据提出了技术要求,确保了在预训练模型研发过程中,数据的质量和规范性,从而确保模型的可靠性,提升模型性能。

  《多模态要求》规定了预训练模型在处理多模态数据时的技术标准,进一步拓展了预训练模型应用范围,使其在多模态新闻内容生成和处理方面也能高效、可靠地发挥作用。

  标准的发布,规范了预训练模型在新闻场景的使用,为新闻行业研发和应用生成式人工智能技术提供了坚实基础和有力保障,有助于提升新闻内容生产能力,促进技术进步与业务模式创新,为新闻行业大规模预训练模型构建了一个全面而系统的框架,推动新闻行业的智能化和高质量发展,将有效推动新闻行业智能化进程,助力培育媒体新质生产力。

  在GenAI技术研发方面,组建山东省新型智慧媒体重点实验室、数字文化创新实验室、5G融媒体实验室等创新平台。自主研发大众党媒大模型、壹点天玑传媒大模型、海岱传媒大模型。壹点天玑传媒大模型成为山东省首个获国家网信办“生成式人工智能服务备案”和“境内深度合成服务算法备案”双备案的传媒大模型,入选第八批山东省首版次高端软件名单。上线智能体开发平台“繁星”,推出AI孔子、AI寻医问药等专属智能体。改造传统内容检校巡检系统上线多模态内容风控平台,获中国信通院测评最高级五星级评价。集团采用大模型技术全面赋能“大海蓝天”系列技术产品,先后入选全国报业技术赋能媒体融合优秀案例、中国经济媒体应用创新典型案例、深度融合技术创新与应用案例,获全国媒体融合技术应用案例一等奖。

  在GenAI技术应用方面,在“大众”新媒体大平台核心载体大众新闻9.0,开设“AI+”频道,确立“AI立端”定位。集团技术委员会组织“生成式人工智能应用训练营”,选聘AI应用导师,组建AI实训小组,培养AI应用骨干,推进集团全员智能化转型。今年以来,集团各媒体采用生成式人工智能技术创新内容生产方式,推出千余件AI创作作品,涵盖创意海报、创意短视频、创意MTV音乐、系列微短剧、数字藏品、AI评论等形态。大众日报采用AI技术创作的第十届尼山世界文明论坛特别策划《从尼山出发》()创意八连版,采用画质增强、画面上色、照片活化等AI技术创作的庆祝新中国成立75周年《“老照片新故事”全媒体报道》(),探索了AI技术赋能重点报道的新手段。

搜索