项目背景
新华社在长期发展过程中积累了大量宝贵的采编资源,为不断提高报道质量、有效履行国家通讯社职能和建设国际一流的新型世界性通讯社发挥了重要作用。同时,随着传媒格局和传播形态的深刻变革,新华社在推进媒体融合、构建内外并重工作格局的进程中,面临全社报道资源整合不够、共享不畅等突出问题,制约了全社新闻信息生产、发布和传播,不利于新华社新闻报道生产力的释放和影响力的扩大。
在此背景下,新华社亟需统筹整合全社各类报道资源,构建集中统一、融会贯通、高效共享、技术先进、安全可靠的全社报道资源数据库,建设大数据分析平台,深度挖掘数据资源价值,提升智能采编水平,为采编、供稿等核心业务提供数据应用服务,助力实现全社报刊、网络、新媒体等各方面业务协调发展,不断增强新华报道的传播力引导力公信力影响力。
解决方案
百分点科技将大数据、人工智能技术与新华社媒体业务深度结合,为新华社构建面向业务的数据服务平台和大数据分析平台,打造一站式智能全媒体数据中台,统一集成数据整合能力、数据计算能力、数据萃取能力、数据交换能力以及算法能力,在此基础上向新闻生产策、采、编、发的各个环节输出服务能力和数据价值。
构建大数据平台 实现全媒体数据统一聚合
通过大数据操作系统(BD-OS)为新华社建设大数据服务平台,提供海量多源异构数据的统一汇聚管理能力,实现互联网数据、第三方数据、社内数据、运营和用户行为等数据资源的按需汇聚与融合,为供稿系统和采编发系统提供全面的数据源,支撑大数据智能应用。
数据资源全生命周期管理
在大数据平台之上,建设新华社统一的数据资源管理,依托完善的数据存储管理、标准管理、流程管理、质量管理和安全管控等,实现对互联网数据、社内稿件数据、产品数据、运营数据、行为数据等各类数据资源的全生命周期管理,全方位保障新华社数据资源的数据质量和数据安全,确保数据服务效率。
构建大数据分析平台 实现信息智能分析处理
通过建设大数据分析平台,利用文本分析、机器学习、深度学习等技术,建立全媒体数据的关联和统一表示,实现新媒体的内容挖掘和统一管理,实现内容的分类聚类、数据的智能标引以及基于内容的关联推荐等智能分析处理,提升大数据分析能力,满足各类公共性大数据应用服务的建设需要。
打造平台级数据应用服务
结合新华社实际业务需求,在百分点科技大数据平台基础上进行定制化开发,形成新华社自己的平台级数据应用服务,对新华社内外部提供丰富的智能化服务,并实现数据应用服务的管理与监控,支撑新华社传统媒体和新兴媒体业务的一体化融合,辅助提升智能采编水平,实现业务流程优化与效率提升。
项目价值
形成数据资产平台
整合新华社传统媒体和新兴媒体多渠道数据资源,统一盘点、梳理及管控,数据总量500T+,集群规模100+节点,实现对数据资源的全生命周期管理,并通过数据可视化方式,实现对全社媒体资源动态掌控,大幅提高数据管理效率。目前平台每天支撑1000万次以上数据服务调用,稳定性达99.99%,在保证系统稳定运行的同时,大大提高了媒体工作者的工作效率。
辅助智能采编
通过文本语义分析形成媒体素材富标签,基于此为采编人员提供内容智能化推荐和自然语言处理功能,实现按专题、分类、标签等维度的相关素材推送和检索,辅助编辑记者选题和撰稿。在今年两会期间,为新华社快速生成两会报道专题库,不仅实现新闻内容自动汇聚,为编辑记者提供一站式的两会资料信息查询入口和内容深度挖掘平台,高效辅助采编,同时还基于专题库自动生成两会报告词云,快速聚焦热点事件和报道重点,有效提升了新华社在两会报道中的媒体传播力、影响力和公信力。
数据应用服务
为新闻生产策、采、编、发的各个环节提供服务能力和数据价值,包括基础数据分析、数据浏览与订阅、基于富标签的语义标引、智能检索、专题事件分析与专题库等数据应用服务,有效支撑新采编、新供稿、统计监测、新闻热点及影响力分析、数字业务管理等系统的运行,高效辅助编辑记者撰稿。