您的位置:首页 > 大数据 > 人工智能

你不知道的数字化转型,与IBM再造高效个性化新闻

2017-11-23 14:34 477 查看

根据慧聪的《2016年中国广电行业发展报告》,2016年我国广电行业搭乘“互联网+”的快车,深层融合、深度洗牌,深刻改变行业内在结构,激发行业新发展,2016年是广电改革发展、转型升级、提质增效的重要一年。
而在行业整体转型升级,并取得出色战果的大环境下,离不开创新科技在背后的默默支持。央视“新闻选题智囊系统”就是这些不为人所知的幕后英雄中的一个。该系统为央视新闻台分布在世界各地的2000余名新闻工作者,提供了实时、多角度、个性化的新闻线索推送,确保每个央视新闻工作者在第一时间掌握自己关注领域的最新信息。
2017年6月,央视“新闻选题智囊系统”获得2016广播电视科技创新奖二等奖。
五年前开始的智能化战略
央视新闻频道工作人员有近2000人,分布在国内31个省市的记者站,以及国外3个分台、4个中心站,共约70个分支机构。除了前期采访、后期栏目制作外,还有策划等多个央视新闻部门。
庞大的规模和节目制作量,带来了对新闻内容源的大规模需求。当时,除了固有来源渠道外,近60-70%的新闻线索来自互联网。从采访到节目制作,当时的央视新闻团队主要依靠个人寻找素材源、判断新闻价值、报选题、做决策。
2010年,央视与IBM共同创建了“新闻选题智囊系统”,开创了新闻资讯共享的新业务模式。该系统构建了新闻线索自动采集和内容分析引擎,对互联网、中央电视台内部信息源进行实时的新闻线索采集,通过内容特征分析、关联分析、内容聚合等“理解”内容含义和特征,并获取热点话题。
该系统再根据内容分析,主动把不同的新闻线索有针对性地推送给2000多个新闻工作者,相当于2000多个新闻视角,千人千面的“智囊”极大提升了央视新闻工作者的效率。
2000多个新闻视角的背后
“新闻选题智囊系统”每天有2万多条线索数据,如何根据2000多个新闻工作者的视角,按时政、社会、地方、军事、经济等以及热点、突发事件等分类方式,分门别类、按需、及时推送给2000多个新闻工作者呢?
在互联网技术基础上,“新闻选题智囊系统”在不违反网络安全法规定及各公众网站的管理规定的前提下,利用扒网技术将新闻节目部门需要的重点网站中的新闻信息抓至本地,自动分析、聚类、处理后,再通过手机短信、邮件、系统内推荐区域、手机APP等方式及时推送到新闻工作者的手里。
央视“新闻选题智囊系统”在架构上,按照信息的流转过程可分为信息收集、信息处理和信息展现三大层共12个功能模块。其中,信息收集是新闻线索信息等数据的统一入口,信息展现是处理以后的数据出口,中间的信息处理部分则是对信息进行智能识别和分类的核心。


(上图为新闻选题智囊系统功能图)底层的信息收集层包括互联网渠道采集、人工新闻线索录入、专有渠道采集和采集接口管理四个模块。“新闻选题智囊系统”可管理多个并行的采集任务,通过对广泛的新闻信息源的采集,包括众多互联网站、中央电视台呼叫中心、中央电视台新闻联络人、各合作机构线索的实时采集,汇集了海量的新闻线索。
中间的信息处理层包括新闻线索分类、新闻线索聚合、新闻线索人工审订、文本内容分析四个模块。通过自动排重、同源信息合并、分类筛选等手段,“新闻选题智囊系统”对获取来的新闻信息加以清洗与整理,构建了与外界实时同步、富含新闻价值且高效的新闻线索库,从而提供最新、最热、最全面的一手资料。
在内容分析方面,“新闻选题智囊系统”通过文本内容分析引擎对海量新闻线索的内容进行分析,不仅能够分析获取当前的新闻热点,也能清晰的判断热点事件的生命周期阶段,结合新闻事件(话题)在众多新闻渠道中的原发期、酝酿期、成熟期、衰退期等阶段不同特点,为新闻生产指挥人员提供智能化指导。
另外,内容分析还结合了央视新闻的覆盖范围广泛、需要根据新闻题材和地域等分类的特点,也通过分类规则、分类语料等进行了自动化的内容分类,基于分类进行热点及突发事件分析和判断。
最上层的信息展现层包括线索浏览、线索查询、用户个人工作台、线索订阅管理和新闻线索话题五个模块。“新闻选题智囊系统”结合内容分析结果与新闻工作人员的工作特性,把新闻线索分门别类地推送给新闻工作者,同时也支持记者根据自己的需要定义订阅规则,极大提升了日常寻找新闻线索的效率。
“新闻选题智囊系统”结合搜索以及自定义关注主题,可以把新闻线索实时抽取出来,例如十九大、共享单车等都能定义为不同的版块,并推送到新闻工作者在系统内的个人工作台上。通过底层和中间层汇聚统计层,上层实现个性化、定制化展现,就组成了2000个新闻工作者的2000个新闻视角,实现高效获得信息。
走向人工智能大未来
央视“新闻选题智囊系统”是过去几年整个中国媒体行业数字化、智能化转型大潮中的一个典型代表。
2012年,IBM商业价值研究院就发布了《超越数字化:媒体与娱乐行业的未来》白皮书,指出媒体与娱乐行业必须关注消费者的个性化内容需求,生产与消费者及时相关的内容,从而创造个性的内容体验,而不仅仅是分发数字化内容。
2017年IBM商业价值研究院还进一步发布了《拥抱内容世界,迎接崭新未来》白皮书,指出随着互联网和社交内容与数据的大爆炸,传统的分析解决方案将无法完全发掘大数据的价值。而认知计算可以充分发现和利用所有数据中隐藏的洞察,以服务于决策支持。应用人工智能、机器学习算法和自然语言处理功能等,认知计算可理解海量数据(包括超过
80% 的文本数据),从而将分析提升到至全新水平。
IBM的2017白皮书《媒体行业数字化再造进行时》还指出,新的数字经济要求全球媒体行业要走过三个“数字化”阶段:从物理媒体到数字媒体的数字化、统一所有数字流程和技术的数字化转型、重新想像内容价值链与生态系统的数字化再造。对于媒体来说,基于人工智能的数字化再造是终极目标,也是进行时。
实际上,对于所有行业来说,数字化再造都不可避免。更重要的是,企业、消费者、产业等整个生态环境都在同时进行数字化再造,在这个前所未有的数字化大潮中只有奋起直追的选择,起步越晚越被动。(文/宁川)
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  IBM 人工智能 大数据