沈艳:大数据与新经济、新动能

2017-03-26

题记 本文为北大数字金融研究中心副主任、国发院沈艳教授在“朗润·格政”第80期活动“两会解读报告会”上的发言。此次发言中,沈艳老师围绕大数据在经济增长新动能中的作用、大数据如何运用到传统制造业中、大数据的误解、问题、以及数据的开放共享问题进行了详细阐释。以下为沈老师发言的精编版,已经演讲者本人确认。

DSC_9091-1

沈艳教授

 

大数据前景广阔,成为经济增长新动能

“大数据”相关表述连续第四年被写入政府工作报告。2014年,“大数据”还处于“头脑风暴”阶段,国家对于它的期望是可以“赶超先进,引领未来”。2015年,政府工作报告提出要“推动”大数据跟制造业相结合。2016年则用 “促进” ,而今年对于过去工作的总结是“深入推进”国家大数据战略。今年的政府工作报告指出,“加快大数据、云计算、物联网的应用”,在具体应用的引领方面上,方向更加明确,提出以发展智能制造作为主攻方向。

 

根据沈艳教授的相关研究,2015年8月到2016年2月的招聘数据显示,带有“研究“关键词的岗位的薪酬增速高于其他传统职业关键词,这说明新经济中的创新、研究正在逐渐发挥作用。

 

沈艳教授认为,未来的“智能制造”有较大发展空间,可以从传统产品与个体数据结合而成的简易智能,从通过收集、分析群体性的数据,并与制造业相结合而形成更为高级的功能;还可以在未来通过大数据与虚拟现实技术的结合,满足人们多样化的需求。中国传统发展模式减弱,发展新动能,需要抓住大数据与智能制造相结合的契机。

 

大数据的误解与问题

沈艳教授认为,大数据并不能回答所有的问题,事实上,单独依靠大数据做的分析质量往往存疑。可靠的大数据分析,离不开对小数据的使用,即“大小结合“,利用一些比较可靠的小数据作为”锚点“,与大数据信息相互对照,进行判断。另外,大数据分析还要“人机结合”而不能仅仅依靠算法。专家的经验、人们的直觉等,都该在分析中有一席之地。大数据分析的另一个可能的问题是由于机器学习的算法更关注预测精度而不是事件背后的逻辑,可能会面对的状况是一段时间预测好的模型,过了一段时间表现就不好了。不应忽视大数据分析中考虑现有经济和各个领域的运行规律的必要性。

 

另外,”数据孤岛“是目前大数据存在的一个问题,即数据之间相互隔绝、互不联通,对于分析问题的范围、对如何评估大数据的质量,都带来不少挑战。要大力发展智能服务产业,加大大数据的应用空间,提高数据的附加价值,需要解决这一问题。

 

大数据的开放共享

为了解决数据孤岛问题,大数据的开放共享为大势所趋,这一点也在国家大数据发展战略中明确指出。然而,在事实中却有不少困难。第一,开放数据的合法性需要进一步明确。虽然《统计法》规定“县级以上人民政府统计机构和有关部门统计调查取得的统计资料,除依法应当保密的外,应当及时开放、供社会公众查询”,但是其他相关条目让地方统计部门不易拿捏哪些信息需要开放、哪些不需要开放。第二,不同部门单位数据存在着标准不一、质量良莠不齐的问题。第三,数据开放到底是向谁开放、如何开放的步骤和执行方案不清晰。进一步开发大数据资源,需要在上述问题上有统筹安排。

 

沈艳教授认为,需要有专门机构来统筹数据治理工作,从全局把控、制定相应标准,做到横向上促进各部门的协调和数据共享,纵向传递优秀的治理经验。在开放共享方面,到底开放的是什么,对谁开放,如何开放,沈艳教授认为需要明确的一点就是,开放不等于免费,开放也不等于完全对社会公众来开放,需要做一个分级的安排。这些安排可以借鉴开放数据做得较好的国家的经验。例如,对于一些基本的数据要免费开放,满足公众的知情权的;对于安全级别更高的数据,则可以通过签订协定等方式,明确数据使用方的责权利,让数据在使用当中达到数据安全和数据共享之间的平衡。