半月谈微信

首页 >> 时事讲堂 >> 保卫大数据安全 >> 阅读

保卫大数据安全

2017-07-24 10:24 作者:周涛、张小松 来源:时事资料手册网刊 编辑:苏蕾
分享到:

相关内容

周涛,电子科技大学教授,主要从事统计物理与复杂性方面的研究。在国际SCI(科学引文索引)期刊发表200余篇学术论文。2015年当选全国十大科技创新人物。2017年获得全国创新争先奖。

张小松,电子科技大学网络空间安全研究中心主任,长江学者特聘教授,研究方向为网络安全、数据安全和软件安全,在国际SCI、EI(工程索引)期刊发表60余篇学术论文。

2016年10月9日,中共中央总书记习近平在主持中央政治局第三十六次集体学习时发表讲话提出,建设全国一体化的国家大数据中心,推进技术融合、业务融合、数据融合,实现跨层级、跨地域、跨系统、跨部门、跨业务的协同管理和服务。

2016年5月25日,国务院总理李克强在中国大数据产业峰会上表示,大数据等新一代互联网技术深刻改变了世界,也让各国站在科技革命的同一起跑线上。中国曾屡次与世界科技革命失之交臂,今天要把握这一历史机遇,抢占先机,赢得未来。

大数据给社会经济带来颠覆性变化

近年来,数据自身数量和形态的迅猛变化驱动了大数据产业发展,其主要趋势体现在三个方面。

第一,数据总量呈指数型爆炸性生长。现在我们每天产生的数据超过3乘以10的18次方字节。

第二,数据结构发生了巨大变化。以前,绝大部分数据都是以表格形态存在,即结构化数据。如,一个大学毕业生的学籍学业表格中,有其姓名、性别、年龄、籍贯、民族、毕业院校、父母职业、高考成绩、大学历次考试成绩、毕业去向等信息。利用一些标准化统计分析工具,就可得到这些数据之间的关联。但是现在,新增数据绝大部分(2017年这个比例会超过90%)是非结构化数据,包括文本、语音、图像、视频、社交关系网络、空间移动轨迹等。目前,没有一套标准化方法去挖掘这些数据的价值。

第三,数据的组织发生了巨大变化以前,针对同一对象不同侧面的数据分散在多处。最近,通过一些政策、资本、产品和技术手段,针对个人、家庭、企业、产品等的多源数据正在被打通。这样的跨域关联有巨大的社会经济价值。如,金融机构可获得更完整的征信记录、税务部门可全面了解个人和企业的涉税信息、民政部门可开展更精准的扶贫等。同时,数据的跨域关联带来隐私和安全方面的巨大挑战,因为分析人员更容易通过多源立体的数据挖掘出个人和家庭隐私信息,而关联数据出现安全问题带来的毁坏性会远远大于单一数据集。

在2017中国国际大数据产业博览会上,参观者在观看“城市网络安全指数”的大数据展示屏。(新华社记者 欧东衢 摄)

大数据持续给我们的社会经济带来颠覆性变化,其重大价值表现在以下四个方面。

第一,大数据可帮助政府维护安全和稳定。通过网络、通信、遥感等多渠道的数据分析,可实时、精准地感知敌对势力和恐怖主义发展的态势,对一些重大事件进行提前预警。但同时,数据安全意识的缺位和数据安全管理的松懈,也可能给国家安全带来重大隐患。

第二,大数据可提升政府的治理和决策能力。通过数据标准等的建设及跨部门数据的打通融合,可大幅提升政府的社会服务和社会治理能力,既包括提升普通公民办理政务手续的用户体验,也包括交通管理、土地规划、科技计划、税务管理、公共治安、纪检反腐、安全生产、脱贫攻坚等多个方面。同时,数据的统计分析,可帮助主要决策机构和决策人准确了解政府在教育、医疗、产业、人才等方面的资源配置现状和发展态势。在决策完成后,数据分析还可帮助政府实时掌握决策的社会经济影响。

第三,大数据可挖掘传统行业内在的创造力。大数据已经在一些数据密集型行业,如金融和电商,发挥了巨大作用。针对一些尚处于信息化初级阶段的行业,大数据有望发挥更大的提升作用。如可通过数据综合分析,优化生产流程,监控大型制造设备的运行情况,实现故障的提前预警等。

第四,大数据可催生以数据共享和交易为核心的新商业模式。当数据被赋予价格甚至资本化后,其商品和金融价值非常可观,数据交易本身会成为一种具有巨大经济价值的新商业模式,并通过数据流通从整体上促进科技和产业创新。

大数据面临的风险和隐患

大数据带来的发展机遇已形成从数据采集、数据加工到数据流通的产业链和新经济形态,但在大数据共享、开放和应用带来巨大社会经济效益的同时,国家和个人信息安全则面临着前所未有的风险。

一是数据采集的真实性确认,即数据来源的安全。

数据采集是大数据应用的源头,其质量尤其是真实性,对数据分析、挖掘、预测结论的正确性至关重要,但在实际场景中,大数据来源众多,加上数据采集中的各种主观、客观因素,为保障数据采集质量带来困难。经济和产业运行数据采集的错误或造假会造成国家对宏观经济形势的误判;互联网上的虚假言论、消息会误导舆论倾向、损害政府机构形象,造成经济损失和不良社会影响等。及时有效地甄别数据真伪,拦截和清除各类虚假信息,是大数据产业健康发展所面临的首要问题。

二是大数据分析挖掘与隐私保护,即数据加工的安全。

大数据的最大价值是数据分析、挖掘和预测,但数据挖掘技术的滥用会对敏感的信息如用户隐私等产生极大威胁。

从主观上讲,在大数据时代,想要阻止对敏感和隐私的信息挖掘几乎是不可能的。当前,围绕数据采集、加工、应用、销售的庞大产业链在我国已悄然形成。这其中既有贵阳大数据交易所、上海数据交易中心、中关村大数据交易平台等合法机构,也有私自将海量个人信息非法窃取并打包出售给中介机构和个人,进而再转手贩卖给销售企业、调查公司、网络犯罪团体等的地下产业链。

从技术角度来看,虽然可以通过数据脱敏(也称数据匿名化)的方法来保护敏感和隐私信息,但是过度的脱敏或匿名会导致信息损失,使数据失去挖掘和利用的价值。因此,大数据的共享开放,以及对敏感和隐私信息保护力度,包括敏感信息的界定、脱敏、匿名的范围和程度等,将是大数据行业发展过程中面临的重要矛盾和需要持续研究解决的问题,尤其是在医疗、社保、公共服务、金融信贷等高价值数据集中的领域。

2017中国国际大数据产业博览会展示的大数据可视化交互平台。(新华社记者 陶亮 摄)

三是数据持有的权属性证明与管理,即数据使用的安全。

这是目前数据安全中最具争议的问题,数据的权属拥有者和数据持有者往往一开始就是分离的,在从采集到存储、分析应用过程中,持有者还会发生多次变化,这会导致数据持有者对数据无限度挖掘利用,数据权属拥有者的权益得不到保障,还存在个人隐私泄露风险。

如,个人健康医疗数据的权属应该为病人,但数据持有者和使用者通常为医院,医院对个人医疗大数据进行分析和挖掘,并创造价值、产生收益,病人是否直接分享到这些成果,并不知情。类似情景在社交网络、个人移动通信、电商平台也存在。电商一般都会在用户不知情情况下,对用户的购买行为数据进行分析挖掘,并开展精准推销,而这种分析对用户可能带来的风险,用户并不知情。

四是大数据安全相关法律法规。

2017年6月,网络安全法正式实施,其中不乏关于保护个人信息、数据安全的规定。这些规定主要针对营运商、网管部门等,而对于在数据采集、数据加工、数据流通产业链中的安全问题如何进行有效的界定、审查、管理等,尚未从法律角度提出可行的条款和规定。对于数据采集造假、数据挖掘利用侵犯公民隐私等造成的社会影响和经济损失,也没有与之相对应的评价认定及处罚条例,因此亟待对大数据安全相关法律法规做进一步完善。

新华社2017年5月27日发

保卫大数据安全如何发力

针对大数据安全面临的风险和隐患,应站在技术和法律层面,从大数据产业链的数据采集、加工、流通环节全方位共同应对。

在技术层面,要加快实现适合大数据业务的可信验证、隐私保护的数据挖掘、风险评估等相关理论和核心技术的突破,从体系结构上,建立大数据应用的安全围栏。在数据的可信验证方面,高抗扰数字水印技术能将标识信息以难以察觉的方式嵌入在数据载体内部且不影响其使用,还能识别出信息的所有者以及被分发的对象,有效防止篡改,有利于数据的追踪溯源。在隐私保护的数据挖掘方面,隐私保护数据搜索等“数据匿名化”技术可在保护隐私的前提下,进行数据的利用和挖掘。

在法律层面,需要以新实施的网络安全法为指导,完善大数据保护方面的法律法规,明确数据权属、数据持有的界定和关系,数据采集的真实性保证,规范数据使用和挖掘的规则,制订切实可行的实施条例和国家标准、管理措施,并严格遵照执行。2017年4月,全国信息安全标准化技术委员会发布了《大数据安全标准化白皮书》,为制订大数据安全相关法律条例提供了重要依据。

保卫大数据安全,除了从技术和法律层面发力,全民的重视和参与同样重要,因此还需要普及大数据安全的基本知识,培养数据保护的意识和习惯,建立大数据安全的健康生态体系。