无处不在的危机
好莱坞明星的私照事件不过是冰山一角,真正的大数据危机无处不在,因为我们的数据已经被政府、商家甚至陌生人所掌握。
数据究竟有多大?
清华大学计算机系教授陈文光介绍,大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。简而言之就是“大”,是海量数据和复杂类型的数据的集合。
大数据之所以会产生,陈文光说,主要是因为信息技术的发展,“大数据链条整体可以分为三个步骤:数据感知、数据传输、数据存储与处理,在信息技术得到快速发展的今天,无论是传感器、3G或4G网络都能给数据的收集处理带来更大的便利。”同样因为现代的人与人之间的沟通渠道增多,不同的途径会产生关于一个人的大量的信息。
中国科学院教授刘世平认为,大数据实际上是信息时代的必然产物。它并不是这几年出现的,而是一个渐进的过程。当信息量和统计技术达到今天的数值时,大数据的概念应运而生,但并不是一个新的产物。“大数据的核心理念是,让决策来源于信息。”
那么大数据有多大呢?陈文光曾做过一个统计:以新浪微博的数据量为调查对象,1000万人每人最多1000条微博,占存储空间5TB。新浪微博用户3亿,数据量达100TB,这其中还未包括评论和图片。
所以,当全量数据堆积在一起时,其反应的结果或许就会推翻当初基于抽样统计调查出的结果,比如开普敦定律和冥王星的错误。所以,在这种定义下,才会出现大数据的“4个V”——数据规模大(Volume)、快速(Velocity)、多样的类型(Variety)和价值(Value)。
大数据的出现实质上是一种数据思维的体现,是一种宏观视角。它要求数据的全面性和复杂的关系,相比于其他“小数据”调查来说,其精确性虽有所降低,但正是从这种大规模的、模式化的数据统计当中能获取全新的数据结果甚至重构其文化和组织。
互联网和电信业是大数据应用的先行者,并且为其他行业提供了大数据支持。但也正是因为互联网和电信业的这种特质,也使得他们成为信息泄露的源头。大量个人的搜索习惯被互联网窥视,从而可以追踪用户的消费水平,进而窥探其生活习惯。
个人网络行为被监控
如果你经常网上购物,就会发现你浏览的类型产品会出现在广告栏处,这就说明用户的网页浏览信息已经被锁定并且跟踪。如果商家和浏览器商户合作,就会将其类似产品自动推送到你的眼前。
其实,不仅仅是购物信息,我们每天浏览的网页、进行的操作都会被系统记录,系统背后就是数据操作人员和盈利公司。央视新闻曾报道过关于cookie的隐私泄露问题,这是私人信息泄露的典型手段和案例。cookie是由服务器端生成的,发送给浏览器,而浏览器会将cookie的key保存到某个目录下的文本文件内,以方便用户下次使用时再次提取信息。虽然这样做方便了用户的使用,但同时却也方便了黑客通过cookie取得用户浏览信息,甚至包括密码。这样的事件从2010年就已经开始,全球最大社交网站Facebook的信息泄露事件,2011年韩国社交网站“赛我网”的3500万用户资料被窃并最终导致韩国网络实名制的取消等等。这也说明了在经济利益的趋驱使下,个人信息安全遭受巨大威胁。
每一个用户都是一个交际圈的核心,围绕着他的信息和人群如果被利益团体抓取,就能提供精准营销,这将会获得很大的经济收益。
不过,大数据对个人信息的收集是必要的,这样会大大方便我们的生活。例如在贷款时,银行就会通过大数据分析分析个人信用度,从而决定是否接受贷款,完成贷款过程。只是我们如何能使数据更安全。
商业公司的原罪
2013年人寿保险80万人保单泄露事件至今提及都会让人不寒而栗,这不仅是个人信息的泄露,也是商业机密的泄露。不仅仅是保险公司的保单,任何公司的数据都是严禁被外人查看的,甚至还会对本公司员工保密,如果一旦泄露,将会对公司造成巨大的损失。
由于大数据信息量巨大,并且社会信息资源开放利用,国家、企业、个人之间的数据权利面临着调整,这三者之间的信息交叉量大,因为每个人在作为个体的同时也是社会的一分子,个人信息和所需团体信息容易成为“临界信息”,就易造成团体机构的信息泄露。
为了应对数据泄露,数据防泄漏系统相继被开发出来,这种系统能遵从文档全生命周期来控制文件夹的内容不被盗取或泄露。当然,电子手段也只是一种防范,它并不能完全防止泄密事件发生。最终还是需要人的主观意识,尽可能不要随意填写个人信息和商业机密。
刘世平认为,信息泄露的问题其实一直存在,但大数据时代的信息泄露相比于一般信统计方式的信息泄露来说,信息量和详细程度会大大增加。
有“全球七大权威大数据专家之一”称号的麻省理工大学教授彭特兰的看法较为极端。他认为大数据时代是要以个人为主体,以个人为核心,为个人服务,被个人所控制。所以基于此大数据实际上不应该由以盈利为目的的商业组织获得。
彭特兰认为,大数据实际上算得上是数据时代每个用户的一个复制,是要有高度隐私保护的,很难想象落在商业组织的后果。即使被商家使用,个人应该具有四种权力:被通知权,能够明确的知晓自己的数据在何时、何地、以何种方式会被采集;知情同意权,个人明确的知道数据将会被如何利用,并且必须经由本人同意;审核,在这里主要是指政府法律机构负责审核;撤销权,个人随时可以销毁自己的个人数据资产。
简单的来说就是这是我个人的数据,只能由我掌控,你想知道什么需要经过我的同意。为此彭特兰提出了一个商店的模式,所有的个人数据都在这里存储,在面对外部访问请求的时候,给出最终答案,而不是数据本身,从而保证数据安全。
智能硬件捆绑用户
日益兴盛的可穿戴设备和智能家居是智能硬件两个最为重要组成部分。它们也把用户个人以及用户的生活和数据紧紧联系在了一起。
智能家居企业幻腾智能的CEO王昊就认为,大数据时代的安全危机对于智能家居是极大的挑战。“如果黑客能够入侵到一个用户的客厅,掌控他的洗衣机、电灯、冰箱,将会是非常可怕的。而智能家居所记录的数据如果被窃取,用户也同样面临个人生活习惯被不法分子掌握的风险。”
可穿戴设备同样面临着这种危机,假如一款主打健康的智能手环被人窃取信息。那么一个人的生活习惯、健康状况同样面临着被人所知的风险。
在新的硬件时代,以移动互联为主的大多数用户,安全问题基本产生在网络到硬件,或者硬件到硬件环节。前者如用户在下载各种应用,直接从云端下载数据等夹杂着病毒、木马,隐私泄露等。后者为各种可穿戴设备有时需要插到PC或者手机上同步的时候,病毒木马等跟着进来了。
传统PC时代的遇到的安全问题,后果最严重电脑死机重装系统,各种利害数据丢失。但在新硬件时代的安全后果可能要更加严重,不仅仅是软件系统破坏,不仅仅是数据丢失,不仅仅是被监控和隐私泄露,还有可能是人身安全。因为新的硬件很多是可穿戴设备,人体的各种特征数据被泄露了,可能会伤害到人体本身,比如智能驾车,智能导航,可能带来车祸等。
这并不是危言耸听,今年7月,一家厂商就发现了电动车特斯拉的漏洞。攻击者利用这个漏洞,可远程控制车辆,实现开锁、鸣笛、闪灯、开启天窗等操作。由于人与网络的无缝连接,安全漏洞日益增多,隐患越来越大。
数据安全要靠技术手段
在中国工程院院士邬贺铨看来,维护大数据时代的网络安全要有过硬的技术。“我国对大数据的存储、保护和利用重视不够,导致信息丢失或不完整,同时存在信息被损坏、篡改、泄露等问题,给国家的信息安全和公众的隐私保护带来了隐患。”
要解决这一问题,就要提高技术自主创新能力。邬贺铨认为,当前,我国所用的个人计算机和手机的操作系统几乎都是国外的,核心芯片依赖进口,这是很大的隐患。在网络安全方面,如果自己没有过硬的技术,就很难实现安全可控的管理。
斯诺登事件爆出美国大规模入侵华为服务器就是一个典型的例子。“外国的核心技术是买不来的,也是市场换不来的。这就要求我们在培育网络核心技术方面也要发挥市场在资源配置中的决定性作用和更好发挥政府的作用。”
安全成为各大巨头关注重点
其实,越来越多的IT巨头开始在数据安全领域做持续投入。
8月7日, Facebook宣布,该公司将收购互联网安全企业PrivateCore,后者可帮助Facebook保护服务器免受“恶意软件、未经授权的物理访问以及恶意硬件设备”的侵袭。Facebook首席安全官乔?苏利文就表示:“人们非常关注托付给Facebook等服务的数据安全性。”
8月12日,IBM完成收购了云托管安全服务提供商Lighthouse Security Group。IBM通过此次收购可提供一套独特的身份和访问管理产品,将经过验证的软件和分析技术与专业托管服务整合在一起,为数字世界里的企业处理复杂的安全问题提供方便。
Twitter也在上个月收购了一家小型密码安全创业公司Mitro,来帮助其改善地理定位能力。
尽管如此,现实中的安全漏洞依然不时发生。
复旦大学软件学院副教授杨珉就认为,没有任何信息是能够保证绝对安全的。任何密码都可以破解,只是需要时间。关键在于保护措施的更新速度要超过安全漏洞的出现速度。这并不容易,因为在大数据时代,各种安全危机有了新的形式并不断变化。
不过,云存储依然是未来的趋势,只是要加强数据中心的网络安全防护,及时修补漏洞,防止黑客入侵和撞库等盗号攻击。此外还需要对重要数据进行加密保护,更重要的是为用户提供更高级别的账号验证机制,访问重要数据推荐使用多重验证,而不仅仅依赖账号密码。
企业无法单独应战
在8月28日落幕的“2014中国互联网大会”上,大数据时代的网络信息安全成为从监管层到参展商持续关注的话题。根据互联网数据中心相关数据显示,互联网上的数据每年将增长50%,每两年将翻一番,而目前全球互联网90%以上的数据是近几年才产生的,大数据时代的互联网安全形势也日益严峻。
腾讯副总裁丁珂认为,“随着移动互联网的全面普及,社交网络成为黑客攻击和网络犯罪的新途径,云应用的进步加大了用户信息泄露的风险和事故处理难度,移动支付安全和移动终端漏洞成为安全新课题。大数时代的企业安全正面临内部管理和外部攻击的新型挑战,可靠的数据存储、安全的挖掘分析、严格的运营监管是大数据时代企业安全的刚需。”
“从外部威胁来看,境内外网络攻击活动日趋频繁,网络攻击的手法更加复杂隐蔽,大数据等新技术的应用,也带来新的威胁和挑战。需要我们不断调整工作思路,提高工作的针对性和有效性。另一方面,从行业自身看,网络安全工作还存在一些突出问题。”工信部通讯保障局网络安全处处长付景广指出。
丁珂认为,传统的端级防护、单点布防安全解决方案能起到的作用甚微,任何一家企业都无法单独对抗大数据安全的全面挑战,安全产业链协同成为必然趋势。信息安全需要在政府主管部门的统一协调管控之下,由产业链各个环节的企业开放安全数据和技术能力,而要想实现最终的产业协同,互联网巨头的示范责任将颇为重要。
安全问题永远存在,永远被解决
尽管这个大数据时代看起来危机四伏,但是没有国家会去放弃这个战略,没有企业会舍弃这块金矿,也没有人会不去享受科技对生活带来的改变。
正如著名咨询公司高德纳所说:“大数据安全是一场必要的斗争。随着计算机网络技术和人工智能的发展,服务器、防火墙、无线路由等网络设备和数据挖掘应用系统等技术越来越广泛,为大数据自动收集效率以及智能动态分析性提供方便。但是,技术发展也增加了大数据的安全风险。一方面,大数据本身的安全防护存在漏洞。虽然云计算对大数据提供了便利,但对大数据的安全控制力度仍然不够,API(应用程序编程接口)访问权限控制以及密钥生成、存储和管理方面的不足都可能造成数据泄漏。而且大数据本身可以成为一个可持续攻击的载体,被隐藏在大数据中的恶意软件和病毒代码很难被发现,从而达到长久攻击的目的。另一方面,攻击的技术提高了。在用数据挖掘和数据分析等大数据技术获取价值信息的同时,攻击者也在利用这些大数据技术进行攻击。
尽管如此,大数据也为数据安全的发展提供了新机遇。大数据正在为安全分析提供新的可能性,对海量数据的分析有助于更好地跟踪网络异常行为,对实时安全和应用数据结合在一起的数据进行预防性分析,可防止诈骗和黑客人侵。网络攻击行为总会留下蛛丝马迹,这些痕迹都以数据的形式隐藏在大数据中,从大数据的存储、应用和管理等方面层层把关,可以有针对性地应对数据安全威胁。
就如同一切困难和威胁一样,它们最终都会被解决。之所以,这次我们的反应如此强烈,是因为我们正在经历时代的变革、一次新的技术革命。正是因为我们感受到了它的变化和未知,才会有恐惧和疑惑,而在之后,将会是又一次人类科技的闪光。