你好,游客 登录 注册 搜索
背景:
阅读新闻

于挺:移动互联网、大数据时代下的隐私保护与电子数据

[日期:2013-10-18] 来源:新华网  作者:于挺 [字体: ]
  很高兴有这个机会跟大家分享一下大数据时代下的司法问题,大数据这个名词现在变得非常流行,到底什么是大数据?简单给大家一组数据来显示一下,据谷歌的估计,在整个互联网的数据时代,五乘以十的十八次方,而IBM每天产生新的数据,包括互联网数据。而且根据这个数据来分析,我们每天所有的数据,90%的数据是最近两年内产生的。不光是系统企业的数据,同时最近几年个人的数据也急剧增加,大家都知道从Web1.0变到Web2.0,个人可以大量的分析数据,用户从一个普通的原来的数据获取者使用者变成数据的创始人。举个例子是Facebook为,每天产生的评论等是27亿跳的基础上增长,我相信在中国的企业,比如说像淘宝、新浪,他们的数据量大概是这个样子的。也就是说在这个过程中很多数据别企业收集和应用到了。
  大数据…比如说高速度,数据的产生非常快,需要我们在很短的时间内能够收到数据进行处理,得到的知识对实际进行指导。还有一个是多样性的并不仅仅是数据大,而且是当前的数据来源变得多样化,它们有不同的类型和不同的质量,比如说对企业来说需要对不同的数据进行整合,进行连接和分析,而变成有用的信息。
  大数据的集成应用非常广泛,我们都听了很多的报道,大家也有很多的实践,比如说在金融业、商业、营销广告、医疗、健康、科学创新或者是国家安全上都有很大的大数据方面的应用。另外一方面,大数据也对个人隐私产生了很大的影响,很多人担心因为大数据的研究,是不是可能对个人隐私受到很大的侵犯。我们都知道隐私权是一个基本人权之一,各国都有很多关于隐私保护的法律框架,隐私问题一直是个数据管理的重大挑战,今天因为有大数据,它又更大的影响了隐私保护的范围和方式,有多个方面,比如说数据本身方式的改变,还有是对数据的分析有很多结果,可能是涉及到个人的隐私或者是怎么样,对这些衍生的结果进行保护,还有一个是法律适用范围的问题。
  给大家举两个例子,一个例子是去年2012年的时候有一个报告,Target是美国的一个零售商,像沃尔玛一样,他就报道说为什么这个零售商知道这个女孩怀孕了而她的父亲不知道,就是因为这个厂商对这个用户的购买行为进行分析,推导出来这个女孩怀孕了,然后就寄一些怀孕的优惠券之类的东西,这个父亲就很奇怪。结果是她女儿怀孕了。所以这个例子告诉我们一些不起眼的很平常的数据经过大数据的分析和其他的数据整合可以能够分析出很多很敏感的个人信息,这就涉及到一个隐私保护。
  刚才我们还谈到法律界限的问题,现在有一个法律在美国叫做HIPPA,是一个关于健康保险,或者是健康医疗方面个人隐私的保护法案,在大数据之前这个法案的适用主体是比较清楚的,如果你是医院、诊所、保险公司,可能会受到用户的隐私信息、健康信息,这些法律适用在这些。但是在今天大数据的情况下,尽管看起来是没有关系的执法商,可能也会收集到有关的信息。比如说刚才的例子,我既然分析出来你怀孕了,这是你的健康信息,是不是这个法律可以适用在你这上面。还有我们现在在手机上用很多的应用,比如说你跑步的信息、位置信息,这些信息加起来综合在一起,也可能涉及到你自己的健康信息,是不是说明这些应用也要受到HIPAA的管理?这就使得应用主体变得非常模糊了。
  国际上有一些关于隐私保护的公认原则,比如说收集限制、数据质量、目的确定等等的原则,在大数据时代下,我们都要对这些原则进行思考,是不是改变了原则的适用性和是否有新的挑战,使这些原则得到很好的维护。由于时间关系我挑几条来做一个分析,第一条是收集限制原则,意思是个人信息收集应该合法和公开透明,不应该对个人财产造成伤害,而且要用户有知情权或者是同意。但是在大数据的情况下,这条原则变得模糊,比如说我推算出来的信息算不算个人隐私?如果是推算出来的信息我怎么样能够让用户知道我推算出来的是隐私的信息?而且由于大数据分析的能力,原来一些大家认为不可识别的信息,比如说我买的一些东西,如果只是说那个人买了东西,我并不知道那个人是谁。但是在大数据情况下,当这些信息和其他的信息进行整合分析之后,这些不可识别信息变成可识别信息了,它所适用的法律条款就不一样了。而且现在由于数据收集无所不在,你和任何一个网站进行交互的时候,很多数据都会收集起来,使得用户的知情权很难得到维护,大家在不知情的情况下数据就被收集走了。
  再来讲一个原则叫做使用限制原则,这个基本原则的意思是说如果你收集了我的信息,你要告诉我为什么要收集这个信息,你收集以后的使用情况和你当时所明确的目的性应该是一致的。但是这个原则在大数据时代也变得非常困难,因为通常情况下你收集的数据在大数据分析之后就会发生改变,收集时候并不确切地知道将来会用于什么目的,如果说只能用于这些数据收集之后用于原来提供的目的的情况下,很多新的有价值的分析服务就不能实现了,比如说医疗研究、诈骗预防或者是信用评估,国家安全等等。也许我们需要改变它整个的结构,原来是一个白名单的结构,收集数据,你要做市场分析,做交易完成,现在有可能要变成一个黑名单结构,就是说我收集你的数据不会用来侵犯你的隐私,不会用来判断出你在某个时间段在某个地点,其他所有的看起来合法的应用目的都可以来进行使用。
  还有一个比较重要的原则是个人参与原则,这个原则就是说如果你的被收集到,个人有权知道哪些数据被收集到了,而且可以知道是否正确,可以根据法律来要求修改和删除这些数据。这个原则在大数据下有很大的实践挑战,首先因为对一个企业来说他收集到的个人数据数量非常庞大,用户区域也非常大,如果每个人都向企业提这样的要求,对企业来说很难满足每个人的要求。而且尤其是数据收集的渠道非常多,对每个个人来说,他都不知道你的数据被收集了,也不知道被谁收集了,所以一个用户很难真正向一个企业说我希望看我的数据是什么样的,然后提出更改或者是删除的要求。而且在这种情况下,对一些衍生数据,推断出来的数据是不是适用这个范围?对于商家来说,我推论出来的信息是我企业推论的结果,我怎么可以把这个东西告诉你?但是对用户来说你推算出来我的信息我应该知道这些信息,这样就产生了矛盾。
  在大数据情况下我们怎么对隐私权进行保护?跟其他的挑战一样,要从各个方面一起入手,比如说法律法规的制定,开发一些新的技术手段,对用户的教育或者是有效监督等等。我个人觉得其中一个很重要的方面是用户应该扮演更主动的角色,不能仅仅依靠别人来对你进行隐私的保护。比如说用户有能力了解企业个人数据的收集和使用情况,能够追踪个人数据的分享传播机制,能够及时发现隐私侵犯的情况,当然我们不能指望一个用户能做这个事情,所以我们需要借助技术手段和工具来实现这些功能,比如说保留证据的功能,如果企业收集了我的数据,我有什么办法能够证明我的数据被收集了,怎么证明我的数据从一方被传到另一方。
  所以对电子数据应用在隐私保护里有很多挑战,比如说个人数据的收集形式非常多样,每个企业都有自己的收集方式,是不是有一个统一的方式能够利于这个企业提供这种电子证据,产生电子证据,使得我们电子证据的生成、收集和保存都经过各方面的管理。然后合理的利用个人数据库进行更好的交互,使得数据的传输和个人数据的查询更加便捷。因为用户和各种不同的系统进行交互,所以可能会产生大量的电子证据,怎么样帮助用户来管理这些电子证据?比如我想知道去年哪些企业收集了我的位置信息,有一个办法可以很快地把这些信息归纳总结起来呈现给用户。我刚才提到云计算的问题,就是我不需要用户自己来保存电子证据,而是参与电子证据云,用云的方式把证据保存起来,进行查询和管理。还有一个是电子证据的粒度问题,你在什么样的情况下得到电子证据?是不是只有收集了一个信息我就有一个电子证据粒度?那样可能会使数据非常庞大。另一方面,如果是特别高层如果在条款中得到一个电子数据,可能对将来检测或者是分析就没有作用了,所以我们希望来个平衡、功能和负担之间的关系。
  作为总结,大数据对隐私保护提出了很多新的要求和挑战,很多隐私保护的原则在大数据情况下可能需要充分的审视和更改,电子证据能够帮助用户更好的提供隐私保护的能力,既是一个机遇也是一个挑战,比如说现在大家都重视用户的隐私,那么隐私保护变成了新的服务,企业是不是可以把隐私保护作为服务提供给用户,使他们能够从中受益。由于时间关系就讲到这里,如果大家有问题,欢迎大家在线下讨论,谢谢!




收藏 推荐 打印 | 录入:elainebo | 阅读:
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款