让数据不再“裸奔”,隐私计算“四小龙”亮出通关密码

来源:中新网 编辑:李 娜2020-09-17 12:29:49
浏览

  当数据成为重要的生产要素,数据隐私保护与数据使用应该如何权衡?

  今年4月,《中共中央、国务院关于构建更加完善的要素市场化配置体制机制的意见》(以下简称“《意见》”)发布,数据作为一种新型生产要素被写入国家文件中,与土地、劳动力、资本、技术等传统要素并列为要素之一。

  《意见》明确,加快培育数据要素市场,推进政府数据开放共享、提升社会数据资源价值、加强数据资源整合和安全保护。

  数据的价值正在被重新认识,那么数据的安全该如何守护呢?

 

  数据要素时代来临,隐私计算迎来爆发节点

  其实,早在去年10月—11月,发改委先后授牌雄安、浙江、福建、广东、重庆、四川在内的六个地区为“数字经济创新发展试验区”,探索数字经济与各行业的融合发展。

  更早的时间,以微信、短视频、直播等为代表的互联网应用改变了我们的生活;以淘宝、京东、拼多多为代表的电商平台改变了我们的消费方式;以李佳琦、薇娅为代表的带货主播创新了新型商业业态;以5G、工业互联网为代表的“新基建”力量正在带动生产力的变革……

  这一切的背后都是数据要素作为支撑。

  Statista数据显示,预计2020年,全球大数据市场的收入规模将达到560亿美元,较2018年的预期水平将增长约33.33%,较2016年的市场收入规模翻一倍。全球数据量在2019年达到了41ZB,2020年预估达到50.5ZB。

  数据价值另一面,数据安全、隐私保护成为与之对立的矛盾。

  比如很多政府数据不能对外公布,通讯运营商、银行、互联网公司等收集到的客户数据受法律规定,也不能透露给第三者,因此数据被分割在一个个孤岛之中,数据之间无法互通,数据价值难以体现。

  然而即便如此,我们几乎每天都会接到各种营销电话,或推销房产、或推荐股票,在各种黑产面前,没有个人隐私可言,每年各行业曝出的数据、隐私泄露事件也层出不穷,公众对数据价值产生的过程产生了极大的不信任。

  数据由于具备可复制和可传播性,其本质上是不能被安全共享的,但在数据要素时代,我们虽然不共享数据本身,但数据价值应该被共享。

  为解决这个矛盾,隐私计算技术出现了。

  隐私计算,根据中国信息通信研究院的定义,是指在保证数据提供方不泄露敏感数据的前提下,对数据进行分析计算并能验证计算结果的信息技术。

  广义上是指面向隐私保护的计算系统与技术,涵盖数据的产生、存储、计算、应用、销毁等信息流程全过程,想要达成的效果是使数据在各个环节中“可用不可见”。

  说的更通俗一些,就是在保证数据安全的前提下,让数据可以自由流通或共享,消除数据孤岛问题,从而释放数据更大的价值,提升生产效率,进而推进产业创新。

  从这一点来理解,大数据市场规模有多大,隐私计算的天花板就有多高。

  为数据价值而生,隐私计算四小龙浮出水面

  隐私计算是一门综合技术,具体来说,目前主要包括三个方向。

  其一为基于密码学的多方安全计算(MPC)技术。通过秘密分享、遗忘传输、混淆电路或同态加密等特殊的加密算法和协议,从而支持在加密数据上直接进行计算。理论上,在不考虑代价的“理想”情况下,多方安全计算技术能实现任意的计算“功能”,并且达到比较高的安全性。但是由于数据通信量骤增,计算效率损失大和需要极高的算力要求等因素,MPC的技术产品化还有一定的限制,相关的技术解决方正在积极探索。

  其二为基于人工智能的联邦学习技术。在横向维度,每个参与者在本地训练计算自己的样本,只分享模型训练的梯度;纵向维度,各参与者训练各自的embedding(“向量映射”),共同训练上层模型。两个维度的融合,从而让多个相互不信任的数据拥有方不必共享数据的基础上联合进行模型训练。

  其三为基于可信硬件的安全沙箱计算(TEE)技术。其核心思想是构建一个硬件安全区域,数据仅在该安全区域内进行计算,利用可信任执行环境TEE防止操作系统恶意地查看应用执行环境的内容;利用安全沙箱防止恶意应用通过特殊调用控制操作系统。

  目前业界的普遍共识是,要实现数据“可用不可见”,单一技术难以独挑大梁,不同技术路径(密码学、人工智能、区块链等)的互补融合才是发展趋势。

  也正是在这样的背景下,蚂蚁金服、微众银行、华控清交、翼方健数这4个隐私计算玩家在一众竞争者中跑了出来,凭借着各有所长的综合解决方案成为隐私计算赛道的“四小龙”。

  比如蚂蚁金服用来做数据安全与隐私保护的TED ENGINE引擎,就融合了敏感数据智能打标技术(Tag)、AI安全增强技术(Enhace)和智能威胁识别技术(Detection)三项技术。在Enhace技术中,蚂蚁金服又以差分隐私和可信硬件为重点开发方向。

  此外,蚂蚁金服还开发了一个大规模多方安全计算商用平台——摩斯Morse,直接向其他企业机构提供个性化的多方安全计算服务,解决业务实际的问题。

  微众银行在融合密码算法、隐私保护算法、安全多方计算等技术的基础上,开发了一套即时可用的场景式隐私保护解决方案WeDPR。今年的杭州区块链国际周上,WeDPR被评为“隐私计算场景应用最具实力派”。

  另外值得一提的是,微众银行的联盟学习开源项目Fate还拥有联邦学习的自主知识产权。

  华控清交专攻多方安全计算,创始人姚期智为清华大学交叉信息研究院院长,也是图灵奖唯一的华人获奖者。多方安全计算的技术理论源于姚期智在1980年代提出的“百万富翁”设想,作为该理论的提出者和重要奠基人,致力于推动技术落地。其PrivPy平台实现了高性能通用的安全计算框架、集群化和可扩展的解决方案。

  翼方健数的数据隐私计算平台翼数坊则以“数据和计算的互联网”(IoDC)为核心,建设开放生态,并在厦门落地了全国首个大规模部署的隐私计算平台,实现数据战略从顶层设计到底层实现的“落地”。在平台中不光融合了自研技术,还集成了第三方优秀的技术方案,其中包括同态加密、区块链、联邦学习等,通过计算实现数据的打通、共享和价值实现。

  另外一个层面,从隐私计算应用的落地行业来看,金融和医疗是两个最主要的赛道。

  数据安全对于金融行业的重要性我们很好理解,往小了说,关系到我们每个人的钱袋子,往大了说,关系到国家的经济基础,因而我们可以看到,隐私计算“四小龙”中,蚂蚁金服、微众银行和华控清交的基本盘都在金融赛道中。