蚂蚁制定共享智能标准,打通数据安全与互通边界
发布时间:2020-07-11 08:33来源: 网络整理7月8日-10日,2020 世界人工智能大会(WAIC)开幕,本届大会的主题是“智能世界 共同家园”,谈智能化很容易谈到共享互通问题,但隐私性跟可用性难以兼顾,又是人工智能一直以来需要克服的问题。
比如在金融领域有一个很常见的例子,一个普通人去银行做贷款,他先去银行甲,银行基于一些本地数据判断这个人不能放贷,于是不通过。然后他又去银行乙,但是银行乙没有银行甲的这些数据,所以银行乙也许会把这笔贷款发放出去。这样的矛盾出现,根本是因为数据不流通所导致,数据为什么不流通?最直接的还是因为隐私和安全。
近期,由蚂蚁牵头制定的共享智能联盟标准在AIIA(中国人工智能产业发展联盟)正式发布,这也是全国首个共享智能的联盟标准。共享智能的本质是解决数据孤岛问题,也就是产生数据无法互通,互通安全隐私无法保障的核心问题。理想状态下,我们希望数据是可用不可见的,在多个参与方而且各个数据提供方与平台互相不信任的场景下,能够和多方的信息来进行机器学习,确保各个参与方隐私不被泄露,数据不被滥用。可以说,蚂蚁共享智能是目前最有可能突破这个壁垒,解决这个问题的技术。
在这个标准中,核心包含两个共享智能方案,包括TEE(Trusted Execution Environment,可信执行环境的方案)以及MPC(Multi—Party Computation,安全多方计算的方案)。
基于TEE的共享智能核心思路是利用一个可信硬件(TEE)来充当一个可信第三方做中心化部署。我们知道,按传统思路,当有多个数据提供方想进行数据共享时,为了解决彼此不信任的问题,往往大家会找一个共同信任的第三方平台,把所有数据汇总到这个可信第三方平台上进行融合和计算。但是问题在于,在传统技术下,由于第三方平台上的管理员会拥有超级权限,这往往会使得数据提供方心存疑虑,担心第三方平台自身或者其员工,利用超级权限拿走数据。使用TEE技术可以完美解决这个问题,同时用户接入成本也极低。
TEE共享智能方案适用于中心化部署,而在模型服务(预测)阶段,机构对实时数据的隐私安全需求会比较高,另一个基于MPC技术的共享智能方案则是给用户的安全体感更强,基于MPC的共享智能方案已被应用于蚂蚁多个联合建模业务的全链路之中。在实际应用中,集中式TEE训练加分布式MPC预测的组合方案效果最佳。
以江苏银行为例,通过MPC共享智能,聚合蚂蚁和江苏银行双方信息,完成共同的模型构建,通过这样的机制实现联合信贷,使得KS提升50%以上,并很好帮助行方有效降低风险。
江苏银行和蚂蚁联合风控案例
曾经因为本身数据的不完整导致风控决策的错误。现在通过共享智能技术双方可以完成共同的模型构建。通过这样机制来实现联合的风控,可以使得这个效果大幅度的提升,同时在这个过程当中,数据的隐私得到了有效的保护。
在今年政府工作报告中,“提高科技创新支撑能力、稳定支持基础研究和应用基础研究,引导企业增加研发投入”被重点提及,表达了国家对企业科研创新发展的重视。自2016年开始,蚂蚁就开始投入到共享智能的研究中,出发点是为了解决业务中遇到的问题,比如机构与蚂蚁的信息协同问题。
蚂蚁也在积极探索降低企业落地门槛的技术和方案,希望更多的企业能参与进来一起共建,而不需要重新再去走蚂蚁之前走过的很多弯路。金融企业可以根据自身业务发展的需要,及时跟进业界最新进展,从而选择更合适的技术和合作方来解决业务难题。能够让业务赢,解决业务痛点,是这里面最重要的因素。
“人工智能的权利义务与法治实践”,可以看到的是,今年人工智能大会探讨的议题也更加贴近应用层面,对隐私安全关注度更高。面对未来,蚂蚁的期盼是希望通过逐步开放技术能力,赋能行业中有需求的企业,同时会联合更多单位,包括研究机构、企业等共同推进解决技术难题。全行业共建一个可以在保护用户隐私和防止数据滥用的前提下实现数据互联互通的共享智能网络。