数据开放与安全如何平衡?蚂蚁共享智能抛出“杀手锏”
发布时间:2020-07-17 07:28来源: 网络整理2020年被认为是数据隐私安全技术发展的关键时期,一方面是数据的价值得到更广泛的认可,另一方面是国家对数据安全保障的重视程度加深。
2019年9月,公安部针对大数据风控行业整治,监管力度空前,十几家大数据风控公司被警方接连调查或者查封,数据安全合规问题终于引起了金融行业和大数据行业的重视。今年4月份,国务院发文明确提出“数据是生产要素”,这意味着数据必须开放流通,必须发挥其作为生产资料的价值。
如何在数据开放和数据安全之间找到平衡?
相较于其他领域,金融领域对数据的管控更为严格,对数据隐私更加重视,因此也是最需要通过技术手段解决数据孤岛问题的领域。为了解决这一问题,国内外不少科技公司先后推出了解决方案,比如谷歌推出的联邦学习、蚂蚁提出的共享智能等。
“数据的流转在金融领域里相较更难”蚂蚁表示,采用共享智能技术,可以做到更好的隐私保护,实现数据可用不可见,是一个关键的助推器。共享智能理念是希望在多方参与且各数据提供方与平台方互不信任的场景下,能够聚合多方信息进行分析和机器学习,并确保各参与方的隐私不被泄漏,信息不被滥用。
通过数据融合,蚂蚁共享智能帮助国内许多大型金融机构建设了数据安全共享解决方案。如帮助中和农信大幅度提高了风控性能,把原来传统的线下模式,变成线上自动过审模式,完成授信只需5分钟,8个月累计放款31.9亿,授信成功人数44万人,业务覆盖20多个省区,300多县城,10000多个乡村。
蚂蚁共享智能杀手锏:TEE、MPC多技术融合解决方案
2016年,蚂蚁开始做共享智能研究,基于解决业务中面临问题的出发点,如机构与蚂蚁的信息协同问题,蚂蚁调研了差分隐私、矩阵变换等多种方案,确定了目前的技术大方向,提出TEE和MPC两大技术解决方案。
基于TEE的共享智能核心思路是利用一个可信硬件(TEE)来充当一个可信第三方做中心化部署。我们知道,按传统思路,当有多个数据提供方想进行数据共享时,为了解决彼此不信任的问题,往往大家会找一个共同信任的第三方平台,把所有数据汇总到这个可信第三方平台上进行融合和计算。但是问题在于,在传统技术下,由于第三方平台上的管理员会拥有超级权限,这往往会使得数据提供方心存疑虑,担心第三方平台自身或者其员工,利用超级权限拿走数据。使用TEE技术可以完美解决这个问题,同时用户接入成本也极低。
通俗来说,TEE技术解决了人员参与数据管理过程中的信任风险,由智能硬件充当可信第三方,多方使用数据和获取数据计算结果都可以实现可用不可见。TEE共享智能方案适用于中心化部署,而在模型服务(预测)阶段,机构对实时数据的隐私安全需求会比较高,另一个基于MPC技术的共享智能方案则是给用户的安全体感更强。目前基于MPC的共享智能方案已被应用于蚂蚁多个联合建模业务的全链路之中,多方联合建模的全链路通常包括了数据对齐(即隐私求交),特征分析(如共线性检验),特征处理(如缺失值填充),模型训练及预测。在整个链接中,参与方的隐私数据始终由各自保留,蚂蚁共享智能在每方部署一个计算模块;同时,多方通过计算模块交互密态的数据来完成数据分析及模型的训练/预测。
基于MPC技术的共享智能解决了多方数据交互过程中,尤其对实时数据安全较为敏感的阶段问题,数据直接在本地服务器完成计算,不用出域。在实际应用中,集中式TEE训练加分布式MPC预测的组合方案效果最佳。
AI浪潮之下,人工智能金融服务市场规模猛增
根据普华永道预测,中国2030年GDP将达到38万亿美金,其中7万亿美金为AI驱动。人工智能在金融、零售、制造业等多个赛道的布局越来越广泛和深入。尤其在金融领域,人工智能的应用有着广阔的潜在市场空间,根据高盛数据报告预测,2025年全球人工智能金融服务规模将达 340-430亿美元。
在AI技术和应用市场规模走上快车道发展的同时,上下游企业如何跟上队形,谋发展、推进行业进步是大家都在思考的问题。蚂蚁共享智能总经理周俊表示,蚂蚁共享智能是一个开放的生态,希望更多的企业能参与进来一起共建,而不需要重新再去走蚂蚁之前走过的很多弯路。金融企业可以根据自身业务发展的需要,及时跟进业界最新进展,从而选择更合适的技术和合作方来解决业务难题。能够让业务赢,解决业务痛点,是这里面最重要的因素。