2020年年中,加州伯克利大学的研究者希望获取新冠病毒的感染者行为数据,来分析追踪新冠病毒的传播情况,考虑到数据隐私问题,他们把目光投向了同态加密技术。由于全同态加密在无需解密的情况下即可对密文进行任意计算,在保护数据隐私的基础上充分发挥数据的价值,全同态加密一直被誉为密码学的“圣杯”。
最近,阿里安全对全同态加密功能进行了重要扩展,扩展后的加密计算速度比当前最好的同态加密计算方法快64倍,密钥体积却小2个数量级。原本需要等待数小时的加密计算,现在几分钟就可完成。阿里安全阐述该研究的论文《Pegasus(飞马):同态密码上的多项式与非多项式计算》入选世界信息安全领域四大顶级会议之首的IEEE Symposium on Security and Privacy (S&P),这也是中国工业界在S&P顶会上首次实现了第一作者论文的突破。
全同态加密计算转换有障碍
正如加州伯克利大学的研究者希望能在充分保障新冠病毒感染者的数据隐私,又想发挥数据的最大效用,分析获取新冠病毒的传播情况,对抗目前人类面临的严峻考验,挽救更多生命。数字经济时代,如何发挥保护数据隐私,同时发挥数据的价值,是一个难题。
其中一个解法是,假设数据拥有者甲需要和数据拥有者乙进行合作,乙可以对自己的数据使用全同态加密再发送给甲,让甲在不触及乙的原始数据内容前提下完成计算,这样就能保护乙的数据安全,真正实现“数据可用不可见”。
不过,全同态加密在应用上还面临许多障碍。目前大部分全同态加密算法(A类)只支持加法及乘法等多项式计算,而难以有效支持除法、根号等非多项式计算;少部分(B类)同态加密算法可以支持任意计算,但是其性能显著低于A类。
图示:A、B两类全同态加密技术优劣势比较
这就好比两个加密“工具”各有优劣,却没有集合两方“长处”的工具,在实际加密应用中,又需要能同时发挥两种长处的“工具”。
“实际应用同时包含多项式计算和非多项式计算,这些问题很难使用单一的全同态加密妥善解决。”阿里安全双子座实验室高级算法工程师居侯介绍。
居侯的主要研究方向是同态加密与隐私保护计算,他于2019年加入阿里安全双子座实验室。与大众印象中的密码学研究者都是进行理论研究不同,居侯在密码学应用领域也投入了很多精力,他还为多个知名开源全同态加密算法库(如HElib、SEAL)贡献了源码。
阿里飞马方案可自由切换加密模式
最近,居侯和同事们提出了一个能够发挥两类技术长处的方案,帮助全同态加密技术大大提升了运行速度,并降低了运算成本。
阿里安全双子座实验室提出的这种全同态密文技术“Pegasus(飞马)方案”,是可以高效桥接A类和B类全同态密文技术的全新转换方案。
在飞马方案中,研究者可以在需要做多项式计算时使用A类方案(马形态),而在需要做非多项式计算时切换到B类方案(飞行形态),能巧妙解决这个两难问题。
“也就是说,假如要翻越一座高山,原来的方案是靠马翻山越岭,在飞马方案下,我们直接让马飞过高山,到山那头的平地时,又能切换成奔跑的马的状态。Pegasus(飞马)可以依据环境自动选择最优的技术方案,两种方案切换无障碍。”居侯比喻。
图示:阿里安全研究的“飞马方案”可以在需要做多项式计算时使用A类方案(马形态),而在需要做非多项式计算时切换到B类方案(飞行形态)。
正是由于“飞马”直接飞过了“高山”,全同态加密的速度大大提升。以机器学习中常用的操作sigmoid为例,Pegasus的计算速度比此前最好的工作(CHIMERA)快64倍。
“Pegasus(飞马)方案”不仅给全同态加密技术提速。它还将密钥体积减小了2个数量级,可减少公钥传输成本和计算的成本,如内存和硬盘的使用等。
阿里安全双子座实验室资深安全专家洪澄解释,此前密钥需要占据100G左右的内存,现在只要1G。普通电脑的内存是8G左右,手机内存是1G左右,以前需要使用高性能服务器进行计算,在“飞马”的技术方案下,完全可以使用普通电脑,甚至手机进行全同态加密的密钥传输、储存以及加密计算。
当前隐私保护计算技术已经逐渐开始获得认可,业界也诞生了多个相关的试点应用。但是由于其底层密码学技术性能和功能的局限性,这些应用往往集中于一些简单的应用场景,很难扩展到更大更复杂的业务范围。
也因此,“Pegasus(飞马)方案”这一突破在解决同态加密技术局限性的问题上前进了一大步,拓宽了各类隐私保护计算技术的潜在应用场景,加速了技术应用,更让从源头守护数字经济下大数据的应用安全多了一份技术保障。
洪澄阐述了“Pegasus(飞马)方案”诞生的原因:“在阿里新一代安全架构核心理念中,我们注重从基础能力开始打造稳定、可靠的安全技术,而密码学的安全性具备坚实的数学理论基础保障,是安全技术体系的重要基石之一。”
从源头“密码学”的安全、稳定性上着力,最终还是为了构建更安全和高效的应用,促进数字经济的发展。居侯希望,眼下“Pegasus(飞马)方案”的提出,可促进不同商业体之间的数据联合建模,比如银行和电商可以在保护各方数据的前提下,建立合适的数学模型,提高风控模型的能力,使每一笔交易更安全。