1 月3 日消息:由中國信息通信研究院、中國通信標準化協會指導,隱私計算聯盟、中國通信標準化協會大數據技術標準推進委員會聯合主辦的“2022可信隱私計算峰會”在京召開。會上,中國信通院云計算與大數據研究所所長何寶宏發布了《隱私計算白皮書(2022年)》。
近年來,在政策驅動和市場需求同時作用下,隱私計算技術作為保障數據安全流通的有效方式,乘時乘勢高速發展,已逐漸成為促進數據要素跨域流通和應用的核心技術,廣泛應用于金融、通信、互聯網、政務、醫療、制造、能源等諸多領域。
《隱私計算白皮書(2022年)》將全面展現行業成就及發展新態勢,旨在為產業界應用隱私計算技術提供參考指導,推動隱私計算行業健康發展,在數據要素市場建設中發揮更大的價值。
《隱私計算白皮書(2022年)》由隱私計算聯盟聯合行業多家單位共同編制,主要涉及隱私計算概況、技術分析、應用分析、行業分析、熱點問題分析以及總結展望等多個方面。
隨著數字經濟持續高速增長,數據流通已成為數據價值化的重要途徑。而在滿足數據融合需求的同時,如何增強數據要素安全防護是數據流通面臨的關鍵問題。
隱私計算是平衡數據利用與安全的重要路徑。近幾年來,我國持續重視隱私計算技術的發展,特別是今年,國內多部門密集出臺了一系列政策文件,提出支持隱私計算技術探索,促進數據要素市場流通,隱私計算產業迎來良好發展環境。
根據隱私計算技術、應用的不同發展特點,隱私計算的發展歷程可劃分為四個發展階段,即萌芽期、探索期、增長期、穩定期。當前,隱私計算正處于產業快速增長期,即將邁入前景廣闊的穩定期。在未來,隨著我國數據要素市場的加速建設,隱私計算技術進一步成熟,隱私技術的行業應用規模也將穩定增長。
2022年,隱私計算在技術上迎來了一系列的創新迭代。一方面,各個主流技術路線持續迭代優化,在單點層面提升了能力上限;另一方面,為了適應現實場景,業內也開始探索通過技術融合等方式突破瓶頸。
在多方安全計算技術領域,今年行業內針對多方安全計算的性能優化與應用擴展取得了一定進展。在性能優化方面,通過對現有算法協議改造、結合硬件加速能力等方式,實現了數倍到數十倍的性能提升,提高了可用性;在應用擴展方面,各種新算法和新協議相繼出現,豐富了多方安全計算的應用場景。
在聯邦學習領域,今年涌現出了大量的優秀研究成果,技術處于快速發展階段。在性能優化方面,業內持續探索高效的聯邦學習算法,有效降低了異構網絡、物理距離、通信數據量等因素造成的通信瓶頸影響;在安全加固方面,針對增強協議的隱私保護能力、檢測并防御潛在的各類安全攻擊等方向均有新技術的出現,促進聯邦學習安全性持續、穩固的提升;在模型效用提升方面,更多AI新技術被引入到聯邦學習中,以求更有效地發揮可用數據的價值,解決多方交集數據稀缺的問題。
在可信執行環境(TEE)領域,從硬件側到軟件側均取得突破進展,為技術大規模落地應用提供了必要條件。在硬件側,隨著TEE技術的不斷成熟,越來越多的國內外硬件廠商在各自的硬件產品中加入了TEE相關能力。在軟件側,業內推出了一系列基于TEE的庫操作系統、隱私計算平臺等,提高了TEE技術的易用性;同時提出了支持各類硬件的通用TEE解決方案以及異構TEE互認證機制,逐漸打破了異構TEE之間的隔離性。
為降低單一技術局限性的影響,多技術融合為解決隱私計算的各類技術瓶頸提供了有效手段。多方安全計算與聯邦學習融合,可以增強對中間數據的安全保護能力,實現更加安全的聯邦學習聚合算法。多方安全計算與可信執行環境融合,可以防止因硬件環境被破壞導致的數據隱私泄露,同時降低多方安全計算跨網節點的通信瓶頸影響,進而提高計算效率。聯邦學習與可信執行環境融合,可以通過技術手段降低對可信第三方的信任依賴,增強整套系統的安全性。
隨著數據安全重視程度不斷增長,隱私計算的應用需求從聯合計算逐漸擴展到了數據全生命周期,隱私計算概念逐漸外延為“廣義隱私計算”技術體系,在原有基礎上擴展了數據限制發布、數據失真、輔助融合等技術。廣義隱私計算技術可以實現數據全生命周期的隱私保護和數據可控可計量。
目前,隱私計算在金融、通信、政務、互聯網、醫療等行業中的應用廣泛。通過調研分析,隱私計算的應用主要覆蓋兩類場景:第一類中,應用了傳統信息安全技術,但仍存在安全風險,隱私計算的應用可以進一步提升安全性,稱為隱私計算存量優化應用場景;第二類中,傳統信息安全技術無法滿足應用需求,隱私計算則提供了新的機會,拓展了數據安全流通的應用場景,稱為隱私計算增量創新應用場景。
隱私計算存量優化應用場景,主要有三個特點:一是原始數據保護要求較為嚴格;二是在保護原始數據安全前提下,通過共享數據ID提高計算效率;三是數據集規模較大。相比于傳統的方法,存量優化場景解決方案能夠加固對隱私數據的安全保護,同時提升關鍵的業務指標。
隱私計算增量創新應用場景拓展了數據安全流通的應用場景。該類場景對原始數據的保護更為嚴格;在保護原始數據安全同時具有特殊的要求,如需要在保護數據ID條件下完成特定任務等。通過隱私計算技術能夠滿足傳統數據流通技術無法支持的場景需求。兩個案例表明增量創新場景能夠完成特定安全要求下的數據流通任務,同時提升業務指標和計算效率。
從現有應用來看,國內隱私計算以To B市場為主,參與方類型眾多。行業需求方已覆蓋金融、通信、互聯網、政務等對數據融合需求較強的多個行業。技術提供方實現了以多方安全計算、聯邦學習、可信執行環境為主要技術路線的隱私計算平臺類產品,包括隱私計算垂類企業、大數據企業、區塊鏈公司等軟件提供商以及硬件支持類企業。
目前隱私計算技術提供方的商業模式主要分為平臺建設與數據運營兩大類。在未來,平臺建設不僅可以在現有的金融、通信、政務等核心行業的基礎上繼續擴大,也可以在醫療、能源、交通等創新領域進行拓展。對于數據運營而言,從傳統數據集或API調用轉向隱私計算模式進行升級改造將是未來的發展趨勢。根據這兩類商業模式的相關數據進行測算,預計到2025年我國隱私計算市場規模將達到百億元。
今年隱私計算領域標準、論文、專利等成果依然快速增長。在標準方面,隱私計算國際標準開始向安全和互聯互通進行擴展。而國內隱私計算相關標準迭代更快,已經向著各個應用場景、軟硬結合、互聯互通等方向逐步擴展。在論文、專利方面,隱私計算作為一種新興的融合技術,其理論研究和技術應用產出均呈現上升趨勢,也順應了世界各國重視數據隱私安全的政策基調。
開源生態促進隱私計算行業蓬勃發展。開源作為一種新型的生產協作方式正逐漸滲入到各個技術領域,也同樣有益于隱私計算行業。從隱私計算開源項目數量上來看,今年的隱私計算開源項目顯著增多,開源的技術路線以多方安全計算和聯邦學習為主。這些開源項目的不斷涌現,既可以降低隱私計算行業門檻,為行業發展帶來活力,又可以提升隱私計算平臺的安全可信性。
隱私計算技術在不同行業、不同場景和不同技術路線中的安全分級是應用過程中的熱點問題。根據廣泛研討,隱私計算安全分級框架思路如下:第一步,全面梳理隱私計算產品所面臨的安全威脅及風險點,可參考中國信通院牽頭編寫的隱私計算安全標準及評測實踐;第二步,定量分析各產品的數據保護程度,形成通用的數據保護程度評價體系,并結合主動攻擊和定量分析的方式做到安全可驗證、可度量;第三步,結合各行業的數據分類分級要求,確定各業務場景的安全基線,形成各分支技術通用且符合業務場景需求的安全分級框架。
隱私計算性能在某些計算場景中已顯著增強,未來可從軟件和硬件兩個層面進一步優化。在軟件層面,一是進行并行化處理,二是選擇高效的調度算法提升網絡通信效率,三是對算法本身進行合理優化。在硬件層面,使用專用的加速設備將同態加密等復雜運算轉移至硬件上執行可以縮短計算耗時,提升計算性能。
探索兼容性強、開放度高的互聯互通模式將成為數據流通的重要方向。然而,隱私計算互聯互通需要統一規范的接口、協議等實現跨平臺的數據、算法、算力的交互與協同。由于技術原理的復雜性和產品形態的多樣性,需要行業多方協作共同探索可驗證、可推廣的互聯方案,以便于在技術上形成統一的標準規范,在應用上適配業務場景,共同推動構建完善的互聯互通生態網絡。
隨著《中華人民共和國個人信息保護法》(以下簡稱“個保法”)出臺,隱私計算領域合規問題迎來廣泛探討。我們認為,單純使用隱私計算技術并不能免除取得授權同意義務、達到絕對的匿名化或滿足目的限制要求,它并不是為了幫助履行個保法的合規義務而設計的合規工具,而是對于增強數據處理安全性具有積極意義的技術手段。隱私計算可以通過加密、分片、不傳遞原始數據等方式大大降低數據泄露和被濫用的風險。
隱私計算作為數據流通的重要創新前沿技術,近幾年來在技術、應用和行業層面上都得到了快速發展,下一步應在性能提升、安全分級、互聯互通等方面重點突破。在未來,隨著隱私技術產品的技術能力和應用模式越發成熟,隱私計算將有助于構建數據流通的基礎設施,在保證安全的前提下有效持續釋放數據要素價值,促進數字經濟高質量發展。
本次隱私計算白皮書編匯聚了多方力量。面對這個日新月異、快速發展的行業,我們期待與業界共同守正創新,推動隱私計算行業健康發展,讓隱私計算在數據要素市場建設過程中發揮更大的價值!