跨年诚献:看懂隐私计算的2021年,收藏这一份就够了!

大数据 算力智库 2021/12/31 10:11

深冬很冷,但隐私计算的2021却很热。


这一年,隐私计算肉眼可见,已成为聚光灯下的焦点。

资本市场东风正劲,亿级融资扎堆,随着专用芯片、加密算法、白盒化、数据信托等技术与制度的融合发展,全域隐私计算崛起,同时也能窥见涌动着的创业暗流,超70多家隐私计算企业于今年成立,区块链公司,人工智能公司,安全公司等都在纷纷布局,瞄准了数据这一靶点,规模化应用开启,但竞争拉锯战也在打响,大浪淘沙下,是活下来或就此消亡的检验。


这一年,数据要素市场建设、数据合规与交易拉开征途序幕。

《数据安全法》、《个人信息保护法》正式实施,北京国际大数据交易所、上海数据交易所相继成立...,这些诸多至关重要的节点和事件,正在形成一只巨大推手,牵引着产业格局走向深处。


岁末年关,也许是一个好的回味和审视的时刻。

一幅关于数据、资本、隐私计算、合规这一系列关键词的年度长卷正徐徐展开,创新语境下的主角们也将一一登场,串连交融成不同的横截面,构成算力智库眼中的2021。


谨以此文,在跨年之际,献给每一位产业之道上的赶路人和耕耘者,聊慰暖意。



2021,被公认的数据合规元年

这一年有一系列法规发布实施:

01

2021年9月1日,《中华人民共和国数据安全法》正式施行,这是我国数据安全领域的一部基础性法律,也是国家安全领域的一部重要法律,从基础定义、数据安全管理、数据分类分级、重要数据出境等方面,作出法制规定。

02

2021年10月,中共中央、国务院印发《国家标准化发展纲要》提出,到2025年,实现标准供给由政府主导向政府与市场并重转变,标准运用由产业与贸易为主向经济社会全域转变,要加强关键技术领域标准研究,在人工智能、量子信息等领域,开展标准化研究。

03

2021年11月1日,《中华人民共和国个人信息保护法》正式生效,这是我国首部专门针对个人信息保护的系统性、综合性法律,其将与《网络安全法》、《数据安全法》一起,全面构筑中国信息与数据安全领域的法律框架。

04

《个保法》法案要点:
(1)“告知——同意规则”,信息收集、存储、使用、加工、传输、提供、公开、删除等全生命周期过程中保障个人享有知情权、决定权,有权限制或拒绝他人对其个人信息进行处理,不需取得个人同意的例外。如,履行法定职责和义务所必需、应对突发公共卫生事件、为公共利益实施新闻舆论监督等。
(2)看门人条款:大型网络平台(用户数量巨大、业务类型复杂)应成立独立机构对个人信息保护进行监督,建立健全个人信息保护合规制度体系,接受社会监督。
(3)个人信息可携带权:数据“携号转网”。
(4)规范国家机关行为:遵循个人信息处理“目的明确+最小范围”原则。
(5)顶格处罚:对经营者严重违法行为,最高可处上一年度营业额5%的罚款。

05

地方性条例规定:3月29日《安徽省大数据发展条例》发布;6月29日《深圳经济特区数据条例》发布;7月30日《广东省数字经济促进条例》发布;8月2日《浙江省公共数据条例(草案)》(征求意见稿)发布;9月30日《山东省大数据发展促进条例》发布;11月25日《上海市数据条例》通过。

也有些金句观点,在深刻洞察:         

01

数据分类分级是数据保护的起点,也是数据安全治理的前提,作为数据安全的关键环节,既是组织内部管理体系制定的基础,又是技术工具体系落地实施的支撑,《网络数据安全管理条例》中提出,按照数据对国家安全、公共利益或者个人、组织合法权益的影响和重要程度,将数据分为一般数据、重要数据、核心数据,不同级别的数据采取不同的保护措施。
——来源:中国信通院《数据分类分级工具技术要求与测试方法》

02

数据进行分级治理是隐私计算技术发展重要的方向,根据业务形态对数据的要求进行分级计算方式。是指计算方式不同,不存在隐私保护程度不一样的分级。
——来源:算力智库《疏堵通塞,数据共享流通成金融创新的一剂猛药》

交易试点,业态初具端倪

数据交易正逢其时,迈向2.0升级,基础设施和交易规则在摸索一条可行之路:


1、

2021年3月31日,国内首家基于“数据可用不可见、用途可控可计量”新型交易范式的数据交易所——北京国际大数据交易所成立,为数据交易大规模使用隐私计算提供了平台,基于区块链和隐私计算技术支持的全链条交易服务体系,将为市场参与者提供数据清洗、供需撮合、法律咨询、价值评估、权属认证等专业化服务,该交易所以数据使用价值为基本交易对象,从技术、模式、规则、风控、生态等5个方面着力破解数据交易的痛点。

02

2021年11月25日,上海数据交易所揭牌成立,重点聚焦数据确权难、定价难、互信难、入场难、监管难等关键共性难题,形成系列创新安排。数商体系、数据交易配套制度、全数字化数据交易系统、数据产品登记凭证、数据产品说明书五大“全国首发”,实现了全时挂牌、全域交易、全程可溯,通过数据产品登记凭证与数据交易凭证的发放,实现一数一码,可登记、可统计、可普查,为破解数据交易“五难”问题理清了方向。

03

2021年12月1日,深圳数据交易有限公司完成工商登记(简称深数交),深数交作为促进数据要素市场化配置的重要主体,将坚持公共服务的职能定位,兼顾市场驱动和合规发展,推动数据资源汇聚和交易流转。

04

数据交易原则:上海数据交易所明确将“不合规不挂牌,无场景不交易”作为数据交易基本原则,数据交易合规应至少涵盖:交易主体的合规、数据产品的合规和交易过程的合规。

05

数据产品化应至少包括:数据来源的合法性、数据产品本身的可交易性和流通性。当前主流的数据交易平台在交易模式上大体可分为三种:数据包交付模式、API交付模式、数据托管模式。

这些观点在试图拨开云雾:

01

如今是数据资本时代,数据融资未来会成为重要模式,而数据信托制度则是构建可信数据经济,实现共同富裕的关键选项。——清华大学技术创新研究中心数权经济研究室主任钟宏
来源:算力智库《上海数据交易所今日揭牌成立!数据信托可以做什么?》

02

隐私问题是数据开放、数据交易的重大障碍,只有解决了隐私问题,权属问题才能顺理成章地解决。——杭州长三角大数据研究院副院长郭兵
来源:算力智库《上海数据交易所今日揭牌成立!数据信托可以做什么?》


数商潮起,深水笃行

01

2021年11月25日,上海数据交易所首发数商体系,全新构建“数商”新业态,涵盖数据交易主体、数据合规咨询、质量评估、资产评估、交付等多领域,“数商”涵盖数据发现者、价值赋能者、联结者和服务提供者等各类经济主体,其中有作为数据交易主体的数据产品的供应方和需求方,有负责数据产品合规审查的律师事务所,也有负责数据产品资产评估的机构,还有协助数据产品交付的主体,隐私计算厂商或身兼多重角色,既是数据产品供应方、需求方也是服务方。
——来源:金杜研究院《数据交易畅想与“上海首发”》

02

“数商”是指以数据作为业务活动的主要对象或主要生产原料的经济主体,释放数据要素‘三类价值’(发现者、价值赋能者、联结者和服务提供者)是‘数商’的使命”。
——大数据流通与交易技术国家工程实验室常务副主任黄丽华

03

数据交易需要遵循完整的程序安排,从“数商”涵盖的范围可以看出,至少需要经过质量评估、资产评估、合规审查、材料提交、数据产品挂牌、交易文件达成、产品交付等一系列过程。从目前的公开信息来看,由律师事务所进行的合规审查是一个“必选动作”,其他过程应当如何安排,是否是必选动作,是可以自行安排还是必须通过第三方服务提供者来进行,交付过程是否有任何监管要求等,还需要通过未来制定和公布的规范文件来明确。
——来源:金杜研究院《数据交易畅想与“上海首发”》

场景下沉,应用开花


隐私计算落地之路,并没有快准狠的封神故事,互联网公司的跑马圈地魔法亦不奏效,只有下沉到场景中,应用才能开花结果。

01

2019年12月,中国人民银行启动金融科技创新监管试点工作,截至2021年10月,全国19个地区共推出127项创新监管试点项目,其中有13项涉及隐私计算技术,应用场景包括金融消费者人脸信息保护、产品营销、跨境结算、小微企业融资和信贷风控等。

02

在金融业务场景方面,隐私计算进一步推动了金融业务创新,包括更明确的交易模式变革、交易形态创新以及合规新挑战等。
——来源:算力智库《疏堵通塞,数据共享流通成金融创新的一剂猛药》

03

在金融领域,目前隐私计算主要应用于风控和营销两个方面。但是,隐私计算对金融领域的影响将不止于这两个方面。隐私计算与区块链技术结合之后,可以改变更多的金融场景,比如跨境支付、供应链金融等。
——来源:《开启新纪元:隐私计算在金融领域应用发展报告(2021)》

04

在数据孤岛,反洗钱业务中,以银行为例,此前由于对中小企业的经营数据掌握的不够完备,银行对中小企业的贷款非常谨慎,中小企业贷款难成为阻碍市场化发展一大痼疾,在隐私计算与区块链等技术的结合下,银行可以更好的收集到相关信息与同业机构交换参数、联合计算建模,为解决样本少、数据质量低的问题提供了方法。
——来源:算力智库《疏堵通塞,数据共享流通成金融创新的一剂猛药》

05

医疗数据安全一直是监管重点,包括互联网医疗数据、可穿戴设备数据以及科研数据等,体系建设的要求势必带来医疗数据的交互利用,而隐私计算是目前医疗数据合规利用中一项急需应用的技术。——华东医院信息科主任冯杰
来源:算力智库《医疗:疫情下的人类高质量数据共享场景 | 2021隐私计算半年纪》

06

如果只做单一应用,确实可以不需要隐私计算技术,但从诸多落地案例可以看到的趋势是,越来越多不同的场景其实都使用了同样的数据源,如医疗保险反欺诈、分级诊疗、病历书写、症候群预测等。过去,数据往往被重复使用和处理,现在基于隐私计算的数据底座就能实现统一的数据开放,再基于这样的数据底座开发各种应用。在此体系中,隐私计算平台就为数据要素化提供了底座和基础设施,能够让不同城市、不同部门既能自己管好自己的数据,又能打通数据、共同协作,隐私计算平台让数据要素在技术层面变得可用可扩展。——翼方健数CEO罗震
来源:算力智库《用技术解锁数据价值,翼方健数十大落地案例首次亮相!》

07

近年来医疗行业对隐私计算的接受程度越来越高,很多三甲医院信息科基本不用再做什么科普,隐私计算对于医疗领域应用的适配是未来趋势,不仅需要加强隐私计算底座的功能,而且需要找到切入临床问题的应用,并把应用基于底座实现。——锘崴科技联合创始人郑灏, 来源:算力智库《医疗:疫情下的人类高质量数据共享场景 | 2021隐私计算半年纪》

08

隐私计算与医疗领域还处于“磨合期”,医疗行业的特殊性对隐私计算的作用提出了更高要求,医疗领域的方法论相比其它领域要更为复杂,很多时候已经超越了建模的范畴,通过隐私计算的底座来支持复杂的方法论是一个挑战,其中涉及并发度、准确度、算法复杂度、隐私等一系列实现和优化点。——锘崴科技联合创始人郑灏
来源:算力智库《医疗:疫情下的人类高质量数据共享场景 | 2021隐私计算半年纪》

09

与其他行业相比,医疗对隐私计算的要求更高,考验隐私计算综合能力,是性能、安全性和精度三个方面的平衡,可以通过三方面实现:
(1)安全等级应由具体场景决定,避免过度保护或者保护不足。
(2)在确保安全保护等级的前提下确定数据分析过程中的精度要求。
(3)针对医学数据的特性、分析方法论的特性、多中心特性、高并发特性等结合隐私计算进行性能优化。——锘崴科技联合创始人郑灏
来源:算力智库《医疗:疫情下的人类高质量数据共享场景 | 2021隐私计算半年纪》


隐私AI成为下半场确定性趋

屡陷隐私风波后,今日商汤科技坐定AI四小龙第一股位置,但AI隐私问题依然如达摩克利斯之剑,悬而未决,可以预见,人工智能与隐私计算未来将成为彼此刚需。

01

2021在世界人工智能大会上,有一显见的亮点趋势,即人工智能正逐步与包括隐私计算、区块链、物联网、智能芯片等在内的其他技术,逐渐呈现融合统一的趋势。其中,隐私计算是面向隐私信息全生命周期保护的计算理论和方法,和人工智能一起,核心突破是,在保证“数据可用不可见”的前提下,仍然能实现数据的联合建模和价值分享。
——来源:《AI+隐私计算如何在未来掀起商业浪潮?|算力隐私专栏》

02

隐私计算通常与AI紧密结合,和从技术角度看,隐私计算是AI能力的重要补充。AI高度依赖数据基础,规模化且多样化的高质量数据,能够训练出效果更好的模型,隐私计算通过解决数据的“链接”问题,为算法的持续进化提供数据补充。
——瑞莱智慧RealAI首席架构师徐世真

03

产品层面来看,复制性低和通用性差是当前隐私计算产品化面临的一大局限。其解决思路,一是尽量从规范成熟、少定制化的需求场景切入,二是将隐私计算嵌入现有的成熟产品,比如隐私保护数据库、隐私保护大数据分析引擎。后者思路下,在与AI技术能力的结合中,隐私计算可看成AI中台2.0,即在原有机器学习平台中添加隐私计算功能模块。
——瑞莱智慧RealAI首席架构师徐世真

04

高效的隐私AI,能形成强大的正反馈网络生态,一旦隐私AI进入自进化,不断提升的模型效率,将具有强大的纠错能力和复利生成能力。在面对环境变化时,数据资产的安全流动,让个人隐私、商业秘密可以在防止泄漏的条件下进行交易,同时还能实现公共利益最大化。
——冉阳博士, 来源:算力智库《数据要素政策解读:如何激活数据资产?怎样完善市场化配置?隐私计算用武之地!》



“区块链+隐私计算”成为标配

在解决数据问题上,区块链与隐私计算殊途同归,也是天然拍档:

01

隐私计算技术结合区块链技术则是站在数据“物理分散,逻辑集中”的视角下,从根本上来平衡数据安全和数据价值之间的矛盾,这也是目前隐私计算价值最被认同的地方。——数牍科技副总裁张迎春,
来源:算力智库《5年后将有一半企业加码隐私计算,如何应对主权技术封锁?|算力隐私专栏》

02

数据的支配权和收益权尚未真正回归数据产生者本人,同时由于数据的复制成本接近于零,无权属证明导致所有权和使用权无法分离,难以定价,通过区块链技术对数据进行确权,用隐私计算对数据进行保护,都是数据生产要素化落地的重要技术手段,因此区块链和隐私计算必将走上前台。——数字资产研究院副院长,通证思维实验室发起人孟岩
来源:算力智库《国内首个隐私计算盛会闭幕,区块链与隐私碰撞,数据流动价值未来可期》

03

区块链解决不了隐私保护,要解决这一问题不得不转到密码学。只有隐私的固化才能给数据确权、估值、定价,因此隐私计算才是区块链应有的商业模式。以MPC为代表的隐私计算,会是下一代最核心的对数据定价和评级的基础设施和方法论。——矩阵元创始人孙立林
来源:算力智库《对话万向、众安等最强大脑,2020隐私计算的黄金时代或由联盟链发展强力开启》

04

区块链是账本,隐私计算是最终的结果,区块链与隐私计算的结合,主要体现在市场化的多参与方数据共享共治机制上。主要解决:参与方的可信问题,确保参与方是真实可信的,不是假冒的;数据资产治理问题,数据资产需要标准化,才能成为商品;参与方数据资产注册问题,这个过程相当于商品的上架,让潜在的合作方可以看到数据资产的元数据(即数据资产必要的描述信息)以及使用方式;算法的可信问题,数据处理的过程要对数据源是可见的,谨防使用方在结果中夹带隐私数据;计算的授权问题和计算过程的协调问题。——联通数科数据智能事业部区块链高级专家孙林博士
来源:算力智库《一文看懂隐私计算与区块链的CP故事》


政务数据”大超市”成为开放载体
蔚然成风

01

2021年,四川省大数据中心正在积极推进数据统一归集、统筹治理工作,打造全国范围内政务数据四川标准节点,后续将通过四川省融资大数据服务平台等场景化数据应用平台,逐步集成以隐私计算为代表的各类数据安全技术,为各类机构,如金融机构,提供政务数据合规应用服务。比如正在建设全国首个隐私计算技术的大规模应用平台,并配套建设线下孵化及培育服务,以此建设成为数据要素协同创新应用基地。
——来源:算力智库《一文回溯2021年隐私计算在金融场景进化之路,市场发生哪些改变?|2021隐私计算半年纪》

02

12月28日,海南省大数据管理局正式上线海南省“数据产品超市”,基于多方安全技术和联邦计算的技术架构,实现了会员注册与认证、产品上架与审核、需求发布、数据开发、监管审核、运营监控等功能,为各级政府和各类企业提供善政、兴业、便民、利商的数据产品。
——海南省公共数据资源开发利用试点成果发布暨数据产品超市上线仪式

03

浙江首次对全省20多年的政务信息化建设成果进行全面盘点,省、市、县三级3430个单位参与,基于全省一套标准,对10129个政务类数字应用系统进行梳理分析,建立了“一体化数字资源系统”,全面普查了全省政务系统的信息化基础设施、公共数据、应用系统、算法组件等数字资源,形成了数字资源的智能化“总账本”,在这个“大超市”里,各地各部门可进行“购物车”式的申请,数字资源能实现跨部门、跨地区、跨层级的高效共享、开发利用。
——浙江省大数据发展管理局副局长蒋汝忠,来源:2021年世界互联网大会乌镇峰会