把握数字经济的发展是当前的重点话题,与此同时,数字安全的重要性更无法忽视。今年初,《数字中国建设整体布局规划》(以下简称《规划》)的发布,为数字中国建设锚定了新时期发展方位,《规划》将数字安全屏障、数字技术创新并列为强化数字中国的“两大能力”,可见数字安全对建设数字中国的关键作用。
5月7日,以“数字安全@数字中国”为主题的2023西湖论剑·数字安全大会(原西湖论剑·网络安全大会)在杭州举办,中国发展研究基金会副理事长、国务院发展研究中心原副主任刘世锦在会上表示,“我国正处在一个前所未有的数字技术和数字经济发展机遇期,必须抓住用好这一机遇期,坚持“用”字当头,平衡和处理好数据产权保护、安全与利用的关系。”
随着我国社会数字化进程加速,数据规模持续扩大。据IDC报告,2018年我国数据量占全球数据量的23.4%,预计到2025年在全球的占比将达到28%。金融、医疗、交通等重要市场以及智能汽车、智能家居等新兴领域的快速发展使得数据量迎来井喷。
在当前的信息时代,数据就是生产力,它是信息的载体,对提高生产效率、加快经济社会发展变革起到重要作用,《“十四五”国家信息化规划》中提出,要充分发挥数据要素作用,加快数据要素市场化流通。
然而,数据中也含有隐私信息,可能涉及到国家利益、社会安全等,因此,《中华人民共和国网络安全法》《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》等法律法规相继施行,为保护信息安全提供法律支撑,重要数据及个人信息保护成为时代需求。
在这个过程里,不可避免地产生了隐私保护与数据要素流动之间的矛盾:数据自由流动,隐私难以保护,存在安全隐患;隐私保护过于严格,数据难以流动,则无法最大限度挖掘数据价值。
“既要重视数据产权保护不力、数据不安全等问题,也要防止有关利益主体借口数据产权和安全问题人为限制数据流通的行为。”刘世锦表示,强调数据产权保护和数据安全,是为了用足用好数据,不能本末倒置。“当前全球数字经济竞争激烈,我国在有些赛道上的优势已经明显减弱,要有危机感、紧迫感。”
其中,隐私计算是一个经典解法。它指的是在保护数据本身不对外泄露前提下实现数据分析计算的技术,包括联邦学习、多元安全计算、可信计算等技术,具有“数据可用不可见”“数据与信息适度分离”的特点,是平衡数据安全和利用很有潜力的新途径。
但安恒信息董事长范渊指出,不同的隐私计算技术各有痛点,性能、安全性和通用性不能兼顾,“关键是要构建一个软硬件一体的可信机密计算安全基础设施,把可信执行环境、安全多方计算和联邦学习等能力真正有机融合在一起。”他进一步补充道,除此之外,还需做到全栈安全、全栈可信,同时安全左移,让源头可信。“我们认为需要可信、可控的数字安全基础设施,它也是数字基础设施当中最重要的一部分。”
刘世锦表示,一些两难问题是因为技术上有瓶颈,不得不采用法规政策等办法应对,如果技术上有所突破,效果和效率都会更优。“这类技术还处在起步成长期,政府机构应带头应用,取得经验后向更多领域推广。”
目前,数字技术、数字经济总体上仍处在拓展上升阶段,他建议,对数据流动的管理监管不宜“一刀切”,可在若干城市开展试点,允许不同模式的探索与比较,“比如现有的地方法规或政策中,有的侧重于数据生产者权益保护,有的侧重于政府数据安全和消费者权益保护,各自都有理由和特点,还可以在实践中看一看再做评判。”
当落地到具体场景时,各个场景的复杂度非常高,数据的分类分级是其中的重点。“这是数据治理和数据安全治理的相交点,也是数据资产的起步线,数据安全的基准线,主体责任的推进线,所以我们将它总结为既要下笨功夫的地方,但同时也需要智能化赋能的地方。”范渊表示。
自然语言模型通过迁移学习进行模型训练,快速适配行业的数据特性,聚类模型、无监督的聚类算法实现信息整合自动标注相似字段,通过可反馈的强化学习对剩余数据自动化分类分级,“通过人工智能,新的行业效率提升5倍以上,已积累的行业效率提升10倍到20倍以上。”范渊介绍道。
这是AI与安全与治理融合的典型实践,范渊表示,AI+安全的智能化应用,会为智能防护和响应带来更大的机遇和成果。但与此同时,今天以ChatGPT为代表的AI大模型发展也会给数字安全带来新的挑战。
范渊分析道,一方面,AI和大模型本身会带来网络安全一些新的挑战,它自身有安全风险。另外,类似于ChatGPT这样技术的应用也会给自动化生成网络安全工具和病毒木马后门带来几百倍效率的提升。“我认为AI+安全的大幕才刚刚拉开,未来还有更大的可能性。”范渊表示。