硬科技报告:大数据“杀熟”可能被彻底解决吗?

你好,这里是《邵恒头条》,我是邵恒。

这周一,国际消费类电子产品展览会(CES)拉开了序幕。今年,CES展会由于疫情原因第一次搬到了线上。已经注册的观展人可以通过直播的方式,观看不同参展商的新科技介绍。今年总共有1800个展商参展。参展商有苹果、通用汽车等科技巨头,也有来自世界各地的新兴科技公司。

每一年的CES展览都会汇集过去一年里,最亮眼的新消费类科技。比如,有智能健身器材,智能花洒,能洗碗、倒红酒的家用机器人等等。随着越来越多的智能设备出现,我们日常生活的一点一滴也在逐渐“数据化”。这自然就带来一个问题,那就是在线上,我们要怎么保护自己的生活隐私呢?

这一期《硬科技报告》,彭天放老师邀请我们关注2020年,两项非常重要但是相对“冷门”的科技进展。第一项进展就跟数据安全有关。接下来,我们一起听一听彭天放老师的解读。

你好,我是彭天放,欢迎来到1月份的《硬科技报告》。

一转眼,《硬科技报告》已经陪大家度过了一年的时间。对我而言非常幸运的是,2020年是人类科技领域非常高产的一年。在这一年里,像是量子计算、太空探索、高端芯片等等这样知名度高,而且意义重大的领域都有很不错的进展。

但是,这也给我带来了一个“幸福的烦恼”,那就是有很多在我看来同样意义重大,但是比较冷门的科技进展,就还没有来得及分享给大家。于是,作为今年的第1期报告,我想为你回顾一下,在2020年还有哪些在我看来比较冷门,但是又很重要的技术进展。

1. Gartner将隐私增强计算(PEC)技术列入2021年重要战略科技趋势

我为你推荐的第一项进展,并不是某一个技术点的突破,而是一整个新兴的技术门类。这一类技术就叫做隐私增强计算技术。2020年的10月,全世界在科技趋势预测领域非常著名的咨询公司Gartner,第一次将隐私增强计算技术(PEC)纳入了它们预测2021年的九大重要战略科技趋势之一。

隐私增强计算技术在今天虽然知名度很低,但是它对于未来的重要性,在我看来就如同石油和互联网对于今天的社会一样。那究竟什么是增强隐私计算技术呢?这还要从现在全世界范围内,对于互联网企业的愈发的不信任这个现象讲起。

不知道你有没有感受到,在过去这一整年,我们经常会看到这样一类新闻,比如像是“被困在算法里的外卖小哥”,或者是被“科技巨头操纵的美国大选”等等。不论我们是认同还是反对这些说法,不可否认的是,全世界范围内对于大型科技企业的信任程度是远不如以前了。其中最重要的原因,就是很多人开始感受到这些科技巨头可能正在利用他们收集海量用户数据的优势,侵犯人们的隐私,甚至是谋取不当利益。比如我们经常提到大数据“杀熟”的概念,就是其中最典型的代表。

面对这个现象,我看到了两种截然不同的态度。一种态度,是认为我们现在个人数据隐私权的牺牲,是技术进步的必然代价,没有什么可大惊小怪的。另外一种态度,是觉得这些大公司实在太可恶了,是在滥用我们的个人数据,一定要制裁它们。

那有没有一种技术,既可以100%地保护我们的个人数据不被滥用,同时又能够确保将我们的各种需求,及时地告知这些科技企业,让它们能够给我们提供高效的服务呢?

这个问题,今天在很多科学家的心目中已经有了答案——那就是我在一开头提到的隐私增强计算技术。

所谓隐私增强计算技术,并不是某一项具体的技术,而是一大类既可以保护用户隐私,又能够实现数据计算效果的新兴计算技术的统称。我把这类技术,大概通俗地分成三大类,下面一一为你介绍:

首先,它能够充当我们每一个个体与大型科技公司之间的一层隔离区。

我们知道,今天我们在各类APP上的数据,大部分都是储存在云端的数据中心里的。APP背后的企业,如果真的想查看任何一个用户的数据,只需要执行一行代码就可以了。也就是说,用户的数据安全,本质上完全依赖于企业内部管理的水平,以及企业本身的道德责任感。

但是我们的隐私增强计算技术,可以在用户和APP之间建立一个数据的隔离区,用户所有的关键信息都是在这一片隔离区里进行存储和计算的,企业只能站在隔离区的外面,拿到隔离区里面给出的一些需求。这样一来,企业就没有办法未经用户同意,悄悄地使用APP里的用户数据了。这样一个隔离区,在技术上通常可以被叫做可信执行环境(TEE),比如据我所知,现在一些款式的华为手机里,就引入了类似这样的技术。

不过说到这里,你可能还会担心,把用户的关键数据放到隔离区里,不就相当于把鸡蛋放到一个篮子里了吗?这样用户不会更危险吗?

——诶,这就要说到隐私增强计算技术可以实现的第二类功能了。那就是,它能够变成我们每一个人的隐私数据,在网络世界里的铠甲。

有了这层铠甲之后,我们每一个人的关键数据,就不再是赤身裸体地走进这个隔离区了,而是会得到非常严格的保护。比如,用我们最熟悉的社交场景来举例子,这层铠甲的功能就相当于,你想在通讯APP上给朋友发一句话,但是你并不想让通讯APP看到这句话的内容,所以呢,就先让这句话穿上了一层铠甲,这层铠甲到了你的朋友那里才会卸下来。这样就避免了像通讯APP一样的,所谓的信息二传手,偷看信息内容。这一类信息铠甲的功能,在隐私增强计算领域中呢通常是以各类密码学技术作为底层原理的。而在这个方面,现在国外也已经有一些即时通信应用,在尝试给用户信息穿上这样的铠甲,让不希望被脸书、推特窥探隐私的人群,也有自己可以放心沟通的网络空间。

不过听到这里,有些同学可能还会担心了,这样做对于数据隐私倒是安全了。但要是一些不怀好意的人通过这种方式传输信息,不是会对社会造成危害吗?

——诶,这就要说到隐私增强计算技术的能够实现的第三类功能了。那就是它能够为各种类型的数据提供一个安全的交流中心。

我们知道,今天像是药物开发、城市建设、新产品的设计等等很多重要的生产活动,都需要大量交叉数据作为参考依据的。比如像是药物开发,研发人员既要知道病人的健康历史,也需要知道病人的生活习惯,甚至还需要了解病人的朋友圈;这么多敏感的数据,在今天而言,是绝对不可能交给任何一个研发公司的。这也导致了,很多高质量的服务和产品,在今天的技术环境下,完全没有可能被开发出来。

而刚刚提到的这个安全交流中心的功能,恰恰就是想要在数字世界之中,建设一个能够让各类交叉类型的数据,都可以放心进行计算交流,产生社会价值的环境。在这样一个环境中呢,任何一个想要使用数据的人,都要经过验证,并且说明来意,才可以在规则范围内使用数据。这样既发挥出了数据的功效,也避免了数据被滥用,同时呢也可以为执法人员打开一个合理的窗口,维护这个数据世界环境的秩序。这一类技术呢,就是今天被叫做安全多方计算、联邦学习等等新兴的概念。

值得一提的是,隐私增强计算的这第三个安全交流中心的功能,其实意义最重大。我们知道,数据在今天已经开始指导各种产品和服务的设计、生产环节了;有价值的交叉数据很可能是我们未来几十年里如同石油一般重要的资源。按照这样一个逻辑,开发一种能够允许大家安全地保存、交换和运算数据的平台,就如同在19世纪末关注石油开采炼油和内燃机开发的技术一样,有巨大社会意义。

总而言之,在今天这个时间点,我们看隐私增强计算技术,往小了说是一种可以保护个人隐私的方便工具;往大了说,它是人类社会在未来能够真正将数据作为一种生产资料,去使用和交换的基础性技术。隐私增强计算,是整个世界今天都没有办法回避的一项,必然会发生的技术。

听到这里有些同学可能会着急了,那我们中国在这项技术方面的进展怎么样呢?

非常令人鼓舞的是,我们国家今天在隐私增强计算领域,是走在世界前列的。已经有很多的技术创新团队,在这几年投入了这一领域的开发和创业,比如像是华控清交、翼方健数等等,就是其中的代表。特别值得一提的是,我们国家还有两位全球在这一领域顶尖的科学家,分别是姚期智院士和王小云院士,他们的研究团队,这些年也在持续产出世界级的研究成果。

隐私增强计算技术,是一项方兴未艾而且意义非常重大的技术。关于它,我还有一个感触想要分享给大家,那就是“科技带来的问题,不妨用科技来解决”。面对像是大数据“杀熟”这样的技术伦理困境,我觉得可以向前一步,考虑如何用更良善的科技来治理和解决。

2. 麻省理工学院科学家发明计算机自动设计机器人的算法

我为你推荐的第二项进展,也来自一个不太热门的领域,那就是机器人设计。

如果你看过电影《终结者》或者美剧《西部世界》的话,对于科幻作品里面一个常见的情节,一定非常熟悉。那就是原本由人类开发的机器人在自我意识觉醒之后,开始自主设计制造大量的机器人同类,并且反过来与人类对抗。但是不知道你有没有好奇过,设计和制造机器人,这可是人类最复杂的智力劳动之一,机器人真的有可能自动化地设计出大量的同类吗?

2020年的11月30号,麻省理工大学在官网上报道了一项非常有趣的研究。科研人员发明了一种让计算机自动设计机器人的算法,这种算法能够让计算机快速产生成千上万个机器人的设计方案,并且自己在其中筛选出最优质的方案交付给人类设计师,从而减少人类机器人设计师的工作量。

我在文稿区放了一张论文里面计算机设计出来的机器人结构图,你有兴趣的话可以看一下。在图片中,计算机给出了好几个类似昆虫的设计方案,并且还在里面挑出了自己觉得最好的一个方案。而且最终挑选出来的这个方案,搞不好比很多人类机器人设计师水平还要更好。

听到这里有些同学可能会想啊,现在的机器人设计师也太懒了,连这些本职工作都要委托给计算机帮忙,万一哪天真的把计算机教坏了可怎么办呀?

其实我想说,开发这样一个自动设计机器人的算法,还真不是因为工程师们犯懒。而是因为传统设计方法,已经没办法应对当前机器人设计中一个重要的挑战——那就是,单凭我们人类设计师的经验,已经没有办法应对越来越复杂的工作条件对机器人的设计要求了。

这样说可能有点抽象,我用一个对比再来解释一下:

过去的机器人设计,其实无非就需要应对几种简单环境,比如在家里或者办公室里的服务机器人,或者是待在工厂里的工业机器人。这些环境里,机器人面临的地形条件、工作任务都是比较简单和确定的。所以成熟的设计方案也就是我们今天看到的这几种。比如扫地和物流机器人,就是一个矮胖的圆盘;工业机器人,大部分就是一只灵活的机械臂。很少能看到令人眼前一亮的新设计。

但是在自然界中,如果我们把各种生物也看作机械结构的话,会发现截然不同的现象。在我们地球曾经出现过的上百万个物种里,各种各样的机械结构,可以说都被尝试过。并且在今天,还依然保持了高度的多样性。比如海里游的,鲨鱼、鳗鱼、水母、浮游生物等等,各自的机械结构差别是很大的。

导致这种多样性的原因,其实就是因为自然界对于生物的环境选择的条件非常复杂。因此没有一种生物结构的设计,能够适应一切环境。反过来,我们人类设计的机器人之所以长得都差不多,不是因为我们的设计能够包打天下,而是因为我们给机器人提供的工作环境比较简单。

但是,机器人作为我们人类拓展世界的工具,不可能永远面对类似办公室和工厂这样的简单环境的。今天从电力系统、城市管网的检修机器人,到飞往火星的探测车,甚至是未来在月球上建立基地的工人机器人,可以说面对的环境变得越来越复杂。传统的设计方案,还有机器人设计师的发量 ,已经很难应对这样艰巨的设计任务了。

最好是有一种技术,能够先帮我们设想出大量可能的方案,然后在一个虚拟环境中,帮我们筛选出比较好的供人类的工程师参考——这也就是各种所谓智能设计技术的初衷。

不过这个思路听起来虽然简单,但是实际操作起来,其实是非常困难的。你想,不要说整个机器人了,就哪怕是机器人上的一颗螺丝钉和齿轮,都有成千上万种尺寸和结构。通过完全随机的方法生成大量机器人设计方案这个思路,可能连一个零件都还没有随机出来,计算机就会因为运算量过大而死机了。

在过去,也正是因为科学家们没有处理好结构的复杂多样性和计算机有限的运算能力这二者之间的矛盾,所以自动化设计机器人的思路,并没有很好的实际案例。

而这一次麻省理工学院的科学家们,采用了一种全新的,叫做“图形语法”的技术。首次让计算机拥有了具备实用潜力的自动化设计能力,可以说是机器人智能设计领域的一项重大突破。

这个所谓“图形语法”技术的思路,简单来说是这样的:与其让计算机在无限种可能性中盲目尝试,不妨由人类先给它们提供一些我们认为成熟的机械结构,作为设计的起点,比如像是承担体重用的脊柱结构,像双截棍一样的关节结构,还有能够降低摩擦力的滚轮结构等等。每一个我们认为成熟的结构,都可以被理解成一个图形。而机器人的设计任务,被简化成了用一种语法将这些图形连接起来的过程,这也就是所谓“图形语法”技术的思想内涵。

通过这样的简化之后,计算机在设计机械方案的时候明显更加有的放矢了,于是成功地构建出了在一开始图片中看到的非常有灵性的设计结果。麻省理工学院的这项研究,可以说第一次让人们相信,通过计算机自动化设计机器人是真实可行的。行业内一些工程师,也评价这项研究是机器人自动设计领域,25年以来的最高成就。

短期来说,这一项技术的诞生几乎是立刻让计算机科学家在数字世界中,拥有了一种类似上帝一样的造物能力。麻省理工研究论文的第一作者表示,在未来的游戏设计中就可以使用它的算法构建出很多在现实世界中还没有被创造出来,但是非常先进的机器人设计。

而长期来说,我们今天其实依然有大量像是深海、高原、南北极,甚至是小行星、火星这样的环境,需要各种各样适合具体场景的新型机器人,去拓展人类的认知,开发那里的资源。通过这种机器人自动化设计的技术,相信未来的某一天,人类所开发的机器人品种,可能会比这个地球上的物种还要更加丰富。

在这个意义上,我想人类机器人物种多样性爆发的时代,可能才刚刚到来。这也是我在本月向你推荐这项技术进展的原因。

本期的《硬科技报告》就到这里,我们下一期再见!

好,《硬科技报告》听完了,我是邵恒。

彭天放老师今天分享的这两项进展,在我看来应了一句老话:发展带来的问题还得靠发展解决。

科技发展给我们的生活带来了不少挑战,有隐私安全、有人被机器替代的风险、有信息茧房等等。但好在,我们往往能从科技当中,找到这些问题的解决方案。

好了,这就是今天的《邵恒头条》。我是邵恒,我们明天见。

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top