经济学人:揭秘全世界最著名AI公司

全世界最著名的人工智能公司是哪一家?答案是,DeepMind。如果这个名字还有一些陌生的话,那么,你想必听说过AlphaGo。这个人工智能应用程序在2016年战胜了韩国围棋国手李世石,让人类一下子警醒到了人工智能的能力。DeepMind就是AlphaGo的开发者。DeepMind的早期投资人包括埃隆·马斯克、彼得·泰尔等硅谷名人。2014年时,谷歌收购了DeepMind。

经济学人》旗下的杂志《1843》,在三四月合刊中,发表了一篇写DeepMind公司的深度报道。报道通过对25个内部人士的采访,讲述了这家公司开发通用人工智能的想法和挑战,以及它如何努力保持在谷歌内的独立地位。

下面我们从三个方面为你转述下这篇报道的内容。

首先是这家公司的创始人和他开发通用人工智能的思路。

DeepMind的创始人叫哈萨比斯(Demis Hassabis)。他16岁时就考入剑桥大学计算机系,22岁时创办了自己的电脑游戏公司。29岁时,哈萨比斯回到伦敦大学读认知神经学博士。之后,他关于大脑海马体与情景记忆关系的研究,被《科学》杂志评选为2007年“年度突破”。2011年,哈萨比斯创立了DeepMind。他的想法是,找到开发通用人工智能技术的方法。

过往科学家开发通用人工智能的路径有两条。第一条路径基于规则,科学家试图搞清楚人类思考的所有规则,然后通过程序把这套规则写出来。这种方法一度非常流行,但却始终没有产生出好的成果。第二条路径想做的,是用数字形式复制大脑的物理网络结构。但是,研究人员发现,这项任务同样难以完成。因为大脑中有非常多的神经元,要想完全复制几乎不可能。

哈萨比斯的方法接近于中间立场,具体就是:参照大脑处理信息的宏观方法来开发通用人工智能。功能型磁共振成像技术,已经可以让脑科学家观察大脑活动时的状态。通过这种技术,科学家发现,大脑会在睡眠时,通过回放经验来学习,以便总结出一个通用原则。人工智能开发者可以效仿这种方法。

这就是DeepMind在开发人工智能时采用的机器学习技术:强化学习。使用了强化学习技术的程序,可以收集有关环境的信息,然后通过不断重复经验来学习进化。具体到围棋来看,程序在熟悉了围棋的规则之后,通过不断重复下棋来学习。如果程序走错了一步,输掉了比赛,下一次它就知道不该这么做。程序可以如此反复训练自己。AlphaGo就是在这个逻辑下开发出来的。

其次,我们再来看下DeepMind和谷歌之间的关系。这家公司在被收购之后,也努力保持独立,并且采用了至少三个方法。

谷歌收购了AlphaGo之后,DeepMind的创始人哈萨比斯,并没有像很多卖掉公司的创业者那样,用更多时间去享受生活。他继续执着于开发通用人工智能的愿景。

不过他首先要解决的问题是,怎么在谷歌内部还能保持自己的独立自主。报道说,2013年大部分时间里,哈萨比斯都在跟谷歌谈判交易条款。他想要达到的目的是:独立于母公司运营,获得谷歌提供的所有好处,比如钱和计算能力,但要保持控制权。用他的话说,“它将拥有创业公司的动力、最伟大大学的智慧,以及世界上最有价值的公司之一提供的雄厚财力。”

哈萨比斯为了保持独立做的工作包括,同谷歌签订了一份由伦敦资深律师起草的合同,名为“道德与安全审查协议”。这份合同规定,DeepMind的通用人工智能核心技术,开发出来后,会被交给一个叫道德委员会的管理小组。DeepMind的三位创始人都是这个小组的成员。这样做,可以防止谷歌公司单方面控制这项技术的知识产权。

此外,还有DeepMind员工对哈萨比斯的忠诚度。哈萨比斯设定的研究议程,吸引了全世界许多科学家加入这家公司工作。此前就有关于牛津大学和剑桥大学的科学家被DeepMind吸引走的报道。对这家人工智能公司的很多员工来说,他们更喜欢DeepMind,而不是谷歌。

然后,是DeepMind的公众影响力。经过AlphaGo一战,这家公司已经成为人工智能领域最著名的公司。谷歌数据中心的大量服务器产生的热量需要降温。DeepMind还用算法算出了最高效率方法,从而节省下能源。它号称在2016年已经把谷歌的能源费用降低了40%。这些都让DeepMind始终受人关注。不过,这需要DeepMind不断制造出大新闻。

这家公司目前还处在亏损状态。报道说,公司在2017年亏损了2.82亿英镑,约为25亿人民币。谷歌母公司的CFO波拉特,已经在对公司里的一些需要长时间投入的业务进行盘点,哪怕它们很酷。因此,自然有人会担心DeepMind还能不能长久保持独立的地位。

而且,已经有不详的前兆发生了。2018年11月,谷歌成立了医疗保健部门,随后就把DeepMind的医疗部门并到母公司的部门中。这样做的逻辑是:可以把整个公司的相关研发资源集中起来。道理很对,但报道抛出了一个问题:在开发通用人工智能这个问题上,谷歌会不会使用同样的逻辑?

最后,报道也指出了DeepMind目前技术的局限性。

这种局限包括:首先,DeepMind开发的人工智能程序,能够在给定的环境下飞速进化,但是,却不能对环境的微小变化做出调试。而外部世界其实是非常多变和不同的。比如,拿医疗人工智能来说,没有两个身体器官是完全一样的。

第二个局限是,目前DeepMind开发的人工智能程序,它的成功,取决于非常快速即时的反馈和奖励功能,反馈和奖励的信号还必须单一并且清晰。这种反馈与奖励,可以让程序知道自己做对或做错了什么,进度怎么样。但是,“现实世界并不提供简单的回报,进步很少用单一标准来衡量。”现实世界的反馈往往信号很薄弱、经常会被延迟等。包括人脑也是这样。人脑很少会收到任务完成的明确反馈。

以上就是《经济学人》旗下的一本杂志对全世界最有名的人工智能公司的深度报道。报道讲述了这家公司开发通用人工智能的路径、它如何努力独立于母公司谷歌,以及它目前技术的两个局限。希望对你了解目前的人工智能技术有所帮助。

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top