伙伴们,快刀广播站又开始广播了。
昨天我给大家介绍了斯坦福团队出的《2024人工智能指数报告》,主要讲了一下报告提到的人工智能十大行业趋势。这个报告非常长,有500多页,看的时候我发现了非常多有意思的细节,所以今天我就带大家再看一下。
第一个细节是,报告开头非常显著地标明了,这份报告虽然由人类研究团队撰写,但在过程中得到了AI的帮助,比如用ChatGPT和Claude整理资料,复制和编辑初稿。其实这份报告就充分展示了现在AI跟人合作的最佳模式,让AI做它擅长的事情,我们做我们擅长的事情,然后一起拿出一个不错的作品。
第二个细节是,报告提到了一个AI发展面临的严峻挑战,就是高质量的数据。随着现有大模型的参数越来越多,无论是研究机构还是从业人员,都在担心未来计算机科学家会耗尽所有的数据。研究机构Epoch的预计是,高质量语言数据的存量在2024年就会被耗尽,低质量语言数据也会在未来20年内用完,并且2030年底到2040年代,我们将耗尽所有的图像数据。
这里我稍微多说一句,可能不少同学会认为,公开出版物、论文、图书这种是不是高质量的数据,这是从内容维度理解的。在AI领域里,高质量数据一般指的是准确、清晰并且有用的数据,例如没有语法错误或者事实错误,例如能覆盖不同的语言、方言、行业的数据,能让模型准确理解。另外还有一类数据非常重要,就是经过高质量标注的数据,例如情感标注、语义标注等等。
所以面对数据可能被耗尽的情况,现在很多大模型已经开始让AI自己合成数据来训练自己。不过2023年,一项相关研究发现,如果没有足够的真实人类数据,只有合成的,那么AI输出的质量会大幅降低。这也是为什么,有好几个过去很垂直的图片或者摄影师网站,在这波文生图的AI浪潮中,光靠卖图片授权就一下子盈利很多。正在听广播站的你,也可以想想自己手里有没有什么优质数据,在未来的AI竞争中,优质数据就是先发优势。
第三个细节是,报告里提到了AI模型训练成本的指数级增长。例如2017年,Transformer架构模型的训练成本是900美元,也就是6000元人民币。而到了2019年,这个成本就变成了16万美元,差不多100万人民币。到了去年,也就是2023 年,GPT4的训练成本是7800万美元,差不多5亿人民币。而谷歌的Gemini Ultra,据称是参数量目前最大的的模型,训练成本直接飙升到了1.91亿美元,也就是差不多12亿人民币。从6000元到12亿,只花了6年的时间,不得不感慨烧钱的程度。
所以大家在选自己平时常用的AI工具时,也可以增加一个维度,就是这个工具能提供稳定的服务吗?如果它对外说自己是完全从零到一自研的,那么你就知道了,它未来进行持续迭代是需要非常大的资本支持的。
第四个细节,报告分析了2010年以来在不同网站上的数亿个岗位,然后发现了一个有意思的拐点。就是2022年,人工智能相关职位占所有职位的2%,而到了2023年,这一数字降到了1.6%。这是不是听着有点反常识?AI大爆发,为什么相关职位不增反降呢?这不难理解,毕竟人工智能并不是一个堆人数的行业,它其实是高度头部精英化的。所以随着AI的发展和开源等技术的普及,对专业人工智能技术人员的要求会进一步降低。
另一个数据更能证明,对AI的使用不仅仅局限在研发岗位上。调研机构Lightcast发现,2023年,有15410个美国发布的岗位中提到,候选人要会用生成式AI工具,这占到所有新招岗位的59.9%。甚至有11%的岗位明确指出,需要候选人熟练使用ChatGPT。
第五个细节,根据麦肯锡的全球报告,在2023年,已经有55%的受访组织表示,至少在一个部门中用上了AI。对比来看在 2017年,用上AI的企业只有 20%。麦肯锡预测,未来五年,企业用AI的比例将会激增,这个预测其实是句正确的废话,不过这里面一个数据洞察特别有意思,对比2022年和2023年,企业里增长最快的三个部门分别是营销与销售,产品开发和客户服务,这3个部门也是率先用上AI的部门。这跟我们的体感也非常一致,就是AI可以帮我们做海报、当客服、优化产品,这几个部门加大对AI的使用量是非常符合逻辑的。
更有意思的一个数据是,哪些部门在2022年尝试使用AI,但在2023年却放弃了?结论是,12%的战略或财务部门弃用了AI;然后是安全与风险,下降了9%;第三是人力资源,下降了2%。其实这三个具体部门一说,我们就能理解原因了。因为现阶段AI最擅长的一个领域是创意的扩散,但是它在可控性上的表现没那么好。你想想看,战略或者财务部门,是最重视数据精准度的,总不能让AI每个月发工资的时候,去判断给你打多少钱,那这个惊喜或者惊吓也太大了。
第六个细节,我们要用AI但不能全依靠AI。报告在分析招聘人员审查简历时,分成了三个组,第一组使用先进AI工具,第二组使用相对落后的AI工具,第三组不使用AI工具。最后发现,只要是使用AI,就会比不使用AI在简历筛选的准确度有提升。但让人惊讶的是,使用先进AI工具的招聘人员,要比使用落后AI工具的人表现更差。这是因为,用先进AI工具的招聘人员,会过度相信AI的判断。而使用落后AI工具的人,在审查简历的时候会更加警惕。
第七个细节是关于人工智能对高等教育的影响的。从报告中可以看到,过去十年,美国和加拿大的计算机专业本科生的数量增长了三倍多。硕士生和博士生的趋势也保持一致,硕士生增长了114%。博士生在绝对数量上变化没有这么大,但也增长了19%。
不过要知道,计算机专业的博士生,毕业后进入任何AI相关企业,基本都能独当一面。这也促使研究者去调研了这批博士生毕业后的去处。在2011年,计算机专业的博士毕业后,有41%的人进入企业,42%则留在学校做学术研究。但是到了2022年,有 71%的博士选择进入企业,只有20%的人选择留校做研究。
另一个数据是计算机专业相关老师的来源,其中有个细分来源是从企业进入高校当老师的比例,2019年,有13%的新老师来自企业,到了2022年,这个比例降到了7%。这就意味着,对于人工智能专业人士来说,只有留在企业才能有更好的资源和发展,随着对算力和资金的要求越来越高,学术研究机构在保留人才上面临着严峻的考验。
第八个细节是关于ChatGPT在老师和学生中的应用情况。早期我们经常会看到,有机构反对学校使用AI,但是通过调研,到2023年7月,已经有超过63%的美国中小学老师在用ChatGPT了,他们30%用来备课,30%用来产生新的创意课堂的想法,27%用来增强背景知识。
而在态度上,88%的老师认为ChatGPT对教育有积极的影响,其中7成的老师认为现在的教育过程必须把ChatGPT的使用合并进来。
这个报告里的干货和数据非常多,有兴趣的同学可以去详细了解一下。只不过因为数据源的问题,里面关于中国的数据比较少,但是我相信很多结论,在全球各个国家,可能只是程度不一样,趋势却是完全一致的。
最后要跟大家说一件咱AI学习圈的新鲜事。不少同学之前都在问,有没有AI辅助做学术研究相关的课程?这下入门教程来了,《如何用AI辅助快速读写论文》今天正式上线,由天津师范大学管理学院副教授王树义老师主讲。如果你本身在做科研,平时经常需要读论文、找课题、写论文,推荐你去看看王老师这门课,用上AI,事半功倍。
好,今天的快刀广播站就到这里了。如果你觉得今天的内容对你有帮助,欢迎分享到朋友圈或者转发给你的朋友们。明天咱们接着聊AI。