伙伴们,快刀广播站又开始广播了。
以往,提起“数据工人”或者“数据工厂”,我第一时间会想起赞比亚或者印度这些地方,专门为美国企业做数据外包或者审核的公司,那里的员工过着黑白颠倒的生活,一整天都看着屏幕,手在鼠标上麻木地点啊点。但是,最近我看了一篇《连线》杂志的文章,里面提到的“数据工人”跟我之前的想的完全不一样,有语言专家,有作家,甚至还有核物理专家,我来给你介绍一下。
这篇文章的主角是一个在葡萄牙的25岁的年轻人,他叫杰伊,受过良好的教育,大学学的是数学专业。他在接受采访时说自己在中学时就爱上了数学,后来痴迷于微积分。看到这里的时候,我觉得人家的爱好真的很高级。不过,之前他认为有朝一日可以像自己的老师一样,把迷人的数学传授给新一代的孩子。
所以在2022年10月,他看到一则招聘信息,招的是数学专家,工作是批改方程式,他就跑去应聘了。不过他要去教的不是孩子,而是一个人工智能系统。这个系统就是OpenAI的ChatGPT,那时ChatGPT还没有上线。杰伊的工作就是为AI提供数学专家的指导,帮它改进数学能力。他就在葡萄牙的家里,通过对话告诉模型解决数学问题的步骤是否正确,在AI的答案上点赞或者踩一下,当然,有时还要写出解释,说明一下人工智能出错的原因。
他为山姆·奥特曼,也就是OpenAI的创始人工作,但却不是OpenAI的员工,因为他只是被邀请加入了Slack里的OpenAI工作区,Slack你可以理解为咱们用的企业微信、钉钉和飞书。OpenAI研究员尤里·布尔达建立了一个“数学训练员”小组,杰伊就是这个小组的成员,当然,除了数学之外,还有很多小组,不少小组里有非常多类似杰伊这样的角色。
其实,OpenAI、脸书、谷歌等头部AI企业背后,都有很多公司在为他们服务。比如,Scale AI,就是一家专门为AI企业提供高质量训练数据的公司。再比如,还有一家叫做Remotasks的数据人力众包网站,2017年成立以来,这个平台的核心就是为AI企业提供廉价劳动力。平台之前的业务主要是在菲律宾和非洲等劳动力低廉的国家找人,让他们去识别自动驾驶汽车的图像,标注出周围的形状。
等到生成式人工智能兴起之后,Remotasks现在的区域已经转向美国和欧洲,因为需要寻找更多专业技能的人来训练大模型。我特意去看了这个公司的官网,一进来就一行大字,“在家做在线任务挣钱”,还说全球已经有24万人加入,一共给大家分了1500万美金。不过我算了一下,平均一个人也就挣了62.5美金,还不到500块钱。平均值低,是因为被之前大批的菲律宾和非洲的低端任务拉低了数值。例如杰伊说自己的收入是每小时60美金,如果一天工作五小时,他一年的收入差不多8万美金左右,在葡萄牙算是中产了。
而从GPT4上线之后,Remotasks加速了寻找各个领域的数据专家,他们在1月的招聘广告中,寻找会说20种欧洲语言的人才、美国的创意作家或者编剧、体育记者、化学专家和核物理专家。之所以需要这么多各个领域的专家,应该跟OpenAI上线了GPTs平台有关,因为他们需要处理更多更复杂、更专业的任务,需要很多领域的专家来做数据训练。
OpenAI为什么要找这么多专家来训练数据呢?算法与数据伦理专家米凯利表示,以前大部分AI智能技术都是在所谓的大型垃圾公开数据集上训练出来的,ChatGPT表现很好,也是因为有一部分数据是在互联网上搜索的,并且付钱让肯尼亚的工人来做标记,这样就会优于很多没有数据标记的人工智能产品。只不过现在OpenAI太火了,所以他们这种搜刮数据的方式引起了不少诉讼,很多知名出版社都禁止了数据收集。现在来看,向专家付费、由专家来调教AI是一个不错的变通方式,并且这些专家可以新建出不少优质数据,这些数据的版权都是OpenAI的,就解决了优质训练数据的问题。
最后,我看了一下不同专家的时薪报价,传染病专家的时薪是40美金,历史学家是32美金,芬兰语言专家是23美元,而保加利亚语言专家却只有5.64美元,两种语言差了五倍。这让我想起了很早之前关于对人工智能的一句调侃,“人工智能,有多少人工,就有多少智能”。
我为什么分享这篇文章呢?也是因为在本周的新商学线下活动上,咱们学习圈的一个同学说他有很多年的飞机设计和机器人设计的经验,但是AI来了,要不要转行到AI。
我的看法是,AI会成为基础设施。什么叫基础设施?水、电、网络WiFi这些都是基础设施,未来一定是少数几家提供服务就足够了。而大量的机会出在用基础设施来做什么事情上。这时候,门槛就是有没有优质的数据,这个数据可以是你收集的1000套中式庭院装修图,也可以是某公司或者仓库的所有的进出库单,也可以是某个专家对生产线所有流程的熟悉程序,也可以是你对某个领域某个群体的理解。先有了这些优质的数据,然后再利用AI的力量,无论对公司,还是对个人,都会产生更大的价值。
找到自己的长板,在这个长板上积累更多的经验和数据,你在AI时代就会屹立不倒。
好,今天的快刀广播站就到这里了。如果你觉得今天的内容对你有帮助,欢迎分享到朋友圈或者转发给你的朋友们。明天咱们接着聊AI。
【相关链接】
《连线》文章:
https://www.wired.com/story/remotasks-ai-expert-data-labor/
数据人力众包网站 remotasks官网:
https://site.remotasks.com/
Scale AI官网:
https://scale.com/