试完这两款AI工具,第一次觉得人类设计师危险了

你好,欢迎来到《得到精选》,我是李南南。

今天的内容来自快刀青衣老师主理的AI学习圈。估计从今天的标题你就能看出来,AI领域最近又有大动作,这个动作大到什么程度呢?

快刀青衣老师说,这是他第一次觉得人类设计师有点危险了,因为AI的一些能力正在发生质的飞跃,它或许正在迈过那个“替代人工”的临界点。那么,到底是什么样的变化这么值得注意呢?

来,咱们有请快刀青衣老师来跟你说一说。

同学们,快刀广播站又开始广播了。

先跟你打个招呼,你现在看到的这个标题——“试完这两款AI工具,我第一次觉得人类设计师有点危险了”,确实有点标题党了。但我想你听完今天的内容,大概率不会觉得夸张。

这两款工具,都是我最近在“AI产品好用榜”第二期评测活动中试出来的好工具。先简单说说这个活动,这是我们AI学习圈发起的一个用户实测项目,由一群一线用户组成评测官,大家一起上手体验各种AI工具,挑出那些真正“能上手、能落地、愿意回头用”的产品。不是拉榜单、也不是蹭热点,而是想做一份普通人用得起、用得顺的工具清单。

这段时间我自己也试了不少工具。今天这期广播,我就想跟你聊聊其中两款让我眼前一亮的AI产品:一个是Napkin,可以一键把文字变成结构图;一个是ChatGPT-4o的新模型,现在已经能听你一句话,直接画出一张图来。

如果你平时写东西、做汇报、找图配文,那今天这期建议你一定听完,听完你很可能会忍不住立马去试一把。

先说Napkin。这款产品一开始我以为是啥便签工具,后来发现它的核心能力,是把文字自动转换成结构化图形——也就是我们常说的思维导图。

我自己上手测了一次,用的是我之前写过的一篇广播站文章,标题叫《如何用AI比别人快10倍地学东西》,内容我自己很熟,当时写的时候是用文字列了六个要点。我就把这段内容复制下来,直接粘进Napkin的对话框里。具体的操作步骤,我做成了一个简单的流程图,你可以点开文稿看看。

我贴进去不到3秒钟,一张结构清晰的思维导图就做出来了,并且支持换模板、换配色,最后做好的结构图也可以顺利导出。

在我一个没学过设计的人的眼里,Napkin生成的导图还挺好看,挺有设计感的。我也把效果图附在文稿里了,你可以点开看看。

总结一下这次体验Napkin的过程,我觉得它打动我的点有三个:

第一,是操作简单,没有复杂的功能门槛。只要我打开网页、复制粘贴文字、点按钮,就能用上它。

第二,是它能生成的思维导图结构比较丰富,适合不同的表达需求。像我们在展示内容的时候经常用到的“循环结构”“递进结构”“并列结构”,它都有对应的模板,不会让人陷入“该怎么直观体现几件事是什么关系”的苦恼。

第三,是生成的图本身质量不错。无论是整体的结构布局、颜色的搭配,还是细节的图标设计,看着都很舒服。

当然了,我做了这么多年产品经理,但凡发现同行做的好产品,都会对背后的人和团队产生好奇。所以我专门去查了一下Napkin的创始团队。

它的两个创始人Pramod Sharma和Jerome Scholler,都是连续创业者。在做Napkin之前,他们做过一家用AI做互动学习游戏的公司Osmo,主要为3到10岁左右的孩子设计“边玩边学”的游戏和工具。那家公司后来以1.2亿美元的估值卖掉了。

他们在创业做Osmo的过程中发现了一个问题——现代职场的沟通方式还是太以文字为中心了,幻灯片、文档、会议纪要里面全是字,他们当时就在思考,能不能有一种方式,让每个人表达自己想法的方式,能像拍照一样简单?

后来就有了Napkin这款产品。这个名字的灵感来源其实很偶然——在硅谷有个著名说法,叫“napkin idea”,意思是那些在咖啡厅、酒馆聊天时,突然冒出的灵感,随手记在餐巾纸上的点子。很多成功的创业故事都是从餐巾纸上的点子开始演变的。而他们想做的,就是把“餐巾纸创意”这件事数字化、视觉化,让每个人都能更好地记录、分享自己的想法。

Napkin的产品逻辑也特别清晰,不是去做那些复杂的图形设计工具,而是围绕“表达一个结构化的想法”这个点来打磨产品。他们非常专注,不去追求高精度的艺术效果,而是追求结构清晰、信息传达准确。你可以理解成,是“Notion+PPT”的合体,是“可视化内容输出”的生产工具。

我看了一下他们的融资情况。Napkin目前拿到了来自Accel和CRV的千万美元级别融资。这几家投资机构一直很关注AI工具赛道,也投过像Notion、Miro这样的协作类产品。他们投Napkin,其实是押注了一个赛道,那就是新的“视觉表达方式”的兴起。说得再具体一点,就是在这个图文并茂、视频为王的时代,谁能更快地把结构信息变成视觉语言,谁就有可能成为新一代的内容基建工具。

Napkin的CEO说过一句话,让我印象特别深刻:“iPhone让每个人都能拍照,而我们希望让每个人都能画出结构图。”你看,这其实不是在做一款软件,而是在打造一个新技能——就像人人都能打字一样,未来也许人人都能用好看的结构化的图来表达自己的想法。

而且,这个产品背后还有一个更大的趋势值得我们注意,那就是“生成优先”(generation-first)的产品理念。换句话说,工具不再是先让你从零开始建一个东西,而是先生成一个初稿,再让你去调整优化。Napkin就是这种思路的典范——它先给你生成一张图,你再来改。这个路径其实大大降低了普通人表达的门槛,哪怕你是第一次接触,也能很快“跑起来”。

说完Napkin,我们再来说说ChatGPT-4o的“生图”功能。这是我最近真正“惊艳到”的一个AI进步。

OpenAI在3月26号悄悄上线了GPT-4o的新版本,虽然没有大张旗鼓宣传,但我身边不少同学都开始上手试用了。我一开始也没太在意,毕竟用Midjourney画图的那段日子,我也是每天拿小本本记各种指令词的人,挺麻烦的。但这次4o版本的变化,真的可以说是一种“碾压式”的升级。

我最大的感受有四个:

第一个,就是图的质量真的太逼真了。我还专门翻出了2023年2月,自己第一次用AI生成的图片。当时我让它画一对80年代的青年男女,坐在广场上。

最后出来的效果,用“惨不忍睹”来形容,都是在夸它。

转眼两年过去了,我用一模一样的指令词,让GPT4o重新画了同样一张图。把两张图片放在一起一对比,你会有种恍然的感觉——原来AI在它自己的世界里,已经悄悄迭代了这么多。

我把图片放在了文稿中,你可以点开看看。

2023年AI作品:

2025年AI作品:

我的第二个感受是,现在中文也能直接生成在图上了。

我以前经常建议大家在做海报的时候,用AI先画一个背景氛围图。但如果你想在图上加个标题或者口号,还得跑去美图秀秀或者Photoshop手动加文字。而这次4o直接就能在图上生成中文了。虽然偶尔会出点乱码,但大部分时候,文字都能准确地呈现出来。

当我看到它能写中文的那一刻,我脑子里第一反应是:“要是我说一句话,它就能换个更好看的字体,那该多好。”你看,人类就是这么不知足。

第三个感受是,现在可以直接把一张照片改成宫崎骏那种动漫风,或者换成别的风格。

这两天你刷朋友圈,估计已经看到不少类似的动漫图了,那大概率就是用4o新模型做出来的。我也没忍住,拿了我和罗胖、脱不花的合影试了一下,效果挺有意思,放在文稿里了,大家可以看看。

第四个感受是,它现在可以一句话改图。

这个功能真的是让我眼前一亮。因为GPT4o的理解能力确实强,只要你把需求说清楚,它就能听懂、然后立刻开工。

我试了几个特别日常的场景,效果都很不错。比如,我扔一张图片进去,说“把衣服颜色改成蓝色”,它立马就换了;再比如,我扔两张图进去,说“合并一下”,它就直接给我融合成一张新图;还有一次,我拍了张办公桌的照片,让它把桌上的两个手办抠出来,它转头就给我做了一张带透明背景的图,只有那两个手办。

这就意味着,以后像做广告海报这种事儿,只要你说得明白,AI听得懂,那就能直接干,效率高得惊人。

当然,AI也不是每次都能成功。

比如有一次,我让它把三个人的合影,全都换成阿根廷队服,它直接告诉我——这活儿有点难。

我就追问它为啥搞不定,它说这张图里三个人都穿着白衬衫,背景也是灰白的,要换得准确,有点费劲。然后它还特别认真地给我提了两个方案:一个是把三个人分别抠出来,单独换衣服,再合成回去;另一个是它先给我换一个人的衣服,发我看看效果,如果OK,它再继续换其他两个。

说实话,看到它这套回复的时候,我真替不少不是特别出挑的设计师捏了把汗。我们先不说技术水平、工作速度,光是它这沟通能力,就已经把很多人类设计师比下去了。

这次4o在生图上的进步,其实不全是AI自己变强了,更关键的,是背后有人类反馈强化学习在助力。OpenAI专门找了上百人的训练师团队,一起盯着AI生成的图,一个个去标注里面的错别字、失真的细节,或者那些畸形的手脚。然后再通过强化学习,不断地训练它,慢慢让AI学会怎么更精准地听懂人话、照着做事。

说完这四大感受,我来说一下接下来可能产生的变化。

第一个变化,是过去两年特别火的SD图像工作流,热度可能要慢慢降下来了。

以前像影楼、学校这种机构要用,成本高、上手难,门槛不低。但现在4o这个版本一出来,一些追求简单效果的AI智能体工作流,一下子就显得没那么必要了。

从这个细节来看,我们现在研究的AI工作流,其实也很可能只是个过渡方案。解决具体问题的小工具肯定还会有,但不一定非得用“工作流”这套复杂方式。因为现在,不管是在扣子还是其他地方做出来的那些智能体,更多还是偏个人用来自己玩、或者展示能力的,还很难真正嵌进企业的工作流程里去。

第二个变化,就是对很多有想法的专业人士特别友好。

比如职场上要做一张海报、一个Logo,学校老师想画一张课件插图,或者做个物理实验的示意图,这些现在都可以直接交给AI来搞定。而且随着AI图像质量越来越高,我们也可以把画出来的图,继续扔进可灵、海螺这些AI视频工具里,让它们自动生成短视频。

我自己就试了一把——先让GPT4o画了一张《桃花源记》洞口的画,然后把图扔进可灵,几分钟就变成了一段小视频。

第三个变化,是很多项目在前期阶段,周期会被大大压缩。不管是企业里的产品研发,还是广告公司的概念提案,现在每个人都可以先把自己的想法交给AI画出来,然后团队再一起看图讨论。这样一来,除了交流理念之外,还能激发出更多新的创意,效率也高了不少。

第四个变化,是对那些写公众号的自媒体同学,真的太友好了。

以前光是找一张配图就得折腾半天,要是只是浪费点时间也就算了,最怕的还是用了不该用的图,还会被一些无良机构盯上、搞版权敲诈。但现在不一样了。你只要脑子里有画面,直接把想法描述给GPT4o,它就能帮你画出来。如果你连画面感都没有,那就把你写的文字扔过去,让它根据内容自动配图。

这个场景我也亲自试过了,效果图放在了文稿里,大家可以自己感受一下。

我还特意翻了下自己的Midjourney账单,发现我第一次付费是2023年3月17日,10美金,到现在整整付了两年。但这次4o的更新,说实话,是我第一次认真动了“要不要退订Midjourney”的念头。

然后,我脑子里一下就蹦出那句经典台词:“以前陪我看月亮的时候,叫人家小甜甜;现在新人胜旧人了,叫人家牛夫人。”

聊完两个AI工具,最后,再说点我自己最近的感受。

说实话,我作为一个多年的产品经理,看工具的时候,很少只看“功能强不强”,我更关心的是——它到底是不是一个合适的入口,能不能让普通人真正用上。

Napkin和GPT-4o的生图功能,它们真正吸引我的,不是“能做什么”,而是“怎么让普通人开始做”。它们给我的感觉是:在这个AI时代里,很多产品不再是解决某个“大问题”,而是在帮人“跨出第一步”。

Napkin把结构图的门槛降到了“复制粘贴”的水平,GPT-4o则是让你第一次觉得“画一张图不用画,只要说”。这两件事听起来不复杂,但背后代表的,是一类新的产品逻辑:你不需要变得更强,只要你愿意开始,这个工具就能帮你撑住后面那半段。

做产品这么多年,我越来越相信一个道理:工具的门槛,不只是“你会不会用”,而是“你有没有兴趣试”。能唤起兴趣、降低启动成本的产品,才是真的好产品。

所以,当你看到这些AI工具越来越“像助理、像合伙人”的时候,其实我们也要慢慢改变思路:不是等AI成熟到什么程度再用,而是越早开始用,就越容易变成它未来演进的一部分。

也许未来我们真正需要学的,不是某一门AI工具,而是“如何判断哪些工具值得试”的那种产品直觉。这个直觉,不是从哪门课上学来的,是你一次次用完工具,觉得“咦,这个还真好用”的那种微妙判断。

而这个判断力,就是你在AI时代最值钱的能力之一。

我们搞“AI产品好用榜”,其实也是希望帮更多人建立这种判断力。不是搞排行,不是推荐最火的,而是从几十上百个工具里,认真试过一轮之后,告诉你哪些是真正能跑起来、值得一试的好产品。像今天我之所以分享Napkin和GPT-4o,就是因为它们是真的让你“一用就明白怎么用,用着还挺上瘾,而且用完你会发现,确实把事儿办了”。

最后再跟你说个事。咱们AI学习圈这波产品评测已经接近尾声,最终榜单将在今晚,也就是4月2日晚上7点正式发布。我和罗胖会一起开一场直播发布会,带大家一起揭晓这份亲测好用的AI工具榜单。

这场直播我们准备了很久,不聊虚的、不整玄的,只分享一张为真实用户量身打造的工具清单。我会现场按照不同职业、不同使用场景,把我压箱底的那几款工具摊开讲一遍——哪些工具适合职场提效,哪些适合创作,哪些是真正对孩子学习有帮助的AI教育助手。

罗胖也会聊聊他最近观察到的趋势:在AI工具井喷的时代,一个普通人怎么选工具不被噱头带节奏,怎么找到最适合自己的那一套“AI组合拳”。

感兴趣的同学,欢迎点击下方链接预约这场直播,届时来直播间一起看榜单、选工具、聊思路。你要是有朋友刚好在做内容、带孩子、写材料,或者压根儿不知道怎么选AI工具,也可以把这个直播转给他。用上这些工具,真的有可能替他省掉几个晚上加班,或者多出一点陪家人的时间。

点此链接预约直播

好,内容听完了。

在这里,再次向你推荐快刀青衣老师主理的AI学习圈,这并不是一门单一的课程,它更像是一所AI学院,里面有各行各业的使用AI的高手向你传授经验。

同时,主理人也是得到的联合创始人快刀青衣老师,他会每天在这里向你播报AI领域的新进展、新方法以及新工具。

现在,在得到首页搜索“AI”,就能看到AI学习圈的订阅入口,推荐你现在加入。

好,以上就是今天的内容。《得到精选》,明天见。

Leave a Comment

Your email address will not be published. Required fields are marked *

en_USEnglish