伙伴们,快刀广播站又开始广播了。
我在第八期广播站里,给大家推荐过几款翻译类的工具产品,然后发现不少同学非常需要一些常用的工具推荐,所以今天这期,我挑了一个最近被问比较多的场景来给大家做推荐,那就是音频转文字。
点击查看翻译工具推荐
最近这两年,AI工具已经非常非常卷了,出来了很多细分领域的工具,例如有音频转文字、视频转文字,还有会议转文字,视频类会分为主攻B站或是油管(YouTube),音频类还会分录音或是播客。今天我介绍的几款音频转文字工具,主要瞄准的是我们日常会使用的几个场景。
我先说一下自己使用的场景。核心是开会,这里不仅有公司里的项目和产品讨论会,还有出去听的一些技术分享会,我经常要先开启录制,等晚上的时候,把音频转化成文本,再整理成笔记。
另外一个场景,是某些重要的电话会,我会先录音,等有空的时候,再转成文本保存起来。
当然还有个场景就是有时来不及打字,就先简单地说两句,再转成文本保存到笔记里。
所以对我来说,有四个功能是选择产品时最看重的。首先肯定是识别的准确率,然后是中文、英文的识别要准确,第三是手机、电脑等多端同步,最后是要支持文档或者PDF的直接下载。
下面开始正式进入推荐吧。
第一个就是飞书妙记。飞书妙记并不是一个独立产品,而是飞书工作台里的一个应用。你听到这个推荐的时候,是不是会下意识地觉得自己单位是用钉钉、企业微信或者微信来做办公协作的,所以就没法用飞书了。
其实大可不必,你完全可以自己去申请个飞书账号,哪怕只是为了使用飞书妙记和飞书文档也是值得的。例如我不但有个公司的飞书账号,还有个家用的飞书账户,我去开闺女的家长会,都会把飞书妙记打开,把老师说的话全都转成文字,然后再发给家人。如果我没记错的话,应该是50人或者100人以内都不收费。
妙记对我来说,有几个功能非常实用,首先是手机、电脑、iPad可以多端同时使用。然后是实时转写,就是对面说什么话,手机马上像实时字幕一样呈现出来,非常直观且有获得感,还有就是一键翻译功能,我今年年初的硅谷行,全靠妙记才能跟上国外教授和专家的讲座。
第二个产品是讯飞听见。科大讯飞在语音识别上有很强的技术积淀,讯飞听见App在场景上,要比飞书妙记更加全面。例如有悬浮字幕功能,啥叫悬浮字幕呢?就是你在听播客或者音频内容时,开启这个功能,就能像是在高科技大会上一样,能看到实时字幕。另外一些常见的功能也都比较能打,例如会议纪要、AI提炼总结、导入本地音频等等。
讯飞听见还有一个优势就是硬件生态,讯飞有不少硬件周边,光我自己就有录音宝、录音笔、AI会议耳机,另外它还有AI办公本、AI键盘鼠标、AI翻译笔等,且都有录音功能,遇到不方便用手机或者你坐的位置比较靠后的时候,在会场前的角落里放个录音笔,你就可以在讯飞听见里看到实时内容了。
不过相比飞书妙记,讯飞听见的免费账户权益不太多,如果你是个高频职场用户,那么非常值得花点儿小钱,买个会员。
第三个产品是通义,这个产品的背后就是阿里的通义千问模型。几个核心的音频转文字功能一个不落,如实时记录、视音频转写、播客链接转写,另外AI总结和概览也一应俱全。
另外相比前两个产品,通义还有一个优势就是他们有微信小程序,以前的名字叫作通义听悟,现在改为“通义效率助手”,里面不但有音频转文字,还结合了长文档阅读、AI视频摘要等职场效率功能。当然,还有App和网页端。
而在费用上,虽然看起来是有权益限制,但实际上只要你注册了,就送30小时的免费转写时长,每天登录,再送10个小时的免费时长,正经人谁每天从早到晚录音玩啊,所以光是送的权益就已经用不完了。写到这里的时候,我又去研究了一下,发现他们应该压根没有做付费功能,这确实太卷了。
如果你的工作环境用英文比较多,我推荐两个音频转文本的产品,一个叫Whisper Memos,一个叫Otter。前者从产品名字上可以看出来,背后的驱动大模型就是OpenAI的开源语音识别模型Whisper,这个产品可以帮你快速用语音记下一个零碎的想法,所以其他产品都是试用期给免费时长,这个产品是只能免费录10条语音笔记。它还有个吸引我的功能是有苹果手表版本,可以快速开启录15分钟语音。
最后一个产品Otter在这个细分领域里用户量更大,一些核心的功能都有,并且在会议录制转摘要和文本方面做得比较好。不过对我来说,因为它无法识别中文所以比较鸡肋。
除了这五款语音转文字产品之外,还有一些安卓手机系统已经自带了这个功能,只不过因为无法满足我多端同步的需求,所以不在这次推荐的列表里。
另外我相信能实现这个功能的产品还有很多,不在这个列表里的,不代表产品不好,只能说明我视野不够。我也在文末把这几个产品的链接放出来了,感兴趣的同学可以去注册使用。
好,今天的快刀广播站就到这里了。如果你觉得今天的内容对你有帮助,欢迎分享到朋友圈或者转发给你的朋友们。明天咱们接着聊AI。
【相关链接】
飞书
https://www.feishu.cn/
讯飞听见
https://www.iflyrec.com/
通义
微信搜索”通义效率助手”小程序或
https://tongyi.aliyun.com/tingwu
Whisper Memos
https://whispermemos.com/
Otter
https://otter.ai/