055|得到电子书能用你的AI声音朗读吗?为什么现在做不到

伙伴们,快刀广播站又开始广播了。

首先插播一条活动消息,3月11日到3月18日,我在得到站内发起了AI学习周。今天是学习周第二天,主题是“来听课,上手用”。咱们AI学习圈,目前已经上线了10门教程课,比如用AI做PPT、读长文、画绘本、写代码、设计海报、做视频短片等等,保证你学完就能用上。还没加入AI学习圈的同学,现在加入还有限时优惠价,千万别错过。

好,开始今天正式的广播内容。

上周我给大家介绍了几款文字转语音的应用,顺便去体验了一下Speechify和豆包APP 两款产品的“个性化音色定制”功能。“个性化音色定制”听起来拗口,其实就是你按照系统的提示读一段话,可能就十几秒钟,然后系统就可以生成你的音色,然后用这个声音给你读书、读文档、念网页。

我在体验的时候,一个被我尘封很久的念头又出现了,那就是用户能不能用自己的音色来读电子书。例如家长新建了自己的音色,出差或者不在家的时候,给孩子读上两本小说。这个需求在我的需求库里已经躺了很久,所以我决定在这两款产品上做一下评估。

先说结论吧,结论就是技术上勉强可行,但商业上完全不可行。如果说得再简洁一点儿,那就一个字:“穷”。

我知道很多同学并非产品或研发出身,所以我简单拆一下自己思考和评估的路径,希望对你有帮助。

第一步,先看主要路径。对于这种功能,一般在最初的时候就会遇到一个决策点,是买成熟服务还是自研。

自研的话,一般都会采用开源方案,说实话,对产研团队来说,自研更可控,成就感也更足,所以很多公司都会出现自研的系统,得到也不例外,过去几年也做了一些没太大必要的自研组件。

但是在一个功能的早期,能直接购买服务的,一定要直接购买服务,因为这样会节省大量的人力、物力和时间。很多产研团队在评估自研和采购时,经常出现的一个问题是,不把产研团队的工资成本算进去。所以有时看到一个采购方案20万,自研方案5万,决策的时候就很容易选自研。但是如果算上产研团队自研开发俩月的时间,可能自研方案的成本就飙升到80万了。

所以,如果是公司核心功能,肯定需要自研,但是非核心命脉功能,我建议还是尽量先买成熟服务,这样能快速上线试错。如果觉得不满意,最多就是下次不续约了。

第二步,挑选成熟的服务商。

这个没啥诀窍,就是我试用了豆包、Speechify和elevenlab这三家的用户端功能,对中文音色定制的呈现效果最好的就是豆包。豆包是字节的产品,底层服务是火山引擎提供的,我们跟火山合作非常多,得到内部的大数据平台、数据分析平台都是建立在火山引擎上的。

第三步,预估成本。

这里我简单说一下,如果现阶段我做了一个产品,要上线自定义音色功能的话,那么费用可能会分成这么几个部分。

第一是音色定制费用,会按照数量分几个档次,例如你新建50个以内的音色,单个的定制费用就是138元,如果你定制的数量在5000个以上,那么单个音色的定制费用就是28元。这里我预估一下,假设得到有五万用户定制了自己的音色来读电子书,那么这个模块的费用就是28乘以5万,等于140万。

第二是模型存储费,例如基于你的音色新建了一个定制语音模型,要保证随时可以调出来,就需要存储,这又是一个随着时间不断增加的费用。

第三是“预付费”或者“后付费”的资源包,意思是你可以先付款,购买用定制音色读书的额度,比如10万字符。或者你可以先读,读完再结账。那么,读1万字符的费用大约是8块。这是个什么概念呢?1万字符,约等于我们听半个小时的电子书。

第四个是并发费用,啥叫并发呢?就是一个用户调用自己的音色,就是一路并发,默认服务是两路并发。多增加一路并发是300块钱。并且如果真的在得到电子书使用, 5000人同时播的话,那就不仅仅是钱的问题了,还包括系统负载能不能承受。

算一下总账,这都不算开发成本、推广成本,光是这个功能背后的硬成本开支,有五万用户定制了自己的音色,每天哪怕只听5000字的内容,一年下来的成本是8200万。当然,这是官网价格,如果我去聊的话,肯定能谈一个折扣,但是问题就是哪怕打到骨折,这个成本也不是我们这种创业公司可以承受的。

今天跟大家拆解这一个小功能背后的成本,是因为不少同学问我说AI浪潮来了之后,是不是创业门槛比以前降低了。我想说的是,门槛肯定大幅度降低了,但是并不代表没有门槛,这个门槛就是你面对一个机会的思考能力。

在上周的一个线下活动上,有位同学问我,“现在想用AI做To B的产品,应不应该辞职出来创业?”我当时追问了他几个问题:“ToB到底是面对哪个行业?哪个行业里的哪个人群?谁付款,谁做决策,谁使用?你解决的是什么问题?AI在里面起到的作用什么?凭什么你能做出来而不是其他人?”

几个问题问下来,他呆住了,说这些问题从来没想过,但这就是很真实的问题,很多时候我们容易被一些分析报告、数据报告或者大佬的分享带着走。从一个平台的角度来看,ToB是一个赛道或者领域,但如果我们自己干的话,要考虑的就是谁来付钱。这个产品想往后走,想扩大规模,从第一天起就应该考虑商业化,不存在2015年、2016年那个O2O的狂飙时代了。

产品领域的大神俞军曾经说过:“从用户价值角度,要想创造最多的用户价值,就要保证提供该产品的企业经营可持续,这就一定要让企业能赚到钱,企业不赚钱倒闭了或不做这个产品了,用户就不能再获得用户价值了。”

其实今天这篇分享,也是我做这个广播站和AI学习圈想干的事情。有不少同学问我日更压力大不大,说实话,肯定有压力,但在我可以承受的范围内。因为研究AI和产品原本就是我每天工作的一部分,只不过以前我评估完这个功能,就写一个备忘扔到笔记软件里了,现在我输出到广播站,也许能给部分同学带去一些启发,那我就达到目的了。

最后说一句,自定义音色这个小功能,我会为你盯住它的新进展,不管是成熟方案还是开源方案,如果哪天得到上线了,那就说明已经出现了一个比较合适的解决方案,到时我再来跟大家分享。

好,今天的快刀广播站就到这里了。如果你觉得今天的内容对你有帮助,欢迎分享到朋友圈或者转发给你的朋友们。明天咱们接着聊AI。

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top