您的位置:首页 > 移动开发 > Unity3D

基于百度AI的文字转语音助手(Unity版)开发进度

2018-10-17 14:50 495 查看

前段时间一直忙别的事儿去了,这个项目压了好久。

挖坑篇请见:( http://www.smartcrane.club/2018/09/11/TTS.html

 

当时做了一个“极简版”的(其实是在百度API的Demo的基础上改了改而已),只有一个按钮,把语音合成和保存的功能都挤到一个函数里实现了。反正是自己用,也没那么讲究了,功能过的去就好了。

但是用着用着,问题就出来了,这玩意儿生成语音,必须得前一个语音读完,后一个语音才能开始弄,有时候做一段长一点的语音,光等他读完就得几分钟,我哪儿有这闲功夫啊;还有就是它语音保存的位置是它默认的资源文件夹中,文件名也是写死的,导致每次生成一个音频,都要翻好久的路径找到它,然后把它拷贝出来或者重命名,否则会被下一段语音覆盖,等等。

 

基于此,我重新设计了一下软件的布局,将“转为语音”功能拆分成两个小功能,试听和保存,前者仅播放语音,查看效果,后者仅保存音频,提高效率;添加了“选择文件夹”和“打开文件夹”两个按钮,用来自定义保存路径,以及便捷的打开文件存放路径。此外,还开放了一些语音合成的参数,如RDN,SPD,VOL,以及发音人等。

 

这是最初的设计图。

好的,回过头来,讲一讲最近的进度。

 

今天手头项目刚完结,一看时间下午也没多长时间了,索性把它拿出来完善完善。

这是我半个下午的成果,先看看实现了哪些功能:

  • “试听”按钮点击之后,会合成并播放语音。有“合成中…”和“播放中…”两个状态,播放完毕之后才能再次点击。
  • “生成音频”按钮点击之后,会合成并保存音频文件,音频文件命名为【Voice-时间戳】,避免了文件重名覆盖的情况。
  • “打开文件夹”按钮点击之后,会打开文件所在的文件夹。
  • 右侧文本区域,本来想做发音人选择的,后来发现其实没必要(一个下拉框就能解决的事情),不如就放软件日志吧,正好可以监测软件运行情况。

还有些功能暂时没做,比如那三个参数的设定(没错它是假的,现在存在的意义只是展示目前系统的参数是多少,修改无效),而且这个我也在考虑,如果没有修改必要的话或许下个版本就直接去掉得了;再比如选择文件夹按钮,目前我觉得优先级没那么高,如果功能真有必要的话,放下个版本里实现好了。

 

这就是我的这个项目的进展。(下次填坑又不知道什么时候了……)

 

这是软件exe的链接,有需要的话拿去玩一玩,提点意见哈。

链接:https://pan.baidu.com/s/189KWsVl2Ccxb28CD3YIxHQ 密码:8txg

阅读更多
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: