您的位置:首页 > 编程语言 > VB

使用VB.net 创建简单的TTS中英文混合语音朗读

2014-05-11 19:19 597 查看
最初的想法很简单,只是想弄个小程序可以实现单词朗读功能。我了解到TTS(Text-to-Speech)技术可以做到阅读文本文字,用的语音引擎是微软的Speech SAPI5.1SDK,搜索一下,网络上大把文章谈到这个,还会告诉你下载地址,大小在60M以上。我的运行环境是xpSP2不需要再去下载。打开你的“控制面板”,打开“语音”,是不是看到了2个语音引擎?一个叫"Microsoft Simplified Chinese",一个叫"MicrosoftSam",OK,让我们设置"Microsoft Simplified
Chinese"为默认值。

一切就绪,我们先在工程里引用saip.dll,这个文件在我的电脑里路径是C:\Program Files\Common Files\Microsoft Shared\Speech\saip.dll (Written by HarryGlory .)

接下来,当然是引用了


Imports SpeechLib

现在开始重头戏了,我们在Form1_Load事件里面写上:


Dim MyVoice As New SpeechLib.SpVoice


Dim tmpStr As String


tmpStr = "I love Chou!"


MyVoice.Speak(tmpStr, SpeechVoiceSpeakFlags.SVSFlagsAsync)

按下F5运行,马上出来结果了,有声音了,耶!简单吧?

什么?你听到的是一个一个字母读出来?试试把tmpStr改成中文 "我爱周星星!" 看看,是不是读出中文了?

但是你很执着,想读英文单词,那怎么办?

OK,让我们稍微改一下代码,如下:


Dim MyVoice As New SpeechLib.SpVoice


Dim tmpStr As String


tmpStr = "I love Chou!"


MyVoice.Voice = MyVoice.GetVoices([String].Empty, [String].Empty).Item(1)


MyVoice.Speak(tmpStr, SpeechVoiceSpeakFlags.SVSFlagsAsync)

你再按F5运行一下。哇,真的可以耶~!太棒了!

你很聪明,知道了这里Item(0)表示中文朗读,Item(1)表示英文朗读。可是,怎么判断语音引擎呢?顺便设置一下音量啊。呵呵,可以这样做的:


Dim language As String = "MSSimplifiedChineseVoice" '此处判断缺省语音引擎. 英文为 MSSam


MyVoice.Volume = 100 '设置音量,0到100


Dim cnVoice, enVoice As Integer


If Strings.Right(MyVoice.GetVoices.Item(0).Id, language.Length) = language Then '如果Item(0)是中文


cnVoice = 0


enVoice = 1


Else '如果Item(0)是英文


cnVoice = 1


enVoice = 0


End If

似乎有点不对劲哦,如果我不止中文和英文这两个语音引擎怎么办?

呃,好吧,我承认我做的不够完美。你要想知道你都有哪些语音引擎,可以用枚举的办法,通过MyVoice.GetVoices.Count得到语音引擎的数量,再通过MyVoice.GetVoices.Item(i).Id得到每个语音引擎的名称(注意:此处id返回的是注册表里的值,也可以用MyVoice.GetVoices.Item(0).GetDescription得到语音引擎的描述,随便你喜欢哪一种)。只是这已经不在本文讨论范围内了,本文只想说说简单的效果。

你脑筋转得很快,又问:“如果我要中英文混合来读,该怎么办呢?”

这个问题问得好,首先,你必须懂得判断一个字符到底是中文字符,还是英文字符。

这里通过ascii来判断,我们另外写一个函数:


Private Function isChinese(ByVal asciiv As Integer) As Boolean


Try


If Len(Hex$(asciiv)) > 2 Then


isChinese = True


Else


isChinese = False


End If


Catch ex As Exception




End Try




End Function

举个例子,引用这个函数:isChinese(Asc("我")),对了,这个函数我们只用来判断一个字符,千万不要写多,不能把"我爱周星星!"全部写进去哦。

写完了这个函数,记得返回Form1_load事件里面,我们继续。

你努力想了想,问:“那我要读一句中英文混合的话,只要用strings.mid语句把这句话一个字符一个字符地读出来,然后判断是中文还是英文字符,最后交给语音去朗读就可以了,对不对?”

我哈哈大笑,说:“你的作法没错,可以实现朗读功能,而且也是准确地区分了语音引擎,可是,逐个字符读的话,一个完整的单词也会让你读成字母啊!而且每个字符切换一次语音引擎,很消耗系统资源的,这样做有什么意义呢?”

最好的办法是,将中英文区分开来,并且用自定义的关键词把它们连接出来,最后通过split语句将它分成数组,这样就OK了。

比如,一句"你真是lucky. I 服了 you.",我们先用关键词"/HarryGlory/"将它们分成

"你真是"/HarryGlory/lucky. I "/HarryGlory/服了"/HarryGlory/ you."

最终通过split语句用数组存储起来,将其分成

a(0)="你真是"

a(1)="lucky. I "

a(2)="服了"

a(3)="you."

明白了吗?中英文是间隔地出来的,这是关键!这样我们可以很方便地根据数组的序号,设置当其为偶数时,用中文语音朗读,奇数时用英文语音朗读了!

这个功能也可以拓展开来,如果你只要判断、读取中文,那就只取序号为偶数的数组就可以了,哈哈,方便吧?

当然,关键词这一步骤显得多余和麻烦了点,你可以自己去试试直接用数组来分开存储的,呵呵,就当是作业吧。

以下代码通过关键词将中英文分开:


Dim strSource As String= "你真是lucky. I 服了 you."


Dim strDestination As String= Mid(strSource, 1, 1)


Dim i As Integer


Dim strSelect As String= ""


Dim splitKey As String = "/HarryGlory/" '这里可以改变临时分割用的关键词,这个关键词一定不能在文章中出现


'以下for语句功能是把中英文用splitKey分开


For i = 2 To Len(strSource)


strSelect = Mid(strSource, i, 1)


If isChinese(Asc(strSelect)) Then '如果是中文


If isChinese(Asc(Strings.Right(strDestination, 1))) Then '如果前一个字符是中文


strDestination = strDestination & Mid(strSource, i, 1)


Else


strDestination = strDestination & splitKey & Mid(strSource, i, 1)


End If


'strDestination = strDestination + Mid(strSource, i, 1)


Else '如果不是中文


If isChinese(Asc(Strings.Right(strDestination, 1))) Then '前一个字符是中文


strDestination = strDestination & splitKey & Mid(strSource, i, 1)


Else


strDestination = strDestination & Mid(strSource, i, 1)


End If


End If


Next i



以下代码是实现数组存储刚才生成的结果


Dim a(), p As String


a = Split(strDestination, splitKey)

以下代码实现逐句朗读


Dim OK As Boolean = True 'OK为true的时候读中文


If isChinese(Asc(a(0))) Then '如果第一个字符是中文


OK = True


Else '如果第一个字符不是中文


OK = False


End If




'以下语句是逐句朗读


For Each p In a


If OK Then


MyVoice.Voice = MyVoice.GetVoices([String].Empty, [String].Empty).Item(cnVoice)


MyVoice.Speak(p, SpeechVoiceSpeakFlags.SVSFlagsAsync)


OK = False


Else


MyVoice.Voice = MyVoice.GetVoices([String].Empty, [String].Empty).Item(enVoice)


MyVoice.Speak(p, SpeechVoiceSpeakFlags.SVSFlagsAsync)


OK = True


End If


Next

整个过程就完成了,很简单,是吧?赶紧运行一下啦,哈哈。

还可以进一步开发出更多功能,如放一个文本框输入字符串来朗读,或者拖放文本文件来朗读,或者读xml文件,还有将朗读的结果输出为wav声音文件等等,这个就靠你自己发挥想象力啦!

在使用微软的tts的speak方法时,需要输入一个SpeechVoiceSpeakFlags参数,该类型有多个枚举。由于没有中文,自己翻译与共享之。

SVSFDefault

默认为:读取给定的文本,被SVSFlagsAsync(异步)重写。

在播放期间的请求不会被清空,被SVSFPurgeBeforeSpeak重写。

只有当指定的文本以“<”开头才会使用XML方式解析,被SVSFIsXML和SVSFIsNotXML重写。

不保留全局XML状态变化(此处翻译有压力)。。。,被SVSFPersistXML重写。

标点符号不扩展为单词,被SVSFNLPSpeakPunc重写。

(旁白:通过default大概了解了此枚举类型的大概)

SVSFlagsAsync

播报调用为异步,所以播报请求一发送,就马上回应。

SVSFPurgeBeforeSpeak

在播报期间,不接受其他的播报请求。

SVSFIsXML

文本以XML形式解析。

SVSFIsNotXML

文本不以XML形式解析。

SVSFPersistXML

不会翻译

SVSFNLPSpeakPunc

把标点符号也读出来。

其他类型就不翻译了。

~~~

个人实操:

在前台的js用 async: true,保证了网页顺利加载。

在后台的CS用

SpeechVoiceSpeakFlags spFlags = SpeechVoiceSpeakFlags.SVSFDefault;
SpVoice voice = new SpVoice();

voice.Speak(strContent, spFlags);

保证了在网页端点击任何东西都不会停止播报——在播放期间的请求不会被清空。


内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: