您的位置:首页 > 其它

DIY: 实现自己的中文语音应用

2008-11-06 09:25 162 查看
VXML是 w3 组织提出的用以搭建语音应用的描述性语音。使用 VXML可以很方便得搭建集成语音识别和语音合成技术的语音应用。本文给出了一个简单的例子介绍 VXML的两个基本的使用方法——语音识别和语音合成,并且简单介绍了
VXML与 JAVA 层信息交互的方法。相信通过本文的介绍,大家就可以搭建出很酷的语音控制系统。
语音技术

微软公司董事长比尔盖茨曾不止一次的提出,语音技术将越来越多得改变我们的生活。新一代的搜索引擎也将使用语音最为最终的输入手段;电脑键盘的作用将逐步减少,今后人们使用电脑时将不再是通过键盘输入文字,而是用语音来输入文字。

不可否认的是,如今的语音技术还未达到如他所述的成熟程度。但是一些简单的应用,例如语音拨号的功能已经被大家所接受。基于语音技术的自动应答系统在欧美已然流行开来,帮助像银行,移动运营商这样的大型服务性机构搭建无人电话语音服务,以此减少接线员的工作量,给大家的生活带来便利。








回页首
VXML简介

Voice eXtensible Markup Language(简称
VXML)是被用来创建语音对话系统,可以调用语音合成以及语音识别服务,可以用来记录语音录入和连接电话系统。创建 VXML语音的主要目的就是用 Web
开发的理念来开发交互式的语音应用。VXML提供了基于 Menu 和基于 Form
的两套框架,整合了语音识别和语音合成两个关键服务,使得语音应用的开发变得更为方便和快捷。








回页首
VXML的运行环境

VXML和普通的标记语言一样,需要有浏览器进行解析;还需要提供语音识别和语音合成服务的应用服务器;有时也需要有 http
服务器提供文档服务;当然,如果需要与电话系统相连,就必须加上 VOIP (网络电话)的支持。如下图所示的就是 VXML的运行环境:

图 1. VXML运行环境



一个企业级应用的系统框架

IVR(interactive voice-response services)
也就是自动应答服务,是使用
VXML
的典型企业级应用。
IVR
和使用者通过电话,按键
(DTMF)
互动,如语音订票,语音查询,语音投票等。普通的
IVR
都是支持
VXML
的解析和提供了
sip
协议的支持,通过和
ASR (
语音识别
)
应用服务器以及
TTS(
语音合成
)
应用服务器的集成,可以实现几乎所有的
VXML
封装的操作。

企业级的
VXML
应用需要如下的体系结构,以使用
IBM Voice Server (WVS)
为例:

图 2. 一个 VXML具体应用的例子

本文转自IBM Developerworks中国

请点击此处查看全文
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐