您的位置:首页 > 数据库

【9月限时免费】中国人说英语手机语音数据库(150人)

2013-09-03 11:03 411 查看
数据介绍:

150名发音人在手机环境下录制的英文普通话语料,所有语音数据均做过人工转写。可用于手机语音识别研发。共计26430条录音数据。

具体指标

1)录音环境

安卓手机环境,录音环境安静,不包括明显的其他人说话的声音。

2)录音设备

覆盖了常用的安卓手机,包括三星、华为、中兴、HTC、联想、酷派、小米等厂商的流行机型。

3)录音人

150名来自全国各地不同城市及年龄段的录音人

4)录音语料

录音语料包括3.5万句常见的英文句子,每名录音人录制250句,进行人工转写后,不合格语音被剔除

5)采样格式

16000Hz,16位,单声道,pcm格式(无头的wav)

数据格式

每个录音人对应一个唯一编号(S0001-S2500)。包括三类数据:

1)录音人信息文件(.txt):存放该录音人的性别、年龄、籍贯及所用手机型号

2)录音人脚本文件(.scp):存放该录音人的录音文本(经过人工转写),每句文本包括句子编号、文本内容、文本中的单词音标。

3)pcm格式的语音:在Wav文件夹下存放该录音人的各个句子的pcm格式语音文件,文件以句子编号命名。

例如:S1018E001.pcm是编号为1018的录音人录制的语音,对应文本为文件S1018.scp中编号为S1018E001的句子。

注:pcm文件可以用adobe audition工具打开,设置为16000Hz,16位,单声道。

数据样例









数据大小

未压缩前4.48G大小

点击下载:【9月限时免费】中国人说英语手机语音数据库

(150人)
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息