语音交互技术——语音信号特征提取
2014-05-20 21:00
337 查看
1.短时能量分析(音强),决定短时能量特性有两个条件:不同的窗口的形状和长度。窗长越长,频率分辨率越高,而时间分辨率越低(N为帧长,M为步长)。
*典型窗函数:矩形窗谱平滑性能好,但损失高频成分,波形细节丢失,海明窗与之相反。一帧内含1~7个基音周期,10kHz下采100~200点。
2.短时平均振幅分析:计算方法简单,但清浊音的区分不如能量明显。
3.短时过零分析:可以区分清音与浊音,浊音时具有较低的平均过零数,而清音时具有较高的平均过零数;可以从背景噪声中找出语音信号,可用于判断寂静无语音和有语音的起点和终点位置。
4.短时相关分析:自相关用于研究信号本身,如信号波形的同步性、周期性等。用来区分清音和浊音,因为浊音信号是准周期性的,对浊音语音可以用自相关函数求出语音波形序列的基音周期;另外在进行语音信号的线性预测分析时,也要用到短时自相关函数。
4.短时平均幅度差:短时平均幅度差计算加、减法和和取绝对值的运算,与自相关函数的相加与相乘的运算相比,其运算量大大减小,尤其在硬件实现语音信号分析时有很大好处。为此,AMDF已被用在许多实时语音处理系统中。
5.短时傅里叶变换:
6.语音信号的倒谱分析:求语音倒谱特征参数,通过同态处理(将非线性问题转化为线性问题)来实现。同态处理(同态滤波):解卷,将卷积关系变为求和处理。 将语音信号的声门激励和声道响应分离开。
7.基音周期的提取:
a)自相关法:峰—峰值之间对应的就是基音周期。为去除声道影响,一般进行中心削波的非线性变换(削除低幅部分)。
b)倒谱法:图a为ln|X(ejw)|的示意图,包括频谱包络的慢变分量,基音谐波峰值的快变分量。再取一次傅里叶反变换,即可将快慢分量分离开。
基音周期后处理:中值平滑、线性平滑、组合平滑。
*典型窗函数:矩形窗谱平滑性能好,但损失高频成分,波形细节丢失,海明窗与之相反。一帧内含1~7个基音周期,10kHz下采100~200点。
2.短时平均振幅分析:计算方法简单,但清浊音的区分不如能量明显。
3.短时过零分析:可以区分清音与浊音,浊音时具有较低的平均过零数,而清音时具有较高的平均过零数;可以从背景噪声中找出语音信号,可用于判断寂静无语音和有语音的起点和终点位置。
4.短时相关分析:自相关用于研究信号本身,如信号波形的同步性、周期性等。用来区分清音和浊音,因为浊音信号是准周期性的,对浊音语音可以用自相关函数求出语音波形序列的基音周期;另外在进行语音信号的线性预测分析时,也要用到短时自相关函数。
4.短时平均幅度差:短时平均幅度差计算加、减法和和取绝对值的运算,与自相关函数的相加与相乘的运算相比,其运算量大大减小,尤其在硬件实现语音信号分析时有很大好处。为此,AMDF已被用在许多实时语音处理系统中。
5.短时傅里叶变换:
6.语音信号的倒谱分析:求语音倒谱特征参数,通过同态处理(将非线性问题转化为线性问题)来实现。同态处理(同态滤波):解卷,将卷积关系变为求和处理。 将语音信号的声门激励和声道响应分离开。
7.基音周期的提取:
a)自相关法:峰—峰值之间对应的就是基音周期。为去除声道影响,一般进行中心削波的非线性变换(削除低幅部分)。
b)倒谱法:图a为ln|X(ejw)|的示意图,包括频谱包络的慢变分量,基音谐波峰值的快变分量。再取一次傅里叶反变换,即可将快慢分量分离开。
基音周期后处理:中值平滑、线性平滑、组合平滑。
相关文章推荐
- 语音信号MFCC的特征提取Matlab源码
- 语音信号MFCC的特征提取Matlab源码
- 一套基于模板匹配的语音识别技术。提取语音的特征,并建立模板库,可以将语音识别技术应用于机器人
- 语音信号特征提取<二>时域特征(待续)
- 语音信号预处理及特征参数提取
- 语音信号MFCC的特征提取Matlab源码
- 语音信号处理—MFCC特征提取(matlab代码)
- 语音信号特征提取<一>预处理
- 语音信号中的特征提取
- 语音性别识别 - 使用R提取特征
- 语音信号的时域、频域特性和短时分析技术
- BP神经网络的数据分类—语音特征信号识别
- 语音特征参数MFCC提取过程详解
- 语音特征参数MFCC提取过程详解
- 生物特征辨识技术结合语音与视觉
- 利用BP神经网络教计算机识别语音特征信号(代码部分SS)
- 语音特征提取方法 (二)MFCC
- OCR技术浅探一:特征提取
- 基于matlab的bp神经网络在语音特征信号识别中的应用
- 时域、频域、时频域振动信号特征提取后得到的特征样本输入到分类器的问题