EMG在语音信号识别中的应用
发布时间:2007/4/23 0:00:00 访问次数:1139
本文使用表面肌电信号(EMG)的语音信号识别系统改善噪声条件下的声音性能或帮助发音障碍的人。有些人发音有障碍,但讲话时面部肌肉与正常人有同样的动作模式,这样使用表面肌电信号能帮助这些发音障碍的人发出简单的指令,用来交流。
1 原理和方法
本研究只使用肌电信号的信息识别孤立的单词、(0~9)十个数字。使用脑电图仪EEG-1100K(electroen-cephalograph,EEG)采集肌电信号,采用双极导联模式,采样频率1000Hz。使用(0~9)十个单词做试验。在实验中,受试者每10s重复词汇表中的单词,每个单词重复10次。受试者以相似的方式重复讲每个单词,保持音量和快速最小变化。
表面肌电信号从五组面部肌肉中采样,五路信号如图1所示。提肌口(LAI)、颧肌部分(ZYG)、颈阔肌(PLT)、压板口(DAO)、二腹的前面腹部(ABD)。使用五对表面电极采集肌电信号,每个电极用电极膏改进电极—皮肤界面,降低电阻。参考电极放在鼻根部。图2是部分数据(0~3)的五路肌电信号(通道LAI、ZYG、PLT、DAO、ABD)时序图。
肌电信号分析,首先对采集的信号进行预处理,端点检测。再使用短时傅里叶变换(STFT)处理数据,提取特征量。通过主成分分析(PCA)减少这些特征集系数的维度。5个肌电通道每个都保留6个PCA系数,这样一共有30个特征量。使用线性判别分析分类器分类(0~9)十个数字。表面肌电信号中语音识别系统的构成如图3所示。
2 特征量提取
肌电信号本质上是具有非平稳定特性的生理电信号,时频分析是研究非平衡信号的一种有效方法。该方法在时频面上表述信号的时变特征,能够更清晰地反映出信号的频率特性随时间的变化。本研究使用短时傅里叶变换方法对讲不同词的肌电信号进行分析,由于变换后特征向量的维度很高,为了成功的分类需要采用合适的降维方法,本文通过主成分分析PCA(Principal Component Analysis)减少这些征集系数的维度。
2.1 短时傅里叶变换
短时傅里叶变换基本原理:把信号划分成许多小的时间间隔,分析每一个时间间隔,确每个间隔存在的频率,频谱的总体表示频谱在时间上的变化。
信号s(t)短时傅里叶变换定义为:
2.2 主成分分析(PCA)
主成分分析(PCA)是总结多变量分析属性的方法,经常用于特片提取或数字压缩上的线性变换。在统计模式识别方面,主成分分析提供降低维度的有效方式,有效地减少特片系数表示的数量。PCA是把特征映射到特征向量上,保留那些最大的特征值。
p维随机向量x的n次采样值构成样本阵X(n×p),n个p维列向量zi构成矩阵Z,如式(1)。
Z=XT=(z1 z2 …zp) (1)
式中T=(t1 t2 … tp)为正交阵,其列向量ti为样本方差矩阵的特征值λi所对应的单位特征向量,且有λ1≥λ2…≥λp,则z1,z2,…,zp分别为样本阵X的第1主成分,第2主部分,…,第p主成分,而且主成分z1表达了x最主要的信息,Z2表达了x次主要的信息,依次类推,前m个主成分一起表达x的主要特征。
3 特征分类
对肌电信号中的语音识别来说,特征提取是基础,有效地进行分类是关键。本文的模式识别分类要用线性判别分类LDA(linear discriminant analysis),分类(0~9)十个数字。
线性判别分析,亦称为Fisher线性判别,是较常用的方法。Fisher准则函数就是为了发现使得样本类间离散度和样本类内离散度的比值最大的投影方向。即在一投影方向上,同一个类的样本聚集在一起,而不同类的样本相对比较分散。
样本类间隔散度矩阵定义为:
EMG在语音信号识别中的应用 [日期:2005-5-16] 来源:电子技术应用 作者:戴立梅 姚晓东 王 蓓 邹俊忠 王行愚 [字体:无线电通信和飞行导航,但飞行舱内是高噪声的环境,声学噪声能掩盖飞行员的所有口头讲话,严重降低了常规的语音识别系统的准确度和性能,在飞行舱内使用面部肌电信号能提高语音识别性能。
本文使用表面肌电信号(EMG)的语音信号识别系统改善噪声条件下的声音性能或帮助发音障碍的人。有些人发音有障碍,但讲话时面部肌肉与正常人有同样的动作模式,这样使用表面肌电信号能帮助这些发音障碍的人发出简单的指令,用来交流。
1 原理和方法
本研究只使用肌电信号的信息识别孤立的单词、(0~9)十个数字。使用脑电图仪EEG-1100K(electroen-cephalograph,EEG)采集肌电信号,采用双极导联模式,采样频率1000Hz。使用(0~9)十个单词做试验。在实验中,受试者每10s重复词汇表中的单词,每个单词重复10次。受试者以相似的方式重复讲每个单词,保持音量和快速最小变化。
表面肌电信号从五组面部肌肉中采样,五路信号如图1所示。提肌口(LAI)、颧肌部分(ZYG)、颈阔肌(PLT)、压板口(DAO)、二腹的前面腹部(ABD)。使用五对表面电极采集肌电信号,每个电极用电极膏改进电极—皮肤界面,降低电阻。参考电极放在鼻根部。图2是部分数据(0~3)的五路肌电信号(通道LAI、ZYG、PLT、DAO、ABD)时序图。
肌电信号分析,首先对采集的信号进行预处理,端点检测。再使用短时傅里叶变换(STFT)处理数据,提取特征量。通过主成分分析(PCA)减少这些特征集系数的维度。5个肌电通道每个都保留6个PCA系数,这样一共有30个特征量。使用线性判别分析分类器分类(0~9)十个数字。表面肌电信号中语音识别系统的构成如图3所示。
2 特征量提取
肌电信号本质上是具有非平稳定特性的生理电信号,时频分析是研究非平衡信号的一种有效方法。该方法在时频面上表述信号的时变特征,能够更清晰地反映出信号的频率特性随时间的变化。本研究使用短时傅里叶变换方法对讲不同词的肌电信号进行分析,由于变换后特征向量的维度很高,为了成功的分类需要采用合适的降维方法,本文通过主成分分析PCA(Principal Component Analysis)减少这些征集系数的维度。
2.1 短时傅里叶变换
短时傅里叶变换基本原理:把信号划分成许多小的时间间隔,分析每一个时间间隔,确每个间隔存在的频率,频谱的总体表示频谱在时间上的变化。
信号s(t)短时傅里叶变换定义为:
2.2 主成分分析(PCA)
主成分分析(PCA)是总结多变量分析属性的方法,经常用于特片提取或数字压缩上的线性变换。在统计模式识别方面,主成分分析提供降低维度的有效方式,有效地减少特片系数表示的数量。PCA是把特征映射到特征向量上,保留那些最大的特征值。
p维随机向量x的n次采样值构成样本阵X(n×p),n个p维列向量zi构成矩阵Z,如式(1)。
Z=XT=(z1 z2 …zp) (1)
式中T=(t1 t2 … tp)为正交阵,其列向量ti为样本方差矩阵的特征值λi所对应的单位特征向量,且有λ1≥λ2…≥λp,则z1,z2,…,zp分别为样本阵X的第1主成分,第2主部分,…,第p主成分,而且主成分z1表达了x最主要的信息,Z2表达了x次主要的信息,依次类推,前m个主成分一起表达x的主要特征。
3 特征分类
对肌电信号中的语音识别来说,特征提取是基础,有效地进行分类是关键。本文的模式识别分类要用线性判别分类LDA(linear discriminant analysis),分类(0~9)十个数字。
线性判别分析,亦称为Fisher线性判别,是较常用的方法。Fisher准则函数就是为了发现使得样本类间离散度和样本类内离散度的比值最大的投影方向。即在一投影方向上,同一个类的样本聚集在一起,而不同类的样本相对比较分散。
样本类间隔散度矩阵定义为: