基于JFA的耳语发音方式下说话人识别研究

基本信息
批准号:61071215
项目类别:面上项目
资助金额:30.00
负责人:赵鹤鸣
学科分类:
依托单位:苏州大学
批准年份:2010
结题年份:2013
起止时间:2011-01-01 - 2013-12-31
项目状态: 已结题
项目参与者:陶智,吕岗,陈雪勤,龚呈卉,张庆芳,颜宗岳,顾晓江
关键词:
说话人识别耳语音波导网格声道模型联合因子分析
结项摘要

耳语音是一种特殊而常见的发音方式,本项目拟研究耳语发音方式下说话人识别的理论和实现方法。这方面的研究不仅对听觉感知的深入探索有理论意义,而且在通信、公共安全、医学等领域有实际应用前景。本项目根据耳语发音特点,提出用联合因子分析模型进行文本无关耳语音说话人识别,模型中包含说话人和信道环境两类因子:前者反映说话人每次发音因说话场合、个人情绪状态等变化引起的语音变异;后者反映耳语音受环境或传输信道的影响。项目研究内容包括联合因子模型建立与超参数集估计、耳语话者个性特征表达。由于耳语音没有反映个人特征的基音频率且频谱平坦,因此提出建立二维波导网格声道模型来有效表达耳语状态下说话人的自身发音特征,并由该模型导出反映说话人特点的语音特征参数。本研究拟建立一个耳语方式下话者识别的实验系统,并进行测试比较。本研究的理论和实现对正常语音下稳健说话人识别研究也有参考意义。

项目摘要

有关耳语音说话人识别的研究是一个全新的课题。耳语音说话人识别与正常语音说话人识别相比的主要难点可归纳为以下几个方面:(1)耳语音特征表达问题。(2)易受噪声及信道环境因素影响问题。(3)易受说话人心理因素、情绪及发音状态影响问题。.本项目研究了耳语音发音方式下说话人识别的理论和实现方法。主要研究了以下几点内容:(1)建立二维波导网格声道模型表达耳语状态下说话人的自身发音特征,并由该模型导出反映说话人特点的语音特征参数;(2)分析耳语音情感特征及其对耳语音说话人识别的影响;(3)分析说话人因说话场合、个人情绪状态等变化引起的语音变异,及耳语音说话人状态因子;(4)分析耳语音受环境或传输信道的影响,即信道环境因子;(5)分析清辅音特征及其在耳语音说话人识别中的作用;(6)建立完整的联合因子分析模型进行文本无关耳语音说话人识别。.本项目建立了一个耳语方式下话者识别的实验系统,并进行测试比较。实验结果显示,采用联合因子分析(JFA)的方法将耳语音的特征分解为说话人空间、信道空间和残差空间三个部分,并形成由说话人超向量和信道超向量等组成超向量,JFA的方法可提高不匹配信道下耳语说话人的识别率;在短时语音测试时用混合补偿法可提升约3%的识别率;正弦模型及人耳听觉模型的全局谱参数可将耳语说话人状态因子分类系统的准确率提高至90%。用正常语音清辅音训练、耳语音清辅音识别可改善说话人识别率。使用波散射模型(Wave Scattering)和时域有限差分算法(Finite Difference Time Domain)建立二维模型,进而导出特征参数,改善系统性能。.这方面的研究不仅对听觉感知的深入探索有理论意义,而且在通信、公共安全、医学等领域有实际应用前景。本研究的理论和实现对正常语音下稳健说话人识别研究也有参考意义。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
2

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
3

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

DOI:10.11821/dlyj201810008
发表时间:2018

赵鹤鸣的其他基金

批准号:60172016
批准年份:2001
资助金额:20.00
项目类别:面上项目
批准号:60572076
批准年份:2005
资助金额:22.00
项目类别:面上项目
批准号:61372146
批准年份:2013
资助金额:84.00
项目类别:面上项目

相似国自然基金

1

融合言语产生系统发音信息和中层鉴别性表征的说话人识别与语种识别

批准号:61401524
批准年份:2014
负责人:李明
学科分类:F0117
资助金额:28.00
项目类别:青年科学基金项目
2

噪声和短语音条件下的说话人识别

批准号:61370034
批准年份:2013
负责人:张卫强
学科分类:F0605
资助金额:82.00
项目类别:面上项目
3

基于迁移学习的跨信道说话人识别研究

批准号:61105026
批准年份:2011
负责人:洪青阳
学科分类:F0605
资助金额:24.00
项目类别:青年科学基金项目
4

基于人工神经网络的说话人识别研究

批准号:69105001
批准年份:1991
负责人:张军英
学科分类:F0605
资助金额:4.00
项目类别:青年科学基金项目