基于子空间迁移学习的跨语种语音情感识别研究

基本信息
批准号:61572009
项目类别:面上项目
资助金额:56.00
负责人:郑文明
学科分类:
依托单位:东南大学
批准年份:2015
结题年份:2019
起止时间:2016-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:杨元魁,宗源,张桐,严经纬,戴惟嘉,王子彦,刘宇灏
关键词:
子空间学习线性鉴别分析语音情感识别
结项摘要

Cross-lingual speech emotion recognition is a hot and cutting-edge research topic in speech emotion recognition field. In the research of cross-lingual speech emotion recognition, the speech emotion recognition model trained based on the training speech utterances would not be well suitable for recognizing the emotion categories of the testing speech utterances because of the significant differences between the emotional speech features extracted from the training speech utterances and the testing utterances. In this project, we will investigate the cross-lingual speech emotion recognition issue based on our preliminary research work of speech emotion recognition and propose a novel subspace transfer learning approach to deal with the cross-lingual speech emotion recognition problem. The research contents of this project consist of the following four major parts: (1) the method of emotional speech feature extraction and speech feature selection; (2) the method of transductive transfer learning based linear discriminative subspace learning as well as the corresponding optimization approach; (3) the method of transductive transfer learning based kernel discriminative subspace learning method as well as the corresponding optimization approach; (4) the method and algorithm of cross-lingual speech emotion recognition based on subspace transfer learning. This project will focus more on the unified model building of the subspace transfer learning method and its application to the cross-lingual speech emotion recognition. The proposed methods may also be applicable to the emotion recognition problem of other modalities.

跨语种语音情感识别研究是当前语音情感识别研究的热点和前沿课题。在跨语种语音情感识别研究中,由于从训练语音信号和从测试语音信号中提取的情感特征之间存在较大的差异,使得传统的基于训练数据得到的语音情感识别模型难以适用于测试样本数据。本项目旨在申请人原有语音情感识别与子空间学习研究基础上,深入开展跨语种语音情感识别研究,提出基于子空间迁移学习的跨语种语音情感识别理论与算法。所开展的研究主要包括以下内容(1)情感语音信号的特征提取与特征选择方法研究;(2)基于直推式迁移学习的判别子空间分析方法及其优化算法研究;(3)基于直推式迁移学习的核判别子空间分析方法及其优化算法研究;(4)基于子空间迁移学习的跨语种语音情感识别方法与算法研究。本项目侧重于子空间迁移学习方法统一模型构建及其在跨语种语音情感识别方面的运用,所提出的理论和算法思想可用于其他模态的情感识别研究中。

项目摘要

语音是人类情感交流的重要方式,通过对语音情感信号的分析与识别可感知人类的心理状态,在医疗、教育等领域具有重要的应用前景。因此,语音情感识别研究已成为当前情感计算研究的重要内容。在语音情感识别中,如何突破跨语种的情感识别所面临的挑战,即训练样本与测试样本来自不同语种语音情感数据库而造成特征向量空间分布不匹配的问题,已成为当前语音情感识别研究的热点和挑战性难题。本项目针对跨语种语音情感识别问题,开展基于子空间迁移学习的识别研究,主要研究成果包括:(1)提出了基于双稀疏学习的语音情感特征选择和识别方法;(2)提出了迁移子空间模型的统一理论框架和基于迁移子空间学习的特征选择方法;(3)基于语音和面部表情多线融合的情感识别方法。本项目实施过程中,在IEEE Transactions on Affective Computing、Speech Communication等国内外期刊和ACM MM、ICMI等会议上发表论文(含已录用)27篇,申请国家发明专利6项,其中已授权专利2项,获2018年国家技术发明二等奖。并分别获2019年度和2016年度ICMI国际情感识别大赛的冠军和季军。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

一种基于多层设计空间缩减策略的近似高维优化方法

一种基于多层设计空间缩减策略的近似高维优化方法

DOI:10.1051/jnwpu/20213920292
发表时间:2021
2

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

DOI:
发表时间:
3

基于改进LinkNet的寒旱区遥感图像河流识别方法

基于改进LinkNet的寒旱区遥感图像河流识别方法

DOI:10.6041/j.issn.1000-1298.2022.07.022
发表时间:2022
4

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

DOI:10.11842/wst.20190724002
发表时间:2020
5

带有滑动摩擦摆支座的500 kV变压器地震响应

带有滑动摩擦摆支座的500 kV变压器地震响应

DOI:10.13336/j.1003-6520.hve.20200528028
发表时间:2021

郑文明的其他基金

批准号:61073137
批准年份:2010
资助金额:34.00
项目类别:面上项目
批准号:61231002
批准年份:2012
资助金额:265.00
项目类别:重点项目
批准号:60503023
批准年份:2005
资助金额:23.00
项目类别:青年科学基金项目
批准号:60872160
批准年份:2008
资助金额:28.00
项目类别:面上项目

相似国自然基金

1

面向多语种语音数据的自适应情感识别算法研究

批准号:61703360
批准年份:2017
负责人:宋鹏
学科分类:F0605
资助金额:23.00
项目类别:青年科学基金项目
2

基于不平衡学习的语音情感识别研究

批准号:61806078
批准年份:2018
负责人:李冬冬
学科分类:F0606
资助金额:26.00
项目类别:青年科学基金项目
3

基于迁移学习的跨语言情感分类研究

批准号:61806072
批准年份:2018
负责人:李娜娜
学科分类:F0606
资助金额:24.00
项目类别:青年科学基金项目
4

基于深度迁移学习的跨领域文本情感分类方法研究

批准号:61906110
批准年份:2019
负责人:赵传君
学科分类:F0606
资助金额:24.00
项目类别:青年科学基金项目