基于维度模型的情感语音建模及生成方法研究

基本信息
批准号:61203258
项目类别:青年科学基金项目
资助金额:25.00
负责人:潘诗锋
学科分类:
依托单位:中国科学院自动化研究所
批准年份:2012
结题年份:2015
起止时间:2013-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:许小颖,李雅,王洋,张冉,车浩,柳雪飞,卢颖超
关键词:
情感语音生成情感维度模型情感语音建模
结项摘要

Speech is one of the most important approaches for human's communication. Not only linguistic information is conveyed in speech, but also speaker's emotional state. Up to date, the research on emotional speech modeling and generation mostly focuses on those typical and discrete emotion categories. From emotional speech modeling aspect, it's still far away from a full-scale emotional speech modeling. From application aspect, it also can not satisfy the need of generating human-like and flexible emotional speech for natural human-computer interaction purpose. Therefore, a research on dimensional model based emotional speech modeling and generation is selected as the topic of this research project. Building a full-scale emotional speech model and generating speech with a highly controllable emotional state is the target to achieve. In this research, the dimensional model of emotion is adopted to represent emotional state. On the basis of study on the labeling scheme of affective dimensions, and a comprehensive analysis on those emotion sensitive speech feature parameters and context features, a full dimensional space based emotional speech model is further established. An emotional speech generation method based on this model is also proposed. Finally, a prototype system for emotional speech generation based on the proposed model is built. A reasonable evaluation method for the generated emotional speech is also proposed. The work will greatly advance the development of research on harmonious human-computer interaction, speech understanding, and language cognition. It also possesses a wide application perspective.

语音是人类交流的最重要工具之一。人类的话语不仅起着表字达意的作用,而且还包含了说话人的情感状态等信息。目前情感语音建模和生成的研究基本集中在一些典型、离散的情感类别下进行,从情感语音建模层面而言没有达到完整的情感语音建模水平,从应用上而言也远不能满足自然人机交互中输出具有类人的、灵活多变的情感语音的需求。为此,本项目以基于维度模型的情感语音建模和生成为研究目标,尝试建立更为完整的情感语音模型,并能生成情感状态细微可控的语音。本项目采用维度模型进行情感状态的表征,在标注方法研究、以及对具有情感区分性的语音特征参数和上下文特征全面分析的基础上,建立完整情感维度空间上的情感语音模型,同时提出结合该模型的情感语音生成方法,最终建立一个基于维度模型的情感语音生成原型系统,及一个合理的情感语音评价方法。此项研究对推进和谐人机交互研究、语音理解和语言认知的发展将起到重要作用,同时还将有着广阔的应用前景。

项目摘要

语音是人类交流的最重要工具之一。人类的话语不仅起着表字达意的作用,而且还包含了说话人的情感状态等信息。目前情感语音建模和生成的研究基本集中在一些典型、离散的情感类别下进行,从情感语音建模层面而言没有达到完整的情感语音建模水平,从应用上而言也远不能满足自然人机交互中输出具有类人的、灵活多变的情感语音的需求。为此,本项目以基于维度模型的情感语音建模和生成为研究目标,尝试建立更为完整的情感语音模型,并能生成情感状态细微可控的语音。本项目采用维度模型进行情感状态的表征,在标注方法研究、以及对具有情感区分性的语音特征参数和上下文特征全面分析的基础上,建立完整情感维度空间上的情感语音模型,同时提出结合该模型的情感语音生成方法,最终建立一个基于维度模型的情感语音生成原型系统,及一个合理的情感语音评价方法。此项研究对推进和谐人机交互研究、语音理解和语言认知的发展将起到重要作用,同时还将有着广阔的应用前景。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

一种基于多层设计空间缩减策略的近似高维优化方法

一种基于多层设计空间缩减策略的近似高维优化方法

DOI:10.1051/jnwpu/20213920292
发表时间:2021
2

二维FM系统的同时故障检测与控制

二维FM系统的同时故障检测与控制

DOI:10.16383/j.aas.c180673
发表时间:2021
3

扶贫资源输入对贫困地区分配公平的影响

扶贫资源输入对贫困地区分配公平的影响

DOI:
发表时间:2020
4

水中溴代消毒副产物的生成综述

水中溴代消毒副产物的生成综述

DOI:10.7524/j.issn.0254-6108.2021021801
发表时间:2022
5

LTNE条件下界面对流传热系数对部分填充多孔介质通道传热特性的影响

LTNE条件下界面对流传热系数对部分填充多孔介质通道传热特性的影响

DOI:10.11949/0438-1157.20201662
发表时间:2021

潘诗锋的其他基金

相似国自然基金

1

非特定人自然语音情感识别的建模方法研究

批准号:61171116
批准年份:2011
负责人:徐明星
学科分类:F0117
资助金额:60.00
项目类别:面上项目
2

情感语音音色分析及补偿方法研究

批准号:61771472
批准年份:2017
负责人:刘斌
学科分类:F0117
资助金额:62.00
项目类别:面上项目
3

语音信号中情感特征的分析与建模

批准号:60472058
批准年份:2004
负责人:赵力
学科分类:F0111
资助金额:20.00
项目类别:面上项目
4

面向语音环境基于情感计算的动态推荐系统模型研究

批准号:61772188
批准年份:2017
负责人:赵欢
学科分类:F0211
资助金额:63.00
项目类别:面上项目