语音是人机交互最为方便直接的方式。有表现力的文语转换技术(Expressive Text-to-Speech Synthesis, E-TTS),除了能让计算机"说出"人类语言外,试图进一步解决言语表达中的"What do you mean by X?"的问题,能够让计算机"绘声绘色"地与人交流。对于E-TTS来说,需要解决两个基本问题:第一、如何获取说话者表达的信息中的表现力;第二、如何建立表现力语音的模型,实现有表现力的语音合成。本研究旨在将文本信息的表现力与表现力语音相结合,研究文语转换系统中文本、语音以及人们表达的情感、态度、意向、说话风格之间的关系,建立文本的语义概念(Semantic Prior)与表现力的联合模型,实现口语对话系统中的E-TTS系统,根据输入文本合成有表现力的语音,进一步提高合成语音的自然度。其研究方法和结果将会对高表现力语音合成有重要的理论意义和应用价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
一种基于多层设计空间缩减策略的近似高维优化方法
基于综合治理和水文模型的广西县域石漠化小流域区划研究
二维FM系统的同时故障检测与控制
扶贫资源输入对贫困地区分配公平的影响
基于直观图的三支概念获取及属性特征分析
高性能汉语文语转换研究
汉语文本分析中语段成分及其作用的研究
具有表现力的维吾尔语可视语音合成技术研究
基于语义分析的汉语文本错误自动侦测与纠错方法