基于分布式声传感器网络和量子优化学习的说话人分类标记研究

基本信息
批准号:61105017
项目类别:青年科学基金项目
资助金额:23.00
负责人:杨毅
学科分类:
依托单位:清华大学
批准年份:2011
结题年份:2014
起止时间:2012-01-01 - 2014-12-31
项目状态: 已结题
项目参与者:张卫强,宋辉,何亮,栗志意,袁桦,包汉波
关键词:
量子优化学习空时域融合特征说话人分类决策说话人分类标记分布式声传感器网络
结项摘要

本项目主要结合语音信号处理和模式识别技术对说话人分类标记系统的特征提取和分类决策进行创新性研究,提高说话人分类标记系统的稳健性,这也是目前国际上语音技术研究发展的重要方向之一。本项目的研究内容包括:(1)基于空间声源位置特征的参数提取方法。(2)基于融合空间特征和听觉感知特征的参数提取方法。(3)基于量子学习的优化分类决策方法。(4)基于行为知识空间的分类决策方法。空时域融合的说话人分类特征突破了传统方法基于人类发音及听觉感知特征的限制,优化量子学习及行为知识空间方法则克服了传统分类算法的非通用性,改善了多个说话人混叠及干扰场景下系统性能和精度。本项目结合以上研究成果,通过对空时域融合特征建立模型并利用优化量子学习和行为知识空间等算法,实现一套基于分布式声传感器网络的多个说话人分类标记系统,在多人会议场景下达到分类误差率低于9%,测试指标达到或超过历年NIST评测国际最优水平。

项目摘要

基于听感知理论和分布式声传感器的说话人分类标记技术是目前国际上语音技术研究发展的重要方向之一,本项目主要进行说话人分类标记中的特征提取及分类决策方面的研究,主要完成的研究内容包括:(1)针对传统方法局限于发音及听觉感知特征的问题,开展基于分布式声传感器网络的空间信息处理和听觉感知理论研究,提出并实现了基于分布式声传感器网络的空间声源位置特征提取及说话人空间定位的方法,已发表相关文章及获得专利授权;(2)采用新的时空域融合分类特征来提高系统在复杂声学环境下的性能和鲁棒性,提出并实现了融合空间特征和听觉感知的特征提取及说话人聚类的方法,已发表相关文章及获得专利授权;(3)针对传统GMM-SVM方法存在非通用性的问题,开展基于量子优化学习的多个说话人分类决策理论研究,提出并实现了基于量子学习的优化分类决策方法,进一步完善了多说话人混叠及噪声干扰环境下的说话人分类决策系统,已申请专利;(4)针对传统方法难以处理混合特征建模时非独立的问题,开展多种说话人分类器理论研究,提出并实现了多分量鉴别式保局投影、多模型局部概率线性判别等多分类器决策方法,进一步提高说话人分类决策系统的精度,已发表相关文章。本项目用64通道美国NI-PXI-4496设备构建了一套用于实验的远距离分布式声传感器网络,进行语音数据采集,排除无效数据后得到基于分布式声传感器网络的语音数据库,数据时长共计1600小时,并按照说话人身份、说话人空间位置、有声段/无声段进行了数据标注工作,在此语音数据库上利用上述研究内容,实现了一套基于分布式声传感器网络的说话人分类标记系统,在多人会议场景下分类误差率达到预期水平。实验结果表明,上述研究成果可以进一步提高多人话音混叠及环境噪声干扰条件下说话人分类标记系统的性能和稳健性。在本项目支持下共计出版专著2部,发表论文15篇,其中EI检索13篇,申请专利7个,授权4个,培养博士后1名,博士生3名。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

路基土水分传感器室内标定方法与影响因素分析

路基土水分传感器室内标定方法与影响因素分析

DOI:10.14188/j.1671-8844.2019-03-007
发表时间:2019
2

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
3

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
4

温和条件下柱前标记-高效液相色谱-质谱法测定枸杞多糖中单糖组成

温和条件下柱前标记-高效液相色谱-质谱法测定枸杞多糖中单糖组成

DOI:10.3724/ SP.J.1123.2019.04013
发表时间:2019
5

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018

杨毅的其他基金

批准号:41801316
批准年份:2018
资助金额:20.00
项目类别:青年科学基金项目
批准号:30671165
批准年份:2006
资助金额:30.00
项目类别:面上项目
批准号:31270819
批准年份:2012
资助金额:90.00
项目类别:面上项目
批准号:31870240
批准年份:2018
资助金额:60.00
项目类别:面上项目
批准号:81170057
批准年份:2011
资助金额:50.00
项目类别:面上项目
批准号:51468025
批准年份:2014
资助金额:48.00
项目类别:地区科学基金项目
批准号:21407119
批准年份:2014
资助金额:24.00
项目类别:青年科学基金项目
批准号:41771506
批准年份:2017
资助金额:63.00
项目类别:面上项目
批准号:41907287
批准年份:2019
资助金额:25.00
项目类别:青年科学基金项目
批准号:U1867213
批准年份:2018
资助金额:270.00
项目类别:联合基金项目
批准号:61105092
批准年份:2011
资助金额:26.00
项目类别:青年科学基金项目
批准号:81301336
批准年份:2013
资助金额:23.00
项目类别:青年科学基金项目
批准号:41675098
批准年份:2016
资助金额:68.00
项目类别:面上项目
批准号:50306008
批准年份:2003
资助金额:22.00
项目类别:青年科学基金项目
批准号:81000827
批准年份:2010
资助金额:20.00
项目类别:青年科学基金项目
批准号:31671455
批准年份:2016
资助金额:62.00
项目类别:面上项目
批准号:50876046
批准年份:2008
资助金额:33.00
项目类别:面上项目
批准号:30471506
批准年份:2004
资助金额:20.00
项目类别:面上项目
批准号:61602251
批准年份:2016
资助金额:16.00
项目类别:青年科学基金项目
批准号:31201492
批准年份:2012
资助金额:23.00
项目类别:青年科学基金项目
批准号:11901011
批准年份:2019
资助金额:27.00
项目类别:青年科学基金项目
批准号:40805044
批准年份:2008
资助金额:20.00
项目类别:青年科学基金项目
批准号:30470927
批准年份:2004
资助金额:22.00
项目类别:面上项目
批准号:41271473
批准年份:2012
资助金额:75.00
项目类别:面上项目
批准号:81070518
批准年份:2010
资助金额:32.00
项目类别:面上项目
批准号:30971557
批准年份:2009
资助金额:35.00
项目类别:面上项目
批准号:51305271
批准年份:2013
资助金额:25.00
项目类别:青年科学基金项目
批准号:40901256
批准年份:2009
资助金额:20.00
项目类别:青年科学基金项目
批准号:30400477
批准年份:2004
资助金额:8.00
项目类别:青年科学基金项目
批准号:39570279
批准年份:1995
资助金额:7.50
项目类别:面上项目
批准号:41375109
批准年份:2013
资助金额:85.00
项目类别:面上项目
批准号:81671892
批准年份:2016
资助金额:52.00
项目类别:面上项目
批准号:41175092
批准年份:2011
资助金额:63.00
项目类别:面上项目
批准号:31171586
批准年份:2011
资助金额:75.00
项目类别:面上项目
批准号:51675318
批准年份:2016
资助金额:62.00
项目类别:面上项目
批准号:61473042
批准年份:2014
资助金额:85.00
项目类别:面上项目
批准号:81670621
批准年份:2016
资助金额:58.00
项目类别:面上项目

相似国自然基金

1

基于信息几何的说话人标记算法研究

批准号:61403224
批准年份:2014
负责人:何亮
学科分类:F0605
资助金额:25.00
项目类别:青年科学基金项目
2

基于迁移学习的跨信道说话人识别研究

批准号:61105026
批准年份:2011
负责人:洪青阳
学科分类:F0605
资助金额:24.00
项目类别:青年科学基金项目
3

基于人工神经网络的说话人识别研究

批准号:69105001
批准年份:1991
负责人:张军英
学科分类:F0605
资助金额:4.00
项目类别:青年科学基金项目
4

基于深度神经网络的说话人分离和识别算法的研究

批准号:61866024
批准年份:2018
负责人:张烨
学科分类:F0605
资助金额:39.00
项目类别:地区科学基金项目