基于分布式声传感器网络和量子优化学习的说话人分类标记研究

基本信息

批准号：61105017

项目类别：青年科学基金项目

资助金额：23.00

负责人：杨毅

学科分类：

依托单位：清华大学

批准年份：2011

结题年份：2014

起止时间：2012-01-01 - 2014-12-31

项目状态：已结题

项目参与者：张卫强,宋辉,何亮,栗志意,袁桦,包汉波

关键词：

量子优化学习空时域融合特征说话人分类决策说话人分类标记分布式声传感器网络

结项摘要

本项目主要结合语音信号处理和模式识别技术对说话人分类标记系统的特征提取和分类决策进行创新性研究，提高说话人分类标记系统的稳健性，这也是目前国际上语音技术研究发展的重要方向之一。本项目的研究内容包括：（1）基于空间声源位置特征的参数提取方法。（2）基于融合空间特征和听觉感知特征的参数提取方法。（3）基于量子学习的优化分类决策方法。（4）基于行为知识空间的分类决策方法。空时域融合的说话人分类特征突破了传统方法基于人类发音及听觉感知特征的限制，优化量子学习及行为知识空间方法则克服了传统分类算法的非通用性，改善了多个说话人混叠及干扰场景下系统性能和精度。本项目结合以上研究成果，通过对空时域融合特征建立模型并利用优化量子学习和行为知识空间等算法，实现一套基于分布式声传感器网络的多个说话人分类标记系统，在多人会议场景下达到分类误差率低于9%，测试指标达到或超过历年NIST评测国际最优水平。

项目摘要

基于听感知理论和分布式声传感器的说话人分类标记技术是目前国际上语音技术研究发展的重要方向之一，本项目主要进行说话人分类标记中的特征提取及分类决策方面的研究，主要完成的研究内容包括：（1）针对传统方法局限于发音及听觉感知特征的问题，开展基于分布式声传感器网络的空间信息处理和听觉感知理论研究，提出并实现了基于分布式声传感器网络的空间声源位置特征提取及说话人空间定位的方法，已发表相关文章及获得专利授权；（2）采用新的时空域融合分类特征来提高系统在复杂声学环境下的性能和鲁棒性，提出并实现了融合空间特征和听觉感知的特征提取及说话人聚类的方法，已发表相关文章及获得专利授权；（3）针对传统GMM-SVM方法存在非通用性的问题，开展基于量子优化学习的多个说话人分类决策理论研究，提出并实现了基于量子学习的优化分类决策方法，进一步完善了多说话人混叠及噪声干扰环境下的说话人分类决策系统，已申请专利；（4）针对传统方法难以处理混合特征建模时非独立的问题，开展多种说话人分类器理论研究，提出并实现了多分量鉴别式保局投影、多模型局部概率线性判别等多分类器决策方法，进一步提高说话人分类决策系统的精度，已发表相关文章。本项目用64通道美国NI-PXI-4496设备构建了一套用于实验的远距离分布式声传感器网络，进行语音数据采集，排除无效数据后得到基于分布式声传感器网络的语音数据库，数据时长共计1600小时，并按照说话人身份、说话人空间位置、有声段/无声段进行了数据标注工作，在此语音数据库上利用上述研究内容，实现了一套基于分布式声传感器网络的说话人分类标记系统，在多人会议场景下分类误差率达到预期水平。实验结果表明，上述研究成果可以进一步提高多人话音混叠及环境噪声干扰条件下说话人分类标记系统的性能和稳健性。在本项目支持下共计出版专著2部，发表论文15篇，其中EI检索13篇，申请专利7个，授权4个，培养博士后1名，博士生3名。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.14188/j.1671-8844.2019-03-007

发表时间：2019

DOI：10.12198/j.issn.1673 − 159X.3895

发表时间：2021

DOI：10.16383/j.aas.2016.c150880

发表时间：2016

DOI：10.3724/ SP.J.1123.2019.04013

发表时间：2019

DOI：

发表时间：2018

杨毅的其他基金

批准号：41801316

批准年份：2018

资助金额：20.00

项目类别：青年科学基金项目

批准号：30671165

批准年份：2006

资助金额：30.00

项目类别：面上项目

批准号：31270819

批准年份：2012

资助金额：90.00

项目类别：面上项目

批准号：31870240

批准年份：2018

资助金额：60.00

项目类别：面上项目

批准号：81170057

批准年份：2011

资助金额：50.00

项目类别：面上项目

批准号：51468025

批准年份：2014

资助金额：48.00

项目类别：地区科学基金项目

批准号：21407119

批准年份：2014

资助金额：24.00

项目类别：青年科学基金项目

批准号：41771506

批准年份：2017

资助金额：63.00

项目类别：面上项目

批准号：41907287

批准年份：2019

资助金额：25.00

项目类别：青年科学基金项目

批准号：U1867213

批准年份：2018

资助金额：270.00

项目类别：联合基金项目

批准号：61105092

批准年份：2011

资助金额：26.00

项目类别：青年科学基金项目

批准号：81301336

批准年份：2013

资助金额：23.00

项目类别：青年科学基金项目

批准号：41675098

批准年份：2016

资助金额：68.00

项目类别：面上项目

批准号：50306008

批准年份：2003

资助金额：22.00

项目类别：青年科学基金项目

批准号：81000827

批准年份：2010

资助金额：20.00

项目类别：青年科学基金项目

批准号：31671455

批准年份：2016

资助金额：62.00

项目类别：面上项目

批准号：50876046

批准年份：2008

资助金额：33.00

项目类别：面上项目

批准号：30471506

批准年份：2004

资助金额：20.00

项目类别：面上项目

批准号：61602251

批准年份：2016

资助金额：16.00

项目类别：青年科学基金项目

批准号：31201492

批准年份：2012

资助金额：23.00

项目类别：青年科学基金项目

批准号：11901011

批准年份：2019

资助金额：27.00

项目类别：青年科学基金项目

批准号：40805044

批准年份：2008

资助金额：20.00

项目类别：青年科学基金项目

批准号：30470927

批准年份：2004

资助金额：22.00

项目类别：面上项目

批准号：41271473

批准年份：2012

资助金额：75.00

项目类别：面上项目

批准号：81070518

批准年份：2010

资助金额：32.00

项目类别：面上项目

批准号：30971557

批准年份：2009

资助金额：35.00

项目类别：面上项目

批准号：51305271

批准年份：2013

资助金额：25.00

项目类别：青年科学基金项目

批准号：40901256

批准年份：2009

资助金额：20.00

项目类别：青年科学基金项目

批准号：30400477

批准年份：2004

资助金额：8.00

项目类别：青年科学基金项目

批准号：39570279

批准年份：1995

资助金额：7.50

项目类别：面上项目

批准号：41375109

批准年份：2013

资助金额：85.00

项目类别：面上项目

批准号：81671892

批准年份：2016

资助金额：52.00

项目类别：面上项目

批准号：41175092

批准年份：2011

资助金额：63.00

项目类别：面上项目

批准号：31171586

批准年份：2011

资助金额：75.00

项目类别：面上项目

批准号：51675318

批准年份：2016

资助金额：62.00

项目类别：面上项目

批准号：61473042

批准年份：2014

资助金额：85.00

项目类别：面上项目

批准号：81670621

批准年份：2016

资助金额：58.00

项目类别：面上项目

相似国自然基金

基于信息几何的说话人标记算法研究

批准号：61403224

批准年份：2014

负责人：何亮

学科分类：F0605

资助金额：25.00

项目类别：青年科学基金项目

基于迁移学习的跨信道说话人识别研究

批准号：61105026

批准年份：2011

负责人：洪青阳

学科分类：F0605

资助金额：24.00

项目类别：青年科学基金项目

基于人工神经网络的说话人识别研究

批准号：69105001

批准年份：1991

负责人：张军英

学科分类：F0605

资助金额：4.00

项目类别：青年科学基金项目

基于深度神经网络的说话人分离和识别算法的研究

批准号：61866024

批准年份：2018

负责人：张烨

学科分类：F0605

资助金额：39.00

项目类别：地区科学基金项目

基于分布式声传感器网络和量子优化学习的说话人分类标记研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

路基土水分传感器室内标定方法与影响因素分析

跨社交网络用户对齐技术综述

基于SSVEP 直接脑控机器人方向和速度研究

温和条件下柱前标记-高效液相色谱-质谱法测定枸杞多糖中单糖组成

基于多模态信息特征融合的犯罪预测算法研究

杨毅的其他基金

时空异质性视角下的地理加权回归方法研究

谷氨酰转移核糖核酸合成酶（AtGuRS)及其相互作用蛋白质在脱落酸信号传导途径中的功能研究

Myosin 7a马达蛋白质大分子复合物体外重建及功能研究

AtARRE和AtTRE1泛素化修饰调控植物非生物胁迫应答的分子机制分析

MSC旁分泌VEGF/HGF对ALI肺微血管内皮通透性的作用和机制研究

滇南民族传统村寨环境友好伦理观及其营建模式研究

城市污水二级出水有机物组成特征及其与重金属作用规律和机制

河口水环境中纳米颗粒物对抗生素抗性基因多介质行为的影响及其机制研究

四氯化碳厌氧生物降解机制及微生物与矿物协同强化去除研究

关键裂变产物核产额分析方法

地面无人平台的越野地形可行驶性分析方法研究

SDF-1/CXCR4信号通路参与BMP-2诱导MSCs归巢效应的机制研究

基于动态下垫面和Nudging同化技术的高时空分辨率气候场构建研究

纳米/微米含能催化复合材料

线粒体基因单倍型类群对脓毒症下线粒体呼吸功能的影响及机制

CARK磷酸化ABA受体PYL/PYR/RCAR的调控网络

纳米催化剂分散性对燃烧稳定性的影响机理

活体夹竹桃灭螺活性成分的构效关系及其化感作用机理研究

基于入侵检测与防御技术的智能变电站网络安全关键技术研究

巴西橡胶树丛枝病病原分子生物学研究

平面紧子集的核心分解及其应用

提高用集合卡尔曼滤波方法同化雷达资料的效率的研究

Fibrillin在拟南芥植物细胞内的功能以及在甘蓝型油菜中的表达研究

纳米颗粒物对河口水体中药物污染物行为的影响及其机制

新生儿脓毒症免疫调控关键miRNAs的鉴定及其功能研究

耐热基因TT1的功能及表达调控分析

新型空间平板天线可展机构构型与精度综合研究

水源地水体中纳米级颗粒物的赋存及其对EDCs的环境意义

玻璃化冷冻保存对人类未受精卵细胞生殖能力影响的研究

胰岛素样生长因子基因在免疫系统的表达及生理意义

基于地/天基激光雷达资料边界层高度诊断、同化及应用

HGF激活mTOR信号通路促进ARDS肺微血管内皮修复的机制研究

闪电定位网资料同化技术研究

耐热基因BnTR1提高油菜脂肪酸不饱和度的作用机理分析

基于植物感性运动机理的模块化柔性可展机构设计方法研究

基于行驶空间的地面无人平台越野自主导航研究

TIFA/TRAF6/DNA2途径介导应激损伤中肾小管上皮细胞线粒体基因稳定性失衡的作用机制研究

相似国自然基金