会议音频中的声学事件检测及说话人分析方法研究

基本信息
批准号:61101160
项目类别:青年科学基金项目
资助金额:25.00
负责人:李艳雄
学科分类:
依托单位:华南理工大学
批准年份:2011
结题年份:2014
起止时间:2012-01-01 - 2014-12-31
项目状态: 已结题
项目参与者:潘伟锵,林沛,李韬,何俊,李威,张雪源,涂悦,黄鹏飞,陈芬
关键词:
短语音段声学事件会议音频重叠语音段重要人物
结项摘要

针对目前会议音频内容分析策略所存在的声学事件检测缺乏普适性、重叠语音段及短语音段没被有效处理、重要语义信息丢失等问题,本项目主要探索会议音频内容分析与理解的新方法,重点研究以下四个方面的问题:1)普适的声学事件检测;2)重叠语音段检测及其主说话人提取;3)短语音段的说话人归类处理;4)重要人物分析。旨在通过上述四个问题的研究,进一步提高说话人分割聚类、语义分析系统的性能,弥补当前会议音频处理策略所存在的缺陷。. 本项目的研究内容是语音及音频信号处理、模式识别与理解等领域的研究热点,理论上具有一定的挑战性,在应用上是研发音频内容分析及检索系统的重要基础。同时,对提高音频处理系统的实用性,加快我国信息产业的发展具有重要作用。预期发表三大索引收录论文3~5篇,申报专利1项。

项目摘要

本项目主要探索了会议音频内容分析与理解的新方法,在音频事件检测、重叠语音检测、说话人聚类、多通道语音说话人日志、说话人角色聚类、关键说话人估计等方面做了较为深入的研究,并提出了一些具有借鉴意义的方法,有效解决了目前会议音频内容分析策略所存在的问题。本项目的研究成果能直接应用于音频内容检索系统、说话人检索系统及多说话人语音识别系统中,具有广泛的应用前景。. 本项目资助完成2篇SCI论文、21篇EI论文和6项国家发明专利,部分资助培养3名博士研究生和2名硕士研究生。通过开展本项目的研究工作,课题组成员特别是项目负责人积累了一定的项目研究经验,为日后开展科研工作奠定了坚实的基础。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于MCPF算法的列车组合定位应用研究

基于MCPF算法的列车组合定位应用研究

DOI:
发表时间:2016
2

多孔夹芯层组合方式对夹层板隔声特性影响研究

多孔夹芯层组合方式对夹层板隔声特性影响研究

DOI:10.3969/j.issn.1006-1355.2021.03.039
发表时间:2021
3

2.0mm和2.5mm直径螺钉固定钛合金 尺骨冠突假体稳定性的有限元分析

2.0mm和2.5mm直径螺钉固定钛合金 尺骨冠突假体稳定性的有限元分析

DOI:103760/cmaj issn0253-23522020,01007
发表时间:2020
4

A Fast Algorithm for Computing Dominance Classes

A Fast Algorithm for Computing Dominance Classes

DOI:
发表时间:2016
5

微震识别方法研究进展

微震识别方法研究进展

DOI:10.6038/pg2019CC0098
发表时间:2019

李艳雄的其他基金

相似国自然基金

1

复杂声学环境下声学事件检测与音频场景识别方法研究

批准号:U1736210
批准年份:2017
负责人:韩纪庆
学科分类:F0111
资助金额:256.00
项目类别:联合基金项目
2

基于深度学习的复杂音频说话人分析关键技术研究

批准号:61771200
批准年份:2017
负责人:李艳雄
学科分类:F0111
资助金额:59.00
项目类别:面上项目
3

说话人电子变调伪装识别取证及音频变调取证

批准号:61100168
批准年份:2011
负责人:王泳
学科分类:F0206
资助金额:23.00
项目类别:青年科学基金项目
4

音频事件检测技术研究

批准号:61571266
批准年份:2015
负责人:吴及
学科分类:F0117
资助金额:57.00
项目类别:面上项目