会议音频中的声学事件检测及说话人分析方法研究

基本信息
批准号:61101160
项目类别:青年科学基金项目
资助金额:25.00
负责人:李艳雄
学科分类:
依托单位:华南理工大学
批准年份:2011
结题年份:2014
起止时间:2012-01-01 - 2014-12-31
项目状态: 已结题
项目参与者:潘伟锵,林沛,李韬,何俊,李威,张雪源,涂悦,黄鹏飞,陈芬
关键词:
短语音段声学事件会议音频重叠语音段重要人物
结项摘要

针对目前会议音频内容分析策略所存在的声学事件检测缺乏普适性、重叠语音段及短语音段没被有效处理、重要语义信息丢失等问题,本项目主要探索会议音频内容分析与理解的新方法,重点研究以下四个方面的问题:1)普适的声学事件检测;2)重叠语音段检测及其主说话人提取;3)短语音段的说话人归类处理;4)重要人物分析。旨在通过上述四个问题的研究,进一步提高说话人分割聚类、语义分析系统的性能,弥补当前会议音频处理策略所存在的缺陷。. 本项目的研究内容是语音及音频信号处理、模式识别与理解等领域的研究热点,理论上具有一定的挑战性,在应用上是研发音频内容分析及检索系统的重要基础。同时,对提高音频处理系统的实用性,加快我国信息产业的发展具有重要作用。预期发表三大索引收录论文3~5篇,申报专利1项。

项目摘要

本项目主要探索了会议音频内容分析与理解的新方法,在音频事件检测、重叠语音检测、说话人聚类、多通道语音说话人日志、说话人角色聚类、关键说话人估计等方面做了较为深入的研究,并提出了一些具有借鉴意义的方法,有效解决了目前会议音频内容分析策略所存在的问题。本项目的研究成果能直接应用于音频内容检索系统、说话人检索系统及多说话人语音识别系统中,具有广泛的应用前景。. 本项目资助完成2篇SCI论文、21篇EI论文和6项国家发明专利,部分资助培养3名博士研究生和2名硕士研究生。通过开展本项目的研究工作,课题组成员特别是项目负责人积累了一定的项目研究经验,为日后开展科研工作奠定了坚实的基础。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于图卷积网络的归纳式微博谣言检测新方法

基于图卷积网络的归纳式微博谣言检测新方法

DOI:10.3785/j.issn.1008-973x.2022.05.013
发表时间:2022
2

古戏台传音的秘密

古戏台传音的秘密

DOI:
发表时间:2021
3

移民背景下内蒙古晋语大包片传统民居形制特征与分异研究——以呼和浩特地区为例

移民背景下内蒙古晋语大包片传统民居形制特征与分异研究——以呼和浩特地区为例

DOI:10.19673/j.cnki.ha.2021.03.003
发表时间:2021
4

中医脏腑句与对应西医器官句的事件相关电位比较研究

中医脏腑句与对应西医器官句的事件相关电位比较研究

DOI:10.3969/j.issn.1673-7202.2022.23.004
发表时间:2022
5

中医学习时间对医学命题认知影响的事件相关电位研究

中医学习时间对医学命题认知影响的事件相关电位研究

DOI:10.3969/j.issn.1673-7202.2022.23.006
发表时间:2022

李艳雄的其他基金

相似国自然基金

1

复杂声学环境下声学事件检测与音频场景识别方法研究

批准号:U1736210
批准年份:2017
负责人:韩纪庆
学科分类:F0111
资助金额:256.00
项目类别:联合基金项目
2

基于深度学习的复杂音频说话人分析关键技术研究

批准号:61771200
批准年份:2017
负责人:李艳雄
学科分类:F0111
资助金额:59.00
项目类别:面上项目
3

说话人电子变调伪装识别取证及音频变调取证

批准号:61100168
批准年份:2011
负责人:王泳
学科分类:F0206
资助金额:23.00
项目类别:青年科学基金项目
4

音频事件检测技术研究

批准号:61571266
批准年份:2015
负责人:吴及
学科分类:F0117
资助金额:57.00
项目类别:面上项目