针对目前会议音频内容分析策略所存在的声学事件检测缺乏普适性、重叠语音段及短语音段没被有效处理、重要语义信息丢失等问题,本项目主要探索会议音频内容分析与理解的新方法,重点研究以下四个方面的问题:1)普适的声学事件检测;2)重叠语音段检测及其主说话人提取;3)短语音段的说话人归类处理;4)重要人物分析。旨在通过上述四个问题的研究,进一步提高说话人分割聚类、语义分析系统的性能,弥补当前会议音频处理策略所存在的缺陷。. 本项目的研究内容是语音及音频信号处理、模式识别与理解等领域的研究热点,理论上具有一定的挑战性,在应用上是研发音频内容分析及检索系统的重要基础。同时,对提高音频处理系统的实用性,加快我国信息产业的发展具有重要作用。预期发表三大索引收录论文3~5篇,申报专利1项。
本项目主要探索了会议音频内容分析与理解的新方法,在音频事件检测、重叠语音检测、说话人聚类、多通道语音说话人日志、说话人角色聚类、关键说话人估计等方面做了较为深入的研究,并提出了一些具有借鉴意义的方法,有效解决了目前会议音频内容分析策略所存在的问题。本项目的研究成果能直接应用于音频内容检索系统、说话人检索系统及多说话人语音识别系统中,具有广泛的应用前景。. 本项目资助完成2篇SCI论文、21篇EI论文和6项国家发明专利,部分资助培养3名博士研究生和2名硕士研究生。通过开展本项目的研究工作,课题组成员特别是项目负责人积累了一定的项目研究经验,为日后开展科研工作奠定了坚实的基础。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于图卷积网络的归纳式微博谣言检测新方法
古戏台传音的秘密
移民背景下内蒙古晋语大包片传统民居形制特征与分异研究——以呼和浩特地区为例
中医脏腑句与对应西医器官句的事件相关电位比较研究
中医学习时间对医学命题认知影响的事件相关电位研究
复杂声学环境下声学事件检测与音频场景识别方法研究
基于深度学习的复杂音频说话人分析关键技术研究
说话人电子变调伪装识别取证及音频变调取证
音频事件检测技术研究