汉语普通话语音生理模型研究

基本信息
批准号:61073085
项目类别:面上项目
资助金额:32.00
负责人:孔江平
学科分类:
依托单位:北京大学
批准年份:2010
结题年份:2013
起止时间:2011-01-01 - 2013-12-31
项目状态: 已结题
项目参与者:李永宏,汪高武,潘晓声,李英浩,杨锋,曹洪林,吴君如,董理
关键词:
汉语语音合成语言生理与声学的关系动态声门动态声道语音生理模型
结项摘要

在言语链中,语言信息传递中最重要的一个环节是人大脑控制下的言语生理机制到言语物理层面的信息转换。这个转换的科学基础涉及神经科学、言语生理学、生理语音学、言语声学、语音学和音位学。研究语言信息从生理层面到声学层面的转换对于认识人类语言信息的产生和传递有重要的理论意义。本项研究从言语生理的角度入手,利用高速数字成像设备、X光设备和核磁共振(MRI)等生理仪器和设备,采集包括汉语普通话语音、动态声门录像、声门阻抗信号、动态二维X光声道录像、二维核磁共振静态声道图像、三维核磁共振声道静态图像、二维核磁共振动态声道录像、二点五维核磁共振动态声道录像和三维核磁共振动态声道录像等一系列生理信号,利用语音和图像处理技术,研究汉语普通话动态声门和声道基本机制,对其生理机制和声学的关系进行深入的分析汉研究,并在此基础上构建基于生理几何模型和声学语音模型的汉语普通话语音生理基础模型。

项目摘要

在项目的支持或部分支持下,共完善和建立了5个普通话生理数据库,分别是:1)X光动态视频模型参数库;2)三维MRI元音声道数据库;3)二维MRI静态声道数据库;4)二维MRI动态声道数据库;5)二维高速数字成像动态声门数据库;并建立了:1)X光声道信号分析系统;2)MRI声道信号分析系统;3)动态声门高速数字成像信号分析系统。.另外,又采集和建立了5个计划外的普通话语音生理样本库和数据库,分别是:1)二维动态唇形数据库;2)三维动态唇形数据库;3)电子腭位数据库;4)基于呼吸带的汉语呼吸数据库;5)基于MRI的汉语呼吸样本库。并建立了:1)唇形分析系统;2)电子腭位分析系统;3)基于呼吸带的呼吸信号分析系统。.本项目共发表了12篇论文,详见成果统计表。有2篇英文论文被国际期刊Journal of Chinese Linguistics(SSCI 和AHCI)接受,论文题目:1)A Dynamic Glottal Model Through High-Speed Imaging;2)An Articulatory Model Of Standard ChineseUsing MRI and X-Ray,预计2014年10月发表。有1篇英文论文“The Application of MRI in Speech Production Study: A Comprehensive Review”已投IEEE Transactions on Information Technology in Biomedicine。另外,本项目还有1本研究专著《汉语普通话声道研究及图谱》正在编辑和撰写。.本项目培养了1名博士后、6名博士生和1名硕士。项目经费严格地按照计划支出。管理费严格控制在5%,学生劳务费控制在15%。国际合作与交流方面得到了学校10万元的资助,主办了北京大学2013年“国际嗓音研讨会:生理、语言和文化”,与会80人,6名国际言语科学家做主题报告。会议的简介已经发表于《北京大学学报》,会议的详细内容将发表于《科学中国人》。.根据本项目的研究,我们提出了基于语音多模态模型的中国有声语言和口传文化数字化方法,为我国口传文化的非物质文化保护和传承开辟了新的信息技术途径,并申请到了一个中国社会科学基金重大招标项目。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
2

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
3

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
4

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
5

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019

孔江平的其他基金

批准号:10674013
批准年份:2006
资助金额:26.00
项目类别:面上项目
批准号:10274105
批准年份:2002
资助金额:27.00
项目类别:面上项目
批准号:19674075
批准年份:1996
资助金额:9.00
项目类别:面上项目

相似国自然基金

1

云南民族口音汉语普通话语音识别研究

批准号:60265001
批准年份:2002
负责人:杨鉴
学科分类:F0605
资助金额:22.00
项目类别:地区科学基金项目
2

汉语普通话语音识别数据库

批准号:69072923
批准年份:1990
负责人:王仁华
学科分类:F0211
资助金额:4.00
项目类别:面上项目
3

汉语普通话发声模型研究

批准号:10674013
批准年份:2006
负责人:孔江平
学科分类:A2305
资助金额:26.00
项目类别:面上项目
4

汉语连续语音识别的声学语音学模型研究

批准号:69672010
批准年份:1996
负责人:富煜清
学科分类:F0111
资助金额:8.00
项目类别:面上项目