在言语链中,语言信息传递中最重要的一个环节是人大脑控制下的言语生理机制到言语物理层面的信息转换。这个转换的科学基础涉及神经科学、言语生理学、生理语音学、言语声学、语音学和音位学。研究语言信息从生理层面到声学层面的转换对于认识人类语言信息的产生和传递有重要的理论意义。本项研究从言语生理的角度入手,利用高速数字成像设备、X光设备和核磁共振(MRI)等生理仪器和设备,采集包括汉语普通话语音、动态声门录像、声门阻抗信号、动态二维X光声道录像、二维核磁共振静态声道图像、三维核磁共振声道静态图像、二维核磁共振动态声道录像、二点五维核磁共振动态声道录像和三维核磁共振动态声道录像等一系列生理信号,利用语音和图像处理技术,研究汉语普通话动态声门和声道基本机制,对其生理机制和声学的关系进行深入的分析汉研究,并在此基础上构建基于生理几何模型和声学语音模型的汉语普通话语音生理基础模型。
在项目的支持或部分支持下,共完善和建立了5个普通话生理数据库,分别是:1)X光动态视频模型参数库;2)三维MRI元音声道数据库;3)二维MRI静态声道数据库;4)二维MRI动态声道数据库;5)二维高速数字成像动态声门数据库;并建立了:1)X光声道信号分析系统;2)MRI声道信号分析系统;3)动态声门高速数字成像信号分析系统。.另外,又采集和建立了5个计划外的普通话语音生理样本库和数据库,分别是:1)二维动态唇形数据库;2)三维动态唇形数据库;3)电子腭位数据库;4)基于呼吸带的汉语呼吸数据库;5)基于MRI的汉语呼吸样本库。并建立了:1)唇形分析系统;2)电子腭位分析系统;3)基于呼吸带的呼吸信号分析系统。.本项目共发表了12篇论文,详见成果统计表。有2篇英文论文被国际期刊Journal of Chinese Linguistics(SSCI 和AHCI)接受,论文题目:1)A Dynamic Glottal Model Through High-Speed Imaging;2)An Articulatory Model Of Standard ChineseUsing MRI and X-Ray,预计2014年10月发表。有1篇英文论文“The Application of MRI in Speech Production Study: A Comprehensive Review”已投IEEE Transactions on Information Technology in Biomedicine。另外,本项目还有1本研究专著《汉语普通话声道研究及图谱》正在编辑和撰写。.本项目培养了1名博士后、6名博士生和1名硕士。项目经费严格地按照计划支出。管理费严格控制在5%,学生劳务费控制在15%。国际合作与交流方面得到了学校10万元的资助,主办了北京大学2013年“国际嗓音研讨会:生理、语言和文化”,与会80人,6名国际言语科学家做主题报告。会议的简介已经发表于《北京大学学报》,会议的详细内容将发表于《科学中国人》。.根据本项目的研究,我们提出了基于语音多模态模型的中国有声语言和口传文化数字化方法,为我国口传文化的非物质文化保护和传承开辟了新的信息技术途径,并申请到了一个中国社会科学基金重大招标项目。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
粗颗粒土的静止土压力系数非线性分析与计算方法
硬件木马:关键问题研究进展及新动向
内点最大化与冗余点控制的小型无人机遥感图像配准
中国参与全球价值链的环境效应分析
云南民族口音汉语普通话语音识别研究
汉语普通话语音识别数据库
汉语普通话发声模型研究
汉语连续语音识别的声学语音学模型研究