面向汉译英口语测试中自动评测方法的研究

基本信息
批准号:61877013
项目类别:面上项目
资助金额:45.00
负责人:李心广
学科分类:
依托单位:广东外语外贸大学
批准年份:2018
结题年份:2022
起止时间:2019-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:温宾利,张晶,杜家利,林江豪,龙艳,李鍵红,李苏梅,管彦琪,龙晓岚
关键词:
英语口语考试自动评分汉英翻译题语音识别语义分析
结项摘要

The automatic scoring technology of English oral examination is a technical means to use computer to automatically score candidates' oral responses. The existing research on the automatic score of spoken English test is a relatively mature technology since the questions in the test are mostly the "controlled type", namely reading aloud; therefore candidates’ responses are highly restricted to standard keys. However, research on the automatic score of the "semi-controlled type" questions, such as translation and story- retelling, are relatively insufficient due to the fact that there is no exclusive standard key to the questions. The evaluation of Chinese-English translation in the oral examination is even more problematic since there is no specific evaluation strategy. . .This project intends to combine intelligent signal processing and natural language processing technologies to study the key techniques of automatic scoring for Chinese-English oral translation. The principal evaluation criteria of Chinese-English translation include the key information of the original language as well as the accuracy and fluency of the target language. Therefore, the key problems that we have to solve include key information identification, synonym recognition, and semantic analysis of the sentence and pronunciation fluency determination. .Through the establishment of the standard answer speech database to oral examinations, this project intends to achieve the following goals: 1) to explore the deep learning method to improve the recognition rate of key information; 2) to draw a semantic tree to help improve the processing technology of synonyms and sentence order; 3) to study English speech and grammar based on part of speech and syntax Analysis; 4) to study the selection of fluency indicators and feature quantification method. The project is expected to be able to eventually determine a set of fractional fusion method based on machine learning.

英语口语考试自动评分是利用计算机对考生口语答卷进行打分。现有关于口语自动评分的研究大多是针对朗读题等限定内容的“控制型”题型,技术相对成熟;而针对翻译题、复述题等未给定标准答案的“半控制型”题型的研究成果相对较少,特别是汉译英题型,更是缺乏具体的评测策略。基于此,本项目拟结合智能信号处理和自然语言处理等技术,研究针对汉英口语翻译题的自动评分关键技术。汉译英题型的评分要点主要包括答案中涉及的关键信息点、汉英表达的准确性和合理性以及句子表达的流畅性。所以要解决的关键问题主要有答题关键信息识别、同义词辨析、句子语法分析和发音流利度判定等。本项目将通过建立口语试卷的标准答案语音库,探讨深度学习方法提高关键信息识别率;建立试题答案关键信息语义树,探讨答题同义词处理及句子词序识别技术;研究基于词性标注和句法特征的英语语音语法分析;研究流利度指标选取及特征量化方法;确定一套基于机器学习的分数融合方法。

项目摘要

本项目重点研究口语考试中“半控制型”题型-翻译题的自动评分问题。特别是口语汉译英题型的评分方法的研究。研究中结合智能信号处理和自然语言处理等技术。分析了人工评分中汉英口语翻译题的评分技术,我们认为汉译英题型的评分要点主要包括答案中涉及的关键信息点、汉英表达的准确性和合理性以及句子表达的流畅性。所以评分中要解决的关键问题主要有答题关键信息识别、同义词辨析、句子语法分析和发音流利度判定等。探讨建立口语试卷的标准答案语音库,探讨深度学习方法提高关键信息识别率;建立试题答案关键信息语义树,探讨答题同义词处理及句子词序识别技术;研究基于词性标注和句法特征的英语语音语法分析;研究流利度指标选取及特征量化方法;研究了一套口语汉译英自动评分方法,并确定一套基于机器学习的分数融合方法。整理了在研究过程中构建的超百GB规模的、已标注语料库。本项目研究期内,研究成果申请发明专利7项。登记软件著作权11项。发表重要国际、国内期刊及会议论文17篇,其中SCI/EI 检索论文15篇。培养博士研究生1名,硕士研究生4名。参加有影响的国内外学术会议11次,累计邀请3位国内外专家举办学术交流报告5次,有效地促进了相关方向的研究和发展。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

DOI:
发表时间:
2

基于改进LinkNet的寒旱区遥感图像河流识别方法

基于改进LinkNet的寒旱区遥感图像河流识别方法

DOI:10.6041/j.issn.1000-1298.2022.07.022
发表时间:2022
3

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

DOI:10.11842/wst.20190724002
发表时间:2020
4

高分五号卫星多角度偏振相机最优化估计反演:角度依赖与后验误差分析

高分五号卫星多角度偏振相机最优化估计反演:角度依赖与后验误差分析

DOI:10.7498/aps.68.20181682
发表时间:2019
5

铁路大跨度简支钢桁梁桥车-桥耦合振动研究

铁路大跨度简支钢桁梁桥车-桥耦合振动研究

DOI:10.3969/j.issn.1000-0844.2017.05.0820
发表时间:2017

李心广的其他基金

相似国自然基金

1

面向军用可信计算环境的构造及评测试验验证研究

批准号:91018008
批准年份:2010
负责人:张焕国
学科分类:F0203
资助金额:50.00
项目类别:重大研究计划
2

面向对象软件测试的自动化研究

批准号:60073027
批准年份:2000
负责人:叶澄清
学科分类:F0203
资助金额:15.00
项目类别:面上项目
3

面向自动驾驶系统的高效物理测试

批准号:61902169
批准年份:2019
负责人:张煜群
学科分类:F0203
资助金额:25.00
项目类别:青年科学基金项目
4

中文自动口语摘要技术研究

批准号:61170197
批准年份:2011
负责人:吴及
学科分类:F0211
资助金额:55.00
项目类别:面上项目