This project aims at the problem of poor accuracy in machine understanding math word problems (MWP) where is found difficulties in representing problems, mining knowledge correlation patterns and extracting core semantics. So combining with the meta-knowledge theory, our research focuses on machine understanding methods for MWPs. We firstly study natural language processing methods for MWPs which are characterized with stories or situations described in a short text, leading to the difficulty of extraction core semantics. Secondly, we explore a knowledge logical organization model and representation methods to realize formalizing the description of MWPs. Thirdly, deep learning methods are employed to propose innovative methods on knowledge element extraction and correlation mining. These novel methods contribute to solving feature sparseness and the ambiguity of semantic correlation problems. Besides, we investigate knowledge acquisition methods to collect commonsense from MWPs, and break the limitation of context diversity within commonsense knowledge through the computation of semantic space. In order to overcome the recessive logic relationship among knowledge unit, we explore a heterogeneous knowledge fusion algorithm based on ontology inference. Taking elementary mathematical problems about probability and statistics as examples, we finally develop a question understanding prototype system for MWPs. The research achievements can be well applied in machine learning, e-learning, natural language processing and information services. This project therefore has a good theoretical value and application prospect.
针对非数学语言描述问题(MWP)题意理解中问题模型难以表征、知识关联模式难以发现、核心语义难以提炼等导致的理解准确性不高问题,项目结合元知识理论研究MWP的机器理解方法。项目首先针对MWP中短文本、情景性等导致的核心语义难以提炼问题,研究面向数学问题的自然语言处理方法;其次,探索元知识理论支持下的知识元逻辑组织模型及其机器表示方法,破解MWP表征难题;第三,利用深度学习方法探索知识元抽取及关联关系挖掘的新方法,解决知识元关联分布中存在的特征稀疏性和语义关联模糊性问题。此外,项目探究MWP中常识的获取方法,引入语义空间计算以破解常识知识的语义多场景问题;探索基于本体推理的异构知识元融合算法,克服知识单元间逻辑关系的隐藏性。最后,项目以初等数学概率与统计为应用背景,研制面向MWP的题意理解系统。研究成果可用于机器学习、数字化教育、自然语言处理、信息服务等多领域,具有广阔应用前景和理论价值。
课题针对数学应用题的题意机器理解中问题模型难以表征、知识关联模式难以发现、核心语义难以提炼等导致的理解准确性不高问题,结合非数学语言描述问题的短文本、情景复杂、关联性强等特点,探索面向数学应用题的自然语言处理分析方法;构建面向数学问题的元知识表征模型和方法,形成命题与问题框架间的映射机制;挖掘数学知识元间的关联关系,形成题意理解的关系推理链,提高题意理解的准确率。.课题的具体研究成果包括:1)自然语言分析方法;以概率与数理统计为例,建构题意理解的语料库、常识库等,进一步探索了特定领域的分词、指代消解方法。重点研究了基于词典策略和命名识别的数学应用题分词方法,对数学应用题语料的分词准确率可达到93.08%;提出基于CRF的指代消解方法,其数学应用题的指代消解结果的F值可达到84.81%。2)开展数学应用题的命题语义分析和抽取方法,涉及命题表征,命题意图识别以及命题抽取等方法。其中,提出的基于条件随机场的文本命题意图识别方法在概率与数理统计的数据集上F值可达到91.3%;基于增量学习的文本命题意图识别方法F值可达到90.2%。3)重点开展数学应用题的知识关系抽取方法。针对数学应用题中实体关系复杂、隐含关系较多等问题,开展基于BILSTM-CRT模型的实体关系抽取方法研究,在优化特征组合后,该方法对古典概型应用题实体关系抽取F值可到70.87%-94.09%,优于同特征下的CRF模型。4)开展了理解系统设计及研究。探索了常识库和语法特征的应用题题意理解方法;及基于依存句法的数学应用题题意理解方法;研发了面向计算机辅助题意理解的思维可视化工具。上述研究成果围绕数学应用题的题意理解及教育应用展开,可广泛应用于人工智能+教育的各类场景中。.经过4年研究,课题组圆满完成预期研究任务。课题组共发表学术论文21篇,其中,SCI/SSCI/EI等检索论文12篇,CSSCI/CSCD期刊论文5篇;获批专利1项、软件著作权5项;培养博士生1人、硕士研究生7人。
{{i.achievement_title}}
数据更新时间:2023-05-31
智能煤矿建设路线与工程实践
四川盆地东部垫江盐盆三叠系海相钾盐成钾有利区圈定:地球物理和地球化学方法综合应用
基于直观图的三支概念获取及属性特征分析
黄曲霉毒素B1检测与脱毒方法最新研究进展
基于直觉模糊二元语义交互式群决策的技术创新项目选择
基于语言理解的机器翻译方法研究
基于语言理解的机器翻译译文自动评价方法研究
语音机器翻译中的语言分析和理解研究
非结构环境下基于非精确信息描述的机器人自主规划方法研究