Recommendation of arguments and detection of incorrect arguments are critical for the improvement of development efficiency and software quality. However, there is no efficient, effective and general approaches for such tasks. To this end, we will investigate lexical similarity based approaches for argument recommendation and incorrect argument detection. Names of arguments and parameters convey rich syntactical information. Consequently, syntactically related arguments and parameters are often lexically similar as well. However, we do not know the distribution of the lexical similarity. To this end, we will do the following research. First, we will investigate the distribution to discover its characters, which is the basis for the lexical similarity based argument analysis. Second, we will analyze the characters of low-similarity arguments and parameter, and propose approaches to fill them out from other arguments and parameters. It is critical for the precision of lexical similarity based argument recommendation and detection of incorrect arguments. Third, we will propose a lexical similarity based lightweight accurate approach to recommend arguments. Finally, we will proposed lexical similarity based general approach to detect incorrect arguments.
参数推荐与错误参数检测对于提高软件开发的效率和软件质量都具有重要意义。但目前尚缺乏通用的准确高效的参数推荐方法以及错误参数检测方法。为此本项目拟研究基于文本相似性的一般化的参数推荐方法与错误参数检测方法。参数名称蕴含了丰富的语义信息,因此在语义上紧密相关的实参与形参通常也具有较高的文本相似性。但是人们尚不清楚实参与形参之间的文本相似性的分布特性,因而未能在参数分析中充分利用这种文本相似性。本项目拟研究形参与实参的文本特性,揭示其文本相似性的分布特征,为基于文本相似性的参数推荐与错误参数检测提供理论依据;研究低相似度形参与实参的特征及其过滤方法,明确基于相似性的参数分析所适用的范围,确保基于文本相似性的参数推荐与错误参数检测的高准确率;研究基于文本相似性的参数推荐,提出一种轻量级的快速准确的参数推荐方法;研究基于文本相似性的错误参数检测,提出一种快速准确的错误参数的一般化检测方法。
参数是软件代码中常见的一种软件元素。参数的推荐与错误参数的检测是与参数相关的两个关键任务。本项目深入研究了基于文本相似性的一般化的参数推荐方法与错误参数检测方法。参数名称蕴含了丰富的语义信息,因此在语义上紧密相关的实参与形参在文本上通常具有较高的相似性。本项目通过大规模实证分析揭示其文本相似性的分布特征,证明了实参和形参的文本相似度呈现U形分布的特征,研究分析了形参与实参相似度偏低的关键原因,为基于文本相似性的参数推荐与错误参数检测提供理论依据。在此基础上,本项目研究低相似度形参与实参的特征及其过滤方法,明确基于相似度的参数分析所适用的范围,确保基于文本相似性的参数推荐与错误参数检测的高准确率。在大规模真实软件上的实验结果表明,基于文本相似性的参数推荐方法具有较高的准确率,平均查准率达到80%。最后,研究提出了一种基于文本相似性的参数推荐方法,推荐准确率高达83%。同样基于文本相似度,研究提出了一种基于深度学习的返回值错误检测方法,充分利用了返回值与函数名称之间的文本相似性检测错误的返回语句。在大规模开源软件上的实验表明,该方法查准率为86%,查全率59.7%。在完成项目既定任务之外,课题组还重点研究了标识符中缩写词的自动扩展方法、基于学习的重构机会检测方法、基于深度学习的不一致方法名检测方法和面向代码自动生成的大型数据集等,取得了很好的研究成果。迄今为止,本项目在IEEE Transactions on Software Engineering、IEEE/ACM International Conference on Software Engineering(ICSE),IEEE/ACM International Conference on Automated Software Engineering(ASE)、ACM Joint European Software Engineering Conference and Symposium on the Foundations of Software Engineering (ESEC/FSE) 和 International Symposium on Software Testing and Analysis (ISSTA) 等软件工程领域CCFA类国际会议/期刊发表录用论文10篇,在国内一级学报发表论文3篇。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
拥堵路网交通流均衡分配模型
基于参数与非参数演化计算新方法的文本聚类研究
基于语义分析的汉语文本错误自动侦测与纠错方法
基于参数反演的红外微弱目标检测方法研究
基于多参数信息融合的种子活力检测方法研究