软件库规约是描述软件库正确用法的形式化文档,在检测软件缺陷等领域中扮演非常重要的角色。但受制于编写的巨大代价,现有的软件库一般并不提供编写好的软件库规约。因此,软件库规约的挖掘方法成为近二十年来软件工程领域的一个研究热点,并产生了一定影响。但是,现有的方法基于客户代码、软件库代码和文档等单一数据源,并在规约的描述能力、方法准确度和规约的具体应用等方面存在不足,因而尚难以大规模实用。不同于已有的基于单一数据的方法,本项目旨在研究一种基于异构数据的软件库规约挖掘方法。该方法利用数据挖掘技术从客户代码挖掘候选规约,利用软件分析技术根据软件库代码过滤候选规约,并利用自然语言处理技术根据文档内容评估规约的质量。通过利用异构数据源,该方法有望能弥补现有方法的不足,以挖掘到更高质量的规约。通过本项研究,我们期望保持我们的研究优势,并为该领域提供新的研究思路,以推动该领域整体向实用方向发展。
软件库规约是描述软件库正确用法的形式化文档,在检测软件缺陷等领域中扮演非常重要的角色。但受制于编写的巨大代价,现有的软件库一般并不提供编写好的软件库规约。因此,软件库规约的挖掘方法成为近二十年来软件工程领域的一个研究热点,并在研究和产业界都有较为深远的影响。但是,现有的方法基于客户代码、软件库代码和文档等单一数据源,并在规约的描述能力、方法准确度和规约的具体应用等方面存在不足,因而尚难以大规模实用。不同于已有的基于单一数据的方法,本项目旨在研究一种基于异构数据的软件库规约挖掘方法。目前,用于挖掘规约的数据主要为代码和文档。首先,我们对文档的质量进行了深入的分析,结果表明文档中存在大量错误,可能对规约挖掘有负面影响。为了提高文档质量,我们提出了一种文档错误的自动检测方法。结果表明,该方法成果发现了上千之前未被发现的错误,其中一些已经得到开发者的确认。其次,我们分析了代码的质量和缺陷修改,其结果能帮助理解如何修改代码中的缺陷。最后,在上述分析结果支持下,我们提出了一种综合利用代码和文档挖掘软件库规约的方法,并由此获取大量高质量的规约。总之,我们的工作已经圆满的完成了申请书的所有内容。
{{i.achievement_title}}
数据更新时间:2023-05-31
生物炭用量对东北黑土理化性质和溶解有机质特性的影响
基于关系对齐的汉语虚词抽象语义表示与分析
基于脉搏波的中医体质自动辨识系统研究初探
基于数据挖掘治疗过敏性紫癜肾炎用药规律探讨
2007-2020中国探月工程VLBI测量数据集
基于数据挖掘方法的软件安全特性建模与分析
基于数据挖掘的服务器端软件性能分析与诊断方法研究
基于网络化数据挖掘的软件重用方法研究
基于规约语言的领域软件形式化程度度量方法研究