基于主动迁移学习的软件缺陷预测模型与方法研究

基本信息
批准号:61502404
项目类别:青年科学基金项目
资助金额:20.00
负责人:马樱
学科分类:
依托单位:厦门理工学院
批准年份:2015
结题年份:2018
起止时间:2016-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:陈玉明,尹华一,唐朝辉,林江毅,郝泽龙,洪鹏林
关键词:
数据挖掘迁移学习软件质量保证软件缺陷预测机器学习
结项摘要

Many prediction models can not predict the most defective modules, because they are difficult to apply in the actual software developments, especially on projects which are across different companies in different application areas. We intend to combat the lack of sample data and class-imbalanced problem which are inherent in software data sets. Based on active learning and kernel method, key data points are identified to build a higher accuracy classification. The proposed method reduces labeling effort by fusing a small amount of local data and unlabeled data information. We also analyze the different data distributions in the cross-project defect prediction, and exploit transfer learning theory to form a learning framework based on similarity measurement, which can transfer knowledge from target data to source data. Eventually an effective treatment of uncertainty is obtained in software development environment to meet the preferences of different areas of the projects and the computational complexity. Our research will be an important complement to existing software defect prediction techniques which is expected to be used in large-scale software development, to improve the decision-making process of software development, to improve software quality, shorten the software development cycle and reduce costs of the software development.

针对已有的软件缺陷预测模型很难应用到实际软件开发项目中,特别是在不同机构不同领域的跨工程应用时,无法预测出大多数有缺陷的软件模块。本项目拟对软件数据集固有的样本数据匮乏以及类不平衡问题,基于主动学习理论与核理论,融合少量本地数据和未标记数据的信息,确定关键数据点,使用尽可能少的标记代价来获得较高的分类性能;基于迁移学习理论,研究跨工程缺陷预测中数据分布的差异性,从现有的数据中迁移知识,建立以相似性度量为向导的学习框架。最终形成一套能有效处理软件开发环境的不确定性、能满足不同领域项目的偏好、计算复杂度适中的软件缺陷预测模型与新方法。本项目的研究成果将是对现有软件缺陷预测技术与方法的重要补充和完善,预期可应用于大规模软件开发中,改善软件开发的决策过程、提高软件质量、缩短软件开发周期、降低成本。

项目摘要

目前的软件缺陷预测识别易出故障模块来提高软件质量和测试效率,是建立在源数据和目标数据必须具有相同的特征且必须遵循相同分布的基本假设之上的。本项目针对已有的软件缺陷预测模型很难应用到实际软件开发项目中,特别是在不同机构不同领域的跨工程应用时,无法预测出大多数有缺陷的软件模块。对软件数据集固有的样本数据匮乏以及类不平衡问题,基于稀疏表示学习理论与核理论,融合少量本地数据和未标记数据的信息,确定关键数据点,提出了平衡稀疏表示分类器(BSRC)与核化稀疏表示分类器(KBSRC),使用尽可能少的标记代价来获得较高的分类性能;基于迁移学习理论,研究跨工程缺陷预测中数据分布的差异性,从现有的数据中迁移知识,建立以相似性度量为向导的基于核典型相关分析迁移学习算法(KCCA+)学习框架。最终形成了一套能有效处理软件开发环境的不确定性、能满足不同领域项目的偏好、计算复杂度适中的软件缺陷预测模型与新方法。本项目执行期间,发表相关论文SCI/EI论文9篇,出版专著1本,申请专利2项(已公布实审)。获得福建省科技进步三等奖1项,厦门市科技进步三等一项(已公示)。研究成果将是对现有软件缺陷预测技术与方法的重要补充和完善,预期可应用于大规模软件开发中,改善软件开发的决策过程、提高软件质量、缩短软件开发周期、降低成本。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

新型树启发式搜索算法的机器人路径规划

新型树启发式搜索算法的机器人路径规划

DOI:10.3778/j.issn.1002-8331.1903-0411
发表时间:2020
2

智能煤矿建设路线与工程实践

智能煤矿建设路线与工程实践

DOI:10.13199/j.cnki.cst.2020.07.010
发表时间:2020
3

长链基因间非编码RNA 00681竞争性结合miR-16促进黑素瘤细胞侵袭和迁移

长链基因间非编码RNA 00681竞争性结合miR-16促进黑素瘤细胞侵袭和迁移

DOI:
发表时间:2021
4

TRPV1/SIRT1介导吴茱萸次碱抗Ang Ⅱ诱导的血管平滑肌细胞衰老

TRPV1/SIRT1介导吴茱萸次碱抗Ang Ⅱ诱导的血管平滑肌细胞衰老

DOI:10.3969/j.issn.1001-1978.2022.02.019
发表时间:2022
5

现代优化理论与应用

现代优化理论与应用

DOI:10.1360/SSM-2020-0035
发表时间:2020

相似国自然基金

1

基于集成和迁移学习的跨项目软件缺陷预测方法研究

批准号:61902228
批准年份:2019
负责人:李志强
学科分类:F0203
资助金额:26.00
项目类别:青年科学基金项目
2

基于代码语义结构特征自动学习的软件缺陷预测研究

批准号:61902114
批准年份:2019
负责人:何鹏
学科分类:F0203
资助金额:23.00
项目类别:青年科学基金项目
3

软件缺陷预测模型及其应用的研究

批准号:61073006
批准年份:2010
负责人:张洪宇
学科分类:F0203
资助金额:31.00
项目类别:面上项目
4

基于主动学习和迁移学习的协同过滤算法研究

批准号:61003140
批准年份:2010
负责人:潘嵘
学科分类:F06
资助金额:21.00
项目类别:青年科学基金项目