机器学习已成为各领域中进行智能数据分析的重要途径。在软件度量分析中,多种经典机器学习技术已被用于分析现有度量与所关注的目标之间的关系,从建立的模型中可发现与所关注目标密切相关的关键度量。然而,大多数软件度量分析任务中的数据均不满足经典机器学习方法奏效所依赖的假设,从而会导致预测模型不能完全反映真实规律。本课题拟对适合于软件度量分析任务特点的学习建模方法进行研究,提出一种能够主动地从备选样本空间有选择性地采样并获取标记以供学习的学习方法;提出一种能够利用大量难以获得标记的样本提升学习能力的学习方法;提出一种对目标类错误分类代价敏感的学习方法;提出一种能够针对目标类样本比例较小的数据进行有效学习的学习方法;并基于上述理论成果建立反映现有软件度量与程序缺陷之间关系的预测模型。本课题可望在重要国际期刊、会议和国内一级学报上发表高质量论文4-6篇,申请国家发明专利1-2项,培养研究生2-3名。
本项目对基于机器学习的软件度量分析方法进行了研究,完成了原定研究计划并取得了以下主要成果:1)提出了能够主动从备选样本空间中有选择性地挑选样本并获取标记的主动半监督学习方法;2) 提出能够利用大量难以获得标记的样本提升学习能力的半监督集成学习方法等;3)提出能够有效降低预测模型的期望类别错分代价同时降低所需标记样本数量的代价敏感半监督学习方法;4)提出能够在标记训练样本很少时针对目标类样本比例较小的数据进行有效学习的方法;5)建立了反映现有软件度量与软件缺陷之间关系的预测模型,基于此挖掘出影响软件缺陷性的关键度量。在重要国际期刊和会议上以及国内一级学报等发表论文12篇,包括《Automated Software Engineering》等软件工程领域国际著名期刊以及AAAI、ECML等一流国际会议,申请国家发明专利1项,主编国际论文集2部,在境内组织国际研讨会2次。人才培养方面取得良好进展。
{{i.achievement_title}}
数据更新时间:2023-05-31
多能耦合三相不平衡主动配电网与输电网交互随机模糊潮流方法
基于LS-SVM香梨可溶性糖的近红外光谱快速检测
施用生物刺激剂对空心菜种植增效减排效应研究
新型树启发式搜索算法的机器人路径规划
智能煤矿建设路线与工程实践
基于机器学习的控制型软件安全性度量方法
基于机器学习的软件调试技术研究
基于信息理论的机器学习目标与评价度量的研究
基于软件网络的软件度量研究