机器学习已成为各领域中进行智能数据分析的重要途径。在软件度量分析中,多种经典机器学习技术已被用于分析现有度量与所关注的目标之间的关系,从建立的模型中可发现与所关注目标密切相关的关键度量。然而,大多数软件度量分析任务中的数据均不满足经典机器学习方法奏效所依赖的假设,从而会导致预测模型不能完全反映真实规律。本课题拟对适合于软件度量分析任务特点的学习建模方法进行研究,提出一种能够主动地从备选样本空间有选择性地采样并获取标记以供学习的学习方法;提出一种能够利用大量难以获得标记的样本提升学习能力的学习方法;提出一种对目标类错误分类代价敏感的学习方法;提出一种能够针对目标类样本比例较小的数据进行有效学习的学习方法;并基于上述理论成果建立反映现有软件度量与程序缺陷之间关系的预测模型。本课题可望在重要国际期刊、会议和国内一级学报上发表高质量论文4-6篇,申请国家发明专利1-2项,培养研究生2-3名。
本项目对基于机器学习的软件度量分析方法进行了研究,完成了原定研究计划并取得了以下主要成果:1)提出了能够主动从备选样本空间中有选择性地挑选样本并获取标记的主动半监督学习方法;2) 提出能够利用大量难以获得标记的样本提升学习能力的半监督集成学习方法等;3)提出能够有效降低预测模型的期望类别错分代价同时降低所需标记样本数量的代价敏感半监督学习方法;4)提出能够在标记训练样本很少时针对目标类样本比例较小的数据进行有效学习的方法;5)建立了反映现有软件度量与软件缺陷之间关系的预测模型,基于此挖掘出影响软件缺陷性的关键度量。在重要国际期刊和会议上以及国内一级学报等发表论文12篇,包括《Automated Software Engineering》等软件工程领域国际著名期刊以及AAAI、ECML等一流国际会议,申请国家发明专利1项,主编国际论文集2部,在境内组织国际研讨会2次。人才培养方面取得良好进展。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
基于SSVEP 直接脑控机器人方向和速度研究
近 40 年米兰绿洲农用地变化及其生态承载力研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
敏感性水利工程社会稳定风险演化SD模型
基于机器学习的控制型软件安全性度量方法
基于机器学习的软件调试技术研究
基于信息理论的机器学习目标与评价度量的研究
基于软件网络的软件度量研究