基于机器学习的软件度量分析

基本信息
批准号:60903103
项目类别:青年科学基金项目
资助金额:19.00
负责人:黎铭
学科分类:
依托单位:南京大学
批准年份:2009
结题年份:2012
起止时间:2010-01-01 - 2012-12-31
项目状态: 已结题
项目参与者:骆斌,李宁,刘胥影,李宇峰,肖新攀,钱祺,孙雨音,眭俊明,孔祥南
关键词:
类别不平衡学习代价敏感学习利用无标注数据学习机器学习软件度量
结项摘要

机器学习已成为各领域中进行智能数据分析的重要途径。在软件度量分析中,多种经典机器学习技术已被用于分析现有度量与所关注的目标之间的关系,从建立的模型中可发现与所关注目标密切相关的关键度量。然而,大多数软件度量分析任务中的数据均不满足经典机器学习方法奏效所依赖的假设,从而会导致预测模型不能完全反映真实规律。本课题拟对适合于软件度量分析任务特点的学习建模方法进行研究,提出一种能够主动地从备选样本空间有选择性地采样并获取标记以供学习的学习方法;提出一种能够利用大量难以获得标记的样本提升学习能力的学习方法;提出一种对目标类错误分类代价敏感的学习方法;提出一种能够针对目标类样本比例较小的数据进行有效学习的学习方法;并基于上述理论成果建立反映现有软件度量与程序缺陷之间关系的预测模型。本课题可望在重要国际期刊、会议和国内一级学报上发表高质量论文4-6篇,申请国家发明专利1-2项,培养研究生2-3名。

项目摘要

本项目对基于机器学习的软件度量分析方法进行了研究,完成了原定研究计划并取得了以下主要成果:1)提出了能够主动从备选样本空间中有选择性地挑选样本并获取标记的主动半监督学习方法;2) 提出能够利用大量难以获得标记的样本提升学习能力的半监督集成学习方法等;3)提出能够有效降低预测模型的期望类别错分代价同时降低所需标记样本数量的代价敏感半监督学习方法;4)提出能够在标记训练样本很少时针对目标类样本比例较小的数据进行有效学习的方法;5)建立了反映现有软件度量与软件缺陷之间关系的预测模型,基于此挖掘出影响软件缺陷性的关键度量。在重要国际期刊和会议上以及国内一级学报等发表论文12篇,包括《Automated Software Engineering》等软件工程领域国际著名期刊以及AAAI、ECML等一流国际会议,申请国家发明专利1项,主编国际论文集2部,在境内组织国际研讨会2次。人才培养方面取得良好进展。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
3

近 40 年米兰绿洲农用地变化及其生态承载力研究

近 40 年米兰绿洲农用地变化及其生态承载力研究

DOI:
发表时间:2020
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

敏感性水利工程社会稳定风险演化SD模型

敏感性水利工程社会稳定风险演化SD模型

DOI:10.16265/j.cnki.issn1003-3033.2021.04.003
发表时间:2021

黎铭的其他基金

批准号:61272217
批准年份:2012
资助金额:75.00
项目类别:面上项目

相似国自然基金

1

基于机器学习的控制型软件安全性度量方法

批准号:61373046
批准年份:2013
负责人:刘国荣
学科分类:F0203
资助金额:77.00
项目类别:面上项目
2

基于机器学习的软件调试技术研究

批准号:61272102
批准年份:2012
负责人:赵建军
学科分类:F0203
资助金额:83.00
项目类别:面上项目
3

基于信息理论的机器学习目标与评价度量的研究

批准号:61075051
批准年份:2010
负责人:胡包钢
学科分类:F0603
资助金额:35.00
项目类别:面上项目
4

基于软件网络的软件度量研究

批准号:60873083
批准年份:2008
负责人:李兵
学科分类:F0203
资助金额:30.00
项目类别:面上项目