基于机器学习的软件度量分析

基本信息
批准号:60903103
项目类别:青年科学基金项目
资助金额:19.00
负责人:黎铭
学科分类:
依托单位:南京大学
批准年份:2009
结题年份:2012
起止时间:2010-01-01 - 2012-12-31
项目状态: 已结题
项目参与者:骆斌,李宁,刘胥影,李宇峰,肖新攀,钱祺,孙雨音,眭俊明,孔祥南
关键词:
类别不平衡学习代价敏感学习利用无标注数据学习机器学习软件度量
结项摘要

机器学习已成为各领域中进行智能数据分析的重要途径。在软件度量分析中,多种经典机器学习技术已被用于分析现有度量与所关注的目标之间的关系,从建立的模型中可发现与所关注目标密切相关的关键度量。然而,大多数软件度量分析任务中的数据均不满足经典机器学习方法奏效所依赖的假设,从而会导致预测模型不能完全反映真实规律。本课题拟对适合于软件度量分析任务特点的学习建模方法进行研究,提出一种能够主动地从备选样本空间有选择性地采样并获取标记以供学习的学习方法;提出一种能够利用大量难以获得标记的样本提升学习能力的学习方法;提出一种对目标类错误分类代价敏感的学习方法;提出一种能够针对目标类样本比例较小的数据进行有效学习的学习方法;并基于上述理论成果建立反映现有软件度量与程序缺陷之间关系的预测模型。本课题可望在重要国际期刊、会议和国内一级学报上发表高质量论文4-6篇,申请国家发明专利1-2项,培养研究生2-3名。

项目摘要

本项目对基于机器学习的软件度量分析方法进行了研究,完成了原定研究计划并取得了以下主要成果:1)提出了能够主动从备选样本空间中有选择性地挑选样本并获取标记的主动半监督学习方法;2) 提出能够利用大量难以获得标记的样本提升学习能力的半监督集成学习方法等;3)提出能够有效降低预测模型的期望类别错分代价同时降低所需标记样本数量的代价敏感半监督学习方法;4)提出能够在标记训练样本很少时针对目标类样本比例较小的数据进行有效学习的方法;5)建立了反映现有软件度量与软件缺陷之间关系的预测模型,基于此挖掘出影响软件缺陷性的关键度量。在重要国际期刊和会议上以及国内一级学报等发表论文12篇,包括《Automated Software Engineering》等软件工程领域国际著名期刊以及AAAI、ECML等一流国际会议,申请国家发明专利1项,主编国际论文集2部,在境内组织国际研讨会2次。人才培养方面取得良好进展。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

多能耦合三相不平衡主动配电网与输电网交互随机模糊潮流方法

多能耦合三相不平衡主动配电网与输电网交互随机模糊潮流方法

DOI:10.13334/j.0258-8013.pcsee.190276
发表时间:2020
2

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

DOI:
发表时间:
3

施用生物刺激剂对空心菜种植增效减排效应研究

施用生物刺激剂对空心菜种植增效减排效应研究

DOI:10.11654/jaes.2022-0087
发表时间:2022
4

新型树启发式搜索算法的机器人路径规划

新型树启发式搜索算法的机器人路径规划

DOI:10.3778/j.issn.1002-8331.1903-0411
发表时间:2020
5

智能煤矿建设路线与工程实践

智能煤矿建设路线与工程实践

DOI:10.13199/j.cnki.cst.2020.07.010
发表时间:2020

黎铭的其他基金

批准号:61272217
批准年份:2012
资助金额:75.00
项目类别:面上项目

相似国自然基金

1

基于机器学习的控制型软件安全性度量方法

批准号:61373046
批准年份:2013
负责人:刘国荣
学科分类:F0203
资助金额:77.00
项目类别:面上项目
2

基于机器学习的软件调试技术研究

批准号:61272102
批准年份:2012
负责人:赵建军
学科分类:F0203
资助金额:83.00
项目类别:面上项目
3

基于信息理论的机器学习目标与评价度量的研究

批准号:61075051
批准年份:2010
负责人:胡包钢
学科分类:F0603
资助金额:35.00
项目类别:面上项目
4

基于软件网络的软件度量研究

批准号:60873083
批准年份:2008
负责人:李兵
学科分类:F0203
资助金额:30.00
项目类别:面上项目