数据驱动的软件过程挖掘研究

基本信息
批准号:61662085
项目类别:地区科学基金项目
资助金额:40.00
负责人:李彤
学科分类:
依托单位:云南大学
批准年份:2016
结题年份:2020
起止时间:2017-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:王黎霞,代飞,林英,谢仲文,赵娜,莫启,朱锐,何云,马自飞
关键词:
软件过程数据过程验证过程挖掘算法软件过程挖掘过程分析
结项摘要

Software process model plays an important role in ensuring the development of high quality and efficient software products. In traditional process modeling, it has brought a series of problems, such as difficultly obtaining models, the complexity of modeling steps, the accuracy of the modeling results and so on. The project aims to propose a theory to build software process models automatically from massive process data. The theory mainly focus on the solutions to three scientific problems: the single-instance problem due to deficiency of instances, the problem of effectively mining software process of complex behaviors, and the results verification problem among multiple competitive quality-dimension. Firstly, the project will build a unified view to the software process data and propose a cross-platform extensible software process event stream descriptive language to transform the original implementation data into software process event logs. Secondly, event semantics is extracted to discover activity information, and then single firing sequence composed of activity information will be partitioned. Thirdly, a deep hybrid process mining approach for complex structure is proposed. At last, a software process verification approach is proposed to verifying the mining results. The project aims at building a theory foundation for software process mining, and establishing the bridge between process mining and process management, consequently the research has the important scientific significance and application value to improve the software process quality and efficiency.

软件过程模型对于保证开发高质、高效的软件产品具有重要作用。传统过程建模存在模型获取困难、步骤复杂、结果不准确等问题。本项目建立从海量过程数据中自动构建软件过程模型的方法,重点解决软件过程实例少而导致的单实例性问题、复杂行为的软件过程高效挖掘问题、相互竞争的多种质量维度间的结果验证问题。项目首先对软件过程数据建立统一视图,提出跨平台可扩展软件过程事件流的描述语言,将原始实施数据转化为软件过程事件日志;接着抽取事件语义来发现活动信息,进而对由活动信息所形成的单触发序列进行案例划分;然后提出面向复杂结构的深度混成过程挖掘方法;最后建立软件过程验证体系对挖掘结果进行验证。本项目旨在为软件过程挖掘奠定理论基础,建立过程挖掘与过程管理之间的桥梁,对于提高软件过程质量和效率具有重要的科学意义和应用价值。

项目摘要

软件过程模型对于保证高质量的开发软件产品具有重要作用。传统软件过程建模方法存在模型获取困难、步骤复杂、结果不准确等问题。为此,传统人为建模方法已经不能有效满足当前大数据时代软件工程领域对模型获取的需求。本项目旨在建立自动化地从软件开发组织已有的海量过程数据中挖掘过程模型的理论体系,提出了“活动发现-过程挖掘”的双层次软件过程挖掘方法。主要解决了以下关键问题:(1)针对海量、低质、异构等特征的开发数据无法直接适用于软件过程挖掘的问题,提出一种跨平台可扩展软件过程事件流的描述语言CPXSPES,为具有不同数据模式的异构过程数据建立统一视图,便于高效、准确、方便的数据存储和交换。(2)对如何准确地表达日志所蕴含活动的语义信息和行为特征进行研究,提出改进的结构连接向量模型,以及基于朴素贝叶斯的动态增量的事件-活动映射方法来解决开发中的实时性问题。(3)对挖掘开发日志所形成的单触发序列进行研究,证明了单触发序列划分基础的正确性,提出了启发式并行化的划分方法,该方法能够有效解决软件开发过程中常出现的迭代结构,并将单触发序列划分为多个实例以供过程挖掘算法执行。(4)对面向复杂结构的过程挖掘展开研究,详细分析了过程模型中复杂结构的基本特征,提出了支持复杂结构的混成过程挖掘方法,建立了能够用于存储具有复杂结构的过程模型库,以及基于完全前缀展开的过程模型索引与检索方法。(5)对所挖掘模型的正确性进行验证,从拟合度、简洁度、精确度以及泛化度四个相互竞争的质量标准来检查模型的合规性,提出了三维层面帕累托最优原则的模型质量评估方法。项目针对软件过程挖掘中的典型应用场景建立原型系统。大量基于真实数据的实验及案例研究表明,所提方法能够在多个质量维度达到最优。项目的执行为软件过程数据分析、活动抽取、过程挖掘及管理带来一种新思维,为软件开发过程挖掘奠定理论基础,对于提高软件产品质量和效率具有重要的科学意义和应用价值。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
4

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
5

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016

李彤的其他基金

批准号:71671022
批准年份:2016
资助金额:49.30
项目类别:面上项目
批准号:61262024
批准年份:2012
资助金额:43.00
项目类别:地区科学基金项目
批准号:81801409
批准年份:2018
资助金额:21.00
项目类别:青年科学基金项目
批准号:61379032
批准年份:2013
资助金额:73.00
项目类别:面上项目
批准号:31601897
批准年份:2016
资助金额:19.00
项目类别:青年科学基金项目
批准号:70371051
批准年份:2003
资助金额:14.00
项目类别:面上项目
批准号:81772174
批准年份:2017
资助金额:56.00
项目类别:面上项目
批准号:60463002
批准年份:2004
资助金额:23.00
项目类别:地区科学基金项目
批准号:61802363
批准年份:2018
资助金额:24.00
项目类别:青年科学基金项目
批准号:60963007
批准年份:2009
资助金额:22.00
项目类别:地区科学基金项目
批准号:39500144
批准年份:1995
资助金额:8.00
项目类别:青年科学基金项目

相似国自然基金

1

基于网络化数据挖掘的软件重用方法研究

批准号:60803025
批准年份:2008
负责人:刘婧
学科分类:F0203
资助金额:19.00
项目类别:青年科学基金项目
2

基于数据挖掘方法的软件安全特性建模与分析

批准号:61170190
批准年份:2011
负责人:任家东
学科分类:F0607
资助金额:56.00
项目类别:面上项目
3

基于异构数据分析的软件库规约挖掘方法研究

批准号:61100071
批准年份:2011
负责人:钟浩
学科分类:F0203
资助金额:23.00
项目类别:青年科学基金项目
4

数据驱动的海量遥感影像高效信息挖掘

批准号:91338113
批准年份:2013
负责人:夏桂松
学科分类:F0113
资助金额:80.00
项目类别:重大研究计划