In the past 20 years, a huge amount of software life cycle data has been accumulated in software repositories, recording the history of what happened during development and maintenance. It is very challenging to leverage these data to improve software productivity and quality in an efficient and effective way. In this project, we aim to utilize the big data to generate measurable, verifiable, and reproducible software engineering practices. The proposed research topics include: .(1) semantic-consistent models to organize software lifecycle data and big-data oriented methods for user-customized data acquisition;.(2) mechanisms of software lifecycle data quality and low-quality software lifecycle data handling methods;.(3) models and methods to measure micro-processes in different development tasks and different projects;.(4) methods and techniques to utilize the data to better extert quality assurance;.Based on the research results, we'll build a platform for research validation, data sharing and practice recommendation.
人们在软件开发和维护过程中积累了海量的软件生命期数据。如何组织、分析和应.用这些数据,以帮助软件实践者提高开发效率和改进软件质量,是一个极具挑战性.的问题。本项目以海量软件生命期数据为基础,以改进Internet时代的软件开发过.程和软件质量保证方法为目标,研究建立可度量、可验证、可复制(可重现)的软.件最佳实践。项目主要研究内容包括:研究海量多源的软件仓库数据的组织方法;.研究支持软件生命期数据特质的多源数据分析方法;研究面向群体协同的微过程度.量和改进方法;研究基于信息融合的多维度软件质量保证方法;研制相应的平台并.结合实际应用进行系统验证。在此基础上,形成数据驱动的软件工程方法学。
本项目致力于研究如何组织、分析和应用软件生命期数据,以帮助软件实践者提高开发效率和改进软件质量。项目的研究目标是基于海量软件生命期数据,改进软件开发过程和软件质量保证方法,从而建立可度量、可验证、可复制(可重现)的软件最佳实践。研究计划中所针对的研究内容如下:海量多源的软件仓库数据组织和用户定制研究;支持软件生命期数据特质的多源数据分析方法研究;面向群体协同的微过程度量和改进方法研究;基于信息融合的软件质量保证方法研究;公共开放数据平台的构建及示范应用。.项目按计划顺利实施,圆满完成了任务,主要的研究进展和所取得的成果如下:.1. 针对目前已有数据收集方法可用性不足的缺点,结合本项目数据多源、海量的特性,提出了一种层次化、多版本的共享与复用软件开发活动数据集的方法,建立数据的可追溯性与捕获数据的动态性。.2. 针对软件生命期数据分布于不同的软件仓库、软件仓库类型多样、但个体数据之间具有内在逻辑联系的特点,提出了缺陷报告和代码变更的关联关系恢复等技术,能够有效降低软件维护成本;针对软件仓库存在的大量缺失、噪声和不确定数据,本项目面向软件开发活动数据的质量问题,提出了相应的检测与修正方法。.3. 在群体协同的微过程方面,研究了群体协作的机制机理(例如:不同微过程中的成长途径),群体微过程的度量和改进(例如:面向众测群体协同和质量提升的众测人员推荐技术),以及群体微过程和软件产品的协同演化(例如:开源生态系统中商业参与模式以及影响)。.4. 在基于信息融合的软件质量保障方法研究方面,从缺陷预防、缺陷预测、缺陷检测、缺陷修复等维度提出了多种新型的软件质量保障方法。例如:在缺陷预防方面,提出了API推荐、API使用和模块化设计等多个场景下的缺陷预防方法。.5. 项目组设计开发了软件生命期数据组织与分析应用平台,具有开发过程灵活配置和按需组合、过程数据与过程资源共享、支持多工具协同的过程管理、开放的智能服务框架等特点,已经成功在500人规模的软件开发组织运行2年。.本项目共发表(含录用)会议/期刊论文74篇,其中CCF A类会议/期刊论文24篇。申请发明专利6项,培养博士/硕士42名。一篇论文获ICSE 2019 ACM SIGSOFT Distinguished Paper award,一篇论文获QRS 2019 IEEE Best Paper award。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
BESIII实验数据分析和处理方法及软件研究
比率型荧光传感体系的原理、构建及生命分析应用研究
生命旋回和突变现象的数据分析
以数据为中心的无线传感器网络中生命期最优路由的构造