基于模糊粗糙集的混合特征流选择方法研究

基本信息
批准号:61906056
项目类别:青年科学基金项目
资助金额:24.00
负责人:周鹏
学科分类:
依托单位:安徽大学
批准年份:2019
结题年份:2022
起止时间:2020-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:
关键词:
模糊粗糙集分布式数据挖掘特征选择特征流混合特征
结项摘要

In real-world applications such as network monitoring and social platforms, data is continuously generated in a stream and needs to be processed immediately. Since the existence of a large number of irrelevant and redundant features in the stream data will affect the quality and efficiency of subsequent data mining, streaming feature selection has become an important research task which aims to select the optimal feature subset in real-time when the features are continuously generated or acquired over time. The existing streaming feature selection method is mainly constructed for a single type of data in which the feature space is all discrete or continuous. However, in real-world applications, the feature space of the objects may be mixed. This project intends to study the streaming feature selection method for mixed data based on fuzzy rough set theory. The main contents include: (1) we study the construction method of streaming feature selection model for mixed feature space; (2) we study the calculation method of dependency degree for dynamic feature set which can improve the updated efficiency of the model; (3) The measurement mechanism of data perturbation sensitivity for streaming feature selection methods is studied, which provides a basis for evaluating and constructing a stable algorithm. Finally, we design and implement the prototype system on the medical record data which aims to improve and deepen the research work. This project provides a new theoretical exploration for the mixed streaming feature selection method and makes a meaningful attempt to develop systems with practical value.

在网络监控、社交平台等实际应用中,数据以流的方式持续生成且需要被立即处理。由于流数据中存在大量无关和冗余特征会影响后续数据挖掘的质量和效率,因此,特征流选择成为一项重要的研究任务,旨在研究特征以流的方式不断产生或获取场景下实时选择最优特征子集的问题。现有特征流选择方法主要针对特征空间全部为离散或连续的单一类型数据,而实际应用中数据对象的特征类型可能是混合的。为此,本项目拟基于模糊粗糙集理论研究面向混合属性数据的特征流选择方法,主要内容包括:(1)研究混合特征空间下特征流选择模型构建方法;(2)研究动态特征集合的依赖度计算方法以提高模型的更新效率;(3)研究特征流选择方法对数据扰动敏感性的度量机制,为评价和构建稳定的算法提供依据。最后,以医疗病历数据为例构建原型系统并以此完善和深化研究工作。本项目研究为混合特征流选择方法提供新的理论探索,并为研发具有实用价值的系统做出有意义的尝试。

项目摘要

随着数据的爆炸式增长,从数据集原始特征空间中选择最优特征子集的特征选择方法备受关注且不可或缺。在网络监控、社交平台等实际应用中,数据是以流的方式持续生成且需要被立即处理的。由此,产生了特征流选择方法研究,旨在研究特征以流的方式不断产生或获取场景下实时选择最优特征子集的问题。现有特征流选择方法主要针对特征空间全部为离散或连续的单一类型数据,而实际应用中数据对象的特征类型可能是混合的甚至未知的。为此,本项目基于粗糙集等理论研究了面向混合属性数据的特征流选择方法。具体包括:1)开展了流特征类型未知场景下的在线特征选择问题研究,基于最大信息系数方法提出了一个无参且无需考虑流特征类型的在线特征选择模型;2)从可扩展性和提前终止两个方向开展了模型快速更新方法研究,提出了基于动态决策视角的可扩展在线流特征选择框架和基于粗糙集理论的可提前终止在线流特征选择框架;3)从特征交互视角开展了在线流特征选择算法稳定性研究,提出了考虑特征交互的单特征流在线选择框架和组特征流在线选择框架;4)在混合属性医学数据应用示范研究基础上,进一步研究了可以适应不同应用场景和数据类型需求的在线流特性选择通用框架问题,基于粗糙集理论提出了一种可装配的通用在线流特征选择框架。此外,为了促进研究成果的落地和转化,开展了流数据上的在线异常检测方法预研,并取得了初步研究成果。本研究丰富了特征流数据上的在线特征选择理论和关键技术,为工业生产、网络安全和医疗检测等领域上的应用提供模型和方法的支撑。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
3

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
4

针灸治疗胃食管反流病的研究进展

针灸治疗胃食管反流病的研究进展

DOI:
发表时间:2022
5

端壁抽吸控制下攻角对压气机叶栅叶尖 泄漏流动的影响

端壁抽吸控制下攻角对压气机叶栅叶尖 泄漏流动的影响

DOI:
发表时间:2020

周鹏的其他基金

批准号:30760134
批准年份:2007
资助金额:17.00
项目类别:地区科学基金项目
批准号:51007063
批准年份:2010
资助金额:21.00
项目类别:青年科学基金项目
批准号:31471697
批准年份:2014
资助金额:89.00
项目类别:面上项目
批准号:61376093
批准年份:2013
资助金额:90.00
项目类别:面上项目
批准号:51201049
批准年份:2012
资助金额:25.00
项目类别:青年科学基金项目
批准号:61502293
批准年份:2015
资助金额:20.00
项目类别:青年科学基金项目
批准号:70903031
批准年份:2009
资助金额:21.00
项目类别:青年科学基金项目
批准号:81200669
批准年份:2012
资助金额:23.00
项目类别:青年科学基金项目
批准号:30060033
批准年份:2000
资助金额:19.00
项目类别:地区科学基金项目
批准号:31872419
批准年份:2018
资助金额:60.00
项目类别:面上项目
批准号:11801373
批准年份:2018
资助金额:23.00
项目类别:青年科学基金项目
批准号:61162018
批准年份:2011
资助金额:46.00
项目类别:地区科学基金项目
批准号:71041008
批准年份:2010
资助金额:10.00
项目类别:专项基金项目
批准号:60706033
批准年份:2007
资助金额:24.00
项目类别:青年科学基金项目
批准号:41071348
批准年份:2010
资助金额:35.00
项目类别:面上项目
批准号:31271062
批准年份:2012
资助金额:15.00
项目类别:面上项目
批准号:70973014
批准年份:2009
资助金额:25.00
项目类别:面上项目
批准号:51801200
批准年份:2018
资助金额:25.00
项目类别:青年科学基金项目
批准号:31200125
批准年份:2012
资助金额:23.00
项目类别:青年科学基金项目
批准号:31200993
批准年份:2012
资助金额:25.00
项目类别:青年科学基金项目
批准号:81402363
批准年份:2014
资助金额:23.00
项目类别:青年科学基金项目
批准号:71273005
批准年份:2012
资助金额:60.00
项目类别:面上项目
批准号:51808175
批准年份:2018
资助金额:26.00
项目类别:青年科学基金项目
批准号:21602035
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目
批准号:71573119
批准年份:2015
资助金额:51.00
项目类别:面上项目
批准号:31671361
批准年份:2016
资助金额:60.00
项目类别:面上项目
批准号:31071492
批准年份:2010
资助金额:32.00
项目类别:面上项目
批准号:30901988
批准年份:2009
资助金额:20.00
项目类别:青年科学基金项目
批准号:31171822
批准年份:2011
资助金额:58.00
项目类别:面上项目
批准号:51701072
批准年份:2017
资助金额:25.00
项目类别:青年科学基金项目
批准号:41906121
批准年份:2019
资助金额:26.00
项目类别:青年科学基金项目
批准号:51377120
批准年份:2013
资助金额:80.00
项目类别:面上项目
批准号:81600786
批准年份:2016
资助金额:17.00
项目类别:青年科学基金项目
批准号:51904322
批准年份:2019
资助金额:25.00
项目类别:青年科学基金项目
批准号:31302083
批准年份:2013
资助金额:20.00
项目类别:青年科学基金项目
批准号:31272198
批准年份:2012
资助金额:80.00
项目类别:面上项目
批准号:61076114
批准年份:2010
资助金额:36.00
项目类别:面上项目
批准号:81772199
批准年份:2017
资助金额:56.00
项目类别:面上项目
批准号:19004003
批准年份:1990
资助金额:1.50
项目类别:青年科学基金项目
批准号:30901123
批准年份:2009
资助金额:20.00
项目类别:青年科学基金项目
批准号:81601138
批准年份:2016
资助金额:17.00
项目类别:青年科学基金项目

相似国自然基金

1

基于模糊粗糙集的概率数据挖掘方法研究

批准号:61202114
批准年份:2012
负责人:赵素云
学科分类:F0202
资助金额:24.00
项目类别:青年科学基金项目
2

基于动态模糊粗糙集的太阳耀斑预报方法研究

批准号:10978011
批准年份:2009
负责人:胡清华
学科分类:A1602
资助金额:31.00
项目类别:联合基金项目
3

基于特征聚类的高维混合属性数据特征选择方法

批准号:61806131
批准年份:2018
负责人:贾红
学科分类:F0603
资助金额:25.00
项目类别:青年科学基金项目
4

基于单相机混合模糊成像的三维流场测量方法研究

批准号:51206112
批准年份:2012
负责人:周骛
学科分类:E0606
资助金额:25.00
项目类别:青年科学基金项目