基于模糊粗糙集的混合特征流选择方法研究

基本信息

批准号：61906056

项目类别：青年科学基金项目

资助金额：24.00

负责人：周鹏

学科分类：

依托单位：安徽大学

批准年份：2019

结题年份：2022

起止时间：2020-01-01 - 2022-12-31

项目状态：已结题

项目参与者：

关键词：

模糊粗糙集分布式数据挖掘特征选择特征流混合特征

结项摘要

In real-world applications such as network monitoring and social platforms, data is continuously generated in a stream and needs to be processed immediately. Since the existence of a large number of irrelevant and redundant features in the stream data will affect the quality and efficiency of subsequent data mining, streaming feature selection has become an important research task which aims to select the optimal feature subset in real-time when the features are continuously generated or acquired over time. The existing streaming feature selection method is mainly constructed for a single type of data in which the feature space is all discrete or continuous. However, in real-world applications, the feature space of the objects may be mixed. This project intends to study the streaming feature selection method for mixed data based on fuzzy rough set theory. The main contents include: (1) we study the construction method of streaming feature selection model for mixed feature space; (2) we study the calculation method of dependency degree for dynamic feature set which can improve the updated efficiency of the model; (3) The measurement mechanism of data perturbation sensitivity for streaming feature selection methods is studied, which provides a basis for evaluating and constructing a stable algorithm. Finally, we design and implement the prototype system on the medical record data which aims to improve and deepen the research work. This project provides a new theoretical exploration for the mixed streaming feature selection method and makes a meaningful attempt to develop systems with practical value.

在网络监控、社交平台等实际应用中，数据以流的方式持续生成且需要被立即处理。由于流数据中存在大量无关和冗余特征会影响后续数据挖掘的质量和效率，因此，特征流选择成为一项重要的研究任务，旨在研究特征以流的方式不断产生或获取场景下实时选择最优特征子集的问题。现有特征流选择方法主要针对特征空间全部为离散或连续的单一类型数据，而实际应用中数据对象的特征类型可能是混合的。为此，本项目拟基于模糊粗糙集理论研究面向混合属性数据的特征流选择方法，主要内容包括：(1)研究混合特征空间下特征流选择模型构建方法；(2)研究动态特征集合的依赖度计算方法以提高模型的更新效率；(3)研究特征流选择方法对数据扰动敏感性的度量机制，为评价和构建稳定的算法提供依据。最后，以医疗病历数据为例构建原型系统并以此完善和深化研究工作。本项目研究为混合特征流选择方法提供新的理论探索，并为研发具有实用价值的系统做出有意义的尝试。

项目摘要

随着数据的爆炸式增长，从数据集原始特征空间中选择最优特征子集的特征选择方法备受关注且不可或缺。在网络监控、社交平台等实际应用中，数据是以流的方式持续生成且需要被立即处理的。由此，产生了特征流选择方法研究，旨在研究特征以流的方式不断产生或获取场景下实时选择最优特征子集的问题。现有特征流选择方法主要针对特征空间全部为离散或连续的单一类型数据，而实际应用中数据对象的特征类型可能是混合的甚至未知的。为此，本项目基于粗糙集等理论研究了面向混合属性数据的特征流选择方法。具体包括：1）开展了流特征类型未知场景下的在线特征选择问题研究，基于最大信息系数方法提出了一个无参且无需考虑流特征类型的在线特征选择模型；2）从可扩展性和提前终止两个方向开展了模型快速更新方法研究，提出了基于动态决策视角的可扩展在线流特征选择框架和基于粗糙集理论的可提前终止在线流特征选择框架；3）从特征交互视角开展了在线流特征选择算法稳定性研究，提出了考虑特征交互的单特征流在线选择框架和组特征流在线选择框架；4）在混合属性医学数据应用示范研究基础上，进一步研究了可以适应不同应用场景和数据类型需求的在线流特性选择通用框架问题，基于粗糙集理论提出了一种可装配的通用在线流特征选择框架。此外，为了促进研究成果的落地和转化，开展了流数据上的在线异常检测方法预研，并取得了初步研究成果。本研究丰富了特征流数据上的在线特征选择理论和关键技术，为工业生产、网络安全和医疗检测等领域上的应用提供模型和方法的支撑。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.13334/j.0258-8013.pcsee.190276

发表时间：2020

DOI：

发表时间：2020

DOI：10.13199/j.cnki.cst.2020.07.010

发表时间：2020

DOI：10.3778/j.issn.1673-9418.2104120

发表时间：

DOI：10.12005/orms.2019.0029

发表时间：2019

周鹏的其他基金

批准号：30760134

批准年份：2007

资助金额：17.00

项目类别：地区科学基金项目

批准号：51007063

批准年份：2010

资助金额：21.00

项目类别：青年科学基金项目

批准号：31471697

批准年份：2014

资助金额：89.00

项目类别：面上项目

批准号：61376093

批准年份：2013

资助金额：90.00

项目类别：面上项目

批准号：51201049

批准年份：2012

资助金额：25.00

项目类别：青年科学基金项目

批准号：61502293

批准年份：2015

资助金额：20.00

项目类别：青年科学基金项目

批准号：70903031

批准年份：2009

资助金额：21.00

项目类别：青年科学基金项目

批准号：81200669

批准年份：2012

资助金额：23.00

项目类别：青年科学基金项目

批准号：30060033

批准年份：2000

资助金额：19.00

项目类别：地区科学基金项目

批准号：31872419

批准年份：2018

资助金额：60.00

项目类别：面上项目

批准号：11801373

批准年份：2018

资助金额：23.00

项目类别：青年科学基金项目

批准号：61162018

批准年份：2011

资助金额：46.00

项目类别：地区科学基金项目

批准号：71041008

批准年份：2010

资助金额：10.00

项目类别：专项基金项目

批准号：60706033

批准年份：2007

资助金额：24.00

项目类别：青年科学基金项目

批准号：41071348

批准年份：2010

资助金额：35.00

项目类别：面上项目

批准号：31271062

批准年份：2012

资助金额：15.00

项目类别：面上项目

批准号：70973014

批准年份：2009

资助金额：25.00

项目类别：面上项目

批准号：51801200

批准年份：2018

资助金额：25.00

项目类别：青年科学基金项目

批准号：31200125

批准年份：2012

资助金额：23.00

项目类别：青年科学基金项目

批准号：31200993

批准年份：2012

资助金额：25.00

项目类别：青年科学基金项目

批准号：81402363

批准年份：2014

资助金额：23.00

项目类别：青年科学基金项目

批准号：71273005

批准年份：2012

资助金额：60.00

项目类别：面上项目

批准号：51808175

批准年份：2018

资助金额：26.00

项目类别：青年科学基金项目

批准号：21602035

批准年份：2016

资助金额：20.00

项目类别：青年科学基金项目

批准号：71573119

批准年份：2015

资助金额：51.00

项目类别：面上项目

批准号：31671361

批准年份：2016

资助金额：60.00

项目类别：面上项目

批准号：31071492

批准年份：2010

资助金额：32.00

项目类别：面上项目

批准号：30901988

批准年份：2009

资助金额：20.00

项目类别：青年科学基金项目

批准号：31171822

批准年份：2011

资助金额：58.00

项目类别：面上项目

批准号：51701072

批准年份：2017

资助金额：25.00

项目类别：青年科学基金项目

批准号：41906121

批准年份：2019

资助金额：26.00

项目类别：青年科学基金项目

批准号：51377120

批准年份：2013

资助金额：80.00

项目类别：面上项目

批准号：81600786

批准年份：2016

资助金额：17.00

项目类别：青年科学基金项目

批准号：51904322

批准年份：2019

资助金额：25.00

项目类别：青年科学基金项目

批准号：31302083

批准年份：2013

资助金额：20.00

项目类别：青年科学基金项目

批准号：31272198

批准年份：2012

资助金额：80.00

项目类别：面上项目

批准号：61076114

批准年份：2010

资助金额：36.00

项目类别：面上项目

批准号：81772199

批准年份：2017

资助金额：56.00

项目类别：面上项目

批准号：19004003

批准年份：1990

资助金额：1.50

项目类别：青年科学基金项目

批准号：30901123

批准年份：2009

资助金额：20.00

项目类别：青年科学基金项目

批准号：81601138

批准年份：2016

资助金额：17.00

项目类别：青年科学基金项目

相似国自然基金

基于模糊粗糙集的概率数据挖掘方法研究

批准号：61202114

批准年份：2012

负责人：赵素云

学科分类：F0202

资助金额：24.00

项目类别：青年科学基金项目

基于动态模糊粗糙集的太阳耀斑预报方法研究

批准号：10978011

批准年份：2009

负责人：胡清华

学科分类：A1602

资助金额：31.00

项目类别：联合基金项目

基于特征聚类的高维混合属性数据特征选择方法

批准号：61806131

批准年份：2018

负责人：贾红

学科分类：F0603

资助金额：25.00

项目类别：青年科学基金项目

基于单相机混合模糊成像的三维流场测量方法研究

批准号：51206112

批准年份：2012

负责人：周骛

学科分类：E0606

资助金额：25.00

项目类别：青年科学基金项目

基于模糊粗糙集的混合特征流选择方法研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

多能耦合三相不平衡主动配电网与输电网交互随机模糊潮流方法

基于多色集合理论的医院异常工作流处理建模

智能煤矿建设路线与工程实践

基于直观图的三支概念获取及属性特征分析

基于直觉模糊二元语义交互式群决策的技术创新项目选择

周鹏的其他基金

番木瓜环斑病毒寄主专一性决定因子研究

基于大脑谐振效应的极低频脉冲磁场治疗失眠症的研究

浓缩乳蛋白体系中蛋白非共价聚集导致溶解性下降的机理

石墨烯晶体管基红外探测的根本机制与性能提高研究

导线焊点界面扩散相变过程模拟和分析

可信工业控制系统中信任冷启动方法研究

考虑非期望产出的效率模型及其在能源效率与环境绩效评价中的应用

CRYAA基因DNA甲基化在年龄相关性白内障发病中的作用研究

轮状病毒表面蛋白基因在番木瓜果实中的表达

紫花苜蓿LEA蛋白缓解苜蓿铝毒害的作用机制

空间生态学中几类偏微分方程模型的定性研究

南疆红枣病虫害的理化参数高光谱遥感监测识别及预测模型的研究

低碳发展政策跟踪：国际经验及中国策略

基于过渡金属氧化物薄膜的新型电阻式存储的可靠开关机理及器件制备技术研究

区域碳排放演化机制及减排配额交易绩效模拟研究

睡眠缺失对大脑警觉度的影响规律及其对抗措施研究

社会“选秀”竞赛的机理、效果及管制问题研究

高强韧纳米孪晶钢微观结构调控及其动态变形机理研究

蝙蝠腺病毒感染后蝙蝠细胞的免疫反应及病毒转录组分析

“自结合肽”的结构生物信息分析及相关新方法研究

TAp63β上调CD137L的分子机制及其在宫颈癌免疫逃逸中的作用研究

效率分析视角下我国二氧化碳减排的责任与路径研究

基于惯性力的大跨度斜拉桥拉索高阶多模态振动控制研究

基于钯对邻位三唑取代卤苯的氧化加成/C-H活化串联环化反应研究

考虑大气污染物协同控制和减排策略差异的城市二氧化碳边际减排成本研究

基于结构生物信息学探索“自结合肽”作为一类新型药物靶标的分子机制

高蛋白中间水分食品中蛋白聚集导致质地硬化的机理

从调控骨钙素分泌研究六味地黄丸干预2型糖尿病的作用机制

两种PRSV分离物混合侵染番木瓜及病症差异决定因子的研究

多元无Co硬质合金的相图热力学及碳平衡控制研究

长江口邻近海域浮游植物群落对黑潮次表层水入侵年际变异的响应特征

基于多模态大脑感知谐振效应的快速提高警觉度方法研究

病毒miRNA参与慢性鼻窦炎鼻息肉炎症反应发病机制的研究

表面活性剂吸附和聚集对粗糙微纳孔隙中油/水流动影响的分子模拟研究

II型弓形虫入侵分泌蛋白组学分析和重要分泌蛋白功能鉴定

狗牙根脱水素基因CdDHN4的抗旱功能及分子调控机制研究

碳基电路中的纳米尺度阻式存储稳定实现及物理机制

SARS样冠状病毒感染蝙蝠细胞后的干扰素应答研究

原子的压缩效应

淡水鱼中胶原蛋白的季节性变化及其对深加工原料特性的影响

I型钠通道（Nav1.1）基因框内缺失突变在癫痫发病机制中的作用及其与疗效的关系

相似国自然基金