Usually, some data are structured, but most of them are unstructured. To exactly acquire information of data, we usually depend on feature extraction to acquire efficacious decision. How to extract latent structure information from unstructured data which has uncertain features is a hot topic in machine learning. As an important granular computing theory, quotient space theory emphasizes the significance of structural information. Its multi-granular analysis is from coarse to fine, from fuzzy to accurate. The multilayer granulation can be gotten based on granular computing theory. Each layer of granulation represents a view of abstract feature sets about original problems. Based on Quotient Space Theory, the deep feature extraction algorithm will be discussed in this project. The multilayer granulation model is built based on multi-granular structural information of unstructured data sets. The main work includes: (1) Implicit relationships are mined to build deep feature sets. Two granular transform operations will be defined: granular composition and granular synthesis. (2) The hierarchical method based on Quotient Space Theory is given to achieve multilayer granulation of data sets. (3)The proposed models will be applied into the real problems.
现实中的数据包括了结构化数据但是更多的是非结构化数据。为准确获取数据集的信息,指导下一步的有效决策,我们往往依赖于特征提取将数据自身的具体属性提取出来。针对特征不明确的非结构化数据,如何提取潜在结构特征是十分重要的。商空间理论作为一种粒计算理论引入结构这一重要特征,采用由粗到细的多粒度分析法,通过对问题的多层粒化,我们可以得到关于原始数据不同层次的抽象特征集合。本项目主要研究基于商空间理论的深度特征提取算法,挖掘非结构化数据集的结构信息,即数据间的关联关系,指导构建多层粒化求解模型。具体研究内容为:(1)挖掘数据内部隐藏着丰富的数据间的关联关系,给出粒度变换规则:粒度分解和粒度整合,构建深度结构特征集;(2)基于多粒度结构特征,实现对数据集的分层递阶粒化,提出商空间粒变换的多层粒化求解模型;(3)提出基于商空间理论的粒化求解算法并应用于实际问题求解中。
本项目根据商空间理论的粒度变换原理来揭示问题的深层特征,获取问题的多层粒度空间,构造问题特征的多粒度深层表示。主要研究基于商空间理论形成多粒度分层递阶结构所需的粒度分解规则和粒度整合规则,提出基于商空间粒变换的深层特征表示算法,并应用于实际问题求解。.(1)商空间粒变换的深层特征表示研究;获取确定性样本的多粒度特征表示,并指导不确定性问题求解。首先将样本集划分为确定性数据集和不确定性数据集。利用互信息技术(MI)构造确定性数据集上的模糊等价关系,构建分层递阶特征表示,并通过对训练集的验证选择粗粒度下的最优特征表示指导不确定数据集的划分,实现最终决策。粗粒度下的最优特征表示进行粒度分解,通过上下两层粒度空间的自适应分解,可获得更适合问题求解的粒度空间。.(2)基于变粒度的分层递阶社团发现研究;在分层聚类获取社团结构的问题中引入商空间理论构建变粒度的社团发现方法。以网络中的重要节点为粒子中心构建初始粒子,并将该层视为最细粒度下的商空间。选取下层商空间的中值聚类系数作为粒化条件,粗化到上层粗粒度空间。以EQ或Q作为评价标准,选取最优层作为社团检测结果。.(3)基于深层特征表示的应用研究。基于商空间理论的深层特征表示有效获取数据的关联关系,因此将其应用于实际问题求解。首先应用于推荐问题求解,挖掘历史用户的特征表示,通过计算目标用户和历史用户之间的相似性进行个性化推荐。其次应用于网络表示学习,构造网络的多粒度网络结构,学习不同粒度空间中的特征表示向量,将不同粒度的粒特征表示按照由粗到细的顺序进行逐层细化拼接,输出最细粒度空间中拼接后的粒特征表示作为初始网络的节点特征表示。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
基于多模态信息特征融合的犯罪预测算法研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
面向云工作流安全的任务调度方法
商空间粒计算理论在大电网环境经济调度的应用研究
基于深度学习和主题模型的文本特征提取方法研究
基于商逼近的粒计算优化问题研究
应用商空间理论改进福岛模型的图象识别能力