Aiming at high-dimensional, distributed and dynamic large-scale complex data (LSCD),the research of theories and methods of knowledge discovery for processing LSCD has been becoming a challenging research topic in the field of artificial intelligence. In this project, the theories and methods of Granular Computing (GrC) are applied to the preprocessing procedure and multi-classification model for LSCD, in order to explore key theories and methods of multi-granular discover knowledge. The contents include: (1)Study the Granulating Strategies and methods of LSCD, granulate the data in sample and attribute space, construct sample granules and attribute granules to reduce the size and dimension of LSCD. (2)Establish Granular Neural Networks(GNN) on the layer of each sample granulating, which contains input layer, knowledge layer and output layer. (3)Design the Multi-Granular Neural Networks (MGNN) ensemble learning model on the basis of the granularity relationships of the models on each layers. (4)Construct the model of multifetal support vector machines (MSVM), and optimize the model through partial least squares and smoothing techniques to reduce the calculation complexity of the model. Finally, combine advantages of GNN and MSVM, establish Multi-granular Support Vector Machine networks (MGSVMN) in order to solve the multi-classification problem of LSCD fastly.
针对高维、分布式、动态的大规模复杂数据(Large-Scale Complex Data,LSCD),探索研究适用于面向LSCD的知识发现理论与方法,已成为人工智能领域中极具挑战性的课题。本项目将粒度计算的理论与方法贯穿于LSCD的预处理和多分类模型中,研究面向LSCD的多粒度知识发现的关键理论与方法。研究内容包括:(1)研究LSCD的粒化策略,在样本空间和属性空间对LSCD进行粒化,构造了"样本粒"和"属性粒",降低了LSCD的规模和维数;(2)在每一个"样本粒"层上,建立包含输入层、知识层和输出层的粒度神经网络模型;基于各层模型之间的粒度关系,建立多粒度神经网络集成学习模型;(3)根据孪生支持向量机模型的具体特征,建立多生支持向量机的算法模型;(4)结合多粒度神经网络和多生支持向量机的优点,建立多粒度支持向量机网络模型,快速解决LSCD的多分类问题。
本项目针对大规模复杂数据(Large-Scale Complex Data,LSCD),研究了面向LSCD的多粒度知识发现的关键理论与技术。主要研究了LSCD环境下如何提供高效率的、鲁棒的聚类方法、深度网络模型与孪生支持向量机计算方法等方面。在聚类粒化学习算法研究方面,研究了谱聚类和密度峰值聚类方法在大规模复杂数据下的适用性问题,提出面向大数据的基于近似求解的谱聚类算法、面向复杂数据的基于局部密度特征的谱聚类算法、面向高维数据的基于降维的谱聚类以及密度峰值聚类算法。确定大规模复杂数据的结构后,还需要进行特征提取从而进行决策。在此基础上,着重研究了深度神经网络模型,从缓解深度模型中的过拟合问题、概率图模型的图像处理、混合深度学习模型和神经网络模型集成四个方面展开研究,实现大规模复杂数据信息的深加工与处理。本课题重点研究了孪生支持向量机决策方法,主要从提升泛化性能、提高学习速度以及增强学习过程的健壮性等几个方面对其进行研究,提出了基于局部信息的加权孪生支持向量机、面向复杂数据的孪生支持向量回归机、基于群体智能优化的孪生支持向量机等方法。此外,本课题将算法模型应用在实际问题上,研究内容有指纹图像方向场提取及增强研究与苹果采摘机器人的全天候作业研究。本课题研究的算法可以用于处理大规模复杂数据,在目前数据爆炸的时代具有很强的实用性,同样也可以为企业创造了很好的经济效益。.经过四年的研究,课题组取得了一系列研究成果,在Information Sciences等国际期刊上发表录用文章69篇,在计算机研究与发展等国内期刊发表录用文章28篇,在IIP等国际会议上发表论文5篇,总计被SCI收录59篇,被EI收录23篇,国内核心刊物15篇。出版专著4本,软件著作权2项,申请国家发明专利21项,获得授权1项。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例
基于多模态信息特征融合的犯罪预测算法研究
F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度
惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法
面向大规模复杂数据的地铁施工安全多粒度知识发现与动态风险感知研究
大数据中的多粒度知识发现模型与方法研究
面向大规模复杂数据的主曲线多粒度建模与分析
面向领域用户知识发现的数据结构化建模与多粒度融合