面向大规模复杂数据的多粒度知识发现关键理论与方法研究

基本信息

批准号：61379101

项目类别：面上项目

资助金额：75.00

负责人：丁世飞

学科分类：

依托单位：中国矿业大学

批准年份：2013

结题年份：2017

起止时间：2014-01-01 - 2017-12-31

项目状态：已结题

项目参与者：许新征,朱红,聂茹,孙统风,贾伟宽,黄华娟,李辉,徐丽,齐丙娟

关键词：

多分类知识发现大规模复杂数据多粒度

结项摘要

Aiming at high-dimensional, distributed and dynamic large-scale complex data (LSCD),the research of theories and methods of knowledge discovery for processing LSCD has been becoming a challenging research topic in the field of artificial intelligence. In this project, the theories and methods of Granular Computing (GrC) are applied to the preprocessing procedure and multi-classification model for LSCD, in order to explore key theories and methods of multi-granular discover knowledge. The contents include: (1)Study the Granulating Strategies and methods of LSCD, granulate the data in sample and attribute space, construct sample granules and attribute granules to reduce the size and dimension of LSCD. (2)Establish Granular Neural Networks(GNN) on the layer of each sample granulating, which contains input layer, knowledge layer and output layer. (3)Design the Multi-Granular Neural Networks (MGNN) ensemble learning model on the basis of the granularity relationships of the models on each layers. (4)Construct the model of multifetal support vector machines (MSVM), and optimize the model through partial least squares and smoothing techniques to reduce the calculation complexity of the model. Finally, combine advantages of GNN and MSVM, establish Multi-granular Support Vector Machine networks (MGSVMN) in order to solve the multi-classification problem of LSCD fastly.

针对高维、分布式、动态的大规模复杂数据(Large-Scale Complex Data,LSCD)，探索研究适用于面向LSCD的知识发现理论与方法，已成为人工智能领域中极具挑战性的课题。本项目将粒度计算的理论与方法贯穿于LSCD的预处理和多分类模型中，研究面向LSCD的多粒度知识发现的关键理论与方法。研究内容包括：(1)研究LSCD的粒化策略，在样本空间和属性空间对LSCD进行粒化，构造了"样本粒"和"属性粒"，降低了LSCD的规模和维数；(2)在每一个"样本粒"层上，建立包含输入层、知识层和输出层的粒度神经网络模型；基于各层模型之间的粒度关系，建立多粒度神经网络集成学习模型；(3)根据孪生支持向量机模型的具体特征，建立多生支持向量机的算法模型；(4)结合多粒度神经网络和多生支持向量机的优点，建立多粒度支持向量机网络模型，快速解决LSCD的多分类问题。

项目摘要

本项目针对大规模复杂数据(Large-Scale Complex Data,LSCD)，研究了面向LSCD的多粒度知识发现的关键理论与技术。主要研究了LSCD环境下如何提供高效率的、鲁棒的聚类方法、深度网络模型与孪生支持向量机计算方法等方面。在聚类粒化学习算法研究方面，研究了谱聚类和密度峰值聚类方法在大规模复杂数据下的适用性问题，提出面向大数据的基于近似求解的谱聚类算法、面向复杂数据的基于局部密度特征的谱聚类算法、面向高维数据的基于降维的谱聚类以及密度峰值聚类算法。确定大规模复杂数据的结构后，还需要进行特征提取从而进行决策。在此基础上，着重研究了深度神经网络模型，从缓解深度模型中的过拟合问题、概率图模型的图像处理、混合深度学习模型和神经网络模型集成四个方面展开研究，实现大规模复杂数据信息的深加工与处理。本课题重点研究了孪生支持向量机决策方法，主要从提升泛化性能、提高学习速度以及增强学习过程的健壮性等几个方面对其进行研究，提出了基于局部信息的加权孪生支持向量机、面向复杂数据的孪生支持向量回归机、基于群体智能优化的孪生支持向量机等方法。此外，本课题将算法模型应用在实际问题上，研究内容有指纹图像方向场提取及增强研究与苹果采摘机器人的全天候作业研究。本课题研究的算法可以用于处理大规模复杂数据，在目前数据爆炸的时代具有很强的实用性，同样也可以为企业创造了很好的经济效益。.经过四年的研究，课题组取得了一系列研究成果，在Information Sciences等国际期刊上发表录用文章69篇，在计算机研究与发展等国内期刊发表录用文章28篇，在IIP等国际会议上发表论文5篇，总计被SCI收录59篇，被EI收录23篇，国内核心刊物15篇。出版专著4本，软件著作权2项，申请国家发明专利21项，获得授权1项。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：2017

DOI：10.12054/lydk.bisu.148

发表时间：2020

DOI：

发表时间：2018

DOI：10.11999/JEIT210095

发表时间：2021

DOI：10.19596/j.cnki.1001-246x.8419

发表时间：2022

丁世飞的其他基金

批准号：61672522

批准年份：2016

资助金额：64.00

项目类别：面上项目

相似国自然基金

面向大规模复杂数据的地铁施工安全多粒度知识发现与动态风险感知研究

批准号：71571078

批准年份：2015

负责人：吴贤国

学科分类：G0115

资助金额：48.00

项目类别：面上项目

大数据中的多粒度知识发现模型与方法研究

批准号：61309014

批准年份：2013

负责人：胡峰

学科分类：F06

资助金额：23.00

项目类别：青年科学基金项目

面向大规模复杂数据的主曲线多粒度建模与分析

批准号：61573255

批准年份：2015

负责人：张红云

学科分类：F0303

资助金额：65.00

项目类别：面上项目

面向领域用户知识发现的数据结构化建模与多粒度融合

批准号：61472056

批准年份：2014

负责人：张清华

学科分类：F0607

资助金额：82.00

项目类别：面上项目

面向大规模复杂数据的多粒度知识发现关键理论与方法研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

论大数据环境对情报学发展的影响

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

基于多模态信息特征融合的犯罪预测算法研究

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

丁世飞的其他基金

基于谱粒度的广义深度学习及其应用研究

相似国自然基金