Data-driven research is attracting more attentions in the development of science and technology. The intelligent analysis and knowledge discovery for big data has become one of the key scientific problems. Two observations account for this point: (1) there is no formal method on dynamic, high dimensional and complex big data, (2) most popular methods are not suitable for processing the big data over TB level. For solving the above problems, the knowledge discovery methods for big data are proposed. The contents of this research project include: (1) Designing and constructing a knowledge description model with multi-granularity for big data, which can be used to describe the course that one recognize and discover the knowledge from original data. (2) Finding the data-driven methods for high dimensional feature selection and sampling, through which one can decrease the size of big data. (3) Designing and constructing the methods for decomposing and solving the complex tasks, which can be used to knowledge discovery and incremental learning of big data. This research project may help to impel the intelligent analysis and knowledge discovery of big data. Furthermore, it may also improve the capability of rough set theory and granular computing under big data environment, and promote the research and application of big data and granular computing.
数据驱动的科学研究已成世界科技发展的新浪潮,大数据智能分析与知识发现日益成为了当前的关键科学难题,而传统的数据挖掘方法难以对大数据进行有效处理。针对缺乏对动态、高维、复杂大数据的形式化描述模型,以及现有方法难以有效处理TB级以上的大数据等急需解决的理论和技术问题,本课题以大数据中的有效知识发现为研究目标,主要研究如下相关关键问题:根据人类从多个粒度层次进行知识的综合表达与处理的机制,建立复杂大数据的多粒度知识表示模型;提出大数据的降维与抽样方法,从数据层面对大数据进行简化,在简化数据模型上实现大数据的高效处理;提出复杂大数据知识发现的任务分解与求解方法,实现大数据中的渐进式知识发现。本课题的研究将有助于大数据的智能分析和知识发现,也有利于提高粒计算、粗糙集在大数据环境下的处理能力,推进大数据、粒计算等领域的研究和应用发展。
数据驱动的科学研究已成世界科技发展的新浪潮,大数据智能分析与知识发现日益成为了当前的关键科学难题。本项目针对动态、高维、复杂大数据的信息处理问题,在复杂大数据的知识表示、大数据的简化理论与方法、大数据的任务分解与控制方法等方面进行了深入研究,取得很好的成果。初步建立了大数据的柔性特征度量标准与描述模型;结合粗糙集理论,提出了复杂大数据的自主式特征选择方法与多粒度抽样方法;实现了复杂任务的多粒度分解与知识获取,并在网络入侵检测、文本分类、运营商用户行为感知等方面取得了较好的应用效果。项目在国内外期刊、会议上发表论文20篇,16篇被SCI/EI收录。培养了7名硕士研究生,授权专利2项,申请专利3项;项目培养了一批大数据处理的人才,在阿里巴巴等国内顶级大数据竞赛中取得了优异的成绩。
{{i.achievement_title}}
数据更新时间:2023-05-31
"多对多"模式下GEO卫星在轨加注任务规划
智能煤矿建设路线与工程实践
强震过程滑带超间隙水压力效应研究:大光包滑坡启动机制
铁路大跨度简支钢桁梁桥车-桥耦合振动研究
重大生物事件与化石能源形成演化--兼论地球系统框架下能源学发展
知识与数据双向驱动的大数据多粒度学习模型与方法
面向大规模复杂数据的多粒度知识发现关键理论与方法研究
面向领域用户知识发现的数据结构化建模与多粒度融合
多粒度框架下带偏好直觉模糊数据集的信息融合与知识发现研究