Data-driven research is attracting more attentions in the development of science and technology. The intelligent analysis and knowledge discovery for big data has become one of the key scientific problems. Two observations account for this point: (1) there is no formal method on dynamic, high dimensional and complex big data, (2) most popular methods are not suitable for processing the big data over TB level. For solving the above problems, the knowledge discovery methods for big data are proposed. The contents of this research project include: (1) Designing and constructing a knowledge description model with multi-granularity for big data, which can be used to describe the course that one recognize and discover the knowledge from original data. (2) Finding the data-driven methods for high dimensional feature selection and sampling, through which one can decrease the size of big data. (3) Designing and constructing the methods for decomposing and solving the complex tasks, which can be used to knowledge discovery and incremental learning of big data. This research project may help to impel the intelligent analysis and knowledge discovery of big data. Furthermore, it may also improve the capability of rough set theory and granular computing under big data environment, and promote the research and application of big data and granular computing.
数据驱动的科学研究已成世界科技发展的新浪潮,大数据智能分析与知识发现日益成为了当前的关键科学难题,而传统的数据挖掘方法难以对大数据进行有效处理。针对缺乏对动态、高维、复杂大数据的形式化描述模型,以及现有方法难以有效处理TB级以上的大数据等急需解决的理论和技术问题,本课题以大数据中的有效知识发现为研究目标,主要研究如下相关关键问题:根据人类从多个粒度层次进行知识的综合表达与处理的机制,建立复杂大数据的多粒度知识表示模型;提出大数据的降维与抽样方法,从数据层面对大数据进行简化,在简化数据模型上实现大数据的高效处理;提出复杂大数据知识发现的任务分解与求解方法,实现大数据中的渐进式知识发现。本课题的研究将有助于大数据的智能分析和知识发现,也有利于提高粒计算、粗糙集在大数据环境下的处理能力,推进大数据、粒计算等领域的研究和应用发展。
数据驱动的科学研究已成世界科技发展的新浪潮,大数据智能分析与知识发现日益成为了当前的关键科学难题。本项目针对动态、高维、复杂大数据的信息处理问题,在复杂大数据的知识表示、大数据的简化理论与方法、大数据的任务分解与控制方法等方面进行了深入研究,取得很好的成果。初步建立了大数据的柔性特征度量标准与描述模型;结合粗糙集理论,提出了复杂大数据的自主式特征选择方法与多粒度抽样方法;实现了复杂任务的多粒度分解与知识获取,并在网络入侵检测、文本分类、运营商用户行为感知等方面取得了较好的应用效果。项目在国内外期刊、会议上发表论文20篇,16篇被SCI/EI收录。培养了7名硕士研究生,授权专利2项,申请专利3项;项目培养了一批大数据处理的人才,在阿里巴巴等国内顶级大数据竞赛中取得了优异的成绩。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
服务经济时代新动能将由技术和服务共同驱动
圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察
资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据
多源数据驱动CNN-GRU模型的公交客流量分类预测
知识与数据双向驱动的大数据多粒度学习模型与方法
面向大规模复杂数据的多粒度知识发现关键理论与方法研究
面向领域用户知识发现的数据结构化建模与多粒度融合
多粒度框架下带偏好直觉模糊数据集的信息融合与知识发现研究