大数据中的多粒度知识发现模型与方法研究

基本信息
批准号:61309014
项目类别:青年科学基金项目
资助金额:23.00
负责人:胡峰
学科分类:
依托单位:重庆邮电大学
批准年份:2013
结题年份:2016
起止时间:2014-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:代劲,邓维斌,刘冰,陶春梅,李美争,徐泰华,李航,向倞,周静奇
关键词:
知识发现粗糙集粒计算大数据
结项摘要

Data-driven research is attracting more attentions in the development of science and technology. The intelligent analysis and knowledge discovery for big data has become one of the key scientific problems. Two observations account for this point: (1) there is no formal method on dynamic, high dimensional and complex big data, (2) most popular methods are not suitable for processing the big data over TB level. For solving the above problems, the knowledge discovery methods for big data are proposed. The contents of this research project include: (1) Designing and constructing a knowledge description model with multi-granularity for big data, which can be used to describe the course that one recognize and discover the knowledge from original data. (2) Finding the data-driven methods for high dimensional feature selection and sampling, through which one can decrease the size of big data. (3) Designing and constructing the methods for decomposing and solving the complex tasks, which can be used to knowledge discovery and incremental learning of big data. This research project may help to impel the intelligent analysis and knowledge discovery of big data. Furthermore, it may also improve the capability of rough set theory and granular computing under big data environment, and promote the research and application of big data and granular computing.

数据驱动的科学研究已成世界科技发展的新浪潮,大数据智能分析与知识发现日益成为了当前的关键科学难题,而传统的数据挖掘方法难以对大数据进行有效处理。针对缺乏对动态、高维、复杂大数据的形式化描述模型,以及现有方法难以有效处理TB级以上的大数据等急需解决的理论和技术问题,本课题以大数据中的有效知识发现为研究目标,主要研究如下相关关键问题:根据人类从多个粒度层次进行知识的综合表达与处理的机制,建立复杂大数据的多粒度知识表示模型;提出大数据的降维与抽样方法,从数据层面对大数据进行简化,在简化数据模型上实现大数据的高效处理;提出复杂大数据知识发现的任务分解与求解方法,实现大数据中的渐进式知识发现。本课题的研究将有助于大数据的智能分析和知识发现,也有利于提高粒计算、粗糙集在大数据环境下的处理能力,推进大数据、粒计算等领域的研究和应用发展。

项目摘要

数据驱动的科学研究已成世界科技发展的新浪潮,大数据智能分析与知识发现日益成为了当前的关键科学难题。本项目针对动态、高维、复杂大数据的信息处理问题,在复杂大数据的知识表示、大数据的简化理论与方法、大数据的任务分解与控制方法等方面进行了深入研究,取得很好的成果。初步建立了大数据的柔性特征度量标准与描述模型;结合粗糙集理论,提出了复杂大数据的自主式特征选择方法与多粒度抽样方法;实现了复杂任务的多粒度分解与知识获取,并在网络入侵检测、文本分类、运营商用户行为感知等方面取得了较好的应用效果。项目在国内外期刊、会议上发表论文20篇,16篇被SCI/EI收录。培养了7名硕士研究生,授权专利2项,申请专利3项;项目培养了一批大数据处理的人才,在阿里巴巴等国内顶级大数据竞赛中取得了优异的成绩。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

服务经济时代新动能将由技术和服务共同驱动

服务经济时代新动能将由技术和服务共同驱动

DOI:10.19474/j.cnki.10-1156/f.001172
发表时间:2017
3

圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察

圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察

DOI:10.3969/j.issn.1674-0858.2020.04.30
发表时间:2020
4

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

DOI:10.12202/j.0476-0301.2020285
发表时间:2021
5

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021

胡峰的其他基金

批准号:41774044
批准年份:2017
资助金额:70.00
项目类别:面上项目
批准号:51205294
批准年份:2012
资助金额:25.00
项目类别:青年科学基金项目
批准号:41504039
批准年份:2015
资助金额:21.00
项目类别:青年科学基金项目
批准号:81602202
批准年份:2016
资助金额:18.00
项目类别:青年科学基金项目
批准号:51705528
批准年份:2017
资助金额:20.00
项目类别:青年科学基金项目
批准号:71173191
批准年份:2011
资助金额:38.00
项目类别:面上项目
批准号:11304266
批准年份:2013
资助金额:25.00
项目类别:青年科学基金项目
批准号:71773115
批准年份:2017
资助金额:49.00
项目类别:面上项目

相似国自然基金

1

知识与数据双向驱动的大数据多粒度学习模型与方法

批准号:61772096
批准年份:2017
负责人:王国胤
学科分类:F06
资助金额:65.00
项目类别:面上项目
2

面向大规模复杂数据的多粒度知识发现关键理论与方法研究

批准号:61379101
批准年份:2013
负责人:丁世飞
学科分类:F0607
资助金额:75.00
项目类别:面上项目
3

面向领域用户知识发现的数据结构化建模与多粒度融合

批准号:61472056
批准年份:2014
负责人:张清华
学科分类:F0607
资助金额:82.00
项目类别:面上项目
4

多粒度框架下带偏好直觉模糊数据集的信息融合与知识发现研究

批准号:61772002
批准年份:2017
负责人:张晓燕
学科分类:F0607
资助金额:50.00
项目类别:面上项目