特异群组挖掘算法研究

基本信息
批准号:61170096
项目类别:面上项目
资助金额:56.00
负责人:朱扬勇
学科分类:
依托单位:复旦大学
批准年份:2011
结题年份:2015
起止时间:2012-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:熊赟,薛利,林志杰,白雪,董家麒,周健雯,林泽帧,马剑青,孙安健
关键词:
特异群组数据挖掘数据相似性
结项摘要

特异群组挖掘是一种新的数据挖掘任务,应用领域广泛,具有重要的应用价值。聚类、异常挖掘和特异群组挖掘属于根据数据对象的相似性来划分数据集的数据挖掘问题。其中,聚类是将大部分具有相似性的数据对象分到若干个簇中的过程;异常挖掘发现数据集当中明显不同于大部分对象(具有相似性)的数据对象;而特异群组挖掘是发现数据集当中明显不同于大部分数据对象(不具有相似性)的数据对象,其在问题定义、算法设计和应用效果都不同于聚类和异常挖掘,不能由现有的聚类、异常等数据挖掘技术实现。本项目在课题组前期工作的基础上,研究特异群组挖掘问题的形式化并设计特异群组挖掘算法,建立一个特异群组挖掘理论体系。主要研究内容包括:①特异群组挖掘问题的形式化;②特异群组的特异性度量的定义;③特异群组挖掘算法的设计;④BenchMark数据集的建立。本项目研究成果将为特异群组挖掘技术研究和应用奠定理论基础。

项目摘要

高价值低密度常常被用于描述大数据的特征,挖掘高价值低密度的数据对象是大数据的一项重要工作。特异群组是一类高价值低密度的大数据形态。本项目针对特异群组挖掘任务进行了深入的研究,即如何在大数据集中发现那些少部分具有相似性的对象形成的群组,而大部分数据对象不在任何组中,也不和其他对象相似。研究成果包括特异群组挖掘任务的系统阐述,特异群组挖掘任务与聚类、异常等任务之间的差异分析,特异群组挖掘任务的形式化定义,特异群组的特异性度量,一系列特异群组挖掘算法的研究设计,构建特异群组挖掘BenchMark数据集,并将所提出的算法在这些真实数据集上实现和应用,最终形成了特异群组挖掘形式化框架和理论体系,为特异群组挖掘技术研究和应用奠定理论基础。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

DOI:10.12202/j.0476-0301.2020285
发表时间:2021
3

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021
4

混采地震数据高效高精度分离处理方法研究进展

混采地震数据高效高精度分离处理方法研究进展

DOI:10.3969/j.issn.1000-1441.2020.05.004
发表时间:2020
5

国际比较视野下我国开放政府数据的现状、问题与对策

国际比较视野下我国开放政府数据的现状、问题与对策

DOI:
发表时间:2016

朱扬勇的其他基金

批准号:60573093
批准年份:2005
资助金额:23.00
项目类别:面上项目

相似国自然基金

1

群组决策动态过程的建模和数据挖掘方法研究

批准号:71871128
批准年份:2018
负责人:王琛
学科分类:G0103
资助金额:48.00
项目类别:面上项目
2

过程挖掘算法评估框架研究

批准号:61003099
批准年份:2010
负责人:闻立杰
学科分类:F0211
资助金额:20.00
项目类别:青年科学基金项目
3

海量不确定图挖掘算法研究

批准号:61173023
批准年份:2011
负责人:邹兆年
学科分类:F0202
资助金额:58.00
项目类别:面上项目
4

基于图结构的文献挖掘算法研究

批准号:60803075
批准年份:2008
负责人:黄民烈
学科分类:F0211
资助金额:21.00
项目类别:青年科学基金项目