面向复杂数据的生成器模式发现及其应用研究

基本信息
批准号:60873171
项目类别:面上项目
资助金额:28.00
负责人:王建勇
学科分类:
依托单位:清华大学
批准年份:2008
结题年份:2011
起止时间:2009-01-01 - 2011-12-31
项目状态: 已结题
项目参与者:贺宇凯,吴昊,高传聪,张军,李淳,李燕
关键词:
复杂数据生成器模式数据挖掘模式发现
结项摘要

传统的频繁模式发现算法主要用于从给定的数据库中挖掘所有的频繁模式或闭合模式,而不能够用于生成器模式的发现。一个等价类中生成器模式的平均长度通常小于该等价类中所有频繁模式的平均长度,更小于该等价类中所有闭合模式的平均长度。在面向分类的应用中,根据最小描述长度原则可知对生成器模式的挖掘比频繁模式和闭合模式的挖掘更有意义。本项目将重点研究面向复杂数据(如序列数据和图数据)的生成器模式挖掘算法,并探讨生成器模式在病句检测、机器翻译、舆情分析和图像分类中的应用。由于存在"组合爆炸"问题,从复杂数据中挖掘生成器模式具有很高的计算复杂性。本项目的挑战性问题之一是如何设计高效的空间裁减策略和模式枚举框架以提高序列生成器模式和图生成器模式的挖掘效率。另外,如何定义可用于分类的、高质量的序列生成器模式和图生成器模式,以及设计可直接挖掘这类模式的高效算法并依此建立分类模型是本项目的另外一个重点研究内容。

项目摘要

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
3

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

DOI:10.7606/j.issn.1000-7601.2022.03.25
发表时间:2022
4

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

DOI:10.11999/JEIT210095
发表时间:2021
5

基于全模式全聚焦方法的裂纹超声成像定量检测

基于全模式全聚焦方法的裂纹超声成像定量检测

DOI:10.19650/j.cnki.cjsi.J2007019
发表时间:2021

王建勇的其他基金

批准号:61906127
批准年份:2019
资助金额:21.00
项目类别:青年科学基金项目
批准号:81801271
批准年份:2018
资助金额:21.00
项目类别:青年科学基金项目
批准号:60573061
批准年份:2005
资助金额:25.00
项目类别:面上项目
批准号:61272088
批准年份:2012
资助金额:80.00
项目类别:面上项目
批准号:21801145
批准年份:2018
资助金额:25.00
项目类别:青年科学基金项目
批准号:11605102
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目
批准号:61532010
批准年份:2015
资助金额:290.00
项目类别:重点项目

相似国自然基金

1

序列大数据复杂情景模式发现算法研究

批准号:61602438
批准年份:2016
负责人:敖翔
学科分类:F0607
资助金额:20.00
项目类别:青年科学基金项目
2

面向复杂数据的粒计算知识发现方法研究

批准号:61363047
批准年份:2013
负责人:黎敏
学科分类:F0607
资助金额:45.00
项目类别:地区科学基金项目
3

面向动态复杂数据的粒化模型与知识发现研究

批准号:61502213
批准年份:2015
负责人:钱文彬
学科分类:F0607
资助金额:19.00
项目类别:青年科学基金项目
4

面向大规模复杂数据的多粒度知识发现关键理论与方法研究

批准号:61379101
批准年份:2013
负责人:丁世飞
学科分类:F0607
资助金额:75.00
项目类别:面上项目