面向复杂数据的生成器模式发现及其应用研究

基本信息

批准号：60873171

项目类别：面上项目

资助金额：28.00

负责人：王建勇

学科分类：

依托单位：清华大学

批准年份：2008

结题年份：2011

起止时间：2009-01-01 - 2011-12-31

项目状态：已结题

项目参与者：贺宇凯,吴昊,高传聪,张军,李淳,李燕

关键词：

复杂数据生成器模式数据挖掘模式发现

结项摘要

传统的频繁模式发现算法主要用于从给定的数据库中挖掘所有的频繁模式或闭合模式，而不能够用于生成器模式的发现。一个等价类中生成器模式的平均长度通常小于该等价类中所有频繁模式的平均长度，更小于该等价类中所有闭合模式的平均长度。在面向分类的应用中，根据最小描述长度原则可知对生成器模式的挖掘比频繁模式和闭合模式的挖掘更有意义。本项目将重点研究面向复杂数据（如序列数据和图数据）的生成器模式挖掘算法，并探讨生成器模式在病句检测、机器翻译、舆情分析和图像分类中的应用。由于存在"组合爆炸"问题，从复杂数据中挖掘生成器模式具有很高的计算复杂性。本项目的挑战性问题之一是如何设计高效的空间裁减策略和模式枚举框架以提高序列生成器模式和图生成器模式的挖掘效率。另外，如何定义可用于分类的、高质量的序列生成器模式和图生成器模式，以及设计可直接挖掘这类模式的高效算法并依此建立分类模型是本项目的另外一个重点研究内容。

项目摘要

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.12202/j.0476-0301.2022178

发表时间：2022

DOI：10.13199/j.cnki.cst.2020.07.010

发表时间：2020

DOI：10.11707/j.1001-7488.20210410

发表时间：2021

DOI：

发表时间：2017

DOI：10.19287/j.cnki.1005-2402.2019.09.028

发表时间：2019

王建勇的其他基金

批准号：61906127

批准年份：2019

资助金额：21.00

项目类别：青年科学基金项目

批准号：81801271

批准年份：2018

资助金额：21.00

项目类别：青年科学基金项目

批准号：60573061

批准年份：2005

资助金额：25.00

项目类别：面上项目

批准号：61272088

批准年份：2012

资助金额：80.00

项目类别：面上项目

批准号：21801145

批准年份：2018

资助金额：25.00

项目类别：青年科学基金项目

批准号：11605102

批准年份：2016

资助金额：20.00

项目类别：青年科学基金项目

批准号：61532010

批准年份：2015

资助金额：290.00

项目类别：重点项目

相似国自然基金

序列大数据复杂情景模式发现算法研究

批准号：61602438

批准年份：2016

负责人：敖翔

学科分类：F0607

资助金额：20.00

项目类别：青年科学基金项目

面向复杂数据的粒计算知识发现方法研究

批准号：61363047

批准年份：2013

负责人：黎敏

学科分类：F0607

资助金额：45.00

项目类别：地区科学基金项目

面向动态复杂数据的粒化模型与知识发现研究

批准号：61502213

批准年份：2015

负责人：钱文彬

学科分类：F0607

资助金额：19.00

项目类别：青年科学基金项目

面向大规模复杂数据的多粒度知识发现关键理论与方法研究

批准号：61379101

批准年份：2013

负责人：丁世飞

学科分类：F0607

资助金额：75.00

项目类别：面上项目

面向复杂数据的生成器模式发现及其应用研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

复杂系统科学研究进展

智能煤矿建设路线与工程实践

基于PROSAIL模型和多角度遥感数据的森林叶面积指数反演

区块链技术:从数据智能到知识自动化

基于物联码的工业产品信息追溯方法研究

王建勇的其他基金

神经网络中的连接机制研究

小G蛋白RIT2对胞内α-突触核蛋白水平的调控作用及其对帕金森病发病的影响

频繁子图的高效挖掘算法及其应用研究

构建面向Web的、以实体为中心的知识库的关键技术研究

萘酐-咔唑“杂交”的多位点可修饰双光子荧光染料的设计、合成及应用研究

非线性演化方程的孤子-椭圆周期波解及其准孤立子行为研究

大规模关联数据管理的关键技术研究

相似国自然基金