多标记数据的粒计算理论与算法研究

基本信息
批准号:61272095
项目类别:面上项目
资助金额:81.00
负责人:李德玉
学科分类:
依托单位:山西大学
批准年份:2012
结题年份:2016
起止时间:2013-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:白鹤翔,翟岩慧,李艳红,康向平,胡建龙,路娟,李华,郝锦华,廖健
关键词:
概念格粗糙集多标记数据粒计算
结项摘要

Multi-lable data is an important data type which is associated with many application fields such as Web information processing, text categorization, bioinformatics, video semantic annotation, information retrieval. Granular computing is one of the most active research fields in artificial intelligence, especially in intelligent information processing. It has a special significance for modeling, analysis and computation based on large-scale complex data. This project devotes itself to the theory and algorithm research on multi-lable data. The main contents include: (1) minimal representation topology structure learning of data; (2) uncertainty measure and attribute reduction algorithm; (3) granulating data based on coverage clustering; (4) classification priority of multi-lable data; (5) data concept structure and its visualization. This project will systematacially develop the theory and method of granular computing for modeling, analysis and computation of multi-label data, and exploit an experimental system for multi-label data modeling and analyzing. The research results of this project will enrich the granular computing theory, expand the data scope for it, explore the new way for complex information processing, and has the very important theoretical significance and practical application value for data mining and knowledge discovery.

多标记数据是密切关联与Web信息处理、文本分类、生物信息学、视频语义标注、信息检索等众多应用领域的一类重要数据类型。粒计算是当前人工智能,特别是智能信息处理领域最为活跃的研究方向,对大规模复杂数据的建模、分析与计算任务具有重要意义。本课题旨在研究多标记数据粒计算理论与算法。主要内容包括:(1)数据的极小表示拓扑结构学习;(2)不确定性度量与属性约简算法;(3)数据的覆盖聚类粒化;(4)多标记数据分类优先性;(5)数据的概念结构及其可视化。系统地发展多标记数据建模、分析与计算的粒计算理论与方法,开发一个可用于多标记数据建模与分析的实验系统。本项目研究成果将丰富粒计算理论,拓展粒计算的数据适用范围,探索复杂信息处理的新途径,对数据挖掘和知识发现的研究有重要的理论意义和应用价值。

项目摘要

多标记数据是密切关联于文本分析、多媒体分析、生物信息学、社会网络、智能商务等众多领域的重要数据类型。按照项目合同书的要求,项目组围绕构建多标记数据的粒计算模型与高效算法进行了系统而深入的研究工作,取得了一系列重要研究进展。在多标记数据分类方面,提出了一种基于粗糙集理论的属性约简方法,给出了一种可以计算所有互补决策约简的区分矩阵方法和互补决策约简的启发式算法,建立了一种新的多标记稳健模糊粗糙分类模型。在多标记数据特征选择方面,给出了一种针对多标记数据的变精度属性约简方法,建立了新约简的判定定理和区分矩阵方法,构造了基于邻域粗糙集的多标记分类任务的特征选择算法,提出一个基于粗糙集的多标记专属特征学习算法,探索了两种基于标记间相关性度量的核函数构造方法。在模糊粗糙集理论方面,定义了二型模糊粗糙集和粒二型模糊集,讨论了二型模糊粗糙集的粒结构,建立了勾股模糊多粒度粗糙集模型,定义了对偶犹豫模糊多粒度粗糙集的模型,并证明了常见性质,建立了双论域区间犹豫模糊多粒度粗糙集的概念。在数据推理的逻辑基础方面,首先研究了决策蕴涵的语义和语构特征;接着引入了决策前提的概念,并据此生成了一个决策蕴涵规范基,证明了该决策蕴涵集的完备性、无冗余性和最优性;还研究了基于决策背景的决策蕴涵规范基;提出了基于最小生成子和真前提的决策蕴涵规范基的生成方法;另外,还研究了模糊决策蕴涵的语义和语构特征。在理论成果的应用方面,基于模糊粗糙集,研究了文本情感的多标签分类、汽车产品评价的多方面情感挖掘。另外,基于条件概率的空间相关性判别,提出了一种归一化的空间相关性度量指标,能够挖掘出更多有价值的空间相关性信息。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

温和条件下柱前标记-高效液相色谱-质谱法测定枸杞多糖中单糖组成

温和条件下柱前标记-高效液相色谱-质谱法测定枸杞多糖中单糖组成

DOI:10.3724/ SP.J.1123.2019.04013
发表时间:2019
3

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
4

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022
5

格雷类药物治疗冠心病疗效的网状Meta分析

格雷类药物治疗冠心病疗效的网状Meta分析

DOI:10.12092/j.issn.1009-2501.2018.03.010
发表时间:2018

李德玉的其他基金

批准号:60573074
批准年份:2005
资助金额:22.00
项目类别:面上项目
批准号:61672331
批准年份:2016
资助金额:62.00
项目类别:面上项目
批准号:60970014
批准年份:2009
资助金额:31.00
项目类别:面上项目
批准号:10772019
批准年份:2007
资助金额:40.00
项目类别:面上项目

相似国自然基金

1

基于标记概念监督的多标记粒计算理论与算法研究

批准号:61672331
批准年份:2016
负责人:李德玉
学科分类:F0201
资助金额:62.00
项目类别:面上项目
2

多标记数据的多粒度粗糙计算理论与算法研究

批准号:61806133
批准年份:2018
负责人:李华
学科分类:F0601
资助金额:22.00
项目类别:青年科学基金项目
3

基于粒计算的多模态多标记数据分类建模研究

批准号:61672272
批准年份:2016
负责人:林耀进
学科分类:F0607
资助金额:62.00
项目类别:面上项目
4

基于粒计算的海量数据挖掘理论与高效算法研究

批准号:60573068
批准年份:2005
负责人:王国胤
学科分类:F06
资助金额:23.00
项目类别:面上项目