面向相似性数据的自适应世系管理关键技术研究

基本信息
批准号:60973018
项目类别:面上项目
资助金额:31.00
负责人:杨晓春
学科分类:
依托单位:东北大学
批准年份:2009
结题年份:2012
起止时间:2010-01-01 - 2012-12-31
项目状态: 已结题
项目参与者:李芳芳,寇月,刘向宇,陈默,于长永,侯闯,李中博,郭庆,曲东
关键词:
数据库数据起源近似数据匹配世系管理
结项摘要

数据产生、并随着时间推移而演变的整个过程称为数据世系或数据溯源。数据世系管理对于用户理解数据的产生过程、确保数据的可重现、避免重复操作、对原始数据进行恢复等起到十分重要的作用。伴随着数据量的爆炸式增长,数据来源变得分散而广泛,导致数据具有来源多样性、粒度不统一、表示不一致性等特点。这些特点体现在数据具有一定程度的相似性,针对这些相似性数据进行世系管理变得更加复杂,具有挑战性。现有的世系管理技术对数据的上述特点支持不够,不具有自适应能力。项目旨在揭示相似性数据在产生和传递过程中的内在联系,为实现更加适合实际应用的世系管理提供重要的依据。主要研究内容包括:世系关系自适应抽取技术、世系关系的自动验证技术、动态存储管理技术、数据质量评价模型与相关算法研究。设计、实现和评价相关的算法, 争取在数据库理论和技术上取得一定的突破, 为今后的实际应用推广奠定坚实的基础。

项目摘要

项目研究面向相似性数据的自适应世系管理关键技术。数据世系管理对于用户理解数据的产生、确保数据的可重现、避免重复操作、原始数据恢复等起到十分重要的作用。伴随着数据量的爆炸式增长,数据来源变得分散而广泛,导致数据具有来源多样性、粒度不统一、表示不一致性等特点。这些特点体现在数据具有一定程度的相似性,针对这些相似性数据进行世系管理变得更加复杂,具有挑战性。现有的世系管理技术对数据的上述特点支持不够,不具有自适应能力。项目揭示了相似性数据在产生和传递过程间的内在联系,为实现更加适合实际应用的世系管理提供重要的依据。主要研究目标及内容包括:世系可表达性、世系自动抽取与验证技术、基于增量序列的世系存储技术、以及复杂世系查询技术。 设计、实现和评价相关的算法, 在数据库理论和技术上取得了一定的突破, 为今后的实际应用推广奠定坚实的基础。. 针对上述目标进行了相关研究工作,在基于领域知识的相似性衡量、近似谓词的自动选取问题、基于不同数据粒度的双亲映射关系抽取、世系关系的完整性表示、世系关系的可靠性验证、世系关系的完备性验证、支持非统一数据粒度的存储结构、世系压缩技术、版本实例化技术、数据质量评估模型、概率世系关系的溯源算法、基于数据质量的排序算法、世系质量评测算法等方面取得了多项研究成果。在国际、国内学术会议和期刊发表论文28篇,其中SCI收录5篇,EI收录18篇,ISTP收录5篇。代表性研究成果发表在国际顶级数据库会议ACM SIGMOD 2013、VLDB 2012和ICDE 2013上。并开发了一个面向email处理的自适应世系管理系统EmailTracer。在项目实施过程中,培养博士生1名,硕士生14名,本科生6名。主办国际会议workshop 3次,特邀报告3次,先后派22人次境外访学、国际交流或参加国际会议,邀请海内外专家学者15人次前来讲学。获得2次国际会议优秀论文,获得美国发明专利一项,申请中国发明专利一项。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
3

黄河流域水资源利用时空演变特征及驱动要素

黄河流域水资源利用时空演变特征及驱动要素

DOI:10.18402/resci.2020.12.01
发表时间:2020
4

基于ESO的DGVSCMG双框架伺服系统不匹配 扰动抑制

基于ESO的DGVSCMG双框架伺服系统不匹配 扰动抑制

DOI:
发表时间:2018
5

基于余量谐波平衡的两质点动力学系统振动频率与响应分析

基于余量谐波平衡的两质点动力学系统振动频率与响应分析

DOI:10.6052/1672⁃6553⁃2017⁃059
发表时间:2018

杨晓春的其他基金

批准号:31701022
批准年份:2017
资助金额:26.00
项目类别:青年科学基金项目
批准号:10461008
批准年份:2004
资助金额:18.00
项目类别:地区科学基金项目
批准号:60503036
批准年份:2005
资助金额:21.00
项目类别:青年科学基金项目
批准号:81102521
批准年份:2011
资助金额:22.00
项目类别:青年科学基金项目
批准号:81872936
批准年份:2018
资助金额:57.00
项目类别:面上项目
批准号:61173031
批准年份:2011
资助金额:58.00
项目类别:面上项目
批准号:81660166
批准年份:2016
资助金额:35.00
项目类别:地区科学基金项目
批准号:51478268
批准年份:2014
资助金额:78.00
项目类别:面上项目
批准号:81573453
批准年份:2015
资助金额:50.00
项目类别:面上项目

相似国自然基金

1

世系与数据协同隐藏关键技术研究

批准号:61772131
批准年份:2017
负责人:倪巍伟
学科分类:F0202
资助金额:61.00
项目类别:面上项目
2

面向多学科协作的数据世系建模及溯源关键问题研究

批准号:U1630115
批准年份:2016
负责人:卢暾
学科分类:A31
资助金额:62.00
项目类别:联合基金项目
3

面向Peta规模计算的自适应存储管理关键技术研究

批准号:60503042
批准年份:2005
负责人:刘仲
学科分类:F0207
资助金额:22.00
项目类别:青年科学基金项目
4

面向医疗健康大数据的半结构化数据管理关键技术研究

批准号:61702086
批准年份:2017
负责人:毕鑫
学科分类:F0202
资助金额:24.00
项目类别:青年科学基金项目