传统的时间序列数据检索通常是在某种时间序列距离量度的基础上、以序列匹配的方式进行的。这种方式在应用于高维海量时间序列数据时存在一些问题:第一,受"维度灾难"的影响,很难有效地计算高维时间序列间的相似度;第二,现有的时间序列索引技术无法有效地索引高维时间序列,而简单的顺序扫描又会因为数据量大而耗时巨大;第三,QBE(Query-by-example)方式的时间序列数据检索由于用户通常没有查询实例而无法使用。为了解决高维时间序列检索所面临的这些难题,我们提出以协同标注和数据空间的方式管理海量高维时间序列的新思路。研究内容包括数据的自动标注、标注数据的非确定性和溯源关系管理、标注数据的高效索引、新的查询脚本语言设计、查询优化处理等关键技术问题。在此基础上搭建支持协同标注的海量高维时间序列数据管理系统原型。在系统工作的基础上,发表一批在国际上有影响力的高水平论文。
为了解决高维时间序列检索所面临的诸多难题,我们提出以协同标注和语义标注的方式管理海量高维时间序列。项目的研究重点放在了和数据标注、数据索引、时间序列数据查询与检索等相关的数据管理方面的研究工作上。其创新点更多的突出于通过标注数据、语义数据等来有效的抽象高维时间序列数据,并在标注数据基础上高效的检索海量规模的时间序列数据。项目的研究工作概括起来从以下方面取得了突破:1)对海量高维时间序列数据的压缩、索引及高效率的模式匹配;2)对包括时间序列在内的非结构化数据进行有效的语义标注与数据集成;3)对标注数据、语义数据进行索引和高性能的查询和检索。在项目执行期间,围绕项目内容发表了国际高水平期刊和会议论文10篇,其中SCI论文3篇,申请国内发明专利1项,形成两个原型系统:运动捕捉数据管理系统和Web数据语义标注集成系统。此外,还在国际会议WISE 2013上成功地举办了语义标注比赛。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
论大数据环境对情报学发展的影响
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
大规模标注RDF数据管理的关键技术研究
海量基因组变异数据管理关键技术研究
云计算环境下海量XML数据管理关键技术研究
云计算环境下基于图模型的海量RDF数据管理关键技术研究