基于辨别性模式的时间序列分类及其在可穿戴设备中的应用研究

基本信息
批准号:61702030
项目类别:青年科学基金项目
资助金额:25.00
负责人:原继东
学科分类:
依托单位:北京交通大学
批准年份:2017
结题年份:2020
起止时间:2018-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:刘海洋,张伟,李宏韬,邓罗丹,李尧,施沫寒
关键词:
分类辨别性模式时间序列数据挖掘算法可穿戴设备
结项摘要

The popularity of wearable devices produces a vast amount of time series data. Due to the restricted computing power and limited storage space of wearable devices, one of the main challenges faced by researchers is to analyze sensing time series online effectively, discovering discriminative patterns efficiently and classifying instances accurately. Based on the study of time series average sequence, this project focuses on building discriminative pattern based classifiers, improving their performances and interpretabilities at the same time. First, time series average sequence which can capture local discriminant characteristics will be estimated and studied. Second, algorithm that combines pattern discovery with average sequence while keeping a balance between its discrimination and efficiency will be researched. Last but not least, by using local weighting strategy and distinctive pattern based transformation method, the interpretability and classification efficiency of extended models are expected to be enhanced. The research of this project can establish classification models specifically for wearable devices, it also lays a good foundation for solving practical problems such as helping users to find out abnormal situations and warning, assisting healthcare workers to diagnose diseases and so on.

可穿戴设备的广泛应用产生了海量的时间序列数据。如何在可穿戴设备有限的计算能力和存储空间限制下,实时分析传感时间序列数据,发现其中的辨别性模式并精确分类是当前研究者所面临的主要挑战之一。本项目拟在研究时间序列均值序列的基础上,建立基于辨别性模式的分类器,提升分类模型的性能与可解释性。首先,研究如何求解能够捕获局部辨别性特征的时间序列均值序列;其次,研究如何将模式发现与均值序列相结合,同时保持模式辨别性与发现效率之间的平衡;最后,通过局部属性加权策略和基于辨别性模式的空间转换,提升模型的可解释性与分类效率。本项目的研究可以建立专门针对可穿戴数据的快速分类算法,同时也为解决诸如帮助用户发现异常情况并预警,辅助医疗工作者进行疾病诊断等实际问题奠定了良好基础。

项目摘要

可穿戴设备的广泛应用产生了海量的时间序列数据。如何在可穿戴设备有限的计算能力和存储空间限制下,分析传感时间序列数据,发现其中的辨别性模式并精确分类是当前研究者所面临的主要挑战之一。本项目在局部辨别性模式发现,流数据概念漂移检测,数据增强与对抗攻击等多个方面针对时间序列数据进行研究,以期提升分类模型的性能与可解释性。. 基于局部辨别性特征的时间序列分类算法具有分类速度快,准确率高,可解释性强等优点,也是本项目的研究重点。主要相关研究内容和成果包括提出基于Pairwise Shapelets的随机森林模型,根据局部加权DTW发现辨别性模式,当前最好的基于DTW的单分类器LSDTW,以及新的鉴别性特征字典构建算法等。对应研究论文已发表在CCF推荐的中英文期刊和会议和其他领域著名国际期刊上,如PAKDD 2018,CIKM 2019,KAIS,计算机学报,软件学报等。. 可穿戴设备所产生的时间序列数据具有不断演化,平稳或非平稳,概念漂移和概念重复等特点。为有效处理和适应此类数据,提出了基于模式的数据流贝叶斯分类器,基于图模型的概念发现与漂移检测算法,基于信息熵和JS散度的具有概念漂移检测机制的自适应集成算法等。对应研究论文已发表在国内外著名期刊上,如Neurocomputing,Computational Intelligence and Neuroscience等。. 针对深度模型的脆弱性,数据量不足等问题,研究了基于shapelets的局部扰动策略和基于离散傅里叶变换DFT的数据增强方法,前者通过添加不易察觉扰动信息干扰模型对原始序列的判断结果,从而帮助研究者发现模型的缺点进行改进;后者通过生成接近原始分布的时间序列数据,增强初始深度模型的分类准确率。两者均取得了当前最好的结果,论文已分别投稿至IEEE TNNLS和IJCAI2021。. 本项目共发表SCI/EI/CSCD检索期刊和会议论文共27篇,其中CCF推荐期刊或会议论文12篇。培养或协助指导2名博士和6名硕士研究生毕业,项目负责人晋升副教授。. 综上所述,该项目的主要进展和重要研究结果主要在于针对时间序列分类模型的可解释性,健壮性进行研究,扩展和丰富了相关问题的外延和内涵,对本领域的研究人员有一定的借鉴作用。应用前景方面,项目组成员正尝试将所提出算法用于脑电信号处理和智慧农业物联网数据。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
4

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

DOI:10.7606/j.issn.1000-7601.2022.03.25
发表时间:2022
5

针灸治疗胃食管反流病的研究进展

针灸治疗胃食管反流病的研究进展

DOI:
发表时间:2022

原继东的其他基金

相似国自然基金

1

时间序列的shapelets表示及其分类学习模式研究

批准号:61672086
批准年份:2016
负责人:王志海
学科分类:F0607
资助金额:62.00
项目类别:面上项目
2

基于α-VG分布的多元时间序列模型及其在金融建模中的应用研究

批准号:11361022
批准年份:2013
负责人:蒋文江
学科分类:A0603
资助金额:40.00
项目类别:地区科学基金项目
3

线粒体分子探针设计及其在细胞辨别分析中的应用研究

批准号:21775010
批准年份:2017
负责人:王卓
学科分类:B0405
资助金额:64.00
项目类别:面上项目
4

基于时间序列的因果推断及其在故障溯源中的应用

批准号:61873142
批准年份:2018
负责人:杨帆
学科分类:F0310
资助金额:67.00
项目类别:面上项目