随着互联网的飞速发展,每天都有海量文本视频数据涌现出来等待人们对其进行自动、实时、在线分析整理,比如监控系统中的物体和人的跟踪、股票数据的实时分析等。这些问题部分可由机器学习和模式识别中的在线学习算法来解决。目前现有的在线学习方法主要处理线性问题,然而实际应用中得到的数据一般都高度复杂并且大部分为非线性的,现有线性在线学习算法很难满足实际应用需求。故本项目提出适用于这个问题的非线性在线学习解决方案,同时由于网络中的视频和文本数据皆为高维数据,因而如何在在线学习框架下同时处理高维数据是本项目要解决的另外一个问题。本项目拟自动在线寻找数据的低维子空间,在此空间对数据的统计信息进行估计,同时在此低维子空间里设计基于该统计信息的非线性在线更新策略,并对提出的算法进行严格的理论分析,最后将研究成果应用到现实文本视频数据分析。
本项目提出了能解决大数据分类问题的三个算法并解决实际应用问题,具体如下:(1)概率边界的非线性算法——设计有效数据预处理方法,定义相似度度量预测新数据;(2)基于感知器的非线性融合算法(简称Fuseptron)——将相似数据融合成一个新数据,提出新数据生成模型,然后使用hinge-loss来设计分类器;(3)领域自适应算法——基于输入-输出空间类标记的一致性,改变训练样本的分布使其尽量向测试样本的分布靠拢,提高分类器的准确性和鲁棒性,该方法应在遥感数据分类。在自然基金的资助下,主持和参与两项大数据相关的国际项目,并申请IEEE杂志JSTARS“遥感大数据”专题担任客座主编。
{{i.achievement_title}}
数据更新时间:2023-05-31
粗颗粒土的静止土压力系数非线性分析与计算方法
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
中国参与全球价值链的环境效应分析
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于细粒度词表示的命名实体识别研究
基于在线机器学习的组合算法交易策略研究
基于在线判别学习的鲁棒视觉跟踪算法研究
神经网络中在线学习算法的收敛性
基于深度学习的遥感时间序列在线异常检测算法