基于累积残余信息的高维高冗余信号特征选择与提取方法研究

基本信息

批准号：61673059

项目类别：面上项目

资助金额：16.00

负责人：孙磊

学科分类：

依托单位：北京理工大学

批准年份：2016

结题年份：2017

起止时间：2017-01-01 - 2017-12-31

项目状态：已结题

项目参与者：杨杰,聂青,南圣玉,徐静影,韩冰洋,张真真,秦坤,王备山

关键词：

线性判别分析相关分析鉴别向量

结项摘要

The processing of high dimensional and redundant data is growing ubiquitous with fast development of information technology. To deal with the "curse of dimensionality", a major approach is to replace the original data by a set of discriminant features namely feature selection or feature extraction, which is getting popular in pattern recognition and machine learning societies. Shannon mutual information measure provides an information theoretic means to measure the relevance among variables. Shannon mutual information is expected to be adopted for relevant measurement since this information measure contains high order statistics. However, it is seldom adopted in high dimensional application because of the estimation difficulty of joint probability density function in high dimensional case. A novel information measure based on the cumulative residual density function (CRDF), instead of the probability density function (PDF), is proposed in this project. Based on this proposed information measure, a feature selection method and a feature extraction method are to be subsequently studied. The CRDF based information measure contains high order statistics while it does not depend on the estimation of PDF. Consequently, it is suitable to extract and select features in high dimensional space where its application model, algorithms and performance will be addressed by this project. Because of the increasing interests of dealing with high dimensional and redundant data in many applications, the results obtained from this project are expected to promote the progresses in those applications including machine leaning, information theoretic analysis, and high dimensional signal processing.

高维高冗余的数据处理问题在现实应用中广泛存在。通过特征选择或特征提取，选择出有辨别力的特征子集，是处理此类问题的重要方法，也是模式识别和机器学习等领域的研究热点。信息论中香农互信息包含了变量间的高阶描述，常被用做相关性的度量，但在高维处理中因联合概率密度估计非常困难，甚至无法得到，难以应用于高维数据。本项目将研究一种基于累积残余分布函数的信息度量方法，以及基于累积残余信息度量的特征选择与提取方法。该方法既可以提供比互相关函数等二阶统计量更丰富的高阶描述，又避免了香农互信息在高维信号处理中难以估计的问题。课题将针对基于累积残余信息的高维高冗余信号特征选择与提取方法的模型和实现算法等问题进行初步研究。课题的研究成果对于信息论理论、高维高冗余信号处理方法以及机器学习方法等的研究，具有较广的理论意义和实用价值。

项目摘要

本项目（基于累积残余信息的高维高冗余信号特征选择与提取方法研究，61673059）为一年期研究项目（原申请为4年期项目），研究用于特征选择和特征提取的累积残余互信息度量指标函数，以及初步探索基于累积残余互信息的特征选择的方法和算法。.本项目的研究目标是基于累积残余分布函数，给出一种不依赖于概率密度估计、可以应用于特征选取的描述标签—多个变量的互信息度量，初步给出采用这个信息度量的特征选择与提取的算法。本项目按照预期计划，已经完成研究目标的主要内容。我们具体研究了最大互熵函数，最小误差熵函数在机器学习和信号处理中的应用，研究了样本统计量稳定性在模式识别中的应用，重点针对信息度量在机器学习和信号处理等的应用方面，取得了多项研究成果。在一年研究周期中，已经发表了3篇SCI检索论文，4篇国际会议论文，并有1篇论文获得国际会议最佳论文奖。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：

DOI：10.17521/cjpe.2019.0351

发表时间：2020

DOI：10.16285/j.rsm.2019.1280

发表时间：2019

DOI：10.19713/j.cnki.43-1423/u.t20201185

发表时间：2021

DOI：

发表时间：2018

孙磊的其他基金

批准号：31100002

批准年份：2011

资助金额：23.00

项目类别：青年科学基金项目

批准号：31900527

批准年份：2019

资助金额：24.00

项目类别：青年科学基金项目

批准号：61902107

批准年份：2019

资助金额：18.00

项目类别：青年科学基金项目

批准号：31800667

批准年份：2018

资助金额：25.00

项目类别：青年科学基金项目

批准号：21403211

批准年份：2014

资助金额：25.00

项目类别：青年科学基金项目

批准号：51904338

批准年份：2019

资助金额：26.00

项目类别：青年科学基金项目

批准号：81202316

批准年份：2012

资助金额：23.00

项目类别：青年科学基金项目

批准号：81000326

批准年份：2010

资助金额：20.00

项目类别：青年科学基金项目

批准号：81602890

批准年份：2016

资助金额：18.00

项目类别：青年科学基金项目

批准号：51907043

批准年份：2019

资助金额：26.00

项目类别：青年科学基金项目

批准号：81303214

批准年份：2013

资助金额：23.00

项目类别：青年科学基金项目

批准号：81300511

批准年份：2013

资助金额：23.00

项目类别：青年科学基金项目

批准号：61904031

批准年份：2019

资助金额：24.00

项目类别：青年科学基金项目

批准号：50701016

批准年份：2007

资助金额：22.00

项目类别：青年科学基金项目

批准号：61301220

批准年份：2013

资助金额：23.00

项目类别：青年科学基金项目

相似国自然基金

面向高维混合数据的信息粒化与特征选择研究

批准号：61662023

批准年份：2016

负责人：舒文豪

学科分类：F0607

资助金额：38.00

项目类别：地区科学基金项目

基于特征聚类的高维混合属性数据特征选择方法

批准号：61806131

批准年份：2018

负责人：贾红

学科分类：F0603

资助金额：25.00

项目类别：青年科学基金项目

基于流形学习的高光谱遥感图像空间-光谱多特征提取与选择

批准号：61401317

批准年份：2014

负责人：张乐飞

学科分类：F0113

资助金额：27.00

项目类别：青年科学基金项目

面向多源高维数据流的在线特征选择与分类方法研究

批准号：61673152

批准年份：2016

负责人：胡学钢

学科分类：F0605

资助金额：61.00

项目类别：面上项目

基于累积残余信息的高维高冗余信号特征选择与提取方法研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

玉米叶向值的全基因组关联分析

涡度相关技术及其在陆地生态系统通量研究中的应用

粗颗粒土的静止土压力系数非线性分析与计算方法

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

硬件木马:关键问题研究进展及新动向

孙磊的其他基金

中国兰属植物内生细菌群落多样性研究

TM9SF4调控非小细胞肺癌细胞凋亡机制研究

具有多种良好密码学性质的旋转对称布尔函数的研究

通过定向进化和半理性设计扩展酰基转移酶DutH底物谱并探索其机理

计算筛选应用于固态敏化太阳能电池中的钙钛矿材料

含锡有色金属炼渣中锡的选冶联合高效回收基础和应用研究

2型甲酰肽受体调控M2型巨噬细胞极化的分子机制及其在炎症反应中的作用

人调节性T细胞在人源化糖尿病鼠中的免疫调节及抗糖尿病作用

miRNA-204在慢性应激诱导的早期生精细胞凋亡中的作用及机制研究

含风储联合系统的输电系统恢复协同优化决策理论与方法

中药整体质量评价中一种新的替代对照品技术“双标多测法”的建立研究

中国人群SHBG基因及其多态性在妊娠期糖尿病发生发展中的分子机制研究

图形化场致发射电子源的全溶液法制备及电子发射调控研究

液氨介质中复合金属纳米微粒的制备及性能研究

基于多源生物数据的长非编码RNA预测方法研究

相似国自然基金