Classification of incomplete data is an important topic in pattern recognition field, but the classical methods working with probability usually have some limitations on modeling the uncertainty caused by missing attribute values. Evidential reasoning is expert at dealing with such uncertain information. In this proposal, generalized credal classification of incomplete data will be studied based on evidential reasoning, and it should be able to well characterize the uncertainty and reduce the error rate using meta-class. When the training information is sufficient, the multiple imputations and their weights of missing values will be estimated, and the corresponding multiple classification results will be weighted combined. Then the fast generalized credal classification method for incomplete data can be designed. When the training information is insufficient, the sequential test samples will be conditionally selected to add in training data set to improve the performance of classifier, and generalized credal classification of sequential incomplete data using fuzzy classification information of training data will be developed. The quantitative evaluation criteria of generalized credal classification will be introduced, and the optimization of parameters in the classifiers will be studied according to the criteria. These proposed methods will be tested and analyzed through experiments, and they will be applied in the multi-source information fusion target identification. This project will create a new direction of development for classification of incomplete data, and extend the application of evidential reasoning in the new field.
不完整数据分类是模式识别领域一项重要研究内容,传统方法利用概率对由属性缺失而造成的信息不确定性建模分析时存在一定局限。证据推理在处理这种不确定信息时具有独特优势,本项目拟在证据推理模型下研究不完整数据广义信任分类方法,通过引入复合类实现对不确定信息合理有效地建模分析,并降低误分率。当训练样本集信息完备时,估计缺失属性的多个可能填补值及权重,并对各填补值下对应的分类结果自适应加权融合,研究不完整数据快速广义信任分类方法;当训练样本集信息不完备时,为提高分类性能,选择利用测试样本动态补充完善训练样本集,进而研究基于训练样本模糊类别信息的序列不完整样本数据广义信任分类;构建广义信任分类性能量化评价指标体系,并基于此研究广义信任分类器参数自动优化方法。将提出的系列方法开展实验分析,并应用到多源信息融合目标识别中。项目研究将为不完整数据分类开辟一个新的发展方向,并将证据推理拓展到新的应用范围。
在目标识别中由于传感器性能局限等原因经常导致样本属性信息缺失,不完整数据分类已成为模式识别中一项重要研究内容。在本项目中,我们提出了一系列不完整数据广义信任分类方法,在幂集下引入了复合类(若干类的集合),允许目标以不同的基本信任值属于任意单类和相关的复合类。当训练知识充分时,面向大规模不完整数据提出了基于类中心的快速广义信任分类方法,利用各类中心向量分别估计缺失值并计算其权重,设计了加权融合算法对不同估计值下的多个分类结果融合识别。该方法能够显著降低错误率,合理揭示属性缺失造成的分类不精确性。在分类精度要求较高时,提出了基于K近邻的不完整数据广义信任分类器,利用样本K个近邻更精准地估计缺失值,采用两级融合方法对不同估计值对应的分类结果融合决策,从而提高分类准确率。当训练知识较为匮乏时,提出了半监督不确定数据动态广义信任分类方法,利用少量标记样本预测无标记样本类别模糊隶属度,选择高精度预测样本完善训练数据库,提升分类可靠性。研究还发现在应用中有些缺失属性对分类结果影响较小,有些较大,故提出了缺失值自适应填补不完整数据信任分类方法。根据现有属性对样本分类,如果分类结果明确,则直接输出,否则利用KNN和SOM技术填补缺失值进而分类,实验表明该方法能够有效提高分类效率。最后提出了广义信任分类性能评价方法,构建了兼顾错误风险和模糊度的信任分类统一效能函数,通过信任分类器参数优化能使综合效能达到最高。相关成果在超视距雷达目标航迹分类中进行了应用验证,提高了异常航路目标识别率,为态势评估提供了有力技术支撑。发表论文17篇,其中SCI 12篇(一区3篇,二区7篇),科学出版社专著1部,受理专利3项,获陕西省科学技术一等奖,举办了第四届国际信任函数理论及应用暑期学校暨前沿论坛,培养研究生8名,申请人任近似推理国际期刊(SCI二区)编委,第18-20届国际信息融合大会程序委员会委员,分会主席。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
基于多模态信息特征融合的犯罪预测算法研究
居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例
基于细粒度词表示的命名实体识别研究
F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度
面向不完整信息的多视图数据表示、恢复与学习
不完整信息的多粒度数据表示及其优化方法研究
缺失数据下广义线性模型的经验似然方法
带有不可忽略缺失数据的结构方程模型的统计分析及应用研究