Similarity measurement is a key and fundamental problem in Artificial Intelligence and it is crucial to the performance of many algorithms. Thus, it will influence mankind to discover valuable information from massive data. The recently developed similarity learning technique aims to learn similarity information from data, thus to improve algorithm performance. Nowadays, the inherent complex structures of big data raise a big challenge for similarity learning. This project aims to do comprehensive research on this topic by utilizing knowledge from machine learning, optimization, and deep learning domains. Specifically, to tackle existing structure information loss issue, we plan to investigate new kernel-based similarity learning models with similarity preserving capability; then to address the instability issue of kernel method, we will propose a similarity learning method with a novel multiple kernel learning strategy; to solve the limited representation ability issue of kernel method, we will further study similarity learning framework based on deep neural networks. Consequently, by integrating similarity learning with specific tasks, we can enhance the solutions of some machine learning tasks, such as clustering, semi-supervised learning. In summary, this study will have significant theoretical contributions and broad application prospects, and its results will benefit many fields in Artificial Intelligence.
相似度测量是人工智能领域的一个核心和基础问题,对诸多算法的性能起着决定性的作用,从而影响人类从海量数据中挖掘有价值信息。近几年发展起来的相似度学习方法旨在从数据中自动地学习出相似度关系,从而提高相应算法的精度。当前大数据所固有的结构复杂特点给相似度学习带来了严峻的挑战。本项目将结合机器学习、优化、深度学习等领域的理论与方法,深入研究复杂结构数据的相似度学习及其应用问题。针对当前算法容易造成数据结构信息丢失的问题,重点研究基于核方法的相似度保持的新模型;继而针对核方法不稳定问题,研究基于新的多核学习的相似度学习算法;最后针对核方法表示能力有限的问题,研究基于深度神经网络的相似度学习框架。最终,通过相似度学习与具体任务相结合的联合学习,来提高相应算法在诸如聚类、半监督学习等机器学习任务上的表现。该研究具有重要的理论价值和广泛的实际前景,其成果将可能对人工智能领域诸多课题产生重要影响。
相似度测量是人工智能的一个基础问题,现有技术无法适应真实场景中的复杂数据。项目组针对复杂结构数据的相似度学习问题进行了系统深入的研究,分别提出了基于核方法的、基于神经网络的、基于图滤波技术的三类方法,解决了真实数据面临的嘈杂、多源异构、规模大等关键问题,并成功应用在聚类、分类、降维等机器学习核心任务上。基于研究成果,共发表标注基金资助文章33篇,包括人工智能领域顶级期刊IEEE TCyb 2篇、IEEE TIP 1篇、IEEE TKDE 1篇;CCF-A类国际会议NeurIPS、AAAI、IJCAI、Multimedia、CVPR 论文9篇,并申请国家发明专利8项,超额完成任务。这些成果也获得了国内外同行的认可,三年引用800余次,已经初步取得一定的影响力。在本项目资助下,培养研究生8名和本科生13名,本科生参与发表15篇论文。总的来说,项目组在面向复杂数据的相似度学习方法与应用等方面均取得了较好的成果,为人工智能技术的落地奠定了基础。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
低轨卫星通信信道分配策略
自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例
内点最大化与冗余点控制的小型无人机遥感图像配准
面向复杂数据的稀疏相似度学习方法及其应用
基于相似度学习的异构数据聚类算法研究及其应用
多模态对象的相似度学习方法及其应用研究
适应大数据处理的概率相似度学习研究