With the development of electronic devices and the Internet, large scale data are avaible in various areas. People usually need to find similiar samples from a large scale dataset when given a query so that people could make further analysis. In adidtion, due to different data sources, collecting technologies or extracting methods, a large number of them have complex components, e.g., multi-modal, multi-label or multi-instance, etc. Hashing methods have shown their effectiveness for searching large scale data, especially those learning based hashing methods. Motivated by this, this project tries to design effective machine learning based hashing models for such complex data. Specifically, the main content of this research project includes: 1. Designing effective hashing methods for multi-modal data which could make multi-modal or cross-modal data searching, respectively; 2. Designing hashing methods for multi-label data which considering the ambiguity and high dimension of data; 3. Designing hashing methods for multi-instance data; 4. Designing efficient hashing models which could make full use of unlabled data. Finally, a platform/system based on hashing methods will be implemented for effcient search of these data.
随着网络和电子设备的快速发展,各个行业所积累的数据急剧增加。面对如此海量的数据,人们往往需要根据给定样本找出数据集中与样本相似的数据,从而对数据做进一步分析和处理。另外,因为数据源、数据采集技术或者数据的抽象处理等原因,目前有很大一部分数据具有一定的复杂性,如有的是多模态的,有的是多义性的(也称为多标记的),有的是多示例的等。而哈希学习方法是能够实现大规模数据检索的有效方法。为此,项目将开展面向该类复杂数据的哈希学习方法研究,具体研究内容包括: 1.研究在分别考虑多模态数据检索和交叉模态检索条件下的多模态哈希学习方法;2.研究在考虑数据多义性以及数据高维性条件下的多义性数据哈希学习方法;3.研究在考虑示例级别和包级别情况下的多示例数据哈希学习方法;4.研究在考虑充分利用未标记数据条件下的哈希学习方法。最后,项目在对所提出哈希学习方法进行验证的基础上,搭建面向该类复杂数据检索的原型系统。
在网络和电子设备快速发展的背景下,数据规模急剧增长,在对数据进行组织和管理过程中,往往需要对数据进行检索。而很多数据往往具有一定的复杂结构,比如多模态的、多示例的等,如何对这些数据进行快速检索成为重要的研究热点。在此背景下,本课题开展了基于哈希学习的数据检索研究,完成了原定研究计划,取得的研究成果包括:(1)提出了基于字典学习的交叉模态检索哈希方法;(2)提出了面向交叉模态检索的有监督离散哈希方法;(3)提出了基于自组织网络的哈希学习方法;(4)针对多模态多标记数据,提出了有效的哈希学习方法;(5)针对数据的快速检索,提出了基于图能够对数据进行检索和分类的哈希学习方法;(6)针对多示例数据提出了有效的哈希方法;(7)实现了实验原型平台。项目组成员在项目资助下(2016.01-2016.16)发表论文7篇,包括MM,CIKM,MMM,Neurocomputing等期刊和会议;另外,申请国家发明专利一项;培养了多名研究生。
{{i.achievement_title}}
数据更新时间:2023-05-31
温和条件下柱前标记-高效液相色谱-质谱法测定枸杞多糖中单糖组成
基于多模态信息特征融合的犯罪预测算法研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
面向流式大数据检索的增量哈希学习方法研究
面向复杂结构数据的哈希方法研究及其应用
面向复杂多视图数据的潜在哈希学习研究
面向大数据跨媒体检索的多模态哈希学习方法研究