查询引导的位置敏感哈希

基本信息
批准号:61772563
项目类别:面上项目
资助金额:65.00
负责人:冯剑琳
学科分类:
依托单位:中山大学
批准年份:2017
结题年份:2021
起止时间:2018-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:Wilfred Ng,王炜,黄强,王桢,邓卓彬,马桂洪
关键词:
查询引导近似最近邻检索随机投影分布式计算位置敏感哈希
结项摘要

Approximate Nearest Neighbor Search is a fundamental problem in processing complex data objects and has extensive applications in various domains, such as database, data mining and computational geometry. Locality-Sensitive Hashing (LSH) and its variants are the most influential solution of the Approximate Nearest Neighbor Search problem in high-dimensional space. Traditionally, an LSH scheme partitions data objects into buckets before any query arrives, and hence a query object and its real neighbor can be partitioned into different buckets. To overcome this limitation, we have newly developed a query-aware LSH scheme named QALSH. In this project, based on our current research progresses, on the one hand we plan to conduct further studies on query-aware LSH from both theoretical and algorithmic perspectives , using the Approximate Nearest Neighbor Search problem as the underlying motivation. On the other hand, we plan to leverage query-aware LSH to solve the Approximate Furthest Neighbor Search and Approximate Closest Pair Search problems, which are closely related to the Approximate Nearest Neighbor Search. In addition, we will study how to effectively implement distributed computing of LSH so that we can easily handle similarity search over massive high-dimensional data. Studies on LSH schemes not only hold great scientific significance in basic theories of computer science, data science and high-dimensional computational geometry, but also enjoy substantial potential in advancing intelligent applications of big data in China.

近似最近邻检索是复杂数据对象处理中的一个基本问题,在数据库、数据挖掘以及高维计算几何等领域有着广泛的应用。位置敏感哈希及其变体是目前最有影响的高维近似最近邻检索机制。传统上,位置敏感哈希在任何查询到来之前已经将数据对象分桶,因此可能将查询对象与它的近邻分进不同的桶。为了克服这一局限,我们新近发展了查询引导的位置敏感哈希机制QALSH。本项目就是希望在我们的现有研究基础上,一方面,针对近似最近邻检索,对查询引导的位置敏感哈希理论与算法开展更深入的研究。另一方面,将查询引导的位置敏感哈希机制用来解决密切相关的近似最远邻检索与近似最近对检索。此外,我们还将研究如何高效地实现位置敏感哈希的分布式计算,以便支持海量高维数据的相似性检索。研究位置敏感哈希技术,不仅在计算机科学,数据科学,高维计算几何等等学科的基础理论方面具有重大科学意义,而且在推动中国大数据智能应用方面具有极其广阔的发展前景。

项目摘要

近似最近邻检索是复杂数据对象处理中的一个基本问题,在数据库、数据挖掘以及高维计算几何等领域有着广泛的应用。位置敏感哈希及其变体是目前最有影响的高维近似最近邻检索机制。传统上,位置敏感哈希在任何查询到来之前已经将数据对象分桶,因此可能将查询对象与它的近邻分进不同的桶。为了克服这一局限,我们新近发展了查询引导的位置敏感哈希机制QALSH: 以查询为锚点动态地进行分桶。本项目在原始QALSH的基础上,一方面,针对近似最近邻检索问题,对查询引导的位置敏感哈希理论与算法开展了更深入的研究。另一方面,将查询引导的位置敏感哈希机制用来解决密切相关的高维相似性检索问题。目前我们在以下方面取得重要研究进展:.1. 将仅仅针对欧式距离(即l2距离)的原始QALSH扩展到解决任意lp距离(0 < p ≤ 2)下的近似最近邻检索问题;.2. 将QALSH用来解决高维欧式空间中的近似最远邻检索问题;.3. 将QALSH用来解决高维欧式空间中的近似最大内积检索问题;.4. 将QALSH与关系数据库系统(PostgreSQL)内核进行耦合;.5. 将QALSH基于非易失性内存进行优化实现;.6. 将QALSH进行单机多核并行化。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

多能耦合三相不平衡主动配电网与输电网交互随机模糊潮流方法

多能耦合三相不平衡主动配电网与输电网交互随机模糊潮流方法

DOI:10.13334/j.0258-8013.pcsee.190276
发表时间:2020
2

智能煤矿建设路线与工程实践

智能煤矿建设路线与工程实践

DOI:10.13199/j.cnki.cst.2020.07.010
发表时间:2020
3

具有随机多跳时变时延的多航天器协同编队姿态一致性

具有随机多跳时变时延的多航天器协同编队姿态一致性

DOI:10.7641/CTA.2018.70969
发表时间:2018
4

“阶跃式”滑坡突变预测与核心因子提取的平衡集成树模型

“阶跃式”滑坡突变预测与核心因子提取的平衡集成树模型

DOI:10.16031/j.cnki.issn.1003-8035.2019.05.04
发表时间:2019
5

带球冠形脱空缺陷的钢管混凝土构件拉弯试验和承载力计算方法研究

带球冠形脱空缺陷的钢管混凝土构件拉弯试验和承载力计算方法研究

DOI:10.14006/j.jzjgxb.2018.0676
发表时间:2021

冯剑琳的其他基金

批准号:60303030
批准年份:2003
资助金额:7.00
项目类别:青年科学基金项目
批准号:60970043
批准年份:2009
资助金额:30.00
项目类别:面上项目

相似国自然基金

1

基于位置敏感哈希的图像语义检索技术研究

批准号:61301232
批准年份:2013
负责人:彭天强
学科分类:F0113
资助金额:24.00
项目类别:青年科学基金项目
2

基于哈希的海量高维数据近似最近邻查询研究

批准号:61472298
批准年份:2014
负责人:崔江涛
学科分类:F0202
资助金额:80.00
项目类别:面上项目
3

LBS中连续查询的位置匿名研究

批准号:60903169
批准年份:2009
负责人:林欣
学科分类:F0205
资助金额:17.00
项目类别:青年科学基金项目
4

检索引导的多模态数据稀疏化降维及哈希技术

批准号:61572298
批准年份:2015
负责人:张化祥
学科分类:F0605
资助金额:67.00
项目类别:面上项目