基于GPU的搜索引擎数据组织和分布技术研究

基本信息
批准号:61373018
项目类别:面上项目
资助金额:75.00
负责人:刘晓光
学科分类:
依托单位:南开大学
批准年份:2013
结题年份:2017
起止时间:2014-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:王刚,任明明,童健聪,敖耐勇,李鑫,王海栋,梁津,李天龙,孙鹏宇
关键词:
GPU搜索引擎压缩缓存
结项摘要

As one type of many-core CPU, GPU has been used in many high performance computing applications. But GPU can not be applied widely for lacking of high throughput computing applications. Since there are millions of queries will be treated by search engine every day, search engine is computing and I/O intensive application. The object of this project is to optimize search engine I/O ability based GPU+SSD. We plane to do some works about data organization , data processing and data distribution . We will give a index compression algorithm which no online decompression; using search engine's log to improve the data distribution; hardware(GPU, SSD) aware cache algorithm. These are also the innovative ideas of this project. Since many cores are the future trend. our works will provide common technologies for internet enterprise.

作为一种新型众核处理器,GPU已经被广泛应用到高性能计算领域。但对I/O密集型应用,还缺少好的GPU示范应用。搜索引擎每秒需要处理成千上万个查询请求,是I/O和计算都密集的典型应用。课题工作的目标是在新的GPU+SSD硬件平台上,结合搜索引擎的特点,优化搜索引擎的I/O处理能力。具体来说,课题计划从数据组织、数据处理和数据分布三个方面着手:设计一种不需解压直接计算的索引压缩算法;设计利用搜索日志信息的数据划分方法;设计针对GPU和SSD等硬件特点的Cache算法。这也是课题工作的主要创新之处。众核处理器是CPU的未来发展方向,课题的工作成果可以作为众核平台上互联网应用的共性技术支持。

项目摘要

本课题针对搜索引擎这一典型的互联网应用,设计适合GPU等新硬件平台特点的搜索引擎基础数据结构和算法,以充分发挥GPU等硬件的计算、存储和I/O能力。针对上述目标,具体来说,课题研究了适合搜索引擎的基于上下文无关文法的索引组织方法,发表在SIGIR 2016;设计适合GPU的数据调度算法,发表在ICA3PP 2017、ICPADS 2017上;设计了面向SSD特征的搜索引擎list缓存算法,系列成果发表在SIGIR2013、TOIS 2014上。在课题研究期间,共发表相关学术论文17篇。其中,CCF A类会议或期刊7篇,CCF B类会议或期刊6篇。培养博士生2名,硕士生7名,完成了课题预期研究目标。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

DOI:10.11999/JEIT150995
发表时间:2016
2

MSGD: A Novel Matrix Factorization Approach for Large-Scale Collaborative Filtering Recommender Systems on GPUs

MSGD: A Novel Matrix Factorization Approach for Large-Scale Collaborative Filtering Recommender Systems on GPUs

DOI:
发表时间:2018
3

Ordinal space projection learning via neighbor classes representation

Ordinal space projection learning via neighbor classes representation

DOI:https://doi.org/10.1016/j.cviu.2018.06.003
发表时间:2018
4

非饱和重塑与结构性黄土等向压缩试验离散元分析

非饱和重塑与结构性黄土等向压缩试验离散元分析

DOI:10.11779/CJGE2019S2031
发表时间:2019
5

活塞式航空煤油直喷发动机的爆震控制

活塞式航空煤油直喷发动机的爆震控制

DOI:10.13224/j.cnki.jasp.2018.03.016
发表时间:2018

刘晓光的其他基金

批准号:31070125
批准年份:2010
资助金额:30.00
项目类别:面上项目
批准号:30840081
批准年份:2008
资助金额:10.00
项目类别:专项基金项目
批准号:30100143
批准年份:2001
资助金额:18.50
项目类别:青年科学基金项目
批准号:81472041
批准年份:2014
资助金额:72.00
项目类别:面上项目
批准号:42002207
批准年份:2020
资助金额:16.00
项目类别:青年科学基金项目
批准号:30670030
批准年份:2006
资助金额:25.00
项目类别:面上项目
批准号:61872201
批准年份:2018
资助金额:63.00
项目类别:面上项目
批准号:30370954
批准年份:2003
资助金额:23.00
项目类别:面上项目
批准号:61070014
批准年份:2010
资助金额:31.00
项目类别:面上项目
批准号:31240046
批准年份:2012
资助金额:15.00
项目类别:专项基金项目
批准号:81901555
批准年份:2019
资助金额:20.00
项目类别:青年科学基金项目
批准号:31601904
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目
批准号:71303117
批准年份:2013
资助金额:19.00
项目类别:青年科学基金项目
批准号:51602018
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目

相似国自然基金

1

搜索引擎在线算法的GPU优化关键技术研究

批准号:61070014
批准年份:2010
负责人:刘晓光
学科分类:F0204
资助金额:31.00
项目类别:面上项目
2

基于通用GPU的RDF流数据推理架构和核心算法

批准号:61672377
批准年份:2016
负责人:冯志勇
学科分类:F0202
资助金额:63.00
项目类别:面上项目
3

基于GPU的FRB搜寻技术研究

批准号:11503075
批准年份:2015
负责人:托乎提努尔
学科分类:A1902
资助金额:22.00
项目类别:青年科学基金项目
4

CPU-GPU耦合架构下数据库连接技术研究

批准号:61402041
批准年份:2014
负责人:栾华
学科分类:F0202
资助金额:23.00
项目类别:青年科学基金项目