基于关键词抽取的云环境密文检索研究

基本信息
批准号:61671030
项目类别:面上项目
资助金额:58.00
负责人:杨震
学科分类:
依托单位:北京工业大学
批准年份:2016
结题年份:2020
起止时间:2017-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:Xia Hu,才智,庄俊玺,王坚,曹怀虎,姚应哲,李超阳,陈伟桐,李怡德
关键词:
可搜索加密机制关键词标引检索风险分析查询扩展云环境检索
结项摘要

With the rapid growth of internet usage and decentralized computing, storage and management characteristics of modern information services have start a new trend, with more and more sensitive information being transferred to the cloud. Unfortunately, the mutual distrust between the data owner and the cloud service provider, data usually have to be encrypted prior to out-sourcing for data privacy and to protect data from unsolicited accesses, which presents the enormous challenge of using data effectively to retrieve documents. Since the encrypted document in cloud is incomprehensible, which creates great challenges in cloud retrieval model definition, keyword index building, and searchable encryption scheme design. To remedy these challenges, in this work, after a review of current research literature, we first build a cloud information retrieval framework and formalize its retrieval risk formally. Secondly, since the existing searchable encryption schemes suffered from the inappropriate keywords selection, a new keyword detection measure based on the spatial distribution of a particular word is proposed. Thirdly, we modify the current searchable encryption scheme to support the state-of-art information retrieval methods, such as vector space model, probabilistic modeling, and language modeling, while the current solution only support simple equality queries on encrypted data that provide a slight better result than random selection. Besides, a financial cloud information retrieval system and the corresponding corpus will be built based on the above theoretical research and deployed for practical uses. This project, having promising academic and practical values, will promote the modernization and scientific level of the modern information retrieval technologies.

云计算深刻改变了现代信息服务的计算、存储和管理模式,当前愈来愈多的信息选择存储到远端云服务器中。但用户和云服务提供商之间缺乏互信,用户数据不得不先加密后存储到云中。正是因为文档在云端以加密形式存储,使得传统检索模型都因无法理解文档而失效,云信息检索面临极大的挑战。为了解决这一难题,首先,课题研究基于贝叶斯风险模型的云信息检索风险建模。通过将云检索视为特殊的信息检索问题,在贝叶斯风险模型框架下实现云检索的最小风险建模。在此基础上,研究适用于云计算场景的云文档关键词分析、抽取与索引建立机制。基于词语空间分布和统计特性结合的方法实现极高精度的云文档关键词抽取。再次,研究支持极端短文本检索的可检索加密协议设计。在保证用户隐私和信息安全的基础上,实现支持极端短文本检索的可检索加密协议设计,提高云信息检索性能。最后,课题将构建一个金融云信息检索原型验证系统,并建立可为本类研究提供样本的信息检索语料库。

项目摘要

云计算深刻改变了现代信息服务的计算、存储和管理模式,当前愈来愈多的信息选择存储到远端云服务器中。但用户和云服务提供商之间缺乏互信,用户数据不得不先加密后存储到云中。正是因为文档在云端以加密形式存储,使得传统检索模型都因无法理解文档而失效,云信息检索面临极大的挑战。经过四年的努力,课题组严格按照项目申请计划,顺利完成项目预定研究目标,获得以下成果:1. 课题研究基于贝叶斯风险模型的云信息检索风险建模。通过将云检索视为特殊的信息检索问题,在贝叶斯风险模型框架下实现云检索的最小风险建模。2. 在此基础上,研究适用于云计算场景的云文档关键词分析、抽取与索引建立机制。基于词语空间分布和统计特性结合的方法实现极高精度的云文档关键词抽取。3. 再次,研究支持极端短文本检索的可检索加密协议设计。在保证用户隐私和信息安全的基础上,实现支持极端短文本检索的可检索加密协议设计,提高云信息检索性能。此外,针对典型的云计算场景,即工业互联网场景开展标准化工作。项目负责人作为主编,提出了国际标准《信息技术 安全技术 工业互联网平台安全参考模型》,在2018年国际网络安全标准化工组ISO/IEC JTC1 SC27会议上成功立项为SP研究项目,并在2019年法国会议上成为新工作提案(NP24392),是我国在工业互联网领域立项的第一个国际标准。团队开发出多款信息内容检索系统,包括文本时间摘要系统、微博推荐系统、突发事件分析系统等,参加国际文本检索会议(TREC)获得佳绩,在TREC 2019大会的Incident Streams Track上获得A轮性能单项指标第一的优异成绩。目前项目已在IEEE Transactions on Vehicular Technology、IEEE Transactions on Neural Networks and Learning Systems、电子学报等刊物上发表论文11篇,其中SCI/EI收录10/10篇,被他人引用120余次;主编国际标准(草案)1项,国家标准1项目;申请国家发明专利17项,其中授权4项,登记软件著作权5项;主办IEEE ICIVC’20国际会议;部分研究成果获2017年吴文俊人工智能科学技术奖一等奖。已经培养教授/博导1名,副教授1名,博士后1名;入选长城学者1名;培养研究生19名(其中4名博士生、15名硕士生)。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

农超对接模式中利益分配问题研究

农超对接模式中利益分配问题研究

DOI:10.16517/j.cnki.cn12-1034/f.2015.03.030
发表时间:2015
4

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
5

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018

杨震的其他基金

批准号:60971129
批准年份:2009
资助金额:30.00
项目类别:面上项目
批准号:21572009
批准年份:2015
资助金额:80.00
项目类别:面上项目
批准号:81000344
批准年份:2010
资助金额:10.00
项目类别:青年科学基金项目
批准号:61173017
批准年份:2011
资助金额:55.00
项目类别:面上项目
批准号:81302122
批准年份:2013
资助金额:23.00
项目类别:青年科学基金项目
批准号:20832003
批准年份:2008
资助金额:160.00
项目类别:重点项目
批准号:20272003
批准年份:2002
资助金额:21.00
项目类别:面上项目
批准号:31660265
批准年份:2016
资助金额:32.00
项目类别:地区科学基金项目
批准号:20242002
批准年份:2002
资助金额:4.50
项目类别:专项基金项目
批准号:31270992
批准年份:2012
资助金额:70.00
项目类别:面上项目
批准号:21632002
批准年份:2016
资助金额:300.00
项目类别:重点项目
批准号:21072006
批准年份:2010
资助金额:36.00
项目类别:面上项目
批准号:20472002
批准年份:2004
资助金额:40.00
项目类别:面上项目
批准号:11902347
批准年份:2019
资助金额:22.00
项目类别:青年科学基金项目
批准号:39070644
批准年份:1990
资助金额:2.50
项目类别:面上项目
批准号:21871012
批准年份:2018
资助金额:66.00
项目类别:面上项目
批准号:61001178
批准年份:2010
资助金额:23.00
项目类别:青年科学基金项目
批准号:21372016
批准年份:2013
资助金额:95.00
项目类别:面上项目
批准号:51876101
批准年份:2018
资助金额:57.00
项目类别:面上项目
批准号:30800215
批准年份:2008
资助金额:19.00
项目类别:青年科学基金项目
批准号:11205055
批准年份:2012
资助金额:22.00
项目类别:青年科学基金项目
批准号:91013004
批准年份:2010
资助金额:65.00
项目类别:重大研究计划
批准号:21302129
批准年份:2013
资助金额:25.00
项目类别:青年科学基金项目
批准号:81370953
批准年份:2013
资助金额:70.00
项目类别:面上项目
批准号:20142004
批准年份:2001
资助金额:3.50
项目类别:专项基金项目
批准号:81670220
批准年份:2016
资助金额:60.00
项目类别:面上项目
批准号:81660056
批准年份:2016
资助金额:37.00
项目类别:地区科学基金项目
批准号:61671252
批准年份:2016
资助金额:60.00
项目类别:面上项目
批准号:61271335
批准年份:2012
资助金额:83.00
项目类别:面上项目
批准号:50976054
批准年份:2009
资助金额:44.00
项目类别:面上项目
批准号:51778076
批准年份:2017
资助金额:62.00
项目类别:面上项目
批准号:29677007
批准年份:1996
资助金额:9.00
项目类别:面上项目
批准号:51176090
批准年份:2011
资助金额:60.00
项目类别:面上项目

相似国自然基金

1

基于视觉语义的云环境密文图像检索研究

批准号:61772561
批准年份:2017
负责人:秦姣华
学科分类:F0206
资助金额:64.00
项目类别:面上项目
2

云计算环境中的密文图像检索方法研究

批准号:61672294
批准年份:2016
负责人:夏志华
学科分类:F0205
资助金额:63.00
项目类别:面上项目
3

云存储环境下基于内容的海量密文语音检索技术研究

批准号:61862041
批准年份:2018
负责人:张秋余
学科分类:F0211
资助金额:40.00
项目类别:地区科学基金项目
4

云计算环境中面向内容的密文检索关键技术研究

批准号:61772283
批准年份:2017
负责人:付章杰
学科分类:F0205
资助金额:16.00
项目类别:面上项目