面向数据密集型计算的局部模式挖掘与搜索方法

基本信息
批准号:61702161
项目类别:青年科学基金项目
资助金额:26.00
负责人:姜涛
学科分类:
依托单位:河南财经政法大学
批准年份:2017
结题年份:2020
起止时间:2018-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:张墨华,赵贞贞,谢佳,付楠,李晓光,付聪聪
关键词:
生物信息学大数据挖掘数据密集型计算基因表达分析复杂查询处理
结项摘要

There are several factors that affect the local pattern mining and search in data-intensive computing environments, which are execution performance, direct search rather than mining, and constrained query of local pattern. To make current local pattern processing technologies or systems much more efficient, effective and reliable, this project thus proposes methods from three key aspects, such as the computing framework of parallel mining, indexing structure and model, and query method. Firstly, this project gives a computing framework to reduce the data amount of transfer, and designs mining method for multi-type local patterns. Secondly, to directly search local pattern from the raw intensive data, it proposes a query method based on a double-layer index, which can improve the analysis performance of intensive data. Thirdly, it introduces constrained query methods based on domain knowledge, and utilizes the reptile technology to extract domain knowledge, which can alleviate the situation that lacks of domain knowledge. In summary, this project provides a practical solution for the efficient analysis of intensive data in data intensive computing environments.

本项目针对密集型计算环境下局部模式的挖掘与搜索问题,围绕局部模式并行挖掘的执行性能问题、避开批量挖掘而直接从源数据中搜索出符合特定要求的局部模式的问题、以及基于领域知识的局部模式约束查询问题,从设计高效的数据挖掘、索引结构与查询方法三方面入手,开展以基因表达数据为代表的密集型数据中局部模式挖掘、索引与搜索方法的研究。首先提出密集型计算环境下减少数据交互量的计算框架,在此基础上设计挖掘多种类型的局部模式的并行算法。其次,为了从源数据中直接搜索符合特定要求的多类型的局部模式,提出基于双层索引的查询方法,提升了密集型数据的分析效率。第三,提出利用领域知识的约束查询方法,以提升查询的相关性,在此基础上,提出了基于爬虫技术的领域知识提取方法,缓解了领域知识匮乏的现状。本项目将为密集型数据的有效分析提供切实可行的解决方案,具有重要的理论意义和应用价值。

项目摘要

局部模式的挖掘与搜索已经成为生物信息学与数据库领域的研究热点。本项目针对针对密集型计算环境下局部模式的挖掘与搜索问题,研究了高效的数据挖掘、索引结构与查询方法等方案。取得了一些研究成果,发表学术论文10篇,出版个人专著1本,申请专利1项。项目代表性成果包括:(1)提出密集型计算环境下减少数据交互量的计算框架,在此基础上设计挖掘多种类型的局部模式的并行算法;(2)提出基于前缀树的索引方法pfTree,给出利用行和列表头来搜索正、负和时延OPSM的优化技术pIndex,通过在线共享查询技术来加速频繁的搜索。(3)综述了包含局部模式的约束查询在内的基因表达数据中局部模式的挖掘方法研究综述。这些研究成果为密集型数据的有效分析提供切实可行的解决方案,具有重要的理论意义和应用价值。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DOI:10.3969/j.issn.1673-1689.2021.10.004
发表时间:2021
4

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
5

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018

姜涛的其他基金

批准号:31602159
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目
批准号:51234008
批准年份:2012
资助金额:290.00
项目类别:重点项目
批准号:41401561
批准年份:2014
资助金额:25.00
项目类别:青年科学基金项目
批准号:81273324
批准年份:2012
资助金额:70.00
项目类别:面上项目
批准号:20773144
批准年份:2007
资助金额:29.00
项目类别:面上项目
批准号:41476032
批准年份:2014
资助金额:97.00
项目类别:面上项目
批准号:51374052
批准年份:2013
资助金额:80.00
项目类别:面上项目
批准号:81800907
批准年份:2018
资助金额:21.00
项目类别:青年科学基金项目
批准号:20473105
批准年份:2004
资助金额:24.00
项目类别:面上项目
批准号:51874355
批准年份:2018
资助金额:60.00
项目类别:面上项目
批准号:51607034
批准年份:2016
资助金额:19.50
项目类别:青年科学基金项目
批准号:21272032
批准年份:2012
资助金额:80.00
项目类别:面上项目
批准号:51174051
批准年份:2011
资助金额:66.00
项目类别:面上项目
批准号:61702402
批准年份:2017
资助金额:25.00
项目类别:青年科学基金项目
批准号:81000722
批准年份:2010
资助金额:20.00
项目类别:青年科学基金项目
批准号:71162021
批准年份:2011
资助金额:34.00
项目类别:地区科学基金项目
批准号:51877033
批准年份:2018
资助金额:56.00
项目类别:面上项目
批准号:11901178
批准年份:2019
资助金额:23.00
项目类别:青年科学基金项目
批准号:21273253
批准年份:2012
资助金额:80.00
项目类别:面上项目
批准号:81500986
批准年份:2015
资助金额:17.50
项目类别:青年科学基金项目
批准号:51874077
批准年份:2018
资助金额:60.00
项目类别:面上项目
批准号:81070062
批准年份:2010
资助金额:32.00
项目类别:面上项目
批准号:41771400
批准年份:2017
资助金额:63.00
项目类别:面上项目
批准号:51778569
批准年份:2017
资助金额:60.00
项目类别:面上项目
批准号:31300672
批准年份:2013
资助金额:22.00
项目类别:青年科学基金项目
批准号:59604002
批准年份:1996
资助金额:7.00
项目类别:青年科学基金项目
批准号:51075305
批准年份:2010
资助金额:32.00
项目类别:面上项目
批准号:30571656
批准年份:2005
资助金额:21.00
项目类别:面上项目
批准号:71562026
批准年份:2015
资助金额:31.00
项目类别:地区科学基金项目
批准号:51574082
批准年份:2015
资助金额:63.00
项目类别:面上项目
批准号:51108410
批准年份:2011
资助金额:25.00
项目类别:青年科学基金项目
批准号:40806019
批准年份:2008
资助金额:20.00
项目类别:青年科学基金项目
批准号:U1162114
批准年份:2011
资助金额:50.00
项目类别:联合基金项目
批准号:11404177
批准年份:2014
资助金额:26.00
项目类别:青年科学基金项目

相似国自然基金

1

面向数据密集型计算的概率图模型构建与推理

批准号:61163003
批准年份:2011
负责人:刘惟一
学科分类:F0202
资助金额:49.00
项目类别:地区科学基金项目
2

数据密集型计算环境下的空间场景相似性搜索研究

批准号:41371386
批准年份:2013
负责人:郭旦怀
学科分类:D0114
资助金额:63.00
项目类别:面上项目
3

生物基因表达数据中局部模式的挖掘与研究

批准号:60903081
批准年份:2009
负责人:季丽萍
学科分类:F0213
资助金额:17.00
项目类别:青年科学基金项目
4

数据密集型计算环境下的数据管理方法与技术

批准号:61033007
批准年份:2010
负责人:李战怀
学科分类:F0202
资助金额:230.00
项目类别:重点项目