Genomic variation has a great effect on evolution, population genetics, discovery of new disease causal or associated genes, personalized diagnosis and treatment, etc. The emergence of massive genomic variation data offers a marvelous opportunity for the life science research and modern medicine. In order to satisfy the urgent need of the genomic variation analysis in big data era, there is an urgent need for the theories and techniques of massive genomic variation data management which supports efficient storage and intelligent retrieval. .In view of lacking effective methods for large-scale genomic variation data management and intelligent analysis of biomedical knowledge, in this project, approaches for massive genomic variation data storage, schema mapping and queries based on MapReduce models are investigated. On this basis, solutions for ontology-based semantic queries over large-scale genomic variation data are provided. The implementation of this project will lay a foundation for intelligent managements of big biodata, and provide technical supports for the development of precision medicine.
基因组变异对于基因组进化、群体遗传学分析、疾病易感或致病基因的发现、个体化诊断与治疗等方面的研究有着重要的意义,海量基因组变异数据的出现为生命科学研究以及现代医疗提供了空前的发展机遇。为了有效应对爆炸式增长的基因组变异数据分析解读的现实需求,迫切需要研究面向海量基因组变异数据的大数据管理方法,提供高效的存储管理和智能化检索服务的能力。.本项目针对海量基因组变异数据难以管理、生物医学知识智能化分析不足的问题,重点研究海量基因组变异数据映射存储方法以及基于MapReduce的海量基因组变异数据查询方法,在此基础上给出基于生物医学本体的海量基因组变异数据语义查询解决方案。本项目的实施将为生物医学大数据智能化分析管理体系的建立奠定坚实的理论基础,同时也将为精准医疗提供强有力的技术支持。
基因组变异对于基因组进化、群体遗传学分析、疾病易感或致病基因的发现、个体化诊断与治疗等方面的研究有着重要的意义,海量基因组变异数据的出现为生命科学研究以及现代医疗提供了空前的发展机遇。为了有效应对爆炸式增长的基因组变异数据分析解读的现实需求,迫切需要研究面向海量基因组变异数据的大数据管理方法,提供高效的存储管理和智能化检索服务的能力。本项目针对海量基因组变异难以管理、生物医学知识智能化分析不足的问题,重点研究海量基因组变异数据映射存储方法以及基于MapReduce的海量基因组变异数据查询方法,在此基础上给出基于生物医学本体的海量基因组变异数据语义查询解决方案。本项目实施后,发表了一批高水平的研究成果,培养了多名专业人才,为生物医学大数据智能化分析管理体系的建立奠定坚实的理论基础,也为精准医疗提供强有力的技术支持。
{{i.achievement_title}}
数据更新时间:2023-05-31
桂林岩溶石山青冈群落植物功能性状的种间和种内变异研究
农业用地土壤重金属样本点数据精化方法——以北京市顺义区为例
玉米SPP基因家族的全基因组鉴定及表达分析
基于GEO数据库呼吸机相关性肺损伤小鼠基因芯片数据的生物信息学分析及关键基因验证
以TMV为模式建立基于宏基因组学的植物病毒检测方法
云计算环境下海量XML数据管理关键技术研究
低能耗海量数据管理理论与关键技术研究
海量众包数据管理的关键技术
基于协同标注的海量高维时间序列数据管理关键技术研究