In metabolomics study, mass spectral library searching technique is one of the most widely used analytical tool for compound identification. With the size of some commercial mass spectral libraries has been increased remarkably in recent year, the computational time and identification performance is two important criteria to measure mass spectral library searching technique. In this research, it can be expected to carry out the following research works: 1) Through molecular space-structure similarity and multi-source molecular fingerprint technique, a large Mass Spectrum Similarity dataset is created for further deep learning model training; 2) A effective deep hashing model is created based on N-tuplet loss and hard example mining technique, the created model can be used to improve molecular identification accuracy and decrease the computational time of molecular comparison simultaneously ; 3) An end to end deep prediction model is created based on dilated convolution technique and a large molecular sub-structure dataset. When the molecule is not collected in mass spectral library, the model can predict the molecular sub-structure effectively.
在代谢组学研究中,质谱库搜索技术是被用来对分子进行定性识别是一种重要方法。近年来,随着商用质谱库数据的不断增大,计算时间和识别性能是衡量质谱库搜索技术的重要标准。本项目中,拟开展以下研究工作:1)基于分子空间结构相似性和多源分子指纹技术,构建一个大规模质谱相似度数据集,为进一步训练深度学习模型使用; 2)基于N-元组排序损失和困难样本挖掘技术,构建一种有效的深度哈希映射模型,通过该模型不仅能够减少分子比对时间同时也能够增加分子的识别精度;3) 基于一维空洞卷积技术和大规模分子子结构数据集,构建一种端到端的深度预测模型,在质谱库未收录该分子时,能够根据质谱数据进行有效的分子子结构预测。
质谱库搜索技术是被用来对分子进行定性识别是一种重要方法。近年来,随着商用质谱库数据的不断增大,计算时间和识别性能是衡量质谱库搜索技术的重要标准。本项目当前主要研究内容如下:1)从NIST质谱数据库中抽取了质谱数据和对应的分子结构文件,并通过分子结构文件计算其分子指纹,并计算分子指纹的相似度和对应质谱相似度,从而根据不同应用需求构建了对应数据集;2)基于深度空间注意力机制构建了一种新的端到端的哈希框架,该框架能够有效地将质谱和图像数据转换成二进制编码,从而能提高库检索速度;此外,无监督嵌入技术也能够有效提高库检索速度,因此,基于质谱嵌入技术对其下游任务如库检索任务做了初步探索;3)基于图卷积网络和分子嵌入技术,从分子结构预测对应质谱;基于质谱嵌入技术获得致密向量,并结合深度学习技术预测对应分子指纹;4)将比例积分微分(PID)控制器作为随机梯度下降(SGD)的学习率调度器,该方法能对网络训练时的学习率进行自动调节。5)在完成基金研究任务的同时,还致立于将深度学习技术应用于脑机接口、工业缺陷检测和气象应用等领域。. 目前在国外重要学术期刊和国际会议上已发表高水平SCI/EI 论文9篇,其中JCR一区TOP期刊论文3篇,CCF A类会议一篇,另外,国内核心期刊6篇,目前在投SCI源期刊论文1篇,已接收SCI源期刊论文2篇。申请专利两项。目前项目已资助毕业硕士生14名,正资助硕士研究生15名。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于改进LinkNet的寒旱区遥感图像河流识别方法
萃取过程中微观到宏观的多尺度超分子组装 --离子液体的特异性功能
"多对多"模式下GEO卫星在轨加注任务规划
非牛顿流体剪切稀化特性的分子动力学模拟
现代优化理论与应用
基于深度学习的个性化搜索技术研究
基于多组学先验信息的串联质谱数据库搜索方法研究及应用
基于反转数据库搜索估算质谱鉴定肽段/蛋白概率新方法
基于曲面深度学习的高速三维人脸测量技术研究