新型化学小分子表征方法及其在人工智能驱动的药物发现中的应用

基本信息
批准号:81803434
项目类别:青年科学基金项目
资助金额:21.00
负责人:杨欣
学科分类:
依托单位:四川大学
批准年份:2018
结题年份:2021
起止时间:2019-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:王译伟,黄深振,付琪,李越山
关键词:
特征向量分子表征人工智能理论化学成药性评估
结项摘要

Drug development pipeline inefficiency has called for more novel solutions and cutting-edge technologies. Artificial intelligence (AI)-based methods including different machine- and deep-learning algorithms, provide new opportunities for the drug discovery. The core and key issue in AI-powered small molecule drug discovery is how to encode chemical compounds effectively. Various molecular representation methods have been developed in the past decades, but they all suffer from varying degrees of defects or problems in the characterization of molecules. In earlier studies, we developed a new molecular representation strategy called GAN-FV (GAN-based Feature Vector), by constructing the S-Codec, a SMILES codec under adversarial paradigm. Although the predictive performance on discriminating hERG blockers from non-blockers built by GAN-FV is encouraging, it still needs to be improved in reflecting the chemical characteristics of molecules. Based on the previous research, this project will firstly develop and optimize the existing S-Codec model to fully dig, learn and extract the internal features, then employ quantum chemical methods and Monte Carlo simulations to systematically analyze the chemical features related to various types of environment and introduce them into the GAN-FV, and finally develop a new type of molecular representation which can simultaneously contain sufficient structural and chemical information. We will use this molecular representation to construct two types of predictive models that are important in early druggability evaluation, with an intent to lay a solid foundation for further building a AI-based service platform for drug discovery and druggability evaluation.

当前小分子药物研发已进入瓶颈期,而人工智能(AI)技术的发展为小分子药物研发带来新的机遇。在AI驱动的小分子药物研发中,如何对小分子进行有效表征是核心和关键问题。目前已有的表征方法在编码分子特征方面仍存在诸多问题或缺陷,这严重阻碍了AI在药物发现中的应用。本课题组在前期工作中,通过构建对抗范式下的SMILES编码解码模型,发展出在药代动力学性质预测上具有良好效果的分子表征GAN-FV,但其反映的分子化学特征信息还有所缺失。本项目拟在此基础上,首先完善和优化现有编码解码模型以充分挖掘并提取内部特征,然后利用理论化学方法计算氢键、静电作用等七类环境相关化学特征,并将其引入GAN-FV中,最终发展出同时包含丰富的结构、化学特征信息的分子表征新策略,进而基于此表征构建出hERG心脏毒性和脂水分配系数的高精度预测模型。本项目的研究将有效解决基于AI的药物发现中的分子表征问题,进一步推动该领域的发展。

项目摘要

创新药物研发面临成本高、周期长、成功率低等多重挑战。近年来,以深度学习为代表的人工智能技术的快速发展为计算机辅助的药物设计带来了新的希望与动力。深度学习网络的突破和网络架构的成功应用,可以一定程度上解决传统药物设计方法准确率低的缺点,大幅度减少寻找具有潜在特性药物的时间和成本,提高药物设计和优化的成功率。然而,由于创新药物研发的独特性,基于深度神经网络的药物设计方法的成功落地应用还面临着诸多难点,包括如何建立一个适合于深度学习的化学分子表征方法;如何构建快速、准确、高通量的蛋白-小分子能量预测,并基于构建高精度的打分函数、准确预测小分子与蛋白质靶标结合位点以及相互作用模式、计算结合亲和力以及计算配体结合/解除结合动力学等。为此,本项目从以下方面展开研究:. 在前期研究的基础上,结合数据驱动的深度学习方法与基于物理学原理的量子化学方法,构建了基于前馈神经网络架构的考虑局部环境的原子环境表征向量。通过学习分子的三维结构与能量之间的潜在关系,实现对化学体系在复杂化学环境中快速准确、密度泛函水平的高精度能量预测。我们基于此分子表征,结合数据驱动的深度学习方法与基于物理学原理的量子化学方法,针对1,3-偶极环加成反应构建高精度能量预测模型,从而对此类反应实现了在复杂化学环境中快速准确的、密度泛函水平的高精度能量预测,并且基于此训练好的神经网络模型,我们还能进一步得到1,3-偶极环加成反应的化学反应机理。这为后续我们开展高效地密度泛函水平的蛋白-小分子能量预测模型打好了坚实的基础。. 已有结果表明,这一方法具有一定的应用潜力,但是考虑到蛋白质与小分子配体所涉及的原子数目较大,在直接使用时需要较多的计算资源,使用效率和应用范围仍受到一定的限制。因此,项目负责人及课题组目前仍还在进一步结合深度神经网络与量子化学或分子力学方法展开深入攻关。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于一维TiO2纳米管阵列薄膜的β伏特效应研究

基于一维TiO2纳米管阵列薄膜的β伏特效应研究

DOI:10.7498/aps.67.20171903
发表时间:2018
2

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
3

结核性胸膜炎分子及生化免疫学诊断研究进展

结核性胸膜炎分子及生化免疫学诊断研究进展

DOI:10.3760/cma.j.issn.1674-2397.2020.05.013
发表时间:2020
4

PI3K-AKT-mTOR通路对骨肉瘤细胞顺铂耐药性的影响及其机制

PI3K-AKT-mTOR通路对骨肉瘤细胞顺铂耐药性的影响及其机制

DOI:
发表时间:2021
5

原发性干燥综合征的靶向治疗药物研究进展

原发性干燥综合征的靶向治疗药物研究进展

DOI:10.13376/j.cbls/2021137
发表时间:2021

杨欣的其他基金

批准号:51008316
批准年份:2010
资助金额:20.00
项目类别:青年科学基金项目
批准号:61872417
批准年份:2018
资助金额:65.00
项目类别:面上项目
批准号:71701013
批准年份:2017
资助金额:17.00
项目类别:青年科学基金项目
批准号:31402095
批准年份:2014
资助金额:24.00
项目类别:青年科学基金项目
批准号:51303184
批准年份:2013
资助金额:25.00
项目类别:青年科学基金项目
批准号:21876210
批准年份:2018
资助金额:65.00
项目类别:面上项目
批准号:20305013
批准年份:2003
资助金额:22.00
项目类别:青年科学基金项目
批准号:60905009
批准年份:2009
资助金额:18.00
项目类别:青年科学基金项目
批准号:21577178
批准年份:2015
资助金额:65.00
项目类别:面上项目
批准号:30900453
批准年份:2009
资助金额:20.00
项目类别:青年科学基金项目
批准号:61573182
批准年份:2015
资助金额:66.00
项目类别:面上项目
批准号:61901390
批准年份:2019
资助金额:27.00
项目类别:青年科学基金项目
批准号:81270667
批准年份:2012
资助金额:70.00
项目类别:面上项目
批准号:81701077
批准年份:2017
资助金额:20.00
项目类别:青年科学基金项目
批准号:71704061
批准年份:2017
资助金额:18.00
项目类别:青年科学基金项目
批准号:81501971
批准年份:2015
资助金额:18.00
项目类别:青年科学基金项目
批准号:61502188
批准年份:2015
资助金额:23.00
项目类别:青年科学基金项目

相似国自然基金

1

集成化学习系统及其在人工智能中的应用

批准号:69075016
批准年份:1990
负责人:洪家荣
学科分类:F0603
资助金额:4.00
项目类别:面上项目
2

天然多糖的化学改性及其在高分子药物中的应用

批准号:38870295
批准年份:1988
负责人:谢世杉
学科分类:H3402
资助金额:2.00
项目类别:面上项目
3

蛋白糖基化的深入研究及其在新型药物和诊断技术发现中的应用

批准号:91853120
批准年份:2018
负责人:谭忠平
学科分类:B0702
资助金额:60.00
项目类别:重大研究计划
4

新型硅烯化合物的合成及其在小分子活化中的应用

批准号:21472032
批准年份:2014
负责人:李志芳
学科分类:B0101
资助金额:86.00
项目类别:面上项目