Statistical-machine-learning-based microarray classification is one of the popular research fields in the post-genome era. New problems which are challenging the learning theory emerge as the study develops in depth, e.g., selecting genes in groups, selecting the multiple regularized parameters, performing multi-class classification. By developing the new support vector machines and the solving algorithms, this project is devoted to resolving these challenges and provides the original theory achievements for analyzing the gene expression data of the liver regeneration in rats. Specifically, the project focuses on the following problems: 1.Construct the adaptive support vector machines which can select genes in group; 2. Describe the grouping effect of multi-class gene selection in mathematical language and provide the reasonable biologic explanations; 3. Develop the piecewise linear solution path algorithms for multiple regularized parameters and analyze the corresponding computational complexity; 4. Perform experiments for microarray classification and seek the important genes which can influence the liver regeneration in rats.
基于统计机器学习的微阵列分类是后基因时代的热门研究方向之一。本项目通过发展新型支持向量机模型和求解算法,以期解决该领域最近涌现出的群体基因选择、多正则化参数调整和多类分类等问题,为进一步开展大鼠肝再生基因表达数据分析提供具有原创性的理论成果。具体地,本项目主要开展以下几个方面的研究:1.构建适用于群体基因选择的自适应支持向量机;2.用数学语言刻画多类分类的群体基因选择效应,并给出合理的生物学解释;3.发展分段线性的多正则化参数解路算法,分析其计算的复杂性;4.进行微阵列分类实验,寻求影响大鼠肝再生的重要基因。
该项目针对具有“小样本,超高维”属性的微阵列数据,建立了基因的重要性评估机制和噪声抑制机制,提出了几种自适应支持向量机和自适应稀疏回归模型,分析了他们的基因选择性能,发展了其快速求解算法,并将其应用于癌症、大鼠肝再生等复杂疾病与生物过程的分类与关键基因筛选。. 具体地,本项目在以下几个方面取得了重要进展:. 1、针对微阵列二分类问题,提出了一种基于网络分析的群lasso特征分群方法,并将其应用于大鼠肝再生细胞增殖相关基因的筛选。提出了自适应双正则化支持向量机、加权双正则化支持向量机、自适应logistic回归等统计机器学习模型,用数学语言刻画了他们的自适应群体基因选择性能并给出生物学解释,发展了多正则化参数的解路算法。这些方法可成功应用于急性白血病、结肠癌、肺癌等癌症的诊断及基因选择,也可筛选出具有良好pathway关系的肝再生相关基因。. 2、针对微阵列多类分类问题,提出了多项式回归和自适应多项式回归模型,分别用数学语言刻画了其多类群体基因选择和自适应群体基因选择性能并给出了生物学解释。所提回归模型能成功地把大鼠肝再生过程进行分类,并筛选出具有良好pathway关系的相关基因。. 3、在利用基因表达谱数据进行辨识局部协调控关系、以及复杂系统的数据驱动建模与控制等方面,也取得了一些相关的研究成果。
{{i.achievement_title}}
数据更新时间:2023-05-31
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
监管的非对称性、盈余管理模式选择与证监会执法效率?
基于LASSO-SVMR模型城市生活需水量的预测
基于SSVEP 直接脑控机器人方向和速度研究
自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例
基于Lp正则化支持向量机的基因选择算法研究
基于主动支持向量机的遥感影像分类研究
基于支持向量机的快速多分类算法的设计与分析
基于支持向量机的团藻目分类新方法