This project aims at the limit theories study of the quantile regression, which provides the theoretical evidences for the biochip data analysis. Considering that the high resolution biochip data may have large capacity, heavy noises and the possible missing responses, quantile approach shows the superiority for the discovery of the potential biomarkers when finding the differently expressed genes or testing the structure of the sequence. Therefore, to overcome the difficulties in real data analysis, the theoretical part will focus on the establishment of a kind of widely used model under very mild conditions, and eventually obtain the parametric estimators and their asymptotic properites of the quantile regression processes, linear quantile models, and the models with censored data. Real data analysis are in terms of mirco-array, SNP-array and CGH-array analysis. Quantitle regression based methods will be employed in data normalization and sequence structure detection, to find out the genes with different expressions and biomarkers with copy number mutations. Further more, our contributions will be on gene or protein regulatory network construction and gene-SNP associated study.The mechanism of the diseases and the survival analysis may be potentically discovered. The research contents of the project are hotpots in the related areas.They are not only of urgent in theory, but also have highly application values.
本项目致力于分位数回归若干极限理论的研究, 并将理论结果应用于生物芯片数据的分析. 高解析度的生物芯片数据量大, 噪声严重, 且可能带有缺失数据, 分位数回归的一些理论手段, 在分析丰度差异表达基因和序列的结构检测时, 能够更准确地找出潜在的生物标记. 鉴于实例数据的特点, 项目理论研究旨在普适性的条件下, 建立分位数自回归过程, 线性分位数模型的参数估计及估计量的渐近性质, 并且考虑带有删失数据的模型. 应用方面在微阵列芯片, 单核苷多态性芯片和比较基因杂交芯片数据分析上, 利用分位数回归进行数据标准化及序列结构的检测, 找出差异丰度表达基因及拷贝数有突变的生物标记, 并进而在基因和蛋白调控网络方面, 基因和单核苷多态性关联问题上有所突破, 找出疾病致病机理, 同时对药物疗效和生存分析进行探索. 项目研究内容是前沿的热点课题, 在理论上有迫切的需要, 又具有较高的应用价值.
本项目以分位数回归技术为主线,展开了一系列相关的研究,前期的研究包括相依随机变量不等式的推广,序列平稳性的检验,这些研究成果为统计建模和应用部分的实例数据分析提供了理论依据。中期的研究在普适性的条件下,建立分位数自回归过程,线性分位数模型的参数估计及估计量的渐近性质,并将常系数的模型推广到变系数的分位数自回归模型(QAR),通过分位数回归的理论研究,将研究的主要结果应用于对金融市场的风险度量方面。后期的研究致力于带删失的列分位数回归模型若干理论的研究,将动态分位数引入到模型中,在非参数回归框架下,通过多重插补、数据增广等方法对数据进行修补,得到无偏又有效的参数估计,并建立估计量的极限定理。一个重要的贡献是,我们提出的方法对模型的假设非常宽泛,是灵活、有效、稳定和计算速度可行的。应用方面,还将删失数据的修补技术应用于生物和工程领域的数据中,在带有删失情况下,给出有效的统计推断。由于目前对于此类模型带删失的研究尚属空白,因此这方面的研究也将成为今后研究的主要方向和研究重点。课题组总体上基本按照原定计划开展研究,同时还加强了相关问题的研究,但研究过程中,在执行后顺序和原定计划有所调整。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
玉米叶向值的全基因组关联分析
基于分形L系统的水稻根系建模方法研究
论大数据环境对情报学发展的影响
粗颗粒土的静止土压力系数非线性分析与计算方法
分位数回归中若干统计问题及其在气候变化和水文模型中的应用
分位数回归过程的估计及其应用
自回归时间序列的若干极限理论及其应用
多输出分位数回归估计中若干问题的研究