分位数回归的若干极限理论及其在生物芯片数据处理中的应用

基本信息
批准号:11201421
项目类别:青年科学基金项目
资助金额:22.00
负责人:杨晓蓉
学科分类:
依托单位:浙江工商大学
批准年份:2012
结题年份:2015
起止时间:2013-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:蔡光辉,李珏,黄红梅,陈赛君,刘焕香,何春,陈洁
关键词:
生物芯片数据分析结构检测线性分位数过程渐近分布分位数回归
结项摘要

This project aims at the limit theories study of the quantile regression, which provides the theoretical evidences for the biochip data analysis. Considering that the high resolution biochip data may have large capacity, heavy noises and the possible missing responses, quantile approach shows the superiority for the discovery of the potential biomarkers when finding the differently expressed genes or testing the structure of the sequence. Therefore, to overcome the difficulties in real data analysis, the theoretical part will focus on the establishment of a kind of widely used model under very mild conditions, and eventually obtain the parametric estimators and their asymptotic properites of the quantile regression processes, linear quantile models, and the models with censored data. Real data analysis are in terms of mirco-array, SNP-array and CGH-array analysis. Quantitle regression based methods will be employed in data normalization and sequence structure detection, to find out the genes with different expressions and biomarkers with copy number mutations. Further more, our contributions will be on gene or protein regulatory network construction and gene-SNP associated study.The mechanism of the diseases and the survival analysis may be potentically discovered. The research contents of the project are hotpots in the related areas.They are not only of urgent in theory, but also have highly application values.

本项目致力于分位数回归若干极限理论的研究, 并将理论结果应用于生物芯片数据的分析. 高解析度的生物芯片数据量大, 噪声严重, 且可能带有缺失数据, 分位数回归的一些理论手段, 在分析丰度差异表达基因和序列的结构检测时, 能够更准确地找出潜在的生物标记. 鉴于实例数据的特点, 项目理论研究旨在普适性的条件下, 建立分位数自回归过程, 线性分位数模型的参数估计及估计量的渐近性质, 并且考虑带有删失数据的模型. 应用方面在微阵列芯片, 单核苷多态性芯片和比较基因杂交芯片数据分析上, 利用分位数回归进行数据标准化及序列结构的检测, 找出差异丰度表达基因及拷贝数有突变的生物标记, 并进而在基因和蛋白调控网络方面, 基因和单核苷多态性关联问题上有所突破, 找出疾病致病机理, 同时对药物疗效和生存分析进行探索. 项目研究内容是前沿的热点课题, 在理论上有迫切的需要, 又具有较高的应用价值.

项目摘要

本项目以分位数回归技术为主线,展开了一系列相关的研究,前期的研究包括相依随机变量不等式的推广,序列平稳性的检验,这些研究成果为统计建模和应用部分的实例数据分析提供了理论依据。中期的研究在普适性的条件下,建立分位数自回归过程,线性分位数模型的参数估计及估计量的渐近性质,并将常系数的模型推广到变系数的分位数自回归模型(QAR),通过分位数回归的理论研究,将研究的主要结果应用于对金融市场的风险度量方面。后期的研究致力于带删失的列分位数回归模型若干理论的研究,将动态分位数引入到模型中,在非参数回归框架下,通过多重插补、数据增广等方法对数据进行修补,得到无偏又有效的参数估计,并建立估计量的极限定理。一个重要的贡献是,我们提出的方法对模型的假设非常宽泛,是灵活、有效、稳定和计算速度可行的。应用方面,还将删失数据的修补技术应用于生物和工程领域的数据中,在带有删失情况下,给出有效的统计推断。由于目前对于此类模型带删失的研究尚属空白,因此这方面的研究也将成为今后研究的主要方向和研究重点。课题组总体上基本按照原定计划开展研究,同时还加强了相关问题的研究,但研究过程中,在执行后顺序和原定计划有所调整。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

演化经济地理学视角下的产业结构演替与分叉研究评述

演化经济地理学视角下的产业结构演替与分叉研究评述

DOI:10.15957/j.cnki.jjdl.2016.12.031
发表时间:2016
2

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
3

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
4

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
5

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019

杨晓蓉的其他基金

批准号:11026087
批准年份:2010
资助金额:2.80
项目类别:数学天元基金项目

相似国自然基金

1

分位数回归中若干统计问题及其在气候变化和水文模型中的应用

批准号:11401114
批准年份:2014
负责人:金应华
学科分类:A0403
资助金额:22.00
项目类别:青年科学基金项目
2

分位数回归过程的估计及其应用

批准号:11571218
批准年份:2015
负责人:冯兴东
学科分类:A0402
资助金额:45.00
项目类别:面上项目
3

自回归时间序列的若干极限理论及其应用

批准号:11026087
批准年份:2010
负责人:杨晓蓉
学科分类:A0211
资助金额:2.80
项目类别:数学天元基金项目
4

多输出分位数回归估计中若干问题的研究

批准号:11601197
批准年份:2016
负责人:刘小惠
学科分类:A0402
资助金额:18.00
项目类别:青年科学基金项目