Species distribution modeling is an important technique to study the effect of climate change on distribution of species and biodiversity, as well as other related problems. Geospatial data are important inputs to species distribution models. A common problem with geospatial data is that they only contain information about presences, without information about absences of species. This type of geospatial data is defined as one-class data. Modeling the distribution of species from one-class data remains a challenge, because traditional statistic models require both presence and absence data. Therefore, we propose to develop effective techniques to address key problems raised by one-class data, including how to estimate the probability of occurrence of species, how to perform model selection, threshold selection, and accuracy assessment, and how to correct the sample selection bias. Improvements on species distribution modeling can help us better understand the relationship between species distribution and environmental variables, and provide useful information for management and decision-making.
物种分布模型是研究全球气候变化对物种分布与生物多样性影响的重要技术,在多个学科领域中有重要的应用价值。地理空间位置数据是物种分布模型的重要输入,而这些数据常见的问题是一类数据问题。所谓一类数据,就是指只具有物种出现的观测数据,而不包括物种不出现的观测数据。真实的物种分布数据往往是一类数据,因此导致了物种分布模型的一系列难题,因为已有的统计模型一般需要正负样本两类数据。本研究针对一类数据问题,对物种分布模型进行研究,主要解决以下关键问题: 在只有一类数据(正样本) 的情况下,如何构建新的统计模型来预测物种在空间上发生的概率分布;如何对模型进行参数优化、阈值选择以及精度评价;如何校正样本的选择性偏差对模型预测结果的影响。通过本项目研究,我们试图为以上问题提出实际性的解决方案,为研究者在应用物种分布模型解决相关科学问题时提供理论指导和技术支持。
物种分布模型是研究全球气候变化对物种分布与生物多样性影响的重要技术,在多个学科领域中有重要的应用价值。地理空间位置数据是物种分布模型的重要输入,而这些数据常见的问题是一类数据问题。所谓一类数据,就是指只具有物种出现的观测数据,而不包括物种不出现的观测数据。真实的物种分布数据往往是一类数据,因此导致了物种分布模型的一系列难题,因为已有的统计模型一般需要正负样本两类数据。本研究针对一类分类中几个关键问题进行研究,包括:在只有一类数据(正样本) 的情况下,如何构建新的统计模型来预测物种在空间上发生的概率分布;如何对模型进行参数优化、阈值选择以及精度评价。研究结果表明:基于正样本-背景数据的PBL算法可以有效地解决相关的一类分类问题,包括物种分布模拟和遥感一类分类等;广义线性模型、广义叠加模型、最大熵模型、多元自适应回归样条模型、人工神经网络、支持向量机等二值分类器可以用于实现PBL模型,且集合模型的性能比单一模型更加稳健;基于正样本-背景数据的精度评价指标Fpb可以有效地评价二值预测结果,可将其用于一类分类中的模型选择、阈值选择和模型集合等问题。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
粗颗粒土的静止土压力系数非线性分析与计算方法
中国参与全球价值链的环境效应分析
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
钢筋混凝土带翼缘剪力墙破坏机理研究
基于多源遥感数据及物种分布模型的麋鹿生境适宜性评价
基于物种分布预测模型的适应性群团抽样理论与方法研究
基于数据分布评估和支持向量机方法的分布式数据流挖掘模型和算法研究
复杂数据模型中的分布逼近方法