Fine-scale population distribution data is an important basic information related to economic development and urbanization. It is crucial in the fields such as regional planning, ecological environment protection, disaster assessment, and public health. However, the traditional population distribution simulation methods have some problems such as collinearity, local outliers and over-fitting, and difficulty in measuring characteristic variables. multi-source emerging geospatial data with machine learning and spatial analysis technology are combined to solve.the above problems. Firstly, the database of population distribution characteristic factors is created, based on high-resolution remote sensing images, geographic and national data, POI data and related auxiliary data. Secondly, a method of searching indicators of population distribution based on random forest hyperparametric search is proposed, which effectively compensates for the problem of fast extraction of high-dimensional factors from large sample population datasets with complex non-linear characteristics. On this basis, considering the.differences of individual social attributes, a simulation model for a fine-scale spatial population distribution on building coupled with random forest and agents is constructed. Finally, the accuracy of population distribution simulation results is tested with Guangdong-Hong Kong-Macao Greater Bay Area. Research results will provide high-precision data support for demography, sociology, geography and other related scientific research and government decision-making, and provide methodological reference for other population and socioeconomic data.and geographic information fusion research, and enrich the theory and technology system between socio-economic data and geographic information data fusion.
高精度人口分布数据是关乎经济社会发展与城镇化建设的重要基础信息。传统人口分布模拟方法存在共线性、过拟合、特征选择难、忽略个体社会属性、空间分辨率低等问题。本项目针对以上问题,将多源新兴地理空间大数据与机器学习、空间分析技术相结合,利用高分遥感影像、地理国情数据、POI数据及相关辅助数据,创建人口分布特征因子库;提出随机森林超参数搜索研究人口分布指示因子寻优方法,有效弥补了复杂非线性特征的大样本人口数据集的高维特征因子快速提取的问题;在此基础上兼顾人口个体社会属性差异,构建随机森林和智能体耦合的高精度人口分布模拟模型,实现政区人口向单体建筑图斑单元人口的精细估算和空间模拟。最后选取粤港澳大湾区进行实验验证。研究成果将为人口学、社会学、地理学等相关研究及政府决策提供高精度的数据支撑,为其他人文信息与地理信息融合研究提供方法借鉴,丰富社会经济统计数据与地理信息融合理论与技术体系。
人口分布数据是社会科学、自然科学等研究领域的重要数据基础。快速、准确掌握高精度人口分布信息,对于社会经济发展规划制定、自然资源精细化管理、国土空间规划与管制、公共卫生健康评估、可持续发展、人地关系研究等方面具有重要意义。针对传统人口分布模拟模型不能精确描述人口居住空间的分异性,忽略地域和群体社会属性差异,尚未考虑载体多维特征和人口群体决策行为差异,人口空间精度与区域格网尺度关系不明等问题,本项目利用人口普查与统计数据,充分结合国土调查数据、地理国情数据、POI数据、夜间灯光遥感影像数据、OSM数据等其他多源相关辅助数据,创立了人口统计数据与地理空间数据精准融合结构框架和因子库,提出了人口分布指示因子寻优、人口分布载体精细提取和人口分布格网单元尺度寻优方法;兼顾空间分区、个体决策行为等差异,针对不同的数据驱动和应用场景,构建了多源数据融入随机森林、多智能体的人口分布模拟、人口多因子逐步融合的高精度人口分布分区模拟等模型,并在粤港澳大湾区、黄河流域、武汉市武昌区等地区进行实证分析与验证,形成了人口分布数据库、指示因子分布数据库和人口统计数据集,解决了高维人口分布影响因子的智能辨识和优化筛选、人口统计数据粒度过粗、人口与地理信息精准耦合与集成应用等难题。研究共发表论文6篇、待出版专著1部、申请专利3项。项目研究成果为3份报告提供了重要的数据和技术支撑,为《全国国土空间规划纲要(2021-2035年)》编制与实施、主体功能区战略实施成效评估提供了支撑。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
基于多模态信息特征融合的犯罪预测算法研究
面向云工作流安全的任务调度方法
惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法
物联网中区块链技术的应用与挑战
基于机理的区域森林火险模拟方法研究
区域人口分布的优化控制
耦合高精度InSAR监测的区域性地面沉降模拟研究
基于区域切换和回归森林算法的大尺度场景表面重建研究