The recent years witnessed great advancements on computing technologies and data collection capabilities, which lead to an exponential expansion of the geographic data and geographic information resources. With the development of the internet, geographic information resources become more and more widely scattered in the internet, while non-uniformed descriptions and various standards cause the uncertainty of the quality of these geographic information resources. How to find geographic information resources mostly needed with best quality is an important problem. Research works and practical experiences in recent years show that, the two discovery modes of the geographic information resources,i.e., general-purpose search engine mode and registry center mode, can not solve this problem. This project will propose a new mode for discovery of web geographic infromation resources, i.e., active crawling - efficient organization - intelligent searching. Through studying the methods of active identifying and discovery of massive, scattered and heterogeneous geographic information resources and extracting their metadata, designing the mechanism of optimizing search results considering quality restrictions and user's cognition, this proposed mode will guide the implementation of a new search engine of online geographic information resources supporting quality restriction. The result of this project will provide theoretical and technical support to a total solution for online geographic information resources discovery supporting quality restrictions. A search engine prototype will be created to demonstrate the fundamental issues of geographic information resources sharing and seamless integratation, which will lead the future development of service-oriented geosptail information science.
计算能力和数据采集能力的提高使得网络上的地理信息资源急剧膨胀。但是,随着网络的发展,地理信息资源分布日益分散,且描述不一、标准各异,使得资源质量参差不齐。如何从整个网络中准确快速地找到用户需要的高质量地理信息资源,成了地理信息科学领域亟待解决的问题。近几年的研究表明,基于通用搜索引擎和基于注册中心的两种地理信息资源发现模式都不能满足目前查找需求。本项目将研究网络地理信息资源的"主动爬取-高效组织-智能搜索"的新模式,探索主动识别和发现海量、分散、异质的地理信息资源并自动析出和规约元数据的理论基础,建立质量约束与用户认知相结合的检索优化机制,实现支持质量约束的网络地理信息资源在线检索技术。本项目研究的成果将支撑支持质量约束的地理信息资源在线搜索方案,建立高效可用的地理信息资源在线搜索平台,为地理信息资源的在线共享和无缝集成奠定理论和应用基础,带动基于服务的地球信息科学的发展。
如何从整个网络中准确、快速地找到符合用户需求的高质量地理信息资源,既是地理信息共享与服务的应用瓶颈问题,也是地理空间信息科学的应用基础问题,对地球信息科学的发展具有带动作用。针对该问题,本项目从“网络地理信息资源的智能识别与高效能主动爬取”,“顾及内容与性能的网络地理信息资源的质量评价”及“兼顾质量约束和用户认知的地理信息资源在线检索”三个方面开展研究,构建了“主动资源发现—多维质量评价—智能在线检索”的研究主线,形成了支持质量约束的网络地理地理信息资源发现与检索的完整解决方案。.在主动资源发现方面,首先基于网络地理信息资源的存在机理与分布规律,设计并实现了一种针对标准OGC服务的高效主题爬虫算法。然后围绕该主题爬虫设计了不同模式数据的主动抓取方法,收割到的网络地理信息资源在类型和数量上都有了极大丰富。.在多维质量评价方面,首先从网络地图服务的访问性能入手,设计并实现了全球尺度的分布式时空监测方案及相应的原型系统。基于该系统长效运行获得监测数据,提出地理加权回归与时空自相关移动平均相结合的Hybrid时空预测模型,实现了服务响应时间的精准预测。然后从网络地图服务的可视化效果入手,研究并设计了面向地图服务的可视质量评价模型,重点突破了地图服务的跨尺度评价难题。.在智能在线检索方面,首先基于Linked Data构建地理信息资源之间的语义关联,为后期的语义检索奠定了基础;然后提出了一种基于用户反馈的网络地图服务交互式搜索方法,联合视觉内容与用户反馈提高地图服务检索的查全率与查准率;最后设计了一种网络地图服务的简略表达方法,用以改善网络地图服务检索中的人机交互体验。.项目积累了大量宝贵数据资源,包括WMS服务38651个,WFS服务10395个,WCS服务2766个,WMTS服务476个,ArcGIS Rest服务目录499个(其中包含地图服务19923个,数据服务1158个,地理处理服务836个,影像服务1082个),共计75287个。这些数据将有效服务于地理信息共享、境外数据获取、全球环境监测等相关领域研究。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
农超对接模式中利益分配问题研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据
多源数据驱动CNN-GRU模型的公交客流量分类预测
搜索引擎在线算法的GPU优化关键技术研究
多层QoS约束支持的遥感信息服务个性化搜索方法
基于支持向量机的智能质量控制方法及关键技术研究
数据质量管理中的完整性约束关键技术研究