With the advances in data acquisition methods, vast amounts of geospatial data are produced. In the context of the needs of the scientific data sharing, how to discovery the data which user are desired is an urgent issue to be solved in geographic information sharing. For general information retrieval methods do not apply to geospatial data intelligent discovery, this research considered data linking and user model at the same time and constructing heterogeneous information networks for geospatial data which put the geospatial data and other relevant information in a more complex environment to analyze. First, construct geospatial retrieval model including meta path-based similarity measurement, similarity search and clustering method by analyzing the temporal-spatial patterns of the meta paths. Second, build user model based on topic model which used to proposing meta path selection and combination methods based on user preference and ranking algorithms for query. Last, design information retrieval prototype system for use in the practice of Data Sharing Infrastructure of Earth System Science. Through this research, it aims to explore new avenues of knowledge discovery in geospatial data; extend theories and methods of geospatial data mining; provide a viable technical method for geospatial data sharing applications; enhance the value of the geospatial data sharing service.
数据获取手段的不断进步,产生了海量的地理科学数据,在科学数据共享需求的背景下,如何从大数据中准确发现并获取用户所需的数据,是地理信息共享迫切需要解决的问题。本研究针对常规信息检索方法不适用于地理共享数据智能发现的现状,拟从数据关联和用户模型两方面着手,构建面向地理共享数据的异构信息网络模型,将地理共享数据和其他相关信息放入一个更加复杂的环境中去分析。首先通过分析异构信息网络中元路径的时空模式,利用元路径研究相似性度量、相似性检索和聚类等信息挖掘方法,形成面向地理共享数据的检索模型;然后构建基于主题的用户模型,提出基于用户偏好的元路径选择和融合方法、查询结果的排序方法;最后设计数据检索原型系统,在地球系统科学数据共享平台中进行应用实践。通过本课题研究,探索地理科学数据中知识发现的新途径,丰富地理空间数据挖掘的理论和方法,为科学数据共享应用提供可行的技术方法,提升地理共享数据的服务价值。
大数据时代产生了海量的地理科学数据,对科学数据共享提出了新的挑战,如何从大数据中准确发现并获取用户所需的数据,是地理信息共享迫切需要解决的问题。本研究针对常规检索方法发现用户所需查询目标的有效性不足问题,结合地理共享数据中丰富的语义信息、地理共享数据之间以及地理共享数据与外部辅助数据的多种关联、用户查询意图等,开展异构信息网络环境中的地理科学数据检索方法研究,实现用户需求地理共享数据的精确发现和智能推荐。首先,从关联数据的视角出发,通过分析地理科学数据特点,以及地理科学数据产生到使用全过程所涉及到的实体,设计地理科学数据语义关联描述模型,将地理科学数据及相关实体的关联分为本质特征关联和外在特征关联,利用本体、SKOS、自然语言处理等技术丰富了数据间的关联,构建地理科学数据异构信息网络,并结合基于本体的相关性度量算法,提出了适用于地理科学关联网络的基于距离的相关性度量算法;其次,针对查询结果推荐问题,提出了一种顾及查询词的相关性排序方法,相比于只考虑数据间相关性度量,用户输入的关键词反映了用户的行为特征及信息需求,本研究结合用户查询词进行推荐,在进行相关性排序时把用户输入关键词行为考虑在内,能够获取更加精准的推荐结果;然后,基于地理科学数据异构信息网络模型,分析用户的历史行为信息,依据数据相似性对地理科学数据进行研究专题聚类,从用户需求的角度描述地理科学数据特征;最后,综合分析数据特征和用户需求,设计在数据特征基础上基于数据主题词的推荐方法以及在数据专题聚类基础上基于聚类的推荐方法,并分析不同推荐方法的适用性,提出融合基于数据主题词和基于聚类的推荐方法,优化推荐结果。实验结果表明,本研究提出的地理科学数据查询与推荐方法可行、有效,能为用户提供发现地理科学数据的新途径,丰富地理空间数据挖掘的理论和方法,为科学数据共享应用提供可行的技术方法,提升地理共享数据的服务价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
农超对接模式中利益分配问题研究
面向云工作流安全的任务调度方法
基于标识检索事例推理的个性化与共享知识管理方法研究
基于本体的地球科学异构数据共享框架研究
基于元数据检索结合动态可视化技术的海洋科学数据共享研究
异构地理信息共享中的实体建模与模式匹配研究