基于异构信息网络的地理共享数据个性化检索研究

基本信息
批准号:41501431
项目类别:青年科学基金项目
资助金额:20.00
负责人:邵华
学科分类:
依托单位:南京工业大学
批准年份:2015
结题年份:2018
起止时间:2016-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:江南,邵进达,李杨,褚俊秀,卜若
关键词:
地理数据检索关联数据异构信息网络数据共享
结项摘要

With the advances in data acquisition methods, vast amounts of geospatial data are produced. In the context of the needs of the scientific data sharing, how to discovery the data which user are desired is an urgent issue to be solved in geographic information sharing. For general information retrieval methods do not apply to geospatial data intelligent discovery, this research considered data linking and user model at the same time and constructing heterogeneous information networks for geospatial data which put the geospatial data and other relevant information in a more complex environment to analyze. First, construct geospatial retrieval model including meta path-based similarity measurement, similarity search and clustering method by analyzing the temporal-spatial patterns of the meta paths. Second, build user model based on topic model which used to proposing meta path selection and combination methods based on user preference and ranking algorithms for query. Last, design information retrieval prototype system for use in the practice of Data Sharing Infrastructure of Earth System Science. Through this research, it aims to explore new avenues of knowledge discovery in geospatial data; extend theories and methods of geospatial data mining; provide a viable technical method for geospatial data sharing applications; enhance the value of the geospatial data sharing service.

数据获取手段的不断进步,产生了海量的地理科学数据,在科学数据共享需求的背景下,如何从大数据中准确发现并获取用户所需的数据,是地理信息共享迫切需要解决的问题。本研究针对常规信息检索方法不适用于地理共享数据智能发现的现状,拟从数据关联和用户模型两方面着手,构建面向地理共享数据的异构信息网络模型,将地理共享数据和其他相关信息放入一个更加复杂的环境中去分析。首先通过分析异构信息网络中元路径的时空模式,利用元路径研究相似性度量、相似性检索和聚类等信息挖掘方法,形成面向地理共享数据的检索模型;然后构建基于主题的用户模型,提出基于用户偏好的元路径选择和融合方法、查询结果的排序方法;最后设计数据检索原型系统,在地球系统科学数据共享平台中进行应用实践。通过本课题研究,探索地理科学数据中知识发现的新途径,丰富地理空间数据挖掘的理论和方法,为科学数据共享应用提供可行的技术方法,提升地理共享数据的服务价值。

项目摘要

大数据时代产生了海量的地理科学数据,对科学数据共享提出了新的挑战,如何从大数据中准确发现并获取用户所需的数据,是地理信息共享迫切需要解决的问题。本研究针对常规检索方法发现用户所需查询目标的有效性不足问题,结合地理共享数据中丰富的语义信息、地理共享数据之间以及地理共享数据与外部辅助数据的多种关联、用户查询意图等,开展异构信息网络环境中的地理科学数据检索方法研究,实现用户需求地理共享数据的精确发现和智能推荐。首先,从关联数据的视角出发,通过分析地理科学数据特点,以及地理科学数据产生到使用全过程所涉及到的实体,设计地理科学数据语义关联描述模型,将地理科学数据及相关实体的关联分为本质特征关联和外在特征关联,利用本体、SKOS、自然语言处理等技术丰富了数据间的关联,构建地理科学数据异构信息网络,并结合基于本体的相关性度量算法,提出了适用于地理科学关联网络的基于距离的相关性度量算法;其次,针对查询结果推荐问题,提出了一种顾及查询词的相关性排序方法,相比于只考虑数据间相关性度量,用户输入的关键词反映了用户的行为特征及信息需求,本研究结合用户查询词进行推荐,在进行相关性排序时把用户输入关键词行为考虑在内,能够获取更加精准的推荐结果;然后,基于地理科学数据异构信息网络模型,分析用户的历史行为信息,依据数据相似性对地理科学数据进行研究专题聚类,从用户需求的角度描述地理科学数据特征;最后,综合分析数据特征和用户需求,设计在数据特征基础上基于数据主题词的推荐方法以及在数据专题聚类基础上基于聚类的推荐方法,并分析不同推荐方法的适用性,提出融合基于数据主题词和基于聚类的推荐方法,优化推荐结果。实验结果表明,本研究提出的地理科学数据查询与推荐方法可行、有效,能为用户提供发现地理科学数据的新途径,丰富地理空间数据挖掘的理论和方法,为科学数据共享应用提供可行的技术方法,提升地理共享数据的服务价值。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

演化经济地理学视角下的产业结构演替与分叉研究评述

演化经济地理学视角下的产业结构演替与分叉研究评述

DOI:10.15957/j.cnki.jjdl.2016.12.031
发表时间:2016
2

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
3

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
4

农超对接模式中利益分配问题研究

农超对接模式中利益分配问题研究

DOI:10.16517/j.cnki.cn12-1034/f.2015.03.030
发表时间:2015
5

面向云工作流安全的任务调度方法

面向云工作流安全的任务调度方法

DOI:10.7544/issn1000-1239.2018.20170425
发表时间:2018

邵华的其他基金

批准号:30471429
批准年份:2004
资助金额:20.00
项目类别:面上项目
批准号:81470145
批准年份:2014
资助金额:30.00
项目类别:面上项目
批准号:81102497
批准年份:2011
资助金额:19.00
项目类别:青年科学基金项目
批准号:51075276
批准年份:2010
资助金额:38.00
项目类别:面上项目
批准号:81872575
批准年份:2018
资助金额:58.00
项目类别:面上项目
批准号:31770586
批准年份:2017
资助金额:62.00
项目类别:面上项目
批准号:51575357
批准年份:2015
资助金额:63.00
项目类别:面上项目

相似国自然基金

1

基于标识检索事例推理的个性化与共享知识管理方法研究

批准号:70272050
批准年份:2002
负责人:邓贵仕
学科分类:G0112
资助金额:15.00
项目类别:面上项目
2

基于本体的地球科学异构数据共享框架研究

批准号:40802080
批准年份:2008
负责人:董少春
学科分类:D0213
资助金额:19.00
项目类别:青年科学基金项目
3

基于元数据检索结合动态可视化技术的海洋科学数据共享研究

批准号:40676058
批准年份:2006
负责人:刘海行
学科分类:D0608
资助金额:20.00
项目类别:面上项目
4

异构地理信息共享中的实体建模与模式匹配研究

批准号:40971208
批准年份:2009
负责人:易善桢
学科分类:D0114
资助金额:35.00
项目类别:面上项目