Both natural language and virtual geographical scene are two important representation means of geographcial scene,but with different advantages in the number of data, visual representation, cognitive custom and public usage etc. Based on the qualitative, unstructured and uncertainty characteristics of geographical scene described in nature language, this program aims to formulate a geographical scene annotation scheme and construct a large-scale annotated corpus, and then explore approaches to extraction and semantic interpretation of geographical scene information in Chinese text. Based on the ant colony algorithm, an spatial layout sketch map generation algorithm is proposed to graphically display the location of the interpreted geographical scene in text. A spatial mapping model is further presented to associate the sketch map and the virtual geographical scene. Finally, an engine is developed to configure the spatio-temporal attributes of the mapped virtual geographical scene. By the solution of key problems in the processes of structuring, formalization, symbolization, spatialization and personalization of geographic scene described in natural language, the semantic mapping of the geographical scene expression from natural language to virtual geographical scene is achieved. The research results will help us deeply understand the spatial cognition patterns and linguistic habit for geographical scene, and extend the usage of virtual geographical scene in such fields as geography study, smart city, film production, and visualization of humanity, history and culture resource.
自然语言和虚拟地理场景是两种重要的地理场景表达手段,在数据的丰富性、表达的直观性、认知的习惯性、应用的普及性等方面各有所长。本项目针对自然语言中地理场景描述的非结构化、定性化和不确定性等特点,构建地理场景信息标注体系和大规模标注语料库,探讨中文文本中地理场景信息的抽取和语义解析方法;研究基于蚁群算法的地理场景空间布局草图生成算法,提出"文-图-景"的匹配模型,设计多重一致性约束的地理场景时空属性动态配置方法。通过解决自然语言中地理场景信息"结构化、形式化、图形化、空间化和个性化"过程中的关键科学问题,实现从自然语言到虚拟地理场景的语义映射,形成由"粗"到"精"、"虚实结合"的地理场景动态重构机制,以进一步揭示地理场景的空间认知模式和自然语言描述习惯,促进虚拟地理场景在地理学研究、智慧城市、影视制作、人文历史文化资源可视化等领域的普及应用。
自然然语言和虚拟地理场景是两种重要的地理场景表达手段,在数据的丰富性、表达的直观性、认知的习惯性、应用的普及性等方面具有显著的优势互补特性。本项目通过分析自然语言中地理场景描述的非结构化、定性化和不确定性等特点,借鉴自然语言处理、机器学习、地理信息科学等领域的理论与方法,突破了自然语言中地理场景信息“结构化、形式化、图形化、空间化和个性化”过程中的关键科学问题,进一步深入揭示了地理场景的空间认知和自然语言描述规律。本项目提出了地理场景的分类体系、要素“六域模型”和信息表达框架,探讨了地理学语言从“地图”发展为“地理场景”的可能性;制定了面向自然语言的地理场景标注规范和语料库,构建了自然语言中“时间、地点、人物、事物、事件、现象”要素和关系的信息抽取模型(包括深度信念网络、条件随机场、支持向量机等),提出了基于区域等级和认知约束的地理语义消歧方法,解决了自然语言中地理场景信息的结构化和统一化表达问题;以地理场景分类体系、常识库、符号库和结构模板库为知识库,提出了基于蚁群算法的地理场景空间布局优化方法,解决了地理场景的“文—图”转换问题;构建了地理概念相似度、空间关系相似度和空间结构相似度计算模型,解决了地理场景“图-景”转换问题;设计了多重一致性约束的时空匹配模型和算法,解决了由“粗”到“精”、“虚实结合”的地理场景重构问题;以公安案事件和社交网络为例,研发原型系统并进行实验验证分析。本项目共申请2项专利和8项软件著作权,发表代表性学术论文3篇,培养毕业博士生2名和硕士生9名,获得1项部省级科技进步三等奖,组织20多人次国内外学术交流。研究成果成功应用于统一时空框架建设、历史文化的虚实再现、案事件场景重建和社交网络平台等领域,取得了较好的社会效益和经济价值,将在地理大数据资源挖掘与利用中发挥重要作用。更为重要的是,该研究是应用跨学科知识解决地理信息科学基础问题的一次重要探索。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
基于分形L系统的水稻根系建模方法研究
涡度相关技术及其在陆地生态系统通量研究中的应用
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例
“自然语言-草图”耦合的地理场景查询方法研究
面向虚拟地理环境的自然语言问答式知识搜索研究
面向网络应用环境的真实感虚拟场景生成技术
自然语言表达的地理实体空间化方法研究