With the recent development of the semantic Web, a large number of OWL ontologies have been published and linked on the Web as a so-called Linking Open Data set. Logical conflicts are inevitable in such open linked ontologies considering the evolution of themselves and the update of links. Usually, the conflicts can be pinpointed and explained utilizing ontology debugging techniques which try to find a set of minimal conflict subsets of axioms as the debugging information. However, existing ontology debugging approaches and optimization techniques have not been proven to have the ability of handling OWL ontologies consisting of more than one billion RDF triples. Obviously, it is necessary to propose novel ontology debugging techniques for OWL to fulfill the requirements of efficient logical conflicts debugging and explaining on billion-scale OWL ontologies. In this research, we will adapt distributed computing technologies to break through the limitation of I/O and main memory on storing and processing large-scale OWL ontologies, based on which we will develop efficient ontology debugging and explanation approaches for large-scale OWL ontologies. The main research contents include: design of the distributed storage structure supporting the ontology debugging for OWL; distributed minimal conflict subsets finding algorithms and optimization techniques; storage updating algorithms and incremental finding algorithms; user oriented debuging information measurements and corresponding Top-k ranking algorithms; and approximate algorithms for distributed OWL debugging. The research results will be applied in a prototype system that provides services of online ontology debugging and explaining for billion-scale real OWL ontologies.
语义Web的发展促使大量OWL本体在Web上发布并互连成链接数据。这种开放链接方式下,本体自身演化或本体间链接更新都可能导致逻辑冲突。通常可采用本体调试技术,通过找出一组最小冲突公理集合作为调试信息的方法来帮助定位并解释冲突原因。目前尚无证据表明已有的本体调试技术及优化方法能有效处理含十亿数量级三元组的OWL本体。当前急需新的OWL本体调试技术来解决在Web 规模本体上进行有效逻辑冲突调试及推理结果解释等问题。课题拟采用分布式处理技术突破I/O和主存对大规模OWL本体存储和处理能力的限制,研究大规模OWL本体的高效调试和解释方法,内容涉及分布式环境下支持OWL本体调试的存储结构设计;求取本体调试信息(最小冲突公理集合)的分布式算法及优化技术;存储更新和增量式求取算法;面向用户的调试信息度量和Top-k算法;近似调试算法。拟将成果用于构建一个提供大规模OWL本体在线调试和解释服务的原型系统。
语义Web的发展促使大量OWL本体在Web上发布并互连成链接数据。这种开放链接方式下,本体自身演化或本体间链接更新都可能导致逻辑冲突。通常可采用本体调试技术,通过找出一组最小冲突公理集合作为调试信息的方法来帮助定位并解释冲突原因。目前尚无证据表明已有的本体调试技术及优化方法能有效处理含十亿数量级三元组的OWL本体。当前急需新的OWL本体调试技术来解决在Web 规模本体上进行有效逻辑冲突调试及推理结果解释等问题。课题采用分布式处理技术突破I/O和主存对大规模OWL本体存储和处理能力的限制,研究了一系列大规模OWL本体的高效调试和解释方法。.在分布式环境下支持OWL本体调试的存储结构设计方面,分别提出了将本体和调试信息存储于Hadoop HDFS,以及存储于Cassandra分布式数据库两套方案。此外,针对分布式本体调试的特点,研究了分布式内存数据库集群系统的可用性。.在存储更新和增量式求取算法方面,提出了在本体增加和删除情况下的本体调试信息的更新策略,以支持动态进行本体推理与调试信息更新。设计了相关缓存机制,避免重复求取所推理的蕴含集。.在求取本体调试信息的分布式算法及优化技术方面,分别研究了采用MapReduce计算模型的方法,以及采用基于内存的分布式计算框架Spark,提升实时计算和迭代计算性能的方法。此外,提出先构造与调试目标相关的依赖子图,再基于依赖子图进行调试的优化策略,通过减小搜索空间来加快调试速度。.在面向用户的调试信息度量和Top-k算法方面,提出一套面向用户认知的OWL本体辩解度量指标,综合考虑复杂度、相关度和新颖度三方面,并在此基础上,采用ListNet 排序学习方法构造Top-k辩解排序模型。该方法在辩解排序准确率方面表现良好。.共计发表论文(含录用)15 篇,其中期刊论文9 篇,会议论文6篇,SCI 检索2 篇,EI 检索7 篇;授权国家发明专利4项;人才培养方面,先后培养硕士生16 名;国际交流合作方面,与南京大学、东南大学、清华大学进行了广泛合作交流。.成果理论意义:1)结合数据库领域的相关思想和理论,解决了本体调试信息的有效存储与管理问题;2)利用多种分布式计算模型,提高调试信息求解性能;3)结合信息检索和机器学习领域的研究成果,提高了调试结果排序准确性问题。成果应用价值:构建了一个能够提供大规模OWL本体在线调试和解释服务的原型系统。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
中外学术论文与期刊的宏观差距分析及改进建议
基于关系对齐的汉语虚词抽象语义表示与分析
基于语义分析的评价对象-情感词对抽取
融合语义信息的汉老双语句子对其方法
OWL本体的协同调试问题研究
OWL DLP本体的学习方法研究
基于图的并行OWL本体推理方法研究
修复不一致OWL本体的高效方法研究