面向异构Web信息源的语义知识获取和融合关键技术研究

基本信息

批准号：61100152

项目类别：青年科学基金项目

资助金额：22.00

负责人：韩先培

学科分类：

依托单位：中国科学院软件研究所

批准年份：2011

结题年份：2014

起止时间：2012-01-01 - 2014-12-31

项目状态：已结题

项目参与者：李文波,张振中,江雪,张苇如,彭泽环

关键词：

语义知识融合知识库构建信息抽取语义知识获取语义关系抽取

结项摘要

语义知识是自然语言理解的基石，是实现文本各个层面智能分析的基础，其核心是概念与概念之间的语义关系。然而由于人工编写方法受制于专家构建的时间，低估了语义知识的复杂性和规模，大规模语义知识的缺乏一直是高性能自然语言处理的关键瓶颈。为此，本课题研究面向异构Web信息源的语义知识库构建，包括语义知识的表示、获取及融合方法。研究内容和创新之处包括：1.提出大规模语义知识结构化表示模型-大规模异构概念语义网络，为Web环境下语义知识的表示、存储、推导和计算奠定基础；2.面向大规模异构Web信息源，以面向开放领域、自学习的信息抽取方法为技术手段，以自动语义知识获取和多源语义知识融合为重点研究内容，探索大规模语义知识库的自动构建，推动当前"语义知识瓶颈"问题的解决; 3.以高精度文本检索任务为平台，展示并验证了语义知识的应用。

项目摘要

语义知识的获取和集成是自然语言理解和人工智能的重要基础。本课题基于大规模异构Web信息源，研究语义知识的获取、融合和应用，在以下四个方面展开了研究并取得相应的研究成果：.（1）在知识融合方面，提出了面向实体链接的实体-主题模型，通过统一建模篇章的主题一致性和实体的上下文相关性，模型将文本中的知识与知识库中的知识以映射的方式进行集成；.（2）在实体知识获取方面，提出了面向实体集合扩展的Co-Bootstrapping算法和基于图的查询日志实体别名抽取方法。Co-Bootstrapping算法可以有效的解决传统Bootstrapping方法的语义漂移问题的边界模型问题，大幅度的提升实体集合扩展性能；基于图的查询日志实体别名抽取方法可以有效解决传统别名抽取训练语料构建困难和时效性差这两个问题，实现高性能的别名挖掘；.（3）在关系知识获取方面，提出了基于语义一致性的远距离监督关系抽取方法、面向关系抽取的特征丰富树核和基于维基百科和模式聚类的实体关系抽取方法。基于语义一致性的远距离监督方法通过充分利用知识库中的关系实例和文本中关系表达的规律性，有效的解决了没有标注语料情况下的关系抽取模型构建。特征丰富树核可以有效的解决传统树核表达能力不足和信息缺失的问题，进一步提升关系抽取的性能。基于维基百科和模式聚类的实体关系抽取方法从少量种子关系实例出发，利用Bootstrapping框架获取准确的关系实例；.（4）在语义知识应用方面，提出了基于知识的查询日志切分方法和社区热点微博推荐算法。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：

DOI：

发表时间：

DOI：10.3724/SP.J.1089.2019.17435

发表时间：2019

DOI：10.7498/aps.68.20181682

发表时间：2019

DOI：10.12005/orms.2019.0029

发表时间：2019

韩先培的其他基金

批准号：61572477

批准年份：2015

资助金额：63.00

项目类别：面上项目

相似国自然基金

面向Web信息的知识融合关键技术研究

批准号：61272205

批准年份：2012

负责人：刘清堂

学科分类：F0607

资助金额：80.00

项目类别：面上项目

语义Web知识库补全关键技术研究

批准号：61772079

批准年份：2017

负责人：王志春

学科分类：F0607

资助金额：15.00

项目类别：面上项目

基于用户知识情境的Web信息语义获取方法研究

批准号：71101074

批准年份：2011

负责人：李敏

学科分类：G0112

资助金额：20.00

项目类别：青年科学基金项目

语义Web模糊时空本体知识管理关键技术研究

批准号：61672139

批准年份：2016

负责人：张富

学科分类：F0607

资助金额：62.00

项目类别：面上项目

面向异构Web信息源的语义知识获取和融合关键技术研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于国产化替代环境下高校计算机教学的研究

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

信息熵-保真度联合度量函数的单幅图像去雾方法

高分五号卫星多角度偏振相机最优化估计反演:角度依赖与后验误差分析

基于直觉模糊二元语义交互式群决策的技术创新项目选择

韩先培的其他基金

开放域语义关系抽取、表示和计算关键技术研究

相似国自然基金