面向异构Web信息源的语义知识获取和融合关键技术研究

基本信息
批准号:61100152
项目类别:青年科学基金项目
资助金额:22.00
负责人:韩先培
学科分类:
依托单位:中国科学院软件研究所
批准年份:2011
结题年份:2014
起止时间:2012-01-01 - 2014-12-31
项目状态: 已结题
项目参与者:李文波,张振中,江雪,张苇如,彭泽环
关键词:
语义知识融合知识库构建信息抽取语义知识获取语义关系抽取
结项摘要

语义知识是自然语言理解的基石,是实现文本各个层面智能分析的基础,其核心是概念与概念之间的语义关系。然而由于人工编写方法受制于专家构建的时间,低估了语义知识的复杂性和规模,大规模语义知识的缺乏一直是高性能自然语言处理的关键瓶颈。为此,本课题研究面向异构Web信息源的语义知识库构建,包括语义知识的表示、获取及融合方法。研究内容和创新之处包括:1.提出大规模语义知识结构化表示模型-大规模异构概念语义网络,为Web环境下语义知识的表示、存储、推导和计算奠定基础;2.面向大规模异构Web信息源,以面向开放领域、自学习的信息抽取方法为技术手段,以自动语义知识获取和多源语义知识融合为重点研究内容,探索大规模语义知识库的自动构建,推动当前"语义知识瓶颈"问题的解决; 3.以高精度文本检索任务为平台,展示并验证了语义知识的应用。

项目摘要

语义知识的获取和集成是自然语言理解和人工智能的重要基础。本课题基于大规模异构Web信息源,研究语义知识的获取、融合和应用,在以下四个方面展开了研究并取得相应的研究成果:.(1)在知识融合方面,提出了面向实体链接的实体-主题模型,通过统一建模篇章的主题一致性和实体的上下文相关性,模型将文本中的知识与知识库中的知识以映射的方式进行集成;.(2)在实体知识获取方面,提出了面向实体集合扩展的Co-Bootstrapping算法和基于图的查询日志实体别名抽取方法。Co-Bootstrapping算法可以有效的解决传统Bootstrapping方法的语义漂移问题的边界模型问题,大幅度的提升实体集合扩展性能;基于图的查询日志实体别名抽取方法可以有效解决传统别名抽取训练语料构建困难和时效性差这两个问题,实现高性能的别名挖掘;.(3)在关系知识获取方面,提出了基于语义一致性的远距离监督关系抽取方法、面向关系抽取的特征丰富树核和基于维基百科和模式聚类的实体关系抽取方法。基于语义一致性的远距离监督方法通过充分利用知识库中的关系实例和文本中关系表达的规律性,有效的解决了没有标注语料情况下的关系抽取模型构建。特征丰富树核可以有效的解决传统树核表达能力不足和信息缺失的问题,进一步提升关系抽取的性能。基于维基百科和模式聚类的实体关系抽取方法从少量种子关系实例出发,利用Bootstrapping框架获取准确的关系实例;.(4)在语义知识应用方面,提出了基于知识的查询日志切分方法和社区热点微博推荐算法。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
2

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
3

桂林岩溶石山青冈群落植物功能性状的种间和种内变异研究

桂林岩溶石山青冈群落植物功能性状的种间和种内变异研究

DOI:10.5846/stxb202009292521
发表时间:2021
4

服务经济时代新动能将由技术和服务共同驱动

服务经济时代新动能将由技术和服务共同驱动

DOI:10.19474/j.cnki.10-1156/f.001172
发表时间:2017
5

卡斯特“网络社会理论”对于人文地理学的知识贡献-基于中外引文内容的分析与对比

卡斯特“网络社会理论”对于人文地理学的知识贡献-基于中外引文内容的分析与对比

DOI:10.13249/j.cnki.sgs.2020.08.003
发表时间:2020

韩先培的其他基金

批准号:61572477
批准年份:2015
资助金额:63.00
项目类别:面上项目

相似国自然基金

1

面向Web信息的知识融合关键技术研究

批准号:61272205
批准年份:2012
负责人:刘清堂
学科分类:F0607
资助金额:80.00
项目类别:面上项目
2

语义Web知识库补全关键技术研究

批准号:61772079
批准年份:2017
负责人:王志春
学科分类:F0607
资助金额:15.00
项目类别:面上项目
3

基于用户知识情境的Web信息语义获取方法研究

批准号:71101074
批准年份:2011
负责人:李敏
学科分类:G0112
资助金额:20.00
项目类别:青年科学基金项目
4

语义Web模糊时空本体知识管理关键技术研究

批准号:61672139
批准年份:2016
负责人:张富
学科分类:F0607
资助金额:62.00
项目类别:面上项目