基于知识图谱的用户长尾需求建模研究

基本信息
批准号:61702564
项目类别:青年科学基金项目
资助金额:25.00
负责人:李岱峰
学科分类:
依托单位:中山大学
批准年份:2017
结题年份:2020
起止时间:2018-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:杨洋,余维杰,周恩国,邹超,卢伟聪,陶盈春
关键词:
序列向量模型知识图谱张量分解需求转移服务映射
结项摘要

Because search engines lack tools for varying knowledge mapping in response to different circumstances, it is easy for relevant online services to be hidden in the “long-tail”. To address this problem, this paper introduces a model based on demand transfer and service mapping that introduces a new perspective, which can help to improve users' experience of long-tail demands. The research concentrates on three areas: (1) Long-tail entity extraction. A sequence vector model is used to extract long tail entities according to context. A tensor decomposition model is used to identify relationships. The proposed research tries to retain as much sequence information as possible, then to identify long tail entities and related terms at the semantic level. (2) Focusing on demand transfer: The tensor decomposition model is integrated with a knowledge graph translation to realize personalized demand transfer. (3) Service mapping: With a view to taking into account users' long-tail demands and requirements, a latent vector model is constructed based on users’ knowledge expression and latent parameters, allowing a direct mapping from users' demands to relevant business services. The project considers the integration of different models, which may deepen understanding of long tail demands, and further improve users' online experience and the quality of Internet services.

传统相关性检索研究较少考虑长尾实体信息,且缺乏在不同场景下的知识映射,因此在长尾检索方面存在用户需求难以满足的情况。针对上述问题,本课题拟将知识图谱引入长尾需求建模,构建包含长尾实体的知识图谱,从需求转移、服务映射两个新的视角进行长尾需求分析。拟从三个方面展开研究:(1) 通过序列向量模型依据上下文信息抽取长尾实体;通过张量分解模型,实现基于上下文的关系发现。该方法可最大限度保留序列信息,实现语义层面的长尾实体及关系识别。(2) 从需求转移的角度:采用张量分解模型融合知识图谱表示学习,实现用户个性化、细粒度的需求转移。(3) 从服务映射的角度:构建基于知识表示的相关性序列向量模型,进行知识表达和潜层参数的协同学习,实现输出端从用户需求到商业服务的直接映射。课题融合多个模型实现参数在不同框架下的协同学习,可进一步提升模型对用户长尾需求的深度理解能力,进而提升用体验及互联网信息服务质量。

项目摘要

智能检索是互联网信息服务的核心技术,随着互联网信息的爆炸式增长,智能检索面临诸多新的挑战。 针对目前智能检索在细粒度需求分析不准确,并难于匹配长尾需求的问题,本课题将知识图谱引入智能检索进行建模,形成系统化的理论模型,并在实践中验证和完善。本研究主要从四个方面展开:(1) 构建Bert-Strategy-HRL(层次强化学习)模型依据上下文信息抽取非结构文本中实体的长尾描述,并构建实体关系;(2) 通过Cascade Knowledge Embedding模型和低秩张量分解模型,构建从实体、需求长尾描述到服务的知识图谱表达及验证;(3) 在知识图谱构建的基础上,提出Attributed Knowledge multi-dimension Embedding模型应用K维正交分解,实现基于需求的实体细粒度分析及转移算法;(4) 针对用户细粒度需求的长尾query,构建基于知识表示的潜变量学习模型,进行知识表达和潜层参数的协同学习,实现从需求到服务的直接映射。本研究提出的Bert-Strategy-HRL模型应用于AI学术、PubMed、电商等数据集,在实体及关系识别测试中平均提升3%;提出的Cascade Knowledge Embedding、Attributed Knowledge multi-dimension Embedding模型在细粒度描述实体关系向量表达测试中,应用在6个数据集得到平均5%提升;提出的Selection-Translation-Selection机制及可解释分层强化学习模型,在智能搜索、推荐数据集平均提升5%。相关研究成果共14篇发表于FGCS、JASIST、IPM、IMDS、CIKM、iConference等国际知名期刊及顶会。指导学生参加学科竞赛获奖10余次。此外,在理论研究的基础上,结合前沿工程技术,开发Helenus.ai、方舟-ARK应用平台,并与政府、企业开展合作,进行多源情报收集、知识图谱构建及应用,为政府进行数据库整合、提升业务效率提供研究报告;为企业实时获取竞争情报、实现智能语义分析提供决策支持,从大数据角度提升企业竞争力、降低企业运营成本。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
2

基于LASSO-SVMR模型城市生活需水量的预测

基于LASSO-SVMR模型城市生活需水量的预测

DOI:10.19679/j.cnki.cjjsjj.2019.0538
发表时间:2019
3

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018

李岱峰的其他基金

相似国自然基金

1

基于领域本体和过程挖掘的用户知识需求获取的关键技术研究

批准号:60603090
批准年份:2006
负责人:曾庆田
学科分类:F0209
资助金额:25.00
项目类别:青年科学基金项目
2

基于用户Nonverbal潜意识行为建模的需求侧创新设计方法研究

批准号:51875399
批准年份:2018
负责人:黄艳群
学科分类:E0506
资助金额:60.00
项目类别:面上项目
3

创新用户细分建模与需求表征应用研究

批准号:71502111
批准年份:2015
负责人:陈星宇
学科分类:G0203
资助金额:17.00
项目类别:青年科学基金项目
4

地理知识图谱实体关联关系建模与补全方法研究

批准号:41801313
批准年份:2018
负责人:陈晓慧
学科分类:D0114
资助金额:24.00
项目类别:青年科学基金项目