问答技术旨在令计算机能够回答用户用自然语言提问的问题。然而,在当前的研究中,没有很好地融入人机交互及个性化分析技术,因此难以准确理解用户意图和个性化需求,从而无法为用户提供更加精准的答案。本项目针对特定域开展个性化交互式问答技术研究,其主要特点和创新点体现在如下方面:(1)系统能够根据人机交互的上下文对用户当前问题进行分析;(2)系统对于有歧义或模糊的用户问题,可自动生成澄清请求问题,通过与用户的交互进一步明确其信息需求;(3)深入挖掘用户兴趣和偏好,构建用户模型,从而为用户提供个性化答案;(4)对相似用户加以聚类,通过协同式问题推荐的方式向用户提供其感兴趣的信息;(5)建立以系统为中心和以用户为中心的评测方案,对个性化交互式问答系统的性能评测进行研究。我们力争通过本项目的研究推动问答及个性化信息服务技术的发展。
本课题针对交互式问答系统中的对话上下文识别,对话问句理解以及用户模型建立三项技术进行了深入的研究。.其中,研究内容主要包括中文交互式问答用户问题相关检测,基于问句主题相似性原理,我们采用二元分类方法解决连续问题集的语境划分问题,在相关问题检测上,准确率达到了96.1%;.基于复述的问句扩展研究,针对用户问句与候选文档之间的词不匹配现象,我们提出了短语复述方法解决相同语义的不同表述匹配问题,在文档检索上,显著优于现有最优的检索模型及问句扩展方法。.基于中心理论的中文对话省略恢复,基于用户语篇一致性原理,我们提出了基于中心理论规则建模用户表述上的省略行为,在省略成分恢复的准确率上,超出baseline 8.91%;.基于词项重要度赋权的问句检索,为了区分不同词项在检索中的重要性,我们采用逻辑回归方法解决传统词项赋权方法对长尾词权重的偏置,在相似问句检索上,MAP结果在统计上显著优于现有最优的问句检索系统;.融合多类特征的Web查询意图识别,针对查询词项与用户意图之间的语义鸿沟,我们采用SVM分类器解决查询中的词项与用户意图的匹配问题,在用户意图识别上,准确率达到了88.5%;.基于主题模型的用户模型,针对已有方法的低效性,我们采用PLSI主题模型解决了低效问题,在用户主题建模上,NDCG达到了82.8%,显著优于K-means及其他主题模型的方法;.基于领域特征权重的社区型问句分类,针对已有方法未能区分分类特征的重要性问题,我们采用最大熵模型解决特征权重问题,在问题分类的准确率上,显著优于现有最优问句分类系统;.基于查询子主题的查询摘要,针对查询较短,主题信息模糊的问题,我们提出抽取式摘要方法解决查询子主题挖掘问题,在查询摘要抽取上,NDCG@3达到了60.8%,优于现有最先进的查询摘要方法3.8%。.本课题共发表期刊论文4篇(其中1篇SCI索引,3篇EI索引),会议论文5篇(其中CCF A类和B类国际会议各一篇)。.研究成果达到了预期的计划。
{{i.achievement_title}}
数据更新时间:2023-05-31
跨社交网络用户对齐技术综述
粗颗粒土的静止土压力系数非线性分析与计算方法
拥堵路网交通流均衡分配模型
中国参与全球价值链的环境效应分析
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
面向交互式问答的省略恢复技术研究
面向交互式问答的问题理解及问题推荐技术研究
开放域问答式信息检索技术研究
受限域汉语问答系统研究