XML已成为网上信息描述和交换的事实标准,XML文本检索是当前国际上的研究热点,根据查询需求将XML文本检索结果的摘要返回给用户能有效提高信息获取效率。本项目以XML信息检索引擎返回的XML元素(以文本为中心)为对象,以生成满足用户特定查询需求的、简洁且可读性良好的摘要为目标,研究面向查询的XML文本自动文摘关键技术,包括特征选择、XML元素摘要内容抽取模型、摘要内容排序模型和话题群落结构分析方法。考虑XML元素自身的结构性和检索引擎返回结果的层次性,本项目选择支持向量回归模型集成查询、内容和结构三类特征,并采用高效且具有并行化特点的瀑布型摘要内容抽取框架。对得到的摘要内容片段,利用随机冲浪模型从全局的角度考察句子的顺序关系,改善摘要的可读性。为使用户把握XML检索引擎返回结果中各子话题之间的联系,还采用基于电路图的群落结构分析法构建各子话题之间的群落结构拓扑图。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
桂林岩溶石山青冈群落植物功能性状的种间和种内变异研究
惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法
圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察
资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据
面向查询的多文档自动文摘技术研究
面向查询的多文档自动文摘技术研究
面向查询的社会化短文本自动摘要研究
基于统计机器翻译和自动文摘的查询扩展研究