XML个性化协作搜索及其在社会网络服务中的应用

基本信息
批准号:61170085
项目类别:面上项目
资助金额:58.00
负责人:王晓玲
学科分类:
依托单位:华东师范大学
批准年份:2011
结题年份:2015
起止时间:2012-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:陈伟婷,夏帆,闫季鸿,林煜明,王朝勇,范远超,周梦婕
关键词:
数据密集型计算协作搜索XML数据管理社会网络服务个性化搜索
结项摘要

随着Web2.0和Web3.0应用的迅猛发展,社会网络服务(包括微博、RSS和Facebook图片共享等)发展迅速,普遍采用XML作为其数据交换的载体,导致互联网应用中的XML信息内容增长迅速,传统的Web搜索引擎提供了对无结构的页面数据的检索,由于数据处理对象不同、查询语义和查询策略不同,很难支撑XML数据的个性化检索。本课题以分析用户网络浏览数据和社会网络关联为依据,以图模型为理论基础,以XML数据的个性化搜索服务为中心,探索基于图的查询聚类技术,深入研究相关的挖掘、存储、索引、搜索、排序、优化等技术,建立一个全面及综合性的个性化搜索架构。同时,为了提高系统性能,本课题还将深入探讨协作搜索策略。研究内容包括个性化的表示和建模技术、个性化检索技术、协作检索技术、用户概念图的存储和索引技术、查新结果的打分和排序技术等关键技术。通过开发原型系统,建立示范性应用,为现实应用提供技术支撑。

项目摘要

本课题以用户线上行为数据、用户的社会网络关系等为分析依据,以用户兴趣分析与挖掘、个性化搜索为中心,探索面向个性化搜索的查询优化技术和社会化搜索技术,深入研究相关的搜索、排序、优化等技术,建立一个个性化搜索架构,并探索在相关真实应用的实证研究。项目的主要成果包括:.(1)个性化信息的建模和挖掘算法。要进行个性化推荐,首先需要建模用户的兴趣、概念、偏好等个性化信息。我们研究了基于熵的PU学习方法,该方法针对用户点击数据中负例少的特点,传统数据挖掘方法不能直接用于这类PU数据,我们设计的该套方法发表在WWW Journal、APWEB等国际期刊和会议上。在用户行为建模方面,本课题设计对用户线上行为数据(包括评论数据、浏览点击数据等)进行分析与挖掘的一系列的算法,包括主题分析模型、基于知识图谱的用户特征分析、基于多分类器集成的观点分析等,用来获取用户兴趣,构建有效的用户个性化特征。相关研究成果发表在《计算机学报》、WWW、WISE等国内外重要学术期刊和学术会议上。.(2)建立了面向社会网络数据进行分析的框架,结合内容主题分析技术,确定用户概要产生的社会子网络图。基于此用户社会网络开展的查询和搜索,更具有个性化和针对性的特点,提高了查询结果的质量。相关研究成果发表在ICDE workshop、NDBC、DASFAA等数据管理领域的重要学术会议上。.(3)对于搜索排序和优化技术,探索了基于次模理论的排序算法,不仅提高了搜索的效率,而且从理论上保证了我们提出的排序方法的精度。相关研究成果发表在DASFAA、APWEB、《软件学报》等重要学术刊物上。.(4)对于大规模分布式索引、查询优化等关键技术,设计了分布式索引,用分布式树簇代替传统的集中式树型索引;设计了3类优化方法,实现窗口函数的优化。相关研究成果发表在《计算机学报》、ICDE上。.(5)在上述理论和算法的基础之上,实现了自适应的个性化搜索的框架和核心算法,并在个性化酒店推荐、审稿论文分发等实际应用中进行了验证,不仅申请了软件著作权和专利,而且应用系统得到用户的好评,个性化特征明显,搜索质量高。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

黄河流域水资源利用时空演变特征及驱动要素

黄河流域水资源利用时空演变特征及驱动要素

DOI:10.18402/resci.2020.12.01
发表时间:2020
3

敏感性水利工程社会稳定风险演化SD模型

敏感性水利工程社会稳定风险演化SD模型

DOI:10.16265/j.cnki.issn1003-3033.2021.04.003
发表时间:2021
4

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

DOI:10.12202/j.0476-0301.2020285
发表时间:2021
5

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021

王晓玲的其他基金

批准号:51308253
批准年份:2013
资助金额:25.00
项目类别:青年科学基金项目
批准号:81503401
批准年份:2015
资助金额:18.00
项目类别:青年科学基金项目
批准号:50879053
批准年份:2008
资助金额:32.00
项目类别:面上项目
批准号:51179121
批准年份:2011
资助金额:60.00
项目类别:面上项目
批准号:71662018
批准年份:2016
资助金额:28.00
项目类别:地区科学基金项目
批准号:61472141
批准年份:2014
资助金额:80.00
项目类别:面上项目
批准号:30772758
批准年份:2007
资助金额:30.00
项目类别:面上项目
批准号:11772047
批准年份:2017
资助金额:62.00
项目类别:面上项目
批准号:30000230
批准年份:2000
资助金额:15.00
项目类别:青年科学基金项目
批准号:61803209
批准年份:2018
资助金额:26.00
项目类别:青年科学基金项目
批准号:11272002
批准年份:2012
资助金额:90.00
项目类别:面上项目
批准号:50579045
批准年份:2005
资助金额:29.00
项目类别:面上项目
批准号:60403019
批准年份:2004
资助金额:24.00
项目类别:青年科学基金项目
批准号:41501268
批准年份:2015
资助金额:20.00
项目类别:青年科学基金项目
批准号:51679165
批准年份:2016
资助金额:62.00
项目类别:面上项目
批准号:60773075
批准年份:2007
资助金额:28.00
项目类别:面上项目

相似国自然基金

1

定性指标偏好感知进化优化及在个性化搜索中的应用

批准号:61473298
批准年份:2014
负责人:孙晓燕
学科分类:F0601
资助金额:83.00
项目类别:面上项目
2

XML数据个性化柔性查询关键技术的研究

批准号:61003162
批准年份:2010
负责人:孟祥福
学科分类:F06
资助金额:18.00
项目类别:青年科学基金项目
3

基于通用加权XML模型的个性化用户兴趣本体研究

批准号:71103081
批准年份:2011
负责人:李树青
学科分类:G0414
资助金额:19.00
项目类别:青年科学基金项目
4

社会网络中个性化隐私保护研究

批准号:61173140
批准年份:2011
负责人:孙宇清
学科分类:F0207
资助金额:55.00
项目类别:面上项目