现有技术在deep Web数据源排序方面,仅考虑了查询接口网页与主题关键字的相关度,忽视了同一主题的多个数据源之间在数据质量方面的差别以及之间的相互包含覆盖关系。本项目研究具有低查询费用和高样本代表性的样本查询选择方法,该方法利用关系属性与值分布、属性值联系规则挖掘和启发式方法提高查询效率和样本对全局数据库的代表性;研究deep Web数据源质量和覆盖关系建模;研究由样本查询得到的样本数据库对各个数据源质量和覆盖关系进行交互比较自动估计、增量估计、聚簇分析和最小覆盖集计算;研究基于数据源质量和覆盖估计,对同一主题的deep Web数据源排序的算法。该研究内容是海量Web信息搜索和综合利用的共性应用基础理论问题。该研究成果将提高目前deep Web搜索的排序质量和用户体验,可作为deep Web集成中数据源选择的重要依据,可加深对隐藏的deep Web数据源的质量、分布及其演变的理解。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
Vibration suppression of drilling tool system during deep-hole drilling process using independence mode space control
肉苁蓉种子质量评价及药材初加工研究
中外学术论文与期刊的宏观差距分析及改进建议
资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据
基于多数据源的Web服务QoS度量方法研究
基于本体的Deep Web搜索技术
面向Deep Web的数据整合关键技术研究
Deep Web数据集成查询结果抽取与整合关键技术研究