互联网中大规模的超链接拓扑结构包含了传统数据环境所没有的丰富信息,如链接数目的幂法则分布,连通域的规模等,对该结构进行研究可以加速Web信息资源的建设、利用和发展。中国Web链接结构图(简称Web Graph)属于整个互联网的一个很重要的子集,但其也包含了很多本地的特征与性质,这使得对应的很多应用模型也因结构等不同而异。本课题通过对中国Web Graph结构的研究,了解中国Web Graph的宏观结构、微观结构及其结构的各种统计特征,并针对中国Web Graph的结构与特性建立相应的模型,来分析中国Web的发展趋势。与此同时,根据以上分析我们结合数据挖掘,机器学习和信息检索技术来提出更为有效的应用,如在信息检索中分析网页重要性的链接分析算法、加速检索引擎页面更新的网络爬行策略等,来加强信息检索引擎的功能。这些研究对于促进中国互联网的发展,提高中文信息利用的效率与效果都具有十分重要的意义。
{{i.achievement_title}}
数据更新时间:2023-05-31
一种基于多层设计空间缩减策略的近似高维优化方法
基于被动变阻尼装置高层结构风振控制效果对比分析
基于LS-SVM香梨可溶性糖的近红外光谱快速检测
基于改进LinkNet的寒旱区遥感图像河流识别方法
萃取过程中微观到宏观的多尺度超分子组装 --离子液体的特异性功能
Web数据挖掘与知识发现
WEB搜索与挖掘的新理论与方法
Web搜索与挖掘的新理论和新方法—支持舆情监控的Web搜索与挖掘的理论与方法研究
Web社区用户个性挖掘与排序研究