基于类格的多层网页分类技术研究

基本信息
批准号:60863001
项目类别:地区科学基金项目
资助金额:28.00
负责人:雷景生
学科分类:
依托单位:海南大学
批准年份:2008
结题年份:2011
起止时间:2009-01-01 - 2011-12-31
项目状态: 已结题
项目参与者:钟声,杨厚群,冯文龙,张春元,卢春燕,靳婷,符发
关键词:
信息检索Web挖掘文本分类类格
结项摘要

本项目以Internet信息资源的组织与利用为研究目的,将数学方法(格)与现有的机器学习技术、文本自动分类技术融合在一起,提出了一种基于类格的多层网页分类方法。该方法首先建立了一个基于类格的多层网页分类的概念模型,把领域专家对网页提供的分类知识用"类格"来表示,作为训练数据集。在分类知识的学习过程中,通过学习训练数据集,在类格中产生类的分类知识(类索引),并对分类知识进行优化处理,获得提炼的分类知识。在分类过程中,网络Robot自动从Internet上采集网页,经过预处理,从采集的网页中提取项,并进行降维处理,多层网页分类器将采集的网页归属于某一类或多个类。最后,对建立的基于类格的多层网页分类方法进行实验评价。.通过本项目的研究,为充分利用多层网页分类方法进行海量Web信息检索和挖掘的应用提供理论和技术支持,努力实现并提高Web信息处理技术的社会效益和经济效益。

项目摘要

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

格雷类药物治疗冠心病疗效的网状Meta分析

格雷类药物治疗冠心病疗效的网状Meta分析

DOI:10.12092/j.issn.1009-2501.2018.03.010
发表时间:2018
2

中外学术论文与期刊的宏观差距分析及改进建议

中外学术论文与期刊的宏观差距分析及改进建议

DOI:
发表时间:2021
3

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021
4

环境信息披露会影响分析师盈余预测吗?

环境信息披露会影响分析师盈余预测吗?

DOI:
发表时间:2017
5

基于相似日理论和CSO-WGPR的短期光伏发电功率预测

基于相似日理论和CSO-WGPR的短期光伏发电功率预测

DOI:10.13336/j.1003-6520.hve.20201778
发表时间:2021

雷景生的其他基金

批准号:61272437
批准年份:2012
资助金额:82.00
项目类别:面上项目
批准号:61672337
批准年份:2016
资助金额:62.00
项目类别:面上项目
批准号:61073189
批准年份:2010
资助金额:33.00
项目类别:面上项目
批准号:61472236
批准年份:2014
资助金额:85.00
项目类别:面上项目

相似国自然基金

1

基于多样性的自适应粒子群算法的研究及在网页分类中的应用

批准号:60975080
批准年份:2009
负责人:史玉回
学科分类:F0608
资助金额:30.00
项目类别:面上项目
2

格路的计数与分类

批准号:11701419
批准年份:2017
负责人:钟欣欣
学科分类:A0408
资助金额:23.00
项目类别:青年科学基金项目
3

链格孢菌新分类方法及中国链格孢属系统分类研究

批准号:39070003
批准年份:1990
负责人:张天宇
学科分类:C0101
资助金额:2.50
项目类别:面上项目
4

基于集成学习的网页链接作弊检测

批准号:61300190
批准年份:2013
负责人:刘馨月
学科分类:F0205
资助金额:22.00
项目类别:青年科学基金项目