基于DOM树语义修剪的藏文Web信息提取算法研究

基本信息
批准号:60763010
项目类别:地区科学基金项目
资助金额:8.00
负责人:珠杰
学科分类:
依托单位:西藏大学
批准年份:2007
结题年份:2008
起止时间:2008-01-01 - 2008-12-31
项目状态: 已结题
项目参与者:欧珠,边巴嘉措,仁青诺布,尼玛扎西,格桑多吉,普次仁,顿珠次仁,赵栋材
关键词:
藏文Web信息提取DOM树语义特征分析
结项摘要

在本项目的藏文Web信息提取中,建立DOM树算法的基础上,通过网页脚本的语义分析和藏文网页中藏文语义和语法的特征分析,对DOM树进行语义修剪算法研究,并通过修剪的DOM树,结合小型的语料库,进行主题信息块的路径识别和模式发现,然后提取到的信息转存到数据库中。 .在研究过程中通过藏文网页的采集,转化成XML格式的文件,建立藏文网页文档库,为算法的测试提供基础。其次在文档库中选择藏文样本网页进行训练,并建立规则库。根据规则从藏文网页文档库中提取藏文文本,建立藏文网络信息数据库。

项目摘要

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
3

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
4

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
5

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015

珠杰的其他基金

批准号:61262058
批准年份:2012
资助金额:43.00
项目类别:地区科学基金项目

相似国自然基金

1

Web 多媒体语义分析与算法研究

批准号:60672114
批准年份:2006
负责人:封化民
学科分类:F0113
资助金额:8.00
项目类别:面上项目
2

基于依存关系的藏文语义角色标注研究

批准号:61363057
批准年份:2013
负责人:祁坤钰
学科分类:F0211
资助金额:43.00
项目类别:地区科学基金项目
3

语义Web的无尺度网络模型及高性能语义搜索算法研究

批准号:60503018
批准年份:2005
负责人:陈华钧
学科分类:F06
资助金额:23.00
项目类别:青年科学基金项目
4

藏文Web信息的社会网络动态演化机理研究

批准号:61262058
批准年份:2012
负责人:珠杰
学科分类:F0607
资助金额:43.00
项目类别:地区科学基金项目