基于DOM树语义修剪的藏文Web信息提取算法研究

基本信息

批准号：60763010

项目类别：地区科学基金项目

资助金额：8.00

负责人：珠杰

学科分类：

依托单位：西藏大学

批准年份：2007

结题年份：2008

起止时间：2008-01-01 - 2008-12-31

项目状态：已结题

项目参与者：欧珠,边巴嘉措,仁青诺布,尼玛扎西,格桑多吉,普次仁,顿珠次仁,赵栋材

关键词：

藏文Web信息提取DOM树语义特征分析

结项摘要

在本项目的藏文Web信息提取中，建立DOM树算法的基础上，通过网页脚本的语义分析和藏文网页中藏文语义和语法的特征分析，对DOM树进行语义修剪算法研究，并通过修剪的DOM树，结合小型的语料库，进行主题信息块的路径识别和模式发现，然后提取到的信息转存到数据库中。 .在研究过程中通过藏文网页的采集，转化成XML格式的文件，建立藏文网页文档库，为算法的测试提供基础。其次在文档库中选择藏文样本网页进行训练，并建立规则库。根据规则从藏文网页文档库中提取藏文文本，建立藏文网络信息数据库。

项目摘要

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：

DOI：10.11842/wst.20190724002

发表时间：2020

DOI：10.1007/s11192-020-03387-8

发表时间：2020

DOI：10.7498/aps.68.20181682

发表时间：2019

DOI：10.3778/j.issn.1673-9418.2104120

发表时间：

珠杰的其他基金

批准号：61262058

批准年份：2012

资助金额：43.00

项目类别：地区科学基金项目

相似国自然基金

Web 多媒体语义分析与算法研究

批准号：60672114

批准年份：2006

负责人：封化民

学科分类：F0113

资助金额：8.00

项目类别：面上项目

基于依存关系的藏文语义角色标注研究

批准号：61363057

批准年份：2013

负责人：祁坤钰

学科分类：F0211

资助金额：43.00

项目类别：地区科学基金项目

语义Web的无尺度网络模型及高性能语义搜索算法研究

批准号：60503018

批准年份：2005

负责人：陈华钧

学科分类：F06

资助金额：23.00

项目类别：青年科学基金项目

藏文Web信息的社会网络动态演化机理研究

批准号：61262058

批准年份：2012

负责人：珠杰

学科分类：F0607

资助金额：43.00

项目类别：地区科学基金项目

基于DOM树语义修剪的藏文Web信息提取算法研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

A tale of two databases: the use of Web of Science and Scopus in academic papers

高分五号卫星多角度偏振相机最优化估计反演:角度依赖与后验误差分析

基于直观图的三支概念获取及属性特征分析

珠杰的其他基金

藏文Web信息的社会网络动态演化机理研究

相似国自然基金