基于朴素贝叶斯算法的藏文垃圾短信过滤研究

基本信息
批准号:61262086
项目类别:地区科学基金项目
资助金额:43.00
负责人:拥措
学科分类:
依托单位:西藏大学
批准年份:2012
结题年份:2017
起止时间:2013-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:群诺,多吉仁欠,冯炎,嘎玛扎西,更尕易西,次曲,尼洛琼达,拉龙东智
关键词:
朴素卑叶斯藏文特征提取垃圾短信短信过滤
结项摘要

In recent years, The R & D and promotion of Tibetan mobile terminals are developping vigorously, it has played a far-reaching significance for the development of Tibetan culture, but at the same time this brought great challenges to information security. The project intends to study the Tibetan SMS spam, combined with Tibetan characteristics, the Naive Bayes algorithm which widely used in Chinese text categorization, is applied in the Tibetan spam filtering. Through collection of real Tibetan SMS to create Tibetan SMS corpus, study automatic identification of coding and conversion technology for common Tibetan phone,Tibetan SMS automatic segmentation and feature extraction of Tibetan spam messages, analysis and evaluation for the Bayesian classification model, explore the effective way for the Tibetan spam filtering.

近年来藏文移动终端的研发和推广工作蓬勃发展,对藏文化的发展起到了深远的意义,但同时对信息安全带来了巨大挑战。本项目拟研究分析藏文垃圾短信,结合藏文自身的特点,把广泛适用于中文文本分类的朴素贝叶斯算法应用在藏文垃圾短信过滤研究上,通过收集真实藏文短信来建立藏文短信语料库,研究国内外常见藏文手机编码自动识别和转换、藏文短信自动分词和藏文垃圾短信特征项提取等关键技术,对贝叶斯分类模型进行了结果分析与评估,探索藏文垃圾短信过滤的有效方法。

项目摘要

本项目在国家自然基金的资助下,通过建立藏文短信语料库,研究了藏文手机编码自动识别和转换、藏文短信自动分词和藏文垃圾短信特征项提取等关键技术,对朴素贝叶斯分类模型进行了结果分析与评估,分析结果表明,基于二元特征的TF-IDF特征的Multinomial Naive Bayes算法较与其他贝叶斯算法在藏文垃圾短信过滤上有较好的优势。这个研究对探索藏文垃圾短信有效过滤方法提供了一定的参考。通过本项目已经完成了六篇论文,其中四篇已发表(两篇EI检索)。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

DOI:10.11821/dlyj020190689
发表时间:2020
3

转录组与代谢联合解析红花槭叶片中青素苷变化机制

转录组与代谢联合解析红花槭叶片中青素苷变化机制

DOI:
发表时间:
4

青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化

青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化

DOI:10.3799/dqkx.2020.083
发表时间:2020
5

基于FTA-BN模型的页岩气井口装置失效概率分析

基于FTA-BN模型的页岩气井口装置失效概率分析

DOI:10.16265/j.cnki.issn1003-3033.2019.04.015
发表时间:2019

拥措的其他基金

相似国自然基金

1

基于贝叶斯网络的排列算法研究

批准号:60905033
批准年份:2009
负责人:蒋良孝
学科分类:F0603
资助金额:19.00
项目类别:青年科学基金项目
2

贝叶斯网络分类器高效算法研究

批准号:60503017
批准年份:2005
负责人:田凤占
学科分类:F06
资助金额:24.00
项目类别:青年科学基金项目
3

基于MCMC算法的非线性贝叶斯估计方法及其应用

批准号:11171117
批准年份:2011
负责人:刘金山
学科分类:A0402
资助金额:32.00
项目类别:面上项目
4

基于贝叶斯压缩感知的稀疏阵列高分辨测向算法研究

批准号:61701408
批准年份:2017
负责人:杨杰
学科分类:F0111
资助金额:22.00
项目类别:青年科学基金项目