基于朴素贝叶斯算法的藏文垃圾短信过滤研究

基本信息
批准号:61262086
项目类别:地区科学基金项目
资助金额:43.00
负责人:拥措
学科分类:
依托单位:西藏大学
批准年份:2012
结题年份:2017
起止时间:2013-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:群诺,多吉仁欠,冯炎,嘎玛扎西,更尕易西,次曲,尼洛琼达,拉龙东智
关键词:
朴素卑叶斯藏文特征提取垃圾短信短信过滤
结项摘要

In recent years, The R & D and promotion of Tibetan mobile terminals are developping vigorously, it has played a far-reaching significance for the development of Tibetan culture, but at the same time this brought great challenges to information security. The project intends to study the Tibetan SMS spam, combined with Tibetan characteristics, the Naive Bayes algorithm which widely used in Chinese text categorization, is applied in the Tibetan spam filtering. Through collection of real Tibetan SMS to create Tibetan SMS corpus, study automatic identification of coding and conversion technology for common Tibetan phone,Tibetan SMS automatic segmentation and feature extraction of Tibetan spam messages, analysis and evaluation for the Bayesian classification model, explore the effective way for the Tibetan spam filtering.

近年来藏文移动终端的研发和推广工作蓬勃发展,对藏文化的发展起到了深远的意义,但同时对信息安全带来了巨大挑战。本项目拟研究分析藏文垃圾短信,结合藏文自身的特点,把广泛适用于中文文本分类的朴素贝叶斯算法应用在藏文垃圾短信过滤研究上,通过收集真实藏文短信来建立藏文短信语料库,研究国内外常见藏文手机编码自动识别和转换、藏文短信自动分词和藏文垃圾短信特征项提取等关键技术,对贝叶斯分类模型进行了结果分析与评估,探索藏文垃圾短信过滤的有效方法。

项目摘要

本项目在国家自然基金的资助下,通过建立藏文短信语料库,研究了藏文手机编码自动识别和转换、藏文短信自动分词和藏文垃圾短信特征项提取等关键技术,对朴素贝叶斯分类模型进行了结果分析与评估,分析结果表明,基于二元特征的TF-IDF特征的Multinomial Naive Bayes算法较与其他贝叶斯算法在藏文垃圾短信过滤上有较好的优势。这个研究对探索藏文垃圾短信有效过滤方法提供了一定的参考。通过本项目已经完成了六篇论文,其中四篇已发表(两篇EI检索)。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

城市生活垃圾热值的特征变量选择方法及预测建模

城市生活垃圾热值的特征变量选择方法及预测建模

DOI:10.11936/bjutxb2021010011
发表时间:2021
2

基于小波高阶统计量的数字图像来源取证方法

基于小波高阶统计量的数字图像来源取证方法

DOI:
发表时间:2017
3

壳斗科植物四种扁趾铁甲潜叶习性生物学特性

壳斗科植物四种扁趾铁甲潜叶习性生物学特性

DOI:
发表时间:2017
4

基于离散Morse理论的散乱点云特征提取

基于离散Morse理论的散乱点云特征提取

DOI:10.3788/AOS201939.0615002
发表时间:2019
5

基于神经网络方法获得最优化月球内部结构模型

基于神经网络方法获得最优化月球内部结构模型

DOI:10.6038/cjg2022o0237
发表时间:2022

拥措的其他基金

相似国自然基金

1

基于贝叶斯网络的排列算法研究

批准号:60905033
批准年份:2009
负责人:蒋良孝
学科分类:F0603
资助金额:19.00
项目类别:青年科学基金项目
2

贝叶斯网络分类器高效算法研究

批准号:60503017
批准年份:2005
负责人:田凤占
学科分类:F06
资助金额:24.00
项目类别:青年科学基金项目
3

基于MCMC算法的非线性贝叶斯估计方法及其应用

批准号:11171117
批准年份:2011
负责人:刘金山
学科分类:A0402
资助金额:32.00
项目类别:面上项目
4

基于贝叶斯压缩感知的稀疏阵列高分辨测向算法研究

批准号:61701408
批准年份:2017
负责人:杨杰
学科分类:F0111
资助金额:22.00
项目类别:青年科学基金项目