融合深层语义理解的网络水军发帖自动检测技术研究

基本信息
批准号:61203281
项目类别:青年科学基金项目
资助金额:25.00
负责人:徐博
学科分类:
依托单位:中国科学院自动化研究所
批准年份:2012
结题年份:2015
起止时间:2013-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:吴高巍,田冠华,孙正雅,庄涛,王昊
关键词:
特征描述测度学习深层语义理解网络水军检测
结项摘要

Internet water army is very harmful to the society and has negative effects to the normal order of the network, which need the research and management. However, the research on the water army is still in the very beginning stages both at home and abroad. This field needs effective theory and related research towards the detection of the paid posters. This project aims to propose an automatic water army detection framework by combining natural language processing and statistical machine learning. The research content of our project includes: establishing the action description and feature generation algorithm to the water army which transforms the detection problem to computational pattern classification model; the research on algorithms of deep semantic sentence similarity computation assist the machine understanding post's meaning and provide an important evidence for the detection of water army; constructing metric learning models for the multi-model distribution of water army's feature to solve the learning problem on large-scale multi-model distribution samples. The construction of water army automatic detection platform is aimed to verify the proposed feature description, metric learning model and solve the water army detection problem fundamentally.

网络水军危害社会、影响正常的网络秩序,需要研究和治理。然而目前国内外对于网络水军的研究尚处于起步阶段,还没有提出有效的针对网络水军发帖的检测方法。本项目以网络水军发帖的自动检测方法研究为目标,通过结合自然语言理解及统计机器学习的研究成果,提出针对网络水军发帖的自动检测框架,为研究解决网络水军发帖自动检测提供解决方法和途径。研究内容包括:建立网络水军的多特征描述和生成方法,从而将网络水军发帖检测问题转化成一个模式分类的可计算问题;基于深层语义的句子相似度计算方法研究是机器能从语义层面理解发帖内容并检测网络水军发帖的一个重要基础;建立针对网络水军类内多模态分布的测度学习模型,以解决大样本多模态分布学习的难题。通过建立网络水军自动检测系统平台对本项目提出的特征描述、测度学习模型进行实践验证,并从根本上解决网络水军发帖的检测问题。

项目摘要

网络水军危害社会、影响正常的网络秩序,需要研究和治理。然而目前国内外对于网络水军的研究尚处于起步阶段,还没有提出有效的针对网络水军发帖的检测方法。本项目以网络水军发帖的自动检测方法研究为目标,通过结合自然语言理解及统计机器学习的研究成果,提出针对网络水军发帖的自动检测框架,为研究解决网络水军发帖自动检测提供解决方法和途径。本项目构建了微博数据实时爬取与自动分类系统平台;同时分析了微博数据的特征,提出了多种特征描述和生成的方法以及基于机器学习的测度学习和分类模型以及多种微博数据的语义匹配算法和微博自动摘要算法。该项目的短文本分类、语义匹配、自动摘要等技术已和南京某安全系统研究所合作,成功应用于短文本的智能分析系统中,并在全国多个地方部署。项目开展期间超额完成预期的6-8篇论文目标,总共发表SCI论文1篇,EI论文13篇,申请专利7项,软件著作权3项。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
2

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
3

城市轨道交通车站火灾情况下客流疏散能力评价

城市轨道交通车站火灾情况下客流疏散能力评价

DOI:
发表时间:2015
4

基于FTA-BN模型的页岩气井口装置失效概率分析

基于FTA-BN模型的页岩气井口装置失效概率分析

DOI:10.16265/j.cnki.issn1003-3033.2019.04.015
发表时间:2019
5

基于全模式全聚焦方法的裂纹超声成像定量检测

基于全模式全聚焦方法的裂纹超声成像定量检测

DOI:10.19650/j.cnki.cjsi.J2007019
发表时间:2021

徐博的其他基金

相似国自然基金

1

基于词汇语义网络的中文深层语义分析

批准号:61872402
批准年份:2018
负责人:邵艳秋
学科分类:F0211
资助金额:64.00
项目类别:面上项目
2

视觉语义启发的视频事件理解技术研究

批准号:61201319
批准年份:2012
负责人:邹晓春
学科分类:F0113
资助金额:26.00
项目类别:青年科学基金项目
3

融合语义相似性和关联性的深层主题模型研究

批准号:61602036
批准年份:2016
负责人:高扬
学科分类:F0211
资助金额:21.00
项目类别:青年科学基金项目
4

融合社交语义环境的网络图像标注关键技术研究

批准号:61402174
批准年份:2014
负责人:张静
学科分类:F0210
资助金额:24.00
项目类别:青年科学基金项目