基于语言特性分析的互联网伪信息的自动识别与评估研究

基本信息
批准号:61170114
项目类别:面上项目
资助金额:55.00
负责人:赵海
学科分类:
依托单位:上海交通大学
批准年份:2011
结题年份:2015
起止时间:2012-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:姚天昉,苏贵洋,杨德印,王晓林,张剑,惠聪,马学喆,张晓甜,陈文俊
关键词:
伪信息语言特性分析机器学习
结项摘要

本项目研究探讨使用语言特性分析来自动评估互联网文本信息的可靠性问题。为此,定义可靠性和真实性不足的信息为伪信息。包含伪信息的网络文本和主要企图欺骗搜索引擎的传统网页垃圾不同,其主要针对对象是互联网用户本身,即,试图欺骗或者误导它的阅读者。当今互联网上的伪信息分布泛滥及其严重的危害性迫切要求适当的技术手段加以应对。本项目通过明确定义可计算的伪信息(在此主要指文本伪信息),以及应用和发展基于语言特性分析的方法,使用两种新型的机器学习模型集成多重知识源来有效地自动鉴别这类信息。其中,多种基础性的自然语言处理技术,包括相似文本检索、语言风格识别、连贯性检测、命名实体分布统计、表达强度词典构建等针对性地用于实现伪信息特征表示。本项目有望最终发展出一整套系统化的技术框架来有效应对已日益严重的伪信息现象并针对性发展出一系列相关的基础自然语言处理技术。

项目摘要

本项目针对的目标是研究一整套相关的自然语言处理技术,自动检测具有欺骗性的网络垃圾评论及其衍生的文字媒体内容,其表现为水文、软文,在本项目中定义为“伪信息”。.本项目在执行中圆满完成了项目规划的研究目标,包括预定的语料标注、系统实现以及相关的各项关键技术研发,并有所额外拓展。本研究项目所涉及的是一个高度困难的文本级处理任务,要进行良好处理,我们在研究中发现,这需要涉及多种不同层面的语言处理子任务,因此,本项目资助下的技术创新除包括处理本项任务所涉及的传统文本分类的改进之外,还包括特别引入的心理学和认知科学方面的特征,以及更多的复杂深层次语言学特征,更包括最近几年兴起的深层神经网络方面的新型技术。本项目的关键技术研发始于实际的应用需求,但是在技术和理论上获得了意外的创新性的结果,导向了将认知科学和心理学与文本处理结合的新型道路(据我们最大范围所知,目前有关的综合研究鲜见报道)。这是本项目资助下的技术发展的最为显著性的学术性收获。在工程实验工作上,我们报告了鼓舞人心的结果,在研究成果上,有关工作发表在本领域顶级会议和期刊上(包括CCF-A/B类论文12篇,C类5篇)。我们在相关语言处理任务的技术评测上,也连续取得优异成绩。在衍生的相关应用领域研究上,包括中文深层处理、机器翻译和人机对话等多个领域也有所贡献。我们注重人才培养以及相关学术交流,本项目资助下,已累计培养各级学位学生23名,并成功举办第六届青年计算语言学会议以及PACLIC-29国际会议。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
3

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
4

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
5

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015

赵海的其他基金

批准号:60973022
批准年份:2009
资助金额:29.00
项目类别:面上项目
批准号:69873007
批准年份:1998
资助金额:10.00
项目类别:面上项目
批准号:60903119
批准年份:2009
资助金额:18.00
项目类别:青年科学基金项目
批准号:61672343
批准年份:2016
资助金额:16.00
项目类别:面上项目
批准号:U1836222
批准年份:2018
资助金额:252.00
项目类别:联合基金项目

相似国自然基金

1

基于互联网网民言论信息的口碑监测、分析与管理研究

批准号:71073006
批准年份:2010
负责人:谢新洲
学科分类:G0414
资助金额:30.00
项目类别:面上项目
2

基于多光谱成像技术的稻飞虱自动识别与危害评估研究

批准号:60968001
批准年份:2009
负责人:冯洁
学科分类:F0508
资助金额:24.00
项目类别:地区科学基金项目
3

互联网上基于概念分析的文本信息监控技术研究

批准号:60402019
批准年份:2004
负责人:李生红
学科分类:F0117
资助金额:21.00
项目类别:青年科学基金项目
4

基于多种信息处理技术的面色诊信息自动识别研究

批准号:30600796
批准年份:2006
负责人:李福凤
学科分类:H3106
资助金额:23.00
项目类别:青年科学基金项目