文本复制取证是为判断一个文本的内容是否抄袭、剽窃或复制于另外一个或多个文本提供证据,是打击抄袭、剽窃、盗版等侵权行为的有效手段,是数字取证的一个重要分支,是近年才发展起来的一个新兴的重要研究领域。基于内容的文本复制取证是文本复制取证的发展方向。本课题拟对多语言共存文本的复制取证中涉及到的文本指纹提取、文本指纹索引与压缩、复制取证策略等关键内容进行深入研究,力图减少多语言共存文本复制取证的存储开销、加快取证的速度、提高取证的精度。课题的主要研究内容包括:基于N-gram的文本指纹提取方法、N-gram项的指纹权重计算方法、基于N-gram的指纹索引与压缩方法、文本复制取证优化策略和文本复制取证原型系统的建立等。通过课题的研究,将在基于N-gram的文本指纹提取、适用于多语言共存文本的文本复制取证等方面完善自然语言文本复制取证的基本理论和方法,为推动自然语言文本取证的发展提供技术支撑。
文本复制取证是为判断一个文本的内容是否抄袭、剽窃或复制于另外一个或多个文本提供证据,是打击抄袭、剽窃、盗版等侵权行为的有效手段,是数字取证的一个重要分支,是近年才发展起来的一个新兴的重要研究领域。基于内容的文本复制取证是文本复制取证的发展方向。本课题对多语言共存文本的复制取证中涉及到的文本指纹提取、文本指纹索引与压缩、复制取证策略等关键内容进行了深入的研究。通过课题的研究,课题组成员提出了多种文本复制取证的方法与关键技术,发表了学术论文17篇,其中被SCI收录7篇、EI收录15篇,培养博士生5名,硕士生3名。
{{i.achievement_title}}
数据更新时间:2023-05-31
面向人机交互的数字孪生系统工业安全控制体系与关键技术
Design, synthesis and antimycobacterial activity of new benzothiazinones inspired by rifampicin/rifapentine
Effects of sediment burial disturbance on macro and microelement dynamics in decomposing litter of Phragmites australis in the coastal marsh of the Yellow River estuary, China
融合字符串特征的维吾尔语形态切分
Ketjen black carbon supported CoO@Co-N-C nanochains as an efficient electrocatalyst for oxygen evolution
基于可比语料的多语言文本聚类研究
多语言智能文本处理中基于主题语义空间的文本表示研究
基于云计算的文本复制检测研究
基于多语言微博文本的新疆热点事件检测关键技术研究