开放式文档同构引擎(ODIE)研究

基本信息

批准号：60502032

项目类别：青年科学基金项目

资助金额：18.00

负责人：刘功申

学科分类：

依托单位：上海交通大学

批准年份：2005

结题年份：2008

起止时间：2006-01-01 - 2008-12-31

项目状态：已结题

项目参与者：薛质,李翔,苏贵洋,王强民,李强,孙强,林祥,熊静娴,张晓霞

关键词：

内容安全信息处理自然语言处理文档结构

结项摘要

在内容安全领域，基于文本信息的内容安全产品都必须对文本进行语义理解和不良（例如，色情、反动等）信息过滤。这类产品（包括垃圾邮件过滤系统、内容网关系统、BBS监管系统等等）都面临着一个统一的问题，即从各式各样的文档中提取出用于理解和过滤的纯文本信息。由于现实世界中的文档具有格式复杂且多样等特性，大多数系统都回避了这个难点问题，所以，对于附件或协议所携带文档，现有系统仅仅过滤了文档的标题、后缀和大小信息。由于获取多格式文档的内容一直是一个难点，所以对这些文档的内容过滤一直是一个空白。该课题的目标是实现一个可以获取多种常见格式文档内容的开放式引擎，从多种多样的文档格式中获取纯文本内容及其所代表的语义,并提供给其它高层系统使用。为此，本课题提出了开放式文档层次模型的概念，介绍了获取格式全信息将要采用的关键技术。多格式文档的同构化可以使其他应用系统摆脱文档分析这个难点，而只专注于系统本身的专有技术。

项目摘要

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.13197/j.eeev.2019.05.95.fuwq.009

发表时间：2019

DOI：10.6041/j.issn.1000-1298.2022.07.022

发表时间：2022

DOI：10.13191/j.chj.2017.0028

发表时间：2016

DOI：

发表时间：2017

DOI：

发表时间：

刘功申的其他基金

批准号：61272441

批准年份：2012

资助金额：20.00

项目类别：面上项目

批准号：61772337

批准年份：2017

资助金额：61.00

项目类别：面上项目

相似国自然基金

群的自同构和自同构群的研究

批准号：10671058

批准年份：2006

负责人：刘合国

学科分类：A0104

资助金额：22.00

项目类别：面上项目

群组查询引擎

批准号：61702449

批准年份：2017

负责人：江大伟

学科分类：F0202

资助金额：22.00

项目类别：青年科学基金项目

基于词义的文档表示模型及多语亚文档主题分析研究

批准号：61272233

批准年份：2012

负责人：夏云庆

学科分类：F0211

资助金额：82.00

项目类别：面上项目

GIS信息映射引擎的研究

批准号：60172024

批准年份：2001

负责人：唐中实

学科分类：F0113

资助金额：20.00

项目类别：面上项目

开放式文档同构引擎(ODIE)研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于被动变阻尼装置高层结构风振控制效果对比分析

基于改进LinkNet的寒旱区遥感图像河流识别方法

血管内皮细胞线粒体动力学相关功能与心血管疾病关系的研究进展

基于SSR 的西南地区野生菰资源遗传多样性及遗传结构分析

石萆汤对弱精子症患者精子线粒体膜蛋白PHB及超微结构的影响

刘功申的其他基金

面向网络舆论的定题情感分析技术研究

文本纹理模型及其在涉恐情报分析领域的应用研究

相似国自然基金

开放式文档同构引擎(ODIE)研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于被动变阻尼装置高层结构风振控制效果对比分析

基于改进LinkNet的寒旱区遥感图像河流识别方法

血管内皮细胞线粒体动力学相关功能与心血管疾病关系的研究进展

基于SSR 的西南地区野生菰资源 遗传多样性及遗传结构分析

石萆汤对弱精子症患者精子线粒体膜蛋白PHB及超微结构的影响

刘功申的其他基金

面向网络舆论的定题情感分析技术研究

文本纹理模型及其在涉恐情报分析领域的应用研究

相似国自然基金

基于SSR 的西南地区野生菰资源遗传多样性及遗传结构分析