跨语言文本自动分类关键技术研究

基本信息

批准号：60803050

项目类别：青年科学基金项目

资助金额：19.00

负责人：代六玲

学科分类：

依托单位：北京理工大学

批准年份：2008

结题年份：2011

起止时间：2009-01-01 - 2011-12-31

项目状态：已结题

项目参与者：刘万春,张晓丹,赵育民,李奇,汤继良

关键词：

信息检索文本挖掘跨语言文本分类

结项摘要

文本分类是文本挖掘的关键性和基础性问题之一。日益加快的全球一体化进程对跨语言的文本分类技术提出了迫切的需求。虽然目前研究者们已经进行了大量的文本分类相关研究工作，但是针对的跨语言文本分类问题的研究比较匮乏，限制了跨文本挖掘的发展和应用。本项目将针对多语言环境下跨语言文本分类的关键问题进行深入研究。具体研究内容包括：（1）基于特征概念的文本表示方法和特征概念的提取方法；（2）跨语言的文本相似度计算方法和类别判定方法；（3）中英跨语言分类测试语料集合的建立，实现原型系统，对算法进行评价和改进。通过本项目的研究，不仅能突破跨语言文本分类的难题，还可为跨语言的信息检索和文本挖掘提供有效的基础算法，使更大范围和更深层次的跨语言应用成为可能。

项目摘要

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：

DOI：10.3724/SP.J.1089.2019.17435

发表时间：2019

DOI：10.7498/aps.68.20181682

发表时间：2019

DOI：10.13376/j.cbls/2021092

发表时间：2021

DOI：10.11936/bjutxb2021010011

发表时间：2021

代六玲的其他基金

相似国自然基金

中文文本自动分类关键技术研究

批准号：60573187

批准年份：2005

负责人：孙茂松

学科分类：F0211

资助金额：26.00

项目类别：面上项目

面向英汉双向跨语言图像检索的文本分析关键技术研究

批准号：61170095

批准年份：2011

负责人：张玥杰

学科分类：F0211

资助金额：57.00

项目类别：面上项目

跨语言文本复制检测研究

批准号：60903123

批准年份：2009

负责人：鲍军鹏

学科分类：F0211

资助金额：19.00

项目类别：青年科学基金项目

跨语言敏感事件抽取关键技术研究

批准号：61672368

批准年份：2016

负责人：洪宇

学科分类：F0211

资助金额：62.00

项目类别：面上项目

跨语言文本自动分类关键技术研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

信息熵-保真度联合度量函数的单幅图像去雾方法

高分五号卫星多角度偏振相机最优化估计反演:角度依赖与后验误差分析

骨外器官来源外泌体对骨骼调控作用的研究进展

城市生活垃圾热值的特征变量选择方法及预测建模

代六玲的其他基金

相似国自然基金