跨语言文本自动分类关键技术研究

基本信息
批准号:60803050
项目类别:青年科学基金项目
资助金额:19.00
负责人:代六玲
学科分类:
依托单位:北京理工大学
批准年份:2008
结题年份:2011
起止时间:2009-01-01 - 2011-12-31
项目状态: 已结题
项目参与者:刘万春,张晓丹,赵育民,李奇,汤继良
关键词:
信息检索文本挖掘跨语言文本分类
结项摘要

文本分类是文本挖掘的关键性和基础性问题之一。日益加快的全球一体化进程对跨语言的文本分类技术提出了迫切的需求。虽然目前研究者们已经进行了大量的文本分类相关研究工作,但是针对的跨语言文本分类问题的研究比较匮乏,限制了跨文本挖掘的发展和应用。本项目将针对多语言环境下跨语言文本分类的关键问题进行深入研究。具体研究内容包括:(1)基于特征概念的文本表示方法和特征概念的提取方法;(2)跨语言的文本相似度计算方法和类别判定方法;(3)中英跨语言分类测试语料集合的建立,实现原型系统,对算法进行评价和改进。通过本项目的研究,不仅能突破跨语言文本分类的难题,还可为跨语言的信息检索和文本挖掘提供有效的基础算法,使更大范围和更深层次的跨语言应用成为可能。

项目摘要

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
2

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015
3

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021
4

环境信息披露会影响分析师盈余预测吗?

环境信息披露会影响分析师盈余预测吗?

DOI:
发表时间:2017
5

基于关系对齐的汉语虚词抽象语义表示与分析

基于关系对齐的汉语虚词抽象语义表示与分析

DOI:
发表时间:2020

代六玲的其他基金

相似国自然基金

1

中文文本自动分类关键技术研究

批准号:60573187
批准年份:2005
负责人:孙茂松
学科分类:F0211
资助金额:26.00
项目类别:面上项目
2

面向英汉双向跨语言图像检索的文本分析关键技术研究

批准号:61170095
批准年份:2011
负责人:张玥杰
学科分类:F0211
资助金额:57.00
项目类别:面上项目
3

跨语言文本复制检测研究

批准号:60903123
批准年份:2009
负责人:鲍军鹏
学科分类:F0211
资助金额:19.00
项目类别:青年科学基金项目
4

跨语言敏感事件抽取关键技术研究

批准号:61672368
批准年份:2016
负责人:洪宇
学科分类:F0211
资助金额:62.00
项目类别:面上项目