汉字识别文本自动输入中若干重要问题的进一步研究

基本信息
批准号:69472007
项目类别:面上项目
资助金额:6.00
负责人:丁晓青
学科分类:
依托单位:清华大学
批准年份:1994
结题年份:1997
起止时间:1995-01-01 - 1997-12-31
项目状态: 已结题
项目参与者:丁晓青,郭繁夏,郭宏,贾红,张忠,胡庆文,马兵,蔡东辉,黄斐萍,许剑辉
关键词:
汉字识别文本自动输入汉英混合识别
结项摘要

在多字体汉英混排印刷文本识别实用化性能提高若干重要问题的研究获得重要进展,主要在⑴低质量印刷文本识别本的提高:核心在于汉字识别特征的提取,从理论上应提取高有效信息熵的特征,在实际上筛选出适合汉字识别高鲁棒性的特征,极大提高了低质量印刷文本的识别率。在体系结构上,采取多识别方案的综合集成方法,更进一步有效地提高了识别率和鲁棒性。⑵多文种混排文本的识别,最常迁到的是汉英混排队的双语文本识别,最佳识别方案是在混排文本首先进行语种的辨识和然后按不同语种分别进行纠字切分和不同语种的识别和后处理。进行文种的辨识,如汉字和英文的辨识主要依靠不同文字的统计特性的区别。研究成果为THOCR-94和THOCR-97多文种汉字识别系统。

项目摘要

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于改进LinkNet的寒旱区遥感图像河流识别方法

基于改进LinkNet的寒旱区遥感图像河流识别方法

DOI:10.6041/j.issn.1000-1298.2022.07.022
发表时间:2022
2

基于直观图的三支概念获取及属性特征分析

基于直观图的三支概念获取及属性特征分析

DOI:10.3778/j.issn.1673-9418.2104120
发表时间:
3

基于速变LOS的无人船反步自适应路径跟踪控制

基于速变LOS的无人船反步自适应路径跟踪控制

DOI:10.19693/j.issn.1673-3185.01377
发表时间:2019
4

GF-4序列图像的云自动检测

GF-4序列图像的云自动检测

DOI:CNKI:SUN:YGXB.0.2018-01-012
发表时间:2018
5

基于小波高阶统计量的数字图像来源取证方法

基于小波高阶统计量的数字图像来源取证方法

DOI:
发表时间:2017

丁晓青的其他基金

批准号:61032008
批准年份:2010
资助金额:230.00
项目类别:重点项目
批准号:60472002
批准年份:2004
资助金额:22.00
项目类别:面上项目
批准号:69972024
批准年份:1999
资助金额:13.00
项目类别:面上项目
批准号:69682003
批准年份:1996
资助金额:14.50
项目类别:专项基金项目
批准号:60241005
批准年份:2002
资助金额:15.00
项目类别:专项基金项目

相似国自然基金

1

汉字识别研究中若干核心问题的新开拓

批准号:69972024
批准年份:1999
负责人:丁晓青
学科分类:F0113
资助金额:13.00
项目类别:面上项目
2

基于合成样本和MCE准则下判别学习的汉字手写文本识别研究

批准号:60975020
批准年份:2009
负责人:张田文
学科分类:F0605
资助金额:32.00
项目类别:面上项目
3

基于多种知识的脱机手写体汉字文本识别方法研究

批准号:69675004
批准年份:1996
负责人:马少平
学科分类:F0605
资助金额:9.00
项目类别:面上项目
4

以知识为基础的文本图像理解和汉字识别及处理的研究

批准号:68872003
批准年份:1988
负责人:吴佑寿
学科分类:F0116
资助金额:5.00
项目类别:面上项目