多文种文档图像识别的多层次马尔可夫随机场模型研究

基本信息
批准号:60872086
项目类别:面上项目
资助金额:30.00
负责人:彭良瑞
学科分类:
依托单位:清华大学
批准年份:2008
结题年份:2011
起止时间:2009-01-01 - 2011-12-31
项目状态: 已结题
项目参与者:丁晓青,吴佑寿,刘长松,王言伟,李昕,孙晓路,黄琛
关键词:
半监督学习图像识别多文种文档多层次马尔可夫随机场
结项摘要

近年来,我国汉字及主要少数民族文字等现代印刷文档识别研究已取得重要成果。中华民族文化的信息化及国际化发展亟待更有效地解决多文种印刷及手写文档识别领域中的文种及文档类型扩展问题。本项目在原有研究尚未考虑的文档图像分割和识别统一建模方面,提出系统描述不同文种文档版面分析、文本行字切分和字符识别整个过程的多层次马尔可夫随机场(Hierachical Markov Random Field, HMRF)模型理论方法。研究内容为:对于不同体系文种,在图像页面、区域、文本行、字符多个层次上进行文档图像HMRF模型构造的方法;利用标记样本和大量实际未标记样本的半监督学习进行HMRF模型训练;利用已训练的模型对输入文档图像进行识别的优化求解方法。前期相关研究说明该理论方法具有可行性。研究难点为综合利用图像全局和局部信息以及先验知识来提高文档识别率;研究创新点为首次提出多种文档图像分割与识别的统一理论模型。

项目摘要

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于MCPF算法的列车组合定位应用研究

基于MCPF算法的列车组合定位应用研究

DOI:
发表时间:2016
2

现代优化理论与应用

现代优化理论与应用

DOI:10.1360/SSM-2020-0035
发表时间:2020
3

空中交通延误预测研究综述

空中交通延误预测研究综述

DOI:10.12305/j.issn.1001-506x.2022.03.19
发表时间:2022
4

基于编解码网络的航空影像像素级建筑物提取

基于编解码网络的航空影像像素级建筑物提取

DOI:10.11834/jrs.20209056
发表时间:2020
5

融合字符串特征的维吾尔语形态切分

融合字符串特征的维吾尔语形态切分

DOI:
发表时间:2022

彭良瑞的其他基金

相似国自然基金

1

图象的马尔可夫随机场模型与算法的研究

批准号:68972011
批准年份:1989
负责人:匡锦瑜
学科分类:F0116
资助金额:4.30
项目类别:面上项目
2

面向图像复原的高阶马尔可夫随机场先验模型研究

批准号:61301235
批准年份:2013
负责人:张志
学科分类:F0116
资助金额:25.00
项目类别:青年科学基金项目
3

基于马尔可夫随机场模型与非局部先验的肝脏图像配准

批准号:31000450
批准年份:2010
负责人:卢振泰
学科分类:C1006
资助金额:19.00
项目类别:青年科学基金项目
4

基于马尔可夫随机场的大规模网络社团发现研究

批准号:61876128
批准年份:2018
负责人:何东晓
学科分类:F0605
资助金额:62.00
项目类别:面上项目