模糊和畸变场景图像中的文字识别研究

基本信息
批准号:61471214
项目类别:面上项目
资助金额:82.00
负责人:刘长松
学科分类:
依托单位:清华大学
批准年份:2014
结题年份:2018
起止时间:2015-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:王言伟,杨诚,王宝慷,李鑫,姜志威,苏冰
关键词:
文字识别字符提取图像识别模糊图像复原几何畸变校正
结项摘要

Among researches of character recognition theory and technology,recognition of scene character image is the key technology for information understanding.When faced with image blurring and distortion,the scene text image almost can not be recognized correctly.It goes without saying the problem of image understanding and indexing based on recognition can not be solved either.Text recognition in degraded scene image is the key problem to be solved for high performance character recognition.This project will be conducted on the benchmark of scene character image recognition system.Based on the analysis of blurring,distorted and broken character images, we will focus on high accuracy character recognition research under these circumstances.The concrete research contents include blurring image restoration,distorted image correction,blurring and distortion invarient character recognition and feature extraction and recognition theory for broken character image theory.On the basis of these research results,a high performance scene character recognition system will be established. This project is significant for theory research since it involves multidisciplinary knowledge, such as image processing,pattern recognition and artificial intelligence.The research results could be extended and applied in content based image indexing,image information monitor on the network etc.

在文字识别理论和技术研究中,场景图像文字识别是图像文字信息理解的关键技术。在图像模糊和畸变条件下,场景图像中的文字几乎无法识别,后续的图像理解、检索更无从谈起。该问题是进一步发展高性能文字识别技术亟待解决的关键问题。本项目以场景图像文字识别系统为研究平台,深入分析模糊、畸变、缺损对场景图像文字识别性能的影响,重点研究退化场景图像中高性能文字识别理论和方法。具体的研究内容包括模糊图像自动复原、文本图像畸变校正方法、具有模糊和畸变鲁棒性的高性能文字识别方法、缺损字符图像特征提取及识别理论和方法。在以上理论和关键技术研究的基础上,研制成实用的场景图像文字识别系统。该项目的研究涉及图像处理、模式识别、人工智能等多个学科,具有重要的理论研究意义。研究的成果可以推广至基于内容的图像搜索、网络图像信息监控等领域。

项目摘要

在文字识别理论和技术研究中,自然场景图像文字识别是图像文字信息理解的关键技术。 图像模糊和畸变是实际成像过程中常有的问题,此时的文字几乎无法识别,后续的图像理解、检索更无从谈起。该问题是进一步发展高性能文字识别技术亟待解决的关键问题。.本项目主要包括三方面研究内容:.1.研究图像盲恢复算法解决图像模糊问题。首先提出了基于图像边缘选择的模糊图像盲恢复算法。研究过程中发现在原始图像分辨率条件下做复原无法达到像素级别的清晰度,于是我们探索了基于超分辨率分析和模糊图像盲恢复相结合的算法,一定程度上克服了该问题。.2.研究文字图像的畸变矫正算法。针对自然场景中标牌等字符少、背景复杂情况,提出了一种基于J-Linkage聚类的消失点检测的校正方法;针对文档图像透视畸变,提出了基于文字行消失点的校正方法;针对文档图像任意弯曲表面造成的畸变,提出了一种基于连通域聚类的行切分算法与基于插值的恢复算法。这些方法能够有效解决常见的文字变形畸变问题,并在我们的THOCR软件中得到应用和推广。.3.针对视频图像和文字识别问题,提出了针对序列图像的特征变换降维方法,将传统的LDA等降维方法扩展到时间维上,利用前后帧图像上的信息共同计算特征降维,有效提高了特征的鉴别能力,从而提高识别率。.另外,本项目对作为工具的深度卷积神经网路CNN的学习方法和压缩方法等进行了研究。.本项目的研究涉及图像处理、模式识别、人工智能等多个学科,具有重要的理论研究意义和实用价值。研究的成果可以推广至基于内容的图像搜索、网络图像信息监控等领域。.项目发表论文12篇,其中包括SCI索引3篇,EI索引12篇。申请发明专利2项。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
2

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

DOI:10.11821/dlyj201810008
发表时间:2018
3

城市轨道交通车站火灾情况下客流疏散能力评价

城市轨道交通车站火灾情况下客流疏散能力评价

DOI:
发表时间:2015
4

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
5

五轴联动机床几何误差一次装卡测量方法

五轴联动机床几何误差一次装卡测量方法

DOI:
发表时间:

刘长松的其他基金

批准号:11575229
批准年份:2015
资助金额:73.00
项目类别:面上项目
批准号:50702029
批准年份:2007
资助金额:21.00
项目类别:青年科学基金项目
批准号:10674135
批准年份:2006
资助金额:36.00
项目类别:面上项目
批准号:60772049
批准年份:2007
资助金额:25.00
项目类别:面上项目
批准号:28770296
批准年份:1987
资助金额:2.00
项目类别:面上项目
批准号:29575204
批准年份:1995
资助金额:8.00
项目类别:面上项目
批准号:29375203
批准年份:1993
资助金额:5.50
项目类别:面上项目
批准号:11375231
批准年份:2013
资助金额:90.00
项目类别:面上项目
批准号:11735015
批准年份:2017
资助金额:320.00
项目类别:重点项目
批准号:10174082
批准年份:2001
资助金额:20.00
项目类别:面上项目
批准号:29170223
批准年份:1991
资助金额:3.50
项目类别:面上项目
批准号:11074253
批准年份:2010
资助金额:48.00
项目类别:面上项目

相似国自然基金

1

复杂场景图像中维吾尔文字的定位与识别技术研究

批准号:61562058
批准年份:2015
负责人:许亚美
学科分类:F0605
资助金额:37.00
项目类别:地区科学基金项目
2

基于消失成分分析的场景图像中蒙古文字识别方法研究

批准号:61563039
批准年份:2015
负责人:邵允学
学科分类:F0605
资助金额:39.00
项目类别:地区科学基金项目
3

基于局部特征的自然场景下文字定位和识别研究

批准号:61201384
批准年份:2012
负责人:周异
学科分类:F0116
资助金额:24.00
项目类别:青年科学基金项目
4

基于图模型的场景文字与叠加文字提取识别技术研究

批准号:61271434
批准年份:2012
负责人:王伟强
学科分类:F0116
资助金额:76.00
项目类别:面上项目