基于Constellation模型的自然场景文本检索方法研究

基本信息
批准号:61073128
项目类别:面上项目
资助金额:32.00
负责人:刘家锋
学科分类:
依托单位:哈尔滨工业大学
批准年份:2010
结题年份:2013
起止时间:2011-01-01 - 2013-12-31
项目状态: 已结题
项目参与者:丁建睿,赵巍,战扬,张博宇,王刚,徐飞,刘胜宇,张杰
关键词:
图像聚类场景文本识别与检索局部特征描述Constellation模型
结项摘要

自然场景中文本的识别与检索是近年来字符识别领域研究的一个热点问题,现有的研究方法大多以传统的OCR技术为基础,首先检测和定位场景图像中的文本,然后分离字符前景与背景,OCR识别字符,最后检索文本。然而自然场景图像同传统的扫描文本图像存在着明显的差异,字符文本存在于杂乱的背景之中,拍摄视角的不同造成文本具有较大的几何变形,存在光照变化、字符颜色不统一的现象,字符可能发生局部破损、断裂和被遮挡,这些现象造成了此项研究到目前为止很难取得令人满意的结果。本项目提出将Constellation模型引入场景文本检索的研究,利用图像的局部特征描述对场景字符建模,通过模型组合实现对自然场景图像中文本关键词的直接检索,避免了传统研究方法在检测,背景分离和识别中所遇到的困难。本项目为自然场景文本识别与检索开辟了一种新的研究思路,将推动此领域研究的进一步发展。

项目摘要

本课题针对自然场景图像中文本信息的检测与识别方法进行了研究。首先提出了一种基于局部特征和Constellation模型的场景文本识别新方法,该方法利用字符上具有显著性的局部区域集合表征整个字符,然后利用Constellation模型来描述局部特征的表观以及局部特征间的位置关系。这一方法可以有效地适应场景图像中背景杂乱、光照不均、摄影机参数不确定、字体字形多变以及不平整表面等不利因素对识别和检索所造成的影响,提高了场景文本识别的鲁棒性。同时我们还提出了一种基于随机投影的场景文本聚类方法,该方法可以高效地自动归类收集到的文本图像样本,为文本识别与检索方法的学习打下了良好的基础。. 为了提高自然场景图像中文本识别与检索的计算效率,在本课题中我们对局部特征选择方法和文本区域检测进行了研究。提出了一种基于笔迹宽度信息的局部特征选择方法,该方法利用字符上局部特征的尺度与图像中的笔迹宽度信息来选择出与文本相关的局部特征,从而减少了需要处理的局部特征数量,提高了算法的运算效率和准确率。此外,我们还提出一种基于局部特征的多尺度文本区域检测方法。在文本区域分类器训练过程中,提出了一种多示例半监督学习方法,有效地解决了分类器训练过程中存在的未知参数问题。最后,我们将课题提出的算法应用于ICDAR及微软数据集,实验结果表明,本研究所提出的场景文本识别与检索方法具有较高的准确性和鲁棒性。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
2

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
3

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
4

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
5

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022

刘家锋的其他基金

相似国自然基金

1

基于NLP的高精度文本检索模型研究

批准号:60773027
批准年份:2007
负责人:孙乐
学科分类:F0211
资助金额:29.00
项目类别:面上项目
2

基于概率图的文本检索模型及算法研究

批准号:61462043
批准年份:2014
负责人:左家莉
学科分类:F0211
资助金额:46.00
项目类别:地区科学基金项目
3

基于空间不变量的自然场景线性重建理论和方法研究

批准号:60954002
批准年份:2009
负责人:储珺
学科分类:F0306
资助金额:20.00
项目类别:专项基金项目
4

基于目标星形先验表达及变分模型优化的自然图像场景划分

批准号:61305044
批准年份:2013
负责人:刘李漫
学科分类:F0604
资助金额:25.00
项目类别:青年科学基金项目