基于消失成分分析的场景图像中蒙古文字识别方法研究

基本信息

批准号：61563039

项目类别：地区科学基金项目

资助金额：39.00

负责人：邵允学

学科分类：

依托单位：内蒙古大学

批准年份：2015

结题年份：2019

起止时间：2016-01-01 - 2019-12-31

项目状态：已结题

项目参与者：王俊义,魏宏喜,马颖东,飞龙,吴伟,武静,姚志鹏,杜健,路敏

关键词：

场景文字识别消失成分分析蒙古文场景文字检测相似字区分

结项摘要

With the rapid development of Mongolian text informatization, we need a system to automatically extract Mongolian texts in images for searching， filtering or analyzing. However, as we know, there is no public research on Mongolian scene text detection and recognition. To overcome the shortcomings of the state-of-the-art methods in applying to the Mongolian text detection and recognition, we focus on the following three aspects. First, we study the Mongolian text region multi-segmentation method and propose the multi-segmentation based hierarchical grouping method to improve the recall rate. Second, we propose the vanishing component analysis based nonlinear discriminant learning method, which describes the nonlinear relationships between Mongolian characters directly and adequately and builds the relationships between low-level features and class labels. Finally, we propose the quadratic vanishing component functions to discriminate similar Mongolian characters, which makes full use of the characteristic of the vanishing component analysis method and uses the maximal margins as the optimization objective. This method can fully mine the critical information and improve the generation performance. The research achievements have both practical and theoretical significance to this field.

随着蒙古文信息化建设的快速推广，亟需能够自动提取、分析和检索场景图像中蒙古文信息的系统，而关于场景图像中蒙古文字检测和识别领域的研究仍处于起步阶段。针对蒙古文字特点及经典方法应用到场景蒙古文字识别时存在的问题，本项目拟在以下三个方面开展研究：第一，研究场景蒙古文字区域的冗余分割方法和倾斜校正方法，拟提出基于冗余分割的场景蒙古文字拓扑聚类方法，提升检测召回率。第二，研究场景蒙古文字识别方法，拟提出基于消失成分分析的非线性判别学习方法，充分描述场景蒙古文字特征之间的非线性结构关系，建立底层特征和文字类别之间的关系。第三，研究场景蒙古文字相似字区分方法，拟提出基于二次消失成分函数的相似字区分方法，该方法以最大化类间间隔为优化目标，在提升关键区域信息描述性能的同时，优化分类器的泛化性能。本项目研究成果不仅能够为场景蒙古文字识别、检索和分析等应用奠定基础，并且对相关领域的研究发展具有重要的借鉴意义。

项目摘要

场景蒙古文字检测和识别是蒙古文信息化建设过程中的重要支撑之一，能够为自动提取、分析和检索场景图像中蒙古文信息提供技术支撑，而关于场景图像中蒙古文字检测和识别领域的研究仍处于起步阶段。本项目对该领域进行了深入研究，包括：完成了场景蒙古文字检测和识别数据库的创建工作，该数据库的构建以及虚拟样本生成算法的实现，为后续检测和识别算法的研究奠定基础；完成了场景蒙古文字检测方法研究，提出了基于CNN结合MSER的场景文字检测方法；完成了基于消失成分分析的非线性判别分析方法研究，该研究中证明了两个重要的定理，对判别分析领域研究具有重要借鉴意义；完成了场景文字二值化与小样本问题下场景文字识别方法研究，在ICFHR2016棕榈叶上手写巴厘语二值化分割和识别竞赛中分别取得了全球第二名和第一名的优异成绩；完成了基于类内样本重建的场景文字特征提取算法研究，在该研究中证明了一个重要定理，在自编码研究领域具有重要借鉴意义；完成了场景蒙古文字识别方法研究，提出了基于孪生网络的场景蒙古文字识别方法；完成了场景蒙古文字检测和识别系统的搭建工作，为项目落地应用奠定基础。在完成项目研究计划的基础上，课题组还开展了基于属性文法的手写文字生成方法研究，该研究思路是国内外首创，为精细生成手写文字奠定基础；另外还研究了基于深度学习的骨骼图像诊断方法，提出了基于两阶段的诊断方法，有效提升了诊断精度。本项目研究成果不仅为场景蒙古文字识别、检索和分析等应用奠定基础，并且对相关领域的研究发展具有重要的借鉴意义。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：

DOI：10.6041/j.issn.1000-1298.2022.07.022

发表时间：2022

DOI：10.11842/wst.20190724002

发表时间：2020

DOI：10.16383/j.aas.c180673

发表时间：2021

DOI：10.7498/aps.68.20181682

发表时间：2019

邵允学的其他基金

相似国自然基金

模糊和畸变场景图像中的文字识别研究

批准号：61471214

批准年份：2014

负责人：刘长松

学科分类：F0116

资助金额：82.00

项目类别：面上项目

复杂场景图像中维吾尔文字的定位与识别技术研究

批准号：61562058

批准年份：2015

负责人：许亚美

学科分类：F0605

资助金额：37.00

项目类别：地区科学基金项目

基于多属性融合的图像场景识别方法研究

批准号：61602459

批准年份：2016

负责人：郑莹斌

学科分类：F0210

资助金额：20.00

项目类别：青年科学基金项目

自然场景图像中的部分形状识别方法研究

批准号：61401455

批准年份：2014

负责人：范慧杰

学科分类：F0116

资助金额：24.00

项目类别：青年科学基金项目

基于消失成分分析的场景图像中蒙古文字识别方法研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于改进LinkNet的寒旱区遥感图像河流识别方法

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

二维FM系统的同时故障检测与控制

高分五号卫星多角度偏振相机最优化估计反演:角度依赖与后验误差分析

邵允学的其他基金

相似国自然基金