基于模型自适应增量学习的个性化无约束联机手写文字识别

基本信息
批准号:61075021
项目类别:面上项目
资助金额:36.00
负责人:金连文
学科分类:
依托单位:华南理工大学
批准年份:2010
结题年份:2013
起止时间:2011-01-01 - 2013-12-31
项目状态: 已结题
项目参与者:杨卫国,丁祖春,郭礼华,薛洋,丁凯,高岩,周贵斌,梁凌宇,汪涛
关键词:
模型自适应手写文字识别个性化云手写输入法增量学习
结项摘要

在大类别无约束的联机中文手写识别中,由于模型自适技术能有效提升识别性能和改善个性化用户体验,因此这项技术是目前文字识别领域内一个重要且难解决的研究课题,受到了不少研究者的关注。本项目研究基于增量学习的模型自适应技术及其在无约束联机文字识别中的应用。主要研究内容包括:(1)线性鉴别子空间增量学习书写者自适应模型及方法;(2)改进二次鉴别函数(MQDF)增量学习模型及技术;(3)鉴别增量MQDF模型自适应方法及其应用;(4)基于增量格子支持向量机(LATTICE SVM)和增量混合高斯模型(GMM)的书写者自适应方法;(5)结合实际应用,实现一个高性能个性化的云手写输入应用示范系统。该项目在前期较好的研究工作基础上开展,针对大部分技术难点及研究问题设计了明确可行的技术路线,所提出研制的多个模型自适应技术及方法有创新,具有很好的理论及应用研究价值。

项目摘要

中文手写文字识别一直以来都是模式识别领域的一个热点研究方向。同时,无约束的中文手写识别由于其用户书写风格的多样性及手写样本的多变性,长期成为模式识别领域的一大难题。虽然规范的有约束的中文手写识别技术已经取得了非常大的发展,识别率已经达到98%以上,然而无约束的中文手写识别的识别率却远远低于规范的有约束的中文手写识别,识别率仅能达到93%左右。因此,使无约束的中文手写识别达到令人满意的识别性能就是一个急需解决的重要问题。随着智能手机、电纸书和平板电脑等带有触摸屏幕的手持电子设备非常流行和普及,这使得在这些电子设备上手写输入方法变得越来越重要。然而由于在实验室采集的手写数据非常有限而不能涵盖所有书写风格,导致在实际应用中手写识别率并不能达到令人满意的效果。尤其是对于某些特定用户,由于其特殊的书写风格,导致对这些用户的识别性能不够好。..针对以上的问题,课题组研究了基于大规模无约束手写数据的书写者自适应的中文手写识别技术,这种技术采用大规模的无约束的手写数据来训练分类器,保证了训练样本中含有尽可能多的书写风格,进而满足大部分书写者的书写体验。同时,我们提出的用户自适应算法可以对特定用户的书写风格进行自适应学习,从而提高该用户的识别率,使该用户获得“越写越准”的用户体验。然而这项研究工作面临许多技术难题,包括,汉字书写风格多变的问题,汉字结构复杂并具有许多难以区分的相似字的问题,数据库的采集与整理的问题,增量学习中原始分类器词典的压缩问题,增量学习中对普通用户的识别率有所降低的问题,以及在鉴别特征空间进行增量学习的问题,手写交互及手写美化问题,云计算环境下的个性化手写识别及应用问题,以及相关机器学习。课题组围绕着这些难点对基于大规模无约束手写数据的书写者自适应的中文手写识别技术展开了一系列的研究,通过对特定用户的书写风格的增量学习,可以大大提高对该用户的书写样本的识别率,同时可以不降低对于其他普通用户的识别率,这可以让所有用户获得更人性化的用户体验。..课题组共发表论文35篇,其中SCI 期刊论文19篇,IEEE Transaction论文(长文)5篇; EI期刊论文5篇,核心期刊论文3篇,国际会议论文12篇(全部为EI或ISTP检索)。获得18项发明专利授权;申请了14项发明专利并已通过初审。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
2

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
3

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
4

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

DOI:10.11821/dlyj201810008
发表时间:2018
5

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018

金连文的其他基金

批准号:60275005
批准年份:2002
资助金额:25.00
项目类别:面上项目
批准号:69802007
批准年份:1998
资助金额:12.00
项目类别:青年科学基金项目
批准号:61472144
批准年份:2014
资助金额:84.00
项目类别:面上项目

相似国自然基金

1

联机手写蒙文字识别的研究

批准号:60365001
批准年份:2003
负责人:高光来
学科分类:F0605
资助金额:18.00
项目类别:地区科学基金项目
2

联机手写新疆维吾尔文字符识别研究

批准号:60863009
批准年份:2008
负责人:哈力木拉提·买买提
学科分类:F0211
资助金额:22.00
项目类别:地区科学基金项目
3

脱机手写藏文字符识别研究

批准号:61462072
批准年份:2014
负责人:黄鹤鸣
学科分类:F0211
资助金额:47.00
项目类别:地区科学基金项目
4

联机手写化学公式识别研究

批准号:61301238
批准年份:2013
负责人:杨巨峰
学科分类:F0116
资助金额:24.00
项目类别:青年科学基金项目