The original historical calligraphy works are existed in papers,stones,silks or bamboo slips.They are unique,fragile,and can be easily destroyed.The digitization of Chinese historical calligraphy works enable them permanently preserved and universal accessible. But due to the complexity and the deformation of calligraphic characters, the existing Optical Character Recognition technologies can't convert these calligraphy images into texts. This project is to recognize Chinese calligraphic character,build tools or platforms for calligraphic character recognition and construct calligraphic character dictionary(CCD).In order to solve the key problems of this project, such as calligraphic character unit segmentation, shape representation and matching of calligraphic character image, the indexing and quick retrieval of large scale calligraphic character images and calligraphic character image recognition, the main research works of this project focus on: (1)the algorithm of calligraphic character unit segmentation;(2) the representation and matching of shape;(3) the indexing and fast content-based retrieval of large scale calligraphic character images;(4) retrieval-based calligraphic character image recognition;(5) the implementation of the above algorithms and the construction of calligraphic character recognition and annotation platform.
数字化技术使历史书法作品得以长久保存,用户可随时、随地、随意地浏览和欣赏。然而由于书法字字形复杂并有些变形,现有OCR方法无法进行准确识别。针对上述问题,本申请项目拟以识别中国书法字图像、构建书法字识别工具和书法字字典为目的,针对书法字单元分割、书法字图像形状表达和匹配、大数据量书法字图像的索引和快速检索以及书法字图像识别等关键科学问题,研究与书法字识别相关的算法和技术,重点研究书法字单元切割算法、书法字形状表达和匹配算法、大数据量书法字图像的索引和快速检索算法以及基于检索的书法字识别算法等,构建书法字识别工具和书法字语义标注平台,用于算法验证和实际应用。本项目研究将赋予计算机识别书法字的认知能力,帮助用户快速认识历史书法作品的内容,考证和发现历史事件、历史文化、地理变迁等相关内容,是计算机智能认知和大数据技术在计算机书法应用中的一次探索,是传统文化与大数据和信息技术的紧密结合。
中国书法是中国传统文化的一块瑰宝,以其优雅的艺术美感吸引了众多的书法爱好者。一直以来,数字书法知识服务系统作为大学数字图书馆国际合作计划(China Academic Digital Associative Library,CADAL)的特色子系统面向广大的书法爱好者提供服务。但是传统的基于元数据的浏览和检索越来越不能满足用户的文化审美需求,本项目从书法字图像表示、书法字图像和书法字风格识别、汉字识别和书法字合成等方面进行研究,取得的以下成果:.(1) 在书法字图像表示方面,综合考虑SC描述子和书法字特征点的梯度信息,提出了OSC描述子,用以描述书法字图像。.(2) 在书法字图像检索方面,提出了基于OSC-SIFT的书法字相似形快速检索方法,通过生成近邻集和在近邻集精确匹配,实现对书法字快速检索。.(3) 在书法字图像识别方面,提出了基于检索和基于SH-MQDF的两种书法字图像识别算法。.(4) 在书法字风格识别方面,提出了基于CNN-MQDF的书法字风格识别算法。用以识别区分五种不同风格书体书法字。.(5) 在汉字识别方面,提出了基于GIST-SIFT-SSC的汉字识别算法。通过使用高维度哈希索引算法减小存储空间,加快计算速度。通过分别对GIST和SIFT特征点进行匹配,提高检索准确度。.(6) 在书法字合成方面,提出基于相关反馈和朴素贝叶斯的书法字合成算法,通过同时考虑待合成书法字风格和用户偏好,合成特定风格的书法字。.基于研究成果,构建了书法字检索、标注平台,并在CADAL(China America Digital Academic Library )门户中得到应用;分别构建了基于Andriod和Windows平台的汉字识别应用,以此验证了算法的有效性。
{{i.achievement_title}}
数据更新时间:2023-05-31
居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例
基于ESO的DGVSCMG双框架伺服系统不匹配 扰动抑制
基于细粒度词表示的命名实体识别研究
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
适用于带中段并联电抗器的电缆线路的参数识别纵联保护新原理
基于风格模型的中国书法字生成算法研究
书法字图像索引和匹配算法研究
基于大数据挖掘与深度学习的中国书法仿写与智能创作的算法研究
基于时频域指纹映射的中国书法运笔姿态与动作的无线感知与识别方法研究