一种账票光学识别方法及装置的制造方法

文档序号:10553714阅读:377来源:国知局
一种账票光学识别方法及装置的制造方法
【专利摘要】本发明公开一种账票光学识别方法及装置,涉及自动识别装置领域,降低了账票整理的工作量,提高工作效率,而且准确率高。方案为:对待识别账票进行扫描、倾斜整理和分类;挖取大写和小写金额字体,并将大写和所述小写金额字体分割成单个字符;将大写和小写金额字符图像转化为二值图;去除噪点;进行大小归一化处理;分别提取大写和小写金额二值图中金额字符特征值;提取的各特征值对应参照预设特征值模板库进行识别;完成识别后,获取识别结果,并将结果输出。本发明主要用于账票识别中。
【专利说明】
一种账票光学识别方法及装置
技术领域
[0001]本发明涉及自动识别装置领域,尤其涉及一种账票光学识别方法及装置。
【背景技术】
[0002]随着经济的迅猛发展,银行、税务等行业每天都会产生大量的票据,对所有的票据进行统一整理、存档是一项工作量较大的工作,所以一种快捷的票据整理方法或软件成为当前炙手可热的市场需求。
[0003]现有技术中对票据的整理一般是通过人工整理,即工人对票据进行逐一识别,归类、统计和存档。
[0004]上述采用人工整理票据的方法,是通过工人对票据进行逐一识别,当票据数量庞杂的时候,单纯依靠人工,工作量大,耗费工时,效率低,准确率低。

【发明内容】

[0005]本发明实施例提供的一种账票光学识别方法及装置,能够实现账票自动识别归类,大大降低了账票整理的工作量,提高了工作效率,而且准确率高。
[0006]为达到上述目的,本发明的实施例采用如下技术方案:
[0007]本发明第一方面提供一种账票光学识别方法,包括:
[0008]对待识别账票进行扫描,以便输入所述待识别账票图像。
[0009]扫描后所述待识别账票图形进行倾斜整理。
[0010]利用分类算法对倾斜整理后所述待识别账票进行分类。
[0011]挖取分类后所述待识别账票图像中的大写金额字体和小写金额字体,并将所述大写金额字体和所述小写金额字体分割成单个字符,以便获取大写金额字符图像和小写金额字符图像。
[0012]将所述大写金额字符图像和所述小写金额字符图像转化为大写金额二值图和小写金额二值图。
[0013]去除所述大写金额二值图和所述小写金额二值图中的噪点。
[0014]对所述大写金额二值图和所述小写金额二值图进行大小归一化处理,以便获取大小统一的所述大写金额二值图和所述小写金额二值图。
[0015]分别提取所述大写金额二值图中金额字符特征值和所述小写金额二值图中金额字符特征值:
[0016]提取所述大写金额二值图中金额字符X轴、Y轴方向的像素密度投影;横、纵、撇、捺四个方向的笔画数;字符外部轮廓;将所述大写金额二值图中金额字符置于弹性网格中,统计各网格中的笔划数目。
[0017]提取所述小写金额二值图中金额字符的端点数目、三叉点数目、四叉点数目。
[0018]提取的各特征值对应参照预设特征值模板库进行识别。
[0019]完成识别后,获取识别结果,并将所述识别结果输出。
[0020]结合第一方面,在一种可能的实施方式中,所述的账票光学识别方法,包括:
[0021]当所述大写金额二值图中金额字符,和/或,所述小写金额二值图中金额字符为手写字符时,多次提取各特征值,以各所述特征值统计次数最多项确定各所述特征值。
[0022]结合第一方面,在一种可能的实施方式中,所述的账票光学识别方法,预设特征值模板库,包括:
[0023]在已有样本字库基础上提取字符特征值并训练建立所述预设特征值模板库。
[0024]本发明第二方面提供一种账票光学识别装置,包括:
[0025]扫描单元,用于对待识别账票进行扫描,以便输入所述待识别账票图像。
[0026]整理单元,用于扫描后所述待识别账票图形进行倾斜整理。
[0027]分类单元,用于利用分类算法对倾斜整理后所述待识别账票进行分类。
[0028]挖取单元,用于挖取分类后所述待识别账票图像中的大写金额字体和小写金额字体,并将所述大写金额字体和所述小写金额字体分割成单个字符,以便获取大写金额字符图像和小写金额字符图像。
[0029]转化单元,用于将所述大写金额字符图像和所述小写金额字符图像转化为大写金额二值图和小写金额二值图。
[0030]去除单元,用于去除所述大写金额二值图和所述小写金额二值图中的噪点。
[0031]归一化单元,用于对所述大写金额二值图和所述小写金额二值图进行大小归一化处理,以便获取大小统一的所述大写金额二值图和所述小写金额二值图。
[0032]提取单元,用于分别提取所述大写金额二值图中金额字符特征值和所述小写金额二值图中金额字符特征值:
[0033]第一提取单元,用于提取所述大写金额二值图中金额字符X轴、Y轴方向的像素密度投影;横、纵、撇、捺四个方向的笔画数;字符外部轮廓;将所述大写金额二值图中金额字符置于弹性网格中,统计各网格中的笔划数目。
[0034]第二提取单元,用于提取所述小写金额二值图中金额字符的端点数目、三叉点数目、四叉点数目。
[0035]识别单元,用于提取的各特征值对应参照预设特征值模板库进行识别。
[0036]输出单元,用于完成识别后,获取识别结果,并将所述识别结果输出。
[0037]结合第二方面,在一种可能的实施方式中,所述的账票光学识别装置,包括:
[0038]第三提取单元,当所述大写金额二值图中金额字符,和/或,所述小写金额二值图中金额字符为手写字符时,多次提取各特征值,以各所述特征值统计次数最多项确定各所述特征值。
[0039]结合第二方面,在一种可能的实施方式中,所述的账票光学识别方法,预设特征值模板库,包括:
[0040]建立单元,用于在已有样本字库基础上提取字符特征值并训练建立所述预设特征值模板库。
[0041]本发明实施例提供的一种账票光学识别方法及装置,包括:对待识别账票进行扫描,扫描后待识别账票图形进行倾斜整理;利用分类算法对倾斜整理后待识别账票进行分类;挖取分类后待识别账票图像中的大写和小写金额字体,并将大写金额字体和所述小写金额字体分割成单个字符;将大写和小写金额字符图像转化为大写和小写金额二值图;去除大写和小写金额二值图中的噪点;对大写和所述小写金额二值图进行大小归一化处理;分别提取大写和小写金额二值图中金额字符特征值:提取大写金额二值图中金额字符X轴、Y轴方向的像素密度投影;横、纵、撇、捺四个方向的笔画数;字符外部轮廓;将大写金额二值图中金额字符置于弹性网格中,统计各网格中的笔划数目;提取小写金额二值图中金额字符的端点数目、三叉点数目、四叉点数目;提取的各特征值对应参照预设特征值模板库进行识别;完成识别后,获取识别结果,并将结果输出,相比于现有技术,能够实现账票自动识别归类,大大降低了账票整理的工作量,提高了工作效率,而且准确率高。
【附图说明】
[0042]为了更清楚地说明本发明实施例的技术方案,以下将对实施例描述中所需要使用的附图作简单地介绍。
[0043]图1为本发明实施例1中一种账票光学识别方法流程示意图。
[0044]图2为本发明实施例2中一种账票光学识别装置组成结构示意图。
【具体实施方式】
[0045]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0046]实施例1
[0047]本发明实施例提供一种账票光学识别方法,如图1所示,包括:
[0048]101、对待识别账票进行扫描,以便输入所述待识别账票图像。
[0049]102、扫描后所述待识别账票图形进行倾斜整理。
[0050]103、利用分类算法对倾斜整理后所述待识别账票进行分类。
[0051]104、挖取分类后所述待识别账票图像中的大写金额字体和小写金额字体,并将所述大写金额字体和所述小写金额字体分割成单个字符,以便获取大写金额字符图像和小写金额字符图像。
[0052]105、将所述大写金额字符图像和所述小写金额字符图像转化为大写金额二值图和小写金额二值图。
[0053]106、去除所述大写金额二值图和所述小写金额二值图中的噪点。
[0054]107、对所述大写金额二值图和所述小写金额二值图进行大小归一化处理,以便获取大小统一的所述大写金额二值图和所述小写金额二值图。
[0055]108、分别提取所述大写金额二值图中金额字符特征值和所述小写金额二值图中金额字符特征值:
[0056]1081、提取所述大写金额二值图中金额字符X轴、Y轴方向的像素密度投影;横、纵、撇、捺四个方向的笔画数;字符外部轮廓;将所述大写金额二值图中金额字符置于弹性网格中,统计各网格中的笔划数目。
[0057]1082、提取所述小写金额二值图中金额字符的端点数目、三叉点数目、四叉点数目。
[0058]109、提取的各特征值对应参照预设特征值模板库进行识别。
[0059]110、完成识别后,获取识别结果,并将所述识别结果输出。
[0060]进一步的,所述的账票光学识别方法,包括:
[0061]1083、当所述大写金额二值图中金额字符,和/或,所述小写金额二值图中金额字符为手写字符时,多次提取各特征值,以各所述特征值统计次数最多项确定各所述特征值。
[0062]进一步的,所述的账票光学识别方法,预设特征值模板库,包括:
[0063]111、在已有样本字库基础上提取字符特征值并训练建立所述预设特征值模板库。
[0064]本发明实施例提供的一种账票光学识别方法,包括:对待识别账票进行扫描,扫描后待识别账票图形进行倾斜整理;利用分类算法对倾斜整理后待识别账票进行分类;挖取分类后待识别账票图像中的大写和小写金额字体,并将大写金额字体和所述小写金额字体分割成单个字符;将大写和小写金额字符图像转化为大写和小写金额二值图;去除大写和小写金额二值图中的噪点;对大写和所述小写金额二值图进行大小归一化处理;分别提取大写和小写金额二值图中金额字符特征值:提取大写金额二值图中金额字符X轴、Y轴方向的像素密度投影;横、纵、撇、捺四个方向的笔画数;字符外部轮廓;将大写金额二值图中金额字符置于弹性网格中,统计各网格中的笔划数目;提取小写金额二值图中金额字符的端点数目、三叉点数目、四叉点数目;提取的各特征值对应参照预设特征值模板库进行识别;完成识别后,获取识别结果,并将结果输出,相比于现有技术,能够实现账票自动识别归类,大大降低了账票整理的工作量,提高了工作效率,而且准确率高。
[0065]实施例2
[0066]本发明实施例提供一种账票光学识别装置,如图2所示,包括:
[0067]21、扫描单元,用于对待识别账票进行扫描,以便输入所述待识别账票图像。
[0068]22、整理单元,用于扫描后所述待识别账票图形进行倾斜整理。
[0069]23、分类单元,用于利用分类算法对倾斜整理后所述待识别账票进行分类。
[0070]24、挖取单元,用于挖取分类后所述待识别账票图像中的大写金额字体和小写金额字体,并将所述大写金额字体和所述小写金额字体分割成单个字符,以便获取大写金额字符图像和小写金额字符图像。
[0071]25、转化单元,用于将所述大写金额字符图像和所述小写金额字符图像转化为大写金额二值图和小写金额二值图。
[0072]26、去除单元,用于去除所述大写金额二值图和所述小写金额二值图中的噪点。
[0073]27、归一化单元,用于对所述大写金额二值图和所述小写金额二值图进行大小归一化处理,以便获取大小统一的所述大写金额二值图和所述小写金额二值图。
[0074]28、提取单元,用于分别提取所述大写金额二值图中金额字符特征值和所述小写金额二值图中金额字符特征值:
[0075]281、第一提取单元,用于提取所述大写金额二值图中金额字符X轴、Y轴方向的像素密度投影;横、纵、撇、捺四个方向的笔画数;字符外部轮廓;将所述大写金额二值图中金额字符置于弹性网格中,统计各网格中的笔划数目。
[0076]282、第二提取单元,用于提取所述小写金额二值图中金额字符的端点数目、三叉点数目、四叉点数目。
[0077]29、识别单元,用于提取的各特征值对应参照预设特征值模板库进行识别。
[0078]210、输出单元,用于完成识别后,获取识别结果,并将所述识别结果输出。
[0079]进一步的,所述的账票光学识别装置,包括:
[0080]283、第三提取单元,当所述大写金额二值图中金额字符,和/或,所述小写金额二值图中金额字符为手写字符时,多次提取各特征值,以各所述特征值统计次数最多项确定各所述特征值。
[0081 ]进一步的,所述的账票光学识别方法,预设特征值模板库,包括:
[0082]211、建立单元,用于在已有样本字库基础上提取字符特征值并训练建立所述预设特征值模板库。
[0083]本发明实施例提供的一种账票光学识别装置,包括:扫描单元,整理单元,分类单元,挖取单元,转化单元,去除单元,归一化单元,提取单元,第一提取单元,第二提取单元,识别单元,输出单元,第三提取单元和建立单元,相比于现有技术,能够实现账票自动识别归类,大大降低了账票整理的工作量,提高了工作效率,而且准确率高。
[0084]以上所述,仅为本发明的【具体实施方式】,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
【主权项】
1.一种账票光学识别方法,其特征在于,包括: 对待识别账票进行扫描,以便输入所述待识别账票图像; 扫描后所述待识别账票图形进行倾斜整理; 利用分类算法对倾斜整理后所述待识别账票进行分类; 挖取分类后所述待识别账票图像中的大写金额字体和小写金额字体,并将所述大写金额字体和所述小写金额字体分割成单个字符,以便获取大写金额字符图像和小写金额字符图像; 将所述大写金额字符图像和所述小写金额字符图像转化为大写金额二值图和小写金额二值图; 去除所述大写金额二值图和所述小写金额二值图中的噪点; 对所述大写金额二值图和所述小写金额二值图进行大小归一化处理,以便获取大小统一的所述大写金额二值图和所述小写金额二值图; 分别提取所述大写金额二值图中金额字符特征值和所述小写金额二值图中金额字符特征值: 提取所述大写金额二值图中金额字符X轴、Y轴方向的像素密度投影;横、纵、撇、捺四个方向的笔画数;字符外部轮廓;将所述大写金额二值图中金额字符置于弹性网格中,统计各网格中的笔划数目; 提取所述小写金额二值图中金额字符的端点数目、三叉点数目、四叉点数目; 提取的各特征值对应参照预设特征值模板库进行识别; 完成识别后,获取识别结果,并将所述识别结果输出。2.根据权利要求1所述的账票光学识别方法,其特征在于,包括: 当所述大写金额二值图中金额字符,和/或,所述小写金额二值图中金额字符为手写字符时,多次提取各特征值,以各所述特征值统计次数最多项确定各所述特征值。3.根据权利要求1所述的账票光学识别方法,其特征在于,预设特征值模板库,包括: 在已有样本字库基础上提取字符特征值并训练建立所述预设特征值模板库。4.一种账票光学识别装置,其特征在于,包括: 扫描单元,用于对待识别账票进行扫描,以便输入所述待识别账票图像; 整理单元,用于扫描后所述待识别账票图形进行倾斜整理; 分类单元,用于利用分类算法对倾斜整理后所述待识别账票进行分类; 挖取单元,用于挖取分类后所述待识别账票图像中的大写金额字体和小写金额字体,并将所述大写金额字体和所述小写金额字体分割成单个字符,以便获取大写金额字符图像和小写金额字符图像; 转化单元,用于将所述大写金额字符图像和所述小写金额字符图像转化为大写金额二值图和小写金额二值图; 去除单元,用于去除所述大写金额二值图和所述小写金额二值图中的噪点; 归一化单元,用于对所述大写金额二值图和所述小写金额二值图进行大小归一化处理,以便获取大小统一的所述大写金额二值图和所述小写金额二值图; 提取单元,用于分别提取所述大写金额二值图中金额字符特征值和所述小写金额二值图中金额字符特征值: 第一提取单元,用于提取所述大写金额二值图中金额字符X轴、Y轴方向的像素密度投影;横、纵、撇、捺四个方向的笔画数;字符外部轮廓;将所述大写金额二值图中金额字符置于弹性网格中,统计各网格中的笔划数目; 第二提取单元,用于提取所述小写金额二值图中金额字符的端点数目、三叉点数目、四叉点数目; 识别单元,用于提取的各特征值对应参照预设特征值模板库进行识别; 输出单元,用于完成识别后,获取识别结果,并将所述识别结果输出。5.根据权利要求4所述的账票光学识别装置,其特征在于,包括: 第三提取单元,当所述大写金额二值图中金额字符,和/或,所述小写金额二值图中金额字符为手写字符时,多次提取各特征值,以各所述特征值统计次数最多项确定各所述特征值。6.根据权利要求1所述的账票光学识别方法,其特征在于,预设特征值模板库,包括: 建立单元,用于在已有样本字库基础上提取字符特征值并训练建立所述预设特征值模板库。
【文档编号】G07D7/20GK105913547SQ201610213090
【公开日】2016年8月31日
【申请日】2016年4月7日
【发明人】李强, 袁熙, 盛小东, 逯峻雨, 林若男
【申请人】四川大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1