一种答卷的扫描方向判断方法

文档序号:6547361阅读:323来源:国知局
一种答卷的扫描方向判断方法
【专利摘要】本发明公开了一种答卷的扫描方向判断方法,其特征在于,包括如下步骤:(1)扫描答卷,获得答卷图像;(2)计算答卷图像的最佳分割阈值;(3)检测水平直线特征点;(4)检测垂直直线特征点;(5)水平直线特征点和垂直直线特征点进行匹配;(6)生成模板数据;(7)判断扫描方向。本发明设计了一种直线特征点之间的相似度指标计算方法,该方法考虑了匹配率和匹配精度两种因素,具有准确率高、算法时间复杂度低且易于实现的优点;在扫描方向判断算法的设计上,使用水平直线检测或者垂直直线检测的多个直线模式与模板数据做匹配算法,因此算法具有非常高的稳定性。该方法广泛应用于答卷图像的扫描、分析、识别等领域。
【专利说明】一种答卷的扫描方向判断方法

【技术领域】
[0001]本发明涉及电子化阅卷领域,具体地讲,涉及一种答卷的扫描方向判断方法。

【背景技术】
[0002]答卷在教育领域中仍然发挥着非常重要的作用,答卷经高速采集设备扫描得到答卷图像,这些图像一般存储于计算机,提供给数字化网上阅卷系统使用。
[0003]常用的答卷扫描方向判断方法使用特殊标记点的识别方法,例如缺角识别方法和方块标记点识别方法,这些方法具有识别速度快、准确性高的特点,非常适合于标准化考试领域。对于普通中学领域,缺乏足够的信息卡设计专业人员,因此基于特殊标记点识别的扫描方向判断受到很大的限制。为此本发明研究了基于答卷直线结构的扫描方向判断方法,该方法不受标记点识别方法的限制条件,具有更广泛的应用性。
[0004]常用的直线检测包括Hough变换检测方法和有向单连通链检测方法,Hough变换检测方法具有几何解析性简单、鲁棒性好、易于实现的特点,但也有很多缺点,比如时间复杂性高、存储空间要求较高、不能判断线段的端点和长度等。基于有向单连通链的方法虽然可以定位线段的端点和长度,但是通常需要估计连通链的最小长度、连通链的合并和伪连通链的消除等方法,时间复杂度较高,不适合实时图像处理的应用场合。
[0005]本发明提出了一种快速的水平直线和垂直直线特征点检测方法,使用直线特征之间的匹配方法定量分析直线特征之间的相似性,给出相似性评价指标。
[0006]2.扫描答卷图像的特点
[0007]答卷图像是一种特殊的文档图像,具有一定的版面结构特征。一般答卷图像都含有直线信息,并且包含部分文字内容,考生作答后,字符在尺寸、颜色等方面差别加大,使得答卷图像的分析工作变得相对复杂。
[0008]常用的答卷图像方向判别使用标记点识别方法,一般是一些容易识别的标记块。
[0009]如图1所示,是典型的带标记点的答卷图像(图像左下方的黑色矩形),仅通过识别这些黑色矩形就可以确定答卷的扫描方向,这种方法具有识别快速、准确性高的特点。
[0010]但是随着数字化网上阅卷技术的普及,大量的普通中学开始自行组织数字化网上阅卷项目,答卷的制作、学生考试、答卷扫描、网上阅卷不在依赖专业的技术公司人员,同时给答卷图像的分析工作提出了更高的要求,其中出现了大量的不规范的答卷,标记点的尺寸也缺乏统一的标准,因此研究基于直线特征的扫描方向判别显得尤其重要。
[0011]如图2所示,图像中不存在用于判断扫描方向的标记点,一般通过图像的直线特征分析图像的扫描方向。该答卷图像较复杂,直线特征比较明显,并且直线对应的线段在颜色深浅、粗细、长短方面变化比较大,而且字符包含了中文、英文字符,字符的排列方向上有横排、竖排,字符尺寸变化较大,这些因素增加了直线分析的难度。


【发明内容】

[0012]本发明要解决的技术问题是提供一种答卷的扫描方向判断方法,具有较高的准确性和稳定性,时间复杂度低易于实现。
[0013]本发明采用如下技术手段实现发明目的:
[0014]与现有技术相比,本发明的优点和积极效果是:本发明的直线特征点检测算法计算稳定、高效,并且具有一定的自适应能力,检测行步长或者列步长具有自适应能力;直线的特征点检测算法可处理图像偏斜、直线断裂等复杂情况;直线特征点之间的匹配算法计算稳定、可靠,扫描方向判定方法计算简单、高效,实际计算结果表明该算法可以非常稳定地确定答卷图像的扫描方向;该直线特征点检测、匹配方法可用于其他图像处理领域,例如基于直线检测的文档图像倾斜角估计、表格分析、表格识别等领域。

【专利附图】

【附图说明】
[0015]图1为典型的标记点识别方法判断答卷扫描方向示意图。
[0016]图2为典型的无标记点的答卷图像。
[0017]图3为像素灰度增强邻域选择标识图。
[0018]图4为水平直线左边、右边连续像素标识图。
[0019]图5为水平直线特征点检测流程图。
[0020]图6为水平直线上面、下面连续像素标识图。
[0021]图7为垂直直线特征点检测流程图。
[0022]图8(a)为水平直线长度较短的特征点检测效果图;图8(b)为水平直线长度较长的特征点检测效果图。
[0023]图9(a)为扫描效果较差的原始表格图像;图9(b)为垂直直线特征点检测标记结果图。
[0024]图10(a)为水平直线倾斜的原始扫描图像;图10(b)倾斜图像的水平特征点检测标记结果图。
[0025]图11为图10(a)的水平直线模板数据计算结果。
[0026]图12为图10(a)的垂直直线模板数据计算结果。
[0027]图13(a)为普通答卷模板图像;图13(b)为扫描方向为O时的扫描图像;图13(c)为扫描方向为I时的扫描图像;图13(d)为扫描方向为3时的扫描图像。

【具体实施方式】
[0028]下面结合附图和优选实施例对本发明作更进一步的详细描述。
[0029]1.快速直线特征点检测算法
[0030]1.1答卷图像的最佳分割阈值计算方法
[0031]本发明研究的扫描答卷图像采用10dpi扫描,扫描灰度位深为8,本发明使用k均值聚类方法实现答卷图像的二值化,(k = 2:前景为直线文字等、背景为空白区域,分割阈值初值设置为128),使用迭代方法得到最优分割阈值。这种全局聚类方法在一致的图像区域保证全局最优,是一种非常有效的最佳分割阈值计算方法,该算法的核心思想是找出k个聚类中心,使得每一个样本数据点与其最近的聚类中心的平方距离和最小化,计算步骤:
[0032](1)计算图像的直方图H,满足

【权利要求】
1.一种答卷的扫描方向判断方法,其特征在于,包括如下步骤: (1)扫描答卷,获得答卷图像; (2)计算答卷图像的最佳分割阈值; (3)检测水平直线特征点; (4)检测垂直直线特征点; (5)水平直线特征点和垂直直线特征点进行匹配; (6)生成模板数据; (7)判断扫描方向。
2.根据权利要求1所述的答卷扫描方向判断方法,其特征在于,所述步骤(2)包括如下步骤: (2.1)计算图像的直方图H,满足二I(D (2.2)根据灰度分割阈值TO (初值为128),计算两个聚类中心,前景聚类中心CO、背景聚类中心Cl,彳两足:
(2.3)根据前景、背景的聚类中心,得到分割阈值Tl,满足条件:
(2.4)若TO == Tl,迭代停止,转步骤(5),否则令TO = Tl,重复执行步骤(2); (2.5)输出最佳灰度分割阈值Tl。
3.根据权利要求1所述的答卷扫描方向判断方法,其特征在于,所述步骤(3)包括如下步骤: (3.1)记水平直线检测的列位置总数为Nh,一般取Nh = 32,假设图像的宽度表示为W,则列位置的间隔(步长)Sh表示为: Sh = ff/Nh(5) 因此所有的列位置的集合可以表示为: Ph= {px|i*Sh},i = O, 1,2,...(Nh-1)(6) 依次判断每个列位置上的行位置处像素灰度是否满足水平直线的特征点; (3.2)设定一个初值Rh,如果(Dh/Nh) <Rh成立,取Rh = 0.90,则重新调整Sh为Sh’如下: Sh,= Sh*(Dh/Nh)(8) (3.3)输出所有列位置上的水平直线特征点,列位置的总数Nh’Nh,= W/Sh, 经过列的步长调整后,重新检测特征点Dh。
4.根据权利要求3所述的答卷扫描方向判断方法,其特征是:所述步骤(3.1)的水平直线的特征点满足两个基本条件: 条件(I):该位置处的像素灰度小于最佳灰度分割阈值Tl,如果该位置处的像素灰度大于等于Tl,则增强该位置处的像素灰度,增强后的像素灰度如果小于固定灰度阈值Td =128,则仍认为该位置处的原始像素灰度小于最佳分割阈值Tl,选择在该位置处增强灰度,将大大提高直线检测的稳定性,同时又保证了水平直线特征点检测的速度;首先计算选择增强灰度位置邻域内所有像素的平均灰度M,当前像素的灰度为g,增强因子记为σ,则增强后的灰度g’计算为: g =g+o*(g-M)(7) 增强相关的邻域尺寸与检测直线的宽度(粗细)有关,经大量样本反复实验,一般设置为待检测直线的宽度,增强因子一般设置为6.0,该值越大,越能够从极低质量的图像中检测出特征点,但是会增加伪特征点被检测出来的概率; 条件(2):该位置处左边至少有连续Lh个像素位置满足条件(I),或者该位置处右边至少有连续Lh个像素位置满足条件(I),或者该位置处左边与右边总共至少有连续Lh个像素位置满足条件(I)。
5.根据权利要求1所述的答卷扫描方向判断方法,其特征在于,所述步骤(4)包括如下步骤: 使用两个集合表示某两个行或者某两个列检测到的直线特征点的位置,直线特征点的位置构成直线模式,
Li (Po? PlJ...Pm- Lj = {Qoj Qd...Qn-J(14) I幸j 公式(14)表示在第i个位置检测到了 m个直线特征点的坐标,在第j个位置检测到了η个直线特征点的坐标,因为直线检测是按照坐标从小到大顺序检测的,因此满足下列不等式: ρ0<ρ1<ρ2<,...〈Pm(15)
q0<q1<q2<,...<qn_i 这样直线特征点之间的匹配问题等价于两个位置集合之间的最佳匹配问题,并且两个集合中的坐标满足公式(15)的要求,所有可能的匹配模式总数C = m*n,假定集合Li中的第α个位置和集合Lj中的第β个位置是匹配的,定义该匹配模式的相似度Sa,e为:
Sa,@ = Rm*Em Rm e [O, I](16)
Em e [O, I] 其中Rm表示匹配率,Em表示匹配精度,匹配率和匹配精度越大越好,集合Li中的第a个位置和集合Lj中的第β个位置匹配时,按下列方式判断是否匹配:
其中T表示系统容许的最大匹配误差参数,一般设置为6,越大表示越容易匹配,越小表示系统要求的匹配精度越高,f (pa,qe) = I表示两个点是匹配的,否则两个点不匹配,不匹配时匹配误差记为O,匹配的两个点按如下方式计算两个点位置的匹配误差:e(pa) q0) = Pa-Q0 /T(18) 计算Sa,e时,先按如下方式调整集合Li和Lj:
Li = {Po_P a,Pl-P a )...Pm-1-P a I = (P 0,Pl,...P m-J
Lj {Qo Qβ j Qi Qβ,...Qn-1 Qβ I {q q,Qi,...Q m-(19) i幸j 按公式(19)调整后,集合Li中第α个位置处的坐标为0,同理集合Lj中第β个位置处的坐标为O。下面计算集合Li中第k个点的坐标在集合Lj中的匹配点对应的下标k’,该下标满足条件: min (I p,J5-Qkk' ), kk = O, I, 2...m_l(20) 根据公式(20)可以计算出集合Li中每个点的下标Ui在集合Lj中匹配的下标Vi,记匹配对应关系为: M = {(Ui, Vi) I i = O, I, 2,...(m-Ι)}(21) 根据匹配对应关系,计算匹配率和匹配精度如下:
将公式(21)、公式(22)带入公式(16)即可得到Sa, e,因此直线特征点之间的匹配问题等价于如下最大值问题:maxSa? 0 a = 0,1,2,…(m-1)(23)
β = 0,1,2,...(η-1)
6.根据权利要求1所述的答卷扫描方向判断方法,其特征在于,所述步骤(5)包括如下步骤: (1)每个水平直线模式都记录了水平直线的位置,计算每个水平直线模式中水平直线位置的个数,如果Dh个水平直线模式中水平直线位置的个数的最大值只有一个,那么直接给出直线模式对应的特征点数据作为模板数据,同时可信度标记为0,这时需要人工确认模板数据正确性以免发生错误;否则转步骤(2); (2)如果Dh个水平直线模式中水平直线位置的个数的最大值大于I个,那么根据直线特征点之间的匹配算法两两计算它们之间的匹配相似度,把匹配相似度最大的两个直线模式之一作为模板数据输出,可信度即为这两个直线模式之间的匹配相似度,相似度小于给定的阈值,则需要人工确认模板数据的正确性。
7.根据权利要求1所述的答卷扫描方向判断方法,其特征在于,所述步骤(6)包括如下步骤:(1)对模板图像执行水平直线特征点检测并生成模板数据no,扫描方向为方向O,记录图像的宽度WO和高度HO之间的大小关系Ω0,根据模板数据no生成数据Π2,模板数据中有m个水平直线特征点坐标: η O = (Pi I i = O, I, 2,...(m-1)}(24)
η 2 = {HO-pj i = O, I, 2,...(m-1)} (2)输入待确定扫描方向的图像I; (3)图像I的宽度Wl和高度Hl之间的大小关系ΩI如果与Ω —致,则图像I的扫描方向为方向O或者方向2,转步骤(4),否则图像I的扫描方向为方向I或者方向3,转步骤(7); (4)检测图像I的水平直线特征点,输出所有列位置上的水平直线特征点,假设最终输出了 N个水平直线模式Ψ = {ψ0, Ψ1; Ψ2...Ψη},根据直线特征点之间的匹配算法计算模板数据no与N个水平直线模式Ψ之间的相似度,得到N个相似度Snciw,同理计算模板数据Π 2与N个水平直线模式Ψ之间的相似度,得到N个相似度S η2,Ψ: sn0;w = IsncuIi = O, 1,2...(N-1)}(25)
Sn2jW = Is n2,i I i = 0, I, 2...(N-1)} (5)计算中最大的相似度 ,记为Sn,计算中最大的相似度,记为sn’2; (6)如果%,。>(%,2+3),则图像1的扫描方向为方向0,其中δ为可靠性控制参数,一般取值为0.1,如果(Su+S )〈Sq,2,图像I的扫描方向为方向2,否则图像I的扫描方向不能确定,给出提示信息,人工确认扫描方向, (7)检测图像I的垂直直线特征点,输出所有行位置上的垂直直线特征点,假设最终输出了 K个垂直直线模式φ 二丨,根据直线特征点之间的匹配算法计算模板数据η0与K个垂直直线模式φ之间的相似度,得到K个相似度*Vtp,同理计算模板数据Π2与K个垂直直线模式φ之间的相似度,得到K个相似度:
K ~\)\(26)
U.V.,|/ = (U2...(/<-m (8)计算&_中最大的相似度,记为Sn,计算中最大的相似度,记为Sy; (9)如果SyMsu+δ),则图像I的扫描方向为方向1,如果(Si^SXsn3,图像I的扫描方向为方向3,否则图像I的扫描方向不能确定,给出提不信息,人工确认扫描方向。
【文档编号】G06T7/00GK104077562SQ201410218996
【公开日】2014年10月1日 申请日期:2014年5月22日 优先权日:2014年5月22日
【发明者】马磊, 刘江, 张华英, 张杉 申请人:山东山大鸥玛软件有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1