基于曲线投影的畸变文本图像基线估计方法_3

文档序号:9598205阅读:来源:国知局
Θ表示条带图像投影线的法线与条带图像横坐标轴的夹角;
[0109] α表示条带图像投影线与横坐标轴的最小夹角;
[0110] β表示条带图像投影线与横坐标轴的最大夹角。
[0111] 作为示例,图2给出了条带投影图计算的原理图。对每一个条带图像,在该条带上 分别建立两个坐标系:图像坐标系UOV和投影坐标系xoy。其中图像坐标系原点位于条带图 像左上角,u轴和v轴分别平行于图像的列和行方向,投影坐标系原点位于条带图像中心, X轴和y轴分别与图像坐标系的u轴和v轴平行。条带图像的投影图主要计算过条带图像 中心线上每一点,图像沿多个方向的投影值。在图2中,p为条带图像中心线上一点。为估 计条带的最优投影线,只需对条带中心线上每一点确定过该点的最优投影线即可。作为示 例,图3a显示了根据一示例性实施例示出的条带图像的边缘图;图3b显示了根据一示例 性实施例示出的条带图像的Radon变换结果;图3c显示了根据一示例性实施例示出的根据 Radon变换得到的条带图像的投影图。
[0112] S106 :根据投影图,估计条带图像的最优投影线。
[0113] 在该步骤中,在投影图R(k,Θ )上构造约束优化问题,并利用动态规划算法计算 条带图像的所有最优投影线。其中,构造的约束优化问题如下:
[0115] 其中,
[0116] 0,表示条带图像第k(k= 1,"·,Η)行中心点的投影线对应的最优夹角参数,该参 数为待估计参数;
[0117] Ρ表示投影值的幂指数参数,优选地,Ρ彡3 ;
[0118] λ表示权重参数;
[0119] Φ ( Θ i,…,θ Η)表示投影线夹角参数的光滑项,用来平滑相邻投影线的夹角参数, 定义如下:
[0121] 其中,σ为一设定参数,用来控制平滑项对相邻投影线夹角差值的敏感度。
[0122] 其中,动态规划是:每次决策依赖于当前状态,又随即引起状态的转移。一个决策 序列就是在变化的状态中产生出来的,所以,这种多阶段最优化决策解决问题的过程就称 为动态规划。
[0123] 在一个可选的实施例中,所述利用动态规划算法计算最优投影线时,需要首先构 造一个加权有向图,具体步骤包括:
[0124] 首先,对投影图R(k,Θ)的k坐标和Θ坐标进行离散采样,得到k-θ平面上系列 网格点(ks,Θ j) (1彡s彡n,1彡j彡m),如图4a所示。其中匕为k方向的离散采样点,Θ j为Θ方向的离散采样点,η为k坐标的采样点总数,m为Θ坐标的采样点总数。将这些网 格点作为构造的加权有向图的顶点。
[0125] 其次,连接加权有向图边。当且仅当两个顶点(ks d Θ D和(ks,Θ 〇对应的投影线 满足不相交条件,对这两个顶点构建一条有向边。为方便起见,记顶点(ksl,Θ1)对应的投 影线角度为%^,同时用该符号来表示对应的顶点。两条相邻的投影线不相交, 当且仅当$&位于如下区间内:
[0127] 其中,
[0128] ^表示前一条投影线与条带图像左边界交点的行坐标,并根据以下公式计算:
[0130] %表示前一条投影线与条带图像右边界交点的行坐标,并根据以下公式计算:
[0132] w表示条带图像的宽度;
[0133] 最后,计算加权有向图边的权重。对于连接顶点爽^和:#的一条有向边,赋予权重 Hf,
[0135] 其中,
[0136] p表示指定的幂指数;
[0137] Δ k表示对投影图k坐标的采样间隔;
[0138] λ表示权重参数;
[0139] σ表示设定参数,用来控制平滑项对相邻投影线夹角差值的敏感度;
[0140] h表示角度步长,并根据以下公式计算:
[0142] 在得到加权有向图之后,将求解上述约束优化问题
转换成所构造的加权有向图上的最长路 径规划问题。为此,需要在加权有向图的左方和右方分别添加一个虚拟的起点和终点,其中 起点与加权有向图最左边的所有顶点连接,终点与加权有向图最右边的所有顶点连接,所 有连接边的权重设置为零。从而,将上述约束优化问题转换为求解一条从加权有向图的左 方起点至加权有向图右方终点的一条最长路径。该问题的求解是一个经典的最长路径问 题,可通过Di jkstra等经典算法快速求解。
[0144] 作为示例,图4a给出了构造加权有向图的示意图。对投影图R(k,Θ)的k坐标和 Θ坐标进行离散采样,得到k-θ平面上系列网格点,这些网格点作为有向图的顶点。在构 造有向边时,仅对满足不相交约束的相邻顶点进行边的连接。作为示例,图4b给出了计算 相邻两条投影线不相交约束的示意图。为保证相邻两条投影线不相交,当前的投影线应位 于前一条投影线和当前点所确定的角形区域内。在图4b中,L表示条带图像的中心线,ksl和1分别为条带图像中心线上相邻的两点,直线AB为过k s i的一条直线,该直线与条带图 像左右边界相交于A和B两点。从图中可以看出,为使过ks的直线与直线AB不相交,该过 ks的直线必须位于由A、B以及过k 3三点确定的角型区域内。作为示例,图5a给出了在条 带投影图上计算最优投影线的结果,该结果对应于在构造的加权有向图上计算从左至右的 最优路径。图5b给出了对应于条带图像上的最优投影线。从图5b中可以看出,这些最优 投影线对应于条带图像的基线。需要指出,由于图像畸变及相机透视效应,条带图像上的基 线通常不平行。图5c和图5d分别给出了沿图像固定方向和沿最优投影线计算条带图像投 影直方图的结果。可以看出,沿最优投影线得到的投影直方图峰值显著,不存在混叠现象。
[0145] S108 :根据条带图像的最优投影线及边界线,得到畸变文本图像的基线。
[0146] 在该步骤中,对图像最左侧的条带图像,对经过条带图像中心线上每一点的最优 投影线,利用投影线方程,计算该最优投影线与条带图像左、右边界的交点,其中若该条带 图像与相邻条带图像相互重合,则选择重合部分的中心线作为条带图像的边界线;从左向 右,将前一条带图像的最优投影线与右边界的交点作为当前条带图像最优投影线的起点, 利用条带投影线方程,计算条带图像最优投影线与条带图像右边界的交点;重复上述过程, 直到位于图像最右侧的条带图像计算完毕;最后,利用三次样条曲线对上述所有交点进行 逼近,得到一条光滑的基线。
[0147] 作为示例,图6给出了相邻条带图像基线连接的示意图。图中Si p SJP S 1+1分别 表示三个相邻且两两重合的条带图像。在进行基线连接时,基线的起点设在条带图像重合 区域的中心线上。
[0148] 为了验证本发明实施例,对多幅真实拍摄的不同畸变形状的文本图像进行了基线 提取。作为示例,图7为根据一示例性实施例示出的利用本发明实施例方法得到的多幅畸 变文本图像基线估计的示意图。其中,第一行为原始的畸变文本图像,可以看出,这些图像 具有不同的畸变形状以及不同的版面结构。部分图像还含有成像过程中引入的页边噪声 等。第二行给出了利用本发明实施例提供的方法提取的图像基线结果。第三行给出了图像 沿提取的图像基线进行图像投影得到的投影直方图。从中可以看出,这些投影直方图具有 显著的峰值,直方图中波峰和谷底具有很好的可分性,这将方便后续的图像版面分割与分 析。第四行给出了局部放大图像上基线的提取效果。可以看出,利用本发明实施例提取的 图像基线精度很高,提取的基线与弯曲的文本行拟合很好。这为后续的图像畸变矫正提供 了很好的特征线。
[0149] 本实施例中将各个步骤按照上述先后次序的方式进行了描述,本领域技术人员可 以理解,为了实现本实施例的效果,不同的步骤之间不必按照这样的次序执行,其可以同时 执行或执行次序颠倒,这些简单的变化都在本发明的保护范围之内。
[0150]
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1