横向校对和输出双层pdf的方法和装置制造方法

文档序号：6518636阅读：280来源：国知局

横向校对和输出双层pdf的方法和装置制造方法
【专利摘要】一种横向校对和输出双层PDF的方法和装置，涉及文字处理领域。本发明实施例提供的方法，包括如下步骤：从OCR识别引擎记录的每个字符在图像中的外接矩形的位置导入行图像和字符图像的位置；修改错误文字和修改文字位置；根据字符图像位置和大小输出双层PDF文件。本发明适用于文字校对、双层PDF文件加工系统。本发明为解决目前书籍资料电子化生成双层PDF过程中文字位置校正精度低、效率低的问题而发明。利用OCR识别的文字位置信息导入行图像和字符图像的位置，在文字校对的过程中，通过拆分、合并和调整字符图像位置，使输出的双层PDF文件文字层和图像层完全重合，相对之前的双层PDF生成方法，本发明大大减少了修改工作量，提高了双层PDF质量，以所见即所得的方式生成双层PDF文件。
【专利说明】横向校对和输出双层PDF的方法和装置
【技术领域】
[0001]本发明属于文字处理领域，涉及一种数据校对和输出双层TOF的方法和装置，具体涉及一种横向校对和输出双层HF的方法和装置。
【背景技术】
[0002]一个完整的数据校对和输出双层TOF的系统分为以下部分:纸质资料的扫描、图像处理、图像版面分析、字符识别、横向校对、输出双层HF、修改PDF文字层字符大小和位置。
[0003]横向校对就是以字符为背景，调用字符所对应的图像与字符进行比对，同时，以颜色标记识别可信度和修改过的文字。由于以字符为背景，无法在校对过程中修改字符图像拆分错误和调整字符图像精度，使输出的双层PDF文件文字层和图像层对应的精度低，字符大小不准确。后期使用其他工具修改字符大小和位置的工作量非常大。

【发明内容】

[0004]本发明所要解决的技术问题是提出一种横向校对方法和装置，将对于文档中识别转换时拆分错误的字符图像进行合并和拆分，调整字符图像位置，使字符位置和字符图像位置一一精确对应，使输出的双层PDF文件和该装置校对时的效果达到所见即所得的效果。提高了校对效率和输出精度。
[0005]本发明公开了一种横向校对和输出双层PDF的方法，包括以下步骤:
步骤1:从OCR识别引擎记录的每个字符在图像中的外接矩形的位置导入行图像和字符图像的位置；
步骤2:修改字符和字符图像位置；
步骤3:根据字符图像位置和大小输出双层PDF文件；
所述步骤I包括以下步骤:
步骤1.1:根据每个字符在图像中的位置，分析出行图像，计算出行图像的位置。
[0006]步骤1.2:根据每个字符在图像中的位置和所在行图像的位置，使用行图像的上下边界和字符图像左右边界形成的矩形框得到字符图像的位置。
[0007]所述步骤2包括以下步骤:
步骤2.1:浏览字符图像和字符文字，查找错误字符和位置错误的文字图像；
步骤2.2:对识别成多个字符结果的字符图像进行合并处理；对识别成单个字符结果的多个字符图像进行拆分处理；修改错误的文字；调整字符图像的位置和大小；
所述步骤2.1中，有以下几种显示方式:
方式3.1:以图像为背景，文字行显示在图像行的上方或下方；
方式3.2:以图像为背景，文字行和图像行完全重合；
方式3.3:文字行和图像行交错显示；
所述步骤2.1中，文字行和图像行有以下几种对齐方式: 方式4.1:文字行中每个字符相对于图像行中的字符图像居中对齐；
方式4.2:文字行整行相对于图像行居中对齐；
所述步骤2.2的合并处理是:合并所述多个字符结果的外接矩形，得到正确的字符图像。
[0008]所述步骤2.2的拆分处理是:将选中的字符图像外接矩形分成左右两个字符图像。
[0009]所述步骤2.2的调整字符图像的位置和大小是:调整字符图像的外接矩形的大小和位置，选中字符图像，调整外接矩形框的宽度、高度或者位置。
[0010]所述步骤3中输出双层PDF文件时根据行图像高度计算字体大小，根据文字图像中心位置计算输出字符的中心位置。
[0011]本发明还公开了一种横向校对和输出双层TOF的装置，其特征在于:包括以下模块:
输入模块，从OCR识别引擎记录的每个字符在图像中的外接矩形的位置导入行图像和字符图像的位置；
校对模块，修改字符和字符图像位置；
输出模块，根据字符图像位置和大小输出双层PDF文件。
[0012]OCR识别过程中，存在文字识别错误和文字图像拆分错误，一个字符图像被识别成多个字符，多个字符图像被识别成一个字符。传统的校对方式是以识别后的文字为背景，只能修改识别错误的文字，无法修改文字和图像的对应关系。本发明横向校对和输出双层HF的方法和装置的优点在于:在横向校对时以图像为背景，提取每个文字图像行对应的字符行进行校对，校对过程中可以相对于每个字符图像对齐显示字符，可以拆分、合并和调整文字对应的图像位置。在输出双层TOF时，使用文字对应的图像的大小计算文字大小和位置输出。使输出的双层PDF文件和该装置校对时的效果达到所见即所得的效果。提高了校对效率和输出精度。
【专利附图】

【附图说明】
[0013]图1为本发明横向校对方法和输出双层PDF的流程图；
图2为本发明横向校对和输出双层PDF方法在拆分前显示状态图；
图3为本发明横向校对和输出双层PDF方法在拆分后显示状态图；
图4为本发明横向校对和输出双层PDF方法在合并前显示状态图；
图5为本发明横向校对和输出双层PDF方法在合并后显示状态图；
图6为本发明横向校对和输出双层PDF方法在改正文字和调整字符图像位置后显示状态图；
图7为本发明横向校对和输出双层PDF方法在输出前显示状态图；
图8为本发明横向校对和输出双层PDF方法在输出后显示状态图；
图9为本发明数据标引导入字符外接矩形和生成文字行的算法流程。
【具体实施方式】
[0014]为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和【具体实施方式】对本发明作进一步详细的说明。
[0015]本发明公开了一种横向校对和输出双层TOF的方法，如图1所示，包括以下步骤: 步骤1:从OCR识别引擎记录的每个字符在图像中的外接矩形的位置，根据每个文字外
接矩形构建文字行的位置。如果文字外接矩形上边缘小于文字行下边缘，文字行上边缘小于文字外接矩形下边缘，那么认定该文字在该行中。文字行外接矩形是该行中所有文字外接矩形的合并结果。具体算法流程见附图9。
[0016]步骤2:修改字符和字符图像位置；
逐行比对字符图像和字符图像对应的字符文字，找到错误字符和位置错误的文字图像。本实施例中，字符图像和对应的字符居中显示时，很容易发现错误的字符和不正确的字符拆分。如图2所示的是多个字符被识别成单个字符图像的情况。如图4所示的是单个字符被识别成多个字符图像的情况。
[0017]当一个字符图像被识别成多个字符结果时，进行合并处理，选中多个字符，合并这些字符的外接矩形，得到正确的字符图像。如图5所示的是合并后的处理结果。对识别成单个字符结果的多个字符图像进行拆分处理，将选中的字符图像外接矩形分成左右两个字符图像，如图3所示的是拆分后的处理结果。修改错误的文字；调整字符图像的外接矩形的大小和位置，选中字符图像，调整外接矩形框的宽度、高度或者位置。如图6所示的是改正文字和调整字符图像位置后的处理结果。
[0018]所述步骤2中，本实施例中有以下几种显示方式:
如图2、图3和图6所示以图像为背景，文字行显示在图像行的上方或下方；
如图7所示以图像为背景，文字行和图像行完全重合；
如图4和图5所示，文字行和图像行交错显示；
所述步骤2中，本实施例中文字行和图像行有以下几种对齐方式:
如图2和图4所示，文字行中每个字符相对于图像行中的字符图像居中对齐；
如图3和图5所示，文字行整行相对于图像行居中对齐；
所述步骤3中，本实施例先向PDF文件输出图像层，然后根据校对后字符图像位置，得到文本层的输出位置，根据字符图像外接矩形宽度得到文字大小，输出文本层。得到双层PDF文件，如图7所示是输出前，如图8所示是输出后同时显示文字和图像的效果图。
[0019]本发明还公开了一种横向校对和输出双层TOF的装置，包括以下模块:
一种横向校对和输出双层PDF的装置,包括以下模块:
输入模块，从OCR识别引擎记录的每个字符在图像中的外接矩形的位置导入行图像和字符图像的位置；其中，导入行图像和字符图像的位置包括:根据每个字符在图像中的位置，分析出行图像，计算出行图像的位置；根据每个字符在图像中的位置和所在行图像的位置，使用行图像的上下边界和字符图像左右边界形成的矩形框得到字符图像的位置；
校对模块，修改字符和字符图像位置；其中，修改字符和字符图像位置包括:浏览字符图像和字符文字，查找错误字符和位置错误的文字图像；对识别成多个字符结果的字符图像进行合并处理；对识别成单个字符结果的多个字符图像进行拆分处理；修改错误的文字；调整字符图像的位置和大小；
输出模块，根据字符图像位置和大小输出双层PDF文件。
[0020]本发明首先对于文档中识别成单个字符的多个字符图像进行拆分，对于文档中识别成多个字符的单个字符图像进行合并，对精度错误的字符位置进行调整，得到字符图像和字符完全对应的结果，并且按多种显示方式显示，方便检查和改错。使字符位置和字符图像位置一一精确对应，使输出的双层PDF文件和该装置校对时的效果达到所见即所得的效果。提高了校对效率和输出精度。
【权利要求】
1.一种横向校对和输出双层HF的方法，包括以下步骤: 步骤1:从OCR识别引擎记录的每个字符在图像中的外接矩形的位置导入行图像和字符图像的位置；步骤2:修改字符和字符图像位置；步骤3:根据字符图像位置和大小输出双层PDF文件；其中，所述步骤I的导入行图像和字符图像的位置，包括以下步骤: 步骤1.1:根据每个字符在图像中的位置，分析出行图像，计算出行图像的位置；步骤1.2:根据每个字符在图像中的位置和所在行图像的位置，使用行图像的上下边界和字符图像左右边界形成的矩形框得到字符图像的位置；所述步骤2的修改字符和字符图像位置，包括以下步骤: 步骤2.1:浏览字符图像和字符文字，查找错误字符和位置错误的文字图像；步骤2.2:对识别成多个字符结果的字符图像进行合并处理；对识别成单个字符结果的多个字符图像进行拆分处理；修改错误的文字；调整字符图像的位置和大小。
2.根据权利要求1所述的方法，所述步骤2.1中，有以下几种显示方式: 方式3.1:以图像为背景，文字行显示在图像行的上方或下方；方式3.2:以图像为背景，文字行和图像行完全重合；方式3.3:文字行和图像行交错显示。
3.根据权利要求1所述的方法，所述步骤2.1中，文字行和图像行有以下几种对齐方式: 方式4.1:文字行中每个字符相对于图像行中的字符图像居中对齐；方式4.2:文字行整行相对于图像行居中对齐。
4.根据权利要求1所述的方法，所述步骤2.2的合并处理是:合并所述多个字符结果的外接矩形，得到正确的字符图像。
5.根据权利要求1所述的方法，所述步骤2.2的拆分处理是:将选中的字符图像外接矩形分成左右两个字符图像。
6.根据权利要求1所述的方法，所述步骤2.2的调整字符图像的位置和大小是:调整字符图像的外接矩形的大小和位置，选中字符图像，调整外接矩形框的宽度、高度或者位置。
7.根据权利要求1所述的方法，所述步骤3中，输出双层PDF文件时根据行图像高度计算字体大小，根据文字图像中心位置计算输出文字的中心位置。
8.—种横向校对和输出双层PDF的装置,包括以下模块: 输入模块，从OCR识别引擎记录的每个字符在图像中的外接矩形的位置导入行图像和字符图像的位置；其中，导入行图像和字符图像的位置包括:根据每个字符在图像中的位置，分析出行图像，计算出行图像的位置；根据每个字符在图像中的位置和所在行图像的位置，使用行图像的上下边界和字符图像左右边界形成的矩形框得到字符图像的位置；校对模块，修改字符和字符图像位置；其中，修改字符和字符图像位置包括:浏览字符图像和字符文字，查找错误字符和位置错误的文字图像；对识别成多个字符结果的字符图像进行合并处理；对识别成单个字符结果的多个字符图像进行拆分处理；修改错误的文字；调整字符图像的位置和大小；输出模块，根据字符图像位置和大小输出`双层PDF文件。
【文档编号】G06F17/25GK103714047SQ201310558843
【公开日】2014年4月9日申请日期:2013年11月12日优先权日:2013年11月12日
【发明者】段雅东, 陈永生, 高志强申请人:知识产权出版社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：段雅东;陈永生;高志强;
技术所有人：知识产权出版社;
我是此专利的发明人

上一篇：一种通过组合键唤醒App或Activity的实现方法
上一篇：一种基于web的服务器远程管理系统的利记博彩app

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。