一种文档拆分方法及系统的利记博彩app

文档序号:9708279阅读:288来源:国知局
一种文档拆分方法及系统的利记博彩app
【技术领域】
[0001]本发明涉及数据加工技术领域,特别涉及一种文档拆分方法及系统。
【背景技术】
[0002]Epub电子书格式是一种新的电子出版物格式。Epub是基于html超文本标记语言,而随着信息网络的发展,超文本标记语言的表达能力也得到了极大的加强,html 5的推出,更是进一步提升html在互动和多媒体方面的优势。Epub的最新的3.0版本就是基于html5技术,应该说网络的发展促进了 html的进步,基于html技术的epub电子书同样也得到了飞速的发展和普及,这种不断的进步和发展,使得epub成为了未来电子出版物事实的发展方向和标准。
[0003]随着电子出版物的普及,传统纸质印刷品出版物面临很大的竞争压力,但是同时对于出版行业,这同样是一种机遇,很多传统的出版企业都转向电子出版领域,相应的这些企业对于从工业流程从传统印刷排版工具平滑过渡到电子出版物制作工具有着强烈的需求。
[0004]当前出版发行企业有很多现有的印刷排版文档,需要转换为电子出版物文档,未来新出版发行的出版物也往往同时需要纸质印刷品和电子出版物的同步上线。
[0005]现有的很多传统排版工具考虑到这类,都推出了自己的解决方案,对于将传统排版文档转换为Html格式内容,各有各的处理模式,对于将一个比较大的排版文档拆分成多个部分,现有的解决方案无外乎以下两类:
[0006]第一类是从内容着手,根据原始内容的格式、样式、章节、片段去拆分,这样做只是为了拆分而拆分,这样简单的拆分存在极大的不确定性,需要人工去判断结果是否合理,如果最终的结果不合理,输出和转换的过程都需要重新来过,极大的影响了效率,浪费了人工。
[0007]第二类是从结果Html文件着手,先从原始排版内容输出一个大的html文件,再通过对于Html结果的容量做分配,或者样式、格式等内容作解析,重新拆分,这样相对以第一类来说,生成html的流程可以不用重新执行,但是拆分的结果仍然存在不确定性,需要人工干预,对于效率的影响仍然是可以预见的。
[0008]无论第一类还是第二类方案,都存在人工干预,效率问题,而且结果都没有考虑到最终epub文件客户端的显示效果,只有最后把转换的结果传输到客户端设备上,才能最终发现拆分的结果是不是真的合理和完善,如果存在问题,又需要重复排版流程。

【发明内容】

[0009]为了避免人工干预,并提高文档的拆分效率,本发明提供了一种文档拆分方法,所述方法包括:
[0010]获取至少一个印刷排版文档,在每个印刷排版文档内的强制换页位置和文档的结尾位置插入强制拆分标记,在每个印刷排版文档的章、节或段落划分处插入辅助拆分标记,并将所述至少一个印刷排版文档整合成一个待拆分文档;
[0011]按照预设显示区域尺寸对所述待拆分文档进行重排;
[0012]根据所述强制拆分标记和辅助拆分标记在重排后的待拆分文档中插入文档拆分标记;
[0013]根据所述文档拆分标记对所述待拆分文档进行拆分。
[0014]其中,所述根据所述强制拆分标记和辅助拆分标记在重排后的待拆分文档中插入文档拆分标记,具体包括:
[0015]将所述重排后的待拆分文档的第一个页面作为当前页面;
[0016]从所述当前页面开始选取预设数量的页面;
[0017]若选取到的页面中存在强制拆分标记,则在所述强制拆分标记的位置插入文档拆分标记,将所述强制拆分标记所在页面的后一页面作为新的当前页面,执行所述从当前页面开始选取预设数量的页面的步骤,直至所述重排后的待拆分文档的所有页面均被选取至IJ,再执行所述根据所述文档拆分标记对所述待拆分文档进行拆分的步骤;
[0018]若选取到的页面中不存在强制拆分标记,则从所述选取到的页面的后一页面开始寻找第一个辅助拆分标记,在寻找到的第一个辅助拆分标记的位置插入文档拆分标记,并将所述寻找到的第一个辅助拆分标记所在页面的后一页面作为新的当前页面,执行所述从当前页面开始选取预设数量的页面的步骤,直至所述重排后的待拆分文档的所有页面均被选取到,再执行所述根据所述文档拆分标记对所述待拆分文档进行拆分的步骤。
[0019]其中,所述在寻找到的第一个辅助拆分标记的位置插入文档拆分标记之前,还包括:
[0020]判断所述寻找到的第一个辅助拆分标记所在页面是否存在强制拆分标记,若是,则在所述第一个辅助拆分标记所在页面的强制拆分标记的位置插入文档拆分标记,将所述寻找到的第一个辅助拆分标记所在页面的后一页面作为新的当前页面,直接执行所述从当前页面开始选取预设数量的页面的步骤。
[0021]其中,所述根据所述强制拆分标记和辅助拆分标记在重排后的待拆分文档中插入文档拆分标记之前,还包括:
[0022]为所述重排后的待拆分文档中每个页面添加页面序号;
[0023]所述从所述当前页面开始选取预设数量的页面,具体包括:
[0024]根据所述页面序号从所述当前页面开始选取预设数量的页面。
[0025]其中,所述按照预设显示区域尺寸对所述待拆分文档进行重排,具体包括:
[0026]根据所述待拆分文档的显示区域尺寸和预设显示区域尺寸之间的区别对所述待拆分文档的文字字号按比例进行缩放,将缩放后的待拆分文档通过排版引擎进行重排。
[0027]本发明还公开了一种文档拆分系统,所述系统包括:
[0028]获取插入模块,用于获取至少一个印刷排版文档,在每个印刷排版文档内的强制换页位置和文档的结尾位置插入强制拆分标记,在每个印刷排版文档的章、节或段落划分处插入辅助拆分标记,并将所述至少一个印刷排版文档整合成一个待拆分文档;
[0029]文档重排模块,用于按照预设显示区域尺寸对所述待拆分文档进行重排;
[0030]标记插入模块,用于根据所述强制拆分标记和辅助拆分标记在重排后的待拆分文档中插入文档拆分标记;
[0031]文档拆分模块,用于根据所述文档拆分标记对所述待拆分文档进行拆分。
[0032]其中,所述标记插入模块具体包括:
[0033]页面确定单元,用于将所述重排后的待拆分文档的第一个页面作为当前页面;
[0034]页面选取单元,用于从所述当前页面开始选取预设数量的页面;
[0035]寻找插入单元,用于若选取到的页面中存在强制拆分标记,则在所述强制拆分标记的位置插入文档拆分标记,将所述强制拆分标记所在页面的后一页面作为新的当前页面;若选取到的页面中不存在强制拆分标记,则从所述选取到的页面的后一页面开始寻找第一个辅助拆分标记,在寻找到的第一个辅助拆分标记的位置插入文档拆分标记,并将所述寻找到的第一个辅助拆分标记所在页面的后一页面作为新的当前页面。
[0036]其中,所述系统还包括:
[0037]标记判断模块,用于判断所述寻找到的第一个辅助拆分标记所在页面是否存在强制拆分标记,若是,则在所述第一个辅助拆分标记所在页面的强制拆分标记的位置插入文档拆分标记,将所述寻找到的第一个辅助拆分标记所在页面的后一页面作为新的当前页面。
[0038]其中,所述系统还包括:
[0039]序号添加模块,用于为所述重排后的待拆分文档中每个页面添加页面序号;
[0040]所述寻找插入单元,进一步用于根据所述页面序号从所述当前页面开始选取预设数量的页面。
[0041]其中,所述文档重排模块,进一步用于根据所述待拆分文档的显示区域尺寸和预设显示区域尺寸之间的区别对所述待拆分文档的文字字号按比例进行缩放,将缩放后的待拆分文档通过排版弓I擎进行重排。
[0042]本发明通过强制拆分标记和辅助拆分标记在重排后的待拆分文档中插入文档拆分标记,并根据所述文档拆分标记对所述待拆分文档进行拆分,达到了合理的文档拆分,避免了人工干预,并提高了文档的拆分效率。
【附图说明】
[0043]图1是本发明一种实施方式的文档拆分方法的流程图;
[0044]图2a是一般纸质的印刷版面第一页的示意图;
[0045]图2b是一般纸质的
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1