专利名称:根据特征图像流程识别和验证未知文档的利记博彩app
技术领域:
本发明涉及使用灵活文档验证框架对护照、驾驶执照、出生证明或财务文档之类 的安全文档进行计算机辅助识别和验证。
背景技术:
计算机辅助技术正越来越多地用于从安全文档捕捉、识别、验证和提取信息。例 如,电子护照阅读器之类的安全文档阅读器正在更加普遍地用于读取和确认安全文档的可 靠性。安全文档的例子包括护照、信用卡、身份证、驾驶执照、出生证明、商业票据和财务文 档。对于一些安全文档,ICAO(国际民用航空组织)提供了使用计算机辅助技术识别安全 文档的明确步骤。对于其他安全文档,尚没有任何标准指定了计算机辅助技术可以用来识 别不符合ICAO要求的安全文档的步骤。通常,必须首先识别给定安全文档的类型,然后才能确定该安全文档的可靠性。例 如,一些现代安全文档阅读器支持多种不同类型的安全文档,如各个国家或地区签发的护 照。为确认安全文档是否为可靠护照,(例如)必须首先确定所鉴定的护照的具体国家和版 本。与(例如)澳大利亚护照相比,鉴定英国护照时可能要求应用不同的算法以及/或者 对护照的不同部分进行分析。更具体地讲,为鉴定不同的安全文档,安全文档阅读器可以采 用多种算法,包括分析文档尺寸、静态图像图案和/或从文档和/或存储媒体(如条形码、 机读区和RFID芯片)上的特定位置收集的信息的那些算法。首先识别安全文档的类型这一流程对于不符合ICAO要求的文档可能是艰巨的挑 战。一种方法是要求操作员手动选择安全文档的类型,然后再处理该文档以确认其可靠性。 然而,该方法的人工劳动量大,并且在处理大量安全文档的环境下容易出错。另外,某些计算机辅助技术可以用于尝试以自动或半自动方式识别安全文档的类 型。然而,到目前为止,此类技术本质上通常是静态的(即严格定义的)。即,可以对文档鉴 定系统进行静态编程以应用第一算法来测试是否为第一类安全文档。如果测试失败,则文 档鉴定系统应用第二算法来测试是否为第二类安全文档。该静态流程按顺序继续进行,直 到安全文档被识别或拒绝。该静态流程的严格本质和所需的大量处理时间不太适合设计用 于支持大量不同文档类型的文档鉴定系统,并且可能限制此类系统的可扩展性。
发明内容
本发明大体而言涉及根据可扩展的高效动态文档识别框架对安全文档且更一般 地说对物件进行识别和验证的技术。即,描述了可扩展软件框架,此框架可用于轻易确定不 同类型的安全文档,并且可以轻易对此框架进行扩展以适合高效地识别和验证大量不同类 型的安全文档。此外,可以轻易地从一组共享、可重复使用的文档识别软件模块添加和选择 识别各文档类型所需的算法。在一个实施例中,文档识别软件模块可以从逻辑上被划分为 “分类器”、“核对器”和“验证器”。文档识别框架包括组织为分层树状结构的一组节点,对 此框架的遍历在应用可重复使用的文档识别软件模块的基础上将文档划分为文档类型和子类型。识别文档类型时,文档处理引擎根据分类器在树中每个父节点处的结果选择性地 遍历此分层文档识别框架中的路径。即,可以在分层文档识别框架中的每个父节点处应用 能进行高效计算的一个或多个分类器,以确定是否遍历至该节点的任何子节点。分类器将 未知文档的整体特性与代表子文档类型的子节点的特性进行比较。给定节点的分类器返回 子集(如以列表的形式),该子集可能包含代表可能的参考文档对象类型的零个或更多个 子节点。遍历分层文档识别框架时,也可以为子集中的每个子节点应用计算密度更高的核 对器,从而应用更多约束条件来以高精确度进一步确认安全文档是否具有适合于分类器所 识别的子节点的特性。如本文所述,子节点的评估顺序可以基于置信度或相似度,并且可以 选择相对于未知文档的相似度最高的子节点。在一些实施例中,必须首先满足置信度水平 或相似度的阈值,才能将任何子节点视为与未知文档可能匹配。一旦选择了子节点,子节点 就被视为父节点,并且遍历流程以递归方式继续进行,从而对于新的父节点再次应用分类 器和核对器。到达叶节点后,该最终父节点被视为识别结果。这时,应用由用于所得识别节点的 一个或多个验证器构成的组来尝试确认安全文档的可靠性。验证器通常使用图像比较算 法将未知文档的任何安全特征与一个或多个已知参考进行比较,以返回置信度水平或相似 度。如果相似度超过鉴定阈值,则将该未知文档视为经验证后为可靠文档。这样,由文档识别模块确定的各算法的应用顺序(即遍历框架的顺序)根据所识 别安全文档的具体属性而动态变化。该方法提供给高效、可扩展的文档鉴定系统,可以轻易 将该系统扩展以支持数百甚至数千种不同类型的安全文档。例如,安全文档的识别以及随后的验证可能涉及来自安全文档的数据,例如从机 读区(MRZ)、条形码、磁条、文本内容、安全图像或安全文档中嵌入的射频识别(RFID)芯片 获得的数据。根据本文所述原理,安全文档鉴定系统通过执行分层框架定义的分类器和核 对器遍历此框架,以处理来自安全文档的数据并确定安全文档是否包含某些识别特性。框 架的分层本质,以及框架使用可重复使用的文档分类器来识别文档类型的类别和子类别, 使得即使是在支持众多不同文档类型的情形下也能够快速高效地识别安全文档。因此,本 文所述技术尤其可用于以缩减快速识别安全文档并随后确定其可靠性(而无论世界上当 前可用的安全文档的数量如何增长)所需比较次数的方式维持动态文档识别框架。例如,可以在安全文档鉴定设备中实施本发明的技术。该设备可以包括接收物件 的捕捉图像的图像捕捉接口和根据动态文档识别框架在数据结构中存储多个文档类型对 象的存储器。安全文档鉴定设备还包括文档处理引擎,其通过选择性地调用多个流程中的 一个或多个来遍历数据结构,从而将安全文档识别为多个文档类型对象中的一个。通常,数 据结构包括树状数据结构以实现捕捉图像和文档类型对象之间少得多的比较次数。此外, 通过使用动态数据结构(如树数据结构),可以将数据结构轻松扩展以涵盖不断增长的安 全文档数量,并且可以在运行时间内实时动态调整以适应其他数据结构。在一个实施例中,一种方法包括接收未知文档的一个或多个捕捉图像,并根据动 态文档识别框架在数据结构中存储多个文档类型对象,其中多个文档类型对象引用多个用 于从捕捉图像提取属性的递归流程,以将未知文档分类并将其验证为文档类型对象中的一个所代表的文档类型。该方法还包括根据对捕捉图像应用多个递归流程所提取的属性,以 可变顺序遍历数据结构的文档类型对象,以及在遍历数据结构后将未知文档识别为多个文 档类型对象中的一个。在另一个实施例中,一种安全文档鉴定设备包括捕捉未知文档的一个或多个图像 的图像捕捉接口和根据动态文档识别框架在数据结构中存储多个文档类型对象的存储器, 其中多个文档类型对象引用多个用于从捕捉图像提取属性的递归流程。该设备还包括文档 处理引擎,其根据对捕捉图像应用多个递归流程所提取的属性,以可变顺序遍历数据结构 的文档类型对象,其中文档处理引擎在遍历数据结构后将未知文档识别为多个文档类型对 象中的一个。在另一个实施例中,本发明涉及包含指令的计算机可读媒体。指令使可编程处理 器接收物件的捕捉图像并根据动态文档识别框架在数据结构中存储多个文档类型对象,其 中多个文档类型对象引用多个流程。指令还使处理器通过选择性地调用多个流程中的一个 或多个来遍历数据结构,从而将捕捉图像识别为多个文档类型对象中的一个。附图和下文的说明书详细描述了本发明的一个或多个实施例。根据本发明说明 书、附图以及权利要求书,本发明的其他特征、目标和优点将显而易见。
图1为示出根据本发明的原理的、用于分析安全文档12的示例性文档鉴定系统10 的示意图。图2为示出根据本发明的原理的、用于根据动态文档识别框架来验证物件的示例 性主机系统的框图。图3为示出图1的文档鉴定系统的示例性操作的流程图。图4为更加详细地示出图2的主机系统的示例性操作的流程图。图5为更加详细地示出图2的文档识别框架的框图。图6为示出文档识别模块在遍历文档识别框架时的示例性操作的流程图。图7A-7C为文档识别框架的用户界面通过显示器向用户呈现的窗口的屏幕截图。图8A、8B为主机系统完成识别和随后的验证之后,用户界面通过显示器向用户呈 现的窗口的屏幕截图。图9为更加详细地示出图2的主机系统存储器结构的一部分的框图。图10为示出文档识别模块在遍历文档识别框架以调用布局匹配识别流程时的示 例性操作的流程图。图11A-11C为示出在文档识别模块执行布局匹配识别流程时捕捉图像的状态的 示例性图像。图12为示出文档识别模块在遍历文档识别框架以调用特征图像文档匹配流程时 的示例性操作的流程图。图13A-13C为示出在文档识别模块执行特征图像文档匹配流程时捕捉图像的状 态的示例性图像。图14A-14C为文档验证模块的示例性图像,这些图像示出捕捉图像和图像中字符 的灰度变化分布。
8
图15A-15D和16A-16C为文档验证模块的示例性图像,这些图像示出样本印刷技 术及其分析结果。图17A-17C示出了该系统在从由206种不同的未使用符合ICAO要求的MRZ区的 美国驾驶执照构成的组中识别和验证纽约驾驶执照的当前版本的效率和高精确度。
具体实施例方式图1为示出根据本发明的原理的、用于分析安全文档12的示例性文档鉴定系统 10的示意图。文档鉴定系统10包括主机系统20,该主机系统连接到文档阅读器11 (如电 子护照文档阅读器)。文档阅读器11用作图像捕捉设备并确认安全文档12是否为有效、 可靠的安全文档。如本文所述,文档阅读器11支持多种类型的安全文档。鉴定的一部分工 作是,文档阅读器U首先确定插入设备的安全文档的具体类型。例如,安全文档12可能是 美国护照、美国某个州的驾驶执照、美国某个州的身份证、欧盟(E.U.)驾驶执照,欧盟身份 证、美国各个州或全球各国政府机构颁发的护照或身份识别文件、所有权凭证、身份证和多 种其他文档类型。识别安全文档的类型后,文档鉴定系统10可以随即从安全文档12验证 和提取信息。例如,文档鉴定系统10的主机计算机系统20可以用于引导文档阅读器11首先捕 捉安全文档12的整体或部分的一个或多个图像构成的序列。然后,使用两阶段流程,其中 文档鉴定系统10首先识别安全文档的类型,然后根据对捕捉图像数据的分析结果并且可 能结合从安全文档获得的其他数据,确定安全文档12是否为所识别类型的有效文档。例 如,除了从安全文档12捕捉的扫描图像数据外,文档鉴定系统10还可以利用从一个或多个 机读区(如条形码)接收的数据、从嵌入文档或附连到文档的射频识别(RFID)芯片接收的 数据或从文档提供的其他信息源接收的数据。如本文所述,主机计算机20为文档处理引擎提供使用动态文档识别框架的操作 环境,可轻松扩展和修改该动态文档识别框架以支持多种类型的安全文档。即,该文档识别 框架提供可在其中根据不同类型的安全文档轻松添加、定义和利用识别算法的环境。文档 处理引擎在必要时与框架进行交互以调用各种算法将安全文档12分类并最终将该安全文 档识别为具体的文档类型,如具体机构颁发并且具有后续鉴定所需特定特性和布局特征的 安全文档。文档鉴定系统10通过扫描安全文档12而从该安全文档12的整体或部分捕捉由 一个或多个图像构成的序列,以此开始识别安全文档12这一流程。然后,文档鉴定系统10 根据动态文档识别框架遍历存储有定义多个文档类型对象的数据的数据结构。多个文档类 型对象以节点的形式分层排列,每一个节点均代表安全文档的类型的类别或子类别。每个 对象均可以引用(即包含指向下述模块的指针)多个可执行文档识别软件模块(即可执行 “分类器”、“核对器”和“验证器”)中的任意模块,这些模块提供对具体文档类型进行分类、 细分类以及最终确定和鉴定所必需的算法。例如,这些文档识别软件模块中的每一个均通 常实施能够确定文档的一个或多个属性的关联文档识别算法。根据具体安全文档12中是 否存在所考虑的属性,该处理引擎遍历文档框架以选择并应用后续的分类器。示例性文档 识别软件模块包括特征图像文档匹配算法或文档布局匹配算法,下文将对这两种算法进行 更加详细的描述。
文档鉴定系统10在遍历文档识别框架的数据结构时,选择性地调用多个文档识 别软件模块中的一个或多个来处理部分捕捉图像数据以及/或者询问安全文档12以获得 其他数据。例如,在识别文档类型时,文档鉴定系统10的文档处理引擎从分层文档识别框 架的根节点开始,然后根据分类器定义的算法在框架中每个父节点处生成的结果选择性地 遍历经过框架的节点的路径。即,可以在分层文档识别框架中的每个父节点处应用能进行 高效计算的一个或多个分类器,以确定是否遍历前往该父节点的任何子节点的路径。这些 分类器参考子节点所代表的子文档类型的特性,并用于为路径选择进行整体比较。分类器 将未知文档的整体特性与代表子文档类型的子节点的特性进行比较。给定节点的分类器返 回子集(如以列表的形式),该子集可能包含代表可能的参考文档对象类型的零个或更多 个子节点。分类器可以以链接索引的形式存储,并返回一组可能的参考文档对象类型。遍历分层文档识别框架时,可将与父节点和/或子节点关联的核对器应用于从更 高级别分类器提取的属性,以进一步确定安全文档具有该分类器所选子节点的相应特性。 核对器参考节点自身代表的文档类型的特性,并进一步用于识别流程中,核对器指定的算 法对该具体文档类型施加更加严格的约束条件以获得正确的识别结果,并且该算法可以具 有比分类器指定的算法更高的计算密度。分类器和核对器的组合提供了高效且灵活的结 构,以平衡对高速度的需求和对准确度的需求。如本文所述,子节点的评估顺序可以基于置 信度或相似度,并且可以选择相对于未知文档的相似度最高的子节点。在一些实施例中,必 须首先满足置信度水平或相似度的阈值,才能将任何子节点视为与未知文档可能匹配。一 旦选择了子节点,子节点就被视为父节点,并且遍历流程以递归方式继续进行,从而相对于 新的父节点再次应用分类器和核对器。到达叶节点(即框架中没有任何子节点的节点)后,应用由一个或多个验证器构 成的组确定安全文档的可靠性。验证器参考此叶节点代表的文档类型的特性,并且可以具 有比核对器或分类器指定的算法更高的计算密度(尽管这一点并非必要)。验证器通常使 用图像比较算法将未知文档的任何安全特征与一个或多个已知参考进行比较从而返回置 信度水平或相似度。如果相似度超过鉴定阈值,则将该未知文档视为经确认后为可靠文档。这样,文档鉴定系统10遍历文档识别框架并且选择性地调用文档识别软件模块 来识别并最终验证未知文档。因此,动态文档识别框架实施的流程是“动态的”,因为该文档 识别框架引导文档鉴定系统10根据先前调用的文档识别软件模块的结果调用特定操作; 分层结构中的起点和调用流程的顺序根据所识别的具体安全文档而有所不同。即,文档鉴 定系统10可以(例如)随后应用第一、第二和第三操作来分析美国护照安全文档12,但随 后应用第一、第三和第五操作来分析美国驾驶执照安全文档12,其中各个操作均分别仅确 定安全文档的一个或多个属性。就这一点而言,这些技术与传统系统不同,传统系统通常需 要以预定顺序静态应用完整的文档识别算法,而不管所鉴定的安全文档12的类型如何。如 下文更加详细的描述,该动态特性有利于根据捕捉图像自身的分析结果选择性并且动态地 使用一组流程,从而更加高效和全面地验证安全文档。文档鉴定系统10可以在存储器、数据库或其他存储媒体(图1中未示出)中将文 档识别框架存储为分层排列的树状数据结构。在本文被称为文档对象类型的数据结构用于 代表树状数据结构中的每个节点。父节点代表文档类型的类别或子类别,并且可以以递归 方式向下遍历到分层结构的多个层级。叶节点代表具体文档类型,如美国护照文档类型对象、美国驾驶执照文档类型对象、或美国身份证文档类型对象。框架中的一些文档类型对象 可以包括一个或多个存储图像或模板以及将文档类型对象彼此清晰地描绘出来的一组具 体特性。例如,美国护照文档类型对象可以包括美国护照模板图像、定义美国护照模板图像 底部是否出现机读区的一组特性、描绘图片在模板中方位的度量,以及确定各种特性之间 的相对位置时引导的其他数据。文档鉴定系统10可以遍历框架的数据结构,从而调用文档类型对象所引用的一 个或多个可执行分类器、核对器和验证器。根据所调用的具体文档识别软件模块,文档鉴定 系统10可以将文档类型对象与捕捉图像进行比较,或对从安全文档获得的图像数据和/或 其他数据执行一些其他分析,以获得指示出安全文档12与类别、子类别或具体文档类型匹 配的相似度的信度值。如果信度值超过与父节点关联的多个分类器和/或核对器中的可编 程或计算的最低信度水平,则文档鉴定系统10从该父节点遍历经过框架中的多个路径,直 到到达一个或多个叶节点后通过最终返回最高信度值而识别出安全文档12。成功确定安全文档12与存储的多个文档类型对象中的一个一致后,文档鉴定系 统12执行鉴定流程以确定安全文档的可靠性。例如,文档鉴定系统12可以分析捕捉图像 以确定存储的参考图像是否在安全文档中出现了一次或多次。如果该参考图像存在于安全 文档中,则文档鉴定系统10可以提供安全文档12已被正确鉴定的指示(如听觉和/或视 觉指示)。如果捕捉图像中不存在参考图像,则文档鉴定系统10提供安全文档12不能被自 动鉴定并且可以被拒绝的指示。在操作中,用户将安全文档12放置到文档阅读器11的检视框架14上。检视框架 14将安全文档12相对于文档鉴定系统10的其他组件精确定位。在图1的示例性实施例 中,文档鉴定系统10包括光源以对放置在检视框架14上的安全文档12进行照明。在一些 实施例中,文档鉴定系统10可以包括不止一个光源,如红外(IR)光源和/或紫外(UV)光 源。文档鉴定系统10还包括图像捕捉设备以从安全文档12捕捉图像数据。该图像捕捉设 备可以为CMOS图像传感器(如具有像素阵列的电荷耦合器件(CCD))、照相机、行扫描仪或 其他光学输入设备。主机系统20可以与安全阅读器11进行交互作用以发出捕捉图像数据、 询问RFID芯片或执行相对于安全文档12的其他操作的命令。可以由主机系统20自动调 整或根据用户的输入来调整光源的强度,调整范围为从最小值到最大值的一系列强度。用户将安全文档12放置在检视框架14中后,文档阅读器11捕捉由安全文档12 的一个或多个图像组成的序列。捕捉图像可以代表安全文档12的整体或部分,但通常捕捉 图像代表安全文档12的整体。图像捕捉设备11将捕捉图像数据传送至主机系统20进行 图像处理。可以在与主机系统20相连的显示器(未示出)上显示主机系统20所处理的捕 捉图像以便于检查。主机系统20可以包括(例如)计算机、膝上型计算机、移动个人数字 助理(PDA)或具有分析捕捉图像所需的足够处理器和存储器资源的其他计算系统。下文将 更加详细地描述主机系统20的示例性配置和操作。图2为示出根据本发明的原理的用于鉴定物件(如图1的安全文档12)的示例性 主机系统20的框图,该主机系统根据动态文档识别框架识别安全文档12。主机系统20分 析图像数据22并选择性地分析从文档阅读器11 (图1)接收的其他数据(如RFID数据) 以动态识别安全文档12。在该例子中,主机系统20包括数据接口 24以从文档阅读器11接收数据(如图像和RFID数据)。数据接口 24可以为(例如)用于与文档阅读器11通信的串行或并行硬件 接口。在另一个例子中,数据接口 24可以为通用串行总线(USB)接口。如图2所示,文档识别框架34可以表示为具有多个节点的树状结构,其中节点代 表安全文档的类别、安全文档的子类别或安全文档的具体类型。文档识别框架34的每个节 点可以包括对一组文档识别软件模块41的一个或多个引用,这些模块包括分类器47、核对 器48和验证器49,它们中的每一个包含可执行指令,这些指令定义了用于检查安全文档的 一个或多个属性或特性的流程。在一个例子中,与父节点关联的一个分类器47可以确定安 全文档的特定位置是否存在机读区(MRZ),从而将安全文档的可能类型缩减到具体的类。与 父节点或其子节点之一关联的一个核对器47可以进一步处理MRZ以确定MRZ文本中是否 存在文本识别器的特定序列。在这方面,核对器48确认文档树分层结构中层级更高的分类 器提取的属性,如是否存在上述文本识别器的特定序列(如“AU”),从而进一步将文档的可 能类型组缩减至澳大利亚文档。最终,到达叶节点(即框架中没有任何子节点的节点)后, 应用由该叶节点引用的一个或多个验证器49构成的组以确定安全文档的可靠性。主机系统20包括用户界面28,该用户界面提供布局编辑器30,用户(未示出)可 以使用该编辑器编辑存储在数据库32中的数据。具体地讲,用户可以与布局编辑器30呈 现的图形用户界面进行交互以编辑存储于数据库32中的文档类型,从而扩展文档识别框 架34以支持不同的文档类型。例如,在某些情况下,用户可以与布局编辑器30进行交互以 手动指定要插入到文档识别框架34中的新文档类型对象。这时,用户可以定义用于定义类 别、子类别或个别文档类型的属性。此外,用户可以将插入的文档对象与一个或多个要存储 为分类器47、核对器48和验证器49的新的或现有的算法相关联。或者,可以将主机系统20置于“学习,,模式以在接收和处理来自新类型安全文档 的模板的图像数据和其他数据22后相应地更新文档识别框架34。在该模式下,主机系统 20处理数据,并且自动将与新类型安全文档的任何识别属性一致的新文档类型对象插入文 档识别框架34。因此,用户输入26可以与用户界面28进行交互以指定用以编辑文档类型对象的 命令,如添加或删除与预定义文档类型对象关联的分类器47、核对器48和验证器49的命 令、手动或自动插入新文档类型对象的命令、删除文档类型对象的命令、重新排列文档识别 框架节点的顺序以排列分类器47、核对器48、验证器49应用优先级的命令,以及其他命令。 因此,用户可以使用布局编辑器30来定制文档识别框架34,从而更加快速地识别安全文档 类型。数据接口 24接收的图像数据可以代表安全文档12的整体或部分的捕捉图像。如 上所述,图像数据可以包括一个或多个图像、文本、MRZ、条形码、水印、或其他信息。主机系 统20包括文档处理引擎36,该处理引擎接收捕捉数据并执行上文所述识别和随后的验证 流程。在该例子中,文档处理引擎36包括图像处理模块38和文档识别模块40以执行文档 鉴定流程。文档处理引擎36还包括文档鉴定模块42以在识别出安全文档后立即确认其可 靠性,以及从物件(如所验证和鉴定的安全文档12)提取相关信息的数据收集模块44。具 体地讲,数据收集模块44可以使用文档阅读器11来读取条形码、询问RFID芯片以及读取 安全文档12上存在的磁条,从而收集可能没有包含在图像数据中的其他数据。接收了捕捉图像数据后,图像处理模块38可以调用图像预处理算法,以根据捕捉
12图像数据生成质量更佳的灰度、彩色或二值图像。出于本文的目的,这些处理后的捕捉图像 被称为捕捉图像,并且“捕捉图像”应被理解为表示任何反映基础安全文档12的图像,而无 论该图像是否经过了处理。图像处理模块38可以根据捕捉图像时使用的光源类型(如紫 外光源可能要求特定的图像处理算法)或根据捕捉图像的特定方面(如具有亮文本的暗背 景可能要求特定的反演图像算法)确定图像处理是否必要。一旦图像数据经过预处理,文 档识别模块40就进一步分析图像数据以及数据收集模块44获取的其他数据,从而识别安 全文档的类型。特别地,在接收到捕捉图像数据后,文档识别模块40遍历存储至数据库32的文档 识别框架34,以将安全文档识别为文档识别框架34所支持的文档类型对象中的一个,或拒 绝此安全文档。数据库32可以在本地驻留于主机系统20的存储器或计算机可读媒体中; 然而,在其他实施例中,数据库32可以存在于相对于主机系统20的远程位置并且通过网络 连接或一些其他远程接入方法(例如公共网络上的虚拟专用网络)连接至主机系统20。数 据库32可以包括任何类型的数据库,如关系数据库,或能够存储文档识别框架34的任何其 他类型的存储器。文档识别框架34被组织为树状数据结构以便于扩展。如下文更加详细的描述,文 档识别模块40通过选择性地调用多个分类器47、核对器48和验证器49来遍历文档识别框 架34,从而将安全文档分类并最终识别为存储至文档识别框架34的多个文档类型对象中 的一个。遍历文档识别框架34后,文档识别模块40可以将所识别的安全文档类型传送至 用户界面28,然后用户界面28可以将所选文档类型通过显示器43呈现给用户以待用户批 准。或者,可以不要求用户确认。在任何情况下,将安全文档识别为具体文档类型对象后, 文档鉴定模块42就开始鉴定阶段,如上所述。在整个识别或鉴定阶段,数据收集模块44可 以从数据库32请求的图像提取信息。鉴定之后,文档处理引擎36通常会将鉴定结果传送 至用户界面28,然后用户界面28将该结果提供给显示器43。显示器43可以包括液晶显示 器(LCD)、平板显示器、等离子体显示器、阴极射线管(CRT)显示器或能够呈现图形、文本和 视频的任何其他类型的显示器。主机系统20还可以包括队列数据结构46 ( “队列46”),该队列数据结构存储最近 识别的文档类型对象。因此,将安全文档12识别为(例如)美国护照文档类型对象后,文 档处理引擎36可以将美国护照文档类型对象或其引用存储至队列46。接收到识别另一安 全文档的请求后,文档识别模块40可以首先尝试将安全文档识别为存储至队列46的文档 类型对象中的一个,然后再遍历文档识别框架34查找其他可能的对象。在一些情况下,识 别的下一个文档可以为同一文档的另一面。在这种情况下,文档处理引擎36自动将信息关 联,并将两组信息组合为一个输出。队列46可以驻留在数据库32中,尽管图2中将二者示 出为彼此分离。主机系统20可以包括能够存储队列数据结构的任何类型的存储器,如随机 存取存储器(RAM)、磁盘或硬盘驱动器、数字视频光盘(DVD)、光盘(CD)、快速擦除只读存储 器(ROM)和拇指驱动器。或者,文档处理引擎36可以改变文档识别框架的排列和/或遍历 路径以排列最近识别的安全文档类型的优先级。图3为示出图1的文档鉴定系统10的示例性操作的流程图。首先,主机系统20根 据动态文档识别框架将一个或多个文档类型对象存储至数据结构,如图2的文档识别框架34。然后,用户将安全文档12(如护照)放置在图像捕捉设备11下的检视框架14中(50)。 主机系统20接收并存储由安全文档12的一个或多个捕捉图像构成的序列(52)。一旦完成存储,主机系统20就通过遍历文档识别框架34来识别捕捉图像。主机系 统20通过选择性地调用一个或多个文档识别软件模块41遍历数据结构,从而将未知文档 识别为存储至文档识别框架34的多个文档类型对象中的一个(54)。动态文档识别框架规 定了用于确保数据结构保持可扩展、灵活并且高效的方针。即,动态文档识别框架规定了遍 历数据结构、从数据结构编辑或删除对象或将对象插入数据结构的方案,或者更一般地说, 该框架规定了维持文档类型数据结构32的完整性的方案。识别出未知文档(除非没有找到任何匹配并且文档被拒绝)后,主机系统20可 以根据是否存在特定于验证时确定的具体文档类型对象的具体安全特征来鉴定安全文档 (56)。例如,识别流程可以导致将安全文档识别为美国护照文档类型对象。鉴定期间,主机 系统20可以访问数据结构34中的美国护照文档类型对象以确定与鉴定美国护照有关的安 全特征。主机系统20然后可以调用文档类型对象引用的正确流程,通过(例如)读取MRZ、 执行搜索水印、反光标记或其他此类标记的各种图像模板匹配算法来开始鉴定所有相关安 全特征,并扫描文本以获得一致性。完成后,主机系统20可以通过显示器43将识别流程和 /或鉴定的结果以及收集到的其他信息显示给用户,或生成任何其他适合的音频或视觉指 示标记(58)。图4为更加详细地示出图2中的主机系统20的示例性操作的流程图。主机系统 20通过分析图1的安全文档12的至少一个捕捉图像验证安全文档12。如上文所述,主机 系统20通过数据接口 24接收安全文档12的捕捉图像(60)以便于文档处理图像引擎36 进行预处理。文档处理图像引擎36包括图像处理模块38,该模块可以确定捕捉图像是否需要 进一步的图像处理以有利于识别和鉴定流程(62)。在确定捕捉图像需要额外的图像处理 (“是”分支,64)后,图像处理模块38可以执行一个或多个图像增强算法来增强捕捉图像 的质量(66),并且完成后会将捕捉图像传送至文档识别模块40进行识别。如果不需要进一 步的图像处理(“否”分支,64),则图像处理模块38直接将捕捉图像传送至文档识别模块 40进行识别。文档识别模块40通过从框架的根对象遍历文档识别框架34来启动识别流程 (68)。一般来讲,文档识别模块40可以根据控件的三个层级来遍历文档识别框架34以获 得更高的性能。如果采用基于优先级的第一遍历方法,则文档识别模块40可以根据与存储 至文档识别框架的文档类型对象关联的优先级遍历文档识别框架34,其中优先级可以由用 户预先定义。如果采用基于队列的第二遍历方法,则文档识别模块40可以访问队列数据结 构46以确定之前刚处理的是哪些文档类型对象并遍历存储在文档识别框架34中的这些文 档类型对象。如果采用动态的第三遍历方法,则文档识别模块40动态遍历整个文档识别框 架34。即,文档识别模块40可以从文档识别框架34的根对象开始,调用在框架的每个父节 点对象处引用的多个分类器47中的一个或多个。文档识别模块40可以根据调用这些分类 器47后接收到的结果,选择父节点的一个或多个子节点向下遍历至于存储至文档识别框 架34的更低层级的对象。文档识别模块40可以应用与该父节点或所选子节点关联的一个 或多个核对器48以确定安全文档是否具有分类器所选路径的相应特性。
14
该遍历识别过程可以继续,直到文档识别模块40到达引用了由匹配文档属性的 一个或多个验证器构成的组的叶节点,并且由此将捕捉图像识别为最佳匹配或超过相对于 存储至文档识别框架34的多个文档类型对象的预定阈值的满意匹配。文档识别模块40可以应用任何前述遍历方法中的两种或更多种方法(相继地或 一前一后地)。因此,文档识别模块40可以(例如)首先访问队列数据结构48,根据队列 遍历数据结构,然后通过选择性地调用多个分类器47中的一个或多个来动态遍历数据结 构34。根据文档识别框架34的遍历,文档识别模块40将捕捉图像识别为存储至文档识 别框架34的多个文档类型对象中的一个(70)。如上所述,在动态遍历文档识别框架34时, 文档识别模块40可以计算信度值并将这些信度值与其他信度值或预先指定的最低信度值 进行比较以正确识别捕捉图像。识别后,文档识别模块40可以通过显示器43将识别的文 档类型对象和信度值显示给用户以待批准(72)。一旦识别出并由用户批准(如果需要),文档识别模块40就将捕捉图像和识别的 文档类型对象或其引用传送至文档鉴定模块42。文档鉴定模块42如上文所述执行鉴定流 程,以确定安全图像12的可靠性(74)并通过显示器43显示该鉴定结果(76)。图5为更加详细地示出图2的文档识别框架34的框图。如图5所示,文档识别 框架34包括树数据结构;然而,文档识别框架34可以包括能够存储多个文档类型对象 78A-78( “文档类型对象78”)的任何其他类型的数据结构。在该例子中,文档识别框架34包括根对象80、多个文档类型对象78以及多个文 档子类型对象82A-82M (“文档子类型对象82”)。此外,该树可以通过子子类型文档对象 向下扩展,并且通过相同构造进行更多递归。根对象80代表示例性树文档识别框架34的 根,或者更一般地说,代表文档识别模块40遍历起始位置的对象(如果仅根据上述动态遍 历方法进行遍历)。根对象80维持将根对象80连接至每个文档类型对象78的双向链接 84A-84M(如指针)。文档类型对象78还维持将文档类型对象78连接至文档子类型对象82 的双向链接84N-84Z。链接84A-84Z( “链接84”)可以包括对根对象80、文档类型对象78 和文档子类型对象82中的一个在数据库32中的存储位置的引用。通常,文档类型对象78 和文档子类型对象根据安全文档的一般物理属性、安全特征或布局特性代表由安全文档类 别、子类别和各个文档类型(叶节点)构成的分层组织。尽管出于举例目的而显示为具有 三个层,但可以重复任何数量的层级以对安全文档的类型进行分类及最终分别进行识别。根对象80包括至少一个分类器对象86N,其引用图2的多个分类器47中的一个 或多个。这些引用可以指定被引用分类器47在存储器中的驻留位置的独特标识符、名称 或地址。作为父节点,文档类型对象78包括多个分类器对象86,并且其中的一些分类器可 以重复。如图5所示,每个文档类型对象78均包括对各自的分类器对象86A-86M的引用。 分类器对象86A-86M( “分类器对象86”)中的每一个均引用多个分类器47中的一个或多 个,这些分类器包含用于执行“分类器流程”以评估所识别安全文档的一个或多个特性或属 性的可执行软件。每个文档类型对象78还可以包括各自的优先级值88A-88M( “优先级值 88”),但是如上所述,文档类型对象78并非必须包括优先级值。如上所述,优先级值88可 以描绘文档识别模块40遍历文档识别框架34时的特定遍历顺序。尽管图5中未示出,但文档类型对象78或文档子对象类型82中的任意者均可以包括对核对器对象90A-90M的引用,可以应用这些核对器对象来确定安全文档是否具有分 类器86所选路径的正确特性。到达叶节点后,应用由一个或多个验证器构成的组以确定安 全文档的可靠性。文档子类型对象82代表叶节点,并且同样的,其中每一个均包括各自的引用了一 个或多个验证器49的验证器对象93A-93M。此外,文档子类型对象82包括各自的模板数 据91A-91M( “模板数据91”),以及一个或多个各自的最低信度值92A-92M( “最低信度值 92”)。验证器对象93A-93M通过指针或独特标识符引用多个验证器49中的一个或多个,这 些验证器进行比较或确定是否存在父节点各自的分类器以及可能的任何核对器收集的具 体属性或特性,以确定安全文档12的种类。尽管图5中未示出,但在一些实施例中,文档子 类型对象82中的每一个可以包括多个核对器对象,这些多个核对器对象中的每一个引用 一个或多个核对器流程。模板数据91从总体上定义了任何模板图像、布局特性、安全特征 和在对具体某一个文档子类型对象82进行分类和/或验证时必须使用的其他任何相关联 数据。通常,核对器48根据文档识别模块40在文档识别框架34中的当前位置,返回符合 可能文档类型或子类型对象的分类器流程的具体属性的信度值。例如,如上所述,文档节点 的一组具体分类器47和对应核对器可以返回其特定子文档类型对象78的分级组,其可以 对应于所分析的当前安全文档的类型。文档识别模块40可以将返回的信度值与最低信度 值92中的对应者进行比较。为识别当前安全文档12,文档识别模块40通常根据动态遍历方法遍历文档识别 框架34。通过该动态方法,文档识别模块40从根对象80开始调用分类器对象86N引用的 分类器47。这些初始分类器47分析捕捉图像和从安全文档12获得的其他数据,并返回由 子节点代表的一组可能的文档类型对象(即文档类型对象78)。该组可以指定任意一个或 多个文档类型对象78。遍历至文档类型对象78中的一个后,文档识别模块40访问关联的分类器对象 86A-86M、调用引用的分类器47,并且接收一组可能的属性或特性。然后对于子子文档对 象中的每一个,对应的核对器对象90A-90M用于与预期值进行比较并生成相似度确定度因 数,并且根据该因数将安全文档和子文档类型之间的匹配相似度分级,以最终选择到达文 档子类型对象82的一个或多个路径。这样,可以垂直遍历框架34以将安全文档进行分类、 细分类并最终识别。遍历可以沿树往下重复进行,直到到达代表具体安全文档的叶节点。这些分类器 47和核对器48可以返回一个或多个信度值,文档识别模块40可以根据存储在所遍历文档 子类型对象82中的公式计算这些信度值的加权平均值。通过使用该加权平均值,文档识别 模块40可以将加权平均值与所遍历文档子类型对象82关联的最低信度值92进行比较,从 而确定安全文档12是否确实为该具体类型的安全文档。如果加权平均值未满足或未超过 关联的最低信度值92,则文档识别模块40可以放弃与文档子类型对象82关联的整个分支 而不作进一步考虑,从而提高效率。文档识别模块40可以通过维持上层分类器对象86返 回的可能文档子类型组继续迭代,直到信度值被放弃而不进一步考虑或信度值被存储以便 进一步考虑。一旦分析完该组中的所有文档子类型对象82,文档识别模块40就可以将与其余 文档子类型对象82关联的信度值彼此进行比较并(例如通过选择最高的信度值)确定最
16佳信度值,从而结束其对文档识别框架34的遍历。文档识别模块40可以通过显示器43将 识别的该信度值以及关联的文档类型对象78或子类型对象82传输至用户界面28以供显 示。可以要求用户批准该识别出的文档类型对象78或子类型对象82,或者确认文档识别模 块40通过分析捕捉图像正确识别出了安全文档12。图6为示出图2的文档识别模块40在根据动态遍历方法以递归方式遍历如图5 所示的文档识别框架34时的示例性操作的流程图。尽管下文所述参考了动态遍历方法,但 文档识别模块40可以根据任何其他方法或它们的组合遍历文档识别框架34,包括根据存 储在队列数据结构46中的对文档类型对象78的引用、根据优先级88以及根据这些方法的 任意组合遍历文档识别框架34。首先,文档识别模块40接收安全文档12的捕捉图像以及任选的其他数据(如 RFID数据),并访问文档识别框架34的根对象80,以开始遍历文档识别模块40并将此根 对象视为当前处理文档(94)。文档识别模块40可以(例如)访问与当前文档关联的分类 器对象86A,从而调用分类器对象86A引用的多个分类器47中的一个或多个(即分类器流 程)(95)。在响应调用时,文档识别模块40计算一组可能的属性或特性。文档识别模块40 可以从该节点的该文档类型对象接收一组可能的文档子类型对象,并且该组通常包括一个 或多个文档子类型对象78(96)。例如,可能的文档类型对象的一个示例性组可以包括文档 类型对象78A和78M。给定该组可能的文档类型对象(即“子类型组”)后,文档识别模块 40根据类型组继续遍历文档识别框架34(96)。文档识别模块40通过访问类型组中返回的第一文档类型对象78A及其关联分类 器对象86向下遍历文档识别框架34的一个层级。如果文档类型对象78A的任何核对器 确认了分类器对象86提取的属性(或者如果不存在核对器对象,如该例子中所示),则文 档识别框架34现在将文档类型对象78A视为当前文档并使用分类器对象86A计算其他 可能属性或特征组(95)。然后,文档识别模块40再向下遍历一个层级以检查其子子文档 82A-82D(即“子类型组”)中的每一个(96)。文档识别模块40然后根据该新的子类型组遍 历文档识别框架34(96)。文档识别模块40通过访问子类型组中返回的第一文档子类型对象82A及其关联 的核对器对象90A向下遍历文档识别框架34。文档识别模块40调用关联核对对象90A引 用的一个或多个核对器48以及验证器对象92A(因为其为叶节点)引用的一个或多个验证 器49,并接收一组信度值(97)。确定信度值时,核对器48可以访问关联的模板数据91A。 信度值反映了一对调用的分类器47和核对器48将对捕捉图像执行的分析与关联模板数据 91A进行比较所获得的相似度级别。例如,信度值100可以反映关联模板数据91A和捕捉 图像之间的完全匹配,而信度值80可以反映关联模板数据91A和捕捉图像之间的充分匹配 同时可以指示捕捉图像的一个或多个特性未与关联模板数据91完全匹配,而信度值为零 则意味着完全不匹配。在一些实施例中,文档识别模块40将调用的核对器48返回的每个 信度值与最低信度值92A进行比较,如果失败则停止从该节点起检查该子文档或整个分支 (98),或将子文档的组合信度值设置为零。在其他实施例中,文档识别模块40根据从每次 调用核对器48所返回的所有信度值的加权平均值计算捕捉图像的该子文档的组合信度值 (102),并将该加权平均值与最低信度值92A进行比较,从而仅存储超过最低信度值92A的 那些加权平均信度值(104)。
如果确定该子文档满足最低信度值,则检查节点是否为文档树中的分支节点以及 是否具有子子文档(即父节点)(106)。如果其自身下层附带有某些子子文档,则将该子 文档视为当前文档,并且文档识别模块通过重复上述流程再向下遍历文档树的一个层级 (95)。该过程被实施为向下遍历整个文档树直到到达叶节点的递归深度优先方法。一旦以子类型组中的一个文档子类型对象82结束,文档识别模块40就可以确定 其是否已完成了对该子类型组的迭代(108)。如果还未完成对该子类型组的迭代,则文档识 别模块40继续通过访问另一个文档子类型对象82、调用其关联核对器对象90引用的核对 器48、接收信度值以及根据比较结果存储信度值来继续对该子类型组的迭代(96-108)。如 果迭代完成,则文档识别模块40通过计算得出的关联信度值将所有子文档分级,以完成给 定文档节点处的路径选择处理循环(110)。下一个步骤是根据当前处理文档是否为根文档 或是否具有父文档类型来确定将结果返回到何处(112)。如果其为子子文档,则控件向上 跳跃文档树的一个层级并返回其父文档(114),并且将该子子文档的信度值与父文档合并。 否则,文档识别模块40结束对整个文档树的迭代,文档识别模块40根据存储的信度值识别 捕捉图像(116)。文档识别模块40可以将存储的所有信度值彼此进行比较并选择最高的信 度水平,从而将捕捉图像识别为属于与最高信度值关联的文档子类型对象82。上文描述了文档识别模块40在遍历文档识别框架34时的操作。文档识别框架34 通过动态文档识别框架存储文档类型对象78和文档子类型对象82。此框架是“动态”的, 因为遍历的顺序根据安全文档的属性和特性而有所不同,并且此框架有利于通过布局编辑 器30分别进行文档类型和子类型对象78、80的更新、删除和插入。动态文档识别框架提 供这些动态更新、删除和插入可能发生时的方案,从而用于维持识别安全文档12的灵活、 可扩展框架。此框架是灵活的,因为可以识别众多不同类型的物件,包括美国和其他国的护 照、美国和其他国的驾驶执照、美国和其他国的身份证,以及商业票据。此框架是可扩展的, 因为可以将一个或多个文档类型(包括文档类型的子类型)快速添加到此框架和插入文档 识别框架34,如下文更加详细的描述。图7A-7C为布局编辑器30通过显示器43向用户呈现的窗口 118的屏幕截图。屏 幕118包括文档选项卡119、表示为文档类型对象120的可展开列表的识别框架34,以及视 图子窗口 121。文档类型对象列表120包括一个或多个文本区域,其中每一个均引用图5的 多个文档类型对象78中的一个。例如,文档类型对象78A可以包括“DOCument-2Line44” 文档类型,如在图7A中列表120上的第一个项目所示。因此,文档类型对象列表120示出 了可以由文档识别框架34定义的示例性组织分层结构。视图子窗口 121通常示出存储至 数据库32并且与文档类型对象列表120中的一个选定项目关联的任何相关模板数据91。图7B示出了用户为该文档类型选择识别流程的项目130后的窗口 118。在响应该 选择时,布局编辑器30使弹出窗口 132覆盖窗口 118,其中弹出窗口 132允许用户编辑与项 目130关联的一个核对器对象90,以定义文档类型的识别流程。在该例子中,弹出窗口 132 包括最低信度值输入134、光源选择输入136、现有核对器流程选择框138A以及所用核对器 流程选择框138B。用户可以通过与最低确定度输入134的交互,将最低信度值与该文档类 型关联,如将最低信度值92A与图5中的文档子类型对象82A关联。用户还可以通过光源 选择输入136指定捕捉安全文档12的图像时要使用的参考光,如可见光、紫外光和红外光。 用户还可以通过现有核对器流程选择框138编辑由核对器对象90A中的一个在当前引用的核对器48。最后,用户可以通过所用核对器流程选择框138B将其他核对器48与所查看的 核对器对象90A关联或删除该核对器。图7C示出了用户通过选择当前核对器选项卡140配置分类器47或核对器48 中的一个的具体应用后,被弹出窗口 132覆盖的窗口 118。如图7C所示,用户正在编辑 “CDocVerif ierDominantColor ”流程,该流程分析捕捉图像的主色,并将分析结果与在引用 输入142中指定的引用进行比较。弹出窗口 132包括引用输入142以使得用户可以手动 编辑这些引用。例如,主色流程将捕捉图像的分析结果与在引用输入142中定义的一系列 颜色进行比较,这一系列颜色指定了品红色百分比0. 007、红色百分比15. 021、黄色百分比 34. 547等。用户可以手动编辑这些个别颜色百分比(如蓝色突出显示区域所示),或者如 果用户准备好了供扫描的物理模板,则可以选择学习按钮144,然后布局编辑器30会从先 前或同时扫描到系统中的模板图像学习这些引用。弹出窗口 132还包括权重输入146和具体最低确定度输入148。用户可以将权重 值输入权重输入146中,以使得计算多个调用核对器48的加权平均值后,文档识别模块40 使用该具体权重值来计算加权平均值。相似地,用户可以将具体最低确定度输入至输入148 中以在遍历时使用,如以上结合图6的步骤98所述。这样,用户可以通过配置权重和最低 信度值动态配置分类器47和核对器48、将分类器47和核对器48与具体对象86、90关联, 以及动态修改框架34的遍历。图8A、8B为主机系统20完成识别和随后的鉴定后由图2的展示用户界面28通过 显示器43向用户呈现的窗口 150的屏幕截图。该文档被识别为美国纽约驾驶执照当前标 准版本的正面。窗口 150包括识别置信度水平文本输出152,其通常代表文档识别模块40 在识别流程中计算得出的加权信度值。窗口 150还包括示出鉴定结果的鉴定详细信息输出 154,以及在选择后呈现识别流程的结果的识别选项卡156。窗口 150还呈现其他相关信息, 如捕捉图像158和从捕捉图像158的分析中获得的安全文档详细信息160。图8B示出了用户选择识别选项卡156后的窗口 150。用户界面28在窗口 150中 呈现文本输出162,该文本输出示出动态遍历文档识别框架34的结果。从文本输出162的 顶部开始,文档识别模块40首先遍历至标记为“21ine44”的文档类型对象78中的一个,并 且访问其关联分类器对象86,然后文档识别模块40调用引用的分类器47。结果未返回任 何可用的文档子类型对象82,因为测试在“行计数”上失败(如文本输出162的第二行所 示)°然后,文档识别模块40遍历至标记为“us_dl”的文档类型对象82 (如文本输出 162的第三行所示),然而,根据文本输出162的第四行,关联分类器对象86在“识别”通用 美国驾驶执照时再次失败。最后,在遍历至标记为“us_dl_ny”的文档类型对象78后,文档 识别模块40发现匹配(如文本输出162的第六行所示)并且接收到一组文档子类型对象。 遍历该子类型组时,文档识别模块40调用如第7-13行所示的被引用的分类器47和核对器 48,它们中的每一个均返回了“Cf”值。“(^”值反映每个核对器确定的信度值,“1^11_(^”值 示出要通过每个核对器所需的最低信度值。文本输出162的第6行显示比较前述“Cf”值 的加权平均值后的结果,或者通过确定捕捉图像“被识别为第14行中的文档[类型对象] us_dl_ny"以及“具体[子类型对象]的标准正面版本],,显示信度值。图9为更加详细地示出图2的主机系统20的存储器结构的一部分的框图。在该
19限制性例子中,分类器47和核对器48包括布局匹配流程164A和特征图像文档匹配流程 164B。如图9进一步所示,文档数据结构34包括根对象166、文档类型对象168和文档子类 型对象170。文档类型对象168包括分类器对象172,文档子类型对象170包括核对器对象 174、模板数据176,以及最低信度值178。对象168-174中的每一个、模板数据176和最低 信度值178可以与结合图5所讨论的那些对象基本相似。文档识别框架34可以包括对象 168-174中的每一个、模板数据176和最低信度值178中的多个,并且该分类结构还可以递 归方式重复进入多个层,但为了方便示意,图9未示出这些其他对象。作为文档识别模块40中采用的两个通用识别方法,布局匹配流程164A和特征图 像文档匹配流程在缩减可能的候选者方面非常高效。可以非常容易地配置这两个方法以识 别文档。下文将详细讨论它们。文档识别模块40并不仅限于这两个方法,而是提供灵活的 编程结构以引入新的方法。一些常用的其他识别方法包括文档尺寸、主色、空白、灰度直方 图、文本和条形码的OCR结果、模板匹配等。图10为示出图2的一个文档识别模块40在遍历文档识别框架34以调用图9的 布局匹配流程164A时所采用的处理步骤的流程图。可以将该处理步骤序列应用到参考图 像数据以构建文档模板,或应用到捕捉的实时图像数据以识别文档类型(180)。可以如上所 述通过布局编辑器30手动修改文档参考模板数据。可以通过将特定光源下图像或灰阶或 彩色图像平面亮背景中的相连暗区域或暗背景中的相连亮区域分隔和分类来对文档布局 进行分析。调用布局匹配流程164A后,文档识别模块40执行布局匹配流程164A以确定文档 子类型对象的可能组,即子类型组。首先,在执行一些图像质量增强后,将图像处理为二进 制(182),然后根据暗像素的连通性将图像分隔为多个区域(184)。然后,按照一些特征将 分隔的区域归为一些类别,如文本、条形码、照片、磁条、指纹等(186),然后按照一些其他信 息(如尺寸、位置和方向等)来表征每个区域(188)。在大多数情况下,区域参考位于中心更 好,这些情况例如条形码、照片、磁条和静态文本。但有时候对于可变区域,如姓名和地址的 动态文本,则必须使用区域的左侧。文档被表示为由具有类型和其他特性的区域对象构成 的树结构(190),可以按区域将区域对象分组形成参考模板表达中的分层结构,这对于人类 更加有意义。尽管由于印刷偏移、扫描中文档的移位或其他原因造成文档或其内容的位置 可能变化,但区域对象的相对位置对于确定文档类型是更为严格的约束条件,但是图像偏 移或旋转在阅读器扫描的应用环境中受限。一旦捕捉图像的不同图像区域以图形方式表示 和连接,文档识别模块40就可以进一步将这多个连接区域相对于与存储至数据库的多个 文档类型对象中的一个关联的模板数据(如图9的模板数据176)进行比较(192)。一般来 讲,模板数据176定义多个预定义连接图像区域以及这多个预定义连接图像区域之间的关 系,文档识别模块40将确定的连接区域和关系与这些预定义的连接区域和关系进行比较。 最后,根据比较结果,文档识别模块40根据标准化的相似度信度值(97)(如0至100)确定 捕捉图像是否属于当前所比较的多个文档类型对象中的一个,即文档类型对象178(194)。图11A-11C为示出在图2的文档识别模块40执行图9的布局匹配流程164A时捕 捉图像的状态的示例性图像。图IlA示出经过图像处理和二值化后的捕捉图像194A(182)。 尽管不要求实施布局匹配流程164A,但通过执行此类图像处理可以大幅改善应用布局匹配 流程164A的结果。图IlB示出经过文档分隔后的捕捉图像194B(184)。文档识别模块40
20在根据布局匹配流程164A执行时,将捕捉图像194B分隔为多个连接区域196A-196N。图 IlC示出捕捉图像的图形表示194C,其中多个连接区域196A-196N中的每一个均映射至节 点198A-198N中的一个(190)。节点198A-198N中的每一个还可以指定其他节点之间的关系。一旦以图形方式表示了捕捉图像,文档识别模块40就可以将该图形表示194C与 模板数据(如图9的模板数据176)进行比较。文档识别模块40可以根据布局匹配流程 164A执行一个或多个不同的比较。例如,文档识别模块40可以对图形表示194C中相同类 型区域的存在与否与模板数据176中区域的存在与否进行简单比较。作为另外一种选择或 除该区域类型比较之外,文档识别模块40可以通过一些其他约束条件(如区域的尺寸和位 置,或者在更严格的情况下,区域的空间关系)将图形表示194C与存储在模板数据176中 的图形表示进行比较。这类图形比较可以由诸如不确切图形匹配之类的动态编程算法方法 快速执行。在图形表示比较的某些情况下,文档识别模块40可以对特定于图1的图像捕捉 设备11和文档类型12的环境的比较施加限制,如有限平移和旋转限制、遮蔽匹配限制、缺 失或额外区域限制、动态内容限制以及不确切分隔和印刷错位限制。应用这些限制中的一 个或多个可以显著降低执行布局匹配识别流程164A所需的时间。有限平移和旋转限制用于限制区域或整个文档在比较前可以旋转多大幅度。遮蔽 匹配限制可以将具体文档的某些区域过滤掉以减少所需的比较次数。缺失或额外区域限制 可以停止对由自定义印刷或对捕捉图像中较差图像或有噪图像的不佳图像处理导致的缺 失、合并或额外区域的比较。动态内容限制可以减少对于包含动态内容的区域(如姓名和 地址文本区域)需要测量的关系数量。不确切分隔和印刷错位限制可以组合未正确分隔的 两个或更多个文本区域,从而减少要比较的区域的数量。图12的右侧为示出布局编辑器30训练特征图像分类器47的操作步骤的流程图 (200-208)。特征图像方法作为一种又被称为PCA(主成分分析)的信息压缩方案,可以将 大量图像的集合的表达复杂度有效地降低至几个标准正交特征图像,从而实现快速对象识 别和其他任务。所关注区域可以为整个文档区域,或最好将动态内容排除在外的部分。此 外,对文档的预处理可以用于降低任何动态内容的影响。在任何情况下,第一步骤均为收集所有可能的图像模板或选择性地收集典型图像 模板(200)。可以将所收集图像模板的模板数据归一化为零均值。然后形成数据矩阵,其中 每一列均存储不同图像模板的图像数据(202)。每一列中的每个条目可以代表图像模板的 相同部分或整个图像区域。根据该数据矩阵的协方差矩阵计算得出一组特征向量,并将该 组特征向量按照各自的特征值排序(204)。特征向量可以由模板的原始图像数据的数据矩 阵计算得到,或由该数据矩阵的转置降低至更低维度;这两种技术生成数学上等效的结果。 阈值可以用于仅选择具有足够大的特征值(即超过预定义阈值的特征值)的那些特征向量 (206)。作为一个例子,可以应用分离点,以使得仅选择大小在最大特征值的10%范围内的 特征值。这些所选特征向量中的每一个均可映射回去作为各自的特征图像,如同它们从转 置的数据矩阵计算得出并被存储一样。可以将上述流程视为数学上的简化流程,因为原始 图像通常具有非常高的维度,并且需要降低至更低维度才能更加快速地计算标准正交特征 向量。然后将该特征向量映射回原始图像的更高维度。特征图像形式的最终表达可以更易 于最终应用捕捉图像,如下所述。可以将选定的该组标准正交特征图像视为模板图像数据
21的原始组在最小平方误差方面的最佳表达。图12的左侧为示出图2的文档识别模块40在遍历文档识别框架34以调用图9 的特征图像文档匹配流程164B时的操作步骤的流程图(210-216)。该处理步骤序列可以应 用至(i)参考图像数据,以建立文档模板和预计算数据库中存储的每个文档子类型对象 的引用权重系数向量,或(ii)捕捉图像数据,以识别文档类型(210)。调用特征图像文档匹配流程164B后,文档识别模块40执行特征图像文档匹配流 程164B以计算捕捉图像的权重系数向量(212),该向量由上层选择的标准正交特征图像表 达。具体操作为将捕捉图像数据向量(或引用图像数据)乘以由所选标准正交特征图像构 建的数据矩阵,以生成捕捉图像的权重系数向量。即,该数据矩阵的每一列均代表一个特征 图像,并且乘以捕捉图像数据向量可生成系数构成的向量,其中每个系数代表捕捉图像在 标准正交特征图像形成的多维空间中的表达然后,文档识别模块40将捕捉图像数据的权 重系数向量相对于与存储在数据库中的多个文档子类型对象中的一个关联的每个预计算 引用权重系数向量(即每个可能的引用文档类型)进行比较(214)。此操作计算两个向量 (分别对应于捕捉图像的权重系数向量和预计算引用权重系数向量)的距离或相似度。通 常,文档识别模块40可以根据以下四种标准距离计算算法之一计算该距离1)欧氏距离、 2)海明距离、3)NCC(归一化互相关)和4)马氏距离。以该距离为基础,文档识别模块40 根据特征图像文档匹配流程164B确定物件是否属于当前所比较的多个文档子类型对象中 的一个(即文档子类型对象170) (216),并且分类通常基于最近邻域(NN)。该确定结果可 能采用每个可能的引用文档类型对象的信度值的形式,该信度值以统一度量(如0至100) 来代表距离。这样,信度值可代表捕捉图像的权重系数向量和对应的每个可能的引用文档 权重系数向量之间的距离是否小于预定义阈值。图13A-13C为示出在文档识别模块(如图2的文档识别模块40)执行特征图像文 档匹配流程(如图9的特征图像文档匹配流程164B)时图13C的捕捉图像230的状态的示 例性图像。图13A和图13B示出识别该文档前使用的示例性训练图像和结果。图13A示出 由七个美国驾驶执照样本构成的组加利福尼亚州和纽约州的各两个样本、明尼苏达州、蒙 大拿州和美国的各一个样本。在实际应用中,该组模板图像可以达到数百个图像或更多。布 局编辑器30计算各样本的特征图像和特征值,图13B中示出了这些特征图像和特征值。可 以对该七个特征图像构成的组进行选择,仅使用它们中具有较高特征值的部分来近似表达 原始的七个模板图像。然后,将图13A的七个模板图像中的每一个乘以由所选特征图像构 造的矩阵,生成引用权重系数向量作为该文档子类型的模板数据,其存储在数据库32中。一旦获得图13C的新捕捉图像230后,文档识别模块40就调用图9的特征图像文 档匹配流程164B,将图像数据乘以由所选特征图像构造的相同上层矩阵,以生成权重系数 向量。特征图像文档匹配流程将该权重系数向量相对于与当前所比较的多个文档子类型对 象关联的预计算引用权重系数向量中的每一个(即图13A中用于训练的七种美国驾驶执 照)进行比较。例如,文档识别模块40可以使用海明距离计算算法或其他算法确定新捕捉 图像数据与七个模板图像数据之间的距离,以生成图13C所示的示例性结果232。新捕捉图像数据的结果232显示,根据海明距离算法,其距与所选特征图像确定 的多维空间中明尼苏达州文档子类型对象关联的模板数据的距离最短,为518. 21。该距离 比此数据距与其他六个文档子类型对象关联的模板数据的距离小得多,这表示文档分类根据最近邻域(NN)原则更加匹配。通过文档识别模块40识别具体文档类型后,由图2的文档处理引擎36提供可靠 性的下一个步骤是,调用文档鉴定模块42以确定是否存在要求的特征。在实施过程中,鉴 定特征是可以与上文讨论的识别特征交换的概念,这意味着可以在验证器、核对器或者甚 至分类器的实施中应用图像分析方法。基本方针是在最短时间内使用尽可能少的特征进行 识别同时使正确文档类型的拒绝率更低,并且用于所谓鉴定流程的其他特征仅调用自识别 出的文档同时使伪造物的误接受率更低。本文示出三种方法作为获取所用印刷技术的特性以识别伪造物的示例性验证器 方法。伪造物通常使用替代印刷技术(如复印机)来复制原始文档。在实施过程中,文档 鉴定模块42可以使用远多于本文所示这三种示例性技术的方法。例如,凹版印刷仍然是广泛使用的方法,该方法于15世纪30年代在德国发明,用 于印刷原始文档。该技术是雕刻成或切成凹板,凹板填充有油墨,并用压力使纸张的压印区 域凸起,以生成具有3D效果的刻纹外观。通常用于伪造物的廉价替代技术为热图像(凸起 油墨),其用于常用名片之类物件的印刷。在使用3M文档阅读器的CCD照相机之类透视环境下进行查看时,可以捕捉到一 些重要的3D视觉效果。在采用3M名片样本的情况下,由平面扫描器生成了图14A的图像 240,由图1的文档阅读器11捕捉到了图14B的图像244。如图14B所示,图像240示出包 括字符阴影的3D效果。在上面两个图像中获取字母“M”的整个右腿中水平移动的灰度变化分布,可以在 图14A的图片242和图14B的图片246中看到一些显著差异;扫描仪中整个笔画上的灰度 级别变化在图14A的分布242中始终是对称的,而CCD照相机的情形中不对称,如图14B的 分布246所示。暗谷朝向照相机原始位置的内侧偏移。通过测量整个视场,每个谷所示的 不对称偏移的量会变化,并且可以在偏离视场原点的距离方面进行量化,如对图14C中的 3M名片进行的测量。所示例子中偏移量的测量单位为密耳。这些技术可以易于由所谓“阴影立体”技术应用,以通过测量图像的精确3D参数 确定是否存在不对称性,这些参数例如笔画凸起多高,该高度可根据图14C中斜线有多陡 来确定。另一种印刷技术为雕版印刷,其在印刷表面上产生切口,并且因此产生与上述方 法相反的光学效果。上文描述的特征分析技术同样可以用于分析此类印刷技术生成的图像 和/或字符的3D特性。将图像印刷到纸张或其他媒体上时,除连续影像(如照片和ID打印机)以外,另 外两种最常用的复印技术通过二值图像模拟连续色调图像半色调加网技术(调幅)使用 间隔相等、尺寸不同的点,而随机加网技术(调频)在不同位置并以不同密度应用尺寸相同 的点。图15A的样本图像250、252和254示出了这些印刷技术的样本。纹理分析的协方差矩阵方法对于半色调加网的规则间隔点是良好的度量,而高频 噪声或边缘检测是对随机加网的理想指示。在另一个例子中,彩色图像通常可以由多个筛网重建,并且在半色调加网中,不同 角度的CMYK四色平面组合了如图15B中的样本256和图15B中的放大图像258所示的玫 瑰花结图案。
图15C示出图像260、262和264所组成的一组图像样本,这些图像是通过将彩色 C⑶照相机捕捉的图像256的RGB平面分解而生成的。图15C的图像组示出图15C中样本 图像260、262和264中的成角度筛网,其可以以相似方式处理。由于复制是文档伪造物中最常见的情形之一,所以扫描文本也会因使用不同的加 网方法而改变,如同图15D中分别由连续色调、半色调和随机加网方法获得的图像266、268 和270的对比那样。在这种情况下,笔画宽度和边缘曲率的变化可以是对复制原始文档的 加网方法导致的字符畸变的良好度量。除上述传统印刷技术外,还设计了许多新方法来不仅限制将图像复制到媒体上, 而且还以微结构承载其他信息以进一步协助防止伪造。尽管这些方法中的大多数仅能通过 自己专有的算法解码,但仍然可以在图像处理中使用一些简单的特征提取方法来确定是否 存在特征,从而以经济高效的解决方案实现鉴定目的。下文讨论了一些例子。例如,一些公司对包含机读码并且其上覆盖人可读内容的文档进行编码和解码, 使得机读码和人可读内容均可分辨。在操作中,生成了背景图像,其中背景图像包括根据 灰阶图像数据值编码的浮雕状网格,每个半色调网格包括至少两个区别明显的图案中的一 个,如图16A所示。另一个最近提出的方法的基础是,通过将一些点偏移来对规则半色调加网进行相 位调制,如图16B的图像280所示。在这种情况下,放置具有相同加网频率的透镜状解码透 镜使图16B的图像282中的编码字母“Si”可见。本文所述技术可以易于应用到此类图像。另一个方法是将彩色或灰阶图像平面转换为微型字符层,其中每一层均相对与另 一层以不同角度排列。微型字符宽度按照灰阶或颜色值(如果有多个颜色)对宽度进行调 制,如图16C所示,并且覆盖有放大图像。本文所述技术可以易于应用到此类图像。作为示出该系统如何快速高效地以高精确度识别文档的例子,图17A-17C示出了 从由206种不同的未使用符合ICAO要求的MRZ区的美国驾驶执照构成的组中识别和验证 纽约驾驶执照的当前版本的流程。下面的表I中列出了被调用和应用于提取图像属性并对 其进行递归处理的所用分类器和核对器表I
分类器/核对器光源空白红外光单色可见光主色可见光布局区域匹配红外光特征图像文档匹配可见光 表I的右列示出对应的光源。该列表根据计算效率排序,并依次执行。最后两项 由文档中预期的两个图像图案匹配定义。图17B示出在该例子中对于一个测试的每个分类器或核对器检查了多少个文档 对象。如图所示,空白分类器/核对器在测试开始时检查所有206个候选对象,可见图案匹 配分类器/核对器已被限制为仅仅检查正确文档类型的一种可能。图17B的曲线示出候选 可能性如何在约200毫秒内高效缩减。图17C示出每个操作的拒绝率,其代表文档识别框 架相对于该类文档的识别性能。由于徽标图案匹配分类器/核对器在从15个候选对象中 识别正确文档并放弃其他14个方面具有最高性能,即93%拒绝率,因此其为相对耗时的操 作。图17A示出通过分别用红外光、可见光、紫外光和逆向反射搜索四个图像中的预 期安全图像图案,将该文档识别为当前纽约驾驶执照后调用的成功验证结果的一部分。该 结果与图8A所示的在系统完成识别和随后的验证后的那些结果相似。已经描述了本发明的各种实施例。这些和其他实施例均在以下权利要求书的范围 内。
权利要求
一种将未知文档验证为多个可能文档类型中的一个的方法,所述方法包括选择不同文档类型的一个或多个引用文档;根据所述引用文档,计算所述多个不同文档类型的一个或多个特征图像和特征值;根据从所述引用文档计算的所述特征图像和特征值,计算所述多个文档类型中的每一个的引用权重系数向量;接收未知文档的至少一个捕捉图像;计算所述捕捉图像的权重系数向量;将所述捕捉图像的所述权重系数向量与所述文档类型的所述权重系数向量中的每一个进行比较,以计算多个距离;以及根据所述多个所计算的距离,将所述未知文档识别为所述多个文档类型中的一个。
2.根据权利要求1所述的方法,其中所述特征图像为标准正交的并且定义了多维空间,并且其中所述多个距离代表所述捕捉图像在所述标准正交特征图像所定义的多维空间中 距所述不同文档类型的距离。
3.根据权利要求2所述的方法,其中所述距离中的每一个是以每个可能文档类型的信 度值的形式表达的,所述信度值以统一的度量来代表所述距离。
4.根据权利要求1所述的方法,其中计算所述捕捉图像的引用权重系数向量包括 构建数据矩阵,其中每一列均代表特征图像;以及乘以所述数据矩阵以生成所述捕捉图像的所述权重系数向量, 其中所述权重系数向量的每个系数代表所述捕捉图像在所述标准正交特征图像所形 成的多维空间中的表达。
5.根据权利要求1所述的方法,其中计算多个引用文档类型的一个或多个特征图像和 特征值包括收集所述可能文档类型的图像模板; 将所述图像模板的图像数据归一化为零均值;形成数据矩阵,其中每一列均存储所述图像模板中的不同模板的图像数据; 通过计算所述数据矩阵的协方差矩阵来计算一组特征向量,并按所述特征向量中的每 一个的各自的特征值进行排序;应用阈值以仅选择具有超过阈值的特征值的那些特征向量; 将所述已选特征向量映射回所述特征图像;以及 存储所述已选特征图像。
6.根据权利要求1所述的方法,其中接收至少一个捕捉图像包括接收红外光(IR)图 像、可见光谱图像、紫外光(UV)图像和逆向反射图像中的一种或多种。
7.根据权利要求1所述的方法,其中接收所述未知文档的至少一个捕捉图像包括接 收护照、驾驶执照、出生证明、财务文档、商业票据、身份证和社会保险卡中的一种的捕捉图像。
8.根据权利要求1所述的方法,还包括在数据结构中存储代表所述可能引用文档类型的多个文档类型对象, 其中所述多个文档类型对象引用多个用于从所述捕捉图像提取属性的递归软件流程,以将所述未知文档分类并验证为由所述文档类型对象中的一个所代表的所述可能文档类 型中的一个。
9.根据权利要求1所述的方法,其中所述文档类型对象中的一个或多个引用特征图像 识别流程,所述特征图像识别流程选择所述引用文档类型、计算所述多个可能引用文档中 的每一个的所述引用权重系数向量、计算所述捕捉图像的所述权重系数向量、对所述捕捉 图像的所述权重系数向量与所述可能引用文档的所述权重系数向量中的每一个进行比较 以计算多个距离,并且根据所述多个距离将所述未知文档识别为所述多个可能文档类型中 的一个。
10.根据权利要求8所述的方法,还包括根据通过将所述多个递归流程应用至所述捕 捉图像而提取的所述属性,以可变顺序遍历所述数据结构的所述文档类型对象。
11.根据权利要求9所述的方法,其中存储所述多个文档类型对象包括存储分类器对象,其中所述分类器对象引用所述 多个流程中的一个或多个,并且其中遍历所述数据结构包括遍历所述分类器对象以调用所述分类器对象所引用的所述一个或多个流程以确定一组可能的引用文档类型 对象;以及遍历所述组以将所述捕捉图像识别为所述多个可能的引用文档类型对象中的一个。
12.根据权利要求9所述的方法,其中存储所述多个文档类型对象包括存储最低信度值和引用所述多个流程中的一个 或多个的核对器对象,并且其中遍历所述组包括遍历所述核对器对象以 调用所述核对器对象所引用的所述多个流程中的一个或多个; 根据通过调用所述核对器对象所引用的所述多个流程中的一个或多个而接收到的一 个或多个返回值来计算信度值,以处理在与所述引用文档类型对象进行比较时由所述分类 器对象从所述未知文档提取的属性;以及根据所述信度值和所述最低信度值之间的比较,从所述组选择性地舍弃所述可能的引 用文档类型对象中的一个或多个。
13.根据权利要求1所述的方法,还包括 调用以下流程中的一个或多个第一方法,以评估用于所述未知文档的印刷方法是来自凹版印刷或雕刻印刷技术的可 能性;第二方法,以区分用于印刷图像和文本的丝网印刷方法;或 第三方法,以评估所述未知文档的印刷材料是否包括微结构;以及 根据所述可能性确定所述识别出的文档是否可靠。
14.根据权利要求1所述的方法,还包括将所述未知文档识别并验证为结合有嵌入电 子信息的安全文档,所述嵌入电子信息包括射频识别(RFID)数据、电子护照数据、智能卡 数据或磁条数据中的一种或多种。
15.根据权利要求1所述的方法,还包括以视觉或声音形式将所述识别和验证流程的 结果呈现给用户。3
16.一种安全文档鉴定设备,包括存储器,所述存储器存储多个引用文档类型的一个或多个特征图像和特征值; 图像捕捉接口,所述图像捕捉接口捕捉未知文档的至少一个图像; 文档处理引擎,所述文档处理引擎响应于所述捕捉图像,选择所述引用文档类型中的 一个或多个作为可能引用文档类型、计算所述多个可能引用文档中的每一个的引用权重系 数向量、计算所述捕捉图像的权重系数向量、比较所述捕捉图像的所述权重系数向量和所 述可能引用文档的所述权重系数向量中的每一个以计算多个距离,并且根据所述多个距离 将所述未知文档识别为所述多个可能文档类型中的一个。
17.根据权利要求16所述的安全文档鉴定设备,其中所述文档处理引擎计算所述捕捉 图像的所述权重系数向量,其中通过构建其中每一列均代表特征图像的数据矩阵并乘以所 述数据矩阵以生成所述捕捉图像的所述权重系数向量。
18.根据权利要求16所述的安全文档鉴定设备,其中所述文档处理引擎计算并存储所 述多个引用文档类型的所述一个或多个特征图像和特征值。
19.根据权利要求14所述的安全文档鉴定设备,其中所述文档处理引擎通过以下操作 来计算并存储所述多个引用文档类型的所述一个或多个特征图像和特征值收集所述可能文档类型的图像模板; 将所述图像模板的图像数据归一化为零均值;形成数据矩阵,其中每一列均存储所述图像模板中的不同模板的图像数据; 通过计算所述数据矩阵的协方差矩阵计算一组特征向量,并按所述特征向量中的每一 个的各自的特征值排序;应用阈值以仅选择具有超过阈值的特征值的那些特征向量;以及 将所述已选特征向量映射回所述特征图像; 将所述已选特征图像存储在所述存储器中。
20.根据权利要求16所述的安全文档鉴定设备,其中所述存储器根据动态文档识别框架在数据结构中存储多个文档类型对象,其中所 述多个文档类型对象引用多个用于从所述捕捉图像提取属性的递归流程,其中所述文档处理引擎根据通过将所述多个递归流程应用至所述捕捉图像而提取的 所述属性,以可变顺序遍历所述数据结构的所述文档类型对象,并且其中所述文档处理引擎在遍历所述数据结构后将所述未知文档识别为所述多个文档 类型对象中的一个。
21.根据权利要求16所述的安全文档鉴定设备,其中所述图像捕捉接口通过接收红外 光(IR)图像、可见光谱图像、紫外光(UV)图像和逆向反射图像中的一种或多种来接收所述 捕捉图像。
22.根据权利要求16所述的安全文档鉴定设备,其中所述图像捕捉接口通过接收护 照、驾驶执照、出生证明、财务文档、商业票据、身份证或社会保险卡中的一种的捕捉图像, 从而接收所述未知文档的所述捕捉图像。
23.一种计算机可读媒体,所述媒体包含指令以使可编程处理器进行以下操作 计算多个引用文档类型的一个或多个特征图像和特征值,接收未知文档的至少一个捕捉图像;选择所述引用文档类型中的一个或多个作为可能的引用文档类型, 计算所述多个可能引用文档中的每一个的引用权重系数向量; 计算所述捕捉图像的权重系数向量;比较所述捕捉图像的所述权重系数向量和所述可能引用文档的所述权重系数向量中 的每一个以计算多个距离;以及根据所述多个距离,将所述未知文档识别为所述多个可能文档类型中的一个。
24. 一种采用布局匹配流程来识别或验证未知文档的方法,包括 接收未知文档的捕捉图像; 分隔和识别所述捕捉图像的多个连接的区域;通过将所述多个连接的区域分类并建立所述多个连接的区域之间的一组关系,构建图 形以表示所述捕捉图像;将所述多个连接的区域相对于与所述多个文档类型对象中的一个相关联的模板数据 进行比较,其中所述模板数据指定预定义的多个连接图像区域和所述多个预定义的连接图 像区域之间的关系;以及根据所述比较,确定所述捕捉图像是否属于当前所比较的所述多个文档类型对象中的 所述一个。 全文摘要
本文描述了根据特征图像流程方法识别和验证安全文档的技术。例如,安全文档鉴定设备选择不同文档类型的一个或多个引用文档、根据所述引用文档计算所述多个不同文档类型的一个或多个特征图像和特征值,并且计算所述多个文档类型中的每一个的引用权重系数向量。在接收未知文档的至少一个捕捉图像后,所述设备计算所述捕捉图像的权重系数向量、比较所述捕捉图像的所述权重系数向量和所述文档类型的所述引用权重系数向量中的每一个以计算多个距离,并且根据所述多个距离将所述未知文档识别为所述多个文档类型中的一个。
文档编号H04L9/32GK101925905SQ200880125413
公开日2010年12月22日 申请日期2008年11月12日 优先权日2007年12月12日
发明者詹姆斯·E·麦克莱恩, 雷宜武 申请人:3M创新有限公司