专利名称:心脏病诊断系统和方法
技术领域:
本发明涉及心脏病诊断系统和方法。
背景技术:
多年来心脏病学家和电心脏病学家开发出大量与心电图信号或ECG的分析有关的知识。他们已经识别出许多对应于基本心脏综合病症的基本“形状”。据最近的计算,有超过80种基本综合病症可以明确地链接到特定ECG信号形态学(Francis Morrus的临床心电图学ABC,BMJ出版社,01-2003,ISBN0727915363)(ECG实例,Jenkings和Gerred,1997,ISBN0443058978)。这些综合病症包括缺血性心脏病、过度肥大性变(hypertrophy patterns)、房室传导阻滞、束支传导阻滞、室上性节律和室性节律。
以往分析ECG的工作集中在为已知的综合病症建立特定的检测器。通常心血管病学家提供在信号中要寻找什么的详细形态学描述并将这种知识编译成一系列编码成算法的规则。他们编码的用于ECG信号和潜在综合病症的检测/分类的基于规则的方法有许多缺点。其中,这中包括反复试验方法的算法设计显然是一种消耗时间的方法。另外,该算法的设计者不会面对大量的数据,并且也不能保证编码该算法的规则是一般充足的。而且从专家那里提取规则是困难的;有时候专家们并不确切的了解怎样将一种心脏综合病症和其它种区分开,他们只是“知道”但不能解释为什么他们能够做出区分。
另外的方法是使用带有由心脏病学家提供的注释的ECG数据。专家分配标签给ECG信号的区域,注明信号是否正常或是否存在特定综合病症。然后模式识别技术从ECG信号中提取特征并用这些标签试图建立最小化错误率的分类器。尽管该应用优于以往的技术并且通常不依靠对信号形态的详细理解(它只需要一个标签),但是它未能利用多年来专家们已经获得的广泛知识。事实上,申请人发现向从原始数据提取有意义的特征并且以其自身编辑特定综合病症的规则做出计算的图像识别算法提出的需要过多。
发明内容本发明克服了现有技术的缺点。具体来说,本发明方法结合了心脏病学专家的专业技术(如编码在ECG形态中)和模式识别技术。这有效地结合了两个领域最好的部分,即专业知识和自动分类技术。
在一个实施例中,本发明用于分析受检者的ECG信号的方法和设备包括(i)接收要分析的受检者心电图信号;(ii)使用实例预定义信号库,将受检者信号与已知的心脏综合病症的信号图形进行比较;(iii)产生指示受检者信号与实例预定义信号的相似性的距离测度;以及(iv)根据所产生的距离测度形成向量序列。形成的向量序列用于输入到确定受检者是否有任何心脏综合病症的分类器(即指示综合病症的信号模式)。
本发明的上述和其他目的、特征和优点将在下面对本发明优选实施的更详细描述中显现,如在附图中示出的那样,附图中相似的参考序号表示相同的部分。这些图例无需按比例绘制,着重在于示出本发明的原理。
图1是本发明使用的训练过程的方框图。
图2是本发明的ECG信号分析的方框图。
图3是可以在其中实现本发明的数字处理环境的示意图。
具体实施方式下面是关于本发明的优选实施方式的描述。
本发明提供了一种把心脏病学家在诊断心脏疾病和综合病症方面的专业知识与基于大量原始数据“学习”的自动机学习系统相结合的方法。
数据驱动模式分类技术有包括支持向量分类器、提升分类器(Boostingclassifier)和神经网络的距离概念。这些分类技术的核心是称为“核”(kernel)的距离函数,该核比较数据点、表示为特征向量并产生实数。在本发明中,数据点是被处理以产生特征向量的ECG信号的段。新的核和带有标记的训练数据(都是以心脏病学家的专业知识为基础)的集合用来学习一组表征要被区别的一组分类的参数。这组参数和核一起用于分类新数据点(未知状态的ECG信号)。
本发明如下述那样工作从心脏病学文献中提取或是从心脏病专家的会诊中开发一组对应于要被分类的综合病症的实例ECG心跳模式或形状。将每个模式在时间和振幅上规范化并与原型(prototypical)心跳同步。得到的模式13a...n被认为是预定义实例信号并存储在库11中(通过数据库、表或其它数据存储实现),如图1所示。
然后库11中的模式13用于构造比较两个数据点并产生距离的核函数15。这会有许多方法来实现,在下面将进一步详细介绍。
核函数15输出的计算出的距离被输入到分类器25的模式识别引擎21中。模式识别引擎21和/或分类器25可以是神经网络支持向量机或提升分类器或本领域中的其它常见类型。分类器25利用由模式识别引擎21做出的模式测定并确定该受检者ECG信号(或其他分类器)的类别。
为了训练模式识别引擎21和分类器25,使用带有标签或其它有注释的训练集23。训练集23是注释有对应综合病症类别的已知且以前分析的ECG信号的集合。开窗口部件17通常在信号图形发生变化处将每个训练ECG信号23分成数据块27,如图1中垂直虚线部分所示。
所得到的ECG信号23段或数据块27被输入到特征提取模块19。对每个段27,特征提取模块19(i)从该该数据块27中提取感兴趣的信号模式,并(ii)产生代表所提取的特征(感兴趣的信号模式)的ECG段数据点29。特征提取模块19输出这些数据点29以输入到核函数15。
在一个实施方式中,在核函数15中,内部距离函数计算(ECG段的)给定数据点29与库11中每个模式13a...n之间的相对距离。所以,该核函数15计算(a)对于每个模式13(在库11中),从给定的ECG段27中的数据点29到模式13中的数据点的距离向量,然后计算(b)对于每个ECG段27,在使用标准度量(欧几里德距离,马哈拉诺比斯距离,等等)的(a)的向量之间的距离作为其最后输出。
在另一个实施方式中,核函数15如下计算每个ECG段27的距离向量。对于给定的ECG段27,相应向量具有如库11中的模式13一样多的分量。也就是,每个分量对应一个不同的模式13。而且,每个分量有一个相似值,该相似值定义为(ECG给定的段27的)数据点29与分量的相关库模式13的数据点之间相同的概率或可能性。根据所得到的多分量向量,核函数15为对应的ECG段27计算并输出得分,这依照2000年11月28日递交的美国专利申请No.09/724269所公开的技术,其全文在这里引用做为参考。这个得分表示在给定ECG段27和库模式13之间的测量的相似性(或分类的距离)图1中学习和训练的最终结果是一组参数31(图2),这组参数还表征被分类的综合病症的特定情况。这组参数31在本发明运行期间使用,参考图2所示。
在对不知道其心脏状况的患者(受检者)的ECG信号33进行分析或测试时,开窗口部件17和特征提取模块19如前面所描述的那样来操作但是是对测试集33操作。由此将受检者的(被分析的)ECG信号33分段并且最后在特征提取模块19的输出表示为被分析以指示心脏综合病症的可能性的ECG数据块27。
根据一个实施例或类似以上描述所建立的核函数15接收受检者的ECG段27和库11的模式13作为输入。核函数15计算受检者ECG段27和库模式13之间相似性的距离测度或其它数量指示。优选的是,核函数15为测试信号33序列中的每个受检者ECG段27产生这种数量测度。最终,核函数15根据计算出的距离测度产生用于输入到分类器25的距离向量序列。如上述图1中训练的并且由学习参数31支持的分类器25,响应来自核函数15的距离向量序列并将检测信号33的受检者ECG段27分类(或根据级别进行归类)。最后,分类器25输出用特定心脏综合病症、置信度得分等标记的测试信号33的有注释的版本35。
总之,本发明运用基于公知常识和心脏疾病的特征模式13的心脏病学家设计的核15作为分类算法的内部组件,该分类算法从有注释的训练数据23中得到附加参数31。本发明以两种方式结合心脏病学家的专业知识。首先是以经由心脏病学家设计的核15的全新方式,然后是以经由他们在ECG训练数据23上的标注的更传统的方式。
图3示出的是可以在其中实现本发明的计算机系统(环境)100。就是说,图1中的训练例行程序/程序40可以在这种计算机系统100中执行。检测/分析例行程序或程序50可以由相同的或不同的计算机系统100执行。每个计算机系统100都有工作内存90用以运行(执行)例行程序/程序40、50并且耦合到保存库11、分类器参数31等的支持数据存储94。
具体地说,每个计算机100包括系统总线79,系统总线是用于在计算机组件间传输数据的硬件线路的集合,总线79本质上是连接计算机系统不同部件(例如处理器,磁盘存储器,内存,输入/输出端口,网络端口,等等)的共享管道,它使得在部件间能够传输信息。I/O设备接口82连接到系统总线79以将各种输入和输出装置(例如显示器,打印机,扬声器等等)连接到计算机。网络接口86使计算机与各种其它连接到网络的设备相连接。内存90给用于实现本发明的实施例的计算机软件指令(例如程序的例行程序92和数据94)提供易失性存储器。程序的例行程序92包括图1和2中的发明程序40、50。磁盘存储器95给用于实现本发明的实施例的计算机软件指令和数据提供非易失性存储器。中央处理单元84也连接到系统总线79,并执行计算机的指令。
网络接口86使程序40、50能够通过网络下载或上载(例如局域网,广域网,全局网络)。I/O设备接口82使得在磁盘(CD-ROM,等)上的程序40、50能够在计算机100之间传输。其它在计算机100之间传输全部或者部分程序40、50的技术在本领域技术人员了解的范围内。因此,程序40、50可以在独立的计算机100中运行、跨计算机系统100分布或在以客户机-服务器方式或其它配置下执行。
尽管通过参考其优选实施对本发明进行了详细的描述和说明,但本领域技术人员应该理解,在不背离由所附权利要求
包含的本发明的范围的情况下,可以在形式和细节上做出各种改变。
例如患者可以是人或动物。
权利要求
1.一种分析受检者的ECG信号的方法,包括计算机执行的步骤接收要分析的受检者心电图信号;使用指示已知心脏综合病症的实例预定义信号库,产生指示所述受检者信号与所述实例预定义信号的相似性的距离测度;根据所产生的距离测度形成向量序列;以及将所述向量序列输入到分类器,所述分类器由此确定所述受检者是否有任何心脏综合病症。
2.如权利要求
1所述的分析方法,还包括将所述受检者信号分成工作段的步骤;其中产生距离测度的步骤包括为每个工作段形成具有与所述库中的实例信号的数量相同数量的分量的向量,每个分量对应于一个不同的实例信号并具有指示工作段与相应实例信号的相似程度的相应距离值。
3.如权利要求
1所述的分析方法,其中产生距离测度的步骤包括将所述受检者信号分成多个段;以及对于每个段,(a)计算所述段的数据点与所述库中每个实例信号的数据点之间的距离从而为每个实例信号形成距离向量,以及(b)为段定义作为所形成的距离向量间的距离函数的距离测度。
4.如权利要求
1所述的分析方法,还包括步骤以所述分类器的输出为基础,标注所述库中的实例信号的段。
5.如权利要求
1所述的分析方法,其中所述实例信号库中存有心脏病学家定义的样本,每个样本有相应的心脏综合病症和对应的实例心电图信号。
6.一种分析受检者的ECG信号的计算机装置,包括模块(14,19),用于接收要分析的受检者心电图信号(33);实例预定义信号(13)库(11);核函数部件(15),耦合在所述库(11)与所述接收模块之间,所述核函数模块(i)产生表示所述受检者信号(33)与所述实例预定义信号(13)的相似性的距离测度,并(ii)根据所产生的距离测度形成向量序列;以及分类器(25),使用所形成的向量序列作为输入并确定所述受检者是否有任何心脏综合病症。
7.如权利要求
6所述的计算机装置,其中所述接收模块将所述受检者信号(33)分成工作段(27);以及所述核函数部件(15)通过形成具有与所述库(11)中的实例信号(13)的数量相同数量的分量的向量来为每个工作段(27)产生距离测度,每个分量对应于一个不同的信号实例(13)并具有指示工作段(27)与相应信号实例(13)的相似程度的相应距离值。
8.如权利要求
6所述的计算机装置,其中所述接收装置将所述受检者信号(33)分成工作段(27);以及核函数部件(15)为每个工作段(a)计算所述段(27)的数据点(29)与所述库(11)中每个实例信号(13)的数据点之间的距离从而为每个实例信号形成距离向量,以及(b)为所述工作段(27)定义作为所形成的距离向量间的距离函数的距离测度。
9.如权利要求
6所述的计算机装置,其中以所述分类器(25)的输出为基础,标注所述库(11)中的实例信号(13)的段。
10.如权利要求
6所述的计算机装置,其中所述实例信号的库(11)中存有心脏病学家定义的样本,每个样本有相应的心脏综合病症和对应的实例心电图信号。
专利摘要
一种分析受检者的ECG信号(33)的计算机方法和装置,包括接收受检者的心电图信号并将其与已知的心脏综合病症的信号模式(13)相比较。采用实例预定义信号(13)的库(11)。产生指示受检者的信号(33)与实例预定义信号(13)的相似性的距离测度并形成向量序列。这个向量序列被输入到分类器(25)中,该分类器确定指示受检者有任何心脏综合病症的信号模式的存在。
文档编号A61B5/0452GK1997313SQ20058001190
公开日2007年7月11日 申请日期2005年3月31日
发明者P·莫雷诺, D·戈多, B·罗甘 申请人:惠普开发有限公司导出引文BiBTeX, EndNote, RefMan