确定胎儿目标区域单体型的方法和装置的制造方法
【技术领域】
[0001] 本发明涉及生物信息领域,特别地,涉及确定胎儿目标区域单体型的方法和装置。
【背景技术】
[0002] 脊髓性肌萎缩症(Spinal Muscular Atrophy, SMA)是一组常见的常染色体隐 性遗传病,居致死性常染色体隐性遗传病的第二位,活产婴儿中患者发生率为1/6000~ 1/10000。目前的研究已经表明,SMA的病因主要是SMN基因缺失:其中SMN1为决定基因, 表达完整而稳定的SMN功能蛋白,而SMN2为SMA的修饰基因。据报道,98. 7% (226/229) 儿童型患者存在SMN1基因缺失,其中约90%的SMA病人显示纯合SMN1外显子7和/或8 缺失。SMA神经肌肉疾病病情严重,目前临床上无有效治疗手段。产前诊断是预防该出生缺 陷的重要手段。
[0003] 随着孕妇外周血浆中胎儿游离DNA存在的发现,为无创产前检测胎儿基因型提供 了可能。然而目前尚未见到有关通过孕妇血浆游离DNA进行无创胎儿SMA检测的报道。已 有的SMA检测报道,多是通过诊断SMN17号外显子设计QPCR引物及探针,实现对缺失型 SMN1突变的检测,如徐湘民等人公开的"一种诊断人类脊髓性肌萎缩症的荧光定量PCR试 剂盒"(公开号CN103614477A)。然而由于母体血浆中胎儿DNA含量相对较低,而QPCR的灵 敏度不足以在高母体背景下实现对胎儿SMN1基因突变情况的检测。
[0004] 因此,发展一种可以无创检测胎儿SMN1基因型的检测方法,将对该疾病的产前诊 断起到十分重要的作用。
【发明内容】
[0005] 依据本发明的一方面,提供一种确定胎儿目标区域单体型的方法,该方法包括以 下步骤:对孕妇体液中游离核酸的所述目标区域进行序列测定,以便获得第一测序数据; 对所述胎儿的家系成员的所述目标区域进行序列测定,以便获得第二测序数据、第三测序 数据和第四测序数据,其中,所述第二测序数据为胎儿母亲的测序数据,所述第三测序数据 为胎儿父亲的测序数据,所述第四测序数据为先证者的测序数据;基于所述第一测序数据、 第二测序数据以及任选的第三测序数据,确定所述孕妇体液中的胎儿核酸含量;基于所述 第二测序数据、第三测序数据和第四测序数据,分别构建所述胎儿母亲的目标区域单体型 和所述胎儿父亲的目标区域单体型;以及,基于所述胎儿母亲的目标区域单体型、所述胎儿 父亲的目标区域单体型以及所述胎儿核酸含量,确定所述胎儿的目标区域单体型。其中,第 一、第二、第三和第四测序数据的获得没有必需遵循的先后关系,可同时获得,也可一个个 获得或几个几个一起获得;胎儿核酸含量的确定步骤和父母单体型的构建步骤也没有先后 关系。
[0006] 依据本发明的另一方面,提供一种确定胎儿目标区域单体型的装置,该装置能够 执行本发明一方面提供的方法的部分或全部步骤,该装置包括:测序单元,用于对孕妇体液 中游离核酸的所述目标区域进行序列测定,以便获得第一测序数据,以及,对所述胎儿的家 系成员的所述目标区域进行序列测定,以便获得第二测序数据、第三测序数据和第四测序 数据,其中,所述第二测序数据为胎儿母亲的测序数据,所述第三测序数据为胎儿父亲的测 序数据,所述第四测序数据为先证者的测序数据;胎儿核酸含量确定单元,与所述测序单元 连接,用于基于所述第一测序数据、第二测序数据以及任选的第三测序数据,确定所述孕妇 体液中的胎儿核酸含量;父母单体型确定单元,与所述测序单元连接,用于基于所述第二测 序数据、第三测序数据和第四测序数据,分别构建所述胎儿母亲的目标区域单体型和所述 胎儿父亲的目标区域单体型;以及胎儿单体型确定单元,与所述胎儿核酸含量确定单元和 所述父母单体型确定单元相连,用于基于所述胎儿母亲的目标区域单体型、所述胎儿父亲 的目标区域单体型以及所述胎儿核酸含量,确定所述胎儿的目标区域单体型。
[0007] 本发明的一方面的方法和/或装置,提供了一种基于目标区域捕获及家系目标区 域单体型连锁分析的方法,通过连锁分析从孕妇体液样本比如孕妇外周血浆DNA测序数据 中推断胎儿目标区域基因型,可用于判断或辅助判断胎儿是否患有目标区域变异相关疾病 或异常。本发明的方法或装置通过利用连锁单体型信息极大的降低了假阳性及假阴性的发 生。该方法和/或装置的应用可以极大的避免由于单个位点测量比例不准,单个位点测序 错误等方面带来的假阴性和假阳性结果,使得检测结果更加准确可靠。通过该方法在SMN1 患病高风险家庭的应用,可以有效检出患病儿,并减少不必要的羊水穿刺等有创取样手术。
【附图说明】
[0008] 本发明的上述和/或附加的方面和优点从结合下面附图对实施方式的描述中将 变得明显和容易理解,其中 :
[0009] 图1是本发明的一个【具体实施方式】中的确定胎儿目标区域单体型的装置的示意 图;
[0010] 图2是本发明的一个【具体实施方式】中的胎儿基因型判断的整体技术线路示意图;
[0011] 图3是本发明的一个【具体实施方式】中的胎儿基因型判断结果,图3A为胎儿从父亲 处所遗传到的单体型的判断结果图,图3B为胎儿从母亲处所遗传的单体型的判断结果图; 图中,点表示一个snp位点遗传自HapO的概率与遗传自Hapl的概率的差值,圈线为组合判 断结果。
【具体实施方式】
[0012] 依据本发明的一种实施方式,提供一种确定胎儿目标区域单体型的方法,包括以 下步骤:
[0013] 步骤一:获得第一、第二、第三和第四测序数据。
[0014] 获得孕妇体液中的游离核酸,捕获目标区域,对所述捕获得的目标区域进行序列 测定,获得第一测序数据。孕妇体液样本为包含胎儿核酸的样本,比如孕妇外周血血浆包 含胎儿核酸,提取的外周血游离核酸是孕妇和胎儿核酸的混合物,混合物是高度片段化的。 依据现有测序平台,通过对从孕妇外周血样本提取的游离核酸进行测序文库构建,利用探 针或芯片或液相探针捕获获得目标区域测序文库,对目标区域测序文库进行上机测序,获 得第一测序数据,第一测序数据是孕妇核酸和胎儿核酸混合物的混合数据。测序平台包括 但不限于 CG(Complete Genomics)、Illumina/Solexa、Life Technologies ABI SOLiD 和 Roche 454,可根据所选用的测序平台进行相应的测序文库制备,可选择单端或双端测序, 由此获得的各个测序数据由多个短序列组成,将各个短序列称为读段。捕获所用的芯片是 由固相基质和固定在其上的多个探针组成的,探针能够特性识别目标区域,目标区域可以 是待测样本基因组DNA的一部分也可以是整个基因组,在本发明的一个【具体实施方式】中, 目标捕获区域包括SMN1基因外显子区,表1显示各个外显子区域在参考基因组HG19上的 位置,目标区域还包括SMN1基因内部及其上下游3M区域内高杂合率的SNP位点,表2为这 些SNP在各个区域的数量分布,这些SNP的次等位基因频率(MAF)在0. 3-0. 5之间。这些 区域以及位点信息有利于判断分析胎儿单体型,目标基因上下游的3M区域的捕获使得重 组概率减少到万分之一以下,使得后续能够准确的进行单体型构建或确定,而且上述高杂 合率的SNP位点的捕获,使得容易获得来源于胎儿自身的特定位点或序列,利用来自胎儿 本身的位点或序列能够估算在混合DNA中胎儿的核酸含量。设计能够特异性识别上述区域 的探针时,为保证捕获的特性性、检测的准确性,使包含至少一个上述SNP位点的探针在参 考基因组上是唯一比对的,这样能增强探针捕获目标位点的特异性。在探针设计时,使每 条探针的GC含量为40-50%,这样有利于在同一个体系中整组探针一起特异性结合目标区 域、在同一个反应体系中能够一起洗脱下来。
[0015] 表1 SMN1基因区域捕获范围
[0016]
[0017]
[0018] 表2 SMN1区单体型分析所用SNP位点分别情况
[0019]
[0020] 获取胎儿家系成员的样本,包括胎儿生物学母亲(孕妇)、胎儿生物学父亲以及先 证者的核酸样本,提取各个家系成员样本中的核酸,参考上述获取第一测序数据的方式,捕 获胎儿家系成员核酸中的同样目标区域,对各个家系成员的同样目标区域进行序列测定, 获得家系成员测序数据,所述家系成员测序数据包括第二、第三和第四测序数据,分别对应 胎儿生物学母亲、胎儿生物学父亲和先证者的同样目标区域的测序数据。其中第二测序数 据,即母亲测序数据的获得,可以通过分离上述获得第一测序数据的孕妇外周血样本,分离 孕妇外周血样本获得孕妇外周血血浆样本和孕妇血细胞,从孕妇血细胞,比如白细胞,可以 获得母亲基因组核酸,进而获得第二测序数据。先证者该家系中是确定带有目标区域相关 变异的的成员,在这里,先证者是与待测胎儿同样生物学父母的胎儿的兄弟姐妹,包括出生 的和未出生,包括体外培养的胚胎或受精卵,包括在世和不在世的。另外,在其他具体实施 方式中,先证者也可以是待测胎儿的父母的兄弟姐妹,比如胎儿的舅舅、叔叔、姑姑等,这 时,胎儿的家系成员的测序数据还应包括胎儿的祖父母和/或外祖父母,这样能够利用父 母的兄弟姐妹的测序数据以及父母的测序数据构建祖父母或外祖父母的目标区域单体型, 进而判断父母的遗传到的目标区域单体型。第一、第二、第三和第四测序数据的获得没有必 需遵循的先后关系,可同时获得,比如利用标签标记多个样本,对多个样本核酸混合建库混 合上机测序同时获得多个样本的测序数据,也可一个个获得或几个几个获得核酸样本的测 序数据。
当前第1页
1 
2 
3 
4