一种检测人类胚胎染色体微缺失和微重复的方法
【技术领域】
[0001] 本发明涉及分子细胞生物领域,具体涉及一种检测人类胚胎染色体微缺失和微重 复的方法,其能够对人类胚胎囊胚期滋养层细胞染色体DNA片段拷贝数变异进行检测。
[0002]
【背景技术】
[0003] 染色体微缺失/微重复是指染色体上出现长度为1. 5kb_10Mb的缺失或重复。人 类染色体微缺失/微重复综合征是一种因人类染色体上出现微小片段缺失或重复,即DNA 片段拷贝数变异,缩写为CNV,引起复杂表型疾病,可导致严重的疾病和异常,如先天性心脏 病、生长发育迟缓、肢体畸形等。常见的微缺失综合征包括22qll微缺失综合征、猫叫综合 征、安格曼综合症、AZF缺失等。
[0004] 2009《中国不孕不育现状调研报告》显示,全国不孕不育患者人数已超过5000万, 而试管婴儿技术能够有效帮助不孕不育患者解决生育难题。试管婴儿技术是将卵子与精子 取出后置于特定的培养液内培养、受精,受精卵在恒温孵箱中发育为胚胎后移植回母体子 宫,最终发育成胎儿。试管婴儿技术作为有效的辅助生殖手段成为大多数不孕不育夫妇的 重要选择,而挑选健康胚胎移植是成功妊娠的关键。但是,通过试管婴儿方法获得的胚胎有 40-60%存在染色体异常,且随着孕妇年龄越大,胚胎染色体异常的风险越高,而染色体异常 是导致妊娠失败和自然流产的主要原因,因此,对于植入前的胚胎进行遗传学筛查是至关 重要的。胚胎植入前遗传学筛查是指胚胎植入着床之前进行染色体数目和结构异常的检 测,挑选正常的胚胎植入子宫,以期获得正常的妊娠,提高患者的临床妊娠率。除了常见的 3体综合症外,微缺失和微重复也是胚胎染色体异常的常见类型。
[0005] 尽管每种微缺失综合征发病率都很低,如较常见的22qll微缺失综合征发生率为 1 :4000,但由于临床检测技术的限制,大量的微缺失综合征患者在产前筛查和产前诊断中 无法检出,更为重要的是作为胚胎植入前诊断的最主要的样本类型,平衡易位患者的胚胎 必须通过分析微重复和微缺失来判定胚胎是否发生异常。因此,如果在试管婴儿技术中能 够避免移植有染色体微缺失/微重复的胚胎,将具有很重要的意义。
[0006] 此外,试管婴儿通常会进行多个卵子的体外受精,但为了避免多胎妊娠给孕妇和 胎儿带来的风险,移植的胚胎数目最好是1个。为了提高妊娠率,必须对移植的胚胎进行筛 选,从而对质量最佳的胚胎进行移植。目前胚胎质量的评估主要依赖于胚胎的形态判断,但 胚胎的形态和最终的成功怀孕之间的关联性还不够高。理论上,对胚胎的染色体进行检查 是筛选优质胚胎的最佳途径。胚胎染色体检测的最大瓶颈是可以用于检测的细胞数量太 少。
[0007] 现有的针对微缺失/微重复综合征的诊断方法主要有高分辨率染色体核型分析、 荧光原位杂交、微阵列-比较基因组杂交、多重连接探针扩增技术和定量PCR的方法等。
[0008] 高分辨率染色体核型分析采用细胞同步化的方法,通过获得大量优质的有丝分裂 晚前期或早中期的显带核型,使单套染色体的条带数量增至数百条以上,从而提高识别染 色体细微结构改变的能力,但其分辨率的极限只有约5M,不足以检测更小的染色体水平上 的微缺失/微重复变异。而且由于胚胎细胞数量的有限,也无法获得足够的染色体。
[0009] 荧光原位杂交,缩写为FISH,是微缺失/微重复检测的黄金标准,其可以有效地检 测出大部分染色体缺失。如果被检测的染色体或DNA与所用的核酸探针是同源互补的,二 者经变性-退火-复性,即可形成靶DNA与核酸探针的杂交体,而经荧光检测体系显示核 酸探针,即可对待测DNA进行定性、定量或相对定位分析。中期染色体FISH的分辨率可达 1-2M,间期染色体FISH分辨率可达50K,但该技术需在已知缺失位点的情况下,设计探针进 行验证,不宜用于发现新的染色体水平的微缺失或重复异常。
[0010] 微阵列-比较基因组杂交技术,缩写为Array CGH,可将特异DNA片段作为靶探针 固化在载体上形成微阵列,通过将荧光素标记的待测DNA和参考DNA与微阵列杂交从而检 测DNA拷贝数变异。Array CGH理论上可检测5至10kb甚至更小的DNA序列,但该方法价 格昂贵且一般并不覆盖全基因组的所有位点。
[0011] 多重连接探针扩增技术,缩写为MLPA,是一种针对待测DNA序列进行定性和半定 量分析的新技术。MLPA技术目前在临床实验室已应用于Y染色体微缺失、22qll. 2染色体 微缺失等的检测,优点是高效、特异、快速、简便,缺点是不适合检测未知的点突变类型。
[0012] PCR方法常用于Y染色体微缺失方面的检测,如Y染色体上与男性生殖相关的AZF 基因,AZFa、AZFb、AZFc等的缺失则多用PCR的方法进行检测。对于已知的染色体微缺失位 点的验证也可以用PCR方法。该方法简便易行,缺点是只能针对已知位点进行检测,且一次 仅能针对几个位点进行检测。
[0013] 虽然,2014年Wells等人报道了采用NGS技术进行染色体CNV检测,实现了全基因 组覆盖,但该技术的分辨率仍然不够高,只能做染色体非整倍体的检测,不能检测出染色体 微缺失/微重复。其采用的算法是均值比较,该算法的缺点是要求DNA片段长,对整个染色 体计算平均值,只能在染色体范围做异倍体分析。
[0014] 综上所述,目前对于染色体微缺失/微重复的检测方法存在的限制因素主要有分 辨率低、不能覆盖全基因组、低通量和高成本。
[0015] 因此亟需开发一种检测试管婴儿技术中胚胎染色体微缺失/微重复的新方法,以 解决现有技术存在的上述不足。
[0016]
【发明内容】
[0017] 本发明的目的是提供一种检测人类胚胎染色体微缺失和微重复的方法,以克服目 前现有技术存在的上述不足。
[0018] 本发明的目的是通过以下技术方案来实现: 一种检测人类胚胎染色体微缺失和微重复的方法,包括以下步骤: 1) 将获自体外培养的囊胚滋养层细胞进行全基因组扩增,将扩增后的基因组DNA分 子随机打断,得到DNA片段,并对得到的DNA片段进行测序,获得测序的读段(reads),读段 (reads)是指测序获得的序列片段; 2) 将步骤1)中测定的DNA序列与人类基因组参考序列进行比对,将所测DNA序列定位 于参考序列上; 3) 筛选参考序列非重复区域,去除参考序列上长度为n并在参考序列其它位置出现完 全一致序列的区域,保留非重复区域; 4) 通过正常样本建立窗口内读段数目矩阵,对预先准备正常样本数据进行分析,统计 步骤3)中非重复区域内各窗口读段数,建立读段数及染色体整倍体的概率矩阵,所述窗口 范围为100_600k ; 5) 根据步骤4)中概率矩阵及预先建立的转移矩阵,计算位点的拷贝数即A/B/C状态, 具体步骤如下: 对于参考序列上的位点b,计算b=l位点的部分概率S (i, 1),S (i, b)表示b位点 到状态i的所有可能中最大的的概率; 计算b>l位点的部分概率,利用b-1位点计算b位点的部分概率为S (i, b)=max( S (j, b-Dajibik),其中ay表示从状态j转移到状态i的概率,bik表示状态i的读 段数为k的概率; 回溯序列,在每一个中间位点和结束位点均有一个部分最优概率S(i,b),记录形成 某个位点最大局部概率的前一个状态,得到所有位点的状态序列; 6) 基于步骤5)中得到的待测样品数据的状态序列,将连续m个位点为A状态选择为微 重复位点,连续m个位点为C状态选择为微缺失位点,所述m值在4以上即为异常; 7) 将所述微缺失位点和/或微重复位点与已有的CNV和疾病数据库进行对照,并进行 基本的基因注释和缺失部分涉及的基因功能分析,标注出微缺失综合征疾病类型。
[0019] 进一步的,所述读段为测序获得的序列片段。
[0020] 进一步的,所述断点为染色体上发生拷贝数变异的分界点。
[0021] 优选的,步骤1)中基因组DNA的获取自胚胎囊胚期,取出的外围滋养层细胞数目 为3-5个。
[0022] 优选的,步骤1)中,DNA分子的随机打断处理可以采用酶切、雾化、超声或物理剪 切法(H