检测的突变范围包括点突变和小片段插入缺失。 本发明的基于二代测序的矮小症基因检测方法,通过对测序检出的异常变异进行分析解 读,明确受检者的致病突变,实现对矮小症疾病的准确诊断、针对性的治疗以及防止疾病在 家族中复发。
[0018] 依据本发明的又一方面,提供一种检测矮小相关基因的装置,该装置能够用以执 行实现前述本发明的方法的部分活全部步骤,该装置包括:A.核酸获取单元,用于获取受 检者的核酸,所述核酸为基因组核酸和/或游离核酸片段;B.捕获单元,与A单元相连,用 于捕获来自A单元中的核酸,以获得矮小相关基因区域;C.序列测定单元,与B单元相连, 用于对来自B单元的矮小相关基因区域进行序列测定,以获得序列信息;D.检测单元,与C 单元相连,用于基于来自C单元的序列信息检测所述矮小相关基因;其中,B单元中的捕获 是利用前述本发明一方面的以及各个实施方式中的任一芯片进行的。图1是本发明的一个 实施例中的装置结构示意图。对本发明的方法的优点及技术特征的描述,同样适用本发明 的装置,而且,本领域人员可以理解,本发明的装置中的全部或部分单元,可选择的、可拆卸 的包含一个或多个子单元以执行或实现前述本发明方法的各个【具体实施方式】。
【附图说明】
[0019] 本发明的上述和/或附加的方面和优点从结合下面附图对实施方式的描述中将 变得明显和容易理解,其中 :
[0020] 图1是本发明的一个【具体实施方式】中的检测矮小相关基因的装置的示意图;
[0021] 图2是本发明的一个【具体实施方式】中的检测矮小相关基因的流程图。
【具体实施方式】
[0022] 本申请描述中的基因名称均采用NCBI-Gene里的官方命名(Official Symbol)。另 外,描述中出现的错义突变(missense)是指,编码某种氨基酸的密码子经碱基替换以后, 变成编码另一种氨基酸的密码子,从而使多肽链的氨基酸种类和序列发生改变。某些错义 突变能使多肽链丧失原有功能,许多蛋白质的异常就是由错义突变引起的。
[0023] 依据一般方法,实现本发明的方法主要包括矮小相关基因检测芯片的设计,目标 区域捕获测序技术以及分析流程的开发。
[0024] (1)矮小症基因检测芯片设计
[0025] 染色体变异与单基因都可以导致矮小症,染色体变异又包括染色体数目、结构的 改变,单亲二倍体与嵌合现象也可以导致矮小症。以下仅示例利用本发明方法检测单基因 以及部分染色体的微缺失与微重复导致的身材矮小。通过对0M頂数据库以及相关文献的 查找,获得438个单基因导致的471种与矮小症相关的单基因疾病,选取了 25个基因作为 染色体微缺失微重复的marker来标记17种由染色体的微缺失微重复导致的矮小症。其中, 53个基因的SNP变异可导致53种与矮小症相关的代谢系统疾病,44个基因中发生的SNP 可导致47种与矮小症相关的内分泌系统疾病,115个基因的SNP可导致124种与矮小症相 关的骨骼系统疾病,17个基因的SNP可导致17种与矮小症相关的皮肤疾病,36个基因可导 致36种与矮小症相关的神经肌肉系统疾病,19个基因可导致19种与矮小症相关的血液系 统疾病,11个基因可导致11种与矮小症相关的耳、鼻、喉五官系统疾病,6个基因可导致6 种与矮小症相关的免疫系统疾病,5个基因可导致5种与矮小症相关的消化系统疾病,以及 146个基因可导致153种与矮小症相关的其它综合征。在这些基因中会出现1个基因导致 多种疾病,这样,选取的基因共计463个,所对应488种疾病,具体如表1所示,表1中粗体 显示的基因表示与多类疾病相关的基因,表2显示基因数目与对应的疾病数目信息。
[0026] 根据人类基因组HG19,选取上述463个基因的外显子序列以及侧翼±30bp区域 进行探针芯片设计,可以这样设计探针序列:从hgl9上获取上述463个基因的外显子序 列以及侧翼±30bp区域的各段参考序列,对每一段参考序列,都从一段参考序列的一端 开始,依次拷贝预定长度的参考序列获得探针序列,使得最后总的探针能够覆盖该段参考 序列至少一次,相邻探针序列之间可以重叠或不重叠,这边,预定长度为探针的长度,可为 50-250nt,接着按照合成仪说明书或者委托厂家合成探针制备芯片。获得的芯片大小约为 2. 5M,该芯片上覆盖了丰富的捕获探针,探针覆盖区域达98. 83%,可以从复杂的基因组中 富集目标DNA片段,在同一张芯片上以高特异性和高覆盖率捕获约为2. 5M的基因组区域。
[0027] 表 1
[0028]
[0029]
[0030]
[0033] (2)目标区域捕获测序及分析流程
[0034] 如图2试验及分析流程所示,从受检者全血中提取基因组DNA,并将检测合格 的DNA同时进行SNP质谱检测和文库制备。文库制备是将lyg基因组DNA打断成主带 为200-300bp小片段DNA,然后将打断后DNA片段进行末端补平,在3'端加碱基"A",使 得DNA片段能与3'端带有"T"碱基的特殊接头连接,经Non-Captured PCR(未捕获前 扩增)构建完成的文库,通过矮小症基因检测芯片将选取的特定基因的Exon及及侧翼 ±30bp区域进行富集,再通过PCR扩增富集后产物,最后通过杂交前后PCR产物QPCR检 测获得序列捕获杂交效率。QPCR检测合格后,将一定数量的文库进行上机测序,例如利用 Hiseq2000/2500,对下机数据进行质控,然后对数据进行分析和解读。其中,文库制备一个 样品周期为5-7天。信息分析采用自主开发的信息分析流程进行数据处理,分析流程包含 的未特别交待的软件、脚本等可通过深圳华大基因公开的网页或数据库来获取,或者定制 深圳华大基因的服务来进行该数据处理,数据处理主要包括过滤、比对、去重复、重比对、质 控、SNV(SNP)+INDEL检测、注释等步骤。注释结果的解读,主要基于HGMD、BGI Gap以及各 大耳聋致病突变数据库及文献搜索查阅进行,同时结合多个功能预测软件结果及受检者临 床表征进行综合解读,基本规则参考美国医学遗传学和基因组学学院(American College of Medical Genetics and Genomics,ACMG)相关指南进行。
[0035] 传统的矮小症基因检测方法依赖临床医生的精确诊断,通过对候选基因的Sanger 验证来探寻患者的致病原因。若候选基因的Sanger验证为阴性,需要重新对临床表征进行 评估来寻找新的候选基因,浪费大量的时间和成本。示例的本发明的方法基于二代测序技 术的矮小症基因检测可以灵活挑选基因集,而且性价比更高、针对性更强,适合大规模的临 床基因检测服务。本方法提供的矮小症基因检测基本上涵盖了目前已报道的单基因导致的 矮小症,可以对受检者进行准确诊断、针对性的治疗以及防止疾病在家族中复发。而且,随 着矮小症新相关基因的发现,此芯片可以不断地升级,加入新的基因,从而不断提升矮小症 芯片的检出率。
[0036] 以下结合具体个体样本对依据本发明的具体检测方法的运行结果进行详细的描 述。下面示例,仅用于解释本发明,而不能理解为对本发明的限制。在本发明的描述中,除 非另有说明,"多个"的含义是两个或两个以上。
[0037] 除另有交待,以下实施例中涉及的未特别交待的试剂、序列(接头、标签和引物)、 软件及仪器,都是常规市售产品或者公开的,比如购自Illumina公司的hi Seq2000测序平 台建库相关试剂盒来进行文库构建等。
[0038] 实施例
[0039] 对1例非匀称性矮小,骨骼异常(先天性脊椎后凸、四肢短小),面部特征异常,先 天性肝动脉门静脉瘘,先天性脑积水的患者进行检测,患者来自天津残疾人联合会。该患者 在临床上无法确诊为哪种疾病,经过上述结合矮小症相关基因芯片新一代目标区域捕获测 序(NGS Panel)检测后,发现在与软骨发育不良的FGFR3基因上发现了一个热点有害突变 c. 1138G>A (p. Gly380Arg),最终患者确诊为软骨发育不良。
[0040] 用盐析法提取标本DNA,大片段DNA进行超声打断,目前使用样品打断方法为 Covaris打断法,将样品DNA打碎至100-700bp范围的片段。(注:打断效果一般以所要求 制备文库Insert片段主带位置在200-250bp位置较为理想,若打断效果不理想则需要进行 重新打断。)
[0041] 1.文库制备
[0042] 1. 1末端修复和纯化
[00431
[0044] 将配置好的mix震荡混匀后,每个反应加入25μ L酶反应混合液。反应条件:20°C, 30min〇
[0045] 使用180 μ L Ampure Beads进行产物纯化,回收的DNA溶于30yL(其中1.9yL 为损耗)的水中。
[0046] 1. 2 末端加 "A"(A-Tailing)
[0047]
[0048] 将配置好的mix震荡混匀后,每管加入6. 9 μ L酶反应混合液。反应条件:20°C, 30min。需要说明的是,末端加"A"后可以不用纯化。
[0049] 1. 3Adapter的连接和纯化
[0050]
[0051] 将配置好的mix震荡混匀,每个反应加入15 μ L酶反应混合液。反应条件:16°C, 12-16h(过夜)。使用75yL Ampure Beads进行产物纯化,回收的DNA溶于35yL(其中 2μ L为损耗)的水中。
[0052] 1. 4Non_Captured 样品 Pre-LM-PCR
[0053]
[0054] PCR 程序:
[0055] 94°C 2min ;
[0056] 94〇C 15s, 62〇C 30s,72〇C 30s,4cycles ;
[0057] 72 °C 5min ;
[0058] 4°C forever
[0059] 2.芯片杂交,目标区域捕获富集
[0060] 本实验中参照NimbleGen使用说明书进行杂交洗脱,获取目的基因并PCR富集。
[0061] 3.上机测序
[0062] 本实验采用hiseq2000或hiseq2500PE101+8+101程序进行上机测序。
[0063] 4.信息分析
[0064] 4. 1从测序仪获取原始数据(FASTQ数据)。
[0065] 4. 2过滤:对原始FASTQ数据进行质量控制,去除常规所说的低质量值数据。
[0066] 4. 3比对:利用SOAP软件及其默认参数设置,使用Hgl9参考序列进行比对,并行 化处理任务。
[0067] 4. 4去重复:基于Picard的read去重复算法,并行化地从比对结果中找出重复 reads并以SAM/BAM文件的tag方式进行标记。
[0068] 4. 5重比对:使用