本发明公开了一种多功能转录调控因子ctcf的dna结合位点ctcf_113的应用。
背景技术:
结直肠癌是世界上发病率和死亡率最高的癌症之一,其是由结肠上皮细胞中不断积累的遗传学和表观遗传学改变所导致的;每年大概有1235108人被确诊为结直肠癌,每年死亡人数大概为609051人;世界卫生组织估计到2030年,结直肠癌的确诊病例将会新增77%,死亡病例将会新增80%,随着经济的快速发展,结直肠癌在中国的发病率和死亡人数正在逐年上升,结直肠癌的防治形势非常严峻。
目前大多数结直肠癌是从腺瘤发展而来的,而且从腺瘤转变为恶性肿瘤的时间大约是10-15年,也就是说在转变为恶性肿瘤之前,我们有10-15年的时间来发现并切除腺瘤从而阻止其恶变。目前,最有效的降低结直肠癌发病率和死亡率的方法就是结直肠癌的早期诊断;因为在结直肠癌早期,病人并没有明显的临床症状,这就导致很多病人在被确诊的时候,已经处于结直肠癌的晚期了,但是在发病初期就对病人进行治疗才是最有效的;通过早期诊断可以在发生癌变前就发现结直肠的病变或者在癌变的早期就发现病情,然后尽可能早的对病人进行有效而系统的治疗,从而有效的降低结直肠癌的发病率和死亡率;早期诊断主要针对的是大量的无症状人群,所以一个理想的早期诊断技术应该是操作简单、成本较低、对病人无创伤以及特异性和敏感性都较高的检测方法。当前临床上应用的最准确的结直肠癌早期诊断方法是结肠镜检查,其缺点是检查费用较高、操作程序较复杂以及病人比较排斥,并不适合在普通人群中大规模推广应用。另一个临床上常用的方法是粪便隐血检查,该方法虽然费用较低,操作起来也比较简单,但是它最大的缺点就是敏感性和特异性不高。
表观遗传学分析发现所有的结直肠癌都有几百到几千个基因发生了异常的dna甲基化,其中一部分基因的异常甲基化与结直肠癌的发病是密切相关的;目前,基于血液的结直肠癌早期诊断方法最有效的就是以sept9基因启动子区的dna甲基化作为生物标记,用该方法对结直肠癌进行早期诊断,可以得到90%的敏感度和88%的特异性,但是该方法对于腺瘤的敏感度和特异性都很低;另外用该方法对50岁以上的无临床症状人群(7941人)进行早期结直肠癌筛查的研究结果显示,虽然特异性能够达到91.5%,但是对于ⅰ-ⅳ结直肠癌的敏感度分别只有35%、63%、46%和77.4%。对于腺瘤的敏感度更是只有11.2%;基于粪便的结直肠癌早期诊断方法最成功的应该是以4个基因(bmp3,ndrg4,vimentin和tfpi2)启动子区的dna甲基化作为生物标记,并同时检测粪便dna中kras基因的突变和粪便中血红蛋白的含量,该方法在特异性为90%的前提下,对于结直肠癌的敏感度为85%,对大于1cm的腺瘤的敏感度为54%;无论是基于血液的方法还是基于粪便的方法,目前都还没有一个特别理想的诊断技术适合在临床上广泛推广应用。
值得注意的是,此前的研究基本都是将特定基因启动子区的dna甲基化作为结直肠癌早期诊断的生物标记,很少有人将关注的目光放在启动子区以外的转录调控区域。基因的启动子就像“开关”,决定基因的活动,控制基因转录的起始时间和表达的程度。但是启动子区以外的转录调控区域同样也会影响基因的转录,很多情况下也会决定基因转录的起始时间和表达的程度,基因启动子区以外的转录调控区域也应该受到同样的关注。
ctcf是一种广泛存在于真核生物中的多功能转录因子,为进化上高度保守的多锌指、dna结合核蛋白。ctcf通过其锌指结构的不同组合,可以选择性识别多种dna序列,并形成不同的ctcf-dna复合体,发挥对基因的表达调控作用,具有启动子抑制和激活、基因沉默、增强子阻断、基因印迹调控、x染色体失活等多种生物学功能。ctcf的dna结合位点在人类基因组是中普遍存在的,大概有5-6万个,每个位点识别大约34个核苷酸;目前还未见将多功能转录调控因子ctcf的dna结合位点作为结直肠肿瘤早期诊断的生物标记的报道。
技术实现要素:
本发明目的在于提供一种多功能转录调控因子ctcf的dna结合位点ctcf_113的新用途,即多功能转录调控因子ctcf的dna结合位点ctcf_113在制备用于结直肠肿瘤早期诊断、筛查和患病风险预测试剂盒中的应用,该结合位点的核苷酸序列如seqidno:1所示。
本发明所述检测试剂盒包括常规基因组dna提取试剂、甲基化dna的亚硫酸氢盐处理试剂、进行dna甲基化检测所需的试剂以及引物对,该引物对能够扩增经亚硫酸氢盐转化过的甲基化或未甲基化的seqidno:1所示序列并对所扩增的序列用dna质谱法进行后续的dna甲基化检测。该结合位点ctcf_113在结直肠肿瘤细胞中表现出高甲基化状态,而在正常组织中处于低甲基化状态。
所述引物对序列如seqidno:2和seqidno:3所示。
本申请首次将多功能转录调控因子-ctcf的dna结合位点作为结直肠肿瘤早期诊断的生物标记。首先,通过分析已发表的ctcf在人类基因组中的dna结合位点数据,并结合已发表的人类基因组dna甲基化数据,我们共筛选出了121个位点的ctcf结合模式与dna甲基化状态存在显著相关性,即这些位点dna甲基化程度的高低与ctcf结合的多少存在负相关。这121个ctcf结合位点就属于在肿瘤细胞系中特异性的,并且其结合模式与dna甲基化状态存在显著相关性。第二步,通过高分辨率溶解曲线法(hrm)在33个结直肠肿瘤组织样本及其对应的正常样本中检测了这121个位点的dna甲基化水平,从中筛选出了23个甲基化模式具有肿瘤特异性的位点。由于hrm法在检测dna甲基化应用中不能进行准确的定量分析,所以也就不能进一步比较所筛选出的23个位点优劣,所以后续的dna甲基化检测都是用dna质谱法完成的;第三步,通过dna质谱法在20个结直肠肿瘤组织样本及其对应的正常样本中检测了23个位点的dna甲基化水平,根据这23个位点在区分肿瘤组织和正常组织上的表现,从中筛选出了10个表现最好的位点通过扩大样本作进一步筛选。第四步,通过dna质谱法在70个结直肠肿瘤组织样本及20个正常样本中检测了10个位点的dna甲基化水平,根据这10个位点在区分肿瘤组织和正常组织上的表现,选择了5个表现最好的位点在大样本中进行验证。第五步,通过dna质谱法在295个结直肠肿瘤组织样本及84个正常样本中检测了5个位点的dna甲基化水平,最终筛选并鉴定出了本申请用于结直肠肿瘤早期诊断分子标记的ctcf结合位点。该位点在结直肠肿瘤细胞中表现出高甲基化状态,而在正常组织中处于低甲基化状态,提示ctcf结合位点ctcf_113的dna甲基化是结直肠肿瘤早期诊断的分子标记。
该结合位点表现出了很高的准确性。在特异性为95%的前提下,它在检测腺瘤、ⅰ期结直肠癌、ⅱ期结直肠癌、ⅲ期结直肠癌和所有结直肠肿瘤中的敏感度分别为82.62%、92.92%、89.19%、89.36%和85.17%。也就是说,ctcf_113检测ⅰ期结直肠肿瘤的准确性最高(特异性为95%的前提下敏感度为92.92%)。而且,在特异性为95%的前提下,它在检测腺瘤、ⅰ期结直肠癌、ⅱ期结直肠癌、ⅲ期结直肠癌和所有结直肠肿瘤中的敏感度都大于82%,说明这个位点对于所有结直肠肿瘤的早期诊断都具有很高的准确性。
另外,当本申请提供的多功能转录调控因子ctcf的dna结合位点ctcf_113与另外4个ctcf的dna结合位点组成一组用于结直肠肿瘤早期诊断的分子标记,并以5个位点中任意2个或2个以上为阳性作为肿瘤阳性的判断标准时,可以得到最优的特异性和敏感度(分别为94.05%和93.54%),特别是对于腺瘤检测的特异性和敏感度分别达到94.05%和91.67%。
即本发明另一目的是将多功能转录调控因子ctcf的dna结合位点ctcf_113与下述4个ctcf的dna结合位点中任意一个或几个应用在制备用于结直肠肿瘤早期诊断试剂盒中;
(1)核苷酸序列如seqidno:4所示的ctcfdna结合位点;
(2)核苷酸序列如seqidno:5所示的ctcfdna结合位点;
(3)核苷酸序列如seqidno:6所示的ctcfdna结合位点;
(4)核苷酸序列如seqidno:7所示的ctcfdna结合位点。
虽然bmp3和ndrg4是已报道的结直肠肿瘤早期诊断的分子标记中表现最好的,但是我们通过dna质谱法在62个结直肠肿瘤组织样本及58个正常样本中检测了bmp3和ndrg4以及ctcf_113的dna甲基化水平,结果显示,在特异性为90%的前提下,ctcf_113的敏感度为86.72%,而bmp3和ndrg4的敏感度分别为48.56%和69.56%。也就是说,本申请提供的结直肠肿瘤早期诊断的分子标记ctcf_113的检测准确性要远远高于已报道的分子标记。
本发明的优点和技术效果如下:
本发明提供的ctcf结合位点无论是检测结直肠腺瘤还是结直肠癌的准确性都要显著高于已报道的dna甲基化分子标记;本申请不仅仅提供了一种更为有效的的结直肠肿瘤早期诊断技术,对于建立其它肿瘤的早期诊断技术也具有借鉴意义,而且ctcf的dna结合位点还有可能成为肿瘤治疗效果监测和预后效果评估以及肿瘤分子分型(如cimp分型)的生物标记。总之,本研究为寻找更为有效的肿瘤早期诊断、治疗效果监测、预后效果评估以及分子分型的分子标记提供了新的思路,对肿瘤的预防和治疗都具有重要意义。
附图说明
图1是23个具有肿瘤特异性的ctcf结合位点在40个样本中的dna质谱结果分层聚类图;图中列代表的是样本,行代表的是ctcf的dna结合位点。
具体实施方式
下面通过附图和实施例对本发明作进一步详细说明,但本发明保护范围不局限于所述内容,实施例中方法如无特殊说明均为常规方法,使用的试剂如无特殊说明均为常规市售试剂或按常规方法配制的试剂。
实施例1:多功能转录调控因子ctcf的dna结合位点的筛选
1、样本收集
收集昆明医科大学第一附属医院2014年4月至2016年8月结直肠癌患者的新鲜肿瘤组织187例及其对应的正常组织(距离肿瘤边缘6cm以上)84例;在肠镜室收集了新鲜腺瘤组织108例。所有样本共计379例,其中正常组织84例,肿瘤组织295例;上述样本临床资料情况如表1所示:
表1样本信息表
2、基因组dna提取和亚硫酸氢盐转化
基因组dna的提取使用的是qiagen公司的qiaampdnaminikit(货号51304)试剂盒,所有操作都是根据试剂盒的说明书来完成的。亚硫酸氢盐转化使用的是qiagen公司的epitectfastdnabisulfitekit(货号59826)试剂盒,所有操作都是根据试剂盒的说明书来完成的。
3、候选ctcf结合位点的筛选
wang等人通过分析19种人类细胞系(包括7种肿瘤细胞系和12种正常细胞系)中ctcf的chip-seq数据,共发现了1236个位点的结合模式是肿瘤细胞系特异的,这些特异性的ctcf结合位点可以将7种肿瘤细胞系与12种正常细胞系区分开。结合已发表的13种细胞系(包括6种肿瘤细胞系和7种正常细胞系)中ctcf结合位点的dna甲基化数据,我们在这1236个肿瘤细胞系特异的ctcf结合位点中共发现121个位点的ctcf结合模式与dna甲基化状态存在显著相关性,即这些位点的dna甲基化程度越高,ctcf的结合就越少。这121个ctcf结合位点就属于在肿瘤细胞系中特异性的,并且其结合模式与dna甲基化状态存在显著相关性的ctcf结合位点。我们根据这121个ctcf结合位点的基因组坐标从ucsc数据库中下载了这121个位点的参考序列,然后设计用hrm法进行dna甲基化检测的pcr引物。
4、高分辨率溶解曲线法(hrm)进行dna甲基化分析
本实施例首先用hrm法在66个样本(33个肿瘤组织样本及其对应的正常组织样本,其中33个肿瘤组织包括6个腺瘤,9个i期肿瘤,10个ii期肿瘤和8个iii期肿瘤)中对121个ctcf结合位点的dna甲基化状态进行分析,以期找出dna甲基化状态在肿瘤组织中具有特异性的ctcf结合位点,也就是那些dna甲基化状态能够将正常组织和肿瘤组织区分开的位点。首先,我们下载了所筛选出的121个ctcf结合位点的基因组序列(每个结合位点是135bp),同时根据在线的ctcf结合位点数据库ctcfbsdb2.0(http://insµlatordb.uthsc.edu/)预测每条序列上ctcf最可能的结合位置,然后根据预测出的ctcf结合位置设计出每个ctcf结合位点的hrm引物,hrm引物的扩增区域必须包含ctcf的结合位置。pcr扩增和hrm分析所使用的仪器是abisteponeplusreal-timepcr系统(appliedbiosystems,usa)。所使用的试剂是abi公司的meltdoctor™hrmmastermix(appliedbiosystems,usa);所有操作都是根据生产商的使用说明来完成;hrmpcr反应体系和扩增程序如表2和表3所示:
表2hrmpcr扩增反应体系
表3hrmpcr扩增和分析程序
每次实验都会用已知甲基化比例的标准品(epitectcontroldna,qiagen公司)做一个标准曲线来判断肿瘤样本和正常样本的甲基化水平;所得到的hrm数据使用abi公司的high-resolutionmeltingsoftware(appliedbiosystems,usa)软件进行分析。
所检测的121个ctcf结合位点中,共发现23个位点的dna甲基化状态具有较好的肿瘤特异性(见表4,表中n代表不具有肿瘤特异性,空格代表具有肿瘤特异性),其中16个位点的甲基化模式为肿瘤组织中的甲基化水平显著高于正常组织(表4,t>n),7个位点的甲基化模式为肿瘤组织中的甲基化水平显著低于正常组织(表4,t<n),23个位点在33个肿瘤患者中的肿瘤特异性为64%-94%。
表4hrm筛选结果统计表
5、dna质谱进行dna甲基化分析
为了进一步验证由hrm法所筛选出来的23个ctcf结合位点在肿瘤组织中的特异性,并准确定量每个ctcf结合位点中不同cpg位点的甲基化比例以及每个cpg位点在肿瘤组织和正常组织中dna甲基化水平的具体差异,从而找出最适合作为结直肠肿瘤早期诊断的ctcf结合位点,我们首先在40个样本中(20个肿瘤组织样本及其对应的正常组织样本,其中20个肿瘤组织包括7个腺瘤、6个ⅰ期肿瘤和7个ⅱ期肿瘤)用sequenommassarrayepityper平台的dna质谱方法检测了由hrm方法所筛选出的23个在肿瘤组织中具有特异性的ctcf结合位点的dna甲基化水平。所用的引物是用sequenom公司的在线引物设计软件sequenomepidesigner所设计的,每条反向引物都包含t7rna聚合酶的启动子序列。质谱dna甲基化检测采用的是碱基特异的剪切和质谱分析相结合来检测包含一个或者多个cpg位点的dna片段的甲基化水平。
具体操作步骤简述如下:
步骤1、使用亚硫酸氢盐,将样本dna中没有甲基化的c全部转化为u(相当于dna中的t);
步骤2、使用特殊设计的一对引物扩增经亚硫酸氢盐转化过的dna样本,得到带有t7rna聚合酶启动子序列的扩增产物;
步骤3、在体外转录体系中,利用t7rna聚合酶,将扩增产物转录为rna片断;
步骤4、在步骤3的体系中,利用rnasea能够特异性识别并切割rna中u3’端的特性,将rna片断切割成携带有cpg位点的小片断(cpg单元);
步骤5、使用sequenommassarrayepityper平台的飞行质谱分析系统检测步骤4的产物;由于同一片断中,只有cpg和cpa之间16da的分子量差别,即质谱图中两者峰的差距;所得到的甲基化质谱数据使用sequenom公司的typer4.0软件进行分析,从而得到目标dna片段中每个cpg单元的甲基化百分比。对于包含多个cpg单元的ctcf结合位点,我们将选择统计分析中auc值最高的cpg单元的甲基化百分比作为该位点的甲基化百分比。
为了保证数据的可靠性,所有数据都经过了严格的质控选择。简单地说,如果一个cpg分析单元有大于30%的样本没有被成功检测,这个cpg分析单元的数据将会被排除。如果一个样本的一个ctcf结合位点中有大于30%的cpg位点没有被成功检测,这个样本的在该ctcf结合位点的数据也将会被排除。
dna质谱的检测结果显示,在23个ctcf结合位点中,其中16个位点的甲基化模式为肿瘤组织中的甲基化水平显著高于正常组织,7个位点的甲基化模式为肿瘤组织中的甲基化水平显著低于正常组织,这个结果与hrm检测结果一致,进一步验证了用hrm法检测dna甲基化的可靠性。
为了判断这23个肿瘤特异性的ctcf结合位点能否将肿瘤组织和正常组织区分开,本研究用这23个位点在40个样本中的甲基化百分比做了分层聚类分析(图1)。从图中可以看出,40个样本通过分层聚类聚为了两枝:n和t。n枝包含22个样本,其中20个为正常组织(91%),2个为肿瘤组织(9%);t枝包含18个样本,全部都是肿瘤组织(100%);也就是说根据这23个ctcf结合位点的甲基化状态可以很好的将肿瘤组织和正常组织区分开。
为了区分这23个ctcf结合位点在区分肿瘤组织和正常组织中的表现,进一步筛选出最适合作为结直肠肿瘤早期诊断分子标记的位点,我们分析了每个位点在区分肿瘤组织和正常组织上的贡献(表5)。由下表可以看出,23个位点中,有19个位点的auc>0.8,说明这些位点在区分肿瘤组织和正常组织中的表现都很好。综合考虑这23个位点的auc值,以及它们的甲基化百分比在肿瘤组织和正常组织之间的差异大小,我们从中选择了10个位点在后续实验中作进一步筛选(下表中用粗体标出的位点)。
表523个ctcf结合位点的检测准确性比较
实施例2:扩大样本量对10个位点做进一步筛选
为了提高所筛选出的分子标记在检测结直肠腺瘤上的特异性和敏感度,我们又增加了50个结直肠腺瘤样本对实施例1所筛选出的10个ctcf结合位点做进一步筛选;加上实施例1中40个样本的质谱数据,这一步筛选总共包含90个样本,其中20个为正常对照、57个为腺瘤、6个为ⅰ期肿瘤和7个为ⅱ期肿瘤。表6显示了这10个ctcf结合位点在区分肿瘤组织和正常组织中的表现。从表6可以看出,这10个ctcf结合位点都具有很强的区分肿瘤组织和正常组织的能力(auc≥0.85)。在特异性为95%的前提下,它们的敏感度在44.64%-88.89%之间。我们的目标是建立一种在保证检测准确性的前提下包含尽可能少的分子标记的结直肠肿瘤早期诊断技术,因为只有这样才能保证检测的经济性和准确性。因此,根据这10个位点在区分肿瘤组织和正常组织中的表现(表6中的auc值),我们选择了5个区分能力最强的ctcf结合位点作为最优的分子标记(表6中粗体表示的位点),下一步我们将在大样本中验证这5个分子标记在对结直肠肿瘤进行早期诊断中的准确性。这5个位点中,有4个位点的甲基化模式为肿瘤组织中的甲基化水平显著高于正常组织。每个位点都具有很强的区分肿瘤组织和正常组织的能力(auc≥0.916),在特异性为95%的前提下,它们的敏感度在73.08%-88.89%之间。其中,ctcf_113是本申请要保护的结合位点,其核苷酸序列如seqidno:1所示。
表610个ctcf结合位点的检测准确性比较
实施例3:在大样本中验证本申请的ctcf结合位点ctcf_113的检测准确性
为了验证本申请要保护的结合位点ctcf_113的检测准确性,我们选取了379例结直肠样本(表1),其中正常样本84例,肿瘤样本295例(腺瘤108例,ⅰ期肿瘤39例,ⅱ期肿瘤101例和ⅲ期肿瘤47例),继续用dna质谱法检测了该结合位点在379例结直肠样本中的dna甲基化水平,检测方法同实施例1中“dna质谱进行dna甲基化分析”内容相同,采用如seqidno:2和seqidno:3所示的引物对。
根据dna质谱检测结果,我们分别统计分析了ctcf_113在检测腺瘤、ⅰ期肿瘤、ⅱ期肿瘤、ⅲ期肿瘤和所有肿瘤的auc值和特异性为95%时的敏感度。结果显示,无论是检测腺瘤、ⅰ期肿瘤、ⅱ期肿瘤、ⅲ期肿瘤还是所有肿瘤,ctcf_113都具有很强的区分肿瘤组织和正常组织的能力(auc值分别为0.92、0.99、0.96、0.95和0.93),而且所有分析都具有显著统计学意义(p<0.0001)。在特异性为95%的前提下,ctcf_113检测腺瘤、ⅰ期肿瘤、ⅱ期肿瘤、ⅲ期肿瘤和所有肿瘤的敏感度分别为82.62%、92.92%、89.19%、89.36%和85.17%。也就是说,ctcf_113检测ⅰ期结直肠肿瘤的准确性最高(特异性为95%的前提下敏感度为92.92%)。而且,在特异性为95%的前提下,它在检测腺瘤、ⅰ期结直肠癌、ⅱ期结直肠癌、ⅲ期结直肠癌和所有结直肠肿瘤中的敏感度都大于82%,说明这个位点对于所有结直肠肿瘤的早期诊断都具有很高的准确性。
实施例4:本申请的ctcf结合位点ctcf_113与其他ctcf结合位点联合使用的检测准确性
为了确定通过实施例1和实施例2所筛选出的5个最优ctcf结合位点联合使用是否能够提高检测准确性,我们同时在大样本中用dna质谱法检测了ctcf_13、ctcf_33、ctcf_55和ctcf_94的dna甲基化水平。所用的样本和检测方法同实施例3。
我们分别将5个位点中任意1个或1个以上、任意2个或2个以上、任意3个或3个以上、任意4个或4个以上或者全部5个位点为阳性作为肿瘤阳性的判断标准,并分别分析了它们检测腺瘤、ⅰ期肿瘤、ⅱ期肿瘤、ⅲ期肿瘤和所有肿瘤的特异性和敏感度,最终发现当以5个位点中任意2个或2个以上为阳性作为肿瘤阳性的判断标准时,可以显著提高检测准确性(表7)。在特异性为94.05%时,检测腺瘤、ⅰ期肿瘤、ⅱ期肿瘤、ⅲ期肿瘤和所有肿瘤的敏感度分别为91.67%、97.44%、94.06%、93.62%和93.54%。
表7ctcf_113与其他4个ctcf结合位点联合使用的检测准确性
实施例5:本申请的ctcf结合位点ctcf_113与已报道的分子标记的检测准确性比较
为了比较本申请的ctcf结合位点ctcf_113与已报道的最优分子标记bmp3和ndrg4的检测准确性,本实施例在120例样本中检测了ctcf_113以及bmp3和ndrg4的启动子区dna甲基化水平。这120例样本包括58个正常组织、46个腺瘤、4个i期肿瘤、8个ii期肿瘤和4个iii期肿瘤。根据检测结果,我们分别计算出ctcf_113、bmp3和ndrg4的auc以及特异性为90%时的敏感度(表8)。由表8可以看出,本申请的ctcf结合位点ctcf_113在特异性为90%时的敏感度为86.72%,而bmp3和ndrg4在特异性为90%时的敏感度分别为48.56%和69.56%。也就是说,本申请的ctcf结合位点ctcf_113在检测中国人群结直肠肿瘤上的准确性要显著高于已报道的最优分子标记bmp3和ndrg4;
表8ctcf结合位点ctcf_113与已报道最优分子标记的准确性比较
序列表
<110>昆明医科大学第一附属医院
<120>多功能转录调控因子ctcf的dna结合位点ctcf_113的应用
<160>7
<170>patentinversion3.5
<210>1
<211>296
<212>dna
<213>人
<400>1
gcccagaggagaaaggaacctctgcctcgaatttccccactgcgccgggcgctgcggaga60
gcggcgagggtgggcgcgaggcggagaacgcgatgaatgagttctcccctcgcctcggag120
ttgtctgagttggcggcgctgcgcccaggcttccggctctcagcgccccacgcgcgcgtg180
gctccccgggctgccacccacgcccgcggccggggccgagccagccacgcagggcagccg240
aggctccggagctcctgtcccggccccagtccgggtaaaaggagggttgtccccag296
<210>2
<211>34
<212>dna
<213>人工序列
<400>2
aggaagagaggtttagaggagaaaggaatttttg34
<210>3
<211>55
<212>dna
<213>人工序列
<400>3
cagtaatacgactcactatagggagaaggctctaaaaacaaccctccttttaccc55
<210>4
<211>180
<212>dna
<213>人
<400>4
gattgtccttgagatgggactgcaatagaaatccgggcagcccgaagaggcacccagcgc60
tccagccaccagctgggccgcccgggagtccctggctctagaccagccgcgaggaggcgc120
cgcgagagagctggtccctgcccgcggccggaggagggctagagcccctgggccagcccc180
<210>5
<211>232
<212>dna
<213>人
<400>5
ttgtctggctcctggccctgggcgtggcgcgcgtggcgctggcgagggtcccggcagggg60
gcgctactgctcggtcagtgagagcctcaggatgcgctccagctcctcctcctcctggcg120
cgcgcgccgccgcctctcctcctgctcctgcgccgacagttccatcgccagccgcagctg180
ctcgtcgtagctccggaacacgtggccgccggaacctggccctgagctgggc232
<210>6
<211>227
<212>dna
<213>人
<400>6
aactgacaaaggatgggagaatgcccgcgccccgggatgccggccgcacgcagcctggcg60
gccgcctgagctacttcaccctccgccggtaagtgactgcaaacatcattcattcaatca120
gcctcactgggagccccttctctccggctggtagtcctgggcggcttgtccctgatcccg180
agcggggcttggcacagcatcagccctggagggcaggcagcaggtgc227
<210>7
<211>156
<212>dna
<213>人
<400>7
ttgaggccagggctcttacctagagcatttgtagttcccagcccggagaagggttctcag60
aagcgaaaattccactgaagacaggttaagtggaagaggcatctttgaacagctgtagga120
ctgggtgctgggctggtagaatgacagcagattcag156