一种基因组重测序分析系统及方法_3

文档序号:9887971阅读:来源:国知局
br>[0086]具体来说,序列比对模块232还用于过滤比对结果中的重复序列,重复序列主要是由于测序PCR产生的,会影响测序深度等比对评估参数,最终导致突变检测的假阳性,比对结果一般以BAM格式(二进制的比对结果存储格式,占用空间小,检索速度快)进行存储,使用Picard的Mark Duplicate模块进行处理去重复,屏蔽PCR-duplicat1n的影响。
[0087]突变检测模块233,用于通过调用所述生物信息学软件库和脚本库,对所述过滤后的基因组重测序数据进行突变检测分析;
[0088]可以理解的是,所述突变检测分析包括单核苷酸多态性检测、插入缺失检测、结构变异检测和拷贝数变异检测。
[0089]进一步的,突变检测模块233,在突变检测分析过程中,还用于对突变所在的基因组位置进行注释,所述基因位置包括基因区、基因间区和非翻译区。
[0090]功能注释模块234,在突变检测分析过程中,用于根据功能注释数据库,对突变基因进行功能注释;
[0091 ]其中,所述功能注释数据库包括G0、C0G\K0G、Pfam、KEGG、NR、SWISS_PR0T。
[0092]综上所述,分析单元23,如图4所示,具体用于:比对,用BWA将测序数据比对到参考基因组上,并用P icard去除比对重复,用samtoo IS统计比对结果;SNP和InDe I检测,基于比对结果,用GATK进行检测,检测前要进行InDel附近重新比对、碱基校正,以降低检测的假阳性;使用break dancer基于成对reads间的距离关系进行SV检测;使用Control-FREEC进行CNV检测;突变基因注释,使用SnpEff进行功能区域注释,使用blast进行基因功能注释。
[0093]本实施例通过调用生物信息学软件和个性化分析脚本库,简化基因组重测序分析流程,提高基因组重测序效率,节省了科研成本。此外,本发明还具有保存基因组重测序分析结果,进行二次查询的功能。
[0094]图3示出了本发明另一实施例提供的一种基因组重测序分析方法的流程示意图,如图3所示,本实施例的一种基因组重测序分析方法,包括:
[0095]S1、接收基因组重测序数据和基因组重测序参数。
[0096]S2、根据所述基因组重测序参数,生成基因组重测序任务信息。
[0097]S3、根据所述基因组重测序任务信息,通过调用生物信息学软件库和脚本库,对所述基因组重测序数据进行分析,获取基因组重测序分析结果。
[0098]其中,所述生物信息学软件库,包括:13¥4、8&1]11:0018、641'1(4;^&1(1、13代&1<:dancer、Control_FREEC、SnpEff和blast;
[0099]所述脚本库,包括:SNP检测脚本、InDel检测脚本、SV检测脚本、CNV检测脚本、功能注释脚本和绘图及统计脚本。
[0100]本实施例通过调用生物信息学软件和个性化分析脚本库,简化基因组重测序分析流程,提高基因组重测序效率,节省了科研成本。此外,本发明还具有保存基因组重测序分析结果,进行二次查询的功能。
[0101]本领域普通技术人员可以理解:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明权利要求所限定的范围。
【主权项】
1.一种基因组重测序分析系统,其特征在于,所述系统包括: Web应用单元,用于接收基因组重测序数据和基因组重测序参数,并将所述基因组重测序参数发送至Java交互单元; Java交互单元,用于根据所述Web应用单元接收的基因组重测序参数,生成基因组重测序任务信息,并将所述基因组重测序任务信息发送至分析单元; 分析单元,用于根据所述Java交互单元生成的基因组重测序任务信息,读取所述基因组重测序数据,并通过调用生物信息学软件库和脚本库,对所述基因组重测序数据进行分析,获取基因组重测序分析结果; 其中,所述生物信息学软件库,包括:BWA、samtools、GATK、picard、break dancer、Control_FREEC、SnpEff和blast; 所述脚本库,包括:SNP检测脚本、InDe I检测脚本、SV检测脚本、CNV检测脚本、功能注释脚本和绘图及统计脚本。2.根据权利要求1所述的系统,其特征在于,所述Java交互单元包括: 任务调度模块,用于根据所述Web应用单元接收的基因组重测序数据和基因组重测序参数,生成基因组重测序任务信息,并将所述基因组重测序任务信息发送至分析单元; 所述任务调度模块,在基因组重测序过程中,还用于实时监测基因组重测序任务的运行状态及进度。3.根据权利要求2所述的系统,其特征在于,所述Java交互单元还包括: 结果推送模块,用于在基因组重测序分析结束时,根据所述任务调度模块发送的展示指令,将所述分析单元获取的基因组重测序分析结果在Web应用单元进行呈现。4.根据权利要求2所述的系统,其特征在于,所述Java交互单元还包括: 数据库交互模块,用于在基因组重测序分析结束时,根据所述任务调度模块发送的存储指令,将所述分析单元获取的基因组重测序分析结果存储至数据库。5.根据权利要求1所述的系统,其特征在于,所述分析单元包括: 数据评估模块,用于对所述基因组重测序数据进行质量检测,并根据质量检测结果,判断所述基因组重测序数据是否可以进行基因组重测序; 其中,所述质量检测包括碱基质量分布检测和碱基类型分布检测。6.根据权利要求5所述的系统,其特征在于,所述分析单元还包括: 序列比对模块,用于将所述数据评估模块评估后的基因组重测序数据与参考基因组分别进行比对率统计、测序深度分布统计、插入片段分布统计,分别得到比对率、基因组覆盖深度、基因组覆盖度; 所述序列比对模块,还用于过滤评估后的基因组重测序数据中的重复序列,得到过滤后的基因组重测序数据。7.根据权利要求6所述的系统,其特征在于,所述分析单元还包括: 突变检测模块,用于通过调用所述生物信息学软件库和脚本库,对所述过滤后的基因组重测序数据进行突变检测分析; 其中所述突变检测分析包括单核苷酸多态性检测、插入缺失检测、结构变异检测和拷贝数变异检测。8.根据权利要求7所述的系统,其特征在于,所述突变检测模块还用于, 在突变检测分析过程中,对突变所在的基因组位置进行注释,所述基因位置包括基因区、基因间区和非翻译区。9.根据权利要求7所述的系统,其特征在于,所述分析单元还包括: 功能注释模块,在突变检测分析过程中,用于根据功能注释数据库,对突变基因进行功能注释; 其中,所述功能注释数据库包括GO、C0G\K0G、Pfam、KEGG、NR、SWISS-PROT。10.一种基因组重测序分析方法,其特征在于,所述方法包括: 接收基因组重测序数据和基因组重测序参数; 根据所述基因组重测序参数,生成基因组重测序任务信息; 根据所述基因组重测序任务信息,通过调用生物信息学软件库和脚本库,对所述基因组重测序数据进行分析,获取基因组重测序分析结果; 其中,所述生物信息学软件库,包括:BWA、samtools、GATK、picard、break dancer、Control_FREEC、SnpEff和blast; 所述脚本库,包括:SNP检测脚本、InDe I检测脚本、SV检测脚本、CNV检测脚本、功能注释脚本和绘图及统计脚本。
【专利摘要】本发明提供了一种基因组重测序分析系统及方法,所述系统包括:Web应用单元,用于接收基因组重测序数据和基因组重测序参数;Java交互单元,用于根据所述Web应用单元接收的基因组重测序参数,生成基因组重测序任务信息;分析单元,用于根据所述Java交互单元生成的基因组重测序任务信息,读取所述基因组重测序数据,并通过调用生物信息学软件库和脚本库,对所述基因组重测序数据进行分析,获取基因组重测序分析结果。本发明通过调用生物信息学软件和个性化分析脚本库,简化基因组重测序分析流程,提高基因组重测序效率,节省了科研成本。此外,本发明还具有保存基因组重测序分析结果,进行二次查询的功能。
【IPC分类】G06F19/18
【公开号】CN105653893
【申请号】
【发明人】郑洪坤, 孔关义, 刘威
【申请人】北京百迈客生物科技有限公司
【公开日】2016年6月8日
【申请日】2015年12月25日
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1