不同品种猪背最长肌差异表达基因的筛选与注释方法

文档序号:8319450阅读:479来源:国知局
不同品种猪背最长肌差异表达基因的筛选与注释方法
【技术领域】
[0001] 本发明涉及一种不同品种猪背最长肌差异表达基因的筛选与注释方法。
【背景技术】
[0002] 猪肉是人类动物蛋白的主要来源,我国是目前世界上生猪生产和猪肉消费的第一 大国。改善肉品质已经成为猪肉产业及满足消费者口感、健康和营养需求的关键因素。骨 骼肌是动物体内最丰富的组织,约占动物体重的40%,猪肌肉生长发育的差异是引起不同 品种猪肉质差异的重要原因。由于肉质性状形成的复杂性及不能(或不易)活体测定,传 统的选育方法很难对肉质性状取得较大遗传进展。因此采用分子生物学手段,深入分析肉 质性状遗传机制,为其改良提供给了机会,从而参考制定合理遗传改良方案是后基因组时 代家畜动物育种研宄的热点。
[0003] 随着后基因组时代的到来,转录组学、蛋白质组学、代谢组学等各种组学技术相继 出现,其中转录组学是率先发展起来以及应用最广泛的技术。转录组是在一个或多个细胞 中表达的RNA转录物的集合。通过转录组分析可以帮助我们在整体水平上研宄细胞中基因 转录的情况及转录调控规律。过去的转录组研宄通常采用Sanger测序和cDNA芯片方法, 而现在的转录组研宄越来越多采用高通量测序技术。新一代高通量转录组测序(RNA-seq) 与传统的基因芯片相比具有高通量、低成本、高灵敏度、重复性好且无需已知参考序列等优 点,已逐步取代基因芯片成为转录组研宄的主要手段。该技术已经应用于小鼠、海鲈鱼和水 稻等的RNA测序。此外,2013年杨亚岚利用高通量测序技术筛选出了不同猪种间的差异表 达基因并对其进行了功能注释和分析。
[0004] 中外猪种比较发现,国外猪种具有生长速度快、瘦肉率高和饲料转化率高等优点, 但往往存在肌内脂肪少、肉色灰白和系水力低等缺点,我国地方猪种具有肉色鲜红、系水力 强、肌内脂肪含量高和肌纤维直径小等优点。

【发明内容】

[0005] 本发明要解决的技术问题是提供一种基于RNA-Seq技术对不同品种猪背最长肌 差异表达基因的筛选与注释方法。
[0006] 为了解决上述技术问题,本发明采用的技术方案是:不同品种猪背最长肌差异表 达基因的筛选与注释方法,包括以下步骤:
[0007] (1)采样与测序:按不同猪种,采取成年期的背最长肌组织,每个猪种采集三头个 体,样品采集后-80°c贮存,提取各样品总RNA,采用Solexa测序技术对样品进行测序;
[0008] (2)原始数据处理:将测序仪产生的原始图像数据经Base Calling转化为序列 数据,并称之为原始序列数据,其结果以FASTQ文件格式存储;由于原始序列数据可能包 含低质量序列、接头序列等杂质序列数据,不能直接用于生物信息分析,所以原始序列数据 必需经过数据处理转换为高质量序列数据,利用Tophat (version :2. 0. 6)软件的spliced mapping算法对高质量序列数据进行猪基因组比对,采用基因组版本为SscrofalO. 2 ;
[0009] (3)差异基因的筛选:基因表达量的计算使FPKM法;根据基因的表达量(FPKM值) 计算该基因在不同样本间的差异表达倍数;差异表达基因定义为FDRS 0. 01且倍数差异在 2倍及以上的基因;
[0010] (4)功能显著性富集分析:把所有差异表达基因向Gene Ontology数据库的各条 目映射,计算每个条目的基因数目,然后应用超几何检验,找出与整个基因组背景相比,在 差异表达基因中显著富集的GO条目,其计算公式为:
[0011]
【主权项】
1.不同品种猪背最长肌差异表达基因的筛选与注释方法,包括以下步骤: (1) 采样与测序:按不同猪种,采取成年期的背最长肌组织,每个猪种采集三头个体, 样品采集后-80°c贮存,提取各样品总RNA,采用Solexa测序技术对样品进行测序; (2) 原始数据处理:将测序仪产生的原始图像数据经Base Calling转化为序列数据, 并称之为原始序列数据,其结果以FASTQ文件格式存储;将原始序列数据经过数据处理转 换为高质量序列数据,利用Tophat软件的spliced mapping算法对高质量序列数据进行猪 基因组比对,采用基因组版本为SscrofalO. 2 ; (3) 差异基因的筛选:基因表达量的计算使FPKM法;根据基因的表达量(FPKM值)计 算该基因在不同样本间的差异表达倍数;差异表达基因定义为FDR < 0. 01且倍数差异在2 倍及以上的基因; (4) 功能显著性富集分析:把所有差异表达基因向Gene Onto Iogy数据库的各条目映 射,计算每个条目的基因数目,然后应用超几何检验,找出与整个基因组背景相比,在差异 表达基因中显著富集的GO条目,其计算公式为:
公式(1)中,N为基因组中具有GO注释的基因数目;η为N中差异表达基因的数目;M 为基因组中注释为某特定GO条目的基因数目;m为注释为某特定GO条目的差异表达基因 数目;计算得到的P值通过Bonferroni校正之后,以校正后的P值< 0. 01为阈值,满足此 条件的GO条目定义为在差异表达基因中显著富集的GO条目; (5) Pathway显著性富集分析:Pathway显著性富集分析以KEGG Pathway为单位,应用 超几何检验,找出与整个基因组背景相比,在差异表达基因中显著性富集的Pathway ;该分 析的计算公式同GO功能显著性富集分析所用公式(1),其中N为芯片中具有Pathway注释 的基因数目;η为N中差异表达基因的数目;M为芯片中注释为某特定Pathway的基因数目; m为注释为某特定Pathway的差异表达基因数目;P < 0. 01的Pathway定义为在差异表达 基因中显著富集的Pathway。
【专利摘要】本发明公开了不同品种猪背最长肌差异表达基因的筛选与注释方法,包括以下步骤:(1)采样与测序;(2)原始数据处理;(3)差异基因的筛选;(4)功能显著性富集分析;(5)Pathway显著性富集分析。本发明采用高通量转录组测序技术,构建不同品种猪背最长肌组织的基因表达谱,获得差异表达基因,利用GO分析和pathway分析对差异基因进行筛选,确定调控肉质性状的关键基因,加深对肌肉生长发育和脂肪代谢调控的了解,为之后研究形成国内外品种在肉质和生长性状方面的差异的分子机理提供分子生物学证据。
【IPC分类】G06F19-20
【公开号】CN104636638
【申请号】CN201510034015
【发明人】王重龙, 李小金, 钱坤, 刘林清, 钱蓉
【申请人】安徽省农业科学院畜牧兽医研究所
【公开日】2015年5月20日
【申请日】2015年1月23日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1