Piggybac转座子变异及其使用方法

文档序号:1199711阅读:1694来源:国知局

专利名称::Piggybac转座子变异及其使用方法PIGGYBAC转座子变异及其使用方法
背景技术
:本申请主张2009年2月25日申请的美国临时申请案案号61/155,206的优先权,所述美国临时申请案全文并入本申请做为参考。把DNA导入细胞的典型方法包含例如磷酸钙的DNA浓缩剂试剂、聚乙二醇、含脂质的试剂,例如磷脂质、多层脂质体,以及由病毒为媒介的策略。然而,所述方法可具有一些限制。例如,DNA浓缩试剂与病毒媒介策略相关的大小限制。再者,在病毒策略中,可转染至细胞的核苷酸量有限制。并非所有方法都能促使进入的核苷酸插入细胞的核苷酸中,以及虽然DNA浓缩方法与含脂质试剂相对容易制备,但是插入核苷酸至病毒载体中需要大量劳力。病毒为媒介的策略可以是细胞形式或组织形式专一性,以及在体内使用病毒为媒介的策略可产生免疫问题。解决这些问题的一种合适工具是转座子。转座子(transposons)或转座因子(transposableelements)包含(短的)核苷酸序列,具有终端重复序列上游与下游。有活性的转座子编码的酵素会促使核苷酸的切除与插入至目标DNA序列中。转座因子代表许多真核基因组的实质部分。例如,50%的人类基因组是衍生自转座因子序列,以及其它基因组,例如植物,可包含实质更高比例的转座因子衍生DNA。转座因子典型分为两类,第1类与第2类。第1类表示为反转录转座子(LINEs、SINEs、LTRs与ERVs)。第2类包含“剪与贴"DNA转座子,由终端反转重复(IlRs)定性,以及被因子编码的转座酶(transposase)动员(mobilized)。目前,在真核细胞中,辨识10个超级家族的剪与贴DNA转座子(FeschotteandPritham,2007)。虽然第2类在许多真核细胞中广为分布且具有活性,但是已经被认为在哺乳动物基因组中转座性地不活化。这结论主要是基于人类与老鼠基因组序列的初始分析。虽然两个物种有许多不同的DNA转座子,但没有近代活性的显示(Landeretat.2001;Waterstonetal.2002)。例如,在人类基因组中,有超过300,000个可辨识的DNA因子(elements),它们被分为120个家族,并且属于5个超级家族。这些因子大部分(40个家族;98,000复制(copies))合并在至少4-8千万年,但是没有证据显示任何人类DNA转座子家族比3万7千年年轻(PaceandFeschotte,2007)。可在实验室条件下模拟水平基因转换的自然过程。在植物中,Ac/Ds与Spm家族已经时常转染至异质物种(heterologousspecies)中(OsborneandBaker,1995Curr.Opin.CellBiol.7,406-413)。然而,在动物中,活性转座子系统从一物种转换至另一物种的障碍是转换的物种专一性,需要自然宿主产生的要素(factors)。无脊椎动物与脊椎动物的转座子在模式生物体中皆有转基因(transgenesis)与插入突变(insertionalmutagenesis)的潜力。特别是在相同物种中其它转座子系统的可得性开启遗传分析的新可能性。仍需要新方法导入DNA至细胞中,以及特别是促进不同大小的转座子有效插入细胞核苷酸或是插入DNA至细胞基因组的方法,同时比目前技艺中可得的架构(construct)具更有效率的转录/转译结果。发明概述如下详细说明,已知在许多昆虫、鼠、猪与包含人类的哺乳类动物细胞中,粉斑夜W,(Trichoplusiani;cabbageloopermoth)的piggyBac^^子^^舌f生因子。*串i青的发明人已经分离粉斑夜蛾PiggyBac变异,比野生型(wildtype)的转座频率更高。高活性的转座子可用于基因转移统,把核苷酸稳定导入至细胞的DNA中。再者,本申请的发明人已经^!争i只合并缺piggyBac转移子(integrationdefectivepiggybacktransposons)0^发明的基因转移系统可用于例如但不限于基因治疗、插入突变或基因发现的方法中。因此,在第一方面,本发明特征在于包括一或多高活性PiggyBac核苷酸序列的转座子,及其保留转座子活性的变异、衍生物与片段。在一实施例中,相较于野生型PiggyBac转座子,高活性PiggyBac转座子具有较高量的转座子切除(transposonexcision)。在另一实施例中,转座子包括2、3、4、5或更多的高活性piggyBac核苷酸序列以及其保留活性的变异、衍生物与片段的转座子。在另一实施例中,高活性PiggyBac核苷酸序列是来自于Noctuidae属。在另一相关实施例中,高活性piggyBac核苷酸序列是来自于粉斑夜蛾物种。在另一实施例中,所述核苷酸序列是选自于SEQIDNO:34_SEQIDNO:63或SEQIDNO70SEQIDNO:96。在另一实施例中,所述核苷酸序列编码的氨基酸序列是选自SEQIDN0:3_SEQIDNO:32ο在另一方面,本发明特征是包括一或多个合并缺陷的(integrationdefective)piggyBac核苷酸序列以及其变异、衍生物与片段的转座子。在一实施例中,相较于野生型piggyBac转座子,所述合并缺陷的(integrationdefective)piggyBac转座子具有较低的合并率(rateofintegration)。在另一实施例中,所述合并缺陷的(integrationdefective)piggyBac核苷酸序列是来自于Noctuidae属。在另一相关实施例中,所述合并缺陷的(integrationdefective)piggyBac核苷酸序列是来自于粉斑夜蛾物种。在一实施例中,所述核苷酸序列是选自于SEQIDN0:67-SEQIDNO:69。在另一实施例中,所述核苷酸序列编码的氨基酸序列是选自SEQIDN0:64_SEQIDNO:66。在另一实施例中,所述野生型piggyBac转座子包括对应于SEQIDNO:1的核苷酸序列。在一些实施例中,高活性变异包括SEQIDN0:2中胺基酸改变,选自于G2C、Q40R、S3N、S26P、DOV、G165S、T43A、Q55R、T57A、S61R、I82V、I90V、S103P、S103T、N113S、M185L、M194V、S230N、R281G、M282V、G316E、P410L、I426V、Q497L、K501N、K565I、N505D、S573L、S509G、N570S、N538K、K575R、Q591P、Q591R、F594L。在上述方面的实施例中,所述转座子可插入至细胞的DNA中。在上述方面的另一实施例中,所述转座子可包括标示蛋白质(markerprotein)0在上述方面的另一实施例中,所述转座子是插入质体(plasmid)中。在一实施例中,所述转座子更包括至少一部份的开放读架(openreadingframe)。在另一实施例中,所述转座子更包括至少一表现控制区域。在另一实施例中,所述表现控制区域是选自于启动子、促进子或消音子(silencer)。在另一相关实施例中,所述转座子更包括启动子操作连结至至少一部份的开放读架。在一实施例中,所述细胞是得自于动物。在另一实施例中,所述细胞是得自于脊椎或无脊椎动物。在另一实施例中,所述脊椎动物是哺乳动物。在一实施例中,本发明特征在于包括根据任一上述方面的转座子的基因转移系统;以及PiggyBac转座酶。在一实施例中,piggyBac转座酶是来自于Noctuidae属。在相关实施例中,所述PiggyBac转座酶是来自粉斑夜蛾物种。在另一实施例中,所述piggyBac转座酶包括对应于SEQIDNO:33的氨基酸序列。在另一实施例中,所述piggyBac转座酶是哺乳动物piggyBac转座酶。在一实施例中,所述转座子是插入细胞的基因组中。在另一实施例中,所述细胞是得自于动物。在另一实施例中,所述细胞是得自于脊椎或无脊椎动物。在另一实施例中,所述脊椎动物是哺乳动物。在一些实施例中,本发明特征也在于包括任依上述方面的转座子的细胞。在其它方面中,本发明特征在于包括转座子的医药组合物,所述转座子包括高活性的PiggyBac核苷酸序列与piggyBac转座酶,以及医药可接受的载体、辅剂或运送体。本发明特征也在于导入外来DNA至细胞中的方法,所述方法包括使细胞接触上述方面的基因转移系统,因而导入外来DNA至细胞中。在一实施例中,所述细胞是干细胞。本发明特征也在于套组,所述套组包括含有高活性piggyBac核苷酸序列以及导入DNA至细胞中的说明。在一实施例中,所述高活性piggyBac核苷酸序列是来自于Noctuidae属。在另一实施例中,所述高活性PiggyBac核苷酸序列是来自于粉斑夜蛾物种。在另一实施例中,所述核苷酸序列是选自SEQIDNO:34_SEQIDNO:63或SEQIDNO:70-SEQIDNO:96。在另一方面,本发明特征也在于套组,所述套组包括转座子与使用说明,所述转座子包括合并缺陷的PiggBac核苷酸序列。在一实施例中,所述核苷酸序列是选自SEQIDNO:67_SEQIDNO:69。由本申请的详细说明与权利要求书可清楚理解本申请的特征与优点。定义除非特别指出,否则本申请的实施是使用习知的化学、分子生物学、微生物学、重组DNA与免疫学的技术,这些都是熟知此技艺的人士能力范围之内。文献中已解释这些技术。例如,J.Sambrook,E.F.Fritsch与T.Maniatis,1989,MolecularCloningALaboratoryManual,SecondEdition,Books1-3,ColdSpringHarborLaboratoryPress;Ausubel,F.Μ.etal.(1995与periodicsupplements;CurrentProtocolsinMolecularBiology,ch.9,13与16,JohnWiley&Sons,NewYork,N.Y.);B.Roe,J.Crabtree与A.Kahn,1996,DNAIsolationandSequencing:EssentialTechniques,JohnWiley&Sons;J.Μ·PolakandJames0'D.McGee,1990,InSituHybridizationPrinciplesandPractice;OxfordUniversityPress;M.J.Gait(Editor),1984,OligonucleotideSynthesis:APracticalApproach,IrIPress;D.Μ.J.Lilley与J.Ε.Dahlberg,1992,MethodsofEnzymology:DNAStructurePartA:SynthesisandPhysicalAnalysisofDNAMethodsinEnzymology,AcademicPress;UsingAntibodies:ALaboratoryManual:PortableProtocolNO.IbyEdwardHarlow,DavidLane,EdHarlow(1999,ColdSpringHarborLaboratoryPress,ISBN0-87969-544-7);Antibodies:ALaboratoryManualbyEdHarlow(Editor),DavidLane(Editor)(1988,ColdSpringHarborLaboratoryPress,ISBN0-87969-3,4-2),1855.HandbookofDrugScreening,由RamakrishnaSeethala,PrabhavathiB.Fernandes编辑(2001,NewYork,N.Y.,MarcelDekker,ISBN0-8247-0562-9);以及LabRef:AHandbookofRecipes,Reagents,andOtherReferenceToolsforUseattheBench,JaneRoskamsandLindaRodgers编辑,2002,ColdSpringHarborLaboratory,ISBN0-87969-630-3。这些文献皆并入本申请做为参考。在本申请中,除非特别说明,否则以下语词的意义如下所述。在本申请中,“包括”与“具有”等类似语词可具有美国专利法中所定义的意义,以及可以代表“包含”与类似语词;“实质上由…组成”的意义如美国专利法中所描述,以及所述语词是开放式的,允许超出主张之外的新增内容存在,只要所主张的基本或新颖特征不受增加物的影响,但排除习知技艺的实施例。在本申请中,“合并缺陷的”语词是指相较于对应野生型转座子,以较低频率整合(integrate)至宿主基因组的转座子。在一些实施例中,本申请的转座子是通过习知的整合机制而整合。在本申请中,“核苷酸”或“聚核苷酸”语词是指单股或双股DNA与RNA,以及其组合物。聚核苷酸可包含有不同功能的核苷酸序列,例如包含编码序列以及非编码序列,例如调节序列。聚核苷酸可直接得自于自然来源,或是可用重组、酵素或化学技术的辅助制备而得。聚核苷酸型态可以是线形或是环形。例如,聚核苷酸可以是载体的一部分或是片段。“编码序列”或是“编码区域”是编码多肽的聚核苷酸,以及当放在适当调节序列的控制下时,表现编码的多肽。编码区域的边界通常是由5’端的转译起始码与3’端的转译停止码决定。调节序列是核苷酸序列,调节其操作链接的编码区域的表现。调节序列的非限制范例包含启动子、转录起始位置、转译起始位置、转译停止位置、转录终结子(包含例如聚腺苷酸化信号)以及居中序列(interveningsequence)(内含子;introns)。在本申请中,“操作连结”语词是指与另一核苷酸序列有功能关系的核苷酸序列。例如,如果编码序列是操作链接至启动子序列,则这通常是指所述启动子可启动编码序列的转录。操作连结是指连结的DNA序列典型是邻近的,以及视需要,连接两个蛋白质编码区域,读取架连续。由于当与启动子相距几千碱基时,促进子(enhancer)仍具有功能,以及内含子序列可以是不同长度,所以有些核苷酸序列可以是操作连结但并不相邻。在本申请中,“多肽”语词是指任何长度的胺基酸聚合物。因此,多肽的定义中包含例如胜肽、寡胜肽、蛋白质、抗体与酵素。这语词也包含多肽的表现后修饰,例如醣基化(例如增加醣类)、乙酰基化、磷酸化等。在本申请中,“转座子”或“转座因子”是指多可从供应(donor)多核苷酸切割出来的核苷酸,所述供应多核苷酸例如载体,并且可合并至目标位置,例如细胞的基因组或是染色体外的DNA。转座子包多核苷酸,所述多核苷酸包含由在转座子终端由cis-acting核苷酸序列侧边相接的核苷酸序列。如果至少一cis-acting核苷酸序列是位在核苷酸序列的5’以及至少一cis-acting核苷酸序列是位在核苷酸序列的3’,则核苷酸序列是被cis-acting核苷酸序列“侧边连接”。Cis-actging核苷酸序列包含在转座子各端的至少一倒转重复(在本申请中也是指倒转终端重复,ITR),较佳是哺乳动物piggyBac家族转座酶结合的转座子。在一些较佳实施例中,所述转座子是来自Noctuidae家族。在一些较佳实施例中,所述转座子是粉斑夜蛾(Trichoplusiani;cabbageloopermoth)的piggyBac转座子。在本申请中,“粉斑夜蛾”是指Noctuidae蛾属的一员。“分离的”多肽或多核苷酸是指已经从自然环境移除、使用重组技术产生的或是化学或酵素合成的多肽或多核苷酸。较佳地,本发明的多肽或多核苷酸是纯化的,亦即实质上没有任何其它的多肽或多核苷酸以及相关的细胞产物或其它杂质。在本申请中,“转座酶”语词是指催化从供应多核苷酸(例如载体)切除转座子以及后续合并转座子至目标细胞基因组或染色体外DNA的多肽。较佳地,转座酶结合倒转序列或直接重复。转座酶可以呈现为多肽。或者,所述转座酶呈现为多核苷酸,包含编码转座酶的编码序列。所述多核苷酸可以是RNA,例如编码转座酶的mRNA,或是DNA,例如编码转座酶的编码序列。当转座酶呈现为编码转座酶的编码序列时,在本发明的一些方面中,所述编码序列可以存在包含转座子的相同载体上,亦即incis。在本发明的其它方面中,所述转座酶编码序列可存在第二载体上,亦即intrans.在一些实施例中,所述转座酶是哺乳动物piggyBac转座Bi。图1是表格(表幻说明在本发明高活性变异中,与野生型(正常化至1)不同的胺基酸改变与折迭增加。图2(A与B),(A)部分说明野生型粉斑夜蛾转座子的核苷酸序列,对应于SEQIDNO1以及对应胺基酸序列(SEQIDNO:2,(B)部分说明对应于野生型粉斑夜蛾转座酶的胺基酸序列,对应于SEQIDNO:33ο图3说明切割高活性piggyBac突变株的辨识。图4说明合并缺陷的piggyBac转座子的胺基酸序列,对应于SEQIDNOs64-66。具体实施例方式对于基因工程使用转座子的能力是高度取决于它可移动的频率。例如,如果10个子代中有1个具有转座子活动,则比1000个子代中有1个发生转座子活动更容易分离出所要的衍生型。本申请的发明人已经从粉斑夜蛾分离高活性PiggyBac转座子,它比野生型具有更高的转座活性。在许多生物中使用插入突变与转殖,广用转座子例如PiggyBac于基因组工程。来自粉斑夜蛾的PiggyBac转座子已显示为在昆虫、老鼠、猪与包含人类的哺乳动物细胞中是活性因子。因此,本发明特征在于高活性piggyBac转座子。高活性piggyBac转座子是指比野生型PiggyBac转座子具有更高频率的转座活动(transposonevent)。例如,在一些实施例中,高活性PiggyBac转座子发生转座0.5倍、1倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、15倍、20倍、25倍、30倍、40倍、45倍、50倍或更多。根据本发明的较佳实施例,高活性piggyBac转座子与转座酶结合,包含一对重复序列。在一些较佳实施例中,第一重复是典型位在核苷酸序列的上游,以及第二重复是典型位在核苷酸序列的下游。因此,第二重复与第一重复的序列相同,但是与第一重复的读取方向相反(互补双股序列的5’与3’端交换)。由于两重复是正好相反的重复序列,所以这些重复称为“倒转重复”(IRs)。在一些实施例中,在上述核苷酸序列的上游或下游,可发生多个重复。较佳地,位在上述核苷酸序列上游与下游的重复数量一样。在一些实施例中,所述重复是短的,在10-20碱基对之间,较佳是15个碱基对。本申请所述的重复aRs)较佳是入细胞DNA的核苷酸序列。核苷酸序列可包含基因的全部或部分的开放读架(亦即部分的蛋白质编码基因)、一或多个表现控制序列(亦即核苷酸中的调节区域)或连同所有或部分的开放读架。较佳的表现控制序列包含但不限于启动子、促进子、边界控制因子、位置控制区域或消音子。在较佳实施例中,核苷酸序列包括启动子操作连接至至少一部份的开放读架。根据一些实施例,本发明的高活性转座子可较佳发生为线性转座子(从5’端至3’端延伸),可用作为线性片段或环化,例如在质体中。本发明特征在于高活性piggyBac核苷酸序列及其保留转座子活性的变异、衍生物与片段。在本发明的较佳实施例中,相较于野生型PiggyBac转座子,高活性piggyBac转座子具有较高量的转座子切害1J(transposonexcision)。在一些较佳实施例中,所述高活性piggyBac核苷酸序列是来自于Noctuidae属。在其它实施例中,所述高活性PiggyBac转座子核苷酸序列是来自粉斑夜蛾。本发明的较佳实施例是指编码本申请定义的高活性piggyBac转座子的核苷酸。熟知此技艺的人士可知由于遗传码的重复性(degeneracy),因此许多不同的多核苷酸可边码相同的多肽。除此之外,应理解熟知此技艺的人士可使用惯常技术制造核苷酸取代,而不影响本发明多核苷酸编码的多肽序列,用来反应任何特定宿主生物表现所述多肽的密码子使用。可用此技艺的任何方法修饰所述多核苷酸。可进行所述修饰,用来促进本发明多核苷酸的体内活性或生命期。可用重组、合成或熟知此技艺的人士知道的任何技术产生多核苷酸例如DNA多核苷酸。也可以用标准技术选殖产生。通常使用重组方法可产生较长的多核苷酸,例如使用PCR(聚合酶链反应)选殖技术。这涉及制造一对引子(例如约15至30核苷酸)侧接要选殖的脂质目标序列区域,使引子接触动物或人类细胞的mRNA或cDNA,在放大所要区域需要的条件下,进行聚合酶链反应,分离放大的片段(例如在洋菜胶体上纯化反应混合物)以及回收放大的DNA。所述引子可被设计为包含合适的限制酵素辨识位置,因而被放大的DNA可被选殖到合适的选殖载体中。应理解本发明的多核苷酸可以只包含编码区域。然而,较佳是如果所述多核苷酸更包括一部分核苷酸在操作链接中,允许编码区域的有效转译。更佳是如果所述多核苷酸(DNA形式)更包括启动子在操作链接中,允许编码区域的转录,以及部分的核苷酸允许在目标细胞中编码区域的有效转译。根据本发明,核苷酸典型包括核醣核酸,包含mRNA、DNA、cDNA、染色体DNA、染色体外DNA、质体DNA、病毒DNA或RNA。在一些较佳实施例中,由于遗传密码的重复性,核苷酸较佳是选自编码高活性PiggyBac转座子相同胺基酸序列的任何核酸序列。这些其它的核苷酸序列可在选择的宿主生物中造成编码融合蛋白质的改良表现。熟知此技艺的人士知道适当调整核苷酸序列的表格。通常用标准程序进行所述核苷酸与/或衍生物的制备与纯U(i^jALSambrooketal.2001,MolecularCloning:ALaboratoryManual,ColdSpringHarbor,N.Y.)。相较于自然的核苷酸序列,这些自然核苷酸的其它变异可具有一或多个插入、删除与/或取代的密码子。相较于转座子的自然核苷酸序列,这些序列变异较佳造成具有至少一胺基酸取代、删除与/或插入的合并缺陷与/高活性PiggyBac转座子蛋白质。因此,本发明的核苷酸序列可编码修饰的(非自然的)转座子序列。再者,启动子或其它表现控制区域可操作链接编码本申请蛋白质的核苷酸,用来调节蛋白质表现的量或组织特性。在特定实施例中,粉斑夜蛾野生型PiggyBac转座子包括对应于SEQIDNO1的核苷酸序列。SEQIDNO1粉斑夜蛾PiggyBac转座子iA;、‘I<u>ι·.^-I^u··、.,'<ιχ^.ν\.Sit'i*νk<t?‘H·,‘-J^rKi■.t<、》f、f、/<t^··{IhPkI·<.“ft'Λ*Τ"1AFΓ.V,,·Λ<‘"'"‘‘”T!-V'WViAV厂广~ΛΤ、ΛΤΓ7·"*"***^'μ,^'Τ!”\ΑIAT-ifTVWTT、ΤΛtf'SΛf/'^y("Uca>*·""%/·■ΛΛ<*>/<,·"ι<¢---.4"Λ'Ν<M<'M,y-Λ.^rKit·,tS4<-fA.^-ai>J。<*,、iV>·Μ·>·,·t众塞农Γ*^f.r^·*^^rsT;;νγ·**·'rτ■■■Ss>i^it-',S<<J··:χ>·;.·.sfS^iνΑ>υ.二.;;s,約Jr’.二.S-Is"Λ-fW""1-—~、"S"κ‘‘‘‘*"iS,'·r>α·η,‘“-4.产<<“1<XXyV—1—-<*<-^\Ii,itiJW-.^wVi^t.Ut.Ji..^itJ,'JiiCV2"*Ji·X.,IνΛ.tVΑ.^A<:Λ“'Am;t^Jt^t**Η,·'''Μ*·>A/ΑΛ.A^t*^^y-iJ'f^ni.^yii^a'T?WW:--*-·Α·'υρW·(·.·-T^vvwwwx.r*!;,νΛ}i-N/W-W.^々,作气.沪Λ,.-ψyw-aw^svshywwxs*..*^--.~^^▲JJ--··."'-.ieJi^Vvvti.-I-VlLi.i'i2-ΛΛJl-<_·^/V^.ΗΛ铋-镇,J·<t,ΛΙ*1Aχ**‘*-C■·rfeyκk·^*r*$-V*hν—Λ>tν,=Kt*■λ■‘.'ΛV.Λ(‘J<.·^■(.^'KtU'..S>■%>-·.Ji^4.··.IS^iΑ,\Λ"ΓJ。T·Λj.W-Γ7IJΓ:^.""Α,、.“'^j.TA-AwmTT,*i°TJACA-""/ΛΓ*-u""WVT""ΓΛ▲*-λM·"w<1.JfV>i-*<4>ΜΜ.<sJ-a7¢-1*iH.χs4*M>1<-s'““‘'i"力,'Λ"Γ"*‘“5/”;5.*H"’/1;”’乙,,厂’,Afi‘二,AAW;'.^AΛ*.../C..'Iτ、,iV.W.·.uι^JtSimW.'ι-Vt^TT/'.^ν.11A,sJiju'tj'^-Λ<-,.A-11tt>-X-·>··■·,,,,-1O.,'^-r1-f,t—,fψ-->^V-ν—'<ΛrtviΛVJ,"S,Λ,W,-Vf^r'tr^ι,->Λ^H沪H、-%·-*·".^ζ<·>SM.J^tJ^‘-ΑΗ.X.i-t>,H.'1SJ,JfA1:J^tA.''*ΛΑJ>"ΛΑ5!一AA、J"*"2aZ'〕二AAr-^v5-T-‘了‘:^I^Z.“;…-。广CA^T-■"wA.'AAA·JT^T-2iTiJ^T>■-·ι·S^ΛJ.,―料"Λi<-)tMj^>1S<<"λ^t.*"i。X,ii,νιsA\'W,}TAwV5·“;^1^jTJ:W:二7··.V-ΓΑΛΛK^'W]Τ·\‘wT4{i^j内‘"-"^ΓΛ1,λ.AiN7Λ--^Λ^/TT:_Γ/.-*__:TTt^、,*Γ.**Λ^vZ~-TL\\ΛΑ~^")__-,《3"Γ(i""*’》>*■<ι.>μ^i·^>ii,Ικ-4.if·*.‘々iι{^;ι4·>tc'i.“fKΛ、ι<.>Λ'iιA^t、ΑιΛ、‘^<Ij—s>w、p、-Λ,yi'~·;Jwy-Γ:j_χ"IiAΓΑ·ΧΙ1Α·νΓJA^^XA'JJ-Γ?i^ri-ΛΑ77J^TΓ-AΓΤΛΓV^\JAi*J1A^AAs:'7.A..,t<^srΓ\A-tΑ,.Γ.<λ^s\A,χ,1HA.-'"1j"'"^.j,ν*-,-i^V系”‘'ΛΛ‘'>"V、k■J、"SWit*“fcv·Λ<tW~iiS^.^ii^sH^i~^Xi^^^Z^it^--J.4/"i.^4fUi-^Si>‘---·"J.7I4<‘1A<*Xr,‘,i,t-t,"fy',-'—4AT“·‘‘'"·*i*1-C·->·=-j"j'-,^iV]...,,Ι*,ItJIUiJ-,/i..-i^...tJ\f.>4i.ii'*L1.。《*u4ii.i·"rrr》rW'JV:"7'/r.c-VIA"*;*Af^^riwj;"αλια;._r”AHs!9IIs:J·i>>(t.-■·/>'J·V--V‘,"^Ι、-‘-5;I1I1M<.iΛ*Ι-uiy.?-J,-JV^-气、^r~~f“·ν·~V、·"■、』->“A,‘t^Ttχ>、ti—-·>Λ-"、.<*--Jf、Τ*""·^TT1S“4**"f*、s.·■.4-j.-a~I..*■<·7·.λ.,λ.λ..-λt,·λλ^ι.λ-λ.#4^1a-ajmws-w·λ.λ..4.;i.saSSjht.xx^ufk..i.4..i-4--.·J^i·.νa3si1AAj^"1'^AffV二”“,hJ*\‘Pt“.ηΛΑ“r*^'‘K"4^A^aA*‘*-·''Α,A·*ΑΓr^AAA1"r,’,”^><Mi,s.f*t-*^。》45在其它实施例中,粉斑夜蛾野生型PiggyBac转座子胺基酸序列是相当于SEQIDNO:2,如下所示MGSSLDDEHILSALLQSDDELVGEDSDSEISDHVSEDDVQSDTEEAFIDEVHEVQPTSSGSEILDEQNVIEQPGSSLASNRILTLPQRTIRGKNKHCWSTSKSTRRSRVSALNIVRSQRGPTRMCRNIYDPLLCFKLFFTDEIISEIVKWTNAEISLKRRESMTGATFRDTNEDEIYAFFGILVMTAVRKDNHMSTDDLFDRSLSMVYVSVMSRDRFDFLIRC10LRMDDKSIRPTLRENDVFTPVRKIWDLF1HQCIQNYTPGAHLTIDEQLLGFRGRCPFRMYIPNKPSKYGIKILMMCDSGTKYMINGMPYLGRGTQTNGVPLGEYYVKELSKPVHGSCRNΓΓCDNWFTSIPLAKNLLQEPYKLTIVGTVRSNKREIPEVLKNSRSRPVGTSMFCFDGPLTLVSYKPKPAKMVYLLSSCDEDASINESTGKPQMVMYYNQTKGGVDTLDQMCSVMTCSRKTNRWPMALLYGMINIACINSFIIYSHNVSSKGEKVQSRKKFMRNLYMSLTSSFMRKRLEAPTLKRYLRDNISNILPNEVPGTSDDSTEEPVMKKRTYCTYCPSKIRRKANASCKKCKKVICREHNIDMCQSCF在本申请中,在一些实施例中,本发明特征在合并缺陷的(integrationdefective)piggyBac转座子。合并缺陷是指相较于对应的野生型转座子,用较低频率合并至宿主基因组的转座子。在一些实施例中,本发明的转座子适用习知的合并机制进行合并。在一些实施例中,合并缺陷的piggyBac转座子是来自于野生型piggyBac序列SEQIDNO:2。在一些实施例中,合并缺陷的piggyBac转座子包括SEQIDN0:2选自R372A或K375A的改变。在一些较佳实施例中,合并缺陷的piggyBac转座子包括选自SEQIDNO:64、SEQIDNO65或SEQIDNO66的氨基酸序列。在一些实施例中,SEQIDNO:2胺基酸改变包括R372A,并且相当于SEQIDNO:64。SEQIDNO64MGSSLDDEHILSALLQSDDELVGEDSDSEISDHVSEDDVQSDTEEAFIDEVHEVQPTSSGSEILDEQNVIEQPGSSLASNRILTLPQRTIRGKNKHCWSTSKSTRRSRVSALNIVRSQRGPTRMCRNIYDPLLCFKLFFTDEIISEIVKWTNAEISLKRRESMTGATFRDTNEDEIYAFFGILVMTAVRKDNHMSTDDLFDRSLSMVYVSVMSRDRFDFLIRCLRMDDKSIRPTLRENDVFTPVRKIWDLF1HQCIQNYTPGAHLTIDEQLLGFRGRCPFRMYIPNKPSKYGIKILMMCDSGTKYMINGMPYLGRGTQTNGVPLGEYYVKELSKPVHGSCRNITCDNWFTSIPLAKNLLQEPILTIVGTVASNKREIPEVLKNSRSRPVGTSMFCFDGPLTLVSYKPKPAKMVYLLSSCDEDASINESTGKPQMVMYYNQTKGGVDTLDQMCSVMTCSRKTNRWPMALLYGMINIACINSFIIYSHNVSSKGEKVQSRKKFMRNLYMSLTSSFMRKRLEAPTLKRYLRDNISNILPNEVPGTSDDSTEEPVMKKRTYCTYCPSKIRRKANASCKKCKKVICREHNIDMCQSCFSEQIDNO:64编码的合并缺陷变异相当于SEQIDNO:1中CGA变成GCA的核苷酸改变,以及相当于SEQIDN0:67。在一些其它的实施例中,SEQIDNO2中胺基酸改变包括K375A以及相当于SEQIDNO:65。SEQIDNO65MGSSLDDEHILSALLQSDDELVGEDSDSEISDHVSEDDVQSDTEEAFIDEVHEVQPTSSGSEILDEQNVIEQPGSSLASNRILTLPQRTIRGKNKHCWSTSKSTRRSRVSALNIVRSQRGPTRMCRNIYDPLLCFKLFFTDEIISEIVKWTNAEISLKRRESMTGATFRDTNEDEIYAFFGILVMTAVRKDNHMSTDDLFDRSLSMVYVSVMSRDRFDFLIRCLRMDDKSIRPTLRENDVFTPVRKIWDLF1HQCIQNYTPGAHLTIDEQLLGFRGRCPFRMYIPNKPSKYGIKILMMCDSGTKYMINGMPYLGRGTQTNGVPLGEYYVKELSKPVHGSCRNITCDNWFTSIPLAKNLLQEPYKLTIVGTVASNKREIPEVLKNSRSRPVGTSMFCFDGPLTLVSYKPKPAKMVYLLSSCDEDASINESTGKPQMVMYYNQTKGGVDTLDQMCSVMTCSRKTNRWPMALLYGMINIACINSFIIYSHNVSSKGEKVQSRKKFMRNLYMSLTSSFMRKRLEAPTLKRYLRDNISNILPNEVPGTSDDSTEEPVMKKRTYCTYCPSKIRRKANASCKKCKKVICREHNIDMCQSCFSEQIDNO65编码的合并缺陷变异相当于SEQIDNO:1中AAA变成GCA的核苷酸改变,以及相当于SEQIDN0:68。在一些其它的实施例中,SEQIDNO2的氨基酸改变包括R372A、K375A以及相当于SEQIDNO:66οSEQIDNO:66MGSSLDDEHILSALLQSDDELVGEDSDSEISDHVSEDDVQSDTEEAFIDEVHEVQPTSSGSEILDEQNVIEQPGSSLASNRILTLPQRTIRGKNKHCWSTSKSTRRSRVSALNIVRSQRGPTRMCRNIYDPLLCFKLFFTDEIISEIVKWTNAEISLKRRESMTGATFRDTNEDEIYAFFGILVMTAVRKDNHMSTDDLFDRSLSMVYVSVMSRDRFDFLIRCLRMDDKSIRPTLRENDVFTPVRKIWDLF1HQCIQNYTPGAHLTIDEQLLGFRGRCPFRMYIPNKPSKYGIKILMMCDSGTKYMINGMPYLGRGTQTNGVPLGEYYVKELSKPVHGSCRNITCDNWFTSIPLAKNLLQEPILTIVGTVASNKREIPEVLKNSRSRPVGTSMFCFDGPLTLVSYKPKPAKMVYLLSSCDEDASINESTGKPQMVMYYNQTKGGVDTLDQMCSVMTCSRKTNRWPMALLYGMINIACINSFIIYSHNVSSKGEKVQSRKKFMRNLYMSLTSSFMRKRLEAPTLKRYLRDNISNILPNEVPGTSDDSTEEPVMKKRTYCTYCPSKIRRKANASCKKCKKVICREHNIDMCQSCFSEQIDNO:66编码的合并缺陷变异相当于SEQIDNO:1中CGA改变成GCA/AAA变成GCA的核苷酸改变,以及相当于SEQIDNO:69。在本申请中,本发明特征也在高活性PiggyBac转座子。在一些较佳实施例中,所述高活性PiggyBac转座子是从合并缺陷的piggyBac变异产生。亦即较佳是在合并缺陷PiggyBac变异中制造一或多个突变。在其它实施例中,所述高活性PiggyBac转座子是从野生型序列产生。亦即较佳是在野生型piggyBac转座子序列中制造一或多个突变。在实施例中,所述高活性piggyBac包括选自SEQIDNO:3_SEQIDNO:32的氨基酸序列。在其它实施例中,所述高活性piggyBac包括选自SEQIDNO:34_SEQIDNO:63的核苷酸序列。所述高活性piggyBac较佳可包括选自SEQIDNO:34_SEQIDNO:63的一或多个核苷酸序列。例如,所述高活性PiggyBac较佳可包括选自SEQIDNO:34_SEQIDNO:63的1、2、3、4、5或更多的核苷酸序列。在一些实施例中,所述高活性变异包括SEQIDN0:2的氨基酸改变,选自于L15P、D19N/F395L、S31P/T164A、H33Y、E44K/K334R、E45G、C97R/T242I、S103P,R189K/G120G、R189R/D450N/R526R、M194T、M194V、S213SN436I、I221T、S373P、N384T、453S/N571S、T560A、N571S、S573A、S584P、M589V、M589V/D170D、S592G,F594L、Stop/WLESCN,Stop595ELESCN/H33H。在一些实施例中,所述高活性变异包括SEQIDN0:2的氨基酸改变,选自于G2C、Q40R、S3N、S26P、DOV、G165S、T43A、Q55R、T57A、S61R、I82V、I90V、S103P、S103T、N113S、M185L、M194V、S230N、R281G、M282V、G316E、P410L、I426V、Q497L、K501N、K565I、N505D、S573L、S509G、N570S、N538K、K575R、Q591P、Q591R、F594L。在一些实施例中,SEQIDNO64或65胺基酸改变包括L15P,以及相当于SEQIDNO:3oSEQIDNO:4编码的高活性变异相当于SEQIDNO1中GAC变成AAC/UUU变成CUU的核苷酸改变,以及相当于SEQIDNO35或71。在一些实施例中,SEQIDNO:64或65胺基酸改变包括S31P/T164A以及相当于SEQIDNO:5oSEQIDNO:5编码的高活性变异相当于SEQIDNO:64或65中UCA变成CCA/ACA变成GCA的核苷酸改变,以及相当于SEQIDNO36或72。在一些实施例中,SEQIDNO64或65胺基酸改变包括H33Y,以及相当于SEQIDNO:6。SEQIDNO:6编码的高活性变异相当于SEQIDNO:64或65中CAC变成UAC的核苷酸变异,以及相当于SEQIDNO37或73。在一些实施例中,SEQIDNO64或65胺基酸改变包括E44K/K334R,以及相当于SEQIDNO:7oSEQIDNO:7编码的高活性变异相当于SEQIDNO1中GAA变成AAA/AAG变成AGG的核苷酸改变,以及相当于SEQIDNO38或74。在一些实施例中,SEQIDNO64或65胺基酸改变包括E45G,以及相当于SEQIDNO:8。SEQIDNO8编码的高活性变异相当于SEQIDNO:1中GAA变成GGA的核苷酸改变,以及相当于SEQIDNO39或75。在一些实施例中,SEQIDNO64或65胺基酸改变包括C97R/T242I,以及相当于SEQIDNO:9oSEQIDNO9编码的高活性变异相当于SEQIDNO:1中UGU变成CGU/ACU变成AUU的核苷酸改变,以及相当于SEQIDNO40或76。在一些实施例中,SEQIDNO64或65胺基酸改变包括S103P,以及相当于SEQIDNO=IO0SEQIDNO:10编码的高活性变异相当于SEQIDNO:1中UCC变成CCC的核苷酸改变,以及相当于SEQIDNO41或77。在一些实施例中,SEQIDNO64或65胺基酸改变包括R189K/G120G,以及相当于SEQIDNO=IloSEQIDNO:11编码的高活性变异相当于SEQIDNO1中AGA变成AAA/GGU变成GGC的核苷酸改变,以及相当于SEQIDNO42或78。在一些实施例中,SEQIDNO64或65胺基酸改变包括R189R/D450N/R5^R,以及相当于SEQIDNO:12oSEQIDNO12编码的高活性变异相当于SEQIDΝ0:1中AGA变成AGG/GAC变成AAC的核苷酸改变,以及相当于SEQIDNO43或79。在一些实施例中,SEQIDNO:64或65胺基酸改变包括Μ194Τ,以及相当于SEQIDN0:13。SEQIDNO:13编码的高活性变异相当于SEQIDNO:1中AUG变成ACG的核苷酸改变,以及相当于SEQIDNO44或80。在一些实施例中,SEQIDNO:64或65胺基酸改变包括M194V,以及相当于SEQIDN0:14。SEQIDNO:14编码的高活性变异相当于SEQIDNO:1中AUG变成GUG的核苷酸改变,以及相当于SEQIDNO45或81。在一些实施例中,SEQIDNO64或65胺基酸改变包括S213S/V436I,以及相当于SEQIDNO:15oSEQIDNO15编码的高活性变异相当于SEQIDNO1中AGU变成AGC的核苷酸改变,以及相当于SEQIDNO46或82。在一些实施例中,SEQIDΝ0:64或65胺基酸改变包括Ι221Τ,以及相当于SEQIDNO:16oSEQIDNO:16编码的高活性变异相当于SEQIDNO:1中AUA变成ACA的核苷酸改变,以及相当于SEQIDNO47或83。在一些实施例中,SEQIDNO:64或65胺基酸改变包括S373P在M6+之间,以及相当于SEQIDNO:17oSEQIDNO17编码的高活性变异相当于SEQIDΝ0:1中UCA变成CCA的核苷酸改变,以及相当于SEQIDNO48或84。在一些实施例中,SEQIDNO:64或65胺基酸改变包括Ν384Τ,以及相当于SEQIDN0:18。SEQIDNO:18编码的高活性变异相当于SEQIDNO:1中AAC变成ACC的核苷酸改变,以及相当于SEQIDNO49或85。在一些实施例中,SEQIDNO64或65胺基酸改变包括C453S/N571S,以及相当于SEQIDNO:19。SEQIDNO19编码的高活性变异相当于SEQIDNO1中U⑶变成AGU/AAU变成AGU的核苷酸改变,以及相当于SEQIDNO50或86。在一些实施例中,SEQIDNO:64或65胺基酸改变包括T560A,以及相当于SEQIDNO:20oSEQIDNO:20编码的高活性变异相当于SEQIDNO:1中A⑶变成G⑶的核苷酸改变,以及相当于SEQIDNO51或87。在一些实施例中,SEQIDNO:64或65胺基酸改变包括N571S,以及相当于SEQIDNO:21。SEQIDNO21编码的高活性变异相当于SEQIDNO1中AAU变成AAG的核苷酸改变,以及相当于SEQIDNO52或88。在一些实施例中,SEQIDNO:64或65胺基酸改变包括S573A,以及相当于SEQIDNO:22oSEQIDNO:22编码的高活性变异相当于SEQIDNO:1中UCG变成GCG的核苷酸改变,以及相当于SEQIDNO53或89。在一些实施例中,SEQIDNO64或65胺基酸改变包括S584P,以及相当于SEQIDNO:23oSEQIDNO:23编码的高活性变异相当于SEQIDNO:1中U⑶变成CXU的核苷酸改变,以及相当于SEQIDNO54或90。在一些实施例中,SEQIDNO64或65胺基酸改变包括M598V,以及相当于SEQIDN0:24。SEQIDNO:编码的高活性变异相当于SEQIDNO:1中AUG变成GUG的核苷酸改变,以及相当于SEQIDNO55或91。在一些实施例中,SEQIDNO64或65胺基酸改变包括M589V/D170D,以及相当于SEQIDNO:25oSEQIDNO:25编码的高活性变异相当于SEQIDNO1中ATG变成GUG/GAC变成GAU的核苷酸改变,以及相当于SEQIDNO56或92。在一些实施例中,SEQIDNO64或65胺基酸改变包括S592G,以及相当于SEQIDNO:26oSEQIDNOJ6编码的高活性变异相当于SEQIDNO:1中AGU变成G⑶的核苷酸改变,以及相当于SEQIDNO57或93。在一些实施例中,SEQIDNO64或65胺基酸改变包括F594L,以及相当于SEQIDNO:27oSEQIDNO:27编码的高活性变异相当于SEQIDNO:1中UUC变成TTA的核苷酸改变,以及相当于SEQIDNO58或94。在一些实施例中,SEQIDNO64或65胺基酸改变包括Mop/WLESCN,以及相当于SEQIDNO:28。SEQIDNO28编码的高活性变异相当于SEQIDNO1中TGA变成TGG的核苷酸改变,以及相当于SEQIDNO59或95。在一些实施例中,SEQIDNO:64或65胺基酸改变包括Mop595ELESCN/H33H,以及相当于SEQIDNO:29oSEQIDNO:编码的高活性变异相当于SEQIDNO:1中TGA变成GGA/CAU的核苷酸改变,以及相当于SEQIDNO60或96。在另一较佳实施例中,编码高活性piggyBac转座子的核苷酸是选自上述定义编码高活性PiggyBac转座子的核苷酸序列,以及可在严厉条件下与上述定义的互补核苷酸序列杂交。在另一实施例中,编码高活性PiggyBac转座子的核苷酸是选自上述定义编码高活性PiggyBac转座子的核苷酸序列,以及可在严厉条件下与上述定义的互补核苷酸序列杂交。严厉条件例如在0.5*SSC中30%(ν/ν)甲醛、0.1%(w/v)SDS在42C进行7小时。测量从载体切割转座子的分析、合并转座子至细胞的基因组或染色体外DNA以及转座酶结合至倒转重复的能力描述在本申请中,并且是此技艺已知的(Iviesetal.Cell,91,501-510(1997);WO98/40510(Hackettetal.);WO99/25817(Hackettetal.),WO00/68399(Mclvoretal.)全部内容并入本申请作为参考。为了决定本发明转座子的转作频率,基本转座子活性被正常化至100%,决定本发明的转座子的相对活性。较佳地,本发明的转座子转座频率增加倍数较佳大于基本线转座子至少约50%、至少约100%、至少约200%,更佳为至少约300%。较佳地,两个转座子(亦即基本线转座子与测试的转座子)皆在包含转座子的载体中侧接相同的核苷酸序列。本发明特征也在于蛋白质序列,显示与SEQIDNOs3_32其中任何一蛋白质序列至少80%、较佳为至少85%、更佳为至少90%、再更佳为至少95%,以及最佳为至少98%序列相同。本发明特征也在于蛋白质序列,显示与SEQIDNOs3_32其中任何一蛋白质序列至少80%、较佳为至少85%、更佳为至少90%、再更佳为至少95%,以及最佳为至少98%序列相同。“相似度(identity)”是指两个或多个蛋白质、核苷酸之间相同的程度,可使用已知的方法例如计算器为基础的序列比对(basiclocalalignmentsearchtool,S.F.Altschuletal.,J.MoI.Biol.215(1990),403-410),比较这些序列而决定。所述方法包含但不限于646编程,包含6々?(06¥6仪1,工,6{al.,NucleicAcidsResearch12(12)287(1984);GeneticsComputerGroupUniversityofWisconsin,Madison,(WI));BLASTPorBLASTN,andFASTA(Altschul,S.,etal.,J.MoI.Biol.215:403-410)(1999))。此夕卜,可使用Smithfeterman运算,决定两序列之间的相同程度。根据本发明,功能衍生物较佳维持哺乳动物转座酶的生物功能,亦即转座酶活性、核苷酸序列的切除以及关于切除序列插入特定目标序列的活性。根据本发明,功能衍生物可包括高活性变异的一或多个胺基酸插入、删除与/或取代,例如相当于SEQIDNOs3-32。本申请所述的胺基酸取代较佳是保守的胺基酸取代,不会改变转座子或转座酶蛋白质的生物活性。保守的胺基酸取代特征在于具有特别大小或特征的胺基酸可取代另一胺基酸,特别是例如在本发明蛋白质的区域与催化活性或DNA结合活性无关。例如,其它的胺基酸序列可包含含有保守改变的胺基酸序列,不会明显改变转座酶的活性或结合特征。胺基酸序列的取代可选自其它胺基酸种类的成员。例如,非极性(疏水性)胺基酸包含丙胺酸、白胺酸、异白胺酸、缬胺酸、脯胺酸、苯丙胺酸、色胺酸与酪胺酸。极性的自然胺基酸包含甘胺酸、丝胺酸、羟丁胺酸、半胱胺酸、酪胺酸、天冬酰胺与麸胺酰胺。正电(碱性)胺基酸包含精胺酸、赖胺酸与组胺酸。负电(酸性)胺基酸包含天冬胺酸与麸胺酸。这些改变并不会实质影响由聚丙烯酰胺凝胶电泳或等电点决定的分子量。特别较佳的保守取代包含但不限于Lys取代Arg,反之亦然,维持正电荷;Glu取代Asp,反之亦然,维持负电荷;Ser取代Thr,因而维持自由的一OH;以及Gln取代Asn维持自由的NH2。胺基酸插入与取代较佳是发生在不影响空间结构、或催化中心或piggyBac转座子或转座酶的结合区域的序列位置。可使用例如CD光谱(圆二色光谱)⑴rry,1985,Absorption,circularDichroismandORDofPolypeptides,in:ModernPhysicalMethodsinBiochemistry,Neubergeretal.(Ed.),Elsevier,Amsterdam)侦测插入或删除造成的空间结构改变。产生具有不同于自然序列的取代的氨基酸序列所用的合适方法例如美国专利号4,737,462,4,588,585,4,959,314,5,116,943,4,879,111与5,017,691,这些公开内容全文并入本申请作为参考。为了避免生理降解,可将其它功能衍生物稳定化。例如可用[贝塔]胺基酸取代酰胺键,稳定蛋白质骨架而得到上述稳定化作用。根据本发明的一些较佳实施例,本发明的转座子可更包括标示蛋白质(markerprotein)。再者,在一些较佳实施例中,核苷酸序列可以是任何的重组蛋白质,例如此技艺中任何已知的蛋白质。例如,核苷酸序列编码的蛋白质可以是标示蛋白质,例如绿荧光蛋白质(GFP)、蓝荧光蛋白质(BFP)、光活化的GFP(PA-GFP)、黄偏移绿荧光蛋白质(黄GFP)、黄荧光蛋白质(YFP)、强化的黄荧光蛋白质(EYFP)、青绿色荧光蛋白质(CFP)JSK的青绿色荧光蛋白质(ECFP)、单体红荧光蛋白质(mRFPl)、点火荧光蛋白质(KFP1)、水母蛋白、自发荧光蛋白质(AFP)、或是荧光蛋白质JRed、TurboGFP,PhiYFP与WiiYFP_m、tHc-Red(HcRed-Tandem)、PS-CFP2以及KFP-Red(全部都是商业上可购买得到),或是其它合适的荧光蛋白质氯霉素乙酰基转移酶(CAT)。蛋白质更可选自生长荷尔蒙,例如在转殖动物中促进生长,或是选自贝塔-半乳糖苷酶(IacZ)、荧光酵素(LUC)以及类胰岛素生长因子(IGFs)、阿法-抗-胰蛋白酶、红血球生成素(EPO)、血液凝结系统的因子VIII与XI、LDL-受体、GATA-I等。核苷酸序列更可以是自杀基因,编码例如细胞凋零死亡相关的酵素,以及包含A1F、Apaf例如Apaf-I、Apaf-2、Apaf-3或AP0-2(L)、AP0-3(L)、Apopain、Bad、Bak、Bax、Bcl_2、Bcl_x·sub.L、Bcl_x.sub.S、bik、CAD、Calpain、Caspases例如Caspase-1>Caspase~2>Caspase-3>Caspase~4>Caspase-5>Caspase~6>Caspase-7>Caspase~8>Caspase-9、Caspase-10、Caspase-ll>或GranzymeB、ced_3、ced_9、Ceramide>c_Jun、c-Myc、CPP32、crmA、Cytochromec、D4-GDP-DI、Daxx、CdRl、DcRl、DD、DED,DISC、DNA-PK.sub.CS、DR3、DR4、DR5、FADD/M0RT-1、FAK,Fas、Fas-IigandCD95/fas(受体)、FLICE/MACH>FLIP、Fodrin、fos、G-Actin>Gas_2、Gelsolin、glucocorticoid/glucocorticoid受体、granzymeAfB、hnRNPsC1/C2、ICAD、ICE、JNK、LaminA/B、MAP、MCL-I、Mdm_2、MEKK-I、MORT-I、NEDD,NF-.sub..kappa.B、NuMa,p53、PAK-2、PARP,Perforin、PITSLRE、PKC.delta.、pRb,Presenilin、prICE、RAIDD、Ras、RIP、Sphingomyelinase、SREBPs、单纯疱疹病毒的thymidinekinase、TNF-alpha、TNF-alpha受体、TRADD、TRAF2、TRAIL-Rl、TRAIL-R2、TRAIL-R3、Transglutaminase、Ul70kDasnRNP、YAMA的基因。本发明的piggyBac转座子较佳是结合piggyBac转座酶,相较于习知技艺的方法有一些优点,所述习知方法是关于病毒与反转录病毒的方法。例如,不同于原病毒的插入,通过intrans提供转座酶活性,转座子插入可以被(再)动员化((immobilized)。因此,例如除了进行耗时的微注射之外,也可根据本发明在新的位置产生转座子插入。本发明的piggyBac转座子结合上述定义的piggyBac转座酶蛋白质可被转染至细胞中,成为蛋白质或包含mRNA的核糖核酸、成为DNA,例如成为染色体外DNA,包含但不限于游离DNA、成为质体DNA或是成为病毒核苷酸。再者,编码转座酶蛋白质的核苷酸可被转染至细胞中,成为核苷酸载体,例如质体,或是成为基因表现载体,包含病毒载体。因此,核苷酸可以是环形或是线形。本申请使用的载体是指质体、病毒载体或是黏质体(cosmid)可合并编码本发明的转座酶蛋白质或转座子的核苷酸。“编码序列”或是“开放读架”是指当放在适当调节序列的控制下十,可在体内被转录与/或转译成为多肽的核苷酸区域。编码转座酶蛋白质的DNA可稳定插入细胞的基因组中或是插入在体中,用于持续或是可诱导型的表现。当转座酶蛋白质转染至细胞中或插入载体中成为核苷酸时,转座酶编码序列较佳是操作连结至启动子。有许多启动子可使用,包含但不限于持续启动子、组织特异性激活子、可诱导的激活子与类似物。启动子是调节信息,在细胞中结合RNA聚合酶,起始下游(3’方向)编码序列的转录。DNA序列操作连结至表现控制序列,例如启动子,表现控制序列控制且调节DNA序列的转录与转译。“操作连结”包含在要表现的DNA序列前具有适当的开始信息(例如ATG),以及维持正确的读架,在表现控制序列的控制下,允许DNA序列的表现,产生所要的蛋白质产物。编码高活性PuggyBac转座子的核苷酸序列例如SEQIDNO:3-SEQIDNO:32或本申请所述的其它高活性变异。除了上述保守改变会需要改变转座子编码核苷酸序列(如本申请所述)之外,还有编码高活性PiggyBac转座子蛋白质的其它DNA或RNA序列。这些DNA或RNA序列具有与高活性piggyBac转座子蛋白质相同的胺基酸序列,但是利用三个字母密码子的重复性指定特定的胺基酸。例如,此技艺中已知可交替使用不同的特并RNA密码子(对应于DNA密码子,由U取代T),编码特定的胺基酸。DNA与蛋白质的操作方法是此技艺中已知的,并且文献具有详细说明,例如Sambrooketal,(1989)MolecularCloning:ALaboratoryManual,ColdSpringHarborLaboratoryPress或Ausubel,R.Μ.,ed.(1994).CurrentProtocolsinMolecularBiology。基因转移系统本发明特征也在于基因转移系统,包括本发明的转座子、本申请所述的合并缺陷的转座子或高活性PiggyBac转座子,以及本申请所述的piggyBac转座酶。如上所述,piggyBac转座酶蛋白质较佳是辨识高活性piggyBac转座子上的重复(例如IR)。因此,本发明的基因转移系统较佳是包括两个成员本申请描述的转座酶,以及本申请描述的高活性转座子或合并缺陷的转座子。较佳地,在一些实施例中,转座子具有至少两个重复(例如^s)。当两个成员放在一起时,提供转座子活性,以及允许转座子重新定位。使用时,转座酶结合至所述重复,以及启动介于中间的DNA序列插入至细胞的DNA中,如下所述。在其它实施例中,所述基因转移系统包括上述定义本发明的piggyBac转座子结合piggyBac转座酶蛋白质(或编码piggyBac转座酶的核苷酸,在细胞中提供活性)。这结合较佳造成插入核苷酸序列至细胞的DNA中。或者,通过非同质重组与许多可再现的机制,可能插入本发明的转座子至细胞的DNA中。使用此基因转移系统,本发明的转座子可用于基因转移。在一些较佳实施例中,所述基因转移系统使用piggyBac转座酶蛋白质,媒介插入高活性PiggyBac转座子至不同细胞形式与不同物种的DNA中。较佳地,所述细胞包含适合本申请的任何细胞,包含但不限于动物细胞或来自细菌、真菌(例如酵母菌)或植物的细胞。较佳的动物细胞可以是脊椎动物或无脊椎动物的细胞。例如,较佳的脊椎动物细胞包含来自哺乳类动物的细胞,包含但不限于嚿齿动物,例如大鼠,有蹄类哺乳动物,例如牛或山羊、绵羊、猪,或人类细胞。在其它实施例中,这些细胞,特别是来自上述定义哺乳动物的细胞可以是分化多能的(pluripont)(亦即这些细胞的子代可以分化为数种有限的细胞型式,例如血液干细胞或其它干细胞),以及分化全能(totipotent)细胞(亦即这些细胞的子代可变成器官中的任何细胞型式,例如胚胎干细胞)。使用这些细胞有利于稳定表现转座酶或得到已经转染本发明基因转移系统成员的许多细胞。此外,也可考虑卵母细胞、蛋以及一或多胚胎细胞,作为本发明基因转移系统稳定转染的目标。在本发明的一些实施例中,所述细胞是干细胞。接收本发明PiggyBac转座子与/或piggyBac转座酶蛋白质的细胞且可插入转座子至细胞DNA中,所述细胞可包含但不限于淋巴细胞、肝细胞、神经细胞、肌肉细胞、许多血液细胞以及器官的不同细胞,胚胎干细胞、体干细胞例如血液前驱细胞、胚胎、受精卵、精细胞(其中有些细胞可在体外操作)。在一些其它的实施例中,如果本发明的ρiggyBac转座子,例如高活性ρiggyBac转座子,与细胞内的PiggyBac转座酶蛋白质接触,则接受本申请转座子的细胞DNA可包含所要转染细胞(如上所述)中的任何DNA。例如,所述DNA可以是细胞基因组的一部分,或是染色体外,例如游离基因、质体、环行或线形DNA片段。插入的典型目标例如双股DNA。本申请的基因转移系统成员,亦即piggyBac转座酶蛋白质(蛋白质或是由本申请所述核苷酸编码的)以及本发明的PiggyBac转座子可被转染至细胞中,较佳是转染至上述定义的细胞中,更佳是转染至相同的细胞中。这些成员的转染更可顺序发生或是平行发生。例如,piggyBac转座酶蛋白质或是其编码核苷酸可同时转染至上述定义的细胞中,或是在转染哺乳动物piggyBac转座子之后,转染PiggyBac转座酶蛋白质或是其编码核苷酸至上述定义的细胞中。或者,在转染PiggyBac转座酶蛋白质或其编码核酸序列之前、同时或之后,可转染所述转座子至上述定义的细胞中。如果是平行转染,较佳是在投与之前,两个成员在个别的配方中与/或直接比次混合,避免转染前发生转座。此外,可重复进行投与基因转移系统的至少一成员,例如投与至少一、二或多剂量的成员。对于上述任何的转染反应,可用此技艺中已知的合适方式调配所述基因转移系统,或成为本申请所述的医药组合物或套组。在其它较佳实施例中,使用粒子轰击、电子穿孔、微注射、结合具有含脂质载体的成员,例如阳离子脂质载体、DNA浓缩剂(例如磷酸钾、聚离胺酸或聚乙亚胺)以及插入所述成分(亦即插入核苷酸至病毒载体中,以及使病毒载体接触细胞),所述基因转移系统的成员较佳可被转染至一或多细胞中。当使用病毒载体时,所述病毒载体可包含所述技艺中已知的任何病毒载体,选自反转录病毒载体、腺病毒载体或是腺相关病毒载体。如上所述,编码piggyBac转座酶蛋白质的核苷酸可以是RNA或是DNA。同样地,编码piggyBac转座酶蛋白质的核苷酸或本发明的转座子可转染至细胞中,成为线形片段或是环形片段,较佳是质体或是重组的病毒DNA。再者,编码piggyBac转座酶蛋白质的核苷酸较佳是稳定的或暂时插入细胞的基因组中,促使细胞中PiggyBac转座酶的暂时或延长表现。上述的基因转移系统代表修饰过的非病毒DNA媒介的基因转移。例如,使用病毒作为基因治疗剂会使遗传工程设计受限于病毒基因组的大小、结构与表现调节。本申请所述的非病毒载体主要是由合成的起始材料产生,因而比病毒载体更容易制造。相较于病毒试剂,非病毒试剂比较不可能成为免疫原,可重复投与。非病毒载体比病毒载体更稳定,因而比病毒载体更适合医药配方与应用。除此之外,本发明的基因转移系统是非病毒基因转移系统,便于插入至DNA,以及明显改善稳定基因转移的频率。本发明更提供有效的方法用于产生转殖动物,包含把本发明的基因转移系统用于动物。转职DNA并未有效率地插入染色体中。只有大约百万分之一的外来DNA分子会插入细胞的基因组中,通常数次切割周期进入发展。结果,大部分的转殖动物是mosaic(Hackettetal.(1993).Themolecularbiologyoftransgenicfish.InBiochemistryandMolecularBiologyofFishes(Hochachka&Mommsen,eds)Vol.2,pp.207—240)。@]ft,必须培养已经传递转殖DNA的胚胎所培育的动物,直到分析到配子有插入的外来DNA存在。许多转殖动物由于位置效应而无法表现转殖基因。需要简单、可靠的程序,在一个细胞阶段,导引早期插入外来DNA至动物的染色体中。本发明的系统协助填补这个需要。在一些较佳实施例中,本发明的基因转移系统可用于产生转殖动物,在动物的一个或多个细胞中,携带特定标示或表现特定蛋白质。通常,此技艺中已知产生转殖动物的方法,以及合并本发明基因转移系统至这些技术中并不需要过度实验,例如有许多产生转殖动物的方法用于研究,或用于蛋白质生产,包含但不限于Hackettetal.(1993,supra)0此技艺中已有产生转殖动物的其它方法的描述(例如Μ.Markkulaetal.Rev.R印rod.,1,97-106(1996);R.T.Walletal.,J.DairyScL,80,2213-2224(1997)),J.C.Dalton,etal.(Adv.Exp.Med.Biol.,411,419-428(1997))andH.Lubonetal.(Transfus.Med.Rev.,10,131-143(1996))。在另一实施例中,本发明特征在于由本申请方法产生的转殖动物,较佳是使用本申请所述的基因转移系统。例如,转殖动物较佳可包含由所述基因转移系统插入动物基因组中的核苷酸序列,因而所述转殖动物可产生其基因产物,例如蛋白质。在转殖动物中,此蛋白质较佳是由细胞分离的产物,例如本发明的蛋白质可产生在奶、尿、血液或蛋中。可使用启动子,促进奶、尿、血液或蛋中的表现,以及这些启动子包含但不限于酪蛋白启动子、老鼠尿蛋白启动子、贝塔球蛋白启动子以及卵白蛋白启动子。已经使用在细胞中产生蛋白质的其它方法,产生重组的生长荷尔蒙、重组的胰岛素以及许多其它重组蛋白质。编码这些或其它蛋白质的核苷酸可被插入至本发明的转座子中,并且转染至细胞中。上述本发明转座子的有效转染至细胞DNA中发生在当有哺乳动物的piggyBac转座酶蛋白质存在时。当所述细胞是组织的一部分或是转殖动物的一部分时,可得到大量的重组蛋白质。可从脊椎动物与无脊椎动物选择转殖动物,例如鱼、鸟、哺乳动物,包含但不限于例如大鼠或老鼠的嚙齿动物、例如牛或山羊、绵羊、猪的有蹄类哺乳动物,或人类。本发明更提供基因治疗的方法,包括导入所述基因转移系统是本申请所述细胞中。因此,本申请中所述本发明的PiggyBac转座酶较佳包括基因,用来提供基因治疗至细胞或生物。较佳地,所述基因是在组织特异性激活子、广布启动子或在细胞中表现基因需要的一或多个其它表现控制区域的控制下。目前,测试许多基因用于许多基因治疗,包含但不限于CFTR基因用于囊性纤维变性、腺苷去胺酶(ADA)用于免疫系统疾病、因子IX与介白素-2(IL-2)用于血液细胞疾病、阿法-1-抗胰蛋白酶用于肺病,以及肿瘤坏死因子(INF)与多抗药性(MDR)蛋白质用于癌症治疗。可在已知的基因数据库,例如GenBank,获得这些以及许多人类或动物特异性的基因序列,包含编码标示蛋白质与许多重组蛋白质的基因序列。本发明基因转移系统用于基因治疗的优点是不受限于重复之间的中间核苷酸序列大小。使用哺乳动物PiggyBac转座子蛋白质,可插入细胞DNA中的核苷酸序列大小没有已知的限制。在特定的较佳实施例中,对于基因至料以及本发明的其它目的,可用许多方法将所述基因转移系统转染至细胞中,例如微注射、脂质媒介的方法或是病毒媒介的方法。例如,当使用微注射时,对于本发明转座子的中间序列的大小有非常小的限制。同样地,脂质媒介的方法没有实质的大小限制。然而,导入基因转移系统至细胞中的其它方法,例如病毒媒介的方法,可限制位于重复之间核苷酸序列的长度。因此,在一些实施例中,本申请所述的基因转移系统可通过病毒传递至细胞,所述病毒包含反转录病毒(例如慢病毒)、腺病毒、腺关联病毒、泡疹病毒以及其它病毒。有一些传送机制的潜在组合,可用于高活性PiggyBac转座子部分,包含由终端重复侧接的转基因以及编码转座酶的基因。例如,可在相同的重组病毒基因组中包含转座子与转座酶基因;单一感染传送基因转移系统的两部分,因而转座酶的表现而后导引从重组病毒基因组切除转座子,后续插入细胞的染色体中。在另一范例中,可通过病毒与/或非病毒系统的组合,例如包含脂质的试剂,分别递送转座酶与转座子。在这些例子中,转座子与/或转座酶基因可由重组病毒递送。在每个例子中,表显的转座酶基因导引转座子从载体DNA(病毒基因组)释出,插入至染色体DNA中。在本发明的一些较佳实施例中,本发明的piggyBac转座子可用于插入突变,较佳是经过辨识突变基因。DNA转座子特别是具有不同于习知技艺的优点,例如关于病毒与反转录病毒方法。例如,不同于原病毒插入,可通过intrans提供转座酶活性,再定位(remobilize)转座子插入。因此,取代进行耗时的微注射,根据本发明可交连(crossing)储存的转殖,转座子系统的上述两成员,本发明的转座子与本发明的转座酶,在新位置产生转座子插入。在较佳实施例中,为了突变生殖细胞,基因转移系统是针对实验动物的生殖系。或者,转座酶表现可使用针对特定组织或器官的许多特定启动子。此外,突变的转座子在插入位置外的再定位可用于分离反突变体(revertants),以及如果转座子切除与侧接DNA的删除相关,则本发明基因转移系统可用于产生删除突变。再者,由于转座子是由DNA组成,并且可维持在简单质体中,本发明的转座子与本发明基因转移系统的使用相较于高感染性的反转录病毒更为安全且更简单操作。转座酶活性提供形式可以是上述定义的DNA、mRNA或蛋白质。在另一实施例中,本发明也提供有效率的系统用于基因发现,例如基因组映像(genomemapping),使用本发明的基因转移系统,导入上述定义本发明的piggyBac转座子至基因中。在一范例中,高活性PiggyBac转座子结合piggyBac转座酶蛋白质或编码PiggyBac转座酶蛋白质的核苷酸转染至细胞中。在一些较佳实施例中,转座子较佳包括位在至少两重复之间的核苷酸序列,其中所述重复结合PiggyBac转座酶蛋白质,以及其中所述转座子插入有PiggyBac转座酶蛋白质的细胞的DNA中。在一些较佳实施例中,核苷酸序列包含标示蛋白质,例如GFP与限制核酸内切酵素辨识位置。在插入之后,细胞DNA被分离且用限制核酸内切酵素消化。例如,如果核酸内切酵素辨识位置是6-碱基辨识位置,以及限制核酸内切酵素是使用6-碱基辨识序列,则所述细胞DNA被切为平均约4000-bp片段。这些片段可被转职或是可加入连结子(linker)至被消化的(digested)片段端,提供PCR引子的互补序列。当加入连结子时,PCR反应使用来自连结子的引子以及转座子中所述重用于放大片段。而后定序放大的片段,以及侧接直接重复的DNA用于搜寻计算机数据库,例如GenBank。使用基因转移系统用于上述方法,例如基因发现与/或基因标定,通过使用转座子作为插入突变剂,允许关于生长与发育的基因辨识、分离与定性,或是控制生长与发育的转录调节序列的辨识、分离与定性。在本发明的另一实施例中,本发明提供在细胞中动员(mobilizing)核苷酸序列的方法。根据此方法,所述高活性PiggyBac转座子插入细胞的DNA中,如本申请所述。高活性PiggyBac蛋白质或编码piggyBac转座酶蛋白质的核苷酸被转染至细胞中,以及所述蛋白质可动员(亦即移动)所述转座子从细胞的DNA内第一位置至所述细胞DNA内的第二位置。细胞的DNA较佳是基因组DNA或是外染色体DNA。本发明的方法允许转座子从基因组的一位置移动至基因组的另一位置,或是例如从细胞中的直体移动至所述细胞的基因组。在另一实施例中,本发明基因转移系统也可作为RNA干扰技术方法的一部分。RNA干扰(RNAi)是与mRNA或细胞的基因/基因片段互补的外来、双股RNA(dsRNA)导入细胞中,专一性结合至特定的mRNA与/或基因,因而破坏基因表现。已经证实这个技术在果蝇、秀丽隐杆线虫(Caenorhabditiselegans)、植物中有效,以及最近也正在哺乳动物细胞培养中有效。为了使用这个技术结合本发明,本发明的转座子较佳包含编码小的干扰RNA(SiRNA)的短hairpin表现匣(shorthairpinexpressioncassettes),与细胞的mRNA与/或基因/基因片段互补。这些siRNA具有较佳长度为20至30核苷酸,更佳的长度为20至25核苷酸,以及最佳长度为21至23核苷酸。所述siRNA可针对任何mRNA与/或基因,编码上述定义的任何蛋白质,例如致癌基因(oncogene)。使用哺乳动物piggyBac转座子用于插入siRNA载体至宿主基因组中,在体外或体内提供长期表现siRNA,因而可长期消音(silencing)特定基因产物。诱导式分化多能的干细胞(iPS)在一些较佳实施例中,本发明可包含再计划的载体(!^programmingvector),所述载体包含多作用子的(polycistronic)表现匣,所述表现匣包括转录调节因子、一或多个再计划因子以及一或多个本申请所述的高活性PiggyBac转座子。较佳地,编码再计划因子是Sox、Oct、Nanog,Klf4或c-Myc。通常,干细胞是未分化的细胞,可以进行连续的成熟功能细胞。例如,血液前驱干细胞可成为任何不同形式最终分化的血液细胞。胚胎干(ES)细胞是来自于胚胎并且是分化多能的,因而具有发展成为任何器官或组织形式的能力,或是至少有潜力成为完整的胚胎。诱导式分化多能的干细胞通常简称为iPS细胞或是IPSCs,是分化多能的干细胞形式,是人工取得自非分化多能的细胞,通常是成人体细胞,插入一些基因。例如在表现一些干细胞基因、蛋白质与染色质甲基化图案、分裂时间、胚样体形成、畸胎瘤形成、存活的嵌合体形成以及潜力与分化能力,诱导式分化多能的干细胞被认为和例如胚胎干细胞的自然分化多能干细胞相同,但是整体内容与自然分化多能干细胞的关系仍被评估。2006年首次从老鼠细胞产生iPS(Takahashietal.,2006,并入本申请作为参考),以及2007年从人类细胞产生iPS细胞(Takahashietal.,2007,并入本申请作为参考)。在干细胞研究中已经被引用成为重要的成就,使得研究人员能得到分化多能的干细胞,这对于研究是重要的,并且潜在具有治疗使用,而没有胚胎使用的争议问题。“再计划(!^programming)”是指在培养或在体内,能使形成至少一种新细胞形式的能力增加的程序,所述能力增加是指相较于相同条件下没有再计划的结果。更特别地,再计划是指使体细胞具有分化多能潜力的程序。这是指如果在再计划之前没有所述子代可实质形成,而在足够的增生之后,具有新细胞型式表现型特征的子代有可测量的比例;否则,具有新细胞型式特征的比例测量上多于在再计划之前。在一些条件下,在增加偏好的程度上,具有新细胞型式特征的子代比例可至少约为1^^5^^25%或更多。胚胎干(EQ细胞是得自于早期胚胎的分化多能干细胞。ES细胞最先是在1981年建立,自1989年开始用于产生基因剔除鼠(knockoutmice)0在1998年,人类ES细胞建立,目前成为再生医学应用。不同于ES细胞,组织干细胞具有有限的分化潜力。组织干细胞存在组织中特定位置,并且具有未分化的细胞内结构。因此,组织干细胞的分活多能性较低。组织干细胞具有较高的核/质比例,以及具有一些细胞内胞器。大部分的组织干细胞具有低的分化多能性、长细胞周期以及分化能力超过个体生命。组织干细胞依取得位置分类,例如皮肤系统、消化系统、骨髓系统、神经系统等。皮肤系统的组织干细胞包含表皮干细胞、毛囊干细胞等。消化系统的组织干细胞包含胰脏(共同)干细胞、肝脏干细胞等。骨髓系统的组织干细胞包含血液前驱干细胞、间叶干细胞等。神经系统的干细胞包含神经干细胞、视网膜干细胞等。“诱导式分化多能的干细胞”通常简称为iPS细胞或iPSC,是指从非分化多能细胞人工取得的分化多能干细胞型式,典型是从成人体细胞或最终分化的细胞,例如纤维母细胞、血液前驱细胞、单核细胞、神经、表皮细胞等,插入一些基因,称为再计划因子。iPS细胞的产生对于用于诱导的基因是很重要的。以下的因子或其结合可用于本发明中。在一些方面中,编码Sox与Oct(较佳为0ct3/4)的核苷酸可包含在再计划因子中。例如,再计划因子可包括编码Sox2、0ct4、Nanog与Lin-观的表现匣,或是编码Sox2、0ct4、Klf4与c-myc的表现匣。编码这些再计划因子核苷酸可包括在相同的表现匣、不同表现匣、相同再计划载体或不同再计划载体中。已经辨识0ct-3/4与一些Sox基因家族成员(Soxl,Sox2,Sox3与SoxM)成为参与诱导过程中的重要转录调节因子,若缺乏则无法诱导。然而,已经辨识包含一些Klf家族(KIfl,Klf2,Klf4,andKlf5)成员、Myc家族(C-myc,L-myc与N-myc),Nanog与LIN28的其它基因可增加诱导效率。0ct-3/4(PoU5fl)是八聚体(Oct)转录因子家族之一,并且对于维持分化多能性具有重要作用。在Oct-3/4+细胞例如胚叶细胞(blastomeres)与胚胎干细胞中,缺乏Oct-3/4会造成自发性的滋胚层(trophoblast)分化,以及Oct-3/4的存在造成胚胎干细胞的分化多能与分化潜力。“Oct”家族的许多其它基因包含Oct-3/4相关的Octl与0ct6,不能引发诱导,因而在诱导程序中呈现Oct-3/4排斥性。类似Oct-3/4,基因的Sox家族与维持分化多能性相关,虽然相较于0ct_3/4,也与多分化潜能与单分化潜能干细胞相关,Oct-3/4只表现在多分化潜能干细胞中。虽然Sox2适用于诱导的初始基因(Yamanakaetal.(2007),Jaenischetal.(1988)andYuetal.O007)),已经发现Sox家族的其它基因也在诱导程序中作用。Soxl产生iPS细胞的效率如同Sox2,以及基因Sox3、Sox15与Soxl8也产生iPS细胞,但效率较低。在胚胎干细胞中,促进分化多能需要至少一Oct成员例如Oct-3/4与至少一Sox成员例如Sox2。虽然Yuetal.(2007)已经报到Nanog可能是产生iPS细胞的因子之一,以及Nanog促进再计划效率与剂量相关,但Yamanakaetal.(2007)报导诱导不需要Nanog。Klf家族的Klf4最初是由Yamanaka等人辨识,以及由Jaenisch等人(1988)确认为产生老鼠iPS细胞的因子,并且由Yamanaka等人Q007)说明为产生人类iPS细胞的因子。然而,Thompson等人报导人类iPS细胞的产生不需要Klf4,以及Klf4无法产生人类iPS细胞。发现Klf2与Klf4可产生iPS细胞,以及相关基因Klfl与Klf5也可以产生iPS细胞,但效率较低。Myc家族基因是与癌症相关的前致癌基因。Yamanaka等人与Jaenisch等人(1988)说明c-myc是参与产生老鼠iPS细胞的因子,以及Yamanaka等人说明它是参与产生人类iPS细胞的因子。然而,Thomson等人与Yamanaka等人Q007)报导产生人类iPS细胞不需要c-myc。在诱导iPS细胞中使用“myc”家族困扰在于iPS细胞最终要做为临床治疗,而c-myc诱导的iPS细胞转殖的老鼠有25%会发展致命的畸胎瘤。已经辨识N-myc与L-myc取代c-myc会诱导相似的效率。医药组合物本发明更提供医药组合物,包含piggyBac转座酶作为蛋白质或是由核苷酸编码,与/或高活性PiggyBac转座子,或本申请所述的基因转移系统,包括piggrBac转座酶作为蛋白质或是由核苷酸编码,结合高活性PiggyBac转座子。所述医药组合物的提供可选择性结合医药上可接受的载体、辅剂或或运送体。在本申请中,根据本发明,医药上可接受的载体、辅剂或运送体是指无毒性载体、辅剂或运送体,不会破坏配方成分的医药活性。本发明组合物使用的医药上可接受的载体、辅剂或运送体包含但不限于离子交换剂、氧化铝、硬脂酸铝、卵磷脂、血清蛋白,例如人类血清白蛋白、缓冲物质例如磷酸盐、甘胺酸、山梨酸、己二烯酸钾、饱和蔬菜脂肪酸的部分甘油酯混合物、水、盐或电解质、氯化钠、锌盐、硅酸胶、三硅酸镁、聚乙烯四氢咯酮、纤维素为基础的物质、聚乙二醇、羧甲基纤维素钠、聚丙烯酸酯、蜡、聚乙烯-聚氧丙烯-块聚合物、聚乙烯二醇以及羊毛脂。本发明的医药组合物可口服、非口服投与、吸入喷洒、局部、直肠、鼻腔、脸颊、阴道投与或是经由植入的储存器。本申请所使用的非口服一词包含皮下、血管内、肌肉内、关节内、滑液内、胸骨内、脑脊髓膜内、肝内、intralesional以及颅内注射或灌注技术。较佳地,所述医药组合物是口服、腹膜内或血管内投与。本发明医药组合物的无菌注射形式可为水溶液或油性悬浮液。可根据此技艺中已知的技术调配这些悬浮液,使用合适的分散或湿润剂以及悬浮试剂。所述无菌可注射的制备也可为无菌可注射的溶液或无毒非口无可接受的稀释剂或溶剂中的悬浮液,例如在1,3_丁二醇中的溶液。在这些可接受的运送体与溶剂中,可使用水、Ringer’s溶液以及等渗透压的氯化钠溶液。除此之外,习知使用无菌、定性油作为溶剂或悬浮媒介。为此目的,可使用任何温和的定性油,包含合成的单或二甘油酯。例如十八烯酸与其甘油酯衍生物的脂肪酸可用于制备注射剂,可以是自然医药与液或悬浮液也可包含长链的醇类稀释剂或分散剂,例如羧甲基纤维素或类似的分散剂,通常使用在医药可接受剂量形式的配方中,包含乳剂与悬浮液。为了配方的目的,也可使用其它通常使用的接口活性剂,例如Tweens、Spans与其它乳化剂或生物可用性的促进剂,通常使用在医药可接受的固体、液体或其它剂量形式的制造中。本发明医药可接受的组合物可用任何口服可接受的剂量形式口服投与,包含但不限于胶囊、锭剂、水溶液悬浮液或溶液。例如使用锭剂作为口服使用,通常使用的载体包含乳糖与玉米淀粉。典型添加例如硬脂酸镁的润滑剂。对于口服投与胶囊形式,有用的稀释剂包含乳糖与干燥的玉米淀粉。当需要水溶液悬浮液作为口服使用时,活性成分结合乳化与悬浮剂。若需要,也可增加一些增甜、气味或颜色剂。或者,本发明医药可接受的组合物可以是栓剂形式用于直肠投与。可混合本发明的基因转移系统或其成分与合适的非刺激赋形剂制备这些组合物,所述非刺激赋形剂在室温为固体而在直肠温度则为液体,因此会在直肠融化,释放所述药物。所述材料包含可可油、蜜蜡以及聚乙烯二醇。本发明医药可接受的组合物也可局部投与,特别是当处理目标包含可局部使用处理的区域或器官,包含眼疾、皮肤或较低肠道。合适的局部配方可制备用于这些区域或器官中。对于局部使用,所述医药可接受的组合物可调配在合适的药膏中,包含本发明的基因转移系统或其成分,悬浮或溶解在一或多载体中。本发明局部投予的成分载体包含但不限于矿物油、液体矿脂、白矿脂、聚乙烯二醇、聚氧乙烯、聚氧乙烯成分、乳化蜡与水。或者,所述医药可接受的组合物可调配在合适的乳液或霜中,包含所述活性成分悬浮或溶解在一或多医药可接受的载体中。合适的载体包含但不限于矿物油、去水山梨醇单硬脂酸酯、聚山梨醇酯60、十六醇酯蜡、鲸腊醇、2-辛基十二烷醇、苯甲醇与水。对于眼部使用,所述医药可接受的组合物可调配成为在等渗透压、pH调整无菌盐水中的粒子化悬浮液或较佳为在等渗透压、PH调整无菌盐水中的溶液,具有或没有例如苯扎氯铵的防腐剂。或者,对于眼部使用,所述医药可接受的组合物可调配在膏药中,例如矿脂。本发明医药可接受的组合物也可鼻腔投与或吸入。根据医药配方技艺中已知的技术,制备此组合物,以及所述组合物可制备为盐水中的溶液、使用苯甲醇或其它合适的防腐剂、吸收促进剂增进生物可用性、氟碳化物与/或其它习知的溶解或分散剂。依待处理的宿主与特定的投与形式,本发明成分的量可结合载体材料产生单剂量形式的组合物。必须注意对于任何特定病患,特定剂量与处理方法取决于不同因子,包含使用特定成分的活性、年龄、体重、一般健康、性别、饮食、投与时间、排泄率、药物结合与治疗医师的评估以及待处理疾病的严重程度。组合物中本发明成分的量取决于组合物中的特定成分。所述医药组合物较佳适合治疗疾病,由基因缺陷造成的特定疾病,例如囊性纤维变性、高胆固醇血症、血友病、免疫缺陷,包含HIV、亨汀顿氏舞蹈病、阿法-抗-胰蛋白酶缺陷、直肠癌、黑色素瘤、肾癌、淋巴癌、急性骨髓白血病(AML)、急性淋巴白血病(ALL)、慢性骨髓性白血病(CML)、慢性淋巴白血病(CLL)、肠胃道肿瘤、肺癌、神经胶瘤、甲状腺癌、乳癌、前列腺癌、肝癌、病毒诱发的肿瘤例如乳突瘤病毒诱导的癌症(例如子宫颈癌)、腺病毒癌、疱疹病毒诱发的肿瘤(例如Burkitt淋巴癌、EBV诱发的B细胞淋巴癌)、B型肝炎诱发的肿瘤(肝细胞癌)、HTLV-1与HTLV-2诱发的淋巴癌、肺癌、咽癌、肛门直肠癌、神经胶母细胞瘤、淋巴癌、直肠癌、星状细胞瘤、脑癌、胃癌、视网膜母细胞瘤、基底细胞癌、脑转移、髓母细胞瘤、阴道癌、胰脏癌、睪丸癌、黑色素瘤、膀胱癌、霍奇综合症、脑膜瘤、Schneeberger'sdisease、支气管癌、脑下垂体癌、蕈状肉芽肿、咽喉癌、乳癌、神经纤维瘤、眼睑肿瘤、Burkitt淋巴癌、喉癌、胸腺瘤、子宫体癌、骨癌、非霍奇淋巴癌、尿道癌、CUP综合症、寡树突神经胶质瘤、外阴癌、肠癌、食道癌、小肠肿瘤、颅咽瘤、卵巢癌、肝癌、血癌或皮肤或眼睛的癌症。套组本发明特征在于套组,包括PiggyBac转座酶作为蛋白质或由核苷酸编码,与/或高活性PiggyBac转座子;或本申请所述的基因转移系统,包括PiggyBac转座酶作为蛋白质或由核苷酸编码,结合高活性PiggyBac转座子;视需要结合医药可接受的载体、赋形剂或运送体,以及视需要结合使用说明。本发明套组的任何成分可连续或平行投与以及/或转染至细胞中,例如在投与且/或转染本发明高活性转座子之前、同时或之后,PiggyBac转座酶蛋白质或其编码核苷酸可被投与以及/或转染至细胞中。或者,在转染PiggyBac转座酶蛋白质或其编码核苷酸之前、同时或之后,所述高活性PiggyBac转座子可转染至细胞中。如果是平行转染,较佳是两种成分提供在不同的配方且/或在投与前直接彼此混合,避免在转染前转座。除此之外,可依时间模式投与且/或转染套组的至少一成分,例如投与多次剂量的此成分。以下范例提供完整的揭露内容给熟知此技艺的人士,描述如何制造与使用本发明的分析、筛选以及治疗方法,并且不限制本发明的范围。范例范例1.辨识合并缺陷的ρiggyBac变异本申请的实验使用产生红荧光蛋白质的Cherry基因,描述筛选与辨识切割PiggyBac转座子。把piggyBac转座子放入所述基因中,将所述基因去活化,因而细胞不是红色。然而,PiggyBac切割回复所述基因,造成产生红色荧光蛋白质。因此,红色群落颜色增加代表突变切割更佳。使用突变PCR,转殖到酵母菌的表现载体中,完成许多突变转座酶基因的收集。在洋菜盘上生长包含各个突变的群落,而后用红色荧光检视。图4说明已经分离的切割高活性。在一些较佳实施例中,合并缺陷的PiggyBac包括野生型piggyBac序列中的胺基酸改变,相当于SEQIDNO:2。较佳地,所述胺基酸改变是R371A、R373A或R371A、R373A。在较佳实施例中,合并缺陷的piggyBac相当于SEQIDNO:64、SEQIDNO:65或SEQIDNO66的胺基酸序列。范例2.辨识高活性变异使用合并缺陷的piggyBac突变作为起始点,本申请的发明人已经辨识高活性piggyBac转座子突变。酵母菌切割分析如MitraR.等人所述(piggyBaccanbypassDNAsynthesisduringcutandpastetransposition.EMBOJ.Apr9;27(7):1097-109.Epub2008Mar20)用于辨识高活性突变株。使用突变PCR与侧接ORF引子作为表现建构,突变化PiggyBac0RF,而后共同转型(co-transformation)PCR产物与有间隙的piggyBac质体至包含ura-至ura+匣的酵母菌分析株中回复转型,其中转座子切割造成ura+群落形成。在SC-Trp-His盘上回复转型株之后,把群落悬浮在水中,点在缺少尿嘧啶的盘上,来辨识切割。在这些点测试中比较突变转型株与野生型的ura+群落数目,辨识潜在的高活性变异株。而后纯化每一个高活性候选株,并且再次定量分析切割。而后悬浮包含来自确认高活25性的PiggyBac基因的质体DNA,来辨识piggyBac基因突变以及造成的胺基酸改变。胺基酸改变与对应的核苷酸改变如表1所示,如下L15PCUG变成CCGD19N/F395LGAC变成MC/UUU变成CUUS31P/T164AUCA变成CCA/ACA变成GCAH33YCAC变成UACE44K/K334RGAA变成AAA/AAG变成AGGE45GGAA变成GGAC97R/T242IUGU变成CGU/ACU变成AUUS103PUCC变成CCCR189K/G120GAGA变成AAA/GGU变成GGCR189R/D450N/R526RAGA变成AGG/GAC变成AACM194TAUG变成ACGM194VAUG变成GUGS213S/V436IAGU变成AGCI221TAUA变成ACA在M6+之间的S373PUCA变成CCAN384TAAC变成ACCC453S/N571SUGU变成AGU/AAU变成AGUT560AACU变成GCUN571SAAU变成AAGS573AUCG变成GCGS584PUCU变成CCUM589VAUG变成GUGM589V/D170DATG变成GUG/GAC变成GAUS592GAGU变成GGUF594LUUC变成TTA停止/WLESCNTGA变成TGG停止595ELESCN/H33HTGA变成GGA/CAC变成CAU突变株C图1中的表2显示从野生型(正常化至1)胺基酸改变与折迭增加的一些高活性高活性突变可发生在转座酶的任何位置,以及预期会发现许多更高活性的PiggyBac变异。这些变异可能是单个胺基酸改变或是多个胺基酸改变。可使用酵母菌分析作为筛选辨识变异。可使用整个基因的PCR突变以及目标突变,使用较小的PiggyBac片段或寡核苷酸的突变,针对已辨识具有高活性的突变区域。范例3.使用高活性转座子的诱导型分化多能干细胞在一些实施例中,可使用高活性piggyBac转座子,产生使用最少基因组的诱导型分活多能干细胞。特别地,使用0ct3/4、SoX2、Klf4与c-myc作为最小的基因组。Takahashietal.(Cell,131,861-872,November30,2007)全文并入本申请作为参考,教导使用0ct3/4、SoX2、Klf4与c-myc,从人类皮肤纤维母细胞产生诱导型分化多能干细胞(iPS)的方法。其它范例由上述说明,显然可对本申请所述的内容进行变化与修饰而因应不同的使用与条件。所述实施例仍落于本申请权利要求的范围内。本申请可变因素的任何定义中组件表列包含所列示组件的单一组件或组合的定义。本申请实施例包含作为单一实施例或任何实施例的组合或任何部份的组合。本申请内容中所有专利与公开案皆并入本申请作为参考。权利要求1.一种转座子,包括一或多高活性PiggyBac核苷酸序列以及保留转座子活性的变异、衍生物与片段。2.如权利要求1所述的转座子,其中相较于野生型PiggyBac转座子,所述高活性PiggyBac转座子具有较高程度的转座切割。3.如权利要求1所述的转座子,包括2、3、4、5或更多高活性piggyBac核苷酸序列以及保留转座子活性的变异、衍生物与片段。4.如权利要求1所述的转座子,其中所述高活性PiggyBac核苷酸序列是来自Noctuidae属。5.如权利要求1所述的转座子,其中所述高活性PiggyBac核苷酸序列是来自粉斑夜蛾物种。6.如权利要求1所述的转座子,包括选自SEQIDN0:34-SEQIDNO:63或SEQIDNO:70SEQIDNO:96的核苷酸序列。7.如权利要求6所述的转座子,其中所述核苷酸序列编码选自SEQIDN0:3-SEQIDNO32的胺基酸序列。8.一种转座子,包括一或多合并缺陷的piggyBac核苷酸序列以及其变异、衍生物与片段。9.如权利要求8所述的转座子,其中相较于野生型piggyBac转座子,所述合并缺陷的PiggyBac转座子具有较低的合并率。10.如权利要求8所述的转座子,其中所述合并缺陷的piggyBac核苷酸序列是来自Noctuidae属。11.如权利要求8所述的转座子,其中所述合并缺陷的piggyBac核苷酸序列是来自粉斑夜蛾物种。12.如权利要求8所述的转座子,包括选自SEQIDN0:67-SEQIDNO:69的核苷酸序列。13.如权利要求12所述的转座子,其中所述核苷酸序列编码选自SEQIDNO:64_SEQIDNO66的胺基酸序列。14.如权利要求2或9所述的转座子,其中所述野生型piggyBac转座子包括相当于SEQIDNO1的核苷酸序列。15.如权利要求1或8所述的转座子,其中所述转座子可插入至细胞的DNA中。16.如权利要求1或8所述的转座子,其中所述转座子更包括标示蛋白质。17.如权利要求1或8所述的转座子,其中所述转座子插入质体中。18.如权利要求17所述的转座子,其中所述转座子更包括至少一部份的开放读架。19.如权利要求17所述的转座子,其中所述转座子更包括至少一表现控制区域。20.如权利要求17所述的转座子,其中所述表现控制区域是选自启动子、促进子或消首子。21.如权利要求17所述的转座子,其中所述转座子更包括启动子操作连结到至少一部份的开放读架。22.如权利要求15所述的转座子,其中所述细胞是来自于动物。23.如权利要求22所述的转座子,其中所述细胞是来自于脊椎动物或无脊椎动物。24.如权利要求17所述的转座子,其中所述脊椎动物是哺乳动物。25.—种基因转移系统,包括;根据权利要求1或权利要求8的转座子;以及PiggyBac转座酶。26.如权利要求25所述的基因转移系统,其中所述PiggyBac转座酶是来自NoctuidaejMο27.如权利要求沈所述的基因转移系统,其中所述piggyBac转座酶是来自粉斑夜蛾物种。28.如权利要求27所述的基因转移系统,其中所述piggyBac转座酶包括相当于SEQIDNO33的胺基酸序列。29.如权利要求25所述的基因转移系统,其中所述piggyBac转座酶是哺乳动物piggyBac转座Bi。30.如权利要求25所述的基因转移系统,其中所述转座子插入所述细胞的基因组中。31.如权利要求30所述的基因转移系统,其中所述细胞是来自动物。32.如权利要求30所述的基因转移系统,其中所述细胞是来自脊椎动物或无脊椎动物。33.如权利要求32所述的基因转移系统,其中所述脊椎动物是哺乳动物。34.一种包括权利要求1的所述转座子的细胞。35.一种包括权利要求8的所述转座子的细胞。36.一种医药组合物,包括包括高活性piggyBac核苷酸序列的转座子与piggyBac转座酶,连同医药可接受的载体、赋形剂或运送体。37.一种用于导入外来DNA至细胞中的方法,包括使所述细胞接触权利要求25所述的基因转移系统,因而导入外来DNA至细胞中。38.如权利要求37所述的方法,其中所述细胞是干细胞。39.一种套组,包括包括高活性核苷酸序列的转座子以及用于导入DNA至细胞中的说明。40.如权利要求39所述的套组,其中所述高活性piggyBac核苷酸序列是来自Noctuidae属。41.如权利要求39所述的套组,其中所述高活性piggyBac核苷酸序列是来自粉斑夜蛾物种。42.如权利要求39所述的套组,包括选自SEQIDNO:34_SEQIDNO:63或SEQIDNO:70-SEQIDNO:96的核苷酸序列。43.一种套组,包括包括合并缺陷的piggyBac核苷酸序列的转座子以及使用说明。44.如权利要求43所述的套组,包括选自SEQIDNO:67_SEQIDNO:69的核苷酸序列。全文摘要本发明提供高活性piggyBac转座子,特别是来自粉斑夜蛾的高活性piggyBac转座子,它的转座频率比野生型高。本发明特征也在于合并缺陷的piggyBac转座子。可在基因转移系统中使用piggyBac转座子与转座酶,用于稳定导入核苷酸至细胞的DNA中。所述基因转移系统可用于方法例如但不限于基因治疗、插入突变或基因发现。文档编号A61K48/00GK102421902SQ201080017915公开日2012年4月18日申请日期2010年2月25日优先权日2009年2月25日发明者N·L·克雷格申请人:约翰·霍普金斯大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1