用于预测肽的免疫原性的系统和方法
【专利摘要】本发明提供了预测肽的免疫原性的系统、计算机可读存储介质和方法。在某些情况下,所述系统包含:a)肽的模型、MHCII蛋白的模型和T细胞受体的模型;和b)用于以下的可执行程序:(i)评估包含所述肽、所述MHCII蛋白和所述T细胞受体的复合物的分子间相互作用的强度以提供预测所述肽的免疫原性的得分;和(ii)输出所述得分。
【专利说明】用于预测肽的免疫原性的系统和方法
[0001] 相关申请的交叉引用
[0002] 本申请要求于2012年5月25日提交的美国临时申请61/652, 076的优先权,所述 临时申请以引用的方式全文纳入本文。
【背景技术】
[0003] 从天然来源分离的或通过重组方法合成的人治疗性蛋白质(生物制剂)在被给予 人类患者时能诱导免疫应答。这些免疫应答可导致的作用范围为从轻微的皮肤刺激到治疗 药物的效力下降,并且在一些情况下可造成器官衰竭或死亡。减轻潜在的免疫原性是蛋白 质工程的主要挑战之一。因此,使得能够对蛋白质的免疫原性进行临床前评估的工具和测 定法可能是重要的。
【专利附图】
【附图说明】
[0004] 技术人员会理解下面描述的附图仅是为了说明的目的。所述附图并不意欲以任何 方式限制本教导的范围。
[0005] 图1示出了可用于实施图2所示的方法的计算机系统的一个示例性的实施方案。
[0006] 图2示出了用于预测肽的免疫原性的方法的一个示例性的实施方案的一些特征。
[0007] 图3示出了可以用来实施图2中所示的方法的方式。
【发明内容】
[0008] 提供了一种计算机系统。在某些实施方案中,所述计算机系统包含存储器,所述存 储器包含:a)肽的模型、MHCII的模型和T细胞受体的模型;和b)用于以下的可执行程序: (i)评估包含所述肽、所述MHCII蛋白和所述T细胞受体的复合物的分子间相互作用的强度 以提供预测所述肽的免疫原性的得分;和(ii)输出所述得分。所述存储器还可包含用于在 所述计算机系统的显示器上显示所述复合物的图像的指令。
[0009] 还提供了包含免疫原性预测程序的计算机可读存储介质。在这些实施方案中,如 上所述,所述介质可包含用于以下的指令:a)评估包含肽、MHCII蛋白和T细胞受体的复合 物的分子间相互作用的强度以提供预测所述肽的免疫原性的得分;和b)输出所述得分。在 某些实施方案中,所述免疫原性预测程序包含用于以下的指令:a)评估每一种均包含肽、 MHCII蛋白和T细胞受体的多种复合物的分子间相互作用的强度,其中所述复合物包含不 同的肽并且所述指令产生每一种复合物的得分;b)通过所述不同的肽的得分将它们排序 (rank);和c)输出根据它们的得分排序的所述不同的肽的列表,从而提供了所述肽的免疫 学特征(immunological profile) 〇
[0010] 还提供了预测肽的免疫原性的方法。在某些实施方案中,所述方法包含:a)将所 述肽的序列信息输入到包含免疫原性预测程序的系统中,所述免疫原性预测程序包含用于 以下的指令:(i)评估包含所述肽、MHCII蛋白和T细胞受体的复合物的分子间相互作用的 强度,以提供预测所述肽的免疫原性的得分;和(ii)输出所述得分;b)执行所述免疫原性 预测程序;和C)从所述系统接收所述得分。在某些实施方案中,所述方法还包括:d)将所 述得分排序。
[0011] 本文列出了本教导的这些和其他特征。
[0012] 定义
[0013] 在更详细地描述示例性的实施方案之前,列出下面的定义以阐明和定义在本说明 书中使用的术语的含义和范围。
[0014] 本文中的"免疫原性"和语法上的同义词意指免疫应答的程度,所述免疫应答,包 括但不限于,中和抗体和非中和抗体的产生、免疫复合物的形成、补体激活、肥大细胞激活、 炎症和过敏反应。免疫原性具有物种特异性。在一些实施方案中,免疫原性是指在人类中 的免疫原性。在一些实施方案中,免疫原性是指在啮齿动物(包括但不限于,大鼠、小鼠、仓 鼠、豚鼠等)、灵长类动物、农场动物(包括但不限于,绵羊、山羊、猪、牛、马等)和家畜(包 括但不限于,猫、狗、兔等)中的免疫原性。
[0015] 本文中的"免疫应答"和"免疫学应答"以及语法上的同义词意指
[0016] 免疫系统对分子的应答,包括体液免疫应答或细胞免疫应答。非限制性的免疫应 答包括中和抗体和非中和抗体的产生、免疫复合物的形成、补体激活、肥大细胞激活、炎症 和过敏反应。
[0017] 本文中的"预测"意指在没有真正给药的情况下,系统或测定法在脊椎动物中充当 体内免疫原性的替代物并概括或模拟治疗性给药的免疫原性结果或应答的能力。即,如果 系统能够合理精确地证明一一如果蛋白质抗原已被给药,其会引起或不会引起免疫原性应 答,则该系统或测定法可预测脊椎动物免疫原性。
[0018] 本文中的"增强的免疫原性"和语法上的同义词意指与对照(例如,未修饰的蛋白 质)相比时的增强的激活免疫系统的能力。例如,如果经修饰的蛋白质与未经修饰的蛋白 质相比以更高的效价或在更多的受试者中引起中和抗体或非中和抗体,则该经修饰的蛋白 质可被称为具有"增强的免疫原性"。在具体的实施方案中,产生中和抗体的可能性提高了 至少5%,例如至少2倍或至少5倍。例如,如果未经修饰的蛋白质在10%的受试者中产生 免疫应答,则具有增强的免疫原性的变体会在10%以上的受试者(例如,20%以上或50% 以上的受试者)中产生免疫应答。如果经修饰的蛋白质与亲本蛋白质相比显示出对一种或 多种MHCI或MHCII等位基因的增强的结合或者如果其在更多的受试者中诱导T细胞激活, 则该经修饰的蛋白质可被称为具有"增强的免疫原性"。在一些实施方案中,T细胞激活的 可能性增加了至少5%,例如至少2倍或至少5倍。
[0019] 本文中的"降低的免疫原性"和语法上的同义词意指与对照(例如,未修饰的蛋白 质)相比时降低的激活免疫系统的能力。例如,如果治疗剂是蛋白质,如果经修饰的蛋白质 与未经修饰的蛋白质相比以更低的效价或在更少的受试者中引起中和抗体或非中和抗体, 则该经修饰的蛋白质可被称为具有"降低的免疫原性"。在一些实施方案中,产生中和抗体 的可能性降低了,例如至少5%、至少50 %或至少90%。例如,如果亲本蛋白质在10 %的 受试者中产生免疫应答,则具有降低的免疫原性的经修饰的蛋白质会在低于10%的受试者 (例如,低于5%或低于1%的受试者)中产生免疫应答。如果经修饰的蛋白质与亲本蛋白 质相比显示出对一种或多种MHCI或MHCII等位基因的降低的结合或者如果其在更少的受 试者中诱导T细胞激活,则该经修饰的蛋白质也可被称为具有"降低的免疫原性"。在一些 实施方案中,T细胞激活的可能性降低了至少5%,例如至少50%或至少90%。
[0020] 本文中的"免疫刺激"和语法上的同义词意指刺激与在其他部分(例如蛋白质的 免疫惰性部分)中产生的免疫应答相比更强的免疫应答的蛋白质的一部分。
[0021] 本文中的"免疫惰性"和语法上的同义词意指不刺激免疫应答的蛋白质的一部分。
[0022] 术语"MHCI "和" I类MHC"包括任何人I类MHC分子,其包括HLA-A、HLA-B和HLA-C 的所有天然存在的序列变体,以及来自其他物种的等同分子。
[0023] 术语"MHCII"和"II类MHC"包括任何人II类MHC分子,其包括DRA、DRB1、 DRB3/4/5、DQA1、DQB1和DPB1分子的所有天然存在的序列变体,以及来自其他物种的等同 分子。
[0024] 本文使用的术语"TCR"和"T细胞受体"用于指任何人T细胞受体、和来自其他物 种的那些。
[0025] 本文中使用的术语"输入"用于指将信息输入计算机的任何方式。例如,在某些情 况下,输入可包括选择已存在于计算机系统上的序列或模型。在其他情况下,输入可包括将 序列或模型添加到计算机系统中。可使用用户界面进行输入。
[0026] 本文中使用的术语"执行"用于指用户所采取的启动程序的动作。
[0027] 本文中使用的术语"对接"是指将两个或多个单独的蛋白质组装成复合物的计算 过程。
[0028] 本文中使用的术语"评估分子间相互作用的强度"是指任何用于测量两个或多 个蛋白如何很好地与彼此结合的方法,包括测量亲和力、互补性、能量支持(energetic favorability)(其可被测量为自由能的差异)等的方法。
[0029] 在输入序列信息的上下文下,本文中使用的术语"序列信息"旨在包括输入序列的 标识符(identifier)、输入序列和输入序列的结构信息(例如,序列的原子坐标)。
[0030] 本文中使用的术语"接收"用于指通常以人类可读的形式(例如,以图形或文本文 件的形式)将信息从计算机系统的存储器传送到用户。该术语旨在包括将图像传送到计算 机监视器的屏幕、以及通过电子手段(例如,通过电子邮件等)将文件传送给用户。
[0031] 在任何实施方案中,可将数据转发到"远程位置",其中"远程位置"意指除了所述 程序在其中执行的位置以外的位置。例如,远程位置可以是在同一城市的另一位置(例如, 办公室、实验室等)、在不同城市的另一位置、在不同州的另一位置、在不同国家的另一位置 等。因此,当一个项目被指示为另一个的"远离的"时,则意味着这两个项目可以在同一房 间中,但是是分开的,或者至少在不同的房间中或不同的建筑物中,并且可以相距至少一英 里、十英里或至少一百英里。"传送"信息是指将代表该信息的数据作为电信号通过适合的 通信渠道(例如,私人或公共网络)传输。"转发"项目是指使该项目从一个位置到下一个 位置的任何方式,无论是通过物理运输(physically transport)该项目还是通过别的方式 (在可能时),并且包括(至少在数据的情况下),物理运输携带数据的介质或传送数据。通 信介质的实例包括无线电或红外传输通道以及与另一计算机的网络连接或联网设备,以及 互联网或者包括电子邮件传输和在网站之上记录的信息等等。
[0032] 本文使用的术语"模型"是指任何方式的蛋白质三维结构的代表性数据。在一些 情况下,模型可表示为例如一组原子坐标或电子密度图。可以理解的是,当在下面的说明书 中提到蛋白质的结构时,其是被提及的蛋白质的代表(即,所述蛋白质的模型而不是蛋白 质分子本身)。同样地,当提到复合物的相互作用时,其是指被预测在所提及的复合物模型 中发生的相互作用。蛋白质的模型可包括翻译后修饰(例如,磷酸化或糖基化等)的结构 信息(例如,原子坐标)。在一些实施方案中,可通过对蛋白质进行X射线晶体学分析产生 "模型"。在其他实施方案中,可通过同源建模一一即,使用高度相关的蛋白质的模型模拟蛋 白质的氨基酸序列一一产生模型。
[0033] 本文使用的术语"MHCII蛋白"和"T细胞受体"是指结合到肽上的那些蛋白质的 至少一部分。因此,在某些实施方案中,可使用MHCII蛋白的肽结合槽的模型、T细胞受体 蛋白的CDR3区域的模型以及所述肽的模型进行下述方法。在某些情况下,可使用这些蛋白 质的其他部分的模型(例如,所述T细胞受体的CDR1区域和CDR2区域、或所述MHCII蛋白 的T细胞结合表面)。
【具体实施方式】
[0034] 本公开内容提供了用于预测肽的免疫原性的系统、计算机可读存储介质以及方 法。使用该系统、计算机可读存储介质或方法,可在研宄和开发过程的早期评估肽的免疫原 性,其中可获得大量候选物用于筛选。在某些情况下,在药物开发过程中,使用本发明的方 法可降低或消除通过实验方法(例如,使用体外或体内测定法)测量候选生物活性蛋白质 的免疫原性的需要。这种实验方法可能是资源密集型的且是相对缓慢的。
[0035] 在描述各个实施方案之前,应理解,本公开内容的教导不限于所描述的具体实施 例,并因此,当然是可以变化的。还应理解,本文使用的术语仅仅是为了描述具体实施方案 的目的,但不意欲进行限定,因为本教导的范围将仅由所附的权利要求书来限定。
[0036] 本文使用的部分标题仅仅是为了组织目的,不应被解释为以任何方式限制本发明 的主题。尽管结合多个实施方案对本教导进行了描述,但是并不意味本教导将受限于这些 实施方案。相反,正如本领域技术人员将会理解的,本教导包括各种替代、修改和等价物。
[0037] 除非上下文另有明确说明,当提供值的范围时,应理解,在该范围的上限和下限之 间的每一个中间值至下限单位的十分之一、以及在该规定范围中的任何其他规定值或中间 值都包括在本公开内容内。
[0038] 除非另有说明,本文使用的所有技术术语和科学术语具有与本公开内容所属领域 的普通技术人员通常理解的的含义相同的含义。尽管在本教导的实施或测试中还可使用 和本文所述的那些相似或等同的任意方法和材料,现在对一些示例性的方法和材料进行描 述。
[0039] 对任何出版物的引用是因为其公开先于本申请日,而不应被解释为承认本申请权 利要求由于在先发明而没有资格早于这些公开物。另外,所提供的出版日期可不同于可能 需要单独确认的实际出版日期。
[0040] 除非上下文中另有明确说明,单数形式"一"、"一个"和"所述"包括复数指代对象。 还要注意,可草拟权利要求以排除任何任选要素。因此,本声明旨在作为将排他性术语(如 "单独地"、"仅"等等)用于权利要求要素的记载或使用"否定性"限定的先行基础。
[0041] 如本领域普通技术人员在阅读本公开内容时会了解的,本文所描述的和所阐明的 每一个单独的实施方案都具有离散的部件和特征,其可容易地与任何其他一些实施方案的 特征分离或结合,而不偏离本教导的范围或精神。可按照所列举事件的顺序或者逻辑上可 能的任何其它顺序实施任何所记载的方法。
[0042] 计筧机系统
[0043] 图1示出了可被用于依据下述方法预测肽的免疫原性的系统100的一个实施方 案。如本领域技术人员会理解的,很多不同的硬件选项和数据结构可用于实施下述方法。因 此,图1所示的系统是示例性的并是非限制性的。
[0044] 基本上,可将任何通用的计算机配置成用于本文所公开的方法和程序的功能性排 列(functional arrangement)。这类计算机的硬件结构是本领域技术人员已知的,并且可 包含硬件部件,所述硬件部件包括一个或多个处理器(CPU)、随机存取存储器(RAM)、只读 存储器(ROM)、内部或外部数据存储介质(如硬盘驱动器)。计算机系统还可包括一个或 多个用于处理并将图形信息输出到显示装置的图形板块。可将上述部件适当地通过计算 机内部的总线互连。所述计算机还可包括用于与通用外部部件(例如监视器、键盘、鼠标、 网络等)通讯的合适的接口。在一些实施方案中,所述计算机可以能够进行平行处理或可 以是所配置的用于平行或分布式计算的网络的一部分,以增强本发明方法和程序的处理能 力。在一些实施方案中,可将从所述存储介质读出的程序代码写入由插入于所述计算机中 的扩展板提供的或由所述计算机连接的扩展单元所提供的存储器,并且由所述扩展板或扩 展单元所提供的CPU等实际上可根据程序代码的指令执行部分或全部操作,以便完成下述 功能。在其他实施方案中,可使用云计算系统执行所述方法。在这些实施方案中,可将数据 文件和编程导出到云计算机,所述云计算机运行该程序,并将输出返回给用户。
[0045] 在某些实施方案中,系统100可包括计算机102,其包括:a)中央处理单元104 ;b) 非易失性主存储驱动器106,其可包括一个或多个用于存储软件和数据的硬盘驱动器,其中 所述存储驱动器106由磁盘控制器108控制;c)系统存储器110,例如高速随机存取存储器 (RAM),用于存储系统控制程序、数据和应用程序(包括从非易失性存储驱动器106加载的 程序和数据);d)系统存储器110还可包括只读存储器(ROM);用户界面112,其包括一个或 多个输入或输出设备,如鼠标114、键盘116和显示器118 ;e)任选的网络接口卡120,用于 连接到任何有线或无线通信网络(例如,打印机);以及f)用于将所述系统的上述元件互 连的内部总线122。
[0046] 所述计算机系统的存储器可以是可通过处理器存储检索信息的任何设备,并且可 包括磁性或光学设备、或固态存储器设备(如易失性或非易失性RAM)。存储器或存储器单 元可具有一个以上相同或不同类型的物理存储器装置(例如,存储器可具有多种存储器装 置,如多个驱动器、卡(card)或多个固态存储器装置,或它们的一些组合)。关于计算机可 读介质,"永久性存储器"是指永久性的存储器。永久性存储器不会因对计算机或处理器的 电力供应的终止而被擦除。计算机硬盘驱动器ROM(即未用作虚拟存储器的ROM)、⑶-ROM、 软盘和DVD都是永久性存储器的实例。随机存取存储器(RAM)是非永久性(即易失性)存 储器的实例。永久性存储器的文件可以是可编辑的和可重写的。
[0047] 计算机102的操作主要由操作系统124控制,其通过中央处理单元104执行。操 作系统124可存储在系统存储器110中。在一些实施方案中,操作系统124包括文件系统 126。除了操作系统124之外,系统存储器110的一种可能的实施方式还包括用于实施下述 免疫原性预测方法的多种编程文件128和数据文件130。在某些情况下,所述编程128可 包含免疫原性预测程序132,其中所述免疫原性预测程序132可包括多个模块,例如,对接 模块138、评分模块140和用户界面模块134(其允许用户在用户界面112手动选择或改变 到编程128的输入或由编程128所使用的参数。所述存储器可任选地包含用于模拟肽、MHC II蛋白和/或TCR蛋白的建模模块136,和/或排序模块142。数据文件130可包括所述 编程的各种输入,包括肽模型144、MHC II模型146和TCR模型148数据文件。编程128还 可包括图1中未示出的其他程序。例如,编程128还可包括结构预测模块,例如,从头建模 程序或最佳拟合建模程序,即,基于已知结构(由例如晶体学研宄所获得的)预测TCR和 /或MHCII氨基酸序列的结构以提供新的数据文件130 (例如,新的肽结构、新的MHCII结 构和/或新的TCR结构)的程序。在一些实施方案中,可将所述MODELER程序(Discovery Studio, Accelrys, San Diego, CA)用作所述编程128。编程128还可包含移动窗口模块,所 述移动窗口模块沿着长的蛋白质的氨基酸序列移动确定尺寸的滑动窗口以提供不同的肽 序列,如果无法获得这类肽的结构,则所述不同的肽序列可被模拟并输入到免疫原性预测 程序132。
[0048] 数据文件144、146和148中的每一个的数目可发生很大变化。在具体的情况下, 可存在每个文件各一个。但是,在一些情况下,可能有,例如,5至100个MHCII蛋白和/或 TCR蛋白模型文件,但是更大数目的文件(例如,最高达1,000个或更多)可存在于多种情 况中。在某些情况下,可能有1至100个或更多个肽模型文件144。在某些情况下,所述 肽模型文件144可包含通过以下方式产生的肽序列的结构:如本文所述的,使用移动窗口 模块处理候选生物活性蛋白质的氨基酸序列,然后使用结构预测模块处理所得的氨基酸序 列。还可包括包含所述肽、MHCII蛋白和/或TCR蛋白的氨基酸序列的序列文件150。
[0049] 模型文件144、146和148可以是适合显示蛋白质的三维结构的任意类型。在某些 实施方案中,这些文件可以是包含多种蛋白的原子坐标的文本文件,但是可使用任意方式 显示蛋白质的三维结构。在某些实施方案中,所述结构数据文件可含有最少量的实施本方 法的信息。例如,TCR结构数据文件可包含只有TCR蛋白的CDR3的结构信息,因为该区域 主要负责抗原结合。同样地,MHCII结构数据文件可包含只有MHCII蛋白的结合槽的结构 信息。
[0050] 在使用时,用户可将肽的序列信息输入到所述系统,并且从所述系统中接收复合 物的排序列表。在该方法中,所述输入可包含选择或键入使得计算机能够鉴定输入的肽结 构的标识符。在某些情况下,所述用户可输入肽的序列信息,并且所述计算机在启动该方法 之前可模拟所述肽。在具体的情况下,除了关于肽的序列信息之外,所述用户还可输入所述 MHCII蛋白和/或TCR蛋白的序列信息或模型。
[0051] 计筧机可读介质
[0052] 在某些实施方案中,可以"编程"的形式将依据本文所述的方法的指令编码到计算 机可读介质中,其中本文使用的术语"计算机可读介质"是指参与向计算机提供指令和/或 数据用于执行和/或处理的任何存储或传输介质。存储介质的实例包括软盘、硬盘、光盘、 磁-光盘、CD-ROM、CD-R、磁带、非易失性存储卡、ROM、DVD-ROM、蓝光盘、固态硬盘和网络连 接存储(NAS),不管这些设备是否是内置于或外置于计算机。可将含信息的文件"存储"在 计算机可读介质上,其中"存储"意指这样记录信息以使得计算机可在以后的日期对其访问 和检索。
[0053] 可使用可以一个或多种任意数量的计算机编程语言写入的编程执行本文所述的 计算机-执行的方法。这些语言包括,例如,Java(SunMicrosystems,Inc.,SantaClara, CA)、VisualBasic (Microsoft Corp.,Redmond,WA)和 C++(AT&T Corp.,Bedminster,NJ)、 以及任何很多其他语言。
[0054] 方法
[0055] 图2示出了用于预测肽的免疫原性的计算机-执行的方法200的一个示例性实施 方案。一般而言,由用户通过将一种或多种肽的序列信息输入到计算机系统中,并执行预测 所述肽的免疫原性的程序来启动计算机执行方法200。然后,所述用户从所述系统中接收预 测所述肽的免疫原性的得分。在图2所示的实施方式中,方法200的计算机执行的部分包 含评分子程序202,其用于计算包含肽、MHCII蛋白和T细胞受体的复合物的分子间相互作 用的强度以提供并输出预测所述肽的免疫原性的得分。在某些情况下,评分子程序202可 结合排序子程序204执行,当已经在可被排序的几个不同复合物上执行评分子程序202 (由 此产生几个得分)时,所述排序子程序204对由所述评分子程序202输出的得分进行排序。
[0056] 可使用多个编程模块(例如,对接模块、评分模块和任选的建模模块)执行评分子 程序202。在一些实施方案中,由用户执行所述程序使得计算机能够鉴定包含所选择的肽的 模型、所选择的MHCII蛋白的模型和所选择的TCR蛋白模型的数据文件206。然后,将所选 择的模型对接(使用,例如,对接模块)以提供肽-MHCII(pMHCII)模型208。在一些实施方 案中,ZD0CK 和 RD0CK 程序(Discovery Studio, Accelrys,SanDiego, CA)是可被用来提供 所述模型的程序的实例。在某些情况下,可将所述肽的模型在MHCII蛋白的结合槽中围绕 着其纵轴旋转以鉴定在所述肽和所述MHCII蛋白之间具有最大的互补性的复合物,用于此 的方法是已知的。一旦鉴定出具有最佳互补性的复合物,可计算在所述PMHCII的模型中所 述肽和所述结合槽之间互补性的程度以量化所述MHCII蛋白和所述肽的能量上最有利排 列。可通过计算所述复合物的AG 即两种状态之间的自由能差异 来指不所述互补 性的程度。在某些实施方案中,使用多种考虑到空间相互作用、疏水相互作用、范德华力等 的方法计算蛋白质或肽的自由能(G)。由于修改了那些参数,所述蛋白质的自由能发生变 化。与变性蛋白质模型相比的蛋白质模型的自由能差异定义了 AG。换句话说,G(折叠蛋 白)-G(变性蛋白质)=AG。
[0057] 该数字(一旦获得)可被用于从所述方法的后面步骤中消除pMHCII的模型。例 如,如果所述肽没有以大于预定阈值的亲和力与MHCII蛋白对接,则认为其是无免疫原性 的并且可在所述方法的后面步骤中将其消除。在某些情况下,可计算指示所述肽和所述 MHCII蛋白之间的互补性程度的得分,并且可结合其他测量值使用该数字来计算下述的免 疫原性得分。
[0058] 在图2所示的实施方案中,在所述pMHCII复合物模型已在步骤208中产生之 后,可将所述pMHCII复合物与TCR蛋白质对接以产生pMHCII-TCR模型210。在产生所述 pMHCII-TCR复合物模型之后,计算指示所述pMHCII-TCR模型是如何在能量上有利的得分 214。这可被表示为自由能的差异。所述得分可指示所述TCR蛋白(特别是TCR蛋白的CDR3 区域)与所述pMHCII复合物中所述肽之间的结合强度。在某些情况下,此计算也可考虑到 所述肽和所述MHCII蛋白之间的结合强度。然后将该得分输出216。所述输出可以是任何 类型的数值评估,例如,在1至100或1至1000或更大的范围内的数字,但是在某些情况下 可使用其他类型的得分,例如,字母得分。
[0059] 在某些实施方案中,可在几个不同的模型上重复所述方法,所述不同的模型在例 如所述肽的氨基酸序列、所述MHCII蛋白的氨基酸序列和/或TCR的氨基酸序列上不同的。 因此,在某些实施方案中,所述编程可确定是否所有所选择的序列都已经被分析218。如果 并非所有模型均已被分析,则用新的输入运行所述程序。如果所有模型均已被分析,则所述 程序可基于复合物的得分对它们进行排序220,并输出所述复合物的排序列表222。可通过 排序子程序204进行所述排序。
[0060] 一旦输出,可将得分的排序列表可检索地记录在计算机可读介质上。可使用多种 数据文件类型和格式进行存储。在一些实施方案中,可记录包含每一种复合物的序列名称、 以及通过它们的免疫原性得分排序的所述复合物各自的免疫原性的文本文件。
[0061] 所述程序的对接模块可使用任何合适的方法将蛋白结构契合(fit)在一起。在 一个实施方案中,所述对接步骤可基于两种蛋白质表面间的互补性将所述蛋白质契合 在一起(参见,例如,Goldman et al, Proteins200038:79-94 ;Meng et al, Journal of Computational Chemistry 200413:505 - 524和Morris et al, Journal of Computational Chemistry 199819 (14): 1639 - 1662;全部以引用的方式纳入)。但是,在一些实施方案中, 可通过计算在构象空间中的蛋白质-蛋白质对的相互作用能量将所述蛋白质契合在一起 (参见,例如,Feig et al, Journal of Computational Chemistry 2〇0425:265 _84;以引 用的方式纳入)。所述方法的第二类可纳入刚体变换(例如平移和旋转),以及内部变化 (例如扭转角度旋转)。用于对接的其他方法是已知的。
[0062] 可使用任何合适的方法计算出估算pMHCII-TCR复合物中的结合相互作用的强度 (特别是所述复合物中的肽与TCR蛋白的结合强度)的得分。在某些情况下,可使用基于 力场、经验或知识的方法的任意组合计算所述得分。所述力场方法是这样的方法,在其中 通过将所述复合物中两个蛋白质的分子间范德华力和原子间静电相互作用的强度进行加 和来估计亲和力。在某些情况下,可以考虑两个结合配偶体的分子内能量(其在某些出版 物中可被成为"应变能")。最后,由于所述结合可在水性环境中发生,有时可使用隐式溶 剂化方法(如Generalized Born模型(其可被用于计算疏水溶剂可及的表面积)和/或 Poisson-Boltzmann方程(其描述了在含离子的溶剂中溶质的静电环境))将所述肽和蛋 白质的去溶剂化能量考虑进去。在一些实施方案中,可通过经验方法一一其基于计算所述 两个结合配偶体之间的各种类型相互作用的数目一一进行评分(参见,B6hmJ.Comput. Aided Mol. Des. 199812:309 - 23;以引用的方式纳入)。这种评分方法是基于彼此接触的 原子的数目或是通过计算在所述复合物中与非复合蛋白质相比的溶剂可及表面积的变化 (A SASA)。可使用多元线性回归方法拟合所述评分函数的系数。所述评分可基于以及进行: 例如,疏水-疏水相互作用(有利的),疏水-亲水相互作用(不利的)、氢键(有利的,特别 是如果被与溶剂屏蔽(if shielded from solvent),如果溶剂暴露没有贡献(if solvent exposed no contribution))以及在复合物形成中所固定的可旋转键(不利的)的数目和 强度。基于知识的方法(也称为统计潜力)是基于被用于获得平均力势的大3D数据库(例 如剑桥结构数据库或蛋白质数据库)中的分子间紧密接触的统计学观察结果。基于知识的 方法都建立在这样的假设上,即,与通过随机分布所预期的相比发生得更为频繁的特定类 型的原子或官能团之间的紧密分子间相互作用可能是能量上有利的,并因此有利地增加了 结合亲和力(Muegge et al,J. Med. Chem. 200649:5895 - 902;以引用的方式纳入)。
[0063] 图3中示出了上述方法的一个实施方案。在该实施方式中,所述方法使用多个 MHCII模型和多个肽模型作为输入,其中所述肽模型代表来自给定蛋白质的每一个15聚体 肽。在一些实施方案中,可通过沿着所述蛋白质的氨基酸序列移动具有确定尺寸的滑动窗 口以提供不同的肽来产生所述肽的模型。在这种情况下,所使用的窗口长度为15个氨基酸 (因为这类似于适合契合进(fit into)所述MHCII结合裂缝的典型肽的大小)。但是,实 际上,可使用范围为9到30个氨基酸的确定尺寸的窗口。使用单个TCR进行图3中所示的 实施方案。实际上,可使用很多不同TCR(例如,2-1,000个TCR)的模型进行所述方法。在 具体的实施方案中,可使用一个或多个可从T细胞库(可在体外或在体内制备)的序列中 鉴定出的免疫显性TCR进行所述方法。在一些实施方案中,可通过离体刺激T细胞增殖,并 对编码所得T细胞受体库的多核苷酸进行测序来获得所述TCR序列。
[0064] 在该方法中,以成对的方式将n个MHCII模型与i个肽结构(其中,i是来自给定 蛋白质的15聚体的数目)对接以产生多个肽-MHCII组合(pMHCIIa?n(l…i))。如上所 述,在此阶段,如果所述肽不能很好地契合到MHCII蛋白的结合槽中,则可将pMHCII复合物 消除。可使用计算机方法或者使用例如体外方法消除PMHCII。进而以成对的方式将这些复 合物与TCR蛋白对接,并根据结合相互作用的强度进行评分,特别是计算了所述MHCII复合 物中的肽与TCR蛋白的结合强度。将所述复合物排序(例如,基于亲和力、平均力场能量或 任何其他合适的方式,从最弱到最强,反之亦然)并输出TCR-pMHCII复合物的排序列表。
[0065] 本方法中使用的模型可从多种不同的来源获得。在一些情况下,可在那些 分子的已知晶体结构(其若干实例是已知的)上模拟所述TCR蛋白和/或MHCII蛋 白。用于模拟MHCII蛋白的结合槽的方法的实例是已知的,例如,De Rosa et al(PLoS One.20105:ell550) ;C6rdenas et al(J.Comput. Aided Mol. Des. 201024:1035-51)和 Menconi (Proc. Natl. Acad. Sci. 2008105:14034-9),用于模拟 TCR 蛋白的 CDR3 的方法也是 一样(参见,例如,Leimgruber et al (PLoS One. 20116:e26301) ;Michielin et al (J. Mol. Bio. 2000300:1205-35) ;Borg et al (Nature Immunology 20056:171-80);以引用的方式 纳入)。可基于可利用的原子坐标对肽进行建模,或可通过本领域已知的多种结构预测程序 中的任一种预测其线性结构。
[0066] 用于将肽对接到MHCII蛋白以产生pMHCII复合物的方法是已知的(例如,Tong et al,Protein Sci. 200413:2523 - 2532 ;Almagro et al, Protein Sci.19954:1708 - 1717 ; 以引用的方式纳入)。在一些实施方案中,通过如下步骤对结合槽末端附近的肽残基进行对 接:使用有效的伪-布朗刚体对接过程,然后是通过空间约束的满意度进行的中间骨架结 构的环闭合,以及随后,对在MHC受体-肽界面处具有较差契合的整个骨架和配体相互作用 侧链以及受体侧链进行精修。
[0067] 里途
[0068] 上述方法具有很多应用。在一个具体的实施方案中,所述方法可用于鉴定靶蛋白 (例如,治疗性蛋白质)的免疫刺激片段。在这些实施方案中,所述方法可包含鉴定蛋白质 的免疫刺激片段并改变该片段(例如通过改变所述片段的氨基酸序列、或通过将翻译后修 饰添加该片段中到或从该片段中去除),以降低所述蛋白质的免疫原性。该方法可运用于 任何治疗性蛋白,包括但不限于工业、药物和农业蛋白,包括可被给药以用于治疗如下的血 液疾病或障碍的蛋白质:例如贫血(例如,再生障碍性贫血、范可尼(fanconi)贫血、溶血 性贫血、镰状细胞性贫血、遗传性球形红细胞增多症和地中海贫血)、血红蛋白尿、血液凝固 障碍(包括无纤维蛋白原血症、因子V缺乏、因子VII缺乏、因子X缺乏、因子XI缺乏、因子 XII缺乏、血友病A、血友病B、冯〃维勒布兰德氏病、播散性血管内凝血、抗凝血酶III缺乏、 伯纳德 -苏里尔(Bernard-Soulier)综合症、蛋白C缺乏、血小板功能不全、血小板存池 缺乏,蛋白质s缺乏)、紫癜(包括伊文氏(evans)综合症和血栓性血小板减少性紫癜)、血 型不合、血液血小板疾病(如血小板减少症),血液蛋白质疾病(例如冷球蛋白血症和华氏 (Waldenstrom)巨球蛋白血症)、骨髓增生异常综合症、骨髓增生性疾病、血红蛋白病或白 细胞异常(例如,嗜酸粒细胞增多、木村疾病,白细胞减少症和嗜中性白细胞减少症)等。
[0069]所述方法可运用于作为治疗癌症和其他疾病等的靶标的蛋白质。这类靶蛋白质的 实例包括但不限于,配体、细胞表面受体、抗原、抗体、细胞因子、激素、转录因子、信号转导 模块、细胞骨架蛋白、毒素和酶。治疗性蛋白的非限制性实例包括,腺苷脱酰胺酶、精氨酸 酶、天冬酰胺酶、骨形态发生蛋白-7、睫状神经营养因子、DNA酶、促红细胞生成素、因子IX、 因子VIII、促卵泡激素、葡糖脑苷脂酶(glucocerebrocidase)、促性腺激素释放激素、粒细 胞集落刺激因子、粒细胞-巨噬细胞-集落刺激因子、生长激素、生长激素释放激素、人绒毛 膜促性腺激素、胰岛素、干扰素a、干扰素0、干扰素y、白细胞介素-2、白细胞介素-3、白 细胞介素-1、鲑鱼降钙素、葡激酶、链激酶、组织纤溶酶原激活剂和血小板生成素。所述亲本 蛋白质还可包括受体的胞外结构域,包括但不限于CD4、白细胞介素-1受体、肿瘤坏死因子 受体和抗体(包括鼠类的、嵌合的、人源化的、骆蛇源的(camelized)、llamalized、单链的 或完整人类抗体)。蛋白质治疗剂可以是天然存在的或合成的。
[0070]在另一个实施方案中,所述方法可用于鉴定靶蛋白的免疫惰性片段。在这些实施 方案中,所述方法可包含:鉴定靶蛋白的免疫惰性片段并改变该片段(例如,通过改变所述 片段的氨基酸序列或者通过将翻译后修饰添加到所述片段中或从所述片段中去除)以提 高所述蛋白的免疫原性。所述蛋白可来自任何传染性疾病,例如炭疽,水痘,白喉,甲型、乙 型或丙型肝炎,HIB,HPV,季节性流感,脑炎,疟疾,麻瘆,脑膜炎,腮腺炎,百日咳,脊髓灰质 炎,狂犬病,风瘆,带状疱瘆,天花,破伤风,TB或黄热病(yeller fever)等。可使用这种方 法,例如通过鉴定与癌症相关的免疫原性表位来鉴定癌症治疗的新靶标。然后可将这些表 位用于设计疫苗或提高预先存在的针对特定表位的免疫应答。
[0071]在一些实施方案中,所述方法还可用于在具有自身免疫疾病的受试者中鉴定自身 抗原。在该实施方案中,可对所述个体的T细胞库进行测序,并且可使用上述方法测试来自 所述个体的蛋白质序列以鉴定免疫显性的自身肽一一其序列应使得能够在所述个体中鉴 定引起自身免疫性疾病的自身抗原。在类似的实施方案中,所述方法可用于预测与癌症相 关的蛋白质的多个片段的免疫原性,并用于鉴定被预测为免疫刺激性的蛋白质的片段。可 将所述免疫刺激片段用作或开发为,例如,癌症疫苗。
[0072]在上述实施方案的一些中,使用在被疫苗或治疗性蛋白所靶向的人群(例如北 美、亚洲、南美、北非等)中普遍存在的MHCII蛋白质的结构进行建模可以是有利的。在某 些情况下,所述输入MHCII蛋白可对应于个体的MHCII单倍型。
[0073]在任意一个上述实施方案中,可使用多种不同的测定法(如结合测定法或T细胞 增殖测定法)测试对蛋白质的氨基酸序列的任何改变。在一些实施方案中,将离体T细 胞活化测定法用于在实验上定量免疫原性(参见,例如Fleckenstein supra,Schmittel et. al. , J. Immunol.Meth. , 24:17-24 (2000),Anthony and Lehmann,Methods 29:260-269 (2003),Stickler et al.,J. Tmmunother. 23:654-660(2000), Hoffmeis ter et al.,Methods 29:270-281 (2003);和 Schultes and Whiteside, J. Immunol. Meth. 279:1-15 (2003),全部以引用的方式全文纳入)。可使用多个测定方案中的任意一种; 这些方案在抗原呈递模式(MHC四聚体,完整的APC)、所述抗原(肽片段或完整蛋白)的形 式、刺激的轮数以及检测方法(细胞因子产生的Elispot检测、流式细胞术、氣化胸苷掺入) 上是不同的。
[0074] 在一些实施方案中,所述方法可用于鉴定炎症的新靶标。在一些实施方案中,可对 患有炎性疾病的受试者的T细胞受体库进行测序,并鉴定出免疫显性的T细胞受体。可将 与来自受试者的MHCII蛋白形成复合物的该受体用于筛选大量的肽序列(例如,代表受试 者的完整蛋白质组的肽)以鉴定最佳契合所述受体的肽,从而鉴定了免疫显性表位。一旦 知道了所述免疫显性表位,则可对其进行靶向用于治疗。
[0075] 尽管已经为了清楚理解的目的,以说明和实例的方式对上述实施方案进行了相当 详细地描述,但是鉴于以上教导,对于本领域的普通技术人员来说是很明显的是,可对其进 行某些改变和修改而不脱离所附权利要求的精神或范围。
[0076] 实施例
[0077] 可根据以下实施例进一步理解本教导的各方面,其不应被解释为以任何方式限制 本教导的范围。
[0078] 实施例1
[0079] 步骤1:使用Perl脚本(AA_process. pi)可将所研宄的蛋白质的氨基酸序列用于 产生一系列重叠的15个氨基酸的肽。通过沿着所研宄的蛋白质的氨基酸序列移动窗口以 提供一系列彼此重叠14个氨基酸残基的肽来完成所述方法。所得的输出将是带有包含所 研宄的蛋白质的整个长度的重叠15聚体肽的列表的文本文件。
[0080] 步骤2:使用MODELER (Discovery Studio, Accelrys)或等同的蛋白质建模软件对 缺少x-射线晶体学结构的II类主要组织相容性复合物(MHCII)蛋白质进行建模。这可通 过使用所解析的MHCII蛋白质的结构对未知结构进行同源建模来完成。可用于同源建模的 结构可见于蛋白质数据库(PDB)网站。这类结构的一些实例是:3QXA、3L6F和3PGD。
[0081] 步骤3 :也使用MODELER或等同软件将在步骤1中产生的每一种肽进行建模。
[0082] 步骤4:然后使用蛋白质对接算法(如ZD0CK或RDOCK(Discovery Studio, Accelrys))将步骤3中所建模的肽与步骤2中所建模的MHCII结构或者与来自TOB 的已知MHCII结构对接,以确定最稳定的肽-MHCII (pMHCII)组合和构象(confirmation) 〇 使用多参数评分函数基于每一个MHCII的亲和力、构象(confirmation)和普遍性对顶部的 pMHCII复合物进行排序。基于各个项目确定截止值。
[0083] 步骤5 :通过标准测序技术或下一代测序技术(例如,适应性TCR)确定响应于所 研宄的蛋白质的T-细胞的序列。
[0084] 步骤6 :使用来自PDB的已知的TCR(例如,1TCR)的序列,使用同源建模基于步骤 5中所获得的序列预测每一个TCR结构。可使用算法(如MODELER)进行同源建模。
[0085] 步骤7:将步骤4中所预测的顶部pMHCII结构与步骤6中所预测的TCR结构对接 以确定构象上最稳定的PMHCII-TCR结构。ZDOCK、RD0CK或类似的蛋白质-蛋白质对接算 法将被用于此步骤。排序最高的结构将基于亲和力、构象(confirmation)和普遍性。
[0086] 步骤8 :最终的输出将会是pMHCII-TCR模型的排序列表。
[0087] 实施例2
[0088] 考虑到MHCII序列、T细胞受体(TCR)序列和目的蛋白质的序列,根据衍生自目的 蛋白的肽形成稳定MHCII-肽-TCR复合物的预期能力如下对它们进行了排序。
[0089] 开发了以下两步评分方案来模拟TCR-pMHC复合物形成的过程。首先,将所述肽序 列建模到MHC腔,并对所述肽-MHC相互作用进行精修和评分。对所述肽和所述MHC的侧链 位置进行精修。这得到了 pMHC_得分。其次,将TCR添加到来自上一步的所述肽-MHC复合 物。对TCR和pMHC的界面侧链、以及TCR相对于pMHC的取向进行了精修。计算了 TCR和 PMHC之间的相互作用的得分一一TCR_pMHC_得分。最后将最终的得分计算为所述两个得分 之和:
[0090] 得分=pMHC_ 得分 +TCR_pMHC_ 得分
[0091] 在当前的实施方式中,使用了 FireDock评分函数(参见Andrusier et al FireDock:fast interaction refinement in molecular docking. Proteins. 200769:139-59 和 Mashiach et al FireDock:a web server for fast interaction refinement in molecular docking. Nucleic Acids Res. 200836:W229-32)〇 所述FireDock函数包括减弱(softened)的范德华力、去溶剂化、静电、氢键键合、二硫键键 合、ji-堆积、脂肪族相互作用以及旋转异构体的偏好的加权组合。该函数可被替换为具有 对蛋白质-蛋白质对接和环建模显示更好的性能的统计学潜力(statistical potential) 的函数。可获得特异性针对肽-MHC-TCR相互作用的统计学潜力。可将I类MHC复合物用 于培训所述潜力。
[0092] 所述FireDock方法包括三个主要步骤:
[0093] 1.侧链优化:通过旋转异构体文库对受体和配体的侧链柔性进行建模。通过解决 整数LP问题找到针对所述界面残基的旋转异构体的最佳组合。该LP最小化了由排斥范德 华和旋转异构体概率项(term)组成的部分能量函数。
[0094] 2.刚体最小化:通过MC技术进行该最小化阶段,所述MC技术试图通过精修配体 结构的取向来优化近似的结合能。该结合能由减弱的排斥和吸引的范德华项组成。在所述 MC方法的每一个循环中,通过quasi-Newton算法进行局部最小化。默认地,进行50个MC 循环。
[0095] 3.评分和排序:这个最终的排序阶段试图鉴定出接近-天然的精修的解析度 (solution)。根据结合能函数进行所述排序,所述结合能函数包括多种能量项:去溶剂化能 量(原子接触能量,ACE)、范德华相互作用、部分静电、氢键和二硫键、31-堆积和脂肪族相 互作用、旋转异构体的概率以及更多。
[0096] 实施例3
[0097] 可使用可得到的晶体结构作为新复合物的模板对所述三元MHCII-肽-TCR复合物 进行建模。目前,PDB包含九个可作为模板的人MHCII-肽-TCR复合物(NCBI结构登录号 1 j8h、lfyt、4e41、2iam,2ian,lymm、3pl6、3o6f 和 lzgl)。另外,还有类似数量的可作为模板 的人MHCII-肽-TCR复合物的结构。
[0098] 本研宄的第二部分将所述三组分的复合物建模与所述评分函数结合,然后进行算 法精修。使用可获得的复合物结构将所述评分方案和所述建模方案结合并进行了测试。已 经鉴定出复合物中每一种肽的全长序列,并使用上述的建模算法对所有的那些全长序列的 肽进行了建模。使用上述方法计算出得分。确定了正确的肽的排序,并与从NetMHCII预测 器获得的结果比较(Nielsen et al BMC Bioinformatics. 20078:238)。下表 1 示出了这些 结果。
[0099] 如下表所示,所述基于结构的方法排序出很多高于NetMHCII方法的测试肽。因 此,基于下表1所示的结果,与基于传统上所使用的序列的预测方法(NetMHCII)相比,上述 基于结构的方法能更好地预测实际结果。
[0100] 表1:使用晶体结构的肽特异性的基准。
[0101]
【权利要求】
1. 一种包含存储器的计算机系统,所述存储器包含: a) 肽的模型、MHCII蛋白的模型和T细胞受体的模型;和 b) 用于以下的可执行程序: (i) 评估包含所述肽、所述MHCII蛋白和所述T细胞受体的复合物的分子间相互作用的 强度以提供预测所述肽的免疫原性的得分;和 (ii) 输出所述得分。
2. 权利要求1的系统,其还包含用于显示所述复合物图像的指令。
3. 权利要求1或2的计算机系统,其中所述存储器包含多种不同的肽的模型、所述 MHCII蛋白的模型和所述T细胞受体的模型;并且所述存储器包含用于以下的可执行程 序: 评估包含所述不同的肽的复合物的分子间相互作用的强度以提供预测所述肽的免疫 原性的得分; 通过所述不同的肽的得分将它们排序;和 输出根据它们的得分排序的所述不同肽的列表,其中所述输出提供了所述肽的经排序 的免疫学特征。
4. 一种包含免疫原性预测程序的计算机可读存储介质,所述免疫原性预测程序包含: a) 评估包含肽、MHCII蛋白和T细胞受体的复合物的分子间相互作用的强度以提供预 测所述肽的免疫原性的得分;和 b) 输出所述得分。
5. 权利要求4的计算机可读存储介质,其中所述评估是通过对所述复合物进行三维建 丰旲而完成。
6. 权利要求4或5的计算机可读存储介质,其中所述免疫原性预测程序包含用于以下 的指令: a) 评估每种均包含肽、MHCII蛋白和T细胞受体的多种复合物的分子间相互作用的强 度,其中所述复合物包含不同的肽并且所述评估产生每一种复合物的得分; b) 通过所述不同的肽的得分将它们排序;和 c) 输出根据它们的得分排序的所述不同肽的列表,从而提供了所述肽的免疫学特征。
7. 权利要求6的计算机可读存储介质,其中所述程序还包含用于输入蛋白质序列的指 令和用于沿着蛋白质的氨基酸序列移动具有确定尺寸的滑动窗口以提供所述不同的肽的 指令。
8. 权利要求7的计算机可读存储介质,其中所述确定尺寸的范围为9到30个氨基酸。
9. 权利要求6到8的任一项的计算机可读存储介质,其中所述程序还包含鉴定具有免 疫刺激性的肽的指令。
10. 权利要求6到9的任一项的计算机可读存储介质,其中所述复合物不同于彼此之处 还在于所述MHCII蛋白的一种或多种氨基酸序列以及所述T细胞受体的氨基酸序列。
11. 权利要求6到9的任一项的计算机可读存储介质,其中所述复合物包含不同的T细 胞受体,其中所述不同的T细胞受体代表个体的T细胞受体库中的至少一部分。
12. -种预测肽的免疫原性的方法,所述方法包含: a)将所述肽的序列信息输入到包含免疫原性预测程序的系统中,所述免疫原性预测程 序包含用于以下的指令: ⑴评估包含所述肽、MHCII蛋白和T细胞受体的复合物的分子间相互作用的强度,以 提供预测所述肽的免疫原性的得分;和 (ii)输出所述得分; b) 执行所述免疫原性预测程序;和 c) 从所述计算机系统接收得分。
13. 权利要求12的方法,其中所述方法包含将两个或多个不同的肽的序列信息输入到 所述计算机系统中;并接收通过它们的得分所排序的不同的肽的列表。
14. 权利要求13的方法,其中所述两种或多种不同的肽代表同一蛋白的不同的片段。
15. 权利要求14的方法,还包含检查所述不同的肽的列表以鉴定所述蛋白的免疫刺激 片段。
16. 权利要求15的方法,还包含改变所述免疫刺激片段的氨基酸序列以在将所述蛋白 给予哺乳动物时降低其免疫原性。
17. 权利要求15的方法,还包含改变所述免疫刺激片段的翻译后修饰以在将所述蛋白 给予哺乳动物时降低其免疫原性。
18. 权利要求14的方法,,还包含检查所述不同的肽的列表以鉴定所述蛋白的免疫惰 性片段。
19. 权利要求18的方法,还包含改变所述免疫惰性片段以在将所述蛋白给予哺乳动物 时增强其免疫原性。
20. 权利要求12-19的任一项的方法,其中所述评估包含评估a)所述T细胞受体和b) 包含所述肽和所述MHCII蛋白的复合物中的所述肽之间的相互作用的强度。
21. 权利要求12-19的任一项的方法,其中所述评估还包含评估a)所述肽和b)所述 MHCII蛋白之间的相互作用的强度。
22. 权利要求12-19的任一项的方法,其中所述评估还包含评估a)肽和b)包含MHCII 蛋白和T细胞受体的复合物的所述肽结合腔之间的相互作用的强度。
23. 权利要求12-19的任一项的方法,其中所述方法还包含将所述MHCII蛋白和/或所 述T细胞受体的序列信息输入到所述系统中。
24. 权利要求12-19的任一项的方法,其中所述方法是来自疫苗的肽,并且所述方法还 包含改变所述肽以增强所述疫苗的免疫原性。
25. 权利要求12-19的任一项的方法,其中所述方法被用于预测与癌症相关的蛋白质 的多个片段的免疫原性,并且鉴定出被预测为免疫刺激性的所述蛋白质的片段。
【文档编号】G06F19/10GK104487979SQ201380039722
【公开日】2015年4月1日 申请日期:2013年3月14日 优先权日:2012年5月25日
【发明者】P·帕斯, F·J·阿斯瓦德 申请人:拜尔健康护理有限责任公司