专利名称:诊断和治疗非胰岛素依赖性糖尿病的方法
诊断和治疗非胰岛素依赖性糖尿病的方法政府支持声明本发明由美国政府支持在国家卫生研究院的资助下完成。政府对本发明具有一定权利。
背景技术:
糖尿病是一种代谢疾病,其出现在胰腺不能产生足够的激素胰岛素来调节血糖(“I型糖尿病”)时,或者,出现在身体不能有效利用所产生的胰岛素(“2型糖尿病”)时。根据世界卫生组织最近的估计,全球超过2亿人患有糖尿病,其中90%患2型糖尿病。典型地长期并发症包括神经病、视网膜病、肾病的发生、大的或小的血管的普 遍退行性变化以及对感染的易感性增加。由于患有2型糖尿病的个体相对于完全缺乏胰岛素的产生的I型糖尿病个体还具有可用的残余量的胰岛素,2型糖尿病仅逐渐显露出来并且通常在发病几年之后被诊断出来,并发症已经出现。胰岛素抵抗发生在25%的非糖尿病、非肥胖的、明显健康的个体身上,并使得他们容易患上糖尿病和冠状动脉疾病。II型糖尿病的高血糖症是在肌肉和其他关键胰岛素靶组织中对胰岛素抵抗以及β细胞胰岛素分泌减少的结果。对有糖尿病家族史的个体的纵向研究表明,胰岛素抵抗先于分泌异常。在发展成糖尿病之前,这些个体通过分泌额外的胰岛素来补偿其胰岛素抵抗。代偿性高胰岛素血症衰退时发生糖尿病。胰腺β细胞分泌不足对糖尿病的严重程度起重要作用。Reaven(1988)Diabetes 37 :1595-607第一个调查了来自非肥胖的普通人群的胰岛素抵抗、非糖尿病的健康个体。引人注目的是,他们观察到,这些人中25%有胰岛素抵抗,与在II型糖尿病患者中所见的具有类似的量级。这些个体通过高于正常3至4倍的胰岛素水平来进行补偿。这些升高的胰岛素水平足以保持血糖浓度正常。其他人也证实了,大部分非糖尿病人群是胰岛素抵抗的。这些胰岛素抵抗、非糖尿病个体患II型糖尿病的风险大大高于胰岛素敏感的对象。但是,即使没有发展成高血糖症和糖尿病,这些胰岛素抵抗的个体的健康也付出了极大的代价。胰岛素抵抗带来下列风险的增加升高的血浆甘油三酯(TG)、降低的高密度脂蛋白(HDL)和高血压,一组被不同研究者称为X综合征、胰岛素抵抗综合征或代谢综合征的异常情况。人们认为高胰岛素血症、胰岛素抵抗、或两者都是引起这些异常情况的直接原因。来自种族、家族和纵向研究的数据暗示抵抗的主要构成因素是遗传的。2型糖尿病是一种多基因疾病;它在全球成人已经很高的发病率以及在成人和儿童中不断上升的发病率表明急需在尽可能的生命早期评价这种疾病的遗传易感性和确定干预治疗,以便防止2型糖尿病的发作和治疗这种疾病。
发明内容
本发明提供用于治疗和诊断与高血糖症相关的疾病的方法和组合物,所述疾病包括糖尿病、胰岛素抵抗等疾病。基因多态性显示与疾病易感性相关,且它们的检测被用于诊断这些病症的诱因。受关注多态性包括单核苷酸多态性、剪接变体、缺失、插入等。如本文所示,CD44基因座和CD44配体(SPP1,骨桥蛋白)以及HDC基因座中的多态性对个体发展成2型糖尿病的易感性是预测性的。CD44的血清水平也是胰岛素抵抗的诊断依据。治疗方法靶向这些基因的产物,尤其靶向CD44和/或骨桥蛋白。在本发明的一些实施方案中,通过向个体施用CD44活性的抑制剂,提供用于预防或治疗2型糖尿病的方法。⑶44抑制剂任选地对在例如脂肪组织巨噬细胞等的、与2型糖尿病发展相关的细胞中表达的CD44剪接变体是选择性的。受关注抑制剂可以靶向例如脂肪组织巨噬细胞的受关注细胞。受关注抑制剂包括但不限于,CD44受体和骨桥蛋白之间相互作用的抑制剂、以及CD44和透明质酸之间相互作用的抑制剂。这些抑制剂包括但不限于,抗体、核酸抑制剂例如反义寡核苷酸、RNAi分子等;抑制骨桥蛋白肽、小分子抑制剂等。在一些实施方案中,在开始治疗之前,例如使用本发明的预测方法评价个体产生疾病的易感性。在本发明的另一些实施方案中,通过确定在编码⑶44、SPPl和HDC中一个或更多 个的遗传序列中与疾病相关的多态性的存在,提供用于确定个体对2型糖尿病(T2D)的易感性的方法。在某些实施方案中,分析多个基因座。单独地或与其他T2D变体组合地描述和应用CD44、SPPl和HDC中的多态性,预测个体对2型糖尿病的易感性。在一些实施方案中,多态性是SNP。在另一些实施方案中,多态性是剪接变体。在本发明的另一些实施方案中,提供用于鉴定用在预防或治疗T2D中的化合物,例如小分子抑制剂和其他药物候选物的方法。在这些方法中,确定抑制CD44活性的候选剂的作用。随后任选地进一步测试T2D模型中的化合物,所述模型可能是细胞培养模型、动物模型等。包括在这些模型中的是表达⑶44并在培养模型中已经显示具有抗成脂作用的分离的脂肪组织巨噬细胞。在另一些实施方案中,提供用于评价人类个体中对2型糖尿病易感性的试剂盒,所述试剂盒包括用于选择性确定一种或更多种如本文限定的疾病相关的多态性的存在与否的试剂。上述综述不旨在包括本发明的所有特征和方面,也不暗示本发明必须包括这个综述中讨论的所有特征和方面。本说明书中提及的所有出版物和专利申请在相同程度上通过引用并入本文,特别地和单独地指示每个单独出版物或专利申请通过弓I用并入。
附图举例说明了本发明的实施方案,并与说明书一起用于阐明本发明。这些附图通过举例方式而不是限制方式提供;应强调附图的各种特征是不按比例的。图I :T2D微阵列实验数据库的验证。(A)通过在一组69个微阵列研究中表达显著差异的次数来表示已知的T2D-相关基因(菱形( ),事先通过GWAS检测的20个基因;正方形(■),从NIH基因相关联数据库GAD提取的170个基因),相对于基因组中所有其他基因(三角形(A))。大多数实验中牵涉的已知的T2D-相关基因是瘦素受体(LEPR),在69个微阵列实验的35个实验中是阳性的(表3)。任意基因的阳性微阵列实验的最大值是46。(B和C)R0C曲线,通过利用所有69个微阵列数据在曲线图中绘制20个GWAS(B)和170个GAD(C)基因的重现中的敏感性和特异性画出所述ROC曲线。在阈值彡14个阳性微阵列实验的20个GWAS基因的重新发现中,最佳的敏感性和特异性分别是55%和81 % (B),在阈值> 11个阳性微阵列实验的170个GAD基因的重新发现中,最佳的敏感性和特异性分别是 83%和 73% (C)。图2 :连锁不平衡图中的显著SNP。在⑶44和OPN的LD图中用空心圆/实心圆表示我们的靶向的相关联研究(阶段I和II)中基因分型的SNP (黑色实心圆;P < O. 05,红色实心圆;P < Bonferroni阈值)。使用GOLD软件基于阶段I中192个随机的日本人(JP)对照对象的SNP数据来绘制LD结构。用距离标示器(kb)按比例绘制轴线。纵轴上显示外显子和内含子。(A)CD44 ;三个标签SNP(rs353647、rsll2762和rs7930724),选自在初始研究中⑶44的23个经筛选的标签SNP (P < O. 05 ;阶段I)(表5),并且在第二群中进一步基因分型(阶段II)。当对研究进行Meta分析时,SNP rs353647和rsll2762与T2D标称地相关联,rs7930724 与 T2D 显著相关联(rs7930724 ;0R = I. 23,P = 2. OXlO-3)(表 I)。通过对包括这3个标签SNP的中等LD区块间(外显子2-13)直接测序来鉴定编码的SNPrsl071695 (外显子3),并且利用相同的群(rsl071695 ;0R = I. 43,P = 3. 9 X 10’来证实其与T2D的显著相关。(见表6的单倍型分析)(B)OPN ;3个标签SNP(rs4754、rs9138(3’UTR)和rsl0012150(3’ UTR)),选自OPN的10个经筛选的标签SNP(P < O. 05 ;阶段I)(附加表7)。进一步测试3个标签SNP (阶段II)。Meta分析时,SNP rs9138与T2D标称地相关联,rsl0012150 与 T2D 显著相关联(rsl0012150 ;0R = I. 15,P=L 5X 1(Γ3)。在这 3 个标签SNP的LD区块间中鉴定出另一个3’UTR SNP (rs1126772),并且也证实了其与T2D显著相关联(rsll26772 ;0R = I. 14,P = 4. 4X 1(Γ3)(表 I)。图3 :人类对象中的⑶44功能实验。(A)在年龄、性别、BMI-匹配的对象之间比较⑶44mRNA表达,所述对象具有两个rsl071695的风险等位基因(TT,η = 13)和一个(TC,η=12)或没有rsl071695的风险等位基因(CC,η = I)。为了美容的目的实施皮下脂肪移除。所有患者都是非糖尿病对象(年龄(岁)59.5±15.3,性别(男/女)2/24,BMI (kg/m2)22. 9±2. 3,HbAlc(%)5. 1±0. 57)。(B和C)通过使用利用非糖尿病对象(η = 55 :年龄(岁);60.3±15,性别(男/女);36/19,BMI (kg/m2) ;23· 2±4· 3)的最小二乘法估计的线性回归模型来确定标准可溶性CD44(sCD44std)的血清水平和胰岛素抵抗指标之间的相关性,HbAlc (B)和 HOMA-IR(C)。图4 :小鼠模型中的CD44功能实验。(A和B)将从糖尿病倾向WT(A)和CD44_K0(B)小鼠分离的内脏(附睾的)脂肪组织用抗Mac-2 (巨噬细胞标志物)抗体然后用DAB(褐色)染色,并用苏木精(蓝色)复染色。箭头显示围绕脂肪细胞的巨噬细胞集群。块(Bar)=20ymo (C-I)⑶44-Κ0小鼠的糖代谢的改善。在进行实验之前测量体重(C)。14小时的过夜禁食之后测量⑶44-Κ0小鼠(η = 7)和年龄匹配的WT (η = 16 ;糖尿病倾向)的血糖(D)、血清胰岛素(E)和血清脂联素(F)。*Ρ < O. 05,对WT。(G和H) 14小时的过夜禁食之后对CD44-K0小鼠(η = 7)和年龄匹配的WT(η = 15)实施葡萄糖耐受性测定(在腹膜内,用葡萄糖(2g/kg体重))。在指示的时间点测量血糖(G)和血清胰岛素(H)。(1)4小时的禁食之后对⑶44-K0小鼠(η = 7)和年龄匹配的WT (η = 16)实施胰岛素耐受性测定(在腹膜内,用胰岛素(1.0单位/1^体重))。所有对小鼠的实验都对14至20周龄的小鼠实施。*Ρ < O. 05,对每个时间点的WT。§Ρ < O. 05,对們^此值)。所有数据以平均值土 SD来表示。图5 :日本人人群中⑶44和OPN风险等位基因对T2D的累积作用。用彩条指出具有增加数目的CD44和OPN风险等位基因的参与者比例(红色对照;蓝色T2D病例)。用黄色三角表示携带增加数目的风险等位基因的参与者与没有或只有一个风险等位基因的那些参与者相比较的T2D优势比。携带4个风险等位基因的参与者的OR为3. 21 [I. 39-7. 39](总体P = 7· 5X10-3)。每个附加的风险等位基因增加I. 21 [I. 07-1. 37] (P = 2. 1X10-3)倍的疾病几率。图6 :全长CD44 mRNA转录本的最佳二级结构。具有或不具有相关同义SNP(rsl071695 ;His[CAC]/[CAT] nt 689)的 CD44mRNA 全长序列(NM_001001391 ;5’ UTR-编码序列-3’ UTR)被用于利用M折叠构建最佳二级折叠结构。在[CA£]和[CAI]⑶44 mRNA之间的蛋白质编码区(nt 435-1517)观察到折叠模式的明显改变。
图7 :所有69个组合的微阵列数据和每组小鼠、人和大鼠的微阵列实验的ROC曲线。(A和B)通过利用下列数据绘制20个GWAS(A)和170个GAD(B)黄金标准基因的重新发现中的敏感性和特异性画出ROC曲线,其使用所有69个(人、小鼠和大鼠)微阵列数据(黑线)、仅48个小鼠实验(红线)、仅13个人实验(蓝线)和仅8个大鼠实验(绿线)。在所有69个微阵列数据中获得最好的敏感性和特异性(黑色)。小鼠微阵列的组(红色)比人(蓝色)和大鼠微阵列(绿色)显示出更好的性能。这些调查结果论证了更多的微阵列实验在再发现(recall)黄金标准基因中得到更好的性能,不依赖于物种。图8 :CD44和OPN的连锁不平衡图中的显著SNP。在CD44和OPN的LD图(JP和CEU)中用空心圆/实心圆表示在我们的靶向的相关联研究和WTCCC GWAS中基因分型的SNP。利用GOLD软件通过绘制在我们的阶段I中日本人(JP)对照或HapMap欧裔(CEU)人群的配对的SNP r2值,画出基因区的LD结构的图示。用距离标记(kb)作为刻度绘制轴线。纵轴上示出⑶44(NM_000610)和OPN(ΝΜ_001040058)的外显子(水平条)和内含子(垂直线)。通过黑色实心圆(P < O. 05)或红色实心圆(P < Bonferroni阈值;0. 05除以所分析的 SNP 的总数)来指示显著的 SNP。a,CD44 ;标签 SNP、rs353647、rsll2762 和 rs7930724 在我们的研究中是显著的(rs353647和112762黑色实心圆);P < O. 05,rs7930724(红色实心圆);P = 2.0X10-3 ;阶段I+II)。通过搜索包括显著的标签SNP的中等的LD区块(外显子2-13)来鉴定rsl071695(编码SNP;红色实心圆),并且用相同的群(OR= I. 43 [95%C. I. I. 17-1. 74],P = 3. 9X 10_4 ;阶段I+II)证实了其与T2D的强相关性。包括外显子3的区域在任意最近的T2D的GWAS中还没有被基因分型。b,OPN ;标签SNP在3’ UTR、rs4754、rs9138和rsl0012150在我们的研究中是显著的(rs4754和rs9138 (黑色实心圆);P<0.05,rsl0012150(红色实心圆);P = I. 5X 10_3 ;阶段I+II)。通过搜索包括显著的标签SNP的LD区块来鉴定rsll26772(3’ UTR SNP ;红色实心圆),并证实了其与T2D的显著相关性(P = 4. 4X 10_3 ;阶段I+II)。3’ UTR在最近的T2D的GWAS中还没有被基因分型。
具体实施方案提供了诊断和治疗对2型糖尿病的增加的易感性的方法。通过评估在⑶44、SPP1和HDC的一个或多个中多态性存在情况的个体基因型,可以预测T2D发生的易感性。在一些实施方案中,所述分析与确定其他风险等位基因的存在相结合,所述其他风险等位基因包括但不限于TCF7L2、KCNQ1等。还可以通过确定可溶性⑶44的血清水平来进行诊断。在一些实施方案中,通过向个体施用CD44活性的抑制剂,提供降低2型糖尿病风险或治疗2型糖尿病的方法。在本发明的特定实施方案中,通过向个体施用CD44活性的抑制剂,提供预防或治疗2型糖尿病的方法。通过局部化的药物递送或通过受关注的CD44剪接变体的选择性,凭借靶部分任选地靶向受关注的抑制剂。受关注的抑制剂包括但不限于,CD44受体和一个或多个其配体之间相互作用的抑制剂,所述抑制剂包括骨桥蛋白、透明质酸、硫酸皮肤素蛋白聚糖双链蛋白聚糖、丝甘蛋白聚糖等。在一些实施方案中,抑制剂是CD44配体的片段或衍生物,例如骨桥蛋白肽、可溶性透明质酸(hyaluranan)等。在另一些实施方案中,在开始治疗之前通过本发明的方法评价个体疾病发展的易感性。有关赋予2型糖尿病疾病风险的遗传变体的知识为进行遗传测试来区分具有增加的患病风险的个体和具有平均的患病风险的个体提供了机会。遗传测试的核心价值是能够在早期诊断疾病的可能性,以及向临床医生提供关于疾病的预知/攻击性的信息,以便 能够施加最适合的治疗。例如,2型糖尿病的遗传试验的应用可以提供早期检测疾病的机会,这可能带来治疗性措施的早期应用,并因此可以将2型糖尿病所致的症状的有害作用和严重健康后果降至最低。定义CD44的“活性”表示该蛋白质所实施的任意信号或结合功能。CD44蛋白质是细胞-细胞相互作用、细胞粘着和细胞迁移涉及的细胞表面的糖蛋白。它是透明质酸的受体,并且还可以与其他配体相互作用,所述配体例如是骨桥蛋白、硫酸皮肤素蛋白聚糖双链蛋白聚糖、丝甘蛋白聚糖、胶原和基质金属蛋白酶(MMP)。⑶44参与很多细胞功能,包括淋巴细胞活化、再循环和归巢、造血作用和肿瘤转移。该基因的转录本经过复杂的选择性剪接,所述剪接产生很多功能上独特的同种型。选择性剪接是该蛋白质的结构和功能多样性的基础。⑶44基因转录至少部分由β连环蛋白和Wnt信号激活。⑶44基因包含分布在50kb基因组DNA中的19个外显子。带注释基因组序列可从GenBank以登录号NG_008937获取。⑶44基因在胞外结构域内具有10个选择性剪接的外显子。除了包含或排除整个外显子之外,通过在两个外显子内利用内部剪接供体和受体位点产生额外的多样性。已经显示,由2个外显子的选择性剪接造成胞质结构域中的变异。因此,⑶44的基因组结构是复杂的,且选择性剪接是其机构和功能多样性的基础。“⑶44”表示通过GenBank登录号NG_008937所示基因序列编码的人蛋白质、包括剪接变体及其同源物的其所有天然变体,以及在本文中适用时,所有抗原片段。分泌的磷蛋白I (SPPl),也被称为骨涎蛋白I (BSP-I),早期T-淋巴细胞活化(ETA-I)和最常见的骨桥蛋白(OPN)是分子量约为32600的单链多肽。其是糖基化的(在大鼠OPN中5至6个O-连接和I个N-连接的寡糖)、高度但可变地磷酸化(在大鼠中12个磷酸化-Ser和I个磷酸化-Thr)和硫酸化的。可以以登录号NM_001040060、NM_001040058和NM_000582从Genbank获取编码人骨桥蛋白转录本的mRNA序列。所述基因具有全长5kb的7个外显子,且在人中位于4号染色体长臂上。组氨酸脱羧酶(HDC)是同型二聚酶,它是磷酸吡哆醛(PLP)依赖型脱羧酶,并且对其组氨酸底物是高度特异性的。推定的662个氨基酸的蛋白的分子质量为74148Da。在大鼠、小鼠和人的HDC和多巴脱羧酶(DDC;107930)中发现高度的同源性。在人中,所述基因位于15q21_q22 ;且!111 ^的序列从Genbank以登录号NM_002112获取。所述基因包含分布在约24kb上的12个外显子。基因组DNA印迹分析表明,HDC是由单拷贝基因编码的。结构分析显示,所观察到的HDC mRNA的异质性是由于选择性剪接造成的。本文中使用的多态性指的是基因序列中的变体。此类变体可以包括单核苷酸多态性、剪接变体、插入、缺失和转座/易位。多态性可以是通常在个体或不同种族和不同地理位置之间发现的尽管具有不同序列但产生功能上相当的基因产物的那些变体(DNA序列差异)。多态性还包括可以被分类为下述的变体,即被分类为可产生可能具有改变的功能之基因产物的等位基因和/或突变(即可以产生功能上不相当的基因产物的序列中的变体)。多态性还包括可以被分类为不产生基因产物、产生无活性基因产物或产生增加的基因产物的等位基因和/或突变体的变体。另外,根据需要,该术语还与等位基因互换地使用。多态性位点在长度上是单核苷酸的情况下,所述位点指的是单核苷酸多态性 (“SNP”)。如本文使用的,术语“核苷酸探针”指的是能够与核酸序列特异性杂交的分子,并且包括本领域公知的核酸的类似物如DNA、RNA、肽核酸等,并且可以是双链或单链的。核酸可以与标记序列融合,所述标记序列例如是编码多肽以辅助多肽分离或纯化的序列。该序列包括但不限于,编码谷胱甘肽-5-转移酶(GST)融合蛋白的那些序列和编码来自流感的血凝素A(HA)多肽标记的那些序列。本发明的核酸分子的其他改变可以包括但不限于,例如进行标记、甲基化、核苷酸间修饰如不带电连接(例如甲基膦酸酯、磷酸三酯、磷酸酰胺化物、氨基甲酸酯)、带电连接(例如硫代磷酸酯、二硫代磷酸酯)、悬垂部分(例如多肽)、嵌入剂(例如吖啶、补骨脂素)、螯合剂、烷化剂(alkylator)和经修饰连接(例如α异头核酸)。还包括在内的是能够经由氢键和其他化学相互作用结合指定的序列的合成分子。此类分子包括例如其中肽连接取代了分子骨架中磷酸酯连接的那些。如本文使用的,“特异性杂交”指的是第一核酸与第二核酸杂交的能力,所述杂交以第一核酸不与除了第二核酸之外的其他核酸杂交的方式进行。杂交的“严格度”是涉及例如温度和缓冲剂浓度的孵育和冲洗条件的专门名词,所述条件允许特定核酸与第二核酸杂交;第一核酸可以完美地(即100% )与第二核酸互补,或者第一核酸和第二核酸可以具有低于完美(例如70^^75^^85^^90^^95% )的一定程度的互补。两种核酸或氨基酸序列的同源性或同一性的百分比可以通过以最优比较目的(例如可以在用于优化对准的第一序列的序列中引入缺口)对序列进行比对来确定。然后比较相应位置的核苷酸或氨基酸,两个序列之间的同一性百分比是所述序列具有一致位置的数目的函数(即同一性% =一致位置的数目/位置数目X 100)。当一个序列中的位置在其他序列的相应位置上被相同的核苷酸或氨基酸残基占据时,那么所述分子在那个位置是同源的。如本文使用的核酸或氨基酸“同源性”相当于核酸或氨基酸“同一性”。该数学算法的优选的非限制性实例在Karlin 等人,roc. Natl. Acad. Sci. USA 90:5873-5877(1993)中有所描述。该算法被并入Altschul 等人,nucleic Acids Res. 25 :389-3402(1997)中描述的 NBLAST 和 XBLAST 程序(2. O版)中。利用BLAST和Gapped BLAST程序时,可以使用各个程序(例如NBLAST)的默认参数。在一个方面,用于序列比对的参数可以设定为得分=100、字长=12,或者可以变化(例如W = 5或W = 20)。
作为探针受关注的核酸分子至少是约15个,优选至少约18、20、23或25个核苷酸,以及可以为30、40、50、100、200或更多个核苷酸长,且包括本文描述的SNP标志物的多态性残基。探针或引物包括核苷酸序列区域,所述核苷酸序列与核酸分子的至少约15个,例如约20至25个,在特定方面与约40、50或75个连续的核苷酸杂交,所述核酸分子包括⑶44、SPP1或HDC或其多态性变体的邻近核苷酸序列。在另一些方面,探针或引物包括100个更少的核苷酸,在某些方面包括6至50个核苷酸,例如12至30个核苷酸。在另一些方面,探针或引物与邻近的核苷酸序列具有至少70%同一性,或者与邻近的核苷酸序列的补体具有至少70%同一性,例如至少80%同一性,在某些方面至少90%同一性,在另一些方面至少95%同一性,或者甚至能够与邻近的核苷酸序列或邻近的核苷酸序列的互补序列选择性地杂交。所述探针或引物通常还包含标签,例如放射性同位素、荧光化合物、酶或辅酶因子。
如本文所述的“标志物”指的是在多态性位点上的特定等位基因的基因组序列特征。本文报道的SNP命名指的是国家生物信息中心(NCBI)分配给每个独特的SNP的官方参考SNP (rs) ID身份标记。如本文所述的“单倍型”指以沿着区段布置的遗传标志物(“等位基因”)的特异性组合为特征的基因组DNA链的区段。在一个特定实施方案中,单倍型可以包括一个或更多个等位基因、两个或更多个等位基因、三个或更多个等位基因、四个或更多个等位基因、或者五个或更多个等位基因。如本文所述的术语“易感性”主要表示增加的易感性。因此本发明的特定标志物和/或单倍型可以具有2型糖尿病的易感性增加的特征,如相对风险较高所表征的。使得2型糖尿病的易感性增加的标志物和/或单倍型另外被认为是“处于风险中”,因为它们带来增加的疾病风险。“相当的细胞”表示其类型与进行比较的其他细胞的类型一致的细胞。相当的细胞的实例是来自相同细胞系的细胞。“抑制”疾病发作表示减少疾病发作的可能性,或者彻底防止疾病发作。在优选的实施方案中,抑制疾病若发作表示彻底防止其发作。“治疗”疾病表示使疾病的进展减慢、停止或逆转。在优选的实施方案中,治疗疾病使疾病的进展逆转,理想地逆转至消除疾病自身的点。如本文使用的,减轻疾病或治疗疾病是相当的。“抑制”基因在细胞中的表达表示,减慢基因被表达的程度,或者彻底防止这种基因表达。“特异性抑制”蛋白质的表达应表示,抑制蛋白质的表达(a)超过任意其他蛋白质的表达,或者(b)超过差不多10个或更少的其他蛋白质的表达。“抗体”包括,例如天然抗体和非天然抗体。特别地,该术语包括多克隆和单克隆抗体,以及它们的片段。另外,该术语包括嵌合抗体和完全合成抗体,以及它们的片段。“反义核酸”表示,在导入细胞中时与细胞中编码蛋白质(“靶蛋白质”)的mRNA的至少一部分特异性杂交的任意核酸,所述蛋白质的表达被抑制,并从而抑制靶蛋白质的表达。与核酸的“特异性杂交”表示,就第一核酸而言,第一核酸与第二核酸杂交的亲合性大于与任意其他核酸杂交的亲合性。“对象”或“患者”表示任意动物,例如人、非人的灵长类、小鼠、大鼠、豚鼠或兔。“合适条件”具有依赖于该术语使用的上下文的意义。也就是说,在与抗体相关使用时,该术语应表示允许抗体与其对应的抗原结合的条件。该术语与核酸杂交相关使用时,该术语应表示允许长度为至少15个核苷酸的核酸与具有与其互补的序列的核酸杂交的条件。该术语与试剂与细胞接触相关使用时,该术语应表示允许能够完成所述接触进入细胞并实施其预定的功能的条件。在一种实施方案中,如本文使用的术语“合适条件”表示生理条件。除非从上下文中显而易见,本发明的所有要素、步骤或特征可以与其他要素、步骤或特征任意组合使用。在下列如分子克隆标准教材中可以发现分子和细胞生物化学的一般方法:ALaboratory Manual, 3rd Ed. (Sambrook 等人,Harbor Laboratory Press 2001) ;ShortProtocols in Molecular Biology, 4th Ed. (Ausubel 等人eds. , John ffiley&Sons 199 9);Protein Methods (Bollag 等人,John ffiley&Sons 1996) ;Nonviral Vectors for GeneTherapy(Wagner 等人 eds., Academic Press 1999) ;Viral Vectors(Kaplift&Loewyeds. , Academic Press 1995) ; Immunology Methods Manual (I. Lefkovits ed.,Academic Pressl997);和 Cell and Tissue Culture Laboratory Procedures inBiotechnology(Doyle&Griffiths, John ffiley&Sons 1998)。本公开文本中涉及的试剂、克隆载体和遗传操作的试剂盒是从商业供应商例如BioRad、Stratagene> Invitrogen、Sigma-Aldrich 和 ClonTech 处可获得的。依据通过本发明人发现或提出的特定实施方案来描述本发明,以便包括用于本发明实践的优选方式。本领域技术人员应理解,按照本公开内容,在不偏离本发明的预定范围的情况下,可以对示例性的特定实施方案进行很多修改和变化。例如,由于密码子冗余,在不影响蛋白质序列的情况下可以对相关DNA序列进行改变。另外,出于生物功能相当的考虑,在不影响生物作用的种类或数量的情况下可以对蛋白质结构进行改变。所有这些修改都包括在所附的权利要求的范围内。列出下列实施例,以便为本领域普通技术人员提供如何实施和使用本发明的完整的公开和描述,并不意在限制发明人的发明范围,也不意在表明下面的实验是全部或者只是所实施的实验。已经做出努力来确保所用数目(例如量、温度等)的准确性,但一些实验性错误和偏差应不包括在内。除非另外指出,份是重量份,分子量是平均分子量,温度是摄氏度,和压力是大气压或接近大气压。本说明书中引用的所有出版物和专利申请通过引用并入本文,特别地和单独地指出每个单独出版物或专利申请通过引用并入。使用CD44特异性抑制剂的治疗方法本发明的方法包括向患有2型糖尿病,或诊断为易患2型糖尿病(例如通过本文所述的本发明的方法)的个体施用CD44活性的抑制剂。所述抑制剂可以对CD44的剪接变体是选择性的,例如剪接变体包括CD44的外显子3,或者靶向CD44的外显子3。施用可以是全身的或局部的,施用的剂量和时机如本文所述的来确定。抑制剂可以通过很多不同的机制来抑制CD44的活性。在某些实施方案中,抑制剂是结合至CD44胞外结构域,并且在实施过程中抑制其配体结合活性。在另一些实施方案中,抑制剂防止CD44的表达或分泌。在另一些实施方案中,抑制剂与CD44的胞质结构域结合,并干扰⑶44介导的信号通路。代表性CD44抑制剂包括但不限于反义寡核苷酸、抗体、CD44配体的片段,尤其是可溶性片段、小分子等。受关注的天然或合成的小分子化合物包括很多化学种类,尽管典型地是有机分子,优选分子量50道尔顿以上和约2500道尔顿以下的小的有机化合物。候选的物质包括对与蛋白质的结构性相互作用必要的官能团,特别是氢键,并且典型地包括至少胺、羰基、羟基或羧基基团,优选至少两个官能性化学基团。候选的物质通常包括碳环或杂环结构和/或芳香族结构或多环芳香族结构,它们被一个或更多个上述官能团取代。候选的物质也存在于包括肽类、糖类、脂肪酸类、类固醇类、嘌呤类、嘧啶类、其衍生物、结构类似物或组合的生物分子中。可通过使用适合的筛选方案等来鉴定此类分子。抑制剂可以作用在⑶44 mRNA上,以便通过减少被靶向的细胞中存在的⑶44 RNA的量来抑制靶CD44的活性。“减少……的量”表示,将靶细胞中靶标CD44 mRNA的水平或数 量与对照相比较减少至少约两倍,通常减少至少约5倍,例如10倍、15倍、20倍、50倍、100倍或更多,即根据对象方法不处理一致的靶细胞。该抑制剂包括RNAi和反义寡核苷酸,其可以对受关注的特异性CD44剪接变体是选择性的。反义试剂可以是反义寡核苷酸(ODN),尤其是具有来自天然核酸的化学修饰的合成0DN,或表达该反义分子如RNA的核酸构建物。反义序列与靶向的mRNA是互补的,并且抑制其表达。可以施用一种反义分子或反义分子的组合,其中组合可包括多种不同的序列。反义分子可以通过所有或部分靶CD44序列在适合的载体中的表达来产生,在载体中转录起始的方向使得产生作为RNA分子的反义链。或者,反义分子是合成的寡核苷酸。反义寡核苷酸的长度通常为至少约7个核苷酸、常见为至少约12个核苷酸、更常见为至少约20个核苷酸,并且长度不超过约25个核苷酸,常见不超过约23-22个核苷酸,其中长度由抑制剂的效率、特异性、包括交叉反应性等所支配。反义寡核苷酸可以是通过本领域已知的方法(见Wagner等人,(1993)和见Milligan等人)化学合成的。优选的寡核苷酸是由天然磷酸二酯结构出发进行了化学修饰的,以便增加它们的胞内稳定性和结合亲合性。文献中已经描述了许多这样的修饰,其改变了骨架、糖类或杂环碱基的化学结构。在骨架化学结构的有用的变化中有硫代磷酸酯、两个非桥连的氧都被硫所替代的二硫代磷酸酯、磷酸酰胺酯(phosphoroamidites)、烧基磷酸三酯和硼烧磷酸酯(boranophosphates)。非手性磷酸酯衍生物包括3 ' -O ' -5 ' -S-硫代磷酸酯、3' -S-5' -O-硫代磷酸酯、3' -CH2-5' _0_磷酸酯和3' -NH-5' _0_磷酸酰胺酯。肽核酸用肽连接代替了整个核糖磷酸二酯骨架。也可使用糖修饰来增强稳定性和亲合性。可使用碱基相对天然β_异头物反转的脱氧核糖α-异头物。核糖的2' -OH可以变化以形成2' -O-甲基或2' -O-烯丙基糖类,这提供了抗降解能力而不包括亲合性。杂环碱基的修饰必须保持正确的碱基配对。一些有用的取代包括对于脱氧胸苷的脱氧尿苷、对于脱氧胞苷的5-甲基-2'-脱氧胞苷和5-溴-2'-脱氧胞苷。在分别代替脱氧胸苷和脱氧胞苷时,已经显示5-丙炔基-2'-脱氧尿苷和5-丙炔基-2'-脱氧胞苷增强亲合性和生物活性。
受关注的反义分子包括antagomir RNA,例如如见Krutzfeldt等人描述的,在此特别地通过引用并入。经改造具有某些“药物样”特性(例如对稳定性的化学修饰和用于递送的胆固醇缀合)的小干扰双链RNA(SiRNA),已经显示其达到了内源性基因在体内的治疗性沉默。为了开发沉默mRNA的在体内的药理方法,开发了与mRNA互补的化学修饰的、胆固醇缀合的单链RNA类似物,称为“antagomir”。Antagomir RNA可以利用标准固相寡核苷酸合成方案来合成。RNA与胆固醇缀合,并且可以进一步在一个或更多个位置包括硫代磷酸酯骨架。在某些实施方案中也受关注的是RNAi物质。RNAi物质表示通过RNA干扰机制来调节mRNA表达的物质。在本发明的一个实施方案中使用的RNAi物质是小核糖核酸分子(本文中也称为干扰核糖核酸),即以双链体结构存在的寡核糖核苷酸,例如两个分开的寡核糖核苷酸互相杂交或者与一个假设小发夹构造的核糖寡核苷酸(ribooligonucleotide)杂交以产生双链结构。寡核糖核苷酸表示长度不超过约lOOnt,典型地不超过约75nt的核糖核酸,在特定的实施方案中长度低于约70nt的核糖核酸。RNA物质是两个分开的核糖核酸互相杂交的双链体结构,例如siRNA,双链体结构的长度典型地为约15至30bp,通常为15 至29bp,在某些实施方案中长度在约20和约29bp之间,例如21bp、22bp尤其受关注。RNA物质是以发夹构造存在的单个核糖核酸的双链结构,即shRNA,发夹的杂交部分的长度典型地与上面提供的siRNA型物质长度相同,或者比其长4至8个核苷酸。本实施方案的RNAi物质的重量典型地为约5000道尔顿至约35000道尔顿,在很多实施方案中为至少约10000道尔顿和低于约27500道尔顿,通常低于约25000道尔顿。dsRNA可以根据很多本领域已知的方法来制备,包括体外和体内方法,以及通过合成化学方法来制备。所述方法的实例包括但不限于,Sadher等人(Biochem. Int. 14 :1015,1987) ;Bhattacharyya (Nature 343:484,1990) JPLivache 等人(美国专利 5,795,715)描述的方法,每种方法的全部内容都通过引用并入本文。单链RNA还可以使用酶促合成和有机合成的组合或者通过完全有机合成来制造。合成的化学方法的使用可以将期望的修饰的核苷酸或核苷酸类似物引入dsRNA。dsRNA还可以根据很多已知方法体内制备(例如见Sambrook等人(1989)Molecular Cloning A Laboratory Manual,2nd ed. !Transcriptionand Translation (B. D. Hames 和 S. J. Higgins, Eds.,1984) ;DNA Cloning, I 和 II 卷(D. N. Glover, Ed.,1985);以及 Oligonucleotide Synthesis (M. J. Gait, Ed.,1984,每种方法的全部内容都通过引用并入本文)。在某些实施方案中,RNAi不是作为干扰核糖核酸,例如如上文所述的siRNA或shRNA,而是RNAi物质可以编码干扰核糖核酸,例如如上文所述的shRNA。换句话说,RNAi剂可以是干扰核糖核酸的转录模板。在这些实施方案中,转录模板典型地是编码干扰核糖核酸的DNA。DNA可以存在于载体中,本领域已知的有各种不同的载体,例如质粒载体、病毒载体等。在另一种实施方案中,CD44抑制剂是抗体。术语“抗体”或“抗体部分”意在包括任何包含多肽链的、具有适合于和鉴定抗原决定部位的特异性形状的分子结构,一个或更多个非共价结合相互作用稳定分子结构和抗原决定部位之间的复合物。该术语包括单克隆抗体、多特异性抗体(包括超过一个结构域特异性的抗体)、人抗体、人源化抗体和具有期望的生物活性的抗体片段。
多克隆抗体可以通过向生产动物注射如上所述配制的抗原组合物通过标准方案来生产。例如见 Harlow 和 Lane, Antibodies :A Laboratory Manual, Cold Spring HarborLaboratory, 1988。在一种这类技术中,最初将包括多肽的抗原部分的II类祀抗原注射到很多种哺乳动物中的任意一种(例如小鼠、大鼠、兔子、绵羊或山羊)。利用整个蛋白质,或蛋白质的较大区段(section)时,可以通过用蛋白质和适合的佐剂(例如弗氏佐剂、弗氏完全佐剂、水包油乳剂等)免疫生产动物来生产抗体。或者,对于单克隆抗体来说,可以通过分离例如来自被接种动物的脾的被刺激的免疫细胞形成杂交瘤。这些细胞随后融合至永生化细胞,例如骨髓瘤细胞或转化细胞,它们能够在细胞培养物中无限复制,从而产生永生的、分泌免疫球蛋白的细胞系。 另外,抗体或抗原结合片段可以通过遗传工程来生产。在这种技术中,正如标准杂交瘤过程,使生产抗体的细胞针对所需的抗原或免疫原致敏。从免疫脾细胞或杂交瘤分离的信使RNA被用作模板,以便使用PCR扩增来制造cDNA。通过将经扩增的免疫球蛋白cDNA的适当区段插入表达载体中来生成载体库,其中每个载体包含保留初始抗原特异性的一个重链基因和一个轻链基因。通过将重链基因库与轻链基因库组合来构建组合文库。这产生 共同表达重链和轻链的克隆库(组装Fab片段或抗体分子的抗原结合片段)。携带这些基因的载体被共转染至宿主(例如细菌、昆虫细胞、哺乳动物细胞或其他适合的蛋白质生产宿主细胞)。在被转染的宿主中诱导抗体基因合成时,重链和轻链蛋白质自组装,以便生产可以通过用抗原或免疫原筛选检测的活性抗体。下述抗体优选用于本发明,即诱导人的强烈或有害免疫应答(例如过敏性休克)之倾向降低,并且还显示出对引发阻止抗体治疗剂重复给药的倾向降低的抗体。因此,在施用给人时产生较少免疫应答的、人源化的、单链、嵌合或人抗体,在本发明中优选使用。本发明中还包括多结构域抗体。嵌合抗体是其中不同部分来源于不同动物种类的分子,例如具有来源于鼠科mAb的可变区和人免疫球蛋白恒定区的那些分子。本文献中描述了开发嵌合抗体的技术。例如参见 Morrison 等人,(1984) Proc. Natl. Acad. Sci. 81 :6851-6855 ;Neuberger 等人,(1984)Nature 312 :604-608 ;Takeda 等人,(1985)Nature 314:452-454。经由氨基酸桥通过连接Fv区的重链片段和轻链片段来形成单链抗体,产生单链多肽。例如参见Huston等人,Science 242 :423-426 ;Proc.Natl. Acad. Sci. 85 :5879-5883 ;和 Ward 等人,Nature341 544-546 ο识别特异性抗原决定表位的抗体片段可以通过本领域已知的技术产生。这些片段包括但不限于,可以通过抗体分子的胃蛋白酶消化产生的F(ab' )2片段,和可以通过还原Fiah1 ) 2片段的二硫键产生的Fab片段。或者,单链抗体(如下面描述的Fv)可以由包含人可变区的噬菌体文库产生。参见美国专利6,174,708。单链免疫毒素LMB-7[B3 (Fv)-PE38]的鞘内施用被证实治愈了大鼠模型中的癌性脑膜炎。Proc Natl. Acad. Sci USA 92,2765-9,其全部都通过引用以整体并入本文。除了整个免疫球蛋白(或它们的重组对应物)之外,包括抗原决定部位结合位点的免疫球蛋白片段(例如Fab’、F(ab’)2或其他片段)在本发明中可用作抗体部分。该抗体片段可以通过无花果蛋白酶、胃蛋白酶、木瓜蛋白酶或其他蛋白酶切割由整个免疫球蛋白产生。利用重组免疫球蛋白技术可以设计“片段”或最小免疫球蛋白。例如用在本发明中的“Fv”免疫球蛋白可以经由肽接头(例如聚甘氨酸或不形成α螺旋或β片层基序的其他序列)通过连接可变轻链区与可变重链区产生。候选抗体可以通过任意适合的标准手段,例如ELISA测定等进行测试。作为第一筛选,可以测试抗体对免疫原的结合。在建立选择性结合之后,可以在体内模型中测试抗体的合适活性。在一个优选的实施方案中,可以使用多种体外和体内方法筛选抗体化合物。这些方法包括但不限于,测量与祀标的结合亲合力的方法、测量在动物或细胞内化合物的生物分布的方法、或测量化合物介导的细胞毒性的方法。本领域已知的这些方法和其他筛选方法提供关于化合物结合、调节特异性靶标或者以其他方式与特异性靶标相互作用的信息,并且测量化合物的效力。抗-CD44抗体可以每天施用、每半周施用、每周施用、每半月施用、每月施用等,全身施用时剂量从每千克体重约O. Olmg起、约O. Img起、约Img起、约5mg起、约IOmg起、约IOOmg起或更多。小剂量可以在局部施用时使用,例如直接施用到眼运动神经等。人源化抗体、嵌合人抗体或人抗体优选施用给人类患者。 在本发明的另一些实施方案中,抑制剂是CD44配体的衍生物,它用于阻断例如可溶性配体、配体类似物、配体片段的活性。受关注的分子包括五肽GRGDS、无内毒素的低分子量透明质酸、和用丁酸残基酯化的透明质酸。抑制剂F-19848A抑制⑶44和HA的结合,其在基于细胞的测定中 IC50 值为 23. 5yM(Hirota-Takahata(2007)J Antibiot 60(10)633-9)。在另一些实施方案中,抑制剂是抑制CD44活性的药物,尤其是小分子药物。这种化合物可以是本领域已知的那些,或者可以使用本文描述的筛选方法来开发。可以使用常规计算方法基于动物数据来确定CD44抑制剂组合物的治疗有效量或预防有效量。在一个实施方案中,如果适用的话,治疗有效量或预防有效量包括约O. Olmg至约Ig的抑制剂,例如核酸、蛋白质或肽等。在另一个实施方案中,如果适用的话,有效量包括约Img至约IOOmg的抑制剂。在又一个实施方案中,如果适用的话,有效量包括约IOmg至约50mg的抑制剂。可以使用本领域技术人员已知的多种方法和递送体系中的任意种来实现或实施相关组合物的施用。例如可以静脉内、口服、经由植入、经粘膜、经皮肤、肌肉内、鞘内和皮下实施所述施用。利用了大量常规使用的药物载体的下列递送体系只是设想用于施用相关组合物的很多实施方案中的代表。可注射的药物递送体系包括溶液、混悬液、凝胶、微球和聚合物注射剂,并且可以包括赋形剂例如溶解性改变剂(例如乙醇、丙二醇和蔗糖)和聚合物(例如聚己内酯和PLGA)。可植入的体系包括棒状物和盘状物,并且可以包括赋形剂例如PLGA和聚己内酯。本发明的核酸还可以附着至颗粒使用基因枪来施用。口服递送体系包括片剂和胶囊。它们可以包含赋形剂例如粘合剂(例如羟丙基甲基纤维素、聚乙烯吡咯烷酮、其他纤维素材料和淀粉),稀释剂(例如乳糖和其他糖类、淀粉、磷酸二钙和纤维素材料),崩解剂(例如淀粉聚合物和纤维素材料)以及润滑剂(例如硬脂酸盐和滑石)。经粘膜递送体系包括贴剂、片剂、栓剂、阴道栓剂、凝胶剂和霜剂,并且可以包括赋形剂例如增溶剂和增强剂(例如丙二醇、胆汁盐和氨基酸),其他载体(例如乙二醇、脂肪酸酯和衍生物、以及亲水聚合物例如羟丙基甲基纤维素和透明质酸)。皮肤递送体系包括例如水性和非水性凝胶、霜剂、复合乳剂、微乳剂、脂质体、软膏、水性和非水性溶液、乳液、气溶胶、碳氢化合物基质和粉末,并且可以包括赋形剂例如增溶剂、渗透增强剂(例如脂肪酸、脂肪酸酯、脂肪醇和氨基酸),以及亲水聚合物(例如聚卡波非和聚乙烯吡咯烷酮)。在一种实施方案中,药学上可接受的载体是脂质体或透皮增强剂。用于可重构递送体系的溶液、混悬液和粉末包括载体例如助悬剂(例如胶质、黄原胶、纤维素质和糖类),保湿剂(例如山梨糖醇),增溶剂(例如乙醇、水、PEG和聚丙二醇),表面活性剂(例如月桂醇硫酸钠、Span、Tween和十六烷基吡啶),防腐剂和200年6月2日抗氧化剂(例如苯甲酸酯类、维生素E和C以及抗坏血酸),抗结块剂和螯合剂(例如 EDTA)。
诊断方法本发明描述了⑶44、SPP1和HDC基因的遗传变体,它们是用于对2型糖尿病(T2D)的个体易感性的遗传标志物。在本发明的诊断方法中,可以评估个体的CD44、SPPl和HDC的一个或更多个中多态性的存在,并且可以进一步评估这些遗传基因座的每一个中的一种或更多种多态性。因此,可以针对如本文所述一个、两个、三个、四个、五个或更多个不同的多态性基因座中一个或两个等位基因的存在,对个体进行基因分型。在一些实施方案中,多态性是单核苷酸多态性(SNP)。风险评价还可以包括对与本文所述的遗传多态性邻接的基因组区域的分析。DNA的大区域通常作为区块(block)遗传,由此,含有相邻的构成原因的以及不构成原因的多态性。因此,多态性可以作为“连锁不平衡区块”或“LD区块”连同很多其他多态性遗传。在本发明的一个实施方案中,通过检测⑶44、SPPl和HDC基因座的一个或更多个中的成因性多态性,进行2型糖尿病易感性的诊断。CD44、SPP1和/或HDC核酸中,多态性可以被改变,例如插入或缺失单个核苷酸,或超过一个核苷酸,导致移码;改变至少一个核苷酸,导致所编码的氨基酸的改变;改变至少一个核苷酸,导致过早的终止密码子的产生; 几个核苷酸的缺失,导致通过所述核苷酸编码的一个或更多个氨基酸的缺失;插入一个或数个核苷酸,例如通过不等重组或基因转换,导致基因编码序列的中断;所有或部分基因的重复;所有或部分基因的转座/易位;选择性剪接、或者所有或部分基因的重排。单个基因中可以存在超过一个的这种改变。这种序列改变可以引起由⑶44、SPPl或HDC核酸编码的多肽中的差异。例如,如果差异是移码改变,移码可以导致所编码的氨基酸的改变,和/或可以导致过早终止密码子的产生,引起截短多肽的产生。或者,与CD44、SPP1或HDC核酸相关疾病或病症或者对疾病或病症的易感性相关的多态性,可以是一种或更多种核苷酸中的同义改变(即,所述改变不会导致CD44、SPP1或HDC核酸编码的多肽中的改变)。这样的多态性可以改变剪接位点,影响mRNA的稳定性或转运,或者以其他方式影响基因的转录或翻译。具有前面描述的任意的变化或改变的CD44、SPPl或HDC核酸本文中指的是“改变的核酸”。受关注的特定多态性包括存在于⑶44基因座的SNP中的那些,例如⑶44多态性的附表。在本发明的一些实施方案中,通过一个或更多个CD44SNP序列对个体进行基因分型,所述 CD44SNP 序列选自 rs353647、rsll2762、rs7930724、rsl071695。位于 CD44 外显子3中的SNP rsl071695是受关注的,并在日本族裔个体的基因分型中特别有用。多态性位点
的序列如下,风险等位基因标注了下划线
SEQ ID N〇:1 rs353647 CAATGTCATCCAAGTGGGAAAGTCAG [C/G] attctaacctctatgctatgt
TGCC
SEQ ID N〇:2 rs112762 GCCTAAAATAGAGCCTGGCATATACA [C/T]T^ATGAATGCACAATAAATATT
AGCC SEQ ID N〇:3 rs1071695 TACAGGTATGGGTTCATAGAAGGGCA[C/T] GTGGTGATTCCCCGGATCCAC
CCCA
SEQ ID NO:4 rs7930724 ATTTACTCAACAATTCCTTTGTTTTT [a/g] gtccaaggaagcatatctgga
AGAGSPPl (骨桥蛋白)的特定多态性包括但不限于,SNP rs4754、rs9138、rsl0012150、rsll26616和rsll26772。多态性位点的序列如下,风险等位基因标注了下划线
SEQ ID NO5 rs4754GATGATATGGATGATGAAGATGATGA [C/T] GACCATGTGGACAGCCAGGAC
TCCA
SEQ ID NO6 rs9138CTCTCATGAATAGAAATTTATGTAGA [A/C ] GCAAACAAAATACTTTTACCC
ACTT
SEQ ID NO7 rs10012150 AGCTAGAAAAGTGGATCACATAGAGA [ C/T j AGACTGTAAATTGGTGGTTCT
ACAA
SEQ ID NO8 rs1126616 CAGTCCAGATTATATAAGCGGAAAGC [C/T] AAT G ATG AG AG C AATG AG C AT
TCCG
SEQ ID N〇:9 rs1126772 GTATCTATTTGAGTCTGGAAATAACT [A/G] ATGTGTTTGATAATTAGTTTA
GTTTHDC的特定多态性包括但不限于,SNP rs854150、rs2853766、和rs2238292。多态
性位点的序列如下,风险等位基因标注了下划线
SEQ ID N010 rs854150 CTCAAGGTAAAGAAGAGCCCTGTCAG [C7G] CTTTATACGTCCAGATTTT
TTGATC
SEQ ID NO:11 rs2853766 TGCCCTAGCTTACACAGCTGATAAGC [A/G] GAAGAACGAGGATTCAAAC
TGATGC
SEQ ID NO: 12 rs2238292 CTGCCCACTCAGCTCCTCCTTACATC [A/C] ggttttgattgtgggctca
GGGCTT为了确定2型糖尿病的易感性,可以使用杂交方法例如Southern分析、Northern分析、或原位杂交(见 Current Protocols in Molecular Biology, Ausubel,F.等人,eds,John Wiley&Sons,包括贯穿1990的所有附录)。例如,从个体(RNA和cDNA只可以用于外显子标志物)获得来自基因组DNA、RNA或cDNA的测试对象(“测试个体”)的生物样品(“测试样品”),所述个体例如疑似患有2型糖尿病、对2型糖尿病易感或者易于患2型糖尿病、或携带2型糖尿病缺陷。个体可以是成人、儿童或胎儿。测试样品可以来自包括基因组DNA的任意来源,例如血液样品、羊水样品、脑脊液样品、或者来自皮肤、肌肉、口腔或结膜粘膜、胎盘、胃肠道或其他器官的组织样品。
随后检验DNA、RNA或cDNA样品,以便确定CD44、SPP1和/或HDC核酸中存在哪种多态性的等位基因。通过基因组DNA、RNA或cDNA中基因与核酸探针的杂交可以指示受关注等位基因的存在。如本文使用的,“核酸探针”可以是DNA探针或RNA探针;核酸探针可以包括例如在⑶44、SPP1和/或HDC核酸中的至少一个多态性残基。探针可以是任意上述核酸分子(例如基因或核酸、片段、包括基因或核酸的载体、探针或引物等)。用于检测mRNA或基因组DNA的优选探针是能够与本文所述的mRNA或基因组DNA序列杂交的带标记核酸探针。核酸探针例如可以是全长核酸分子,或者其一部分,例如长度为至少15、30、50、100、250或500个核苷酸的寡核苷酸,并足以在严格条件下与适合的1111 ^或基因组DNA序列特异性杂交,以及足以区分风险等位基因和保护性等位基因。杂交样品保持在足以允许核酸探针与CD44、SPP1和/或HDC核酸特异性杂交的条件下。如本文使用的,“特异性杂交”表示严格杂交(例如无错配)。特异性杂交可以在例如如上所述的高严格度或中等严格度下实施。在一个特别优选的方面中,特异性杂交的杂交条件是对探针长度适合的高度严格。 使用标准方法检测特异性杂交(如果存在的话)。在所述方法中还可以同时使用超过一种核酸探针。任意一种核酸探针与本文中所述为易感性等位基因的等位基因的特异性杂交是2型糖尿病易感性的诊断依据。在本发明的另一种方法中,如果基因中的改变(突变)或多态性导致限制性位点的产生或消除,则可以使用通过限制性消化的替代分析来检测基因中的改变。从个体获得包含基因组DNA的测试样品。可以使用聚合酶链反应(PCR)来扩增来自测试个体的基因组DNA的测试样品中CD44、SPPl或HDC核酸(如果必要的话,和侧翼序列)。如所述的实行RFLP 分析,见 Current Protocols in Molecular Biology。相关 DNA 片段的消化模式指不是否存在本文所述作为CD44、SPPl或HDC核酸中易感性等位基因的等位基因,并因此指示是否存在对2型糖尿病的易感性。序列分析还可以被用于检测CD44、SPP1或HDC核酸中的特异性多态性。从测试个体获得DNA或RNA的测试样品。可以使用PCR或其他适合的方法来扩增基因或核酸,和/或其侧翼序列(如果需要的话)。使用标准方法确定CD44、SPPl或HDC核酸序列、或核酸片段序列、或cDNA序列、或cDNA片段序列、或mRNA序列、或mRNA片段序列。视情况而定,将核酸、核酸片段、cDNA、cDNA片段、mRNA或mRNA片段的序列与基因或cDNA或mRNA的已知核酸序列进行比较。本文所述作为CD44、SPP1或HDC基因中易感性等位基因的多态性的存在指示个体具有对2型糖尿病的易感性。等位基因特异性寡核苷酸还可以用于检测CD44、SPPl或HDC核酸中多态性的存在,通过使用经扩增的寡核苷酸与等位基因特异性寡核苷酸(ASO)探针的点印迹杂交(例如见Saiki,R.等人,Nature 324 163-166 (1986)) 0 “等位基因特异性寡核苷酸”,也称为“等位基因特异性寡核苷酸探针”是约10至50个碱基对的寡核苷酸,它与CD44、SPPl或HDC核酸特异性杂交,并包括与对2型糖尿病的易感性相关联的多态性。使用标准方法(见Current Protocols in Molecular Biology)可以制备对 CD44、SPP1 或 HDC 核酸中特定多态性特异性的等位基因特异性寡核苷酸探针。本发明进一步提供了等位基因特异性寡核苷酸,它与包括多态性的基因或核酸的参考或变体等位基因杂交,或与它们的互补序列杂交。这些寡核苷酸可以是探针或引物。由于作为锁核酸(LNA)的这种类似物的添加,可以将引物和探针的尺寸降至少到8个碱基。从个体获得DNA的测试样品。可以使用PCR来扩增⑶44、SPP1或HDC核酸的全部或片段以及其侧翼序列。使用标准方法(见Current Protocols in Molecular Biology)对含有经扩增的CD44、SPPl或HDC核酸(或基因或核酸的片段)的DNA进行点印迹,将所述印迹与各个寡核苷酸探针接触。随后检测探针与经扩增的CD44、SPP1或HDC核酸的特异性杂交的存在。等位基因特异性寡核苷酸探针与来自个体的DNA的杂交,指示了本文所述作为CD44、SPPl或HDC基因中易感性等位基因的等位基因的存在,因此指示对2型糖尿病的易感性。等位基因特异性引物与重叠多态性的靶DNA上的位点杂交,且只引发等位基因型(allelic form)的扩增,引物对所述等位基因型显示出完美的互补性。见Gibbs, NucleicAcid Res. 17,2427-2448(1989)。该引物与第二引物一起使用,第二引物在远端位置杂交。扩增从两个引物开始,产生可检测的产物,该产物指示存在特定的等位基因型。通常用第二对引物实施对照,所述第二对引物之一示出在多态性位点的单个碱基错配,另一个示出与 远端位点的完美互补性。单个碱基错配阻止了扩增,并且不形成可检测的产物。当所述错配与多态性相比包含在所述寡核苷酸的3'-末端位置(most position)时,所述方法的效果最好,因为这个位置与来自引物的延长部最不稳定(例如见WO 93/22456)。在另一方面中,与来自个体的靶核酸序列区段互补的寡核苷酸探针的阵列可以用来鉴定CD44、SPPl或HDC核酸中多态性等位基因的存在。例如,在一个方面中,可以使用寡核苷酸阵列。寡核苷酸阵列典型地包括多种不同的寡核苷酸探针,所述探针与在不同的已知位置与衬底的表面相连接。这些寡核苷酸阵列,也描述为“基因芯片”,其已经在本领域一般性地描述,例如在美国专利5,143,854和PCT专利出版物WO 90/15070和92/10092中。这些阵列一般可以使用机械合成方法方法生产,或使用引入了光蚀刻方法和固相寡核苷酸合成方法的组合的光导向合成方法来生产。见Fodor等人,Science251 :767-777 (1991),Pirrung等人,美国专利5,143,854 (还参见PCT申请WO 90/15070)和Fodor等人,PCT公开TO 92/10092和美国专利5,424,186,其全部教导通过引用并入本文。在例如美国专利5,384,261中描述了使用机械合成方法合成这些阵列的技术,其全部教导通过引用并入本文。在另一个实例中,可以利用线型阵列。一旦制备了寡核苷酸阵列,受关注的核酸就与该阵列杂交,并筛选多态性。杂交和筛选一般通过本文描述的方法,还有例如公开的PCT申请WO 92/10092和WO 95/11995以及美国专利5,424,186中描述的方法来实施,其全部教导通过引用并入本文。简言之,通过众所周知的扩增技术例如PCR来扩增包括一种或更多种之前鉴定的多态性标志物的靶核酸序列。典型地,这涉及引物序列的使用,所述引物序列与来自多态性的上游和下游靶序列的两个链是互补性的。还可以使用不对称的PCR技术。随后,一般引入了标记的经扩增靶标与阵列在适当条件下杂交。阵列的杂交和冲洗完成时,扫描所述阵列以便确定阵列上靶序列合成的位置。通常,由扫描获得的杂交数据是作为阵列上位置之函数的荧光强度的形式。用于多态性检测的寡核苷酸阵列的其他用途可见于例如美国专利5,858,659和5,837,832中,其全部教导通过引用并入本文。可以使用其他核酸分析方法来检测2型糖尿病基因中的多态性等位基因,或由2型糖尿病基因编码的变体。代表性方法包括直接手动测序(Church 和 Gilbert, Proc. Natl. Acad. Sci. USA 81 1991-1995 (1988) ;Sanger, F.等人,Proc. Natl. Acad. Sci. USA 74:5463-5467(1977) ;Beavis 等人,美国专利 5,288,644);自动突光测序;单链构象多态性测定(SSCP);夹变性凝胶电泳(clamped denatured gelelectrophoresis, CDGE);变性梯度凝胶电泳(DGGE) (Sheffield, V. C.等人,Proc. Natl.Acad. Sci. USA 86 :232-236(1989));迁移率变动分析(Orita, M.等人,Proc. Natl. Acad.Sci.USA 86 :2766-2770(1989));限制性内切酶分析(Flavell 等人,Cell 15 :25(1978);Geever,等人,Proc. Natl. Acad. Sci. USA 78:5081(1981));异源双链体分析;化学错配切割(CMC) (Cotton 等人,Proc. Natl. Acad. Sci. USA 85 :4397-4401 (1985)) ;RNA 酶保护测定(Myers, R. M.等人,Science 230 :1242(1985));使用多肽来识别核苷酸错配,例如大肠杆菌mutS蛋白质;例如等位基因特异性PCR。在本发明的一个方面中,还可以通过定量PCR (动态热循环) 的表达分析进行对2型糖尿病的易感性的诊断。这种利用TaqMan 测定的方法可以评价⑶44、SPP1或HDC核酸或者由⑶44、SPP1或HDC核酸编码的剪接变体的表达或组合中改变的存在。TaqMan.⑧探针还可以用于允许多态性的鉴定,以及患者是纯合体还是杂合体的鉴定。另外,可以将变体的表达定量为身体上或功能上的不同。在本发明的另一个方面中,通过检验⑶44、SPPI或HDC多肽的表达和/或组成,可以进行对2型糖尿病的易感性的诊断,所述检验通过各种包括酶联免疫吸附测定(ELISA)、Western印迹、免疫沉淀和免疫荧光方法来进行。评价来自个体的测试样品,评价由CD44、SPPl或HDC核酸编码的多肽的表达和/或组成中改变的存在,或者评价由CD44、SPPl或HDC核酸编码的特定变体的存在。由CD44、SPP1或HDC核酸编码的多肽的表达中的改变可以是,例如定量多肽表达(即所产生的多肽的量)中的改变;由CD44、SPPI或HDC核酸编码的多肽的组成中的改变是定性多肽表达,例如改变的CD44、SPPl或HDC多肽的表达或不同剪接变体的表达)。在优选的方面中,通过检测由⑶44、SPPl或HDC核酸编码的特定剪接变体、或剪接变体的特定模式,可以进行对2型糖尿病的易感性的诊断。还可以存在两种改变(定量和定性)。如本文中使用的,多肽表达或组成中的术语“改变”指的是,与对照样品中由⑶44、SPPl或HDC核酸编码的多肽的表达或组成相比较,测试样品中表达或组成中的改变。对照样品是对应测试样品的样品(例如来自相同类型的细胞),其来自不受II型糖尿病易感性影响的个体。与对照样品相比较,测试样品中多肽的表达或组成中的改变是对2型糖尿病的易感性的指示。类似地,与对照样品相比较,测试样品中一种或更多种不同的剪接变体的存在,或测试样品中显著不同量的不同剪接变体的存在,是对2型糖尿病的易感性的指示。可以使用检验由⑶44、SPPl或HDC核酸编码的多肽的表达或组成的多种手段,其包括光谱、色谱、电泳、等电聚焦和免疫测定(例如David等人,美国专利4,376,110),例如免疫印迹(也参见Current Protocols in Molecular Biology)。例如,在一个方面中,可以使用例如如上所述的能够结合多肽的抗体,优选具有可检测的标签的抗体。抗体可以是多克隆的,或更优选是单克隆的。可以使用完整的抗体或其片段(例如Fab或F(ab' ) 2)。对于探针或抗体,术语“标记的”意在包括通过将可检测的物质与探针或抗体相连接(即物理性连接)来直接标记探针或抗体,以及通过与其他直接标记的试剂的反应性来间接标记探针或抗体。间接标记的实例包括,使用荧光标记的第二抗体检测第一抗体,和用生物素末端标记DNA探针以便可以用荧光标记的链霉亲和素检测到它。使用与改变的CD44、SPPl或HDC核酸所编码的多肽特异性结合的抗体、或与未改变的核酸所编码的多肽特异性结合的抗体、或与核酸编码的特定剪接变体特异性结合的抗体,Western印迹分析可以用于鉴定测试样品中特定的剪接变体的存在,或者由多态性或改变的CD44、SPPl或HDC核酸编码的多肽的存在;或者用于鉴定测试样品中不存在特定的剪接变体,或者不存在由非多态性或未改变的核酸编码的多肽。由多态性或改变的核酸编码的多肽的存在,或者不存在由非多态性或未改变的核酸编码的多肽,是2型糖尿病易感性的诊断依据,由CD44、SPPl或HDC核酸编码的特定剪接变体的存在(或不存在)亦如此。在该方法的一个方面中,测试样品中CD44、SPPl或HDC核酸所编码的多肽的水平或量,与对照样品中CD44、SPPl或HDC核酸所编码的多肽的水平或量相比较较。测试样品中多肽的水平或量,比对照样品中多肽的水平或量高,或者比对照样品中多肽的水平或量低,从而在统计学上的差异是显著的,这是CD44、SPP1或HDC核酸所编码的多肽的表达中的改变的指示,并且是2型糖尿病易感性的诊断依据。或者,测试样品中CD44、SPP1或HDC核 酸所编码的多肽的组成,与对照样品中⑶44、SPPl或HDC核酸所编码的多肽的组成相比较(例如不同剪接变体的存在)。与对照样品中多肽的组成相比,测试样品中多肽组成中的差异,是2型糖尿病易感性的诊断依据。在另一些方面中,可以评价测试样品和对照样品两者中多肽的水平或量以及多肽的组成。测试样品中多肽的量或水平与对照样品中多肽的量或水平相比较的差异;测试样品中组成与对照样品中组成相比较的差异;或者量或水平的差异以及组成的差异,指示了 2型糖尿病的易感性。标志物和单倍型的评估个体的基因组显示出基因组中很多位置上的序列可变性。在一些情况下,提到多态性位点处的替代性等位基因,而不选择参考等位基因。或者,对于特定的多态性位点,可提到参考序列。所述参考等位基因有时指的是“野生型”等位基因,其通常被选为第一测序等位基因或作为来自“未受到影响的”个体的等位基因,例如没有出现疾病或异常表型的个体。不同于所述参考的等位基因指的是“变体”等位基因。单倍型是在多态性位点处具有特定等位基因的各种遗传标志物的组合。单倍型可以包括各种遗传标志物的组合,因此,可以通过本领域已知的用于检测多态性位点的序列的方法来实现单倍型的检测。鉴定相关标志物和SNP的某些方法包括连锁不平衡(LD)和/或LOD得分的使用。在本文所述的特定方法中,处于2型糖尿病风险中的个体是在其中鉴定出至少一种风险标志物或单倍型的个体。在一个方面中,风险标志物或单倍型是使得2型糖尿病(或易感性)风险显著增加的标志物或单倍型。在一个实施方案中,通过相对风险来测量与标志物或单倍型相关联的显著性。在另一个实施方案中,通过百分比测量显著性。在一个实施方案中,显著性增加的风险测量为至少约I. 2的相对风险,包括但不限于1. 2,1. 3,1. 4、1.5、1.6、1.7、1.8和1.9。在另一个实施方案中,至少I. 2的相对风险是显著性。在另一个实施方案中,至少I. 5的相对风险是显著性。在另一个实施方案中,风险的显著性增加至少约I. 7是显著性。在另一个实施方案中,风险的显著性增加至少约20%,包括但不限于约25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95% 和98%。在另一个实施方案中,风险的显著性增加至少约50%,并可以用处于风险中的标志物的组合来增加。在⑶44、SPPl或HDC基因中或包含其一部分的风险标志物或单倍型,是下述标志物或单倍型,即与其在健康个体(对照)中存在的频率相比较,更频繁地存在于处于2型糖尿病风险中的个体(受到影响的),其中该标志物或单倍型的存在是对2型糖尿病的易感性的指示。作为相关性简单测试的实例的是对二乘二表的Fisher精确检验。考虑到染色体的组,二乘二表由包括两种标志物或单倍型的、包括一种标志物或单倍型但不包括另一种的和两种标志物或单倍型均不包括的染色体的数目构建。在本发明的某些方面中,风险标志物或单倍型是与2型糖尿病显著关联的CD44、SPPl或HDC内或接近⑶44、SPPl或HDC的风险标志物或单倍型。在另一些方面中,风险标志物或单倍型包括与对2型糖尿病易感性显著关联的⑶44、SPPI或HDC内或接近⑶44、SPPl或HDC的风险标志物或单倍型。在本发明的一些特定实施方案中,所述标志物或单倍型是与本文所述的CD44、SPPl或HDC的LD区块相关联的。
可以使用最大期望算法来估计在患者中和对照组中单倍型的频率(Dempster等 人,J. R. Stat. Soc. B,39 :1-38(1977))。可执行该算法,其可处理缺失的基因型以及与相有关的不确定性。在一个优选的实施方案中,P值< 0. 05是标志物和/或单倍型显著相关性的指示。对于与疾病相关联的单个标志物来说,可以使用Fisher精确检验来计算每个单独等位基因的双侧P值。除非特别指出,所有P值均未调整地给出,用于多重比较。存在的频率(对于微卫星、SNP和单倍型)是与载体频率相反的等位基因频率。为了将由于被招募作为连锁分析的家族的患者的亲属关系带来的任何偏见降至最低,可以从患者名单上排除一级未属和_■级未属。另外,可以重复检验,以针对患者间任意剩余的未属关系进行相关性校正,通过 Risch,N.&Teng,J. (Genome Res.,8 :1273-1288 (1998))中描述的扩展方差调整方法,合并亲缘关系的DNA(ibid),以便可以应用于一般家族关系,且存在经调整的和未经调整的P值以用于比较。如预期的,差异一般来说非常小。为了评价多重检验校正的单个标志物相关显著性,可以进行使用相同基因型数据的随机测试。患者和对照的群可以是随机的,并可以多次(例如高达500000次)重复相关性分析,p值是产生一些标志物等位基因的P值的复制的一小部分,低于或等于在初始患者和对照群中观察到的P值。对于单一标志物和单倍型分析来说,可以假设相乘模型(单倍型相对风险模型)来计算相对风险(RR)和人群归因风险(PAR) (Terwilliger, J. D. &0tt, J.,Hum. Hered. 42 337-46(1992)和 Falk, C. T. &Rubinstein, P, Ann. Hum. Genet. 51(Pt 3) :227-33(1987)),即,将人携带的两种等位基因/单倍型的风险相乘。例如,如果RR是A相对于a的风险,则人纯合体的风险AA将是杂合体Aa的风险的RR倍,和纯合体aa的风险的RR2倍。相乘模型具有简化分析和单倍型计算独立的良好特性,即在哈迪-温伯格平衡中,在受到影响的人群中以及在对照人群中。结果是,受到影响的和对照的单倍型计数,每个具有多项分布,但是在备择假设中具有不同的单倍型频率。特别地,对于两种单倍型hi和hj来说风险(hi)/风险(hj) = (fi/pi/(f j/pj),其中f和p分别指称受到影响的人群和对照人群中的频率。而如果真实模型是不相乘的,则存在效力损失,因此除了极端情况外损失趋于轻微。最重要的是,由于相对于零假设计算,P值一直有效。标志物对之间的LD可以使用D '和R2的标准定义来计算(Lewontin,R. , Genetics49 :49-67 (1964) ;Hi11, ff. G. &Robertson, A. Theor. Appl. Genet.22 226-231 (1968))。使用NEMO,通过最大似然估计的两种标志物等位基因组合的频率,和通过似然比检验估计相对于连锁平衡的偏差。D'和R2的定义延伸至包括对求平均值的微卫星位点,所述值用于通过边际等位基因概率加权的两种标志物的所有可能的等位基因组合。当绘制所有标志物组合来阐明特定区域中的LD结构时,将D'绘制在左上角,p值在右下角。如果期望的话,在LD图中,标志物可以等距绘制,而不是根据其物理位置。在某些实施方案中,标志物和单倍型的分析涉及对基于“单倍型区块”(也称为“LD区块”)的候选易感性基因座进行定义。已经报道,人基因组的一部分可以断裂成一系列包括少数常见的单倍型的不连续的单倍型区块;对于这些区块,连锁不平衡数据几乎没有提供指示重组的证据(例如见Wall.,J. D.和Pritchard, J. K.,NatureReviews Genetics4 :587-597 (2003) ;Daly, M.等人,Nature Genet. 29 :229-232 (2001);Gabriel, S. B.等人,Science 296:2225-2229(2002) ;Patil, N.等人,Science 294 1719-1723(2001) ;Dawson, E.等人,Nature 418 :544-548(2002) ;Phillips, M.S.等人,Nature Genet. 33 :382-387 (2003))。有两种主要的方法来定义这些单倍型区块区块可以被定义为具有有限的单倍型多样性的DNA区域(例如见Daly,M.等人,Nature Genet. 29 229-232(2001) ;Patil,N.等人,Science 294:1719-1723(2001) ;Dawson, E.等人,Nature418 :544-548(2002) ; Zhang, K.等人,Proc. Natl. Acad. Sci.USA 99 :7335-7339 (2002)),或者被定义为具有大量历史重组的过渡区之间的区域,使用连锁不平衡来鉴定(例如见 Gabriel, S. B.等人,Science 296 :2225-2229(2002) ;Phillips, M.S.等人,NatureGenet. 33 :382-387(2003) ;ffang,N.等人,Am. J. Hum. Genet. 71 :1227-1234(2002) ;Stumpf,M. P.,和 Goldstein,D. B.,Curr. Biol. 13 :1-8(2003))。如本文使用的,术语“单倍型区块”或“LD区块”包括由任一特征定义的区块。用于鉴定单倍型区块的代表性方法,例如在美国公开的专利申请20030099964、20030170665,20040023237和20040146870中列出。单倍型区块可以容易地用于对表型和单倍型状态之间的相关性进行作图。可以在每个单倍型区块中鉴定出主要单倍型,随后可以鉴定出一组“带标签的”SNP或标志物(区分单倍型所需的最小的SNP或标志物组)。这些带标签的SNP或标志物可以接着被用于评估来自个体组的样品,从而鉴定表型和单倍型之间的相关性。如果需要,可以同时评估相邻的单倍型区块,因为那里也可能存在单倍型区块间的连锁不平衡。在一些特定的实施方案中,与⑶44、SPP1或HDC的LD区块相关的标志物或单倍型是,其中与其在健康个体(对照)中存在的频率相比较,更频繁地存在于处于2型糖尿病风险中的个体(受到影响的)中的标志物或单倍型,其中该标志物或单倍型的存在是2型糖尿病或对2型糖尿病的易感性的指示。在另一些实施方案中,与一种或更多种CD44、SPPl或HDC的LD区块相关标志物处于连锁不平衡的带标签风险标志物是与其在健康个体(对照)中存在的频率相比较,更频繁地存在于处于2型糖尿病风险中的个体(受到影响的)中的标志物,其中该标志物的存在是2型糖尿病或对2型糖尿病的易感性的指示。在另一个实施方案中,与一种或更多种⑶44、SPP1或HDC的LD区块相关标志物处于连锁不平衡的风险标志物,是与其在健康个体(对照)中存在的频率相比较,更频繁地存在于处于2型糖尿病风险中的个体中的标志物,其中该标志物的存在是对2型糖尿病的易感性的指示。
筛选方法本发明还提供用于鉴定物质(例如融合蛋白、多肽、类肽物、前药、受体、结合剂、抗体、小分子药物或其他药物、或核酶)的方法,所述物质是改变(例如增强或降低)CD44或CD44配体(例如否则与CD44相互作用骨桥蛋白、透明质酸)的活性,或者以其他方式与CD44相互作用骨桥蛋白。例如,在某些实施方案中,所述物质可以是结合至CD44的物质;其对例如CD44的活性具有抑制作用;或者抑制CD44与其同源配体相互作用的能力。在一个实施方案中,本发明提供用于筛选候选或测试物质的测定,以及通过该测定可鉴定的物质,所述候选或测试物质结合或介导CD44蛋白质的活性(或其生物活性部分)或CD44配体。优选地,候选物质在用于2型糖尿病的模型中进一步接受测试,所述模型例如是 Chen 和 Wang(2005)Diabetes Obes Metab. 7 (4) :307-17 中列出的任一种动物模型,本文特别地通过引用并入了关于药物筛选中使用的动物模型的公开内容。可以使用本领域已知的组合文库方法中的多种方法获得测试物质,所述方法包 括生物文库、空间可寻址的平行固相或液相文库、要求去卷积的合成库方法、“一珠一化合物方法”文库方法、和使用亲合性色谱选择的合成库方法。在一个实施方案中,为了鉴定改变⑶44活性的物质,可以将包含或表达⑶44或者其片段或衍生物或CD44配体的细胞、细胞裂解物、或者溶液与待测试的物质相接触;或者,可以将蛋白质直接与待测试的物质接触。或者直接或者间接地评价活性水平(量),并且与对照(例如不存在待测试的物质)中的活性水平进行比较。如果所述物质存在下的活性水平以统计学上显著的量不同于不存在所述物质的情况,那么该物质是改变活性的物质。本发明还涉及一个测定,所述测定用于鉴定改变⑶44基因或其配体之表达的物质(例如反义核酸、融合蛋白质、多肽、类肽物、前药、受体、结合剂、抗体、小分子药物或其他药物,或核酶),所述物质改变基因的表达(例如转录或翻译)。例如,编码CD44的核酸可以与待测试的物质接触。溶液可以包括例如含有核酸的细胞或含有核酸的细胞裂解物;或者,溶液可以是包括核酸转录/翻译必需的要素的其他溶液。如果需要的话,还可以使用没有悬浮在溶液中的细胞。评价⑶44表达的水平和/或模式,并与对照中表达的水平和/或模式进行比对。如果存在所述物质的情况下,水平和/或模式以统计学上显著的量或方式不同于不存在所述物质的情况下的水平和/或模式,那么该物质是改变表达的物质。在本发明的另一个实施方案中,使用含有与报告基因可操作地连接的编码基因或核酸启动子区的核酸的细胞、细胞裂解物、或者包含核酸的溶液,可以鉴定改变CD44或其配体的表达的物质。在与待测试的物质接触之后,评价报告基因的表达水平,并与对照中的表达水平进行比对。如果存在所述物质的情况下,该水平以统计学上显著的量或方式不同于不存在所述物质的情况下的水平,那么该物质是改变⑶44表达的物质,如通过改变与CD44基因启动子可操作地连接的基因表达的能力所显示的。改变由CD44编码的不同剪接变体的量的物质,例如增强第一剪接变体的表达的物质,和抑制第二剪接变体的表达的物质,以及拮抗第一剪接变体的活性的物质和拮抗第二剪接变体的活性的物质,使用上述这些方法可以容易地鉴定。在本发明的另一些实施方案中,测定可以用于评价测试物质对CD44配体相关多肽之活性的影响。例如,将表达CD44配体的细胞在存在待测试的物质的情况与CD44接触,确定待测试的物质改变⑶44和⑶44结合物之间相互作用的能力。或者,可以使用包含⑶44配体的细胞裂解物或溶液。可以如下所述确定测试物质结合至CD44或CD44配体的能力,例如通过将测试物质与放射性同位素或酶标签耦合,以便通过直接或间接地检测125i、35s、14C或3H标记,并通过直接计数放射性发射(radioemmission)或通过闪烁计数,确定测试物质与多肽的结合。或者,测试物质可以被酶促标记,例如用辣根过氧化物酶、碱性磷酸酶或萤光素酶,以及通过诊断适当底物向产物的转化来检测酶标签。在不对任何反应物(interactant)进行标记的情况下确定测试物质与多肽相互作用的能力也在本发明范围内。例如,可以使用微生理计(microphysiometer)来检测测试物质与0)44或0)44配体的相互作用,而不标记测试物质、CD44 或 CD44 配体。McConnell, H. M.等人,Science 257:1906-1912(1992)。如本文使用的,“微生理计”是使用光寻址电位传感器(LAPS)测量细胞酸化其环境的速率的分析装置。该酸化速率的变化可以被用作配体和多肽之间相互作用的指示剂。在本发明的上述测定方法的超过一个的实施方案中,使⑶44基因、⑶44蛋白质、CD44配体或该测定的其他组分固定在固体支持物上可能是理想的,从而促进一种或两种蛋 白质的复合形式与非复合形式分离,以及适应测定的自动化。测试物质与蛋白质的结合,或者在存在和不存在测试物质条件下蛋白质与结合剂的相互作用,可以在适用于容纳反应物的任意容器中完成。该容器的实例包括微量滴定板、试管、和微离心管。在一个实施方案中,可以提供融合蛋白质(例如谷胱甘肽-S-转移酶融合蛋白),其添加允许CD44、CD44蛋白质或CD44配体结合至衬底或其他固体支持物的结构域。本发明还涉及通过上述筛选测定来鉴定的新型物质。因此,进一步在如本文所述的治疗方法中使用如上所述鉴定的物质在本发明范围内。例如,如上所述鉴定的物质可以用于改变由CD44基因编码的蛋白质的活性,或者用于通过使蛋白质或核酸与如本文所述鉴定的物质相接触(或者使包括多肽或核酸的细胞与其相接触)来改变CD44的表达。可用于诊断方法中的试剂盒(例如试剂盒)包括用在任意本文所述方法中的组分,例如包括如本文所述的杂交探针或引物(例如经标记的探针或引物)、用于检测经标记的分子的试剂、限制性酶(例如用于RFLP分析)、等位基因特异性寡核苷酸、结合至改变的或未改变的(天然的)⑶44、SPPI或HDC多肽的抗体、用于扩增包括⑶44、SPPI或HDC核酸的装置或用于分配⑶44、SPPl或HDC的装置/物质、或用于分析⑶44、SPPl或HDC核酸的核酸序列的装置/物质或用于分析如本文所述的CD44、SPP1或HDC多肽的氨基酸序列的装置/物质等。在一个方面中,用于诊断对2型糖尿病易感性的试剂盒可以包括,用于CD44、SPPl或HDC核酸中区域的核酸扩增的引物,其包括SEQ ID NO 1至SEQ ID NO 12中列出的SNP序列,或更频繁存在于患2型糖尿病的个体或对2型糖尿病易感的个体中的风险单倍型。可以使用指示2型糖尿病的核酸侧翼SNP的部分来设计引物。实验下列方法用于后面描述的实施例中,以便举例说明本发明的实施方案。在进一步描述本发明之前,应理解本发明不局限于下面描述的本发明的特定实施方案,特定实施方案可以变化并仍落入所附权利要求的范围内。还应理解,所用的术语是以描述特定实施方案为目的的,不是旨在限制。或者,本发明的范围应通过所附的权利要求来构建。在本说明书和所附权利要求中,除非另有指明,否则没有数量词指代的名词包括复数形式。除非另外定义,本文使用的所有技术和科技术语具有与本发明所述技术领域的普通技术人员通常理解的相同含义。本说明书中引用的所有出版物和专利申请通过引用并入本文,特别地和单独地指出每个单独出版物或专利申请通过引用并入。对任意出版物的引用是为了引用其在提交日期之前的公开本文,而不应解释为承认本发明不必在凭借在先发明的这些出版物之前。尽管出于清楚理解的目的已经通过举例说明和实例详细描述了前面的发明,对本领域的普通技术人员来说仍然显而易见的是,借助本发明的教导,在不偏离所附的权利要求的精神或范围情况下可以对其作出特定的变化和修改。实施例I2型糖尿病(T2D)全基因组微阵列实验数据库的建立。通过收集和对所有在进行研究时公共可用的T2D相关的微阵列研究(69个实验,共计518个微阵列)进行再分析,来建立T2D全基因组功能实验数据库。微阵列实验包括多种类型的组织(肌肉、肝脏、脂肪和 胰岛)和物种(人、小鼠和大鼠)。该数据库中20994个基因中的每一个都基于来自69个微阵列研究组的其中每个基因显著失调(dysregulated)的微阵列实验的数目来计数和分类。从三个来源收集来自T2D相关的全基因组微阵列实验的所有69个公共可用的数据(表2)。首先,从Gene Expression Omnibus (GEO)用关键词搜索“糖尿病”或“糖尿病患者”或“NIDDM”或“非胰岛素依赖”来选择和下载微阵列的原始定量数据。手动排除涉及I型糖尿病、药物诱导的糖尿病、妊娠期糖尿病和糖尿病并发症的实验。使用来自人和啮齿类动物模型的数据。该查询的执行产生了包括共计262个样品的35个独立数据组。第二,另外从糖尿病基因组剖析项目(DiabetesGenome Anatomy Project,DGAP)下载原始定量数据。特别地,下载涉及T2D和糖耐量受损的数据组。有32个相关的独立数据组可用,包括共计248个样品。使用来自人和啮齿类动物模型的数据。第三,还从核受体信号数据集(Nuclear Receptor Signaling Atlas, NURSA)下载原始定量数据。特别地。下载涉及T2D和糖耐量受损的数据组。有两个相关的独立数据组可用,包括共计8个样品。表2.用于开发T2D数据库的69个微阵列实验的列表。
权利要求
1.治疗或预防个体中2型糖尿病发作的方法,所述方法包括 向所述个体施用CD44的抑制剂。
2.根据权利要求I的方法,其中⑶44在脂肪组织巨噬细胞或脂肪细胞上表达。
3.根据权利要求I的方法,其中所述抑制剂抑制CD44与一种或更多种同源配体的结八口 ο
4.根据权利要求3的方法,其中所述配体是骨桥蛋白。
5.根据权利要求3的方法,其中所述配体是透明质酸。
6.根据权利要求3的方法,其中所述抑制剂是抗体或其片段。
7.根据权利要求3的方法,其中所述抑制剂是CD44配体的类似物。
8.根据权利要求I的方法,其中所述抑制剂降低CD44的表达。
9.根据权利要求8的方法,其中所述抑制剂是反义寡核苷酸。
10.根据权利要求8的方法,其中所述抑制剂是RNAi核酸。
11.根据权利要求I的方法,其中所述抑制剂降低CD44的信号传导活性。
12.诊断个体中2型糖尿病(T2D)易感性的方法,所述方法包括确定来自所述个体的生物样品中是否存在多态性等位基因,其中所述至少的多态性等位基因与CD44、SPPl和HDC基因座中的一个或多个遗传相关联,且其中等位基因的存在指示对2型糖尿病的易感性。
13.根据权利要求12的方法,其中所述多态性等位基因包括单核苷酸多态性。
14.根据权利要求13的方法,其中所述单核苷酸多态性在CD44、SPP1或HDC基因座的内含子或外显子内。
15.根据权利要求13的方法,其中所述单核苷酸多态性在与CD44、SPP1或HDC基因座相关的调控区内。
16.根据权利要求13的方法,其中所述SNP选自SEQID NO :1_12中所示的多态性。
17.根据权利要求12的方法,所述方法还包括用权利要求I至11中任一项所述方法治疗所述个体。
18.根据权利要求12的方法,其中增加的易感性具有至少I.2的相对风险(RR)或优势比(OR)的特征。
19.根据权利要求12的方法,其中所述生物样品是遗传样品。
20.根据权利要求19的方法,其中所述遗传样品包括mRNA或由其衍生的cDNA。
21.诊断个体中胰岛素抵抗的方法,所述方法包括对所述个体中CD44的血清水平进行定量。
22.评价个体中对2型糖尿病易感性的试剂盒,所述试剂盒包含用于选择性确定来自所述个体的生物样品中是否存在至少一个多态性等位基因的试剂,其中所述多态性等位基因选自SEQ ID NO :1-12中所示的多态性,且其中至少一个SNP的存在指示对2型糖尿病的易感性。
23.根据权利要求22的试剂盒,所述试剂盒包含特异性结合SEQID N0:l_12中所示至少一个序列的探针。
24.根据权利要求22的试剂盒,所述试剂盒还包含用于选择性确定是否存在其他与2型糖尿病的诱因相关的其他多态性等位基因的试剂。
25.根据权利要求23的试剂盒,所述试剂盒包含选择性结合与2型糖尿病易感性相关的多态性等位基因的探针 阵列。
全文摘要
本发明提供治疗和诊断与高血糖症相关的疾病,包括糖尿病、胰岛素抵抗等疾病的方法和组合物。基因多态性显示与疾病易感性相关,且它们的检测被用于诊断这些病症的诱因。相应的蛋白质用作介入治疗的靶。
文档编号A61K31/7088GK102781517SQ201180007910
公开日2012年11月14日 申请日期2011年2月1日 优先权日2010年2月1日
发明者児玉桂一, 阿图尔·J.·布特 申请人:小利兰·斯坦福大学托管委员会