CN102388140B

CN102388140B - 异常线粒体dna、相关的融合转录本和翻译产物及其杂交探针

Info

Publication number: CN102388140B
Application number: CN201080014122.6A
Authority: CN
Inventors: 瑞安·帕尔; 加布里埃尔·达库波; 安德鲁·哈博特尔; 布赖恩·赖古伊; 珍妮弗·克里德; 凯丽·鲁滨逊; 丹尼尔·克莱因
Original assignee: Mitomics Inc
Current assignee: Dodik Landau Co; Mdna Life Science Cos
Priority date: 2008-03-28
Filing date: 2010-03-29
Publication date: 2015-07-08
Anticipated expiration: 2030-03-29
Also published as: SG192453A1; US8715960B2; WO2009117811A1; CA2719718C; CA2719718A1; CA3044262A1; CN102388140A; CN107011428B; SG10201400985RA; EP2274426A4; NZ602175A; CA3044262C; EP2274426B1; CN102016039A; CN107011428A; AU2009227935A1; JP5938690B2; US20130059299A1; KR20110004860A; NZ588658A

Abstract

本发明提供了用于预测、诊断和/或监测癌症的新线粒体融合转录本、突变的亲本mtDNA分子以及得到的翻译产物(蛋白质)。还提供了与其互补的用于本发明方法的杂交探针。

Description

异常线粒体DNA、相关的融合转录本和翻译产物及其杂交探针

在先申请的交叉引用

本申请是2009年3月27日提交的PCT申请号PCT/CA2009/000351的部分继续申请，该PCT/CA2009/000351要求于2008年3月28日提交的美国临时申请号61/040,616的优先权。此在先申请的全部内容通过引用并入本文。

发明领域

本发明涉及线粒体基因组学和蛋白组学领域。在一个方面，本发明涉及线粒体基因组融合转录本和翻译产物的确定鉴定和应用，以及与其杂交的探针。

发明背景

线粒体基因组

线粒体基因组是小型而关键的核酸序列。相对于33亿bp的巨大核基因组(单倍的)而言，线粒体DNA或者″mtDNA″包括16,569个核酸碱基对(bp)的小基因组(Anderson等人，1981；Andrews等人，1999)。它的遗传组(genetic complement)大大小于核细胞遗传组(0.0005％)。然而，单个细胞根据具体的细胞功能携带10³至10⁴个线粒体(Singh and Modica-Napolitano2002)。通信和化学信号传导常规地发生于核和线粒体基因组之间(Sherratt等人，1997)。此外，特定的核组份负责线粒体序列的维持和完整性(Croteau等人，1999)。给定个体中的全部mtDNA基因组是相同的，其原因在于在发生受精后卵子内线粒体的克隆扩增。然而突变事件可诱发反映为体细胞突变的序列多样性。在称为异序性(heteroplasmy)的情况下这些突变可在整个身体的不同组织中积累。

线粒体蛋白质组

需要大约3,000个核基因来构建、操作和维持线粒体，它们中仅有37个由线粒体基因组编码，表明线粒体极其依赖于核基因座。该线粒体基因组编码24个基因的组，包括2个rRNA和22个tRNA，它们确保其余13个基因的正确翻译，这13个基因对于电子传递是至关重要的(参见图1)。除由该线粒体基因组提供的13个多肽外，该线粒体基因组依赖于70个核编码的蛋白质以完成此种重要功能所需的氧化和还原反应。核和线粒体蛋白二者形成跨越线粒体内膜的复合物并总共产生80-90％的细胞代谢所需的化学燃料三磷酸腺苷或ATP。除了产生能量以外，线粒体在其它代谢途径中也发挥重要作用。线粒体的关键功能是细胞死亡或者凋亡的介导(参见Green and Kroemer，2005)。本质上，存在有渗透线粒体外膜的信号通路，或者除此之外还渗透线粒体内膜。当特定的线粒体蛋白质释放进入细胞溶质中时，启动不可逆的细胞死亡。这一过程强调了一些线粒体蛋白质所具有的多功能作用。这些多任务蛋白质暗示其它线粒体蛋白质也可能具有另外功能。

线粒体融合转录组/蛋白质组

线粒体基因组不寻常之处在于它是一种环状的、无内含子的DNA分子。该基因组散布有重复基序，该基序处于特定长度的序列的侧翼。这些重复之间的序列在尚未充分理解的情况下容易缺失。鉴于该线粒体基因组中重复基因的数目，有许多可能的缺失。最熟知的例子是4977“共同缺失(common deletion)”。此缺失与有证据支持的若干病症和疾病有关，并且据认为随衰老而频率增加(Dai等人，2004；Ro等人，2003；Barron等人，2001；Lewis等人，2000；Muller-Hocker，1998；Porteous等人，1998)(图4)。线粒体基因组学领域目前的观点是，线粒体缺失仅仅是通过诸如活性氧簇和UVR的试剂损害线粒体基因组的有害副产物(Krishnan等人2008，Nature Genetics)。此外，尽管认识到高水平的mtDNA缺失可能对细胞产生ATP形式的能量的能力有严重的影响(其原因是缺少细胞呼吸所必需的基因序列)，但是未预料到的是这些缺失的线粒体分子可以是下游通路的组分，具有预定的功能作用，并且可能更适合将其认为是已确定的线粒体基因的另外的天然形式。

mtDNA的序列动力学是重要的诊断工具。mtDNA中的突变通常是发展成疾病的初期指示信号。例如，已经证实，线粒体基因组中的点突变是前列腺中肿瘤病灶的特征。这种趋势还延伸到了肿瘤组织近端和远端的表现正常的组织(Parr等人2006)。这表明线粒体突变在恶性转化通路早期即已发生。

例如，3.4kb线粒体缺失的频率在良性和恶性前列腺组织之间的区分中具有优良的效用(Maki等人2008)。此外，对与缺失有关的疾病和新序列(通过确定许多开放阅读框的分子的再接近而产生)的研究鉴定表明独特的线粒体融合蛋白的可能性。

线粒体融合转录本此前在文献中已有报道，首次报道于大豆中(Morgens等人1984)，后来报道于两名卡恩斯-塞尔综合征(Kearns-Sayre Syndrome)患者中，该卡恩斯-塞尔综合征是一种罕见的神经肌肉障碍(Nakase等人1990)。重要的是，未发现这些转录本与任何人类癌症有关联(或者未被研究认为与任何人类癌症有关)。

核融合蛋白质组

融合蛋白及其对癌症产生的影响在核中已有重要的先例。核MLL基因对易位被充分确定与高风险急性白血病以及用靶向拓扑异构酶II的药剂治疗后的治疗相关急性髓细胞性白血病有关联(Libura等人，2005)。目前，已知人MLL基因的大约50种易位与这些癌症有关(Meyer等人，2005)。在大部分这些事件中，这些突变的断裂点不论是部分串联重复还是易位都出现在核特异性重复基序例如Alu I中。这些突变的大多数是相互易位的(84％)，并且包括大约40种不同基因(Libura等人2005)。

已知影响恶性疾病进程的一些此类重排产生的功能性嵌合蛋白。例如，表达MLL-ENL的蛋白质的鼠细胞加速了存活于依托泊苷暴露的细胞的普遍染色体异常(Eguchi等人，2006)。尤其引人关注的是MLL-SMAP1和交互的SMAP1-MLL。SMAP1结合钙，并且因此参与细胞信号传导和运输。

线粒体融合蛋白可以被假定与核融合蛋白具有相似作用，特别是由于线粒体和线粒体蛋白质在信号传导和凋亡中发挥类似作用。

发明概述

本发明的一个目的是提供异常线粒体DNA、相关的融合转录本和翻译产物及其杂交探针。

根据本发明的一个方面，提供了与癌症有关的分离的线粒体融合转录本。

根据本发明的另一方面，提供了编码本发明融合转录本的分离的mtDNA。

根据本发明的另一方面，提供了一种杂交探针，其具有与本发明的线粒体融合转录本或mtDNA的至少一部分互补的核酸序列。

根据本发明的另一方面，提供了检测哺乳动物癌症的方法，该方法包括通过将哺乳动物组织样品与至少一种杂交探针杂交来分析该样品中与癌症有关的至少一种线粒体融合转录本的存在，所述杂交探针具有与本发明的线粒体融合转录本的至少一部分互补的核酸序列。

根据本发明的另一方面，提供了检测哺乳动物癌症的方法，该方法包括通过将哺乳动物的组织样品与至少一种杂交探针杂交来分析所述样品中与癌症相关的至少一种异常mtDNA的存在，所述杂交探针具有与本发明的mtDNA的至少一部分互补的核酸序列。

根据本发明的另一方面，提供了用于进行检测哺乳动物中癌症存在的分析的试剂盒，所述试剂盒包括至少一种与本发明的融合转录本或mtDNA的至少一部分互补的杂交探针。

根据本发明的另一方面，提供了一种线粒体融合蛋白，该蛋白质具有由本发明线粒体融合转录本的翻译产生的氨基酸序列。

根据本发明的另一方面，提供了检测哺乳动物癌症的方法，该方法包括分析哺乳动物的组织样品中至少一种线粒体融合蛋白的存在，该蛋白质具有由本发明线粒体融合转录本翻译产生的氨基酸序列。

附图说明

现参照附图仅以示例的方式描述本发明的一些实施方案，其中：

图1是显示线粒体蛋白质编码基因的示意图。

图2显示了前列腺样品中的聚腺苷酸化融合转录本，其由3.4kb缺失的丧失引起。

图3显示了前列腺样品中的聚腺苷酸化融合转录本，其由4977kb共同缺失的丧失引起。

图4显示了乳腺样品中的聚腺苷酸化融合转录本，其由mt基因组的3.4kb区段的丧失引起。

图5a和5b显示基因剪接之前和之后的线粒体DNA区域的实例。

图6a至6g说明了本发明转录本2，3，8，9，10，11和12在结直肠癌肿瘤鉴定中的结果。

图7a至7d说明了本发明转录本6，8，10和20在肺癌肿瘤鉴定中的结果。

图8a至8j说明了本发明转录本6，10，11，14，15，16和20在黑素瘤鉴定中的结果。

图9a至9h说明了本发明转录本1，2，3，6，11，12，15和20在卵巢癌鉴定中的结果。

图10至18说明了本发明转录本2，3，4，11，12，13，15，16和20在睾丸癌鉴定中的结果。

图19说明了在融合蛋白发现期进行的RWPE1和WPE1-NA22细胞系的细胞溶质和线粒体级分的SDS PAGE凝胶。

图20a说明了基于肽ILYMTDEVNDPSLTIK和STPYECGFDPMSP的融合转录本P0026的鉴定的蛋白质。

图20b说明了检索人(SwissProt)数据库后图19的线粒体NA22细胞系凝胶切片5中鉴定的野生型CO2蛋白。

图21a说明了基于肽KGPNVVGPYGLLQPFADAMK、YDQLMHLLWK和LITTQQWLIK的融合转录本P0062的鉴定的蛋白质。

图21b说明了检索人(SwissProt)数据库后图19的凝胶切片5中鉴定的ND1的鉴定肽。

图22说明了基于肽KGPNVVGPYGLLQPFADAMK和WAIIEEFTK的融合转录本P0064的鉴定的蛋白质。

图23a说明了基于肽KGPNVVGPYGLLQPFADAMK、VFSWLATLHGSNMK和VLMVEEPSMNLEWLYGCPPPYHTFEEPVYMK的融合转录本P0176的鉴定的蛋白质。

图23b说明了检索人(SwissProt)数据库后图19的线粒体NA22细胞系凝胶切片4中鉴定的野生型CO1蛋白。

图24a至24d分别说明了融合转录本P0026、P0062、P0064和P0176的定量测定结果。

具体实施方式

本发明提供了用于预测、诊断和/或监测癌症的新颖的线粒体融合转录本、突变的亲本mtDNA分子和得到的翻译产物。本发明进一步提供了用于检测融合转录本和相关mtDNA分子的杂交探针以及此类探针的应用。

定义

除非另有说明，用于本文的全部技术和科学术语均具有与本发明技术领域普通技术人员通常理解相同的含义。

术语“包括”、“包含”或“含有”可用于本申请文件。如本文所述的(包括说明书和/或权利要求书)，这些术语解释为说明存在所述特征、整体、步骤或组份，但是如对于相关领域普通技术人员显而易见的那样，不解释为排除存在一种或多种其它的特征、整体、步骤、组份或其组。

如本文使用的，“异常”或“突变”包括会产生融合转录本的野生型线粒体DNA序列的任何修饰，并且包括但不限于，插入、易位、缺失、重复、重组、重排或其组合。

如本文定义的，“生物样品”是指含有细胞的组织或体液，可以从其中可以获得感兴趣的分子。例如，该生物样品可得自组织例如前列腺，乳腺，结直肠，肺和皮肤，或者得自血液，唾液，脑脊液，痰液，尿液，粘液，滑液，腹腔液，羊水等。该生物样品可以是外科手术样品或生物活检样品。该生物样品可以从来源所得那样直接使用或者经预处理以改变样品性质之后再使用。因此该生物样品可以在使用前预处理，例如通过从血液中制备血浆或血清、破坏细胞、从固体材料制备液体、稀释粘稠液体、过滤液体、蒸馏液体、浓缩液体、使干扰组分失活、添加试剂等。

“连续的”转录本是一种融合转录本，其保留有两个剪剪接基因的起始到终点的阅读框。“末端”转录本是一种融合转录本，其会在第二剪剪接基因的原始终止密码子之前产生早熟的终止密码子。

如本文使用的，“线粒体DNA”或“mtDNA”是存在于线粒体中的DNA。

如本文使用的，措辞“线粒体融合蛋白”或“融合蛋白”是指通过突变线粒体DNA的转录和翻译产生的肽产物，其中此类突变包含缺失或者其它“大规模”线粒体DNA重排。此外或者可选择的，同框(in-frame)蛋白可以从在此序列中的另外的起始和终止密码子翻译而来。

如本文使用的，措辞“线粒体融合转录本”或“融合转录本”是指由于突变线粒体DNA序列的转录产生的RNA转录产物，其中此类突变可包含线粒体缺失和其它大规模线粒体DNA重排。

如本文使用的，措辞“线粒体翻译产物”或“翻译产物”是指得自线粒体融合转录本的任何氨基酸链，包括肽、多肽和蛋白质。应当理解，“线粒体翻译产物”包括上文定义的“融合蛋白”。

计算机分析和序列靶向

如上文讨论的，线粒体融合转录本已被报道于大豆(Morgens等人1984)中以及罹患罕见神经肌肉障碍的人(Nakase等人1990)中。然而与人类癌症有关的融合转录本未被披露。

使用与癌症相关的人类线粒体基因组的大规模缺失绘图中获得的知识、此类缺失的高频率的观察，以及在转录活化突变的mtDNA分子的另一有机体和另一疾病类型中的证据，本发明人推测，此类缺失具有超越与癌症有关的DNA分子以及损伤和修复过程的重要性。为了检验此推测，进行了线粒体基因组的计算机分析，特别是对于重复元件，其提示许多潜在的缺失位点。在鉴定具有非邻近或非串联位置的线粒体序列中的独特重复的初始步步骤之后，进行以下筛选以鉴定这些重复，即通过在该DNA分子中启动缺失事件，其中这些DNA分子可能重新接近或者重新连接以产生具有开放读码框(ORF)的融合DNA序列，并因此能够通过线粒体转录机制而被转录。然后选择这些分子的18个的亚组以用于靶向研究是否：它们存在于人类的天然生物学状态中；它们被聚腺苷酸化并因此有望进行蛋白质合成；它们与恶性肿瘤有关联。这些研究的结果证实对于全部三个疑问均是肯定的，并且描述于下文。

基因组突变

线粒体DNA(mtDNA)动力学是一种重要的诊断工具。mtDNA中的突变体通常是疾病发生的初步指示并且可作为指示与疾病发生相关的风险因子的生物标志物。根据本发明，线粒体基因组中的突变导致产生与癌症相关的融合转录本。因此，提供了编码此类转录本的mtDNA和针对它的探针在癌症的检测、诊断和监测中的用途。

本领域技术人员一应理解，用于本发明方法的mtDNA分子可通过分离天然出现的突变而得到，或者可以基于本文所述任一融合转录本互补序列而得到。示例性的mtDNA序列和融合转录本公开于本申请人的共同待决美国申请No.61/040,616和公开的PCT申请PCT/CA2009/000351(以WO 2009/117811公开)中。

突变基因组序列的检测

本发明的突变体mtDNA序列可包括导致融合转录本生成的任何修饰。此类修饰的非限制性实例包括插入、易位、缺失、重复、重组、重排或其组合。虽然修饰或变化可以在大小上极大地变化，从仅几个碱基到几千个碱基，优选地，该修饰会造成大型缺失或者其它大规模基因组异常。

提取DNA以检测此类突变体的存在可以使用本领域公知的方法、接着通过扩增线粒体基因组的全部或区域来进行，并且可以包括线粒体基因组的测序，如Current Protocols inMolecular Biology所述。

检测该突变体的步骤可以从本领域的任何已知技术中选择。例如分析mtDNA可包括对mtDNA测序，通过PCR扩增mtDNA，Southern、Northern、Western South-Western印记杂交，变性HPLC，与微阵列杂交，生物芯片或基因芯片，分子标志物分析，生物传感器，熔解温度曲线或者上述任一方法的组合。

可以使用任何适宜方法对线粒体DNA测序。优选地，mtDNA在测序之前通过PCR扩增。PCR方法是本领域公知的，并且可以如Mullis和Faloona，1987，Methods Enzymol.，155：335中所述来执行。PCR产物可以被直接测序列，或者被克隆到载体中，然后将该载体置于细菌宿主中。DNA测序方法的实例可见于Brumley，R.L.Jr.和Smith，L.M.，1991，Rapid DNAsequencing by horizontal ultrathin gel electrophoresis，Nucleic Acids Res.19：4121-4126，以及Luckey，J.A.，等人，1993，High speed DNA sequencing by capillary gel electrophoresis，Methods Enzymol.218：154-172。mtDNA的PCR和测序的组合应用描述于Hopgood，R.，等人，1992，Strategies for automated sequencing of human mtDNA directly from PCR products，Biotechniques 13：82-92，以及Tanaka，M.等人，1996，Automated sequencing of mtDNA，Methods Enzymol.264：407-421。

选择适宜序列以用于制备各种引物的方法亦是本领域已知的。例如，该引物可使用常规固相合成法应用商购设备来制备，所述商购设备例如得自Applied Biosystems USA Inc.(Foster City，California)、DuPont，(Wilmington，Del.)或Milligen(Bedford，Mass.)。

根据本发明的一个方面，为了测定候选的基因组序列，首先鉴定序列缺失的连接点。序列缺失主要是通过直接或间接的重复元件来鉴定，该重复单元在待缺失序列的5’和3’端侧翼。从该基因组中去除核苷酸的一部分，接着连接该基因组，结果产生新的连接点。

在鉴定了该连接点以后，确定连接点侧翼的基因的核苷酸，以确定剪剪接基因。通常，该剪接基因包括来自第一基因的起始密码子以及第二基因的终止密码子，并且可以被表达为连续转录本，即，其从两个剪接基因的起始到终点保持读码框。表1提供了当重排序列在剪接位点重新接合时发现具有开放读码框(ORF)的一些已知的线粒体缺失。

用于本发明方法的示例性的mtDNA分子提供于下文。这些mtDNA基于已知线粒体基因组(SEQ ID NO：1)的修饰，并已赋予融合或“FUS”名称。其中A:B表示第一剪接基因的最末线粒体核苷酸与第二剪接基因的第一线粒体核苷酸之间的连接点。剪接基因的出处提供于括弧内，其后是相应的序列标识。当以下面提供时，(AltMet)和(OrigMet)分别是指另外的和原始的翻译起始位点。

FUS 8469：13447(AltMet)(ATP合酶F0亚基8至NADH脱氢酶亚基)(SEQ ID No：2)

FUS 10744：14124(NADH脱氢酶亚基4L(ND4L)至NADH脱氢酶亚基5(ND5))(SEQID No：3)

FUS 7974：15496(细胞色素C氧化酶亚基II(COII)至细胞色素b(Cytb))(SEQ ID No：4)

FUS 7992：15730(细胞色素C氧化酶亚基II(COII)至细胞色素b(Cytb))(SEQ ID No：5)

FUS 8210：15339(细胞色素C氧化酶亚基II(COII)至细胞色素b(Cytb))(SEQ ID No：6)

FUS 8828：14896(ATP合酶F0亚基6(ATPase6)至细胞色素b(Cytb))(SEQ ID No：7)

FUS 10665：14856(NADH脱氢酶亚基4L(ND4L)至细胞色素b(Cytb))(SEQ ID No：8)

FUS 6075：13799(细胞色素C氧化酶亚基I(COI)至NADH脱氢酶亚基5(ND5))(SEQID No：9)

FUS 6325：13989(细胞色素C氧化酶亚基I(COI)至NADH脱氢酶亚基5(ND5))(SEQID No：10)

FUS 7438：13476(细胞色素C氧化酶亚基I(COI)至NADH脱氢酶亚基5(ND5))(SEQID No：11)

FUS 7775：13532(细胞色素C氧化酶亚基II(COII)至NADH脱氢酶亚基5(ND5))(SEQID No：12)

FUS 8213：13991(细胞色素C氧化酶亚基II(COII)至NADH脱氢酶亚基5(ND5))(SEQID No：13)

FUS 9191：12909(ATP合酶F0亚基6(ATPase6)至NADH脱氢酶亚基5(ND5))(SEQ IDNo：14)

FUS 9574：12972(细胞色素C氧化酶亚基III(COIII)至NADH脱氢酶亚基5(ND5))(SEQ ID No：15)

FUS 10367：12829(NADH脱氢酶亚基3(ND3)至NADH脱氢酶亚基5(ND5))(SEQ IDNo：16)

FUS 11232：13980(NADH脱氢酶亚基4(ND4)至NADH脱氢酶亚基5(ND5)(SEQ IDNo：17)

FUS 8469：13447(OrigMet)(ATP合酶F0亚基8至NADH脱氢酶亚基)(SEQ ID No：18)

FUS 9144：13816((ATP合酶F0亚基6(ATPase6)至NADH脱氢酶亚基5(ND5))(SEQ IDNo：54)

本发明还提供了这些序列的变体或片段在预测、诊断和/或监测癌症中的用途。

“变体″，如本文使用的，是指与本发明mtDNA序列不同但保留了它们的必需的性质的核酸。通常来说，变体总体上很相似，并且在许多区域，与所选的mtDNA序列相同。具体地说，本发明的变体包括剪接基因的连接点的至少一个核苷酸，并且可进一步包括一个或多个与其邻近的核苷酸。在本发明的一个实施方案中，该变体序列与任一本发明mtDNA序列或者其互补链至少有80％，85％，90％，95％，96％，97％，98％或99％的同一性。

在本发明中，″片段″是指一条短的核酸序列或与其互补的链，所述核酸序列是包含在公开的基因组序列中的一部分。此部分包括至少一个核苷酸(其包含剪接基因的连接点)，并且可进一步包含一个或多个与其邻近的核苷酸。本发明的片段长度优选为至少约15nt，更优选至少约20nt，还更优选至少约30nt，再更优选至少约40nt，至少约50nt，至少约75nt或至少约150nt。″长度至少20ng″的片段，例如，将包括上文所列任一个mtDNA序列的20个或者更多个连续碱基。在本上下文中，“约”包括具体引述的数值，在任一末端或者两个末端大几个或小几个(5，4，3，2或1)核苷酸的数值。这些片段用途包括但不限于作为如本文讨论的诊断探针和引物。当然，还考虑更大的片段(例如，50，150，500，600，2000个核苷酸)。

因此，在本发明的一些具体实施方案中，该mtDNA序列选自：

SEQ ID NO：2(FUS 8469：13447；AltMet)

SEQ ID NO：3(FUS 10744：14124)

SEQ ID NO：4(FUS 7974：15496)

SEQ ID NO：5(FUS 7992：15730)

SEQ ID NO：6(FUS 8210：15339)

SEQ ID NO：7(FUS 8828：14896)

SEQ ID NO：8(FUS 10665：14856)

SEQ ID NO：9(FUS 6075：13799)

SEQ ID NO：10(FUS 6325：13989)

SEQ ID NO：11(FUS 7438：13476)

SEQ ID NO：12(FUS 7775：13532)

SEQ ID NO：13(FUS 8213：13991)

SEQ ID NO：14(FUS 9191：12909)

SEQ ID NO：15(FUS 9574：12972)

SEQ ID NO：16(FUS 10367：12829)

SEQ ID NO：17(FUS 11232：13980)

SEQ ID NO：18(FUS 8469：13447；OrigMet)

SEQ ID NO：54(FUS 9144：13816)，

-及其片段或变体。

探针

本发明另一方面提供了能够识别本发明异常mtDNA序列的杂交探针。如本文使用的，术语″探针″是指一种寡核苷酸，其与靶核酸序列形成双链结构，原因是该探针中的至少一个序列与靶区域中的序列互补。可以根据本领域已知的方法标记该探针。

一旦与特定疾病有关的异常mtDNA被鉴定，mtDNA与例如寡核苷酸阵列的杂交可用于鉴定特定的突变，然而，可以使用任一已知的杂交方法。

与本发明引物用相同，可以产生直接针对本发明示例性的mtDNA融合分子或其片段或变体产生探针。例如，SEQ ID NO：2-18和54所述的序列和表1公开的序列可用于设计引物或探针，它们将检测包含目的融合序列的核酸序列。正如本领域技术人员所理解的，与这些核酸分子杂交的引物或探针在高度严格杂交条件或者较低严格条件下可以杂交，这些条件是本领域技术人员已知的，并且可例如见于Current Protocols in Molecular Biology(JohnWiley & Sons，New York(1989))，6.3.1-6.3.6。

在本发明的一些具体实施方案中，本发明探针含有与包含剪接基因的连接点的异常mtDNA的至少一部分互补的序列。此部分包括至少一个构成连接点A:B的核苷酸，并且可进一步包括一个或多个与其邻近的核苷酸。关于此方面，本发明包括任何适宜的靶向机制，该机制会使用构成和/或邻近于该连接点A:B的核苷酸来选择mtDNA分子。

本发明考虑本领域已知的多种类型的探针。例如，该探针可以是杂交探针，其与靶核苷酸序列的结合可以使用通用DNA结合染料例如溴化乙锭、SYBRGreen、SYBRGold等来检测。或者，该探针可以整合一个或多个可检测标记。可检测标记是分子或者部分，其性质或者特征可以直接或间接地被检测，并按照该探针与其靶序列杂交的能力不受影响来选择。标记核酸序列的方法是本领域公知的(参见，例如，Ausubel等人，(1997，和更新资料)CurrentProtocols in Molecular Biology，Wiley & Sons，New York)。

适合用于本发明探针的标记包括可以直接检测的那些，例如放射性同位素、荧光团、化学发光团、酶、胶体颗粒、荧光微粒等。本领域技术人员理解，直接可检测标记可能需要另外的组分，例如底物、触发试剂、光等使得该标记能够检测。本发明还考虑间接检测的标记的用途。

本发明探针长度优选至少约15nt，更优选至少约20nt，还更优选至少约30nt，再更优选至少约40nt，至少约50nt，至少约75nt或至少约150nt。″长度至少20nt″的探针，例如，将包括与本发明mtDNA序列互补的的20个或者更多个连续碱基。当然，可优选更大的探针(例如，50，150，500，600，2000个核苷酸)。

本发明探针还将在生物样品中与核酸分子杂交，从而促成了本发明的方法。相应地，在本发明的一个方面，提供了用于检测癌症的杂交探针，其中该探针与异常mtDNA分子的至少一部分互补。在另一方面，本发明提供了探针以及此探针用于检测结直肠癌，肺癌，乳腺癌，卵巢癌，睾丸癌，前列腺癌和/或黑素瘤皮肤癌的用途(或者使用方法)。

分析法

测定生物样品中异常mtDNA的水平可以确定受试者中一种或多种癌症的存在。因此，本发明包括用于预测、诊断或监测癌症的方法，该方法包括获得一种或多种生物样品，从该样品中提取mtDNA，以及分析该样品中的异常mtDNA，其方式是：对样品中的一种或多种异常mtDNA序列进行定量并与参比值比较检测的量。本领域技术人员理解，该参比值是基于该方法是否是旨在预测、诊断或监测癌症。因此，该参比值可以与从一种或多种已知的非癌性生物样品、一种或多种已知的癌性生物样品、和/或一种或多种随时间获取的生物样品中收集的mtDNA数据关联。

在一个方面，本发明提供了检测哺乳动物癌症的方法，该方法包括分析哺乳动物的组织样品中上述异常线粒体DNA的存在。本发明还提供了包括通过使该样品与至少一种杂交探针杂交来分析哺乳动物的组织样品的方法。该探针可针对本文所述本发明突变线粒体DNA序列来产生。

在另一方面，本发明提供了上文所述方法，其中该分析法包括：

a)使用至少一种探针进行杂交反应，使该至少一种探针与互补的异常线粒体DNA序列杂交；

b)通过对与该至少一种探针杂交的线粒体DNA定量，来定量样品中的至少一种异常线粒体DNA序列；和

c)将样品中的线粒体DNA的量与至少一种已知参比值进行比较。

本发明还包括用于预测、诊断或监测癌症的方法，该方法包括如下文所述的诊断显像分析。本发明的诊断分析可以容易地适用于高通量法。高通量分析法提供了同时处理许多样品并且显著减少了筛选大量样品所需的时间的益处。因此，本发明考虑本发明的核苷酸在高通量筛选法或者分析法中用于在许多测试样品中检测和/或定量靶核苷酸序列的用途。

融合转录本

本发明进一步提供了可用于预测、诊断和/或监测癌症的方法的融合转录本和相关杂交探针的鉴定。本领域技术人员将理解，此类分子可以通过分离天然转录本得到，或者，通过重组表达本发明方法分离的mtDNA而得到。如所讨论的，此类mtDNA通常包含剪接基因，该剪接基因具有来自第一基因的起始密码子和第二基因的终止密码子。因此，由此得到的融合转录本包括与该剪接基因相关的连接点。

融合转录本的检测

天然融合转录本可从生物样品中提取，并且根据本领域已知的任何适宜方法鉴定，或者可以根据实施例所述方法进行。在本发明的一个实施方案中，稳定的聚腺苷酸化融合转录本是使用靶向具有聚腺苷酸尾的转录本的寡聚(dT)引物，接着使用设计为针对该靶转录本的引物对进行RT-PCR而鉴定的。

使用此类方法检测以下示例性的融合转录本，并且发现其如实施例中所述可用于预测、诊断和/或监测癌症。同样，得自表1所示ORF序列的融合转录本可用于预测、诊断和/或监测癌症。

SEQ ID NO：19(转录本1；8469：13447；AltMet)

SEQ ID NO：20(转录本2；10744：14124)

SEQ ID NO：21(转录本3；7974：15496)

SEQ ID NO：22(转录本4；7992：15730)

SEQ ID NO：23(转录本5；8210：15339)

SEQ ID NO：24(转录本6；8828：14896)

SEQ ID NO：25(转录本7；10665：14856)

SEQ ID NO：26(转录本8；6075：13799)

SEQ ID NO：27(转录本9；6325：13989)

SEQ ID NO：28(转录本10；7438：13476)

SEQ ID NO：29(转录本11；7775：13532)

SEQ ID NO：30(转录本12；8213：13991)

SEQ ID NO：31(转录本14；9191：12909)

SEQ ID NO：32(转录本15；9574：12972)

SEQ ID NO：33(转录本16；10367：12829)

SEQ ID NO：34(转录本17；11232：13980)

SEQ ID NO：35(转录本20；8469：13447；OrigMet)

SEQ ID NO：53(转录本13；9144：13816)

融合转录本还可以通过本领域已知的重组技术来制备。通常地，它包括用包含目的mtDNA序列的表达载体转化(包括转染、转导或感染)适宜的宿主细胞。

还提供了本文鉴定的融合转录本的变体或片段。此类序列可符合上文所述关于基因组变体和片段的或者熟练技术人员所确定的适当的大小限度和百分比同一性。

探针

一旦表征了融合转录本，则引物或探针可以被开发成靶向生物样品中的转录本。此类引物和探针可以使用任何已知方法(如上文所述的)或者下文提供的实施例中所述的方法来制备。例如，针对该融合转录本可以产生探针，并且例如Panomics^TM的QuantiGene 2.0^TM的检测技术用于检测样品转录本的存在。可以针对本发明示例性的融合转录本或其片段或变体而直接产生引物和探针。例如，SEQ ID NO：19-35和53所述以及表1所公开的序列可用于设计探针，该探针将检测包含目的融合序列的核酸序列。

本领域技术人员将理解，设计用于与本发明融合转录本杂交的探针含有与表达剪接基因的连接点的该转录本的至少一部分互补的序列。该部分包括与该表达的连接点互补的至少一个核苷酸，并且可进一步包含与其邻接的一个或多个互补的核苷酸。在此方面，本发明包括任何适宜的选择融合转录本的靶向机制，该融合转录本使用构成并邻近剪接基因的连接点的核苷酸。

本领域已知的各种类型的探针和标记方法均考虑用于制备转录探针。这些类型和方法已就基因组序列的检测描述于上文。本发明的转录探针长度优选至少约15nt，更优选至少约20nt，还更优选至少约30nt，再更优选至少约40nt，至少约50nt，至少约75nt或者至少约150nt。″长度至少20nt″的探针，例如，将包括与本发明mtDNA序列互补的的20个或者更多个连续碱基。当然，可优选更大的探针(例如，50，150，500，600，2000个核苷酸)。

在一个方面，本发明提供了用于检测癌症的杂交探针，其中该探针与上文提供的线粒体融合转录本的至少一部分互补。

在另一方面，本发明提供了探针以及此探针在检测结直肠癌，肺癌，乳腺癌，卵巢癌，睾丸癌，前列腺癌或黑素瘤皮肤癌中的用途。

分析法

测定生物样品中线粒体融合转录本水平可以确定在受试者中一种或多种癌症的存在。因此，本发明提供了用于预测、诊断或监测癌症的方法，该方法包括获得一种或多种生物样品，从该样品中提取线粒体RNA，以及通过下列方式分析该样品中的融合转录本：对样品中的一种或多种融合转录本进行定量，再将检测的量与参比值进行比较。本领域技术人员理解，该参比值是基于该方法是否旨在预测、诊断或监测癌症。因此，该参比值可以与从一种或多种已知的非癌性生物样品、一种或多种已知的癌性生物样品、和/或一种或多种过去获取的生物样品中收集的转录本数据关联。

在一个方面，本发明提供了检测哺乳动物癌症的方法，该方法包括通过使所述样品与至少一种杂交探针杂交来分析来自所述哺乳动物的组织样品中至少一种本发明融合转录本的存在，所述杂交探针具有与线粒体融合转录本的至少一部分互补的核酸序列。

a)使用至少一种上述探针进行杂交反应，使该至少一种探针与互补的线粒体融合转录本杂交；

b)通过对与该至少一种探针杂交的转录本定量，来定量样品中的至少一种线粒体融合转录本；和

c)将样品中的线粒体融合转录本的量与至少一种已知参比值进行比较。

如上文讨论的，本发明的诊断分析还包括如本文所述的诊断显像方法，并且可以容易地适用于高通量法。因此，本发明考虑本发明的融合转录本及相关探针在高通量筛选法或分析法中检测和/或定量多个测试样品中的靶核苷酸序列的用途。

翻译产物

迄今为止，线粒体融合蛋白尚未被检测或分离。然而，下文提供的实施例中观察到的线粒体融合转录本的水平以及它们是聚腺苷酸化的证据进一步提供了支持此类线粒体融合蛋白存在的证据。因此，本发明提供了用于预测、诊断和/或监测癌症的融合蛋白的鉴定。

考虑用于本发明方法的融合蛋白可通过从天然多肽的分离获得或者通过基因表达获得。此类多肽可以通过本领域已知的方法制备，例如从细胞提取物中纯化或者使用重组技术。

与转录本1-17和20相应的推测蛋白序列连同它们各自的序列标识提供下于文。这些以及公开于表1中的与缺失序列相应的推测蛋白序列在本文考虑用于本发明方法。

SEQ ID NO：36(转录本1)

SEQ ID NO：37(转录本2)

SEQ ID NO：38(转录本3)

SEQ ID NO：39(转录本4)

SEQ ID NO：40(转录本5)

SEQ ID NO：41(转录本6)

SEQ ID NO：42(转录本7)

SEQ ID NO：43(转录本8)

SEQ ID NO：44(转录本9)

SEQ ID NO：45(转录本10)

SEQ ID NO：46(转录本11)

SEQ ID NO：47(转录本12)

SEQ ID NO：48(转录本14)

SEQ ID NO：49(转录本15)

SEQ ID NO：50(转录本16)

SEQ ID NO：51(转录本17)

SEQ ID NO：52(转录本20)

SEQ ID NO：55(转录本13)

融合蛋白的检测

本发明的融合蛋白可以从生物样品中通过公知方法来回收和纯化，所述方法包括硫酸铵或乙醇沉淀法、酸提取法、阴离子或阳离子交换色谱法、磷酸纤维素色谱法、疏水相互作用色谱法、亲合色谱法、羟基磷灰石色谱法、疏水荷电相互作用色谱法和凝集素色谱法。最优选高效液相色谱法(″HPLC″)用于纯化。

分析生物样品中的融合蛋白水平可以使用诸多技术来进行。例如，组织中的蛋白质表达可以用经典免疫组织学方法来研究(Jalkanen等人，J.Cell.Biol.101：976-985(1985)；Jalkanen，M.，等人，J.Cell.Biol.105：3087-3096(1987))。用于检测蛋白质表达的其它方法包括免疫分析法，例如酶联免疫吸附法(ELISA)和放射免疾分析法(RIA)。适宜的抗体分析标记是本领域已知的并且包括酶标记(例如葡萄糖氧化酶)以及放射性同位素例如碘(<125>I、<121>I)、碳(<14>C)、硫(<35>S)、氚(<3>H)、铟(<112>In)和锝(<99m>Tc)，以及荧光标记例如荧光素和若丹明，以及生物素。

本发明的多肽还可通过本领域已知的重组技术来制备。通常地，它包括用包含目的编码多核苷酸的蛋白质或多肽的表达载体转化(包括转染、转导或感染)适宜的宿主细胞。

抗体

用于本发明分析方法的蛋白质特异性抗体可以针对本发明的野生型或表达的线粒体融合蛋白或者其抗原多肽片段产生，其可以与载体蛋白例如白蛋白一起提供给动物系统(例如兔或小鼠)，或者如果其长度足够(至少约25个氨基酸)可以没有载体。

如本文使用的，术语“抗体”(Ab)或“单克隆抗体”(Mab)表示包括完整的分子以及抗体片段，或者其抗原结合片段(例如，Fab和F(ab′)2片段)，其能够特异地结合到线粒体融合蛋白，或者对线粒体融合蛋白具有“特异性”。Fab和F(ab′)2片段缺少完整抗体的Fc片段，更容易从循环中清除，并且可具有较低的完整抗体的非特异性组织结合(Wahl等人，J.Nucl.Med.24：316-325(1983))。因此，这些片段是优选的。

本发明的抗体可通过众多方法的任一种来制备。例如，表达线粒体融合蛋白或其抗原片段的细胞可以被施用于动物以便诱导产生含有多克隆抗体的血清。在一个方法中，制备和纯化线粒体融合蛋白的制品，使其基本上不含有天然污染物。然后将此制品引入动物中以便产生更高特异活性的多克隆抗血清。

在一个相关的方法中，本发明的抗体是单克隆抗体。此类单克隆抗体可以使用杂交瘤技术来制备(Kohler等人，Nature 256：495(1975)；Kohler等人，Eur.J.Immunol.6：511(1976)；Kohler等人，Eur.J.Immunol.6：292(1976)；Hammerling等人，于：Monoclonal Antibodiesand T-Cell Hybridomas，Elsevier，N.Y.，(1981)pp.563-681)。通常，这些操作法包括用线粒体融合蛋白抗原或者用表达线粒体融合蛋白的细胞对动物(优选小鼠)免疫。

本发明包括免疫分析法，该方法使用对本文所述融合蛋白具有特异性的抗体或抗原结合片段。此类免疫分析法可以借助于试剂盒，该试剂盒包括抗体或抗原结合片段以及任何其它必需的试剂、试片、材料和说明书等等。

分析法

测定生物样品中翻译产物例如融合蛋白水平可以确定受试者中一种或多种癌症的存在。因此，本发明提供了用于预测、诊断或监测癌症的方法，该方法包括获得一个或多个生物样品，从该样品中提取线粒体融合蛋白，以及通过下列方式分析该样品的此分子：对样品中的一种或多种分子进行定量，再将检测的量与参比值进行比较。本领域技术人员理解，该参比值是基于该方法是否旨在预测、诊断或监测癌症。因此，该参比值可以与从一种或多种已知的非癌性生物样品、一种或多种已知的癌性生物样品、和/或一种或多种过去获取的生物样品中收集的蛋白质数据关联。

对样品中的蛋白质定量的技术是本领域已知的，并且包括，例如，经典的免疫组织学方法(Jalkanen等人，J.Cell.Biol.101：976-985(1985)；Jalkanen，M.，等人，J.Cell.Biol.105：3087-3096(1987))。用于检测蛋白质表达的其它方法包括免疫分析法，例如放射免疫分析法(RIA)和酶联免疫吸附法(ELISA)。

在一个方面，本发明提供了检测哺乳动物癌症的方法，该方法包括分析哺乳动物的组织样品中至少一种线粒体融合蛋白的存在。在另一方面，本发明提供了结直肠癌，肺癌，乳腺癌，卵巢癌，睾丸癌，前列腺癌和/或黑素瘤皮肤癌的诊断中线粒体融合蛋白的检测。

诊断成像

诊断设备

本发明包括用于诊断特定疾病或鉴定特定突变的诊断设备，如生物芯片、基因芯片或微阵列。对所有测序的线粒体基因组进行评估从而得到碱基对排列的共有结构，并对与特定疾病或病症相关的碱基对缺失和突变的比例赋予禁止指数(prohibiting index)。其后所述诊断性排列用于制造生物芯片、基因芯片或微阵列。

一旦鉴定出与特定疾病、疾病状态或病症有关的序列，可使用将线粒体核苷酸样品与寡核苷酸阵列进行杂交从而鉴定特定的突变。可以使用任何已知的杂交方法。优选地，使用具有与野生型或突变区匹配的寡核苷酸探针以及对照探针的阵列。市售的阵列如微阵列或基因芯片是适合的。这些阵列在载片或微芯片上含有数千匹配的以及对照探针对，并能够非常迅速地进行全基因组测序。描述微阵列在基因组和DNA序列分析中的应用的综述文献可在线获得。

微阵列

多核苷酸阵列提供了能在包含一种或多种靶核酸序列的样品中测定大量多核苷酸的高通量技术。本发明的阵列可用于基因表达分析、疾病诊断和疾病预后(例如，监测患者对治疗的反应等)。

指示疾病或疾病进展的mtDNA多核苷酸序列的任何组合均可用于构建微阵列。

使用微阵列进行分析的靶核酸样品来自如上述包含足量mtDNA的任何人组织或体液。在足以产生互补核酸成员/靶标复合体的杂交模式的杂交条件下使靶核酸样品接触多核苷酸成员。

微阵列的构建

所述微阵列包含附着在固体支持物一个表面的许多独有多核苷酸，其中每种多核苷酸附着在所述固体支持物表面上不相同的预选区中。阵列上每种相关样品包含身份已知(通常序列已知)的多核苷酸组合物，这在下面有更详细的描述。任何可能的基质都可以应用在本发明中。

使用任何已知的方法构建所述阵列。可以使用已建立的技术生产所述核酸成员，如聚合酶链式反应(PCR)和逆转录(RT)。这些方法与本领域目前已知的方法类似(参阅如，PCRStrategies，Michael A.Innis(编者)，等人(1995)，以及PCR：Introduction to BiotechniquesSeries，C.R.Newton，A.Graham(1997))。经扩增的多核苷酸通过本领域熟知的方法纯化(例如柱纯化)。当多核苷酸已被分离从而基本上不含引物以及所需多核苷酸的合成期间产生的不完整产物时，则认为多核苷酸是纯的。优选地，纯化的多核苷酸还将基本上不含可能阻碍或以其他方式掩盖所述分子的结合活性的污染物。

在本发明的阵列中，所述多核苷酸组合物与固体支持物的表面稳定结合，其中该支持物可以是柔性或刚性固体支持物。

本发明中可以使用核酸成员可附着于其上的任何固体支持物。适宜的固体支持物材料的实例包括但不限于：硅酸盐如玻璃和硅胶、纤维素和硝酸纤维素纸、尼龙、聚苯乙烯、聚甲基丙烯酸酯、胶乳、橡胶和碳氟树脂如TEFLON^TM。

可以使用各种形状的固体支持物材料，包括但不限于载片和珠。载片提供了一些功能上的优势，因此是优选的固体支持物形式。由于其表面扁平，因此使用玻璃载片将探针和杂交试剂减至最少。载片还使得试剂能靶向应用，易于保持恒定的温度，易于清洗并且便于直接观察固定在固体支持物上的RNA和/或DNA。使用载片还便于去除固定在固体支持物上的RNA和/或DNA。

选择作为固体支持物的具体材料对于本发明不是关键的，只要其提供所述功能。通常实施或使用本发明的人会基于成本节约和可获得性、最终产品的预期应用需求以及整个制造过程的需要而选择最佳的市售材料。

使用许多方法用于将本发明的核酸成员附着在基质上(称作点样的过程)。例如，使用如美国专利No.5,807,522中的技术附着多核苷酸，其为教导聚合物附着方法而通过引用并入本文。或者使用接触压印技术进行点样。

每个组合物中存在的多核苷酸量将足以在使用该阵列的测定中提供充分的靶多核苷酸序列的杂交和检测。通常，与阵列的固体支持物稳定结合的每一核酸成员量为至少约0.1ng，优选至少约0.5ng并且更优选至少约1ng，其中所述量可以高至1000ng或更高，但是通常不超过约20ng。

可以将对照多核苷酸点样在该阵列上，并用作靶标表达对照多核苷酸和错配对照核苷酸，从而监测与所述样品中除靶标外(探针所指向的靶标)的多核苷酸进行的非特异性结合或交叉杂交。因此，错配的探针指示杂交是否特异。例如，如果存在靶标，则完全匹配的探针应该始终比错配的探针更亮。另外，如果存在所有主要错配，则使用错配探针检测突变。

制备靶标

所述微阵列的靶标可以来源于一种或多种生物样品。可能希望在杂交之前对靶核酸样品进行扩增。本领域的技术人员会了解，无论使用何种扩增方法，如果需要定量结果的话，则必需注意使用维持或控制所述扩增多核苷酸的相对频率的方法。“定量”扩增的方法对于本领域技术人员是熟知的。例如，定量PCR包括使用相同的引物同时共同扩增已知量的对照序列。这提供了可以用于校准该PCR反应的内标。然后高密度阵列可以包括内标特异性探针，以定量所扩增的多核苷酸。PCR Protocols，A Guide to Methods and Applications，Innis等人，Academic Press，Inc.N.Y.，(1990)中提供了定量PCR的详细方案。其它适当的扩增方法包括但不限于聚合酶链式反应(PCR)(Innis，等人，PCR Protocols.A guide to Methods andApplication.Academic Press，Inc.San Diego，(1990))、连接酶链式反应(LCR)(参见Wu andWallace，Genomics，4：560(1989)，Landegren，等人，Science，241：1077(1988)以及Barringer，等人，Gene，89：117(1990)、转录扩增(Kwoh，等人，Proc.Natl.Acad.Sci.USA，86：1173(1989))以及自主序列复制(Guatelli，等人，Proc.Nat.Acad.Sci.USA，87：1874(1990))。

本发明提供了上文所述标记的靶标或标记的探针。对于微阵列，任何附着于或掺入于分子中的可分析检测的标记均可用于本发明。可分析检测的标记指任何被分析检测和定量的分子、部分或原子。适用于本发明的检测标记包括任何可通过光谱、光化学、生物化学、免疫化学、电、光学或化学方法检测的组合物。可用于本发明的标记包括用标记的链霉抗生物素蛋白缀合物染色的生物素、磁珠(例如，Dynabeads^TM)、荧光染料(例如，荧光素、得克萨斯红、罗丹明、绿色荧光蛋白等)、放射性标记(例如，3H，125I，35S，14C或32P)、酶(如辣根过氧化物酶、碱性磷酸酶及其它普遍用于ELISA的酶)和比色标记如胶体金或有色玻璃或塑料(例如聚苯乙烯、聚丙烯、胶乳等)珠。教导该标记用途的专利包括美国专利No.3,817,837；3,850,752；3,939,350；3,996,345；4,277,437；4,275,149和4,366,241。

检测这些标记的方法对于本领域的技术人员是熟知的。因此，例如，可以使用胶片或闪烁计数器检测放射性标记，可使用检测发射光的光检测器检测荧光标记。酶标记通常通过为酶提供底物并检测该酶对底物的作用所产生的反应产物来检测，而比色标记通过简单地观察有色标记进行检测。

可以通过本领域技术人员所熟知的许多方法掺入所述标记。然而，在一个优选的实施方案中，所述标记在制备样品多核苷酸的扩增步骤中同时掺入。因此，例如，带有标记引物或标记核苷酸的聚合酶链式反应(PCR)将提供标记的扩增产物。在一个优选的实施方案中，如上述使用标记的核苷酸(如荧光素标记的UTP和/或CTP)的转录扩增将标记掺入转录的多核苷酸中。或者，可以将标记直接加入原始多核苷酸样品(例如，mRNA，聚腺苷酸化mRNA，cDNA等)或在扩增完成之后加入扩增产物。将标记附着在多核苷酸上的方法对于本领域的技术人员是熟知的，包括如切口平移或末端标记(例如使用标记的RNA)，通过用激酶处理多核苷酸并随后附着(连接)连接多核苷酸样品与标记(例如，荧光团)的多核苷酸接头。

在一个优选的实施方案中，所述靶标将包括一种或多种对照分子，其与微阵列上的对照探针杂交，从而将该微阵列得到的信号归一化。标记的归一化靶标是与如上述点样在所述微阵列上的对照寡核苷酸完全互补的多核苷酸序列。杂交后得自归一化对照的信号提供了对杂交条件、标记强度、“读数”效率及其可造成完全杂交的信号在阵列间变化的其他因素的变化的对照。

图像采集和数据分析

在杂交和任何洗涤步骤和/或常规的后续处理之后，检测得到的杂交模式。在杂交模式的检测或成像中，标记的强度或信号值将不仅被检测而且还被定量，这意味着将对来自每个杂交点的信号进行测量并与已知数目的末端标记靶多核苷酸所发射信号相应的单位值进行比较，从而获得杂交模式中与阵列上的特定点杂交的每种末端标记靶标的拷贝数的计数或绝对值。

分析从阵列杂交收集的数据的方法在本领域是熟知的。例如，当杂交检测涉及荧光标记时，数据分析可包括如下步骤：从收集的数据确定作为基质位置的函数的荧光强度，除去异常值，即偏离预定统计分布的数据，以及从剩余的数据计算测试多核苷酸的相对结合亲和力。将得到的数据展示为图像，其中每个区域中的强度根据相关寡核苷酸和/或多核苷酸与测试多核苷酸之间的结合亲和力而发生变化。

诊断测试

检测或成像后，所述杂交模式用于确定与该阵列接触从而得到杂交模式的标记靶多核苷酸样品的遗传谱的定量信息，以及样品所源自的组织、体液、器官、细胞等的状态或情况。就此而言，本发明进一步提供了用于检测癌症的诊断测试。本发明还提供了针对患者状况进行检测。根据本发明的方法，癌症的存在是通过从患者获得生物样品来检测的。包含核酸的测试样品是从该生物样品制备的。从该样品中提取的核酸与包含固体基质和多个核酸成员的阵列杂交，其中每个核酸成员指示存在疾病或者有癌症倾向。根据此诊断测试，包含核酸的样品与该阵列上的一个或多个核酸成员杂交指示着癌症或者有癌症倾向。

诊断性监测

本发明方法可进一步包括基于一种或多种分析法的结果来推荐监测状态或治疗进程的步骤。这让临床医生能够实施个体化给药；例如通过监测患者癌症进程(例如通过识别何时起始和或后续的突变发生)或者治疗进程(例如通过识别何时突变稳定)而治疗癌症。

有了序列变化范围的知识，该信息可用于诊断癌前状况或者癌存在时的状况。此外，通过对随时间的连续样品中异常mtDNA的定量，可以监测癌症状况的进展。例如通过在某一时间点分析患者组织以检测第一组从野生型的突变而获得数据，该数据可以与后续分析所提供的数据进行比较，以确定在该异常中是否发生了变化。

当在尚未发展成癌症症状的个体中发现突变时，该突变可能指示有发展为癌症状况的遗传易感性。其疾病易感性的确定或其存在的诊断可以进一步基于以下信息量化评价，该信息是关于患者家族史中癌症状况(如果有)的普遍性以及其它风险因子的存在(例如暴露于环境因素)以及患者细胞是否还携带另一类突变。

生物样品

本发明提供了诊断测试法，其包括获得或采集一种或多种生物样品。在本发明的上下文中，“生物样品”是指含有细胞的组织或体液，从该细胞中可以获得mtDNA、mtRNA和翻译产物或者融合蛋白。例如，该生物样品可以得自包括但不限于下列的组织：皮肤，肺，乳腺，前列腺，神经，肌肉，心脏，胃，结肠，直肠组织等；或者得自血液，唾液，脑脊液，痰液，尿液，粘液，滑液，腹腔液，羊水等。该生物样品可以得自癌性或非癌性组织，并且可以，但不限于外科手术样品或生物活检样品。

该生物样品可以以从来源获得的那样直接使用或者预处理以改变样品性质后使用。因此，该生物样品在使用前进行预处理，预处理的方式例如是，从血液制备血浆或血清，破坏细胞，从固体材料制备液体，稀释粘稠液体，过滤液体，蒸馏液体、浓缩液体，使干扰组分失活，添加试剂等。

本领域技术人员将理解，可以单次分析一种以上的样品类型(即，对于检测一种以上的癌症)。此外，当需要一系列采集时例如对于癌症经时监测时，给定样品可以单独被诊断，或者整个试验期获得的其它样品一起被诊断。就此而言，生物样品可以仅一次获取，或者以规则间隔获取，例如两周一次、一月一次、半年一次或每年一次。

试剂盒

本发明提供了用于在临床环境下检测癌症的诊断/筛查试剂盒。此试剂盒可包括一个或多个取样工具，以及一种或多种本发明的探针。或者，或除此以外，该试剂盒可包括用于检测本发明翻译产物的工具。

该试剂盒可任选包括进行诊断分析所需的试剂，例如缓冲剂、盐、检测试剂等。其它成分例如用于分离和/或处理生物样品的缓冲剂和溶液亦可包含在该试剂盒中。该试剂盒的一种或多种组分可以被冷冻干燥，并且该试剂盒可进一步包括适用于使该冷冻干燥组分复溶的试剂。

如果适宜，则该试剂盒还可包含反应容器，混合容器以及其它有助于制备测试样品的组件。该试剂盒还任选可包括使用说明书，其可以纸质形式提供，或者以计算机可读形式例如磁盘、CD、DVD等提供。

在本发明的一个实施方案中，提供了用于诊断癌症的试剂盒，其包括取样工具以及本发明的杂交探针。

在另一实施方案中，本发明的试剂盒可包括免疫分析。在此情况下，该试剂盒可包括对本文所述融合蛋白具有特异性的抗体或抗原结合片段。可以理解，此免疫分析所需的各种其它试剂、试片等将被包含在该试剂盒中，所需要的用户说明书也被包含在该试剂盒中。

实施例

本发明的多个方面将通过使用以下实施例来示意性描述。本文提供的实施例仅用于说明本发明某些具体的实施方案，而不是用于以任何方式限定本发明范围。

实施例1：线粒体融合转录本的检测

先前本申请人在PCT申请号PCT/CA2007/001711(公开号WO 2009/039601，其全部内容通过引用并入本文)中鉴定的线粒体4977“共同缺失”和3.4kb缺失产生了独特的开放读码框，其具有前列腺组织中寡-dT筛选所鉴定的活性转录本(图2和3)。乳腺组织样品的检查亦揭示存在从3.4kb缺失产生的稳定的聚腺苷酸化融合转录本(图4)。

用于缺失转录本检测的逆转录酶-PCR方案

RNA分离cDNA合成

总RNA是从快速冷冻的前列腺和乳腺组织样品(恶性和邻近于肿瘤的正常样品两者)分离的，其中使用Aurum^TM Total RNAFatty和Fibrous Tissue试剂盒(Bio-Rad，Hercules，CA)并遵照用户说明书。由于在此试验中应避免基因组DNA污染，所以包括DNase I处理步骤，其使用本领域公知的方法。用ND-1000分光光度计(NanoDroptechnologies)对RNA定量和定性。来自约100g的起始材料，总RNA浓度变化范围为100-1000ng/ul，260/280比率为1.89-2.10。将RNA浓度调节到100ng/ul，将2ul的每个模板用于第一链DNA合成，其中使用的SuperScript^TM第一链DNA合成系统(Invitrogen)并遵照用户说明书进行RT-PCR。为了鉴定稳定的聚腺苷酸化融合转录本，使用了靶向具有聚-A尾的转录本的寡聚(dT)引物。

PCR

每个cDNA模板使用5ul进行实时PCR，其中在DNA Engine Opticon2连续荧光检测系统(Bio-Rad，Hercules，CA)上使用iQ^TM SYBRGreen Supermix(Bio-Rad，Hercules，CA)进行。靶向4977bp缺失的引物对为；8416F 5’-CCTTACACTATTCCTCATCAC-3’，13637R 5’-TGACCTGTTAGGGTGAGAAG-3’，而靶向3.4kb缺失的引物对为；ND4LF 5′-TCGCTCACACCTCATATCCTC-3′，ND5R 5′-TGTGATTAGGAGTAGGGTTAGG-3′。反应混合液包括：2X SYBRGreen Supermix(100mM KCL，40mM Tris-HCl，pH 8.4，0.4mM的各种dNTP[dATP，dCTP，dGTP和dTTP]，iTaq^TM DNA聚合酶，50单位/ml，6mM MgCl₂，SYBRGreen 1，20nM荧光素，以及稳定剂)，每种引物250nM，以及ddH₂O。PCR循环参数如下：(1)95℃2min，(2)95℃30sec，(3)55℃(对于4977bp缺失)和63℃(对于3.4kb缺失)30sec，(4)72℃45sec，(5)读板，接着步骤3至5进行39个循环，最终在4℃下孵育。除了循环阈值以及熔解曲线分析以外，针对扩增产物的特异性显影使样品跑琼脂糖凝胶(参见图2至4)。

图2是显示由线粒体基因组失去3.4kb引起的前列腺样品中的聚腺苷酸化融合转录本的琼脂糖凝胶。图2的图例：B-空白，泳道1-6cDNA中检测的转录本；泳道7-12泳道1-6样品的无逆转录酶(RT)对照。

图3显示了由失去4977kb共同缺失引起的前列腺样品中的聚腺苷酸化融合转录本。图3的图例：B-空白，泳道1-6cDNA中检测的转录本；泳道7-12泳道1-6样品的的无RT对照。

图4显示了由失去3.4kb mt基因组引起的乳腺样品中的聚腺苷酸化融合转录本。图4的图例：泳道2-8来自乳腺cDNA的转录本；泳道9阴性(水)对照；泳道10和11，阴性，无RT，泳道2和3样品的对照。

这些结果证实了存在稳定的线粒体融合转录本。

实施例2：融合产物的鉴定和靶向

设计多种杂交探针以检测并进一步证实由突变的线粒体基因组得到的新转录本的存在，例如3.4kb缺失。为此目的，使用单重分支DNA平台(single-plex branched DNA platform)进行定量基因表达分析(QuantiGene 2.0^TM，Panomics^TM)。本实施例中所列举的特异性缺失和序列基于它们与整个mtDNA基因组(其描述于SEQ ID NO：1)的相对位置。针对四种转录本的核酸序列设计的本实施例探针在本文中标识如下：转录本1(SEQ ID NO：19)，转录本2(SEQ ID NO：20)，转录本3(SEQ ID NO：21)和转录本4(SEQ ID NO：22)。

来自3.4kb线粒体基因组缺失的连续转录本的实例在基因ND4L(NADH脱氢酶亚基4L)和ND5(NADH脱氢酶亚基5)之间发生。具有对SEQ ID NO：20的互补序列的探针用于检测转录本2。重复元件出现位置为ND4L中的10745-10754以及ND5中的14124-14133。

3.4kb缺失导致去除ND4L的3’端、全部的ND4基因、tRNA组氨酸、tRNA丝氨酸2、tRNA亮氨酸2以及ND5的5’端的大部分(参见图5a)，造成ND4L和ND5的基因剪接，连接点为10744(ND4L)：14124(ND5)(图5b)。

通过启动第一基因ND4L的原始起动密码子，翻译该氨基酸序列直到出现终止密码子。在此实施例中，该终止密码子是ND5的原始的终止密码子。因此，尽管将两个基因剪接在一起，该读码框保持完整，导致一种假设或预测的转录本，其长度为100个氨基酸(或者300bp)。此融合蛋白转录本产物在本文标识为SEQ ID NO：37。编码此蛋白质的核苷酸序列(SEQ IDNO：3)与线粒体基因组位置10470-10744：14124-14148相对应。SEQ ID NO：3是与上文所述方式检测的RNA转录本(SEQ ID NO：20)互补的DNA序列。

类似地，转录本1是ATPase 8和ND5之间对应位置8469：13447的融合转录本(SEQ IDNO：19)。转录本3和4(分别为SEQ ID NO：21和SEQ ID NO：22)是COII和Cytb之间分别对应核苷酸位置7974：15496和7992：15730的融合转录本。表3提供了本实施例使用的各种序列之间关系的汇总。表3包括检测的融合转录本、与检测的融合转录本互补的DNA序列以及针对每种转录本的推测翻译产物。

实施例3：应用于前列腺癌

使用4种融合转录本，即上文讨论的转录本1至4，分析来自一名患者的两个前列腺组织样品，以评价新预测的融合转录本的定量差异。试验结果提供于以下表2。其中“Homog 1”是指来自患者的冷冻前列腺肿瘤的匀浆物，“Homog 2”是指与该患者肿瘤邻近的冷冻的正常前列腺组织的匀浆物。根据制造商方案(用于新鲜或冷冻的动物组织的QuantiGene样品样品处理试剂盒；以及QuantiGene2.0试剂系统用户手册)处理这些样品，以25.8mg的Homog1和28.9mg的Homog 2开始(该分析方案显示于表5a和5b)。

清楚证明的是，与正常邻近的前列腺组织相比，前列腺癌组织中线粒体融合转录本存在增加。该融合转录本存在于正常组织中，尽管水平很低。探针与靶转录本杂交产生的相对发光单位(RLU)直接与每种转录本的丰度成比率。表2还标明了以百分数表示的样品读数的变异系数CV。该CV由标准偏差除以该数值的均值得到。这些癌症组织中稳定转录的线粒体基因产物的显著性暗示了疾病演化和进展。

实施例4：应用于乳腺癌

使用与实施例3相同的方案，但是仅针对转录本2(与3.4kb mt基因组缺失相关的新融合转录本)在两个乳腺肿瘤组织样品上两个与这些肿瘤邻近无肿瘤组织的样品上，以及三个前列腺肿瘤组织样品、一个包含邻近的无肿瘤组织的样品进行分析。本实施例的结果提供于表4。具有相应的正常组织部分的前列腺肿瘤组织样品证实与实施例3分析的前列腺样品有相似模式，即，该肿瘤组织比正常邻近的组织具有约2倍量的融合转录本。当与邻近非-肿瘤组织相比时，证实该乳腺肿瘤样品有显示增加的融合转录本水平。匀浆物的1∶100稀释液用于本分析，因为它在实施例3的试验进行中最具重现性。

因此，上文讨论的结果说明本发明转录本在前列腺和乳腺组织肿瘤检测中的应用。

实施例5：应用于结直肠癌

本研究旨在测定本发明若干转录本在检测结直肠癌中的效力。制备了总计19个样品，它们包括9个对照(良性)组织样品(样品1至9)和10个肿瘤(恶性)组织样品(样品10至19)。根据制造商建议(用于新鲜或冷冻的动物组织的QuantiGene样品样品处理试剂盒；以及QuantiGene 2.0试剂系统用户手册)将该样品匀浆。以上文前面实施例所述方式制备7个靶转录本和一个看家基因转录本。该转录本的特征汇总如下：

表7：乳腺癌转录本的特征

转录本ID	连接位点	基因连接
			2	10744：14124	ND4L：ND5
3	7974：15496	COII：Cytb
			10	7438：13476	COI：ND5
11	7775：13532	COII：ND5
			12	8213：13991	COII：ND5
肽基丙基异构酶B(PPIB)(“看家基因”)	N/A	N/A

注意，转录本2和3与上文关于实施例3和4中讨论的那些相同。

使用约25mg来自OCT块的组织制备匀浆物，并针对转录本2和4以1∶1稀释，针对转录本10和11以1∶8稀释。以相对发光单位RLU在Glomax^TM多重检测系统(Multi DetectionSystem)(Promega)上测定转录本的量。对于每种转录本，全部样品均一式三份测试。背景测定(无模板)同样一式三份测试。以样品RLU值的下限减去背景来计算分析。使用公式log₂ aRLU-log₂ h RLU计算加入的RNA，其中a是靶融合转录本，h是看家基因转录本。

数据分析包括以下步骤：

a)对三份分析建立CV(变异系数)，如果≤15％则可接受。

b)对靶融合转录本(a)和看家基因转录本(h)的三份分析建立平均RLU值。

c)由三份背景RLU值建立下限(l)。

d)由(a)减去下限(l)。

e)计算log2 a RLU-log2 h RLU。

结果汇总：

以上分析结果描绘于图6a至6g，其包括log₂ a RLU-log₂ h RLU对样品号的曲线。还描绘了每种转录本结果确定的各个ROC(接收器操作特性)曲线。

转录本2：正常组与恶性组的均值之间存在统计学显著差异(p＜0.10)(p＞0.09)，其中使用的临界值为3.6129，该临界值由灵敏度60％和特异性89％的ROC曲线结果所证实，曲线下面积0.73表明公允的试验精度。对于特定应用可以调节所选阈值以增加试验的特异性或灵敏度。

转录本3：正常组与恶性组的均值之间存在统计学显著差异(p＜0.05)(p＝0.03)，其中使用的临界值为4.0813，该临界值由灵敏度60％和特异性78％的ROC曲线结果所证实，曲线下面积0.79表明公允到良好的试验精度。对于特定应用可以调节所选阈值以增加试验的特异性或灵敏度。

转录本8：正常组与恶性组的均值之间存在统计学显著差异(p＜0.1)(p＝0.06)。其中使用的临界值为-6.0975，该临界值由灵敏度60％和特异性89％的ROC曲线结果所证实，曲线下面积0.76表明公允的试验精度。对于特定应用可以调节所选阈值以增加试验的特异性或灵敏度。

转录本9：正常组与恶性组的均值之间存在统计学显著差异(p＜0.1)(p＝0.06)。其中使用的临界值为-7.5555，该临界值由灵敏度60％和特异性89％的ROC曲线结果所证实，曲线下面积0.76表明公允到良好的试验精度。对于特定应用可以调节所选阈值以增加试验的特异性或灵敏度。

转录本10：正常组与恶性组的均值之间存在统计学显著差异(p≤0.01)(p＝0.01)。其中使用的临界值为-3.8272，该临界值由灵敏度90％和特异性67％的ROC曲线结果所证实，曲线下面积0.84表明良好的试验精度。对于特定应用可以调节所选阈值以增加试验的特异性或灵敏度。

转录本11：正常组与恶性组的均值之间存在统计学显著差异(p＜0.1)(p＝0.06)，其中使用的临界值为3.1753，该临界值由灵敏度70％和特异性78％的ROC曲线结果所证实，曲线下面积0.76表明公允到良好的试验精度。对于特定应用可以调节所选阈值以增加试验的特异性或灵敏度。

转录本12：正常组与恶性组的均值之间存在统计学显著差异(p＜0.1)(p＝0.06)，其中使用的临界值为3.2626，该临界值由灵敏度70％和特异性78％的ROC曲线结果所证实，曲线下面积0.76表明公允到良好的试验精度。对于特定应用可以调节所选阈值以增加试验的特异性或灵敏度。

结论：

以上结果说明了转录本2，3，8，9，10，11和12在检测结直肠癌和区分恶性与正常结直肠组织中的应用。如上所述，转录本2和3亦发现可用于检测前列腺癌。转录本2亦发现可用于检测乳腺癌。转录本11亦发现可用于检测黑素瘤皮肤癌.转录本10亦发现可用于检测肺癌和黑素瘤。转录本8亦发现可用于检测肺癌。列举的7种转录本中的任一种均可单独或者组合作为工具用于临床情况下检测结直肠癌的特征。

实施例6：应用于肺癌

本研究旨在测定本发明若干转录本在检测肺癌中的效力。如实施例5中所述的，根据制造商建议(用于新鲜或冷冻的动物组织的QuantiGene样品样品处理试剂盒；以及QuantiGene 2.0试剂系统用户手册)对9个对照(良性)组织样品(样品1至9)和10个肿瘤(恶性)组织样品(样品10至19)进行匀浆。将匀浆物以1∶8稀释，在Glomax^TM多重检测系统(Promega)上以相对发光单位RLU测定4个靶转录本和1个看家转录本的量。对于每种转录本，全部样品均一式三份分析。背景测定(无模板)同样一式三份测试。

针对本实施例制备以下转录本：

表8：肺癌转录本的特征

用于本实施例的组织样品具有以下特征：

表9：肺癌样品的特征

样品	恶性	注释(组织来源)
			1	否	间质性肺病
2	否	肺气肿
			3	否	动脉瘤
4	否	支气管肺炎，COPD
			5	否	肝恶性瘤，起源不明，肺钙化性肉芽肿
6	否	死后12小时，轻度肺气肿
			7	否	死后12小时，大B细胞淋巴瘤，肺水肿，肺炎
8	否	肺炎，水肿，肺泡损伤
			9	否	充血和水肿
10	是	腺癌，非小细胞
			11	是	小细胞
12	是	鳞状细胞癌，非小细胞，肺气肿
			13	是	腺癌，肺癌，非小细胞，转移的
14	是	鳞状细胞癌，非小细胞
			15	是	混合鳞状和腺癌
16	是	非小细胞癌，鳞状
			17	是	小细胞癌

18	是	腺癌，肺癌，非小细胞
			19	是	腺癌，肺癌，非小细胞，转移的

根据实施例5所述方法进行数据分析。结果描绘于图7a，7b，7c和7d。

结果汇总：

转录本6：正常组(良性)与恶性组的均值之间(p＜0.1)存在统计学显著差异(p＜0.1)(p＝0.06)，其中使用的临界值为-6.5691，该临界值由灵敏度80％和特异性71％的ROC曲线结果所证实，曲线下面积0.77表明公允的试验精度。对于特定应用可以调节所选阈值以增加试验的特异性或灵敏度。

转录本8：正常组与恶性组的均值之间的差异是统计学显著的p＜0.05(p＝0.02)。其中使用的临界值为-9.6166，该临界值由灵敏度90％和特异性86％的ROC曲线结果所证实，曲线下面积0.86表明良好的试验精度。对于特定应用可以调节所选阈值以增加试验的特异性或灵敏度。

转录本10：正常组与恶性组的均值之间的差异是统计学显著的p≤0.01(p＝0.01)。其中使用的临界值为-10.6717，该临界值由灵敏度90％和特异性86％的ROC曲线结果所证实，曲线下面积0.89表明良好的试验精度。对于特定应用可以调节所选阈值以增加试验的特异性或灵敏度。

转录本20：正常组与恶性组的均值之间的差异是统计学显著的p≤0.1(p＝0.1)。其中使用的临界值为2.5071，该临界值由灵敏度70％和特异性71％的ROC曲线结果所证实，曲线下面积0.74表明公允的试验精度。对于特定应用可以调节所选阈值以增加试验的特异性或灵敏度。

结论：

实施例6的结果说明了本发明转录本6，8，10和20在检测肺癌肿瘤以及区分恶性与正常肺组织中的应用。3种转录本的任一种均可用于临床情况下检测或表征肺癌。

实施例7：应用于黑素瘤

本研究旨在测定本发明若干转录本在检测黑素瘤中的效力。在本研究中，使用总计14个样品，包括5个对照(良性)组织样品和9个恶性组织样品。全部样品均用福尔马林固定、石蜡包埋(FFPE)。将该FFPE组织样品在管中切开，并根据制造商建议(用于FFPE样品的Quantigene2.0样品处理试剂盒；以及QuantiGene 2.0试剂系统用户手册)进行匀浆，各样品在匀浆前为大约20微米。将匀浆物以1∶4稀释，再在Glomax^TM多重检测系统(Promega)上以相对发光单位RLU测定7种靶转录本和1种看家转录本的量。对于每种转录本，全部样品均一式三份分析。背景测定(无模板)同样一式三份测试。

用于本实施例的14个组织样品具有以下特征：

表10：黑素瘤癌样品的特征

样品	恶性	注释(组织来源)
			1	否	乳腺缩减术组织(皮肤)
2	否	乳腺缩减术组织(皮肤)
			3	否	乳腺缩减术组织(皮肤)
4	否	乳腺缩减术组织(皮肤)
			5	否	乳腺缩减术组织(皮肤)
6	是	恶性雀斑，(原位黑素瘤)不存在侵袭性黑素瘤
			7	是	侵袭性恶性黑素瘤
8	是	结节性黑素瘤，pT3b，恶性雀斑的相关性质
			9	是	残余的表面扩散侵袭性恶性黑素瘤，Clark氏II级
10	是	表面扩散恶性黑素瘤，Clark氏II级
			11	是	结节性恶性黑素瘤，Clark氏IV级
12	是	表面扩散恶性原位黑素瘤，未显示侵袭
			13	是	表面扩散恶性黑素瘤，Clark氏II级，病灶存在垂直期
14	是	表面扩散恶性原位黑素瘤，Clark氏I级

本实施例制备以下转录本：

表11：黑素瘤癌转录本的特征

转录本ID	连接位点	基因连接
			6	8828：4896	ATPase6：Cytb
10	7438：13476	COI：ND5
			11	7775：13532	COII：ND5
14	9191：12909	ATPase6：ND5
			15	9574：12972	COIII：ND5
16	10367：12829	ND3：ND5
			20	8469：13447	ATPase8：ND5
肽基丙基异构酶B(PPIB)(“看家基因”)	N/A	N/A

如指明了的，转录本10和11还用于实施例5。根据实施例5所述方法进行数据分析。结果描绘于图8a-8g。

结果汇总：

转录本6：正常组与恶性组的均值之间存在统计学显著差异(p≤0.01)(p＝0.01)。此外，其中使用的临界值为-5.9531，该临界值由灵敏度89％和特异性80％的ROC曲线结果所证实，曲线下面积0.96，表明非常良好的试验精度。对于特定应用可以调节所选阈值以增加试验的特异性或灵敏度。

转录本10：正常组与恶性组的均值之间存在统计学显著差异(p≤0.05)(p＝0.05)，其中使用的临界值为-4.7572，该临界值由灵敏度89％和特异性40％的ROC曲线结果所证实，曲线下面积0.82表明良好的试验精度。对于特定应用可以调节所选阈值以增加试验的特异性或灵敏度。

转录本11：正常组与恶性组的均值之间存在统计学显著差异(p＜0.05)(p＝0.02)。此外，其中使用的临界值为1.6762，该临界值由灵敏度78％和特异性100％的ROC曲线结果所证实，曲线下面积0.89表明良好的试验精度。对于特定应用可以调节所选阈值以增加试验的特异性或灵敏度。

转录本14：正常组与恶性组的均值之间存在统计学显著差异(p≤0.05)(p＝0.05)。此外，其中使用的临界值为-4.9118，该临界值由灵敏度89％和特异性60％的ROC曲线结果所证实，曲线下面积0.82表明良好的试验精度。对于特定应用可以调节所选阈值以增加试验的特异性或灵敏度。

转录本15：正常组与恶性组的均值之间存在统计学显著差异(p＜0.1)(p＝0.07)，其中使用的临界值为-7.3107，该临界值由灵敏度100％和特异性67％的ROC曲线结果所证实，曲线下面积0.80表明良好的试验精度。对于特定应用可以调节所选阈值以增加试验的特异性或灵敏度。

转录本16：正常组与恶性组的均值之间存在统计学显著差异(p＜0.05)(p＝0.03)。此外，其中使用的临界值为-10.5963，该临界值由灵敏度89％和特异性80％的ROC曲线结果所证实，曲线下面积0.878表明良好的试验精度。对于特定应用可以调节所选阈值以增加试验的特异性或灵敏度。

转录本20：正常组与恶性组的均值之间存在统计学显著差异(p＜0.05)(p＝0.04)。此外，其中使用的临界值为-8.3543，该临界值由灵敏度100％和特异性80％的ROC曲线结果所证实，曲线下面积0.89表明良好的试验精度。对于特定应用可以调节所选阈值以增加试验的特异性或灵敏度。

结论：

实施例7的结果说明了本发明转录本6，10，11，14，15，16和20在检测恶性黑素瘤中的应用。如上所述，转录本10和11亦发现可用于检测结直肠癌结直肠癌，而转录本6可用于检测肺癌。疾病的转录本汇总提供于表6。

实施例8：应用于卵巢癌

本研究旨在测定本发明若干转录本在检测卵巢癌中的效力。制备总计20种样品，包括10种对照(良性)组织样品(样品1至10)和10种肿瘤(恶性)组织样品(样品11至20)。根据制造商建议(用于新鲜或冷冻的动物组织的QuantiGene样品样品处理试剂盒；以及QuantiGene2.0试剂系统用户手册)对该样品进行匀浆。以上文前面实施例所述方式制备8种靶转录本和1种看家转录本。

用于本实施例的20个组织样品具有以下特征：

表12：卵巢癌样品的特征

样品	诊断	注释
			1	正常	毛囊囊肿
2	正常	纤维瘤
			3	正常	卵巢无病理变化
4	正常	毛囊囊肿
			5	正常	细胞性纤维瘤
6	正常	良性囊泡和单纯性囊肿
			7	正常	平滑肌瘤，乳头体
8	正常	乳头体和上皮包含性囊肿
			9	正常	乳头体
10	正常	乳头体，表面包涵囊肿，毛囊囊肿
			11	恶性	包括网膜的高级低分化乳头状浆液性癌
12	恶性	子宫内膜样腺癌，良好至中度分化，具有病灶性浆液分化
			13	恶性	乳头状浆液性癌
14	恶性	混合上皮癌主要是乳头状浆液性癌
			15	恶性	高级：浆液性癌，乳头状和实体生长方式
16	恶性	高级(3/3)乳头状浆液性癌
			17	恶性	乳头状浆液性癌，高核级
18	恶性	乳头状浆液性囊腺癌分级：III
			19	恶性	低分化性乳头状浆液性癌
20	恶性	分化好的腺癌，子宫内膜样型，1级

该转录本的特征汇总如下：

表13：卵巢癌转录本的特征

注意，转录本1，2，3，6，11，12，15和20与上文实施例3-7所讨论的那些相同。

使用约25mg的冷冻组织制备匀浆物并以1∶4稀释。在Glomax^TM多重检测系统(Promega)中以相对发光单位RLU测定转录本的量。对于每种转录本，全部样品均一式三份分析。背景测定(无模板)同样一式三份测试.以样品RLU值的下限减去背景来计算分析。使用公式log₂ a RLU-log₂ h RLU计算输入RNA，其中a是靶融合转录本，h是看家基因转录本。

数据分析包括以下步骤：

a)对三份分析建立CV(变异系数)，如果≤15％则可接受。

b)对靶融合转录本(a)和看家转录本(h)的三份分析建立平均RLU值。

c)由三份背景RLU值建立下限(l)。

d)由(a)减去下限(l)。

e)计算log2 a RLU-log2 h RLU。

结果汇总：

以上分析结果描绘于图9a至9h，其包括log₂ a RLU-log₂ h RLU对样品号的曲线。还描绘了每种转录本结果确定的各个ROC(接收器操作特性)曲线。

转录本1：正常组与恶性组的均值之间存在统计学显著差异(p＜0.05)(p＝0.002)。其中使用的临界值为-11.1503，该临界值由灵敏度90％和特异性80％的ROC曲线结果所证实，曲线下面积0.91表明非常良好的试验精度。对于特定应用可以调节所选阈值以增加试验的特异性或灵敏度。

转录本2：正常组与恶性组的均值之间存在统计学显著差异(p＜0.01)(p＝0.001)。其中使用的临界值为0.6962，该临界值由灵敏度90％和特异性100％的ROC曲线结果所证实，曲线下面积0.96表明非常良好的试验精度。对于特定应用可以调节所选阈值以增加试验的特异性或灵敏度。

转录本3：正常组与恶性组的均值之间存在统计学显著差异(p＜0.01)(p＝0.000)。其中使用的临界值为0.6754，该临界值由灵敏度100％和特异性100％的ROC曲线结果所证实，曲线下面积1.00表明极好的试验精度。对于特定应用可以调节所选阈值以增加试验的特异性或灵敏度。

转录本6：正常组与恶性组的均值之间存在统计学显著差异(p＜0.01)(p＝0.007)。其中使用的临界值为-9.6479，该临界值由灵敏度90％和特异性70％的ROC曲线结果所证实，曲线下面积0.86表明良好的试验精度。对于特定应用可以调节所选阈值以增加试验的特异性或灵敏度。

转录本11：正常组与恶性组的均值之间存在统计学显著差异(p＜0.01)(p＝0.000)。其中使用的临界值为-1.3794，该临界值由灵敏度100％和特异性90％的ROC曲线结果所证实，曲线下面积0.99表明极好的试验精度。对于特定应用可以调节所选阈值以增加试验的特异性或灵敏度。

转录本12：正常组与恶性组的均值之间存在统计学显著差异(p＜0.01)(p＝0.001)。其中使用的临界值为-1.2379，该临界值由灵敏度90％和特异性100％的ROC曲线结果所证实，曲线下面积0.96表明极好的试验精度。对于特定应用可以调节所选阈值以增加试验的特异性或灵敏度。

转录本15：正常组与恶性组的均值之间存在统计学显著差异(p＜0.05)(p＝0.023)。其中使用的临界值为-8.6926，该临界值由灵敏度70％和特异性80％的ROC曲线结果所证实，曲线下面积0.80表明良好的试验精度。对于特定应用可以调节所选阈值以增加试验的特异性或灵敏度。

转录本20：正常组与恶性组的均值之间存在统计学显著差异(p＜0.01)(p＝0.000)。其中使用的临界值为0.6521，该临界值由灵敏度100％和特异性100％的ROC曲线结果所证实，曲线下面积0.76表明公允到良好的试验精度。对于特定应用可以调节所选阈值以增加试验的特异性或灵敏度。

结论：

以上结果说明了转录本1，2，3，6，11，12，15和20在检测卵巢癌以及区分恶性与正常卵巢组织中的应用。转录本1，2和3亦发现可用于检测前列腺癌。转录本6亦发现可用于检测黑素瘤和肺癌。转录本11亦发现可用于检测黑素瘤皮肤癌，结直肠癌和睾丸癌。转录本12亦发现可用于检测结直肠癌和睾丸癌。转录本15亦发现可用于检测黑素瘤和睾丸癌。转录本20亦发现可用于检测结直肠癌，黑素瘤和睾丸癌。列举的8种转录本中的任一种均可单独或者组合作为工具用于临床情况下检测或表征卵巢癌。

实施例9：应用于睾丸癌

本研究旨在测定本发明若干转录本在检测睾丸癌中的效力。制备总计17种样品，包括8种对照(良性)组织样品(样品1至8)和9种肿瘤(恶性)组织样品(样品9至17)，5种恶性样品为非精原细胞瘤(样品9-13)而4种为精原细胞瘤(样品14-17)。根据制造商建议(用于新鲜或冷冻的动物组织的QuantiGene样品样品处理试剂盒；以及QuantiGene 2.0试剂系统用户手册)对该样品进行匀浆。以上文前面实施例所述方式制备10种靶转录本和1种看家转录本。

用于本实施例的17个组织样品具有以下特征：

表14：睾丸癌样品的特征

样品	一般诊断	分层恶性诊断
			1	良性	良性
2	良性	良性
			3	良性	良性
4	良性	良性
			5	良性	良性
6	良性	良性
			7	良性	良性
8	良性	良性
			9	恶性	非精原细胞瘤
10	恶性	非精原细胞瘤
			11	恶性	非精原细胞瘤
12	恶性	非精原细胞瘤
			13	恶性	非精原细胞瘤
14	恶性	精原细胞瘤
			15	恶性	精原细胞瘤
16	恶性	精原细胞瘤
			17	恶性	精原细胞瘤

该转录本的特征汇总如下：

表15：睾丸癌转录本的特征

转录本ID	连接位点	基因连接
			2	10744：14124	ND4L：ND5
3	7974：15496	COII：Cytb
			4	7992：15730	COII：Cytb
11	7775：13532	COII：ND5
			12	8213：13991	COII：ND5
13	9144：13816	ATPase6：ND5
			15	9574：12972	COIII：ND5
16	10367：12829	ND3：ND5
			20	8469：13447	ATPase8：ND5

肽基丙基异构酶B(PPIB)

N/A

注意，转录本2，3，4，11，12，15，16和20与上文实施例3-8所讨论的那些相同。

使用约25mg的冷冻组织制备匀浆物并以1∶4稀释。在Glomax^TM多重检测系统(Promega)中以相对发光单位RLU测定转录本的量。对于每种转录本，全部样品均一式三份分析。背景测定(无模板)同样一式三份测试.以样品RLU值的下限减去背景来计算分析。使用公式log₂ a RLU-log₂ h RLU计算输入RNA，其中a是靶融合转录本，h是看家转录本。

数据分析包括以下步骤：

a)对三份分析建立CV(变异系数)，如果≤15％则可接受。

c)由三份背景RLU值建立下限(l)。

d)由(a)减去下限(l)。

e)计算log2 a RLU-log2 h RLU。

结果汇总：

以上分析结果描绘于图10至18，其包括log₂ a RLU-log₂ h RLU对样品号的曲线。还描绘了每种转录本结果确定的各个ROC(接收器操作特性)曲线。

虽然有一些转录本能区分良性与恶性睾丸组织，而其它证实了精原细胞瘤与非精原细胞瘤和/或良性睾丸组织的肿瘤类型之间的区别。因此可以预期，由各分类来组合转录本将不但有助于检测睾丸癌，而且有助于分类成精原细胞瘤或非精原细胞瘤的亚类。

转录本2：正常组与恶性精原细胞瘤组的均值之间存在统计学显著差异(p＜0.05)(p＝0.02)。其中使用的临界值为1.5621，该临界值由灵敏度100％和特异性100％的ROC曲线结果所证实，曲线下面积1.00表明极好的试验精度。恶性精原细胞瘤与恶性非精原细胞瘤的均值之间亦存在统计学显著差异(p＜0.05)(p＝0.024)。其中使用的临界值为2.1006，该临界值由灵敏度100％和特异性80％的ROC曲线结果所证实，曲线下面积0.90表明极好的试验精度。对于特定应用可以调节所选阈值以增加试验的特异性或灵敏度。

转录本3：正常组与恶性精原细胞瘤组的均值之间存在统计学显著差异(p＜0.05)(p＝0.018)。其中使用的临界值为0.969，该临界值由灵敏度100％和特异性87.5％的ROC曲线结果所证实，曲线下面积0.969表明极好的精度。恶性精原细胞瘤与恶性非精原细胞瘤的均值之间亦存在统计学显著差异(p＜0.05)(p＝0.017)。其中使用的临界值为1.8181，该临界值由灵敏度100％和特异性80％的ROC曲线结果所证实，曲线下面积0.9表明极好的试验精度。对于特定应用可以调节所选阈值以增加试验的特异性或灵敏度。

转录本4：正常组与恶性组的均值之间存在统计学显著差异(p＜0.05)(p＝0.034)。其中使用的临界值为-9.7628，该临界值由灵敏度67％和特异性100％的ROC曲线结果所证实，曲线下面积0.833表明良好的试验精度。对于特定应用可以调节所选阈值以增加试验的特异性或灵敏度。

转录本11：正常组与恶性精原细胞瘤组的均值之间存在统计学显著差异(p＜0.05)(p＝0.016)。其中使用的临界值为0.732，该临界值由灵敏度100％和特异性100％的ROC曲线结果所证实，曲线下面积1.00表明极好的试验精度。恶性精原细胞瘤与恶性非精原细胞瘤的均值之间亦存在统计学显著差异(p＜0.05)(p＝0.016)。其中使用的临界值为0.9884，该临界值由灵敏度100％和特异性80％的ROC曲线结果所证实，曲线下面积0.90表明极好的试验精度。对于特定应用可以调节所选阈值以增加试验的特异性或灵敏度。

转录本12：正常组与恶性精原细胞瘤的均值之间存在统计学显著差异(p＜0.1)(p＝0.056)。其中使用的临界值为1.5361，该临界值由灵敏度100％和特异性87.5％的ROC曲线结果所证实，曲线下面积0.969表明极好的试验精度。恶性精原细胞瘤与恶性非精原细胞瘤的均值之间亦存在统计学显著差异(p＜0.05)(p＝0.044)。其中使用的临界值为1.6039，该临界值由灵敏度100％和特异性80％的ROC曲线结果所证实，曲线下面积0.9表明极好的试验精度。对于特定应用可以调节所选阈值以增加试验的特异性或灵敏度。

转录本13：正常组与恶性组的均值之间存在统计学显著差异(p＜0.05)(p＝0.019)。其中使用的临界值为-9.8751，该临界值由灵敏度87.5％和特异性78％的ROC曲线结果所证实，曲线下面积0.875表明非常良好的试验精度。恶性非精原细胞瘤与良性组的均值之间亦存在统计学显著差异(p＜0.01)(p＝0.000)。其中使用的临界值为-13.9519，该临界值由灵敏度100％和特异性87.5％的ROC曲线结果所证实，曲线下面积0.975表明极好的试验精度。恶性精原细胞瘤与恶性非精原细胞瘤的均值之间亦存在统计学显著差异(p＜0.01)(p＝0.001)。其中使用的临界值为-15.8501，该临界值由灵敏度100％和特异性100％的ROC曲线结果所证实，曲线下面积1.00表明极好的试验精度。对于特定应用可以调节所选阈值以增加试验的特异性或灵敏度。

转录本15：正常组与恶性组的均值之间存在统计学显著差异(p＜0.1)(p＝0.065)。其中使用的临界值为-5.4916，该临界值由灵敏度75％和特异性89％的ROC曲线结果所证实，曲线下面积0.833表明良好的试验精度。对于特定应用可以调节所选阈值以增加试验的特异性或灵敏度。

转录本16：正常组与恶性组包括精原细胞瘤和非精原细胞瘤二者的均值之间存在统计学显著差异(p＜0.05)(p＝0.037)。其中使用的临界值为-6.448，该临界值由灵敏度89％和特异性75％的ROC曲线结果所证实，曲线下面积0.806表明良好的试验精度。正常组与恶性精原细胞瘤的均值之间亦存在统计学显著差异(p＜0.05)(p＝0.037)。其中使用的临界值为-7.4575，该临界值由灵敏度100％和特异性87.5％的ROC曲线结果所证实，曲线下面积0.938表明极好的试验精度。对于特定应用可以调节所选阈值以增加试验的特异性或灵敏度。

转录本20：正常组与恶性精原细胞瘤的均值之间存在统计学显著差异(p＜0.01)(p＝0.006)。其中使用的临界值为1.8364，该临界值由灵敏度100％和特异性100％的ROC曲线结果所证实，曲线下面积1.00表明极好的试验精度。恶性精原细胞瘤与恶性非精原细胞瘤的均值之间亦存在统计学显著差异(p＜0.01)(p＝0.004)。其中使用的临界值为1.6065，该临界值由灵敏度100％和特异性100％的ROC曲线结果所证实，曲线下面积1.00表明极好的试验精度。对于特定应用可以调节所选阈值以增加试验的特异性或灵敏度。

结论：

以上结果说明了转录本2，3，4，11，12，13，15，16和20在检测睾丸癌和睾丸癌亚型以及区分恶性与正常睾丸组织中的应用。转录本2亦发现可用于检测前列腺，乳腺，结直肠和卵巢癌。转录本3亦发现可用于检测前列腺，乳腺，黑素瘤，结直肠和卵巢癌。转录本4亦发现可用于检测前列腺和结直肠癌。转录本11亦发现可用于检测结直肠，黑素瘤和卵巢癌。转录本12亦发现可用于检测结肠直肠和卵巢癌。转录本15亦发现可用于检测黑素瘤和卵巢癌。转录本16亦发现可用于检测黑素瘤皮肤癌。转录本20亦发现可用于检测结直肠癌，黑素瘤和卵巢癌。列举的9种转录本中的任一种均可单独或者组合作为工具用于临床情况下检测或表征卵巢癌。

在一个方面，本发明提供了一种试剂盒，其用于进行测定组织样品中癌症存在的分析。该试剂盒包括用于进行上述分析法所需要的试剂。特别地，该试剂盒包括一个或多个容器，所述容器包含一种或多种与上文所述转录本1至17以及20相应的杂交探针。可以理解，用于进行该分析法的试剂可包括任何必要的缓冲剂、盐、检测试剂等等。此外，该试剂盒可包括用于获得需要的组织样品的任何必要的样品采集装置、容器等，制备组织样品例如通过匀浆或核酸提取的试剂或者材料，以及用于进行受试者分析。该试剂盒还可包括对照组织或样品以确立或确证患病或未患病组织的可接受的值。

实施例10：融合蛋白的检测

细胞系

在2种人前列腺细胞系中研究融合蛋白的存在。首先是正常前列腺细胞系RWPE-1(ATCC Cat# CRL-11609)，这些细胞在裸鼠中是非致瘤性的，并且通过用组织正常成年人前列腺细胞的人乳头瘤病毒18感染来建立。其次检测瘤细胞系WPE1-NA22(ATCC Cat#CRL-2849)。这些细胞得自RWPE-1细胞，接着暴露于N-甲基-N-亚硝基脲。这些细胞中裸鼠中是致瘤性的，这与其母细胞系RWPE-1不同。

使两种细胞系在Keratinicyte无血清培养基(Invitrogen Cat#17005-042)中生长，培养基补充了牛垂体浸膏和人重组表皮生长因子。使细胞生长到90％汇合度，然后使用TrypLESelect(Invitrogen Cat#12563029)胰蛋白酶消化。然后使用自动计数系统(Invitrogen CountessCat#C10227)对细胞计数，然后将等分样品速冻并在-80℃下保存。

蛋白质提取

使用Qproteome线粒体分离试剂盒(Qiagen Cat#37612)从RWPE1和WPE1-NA22细胞系两者中提取细胞级分。线粒体和细胞质级分均从1x10⁷个细胞中提取。然后使用荧光蛋白分析法(Quant-IT Protein，Invitrogen Cat#Q33211)在Qubit荧光计(Invitrogen Cat#Q32857)上测定来计算蛋白质浓度。

SDS-Page凝胶电泳

针对使用Qproteome线粒体分离试剂盒制备的线粒体和细胞溶质级分进行SDS-Page电泳。使用MES运行缓冲剂(Invitrogen Cat#NP00020)，使20μg蛋白质在4-12％预制(invitrogen Nupage Cat#NP0321)bis-tris凝胶还原凝胶中的各泳道中跑胶。用胶体蓝凝胶染料(Invitrogen Cat#LC6025)将该凝胶染色过夜。结果描绘于图19。下面是显示于图19中的，包含在8个凝胶切片中的每一个预计的蛋白质的大约大小(kD)范围。

1	60-80
		2	50-60
3	40-50
		4	30-40
5	20-30
		6	15-20
7	10-15
		8	3.5-10

LCMS

从胶体蓝染色的1D SDS-PAGE(图19)的每一泳道切取8个凝胶切片，并在凝胶中遵照标准操作法用胰蛋白酶消化。

将消化产物从该凝胶中洗脱并蒸发。将一等份试样注入到LCMS系统(Dionex/LCPackings Ultimate3000，与Thermo LTQ XL orbitrap在线偶联)，在25cm(75um ID)PepMap(Dionex)柱上以流速300ml/min分离，以甲酸为离子配对试剂，线性梯度为110min内以5％MeCN开始到达40％MeCN。在orbitrap中以60000(400Da)的分辨率采集MS光谱，并以低分辨率在线性离子阱中采集MSMS光谱。

使用Thermo Proteome Discoverer处理数据，生成.mgf(mascot通用文件)峰列表文件，将其内部提交给X！Tandem，检索惯用数据库，该数据库包括人蛋白质组(ensembl)和基于前述融合转录本的推测融合蛋白。为了计算假发现率(FDR)，检索的数据库还包括全部蛋白质的反序列。

蛋白质复合物分析

在完成X！Tandem自定义数据库检索后，返回鉴定的蛋白质和融合转录本。通过它们的log(e)⁺值对蛋白质记分，当该低于负1(优选约定蛋白质的log(e)⁺低于负3)时分类为显著。通过来自每种存在于相同凝胶切片中的融合转录本的贡献基因的肽的至少一种的存在度来鉴定融合蛋白。红色显示的是由LC/MS-MS鉴定的肽的蛋白质序列覆盖度。绿色标记为可能是由于试验条件原因而难以观察的肽的的蛋白质序列。最后，以黑色显示的蛋白质序列表示鉴定肽的中性概率。

鉴定融合蛋白的实施例

使用本方法鉴定了许多线粒体融合蛋白。这些融合蛋白中的4种以典型实例描述于下文。

实施例融合蛋白1

图20a说明了与标记为P0026的融合转录本相应的融合蛋白的氨基酸序列，其是在从存在的细胞色素C氧化酶亚基2(CO2)N-端肽ILYMTDEVNDPSLTIK和NADH-泛醌氧化还原酶链3(ND3)C-端肽STPYECGFDPMSP(图20a)的线粒体NA22细胞系的切片7(图19)中鉴定的(log(e)⁺＝-13.2)。

对全部线粒体NA22细胞系凝胶切片.xml数据检索大多数野生型CO2的C-端胰蛋白酶肽IFEMGPVFTL。仅在凝胶切片5(图19)中观察此肽。在用全部凝胶切片检索人(SwissProt)数据库(无融合转录本)后，在线粒体NA22细胞系凝胶切片5中使其进一步通过鉴定CO2野生型(log(e)⁺＝-42.9)(图20b)来确证。

在凝胶切片5和7中观察细胞色素C氧化酶亚基2肽ILYMTDEVNDPSLTIK。表明分子量～25kDa的野生型CO2存在于20-30kDa凝胶切片5中，CO2N-末端的片断存在于凝胶切片7中。来自ND3的胰蛋白酶肽STPYECGFDPMSP仅在凝胶切片7中鉴定到(10-15kDa)，其鉴定了P0026的野生型基因(13kDa)和C-末端。

本文提供了融合转录本P0026、从其中衍生的突变DNA和得到的蛋白质的序列，分别为SEQ ID NO：56、SEQ ID NO：57和SEQ ID NO：58。

实施例融合蛋白2

图21a说明了与线粒体NA22细胞系的融合转录本P0062相应的融合蛋白的氨基酸序列，存在NADH脱氢酶亚基1(ND1)N-端肽KGPNVVGPYGLLQPFADAMK和YDQLMHLLWK以及ATP合成酶亚单位6C-端肽LITTQQWLIK，该融合转录本P0062鉴定为图19所示的切片5(20-30kDa)(log(e)⁺＝-41.2)。所有这三个肽均鉴定于线粒体NA22细胞系凝胶切片5中(图19)，但是由于ND1(YDQLMHLLWK)的大多数C-端肽仅存在于凝胶切片5中，野生型(图21b)和与融合转录本P0062相应的融合蛋白两者的存在是有可能的。

本文提供了融合转录本P0062、从其中衍生的突变DNA和得到的蛋白质的序列，分别为SEQ ID NO：59、SEQ ID NO：60和SEQ ID NO：61。

实施例融合蛋白3

图22说明了与线粒体NA22细胞系的融合转录本P0064相应的融合蛋白的氨基酸序列，从ND1的N-端和NADH脱氢酶亚基2(ND2)C-端肽WAIIEEFTK具有肽KGPNVVGPYGLLQPFADAMK，该融合转录本P0064鉴定为图19所示的切片4(log(e)+＝-22)。在凝胶切片4中未观察到ND1C-端肽YDQLMHLLWK，并且根据P0064和ND2的期待大小表明凝胶切片4包含P0064和ND2。

本文提供了融合转录本P0064、从其中衍生的突变DNA和得到的蛋白质的序列，分别为SEQ ID NO：62、SEQ ID NO：63和SEQ ID NO：64。

实施例融合蛋白4

图23a说明了与线粒体NA22细胞系的融合转录本P0176相应的融合蛋白的氨基酸序列，从ND1的N-端细胞色素C氧化酶亚基1(CO1)C-端肽VFSWLATLHGSNMK以及VLMVEEPSMNLEWLYGCPPPYHTFEEPVYMK具有肽KGPNVVGPYGLLQPFADAMK，该融合转录本P0176鉴定为图19所示的切片4(log(e)+＝-33.8)。两个CO1肽仅在线粒体NA22细胞系的凝胶切片4(30-40kDa)中一起观察到，尽管期望的大小是55kDa。这进一步通过在用全部凝胶切片检索人(SwissProt)数据库(无融合转录本)后才在线粒体NA22细胞系鉴定了CO1野生型(log(e)⁺＝-14.6)(图23b)得以确证。

仅在凝胶切片4中观察到的ND1肽是KGPNVVGPYGLLQPFADAMK，由于不存在ND1C-端肽YDQLMHLLWK，在该切片中不存在野生型ND1，这支持了P0176的存在。

本文提供了融合转录本P0176、从其中衍生的突变DNA和得到的蛋白质的序列，分别为SEQ ID NO：65、SEQ ID NO：66和SEQ ID NO：67。

相应的融合转录本

与这四种融合蛋白的每一种有关的融合转录本的定量测定是在一系列细胞系中进行的，在这些细胞系中，两种用于LC-MS/MS试验，尤其是RWPE-1和WPE1-NA22，其是具有低侵袭潜能的恶性细胞系。这些测定的结果示于图24a-24d，与上文讨论的四种蛋白质相对应。在图24a-d中，细胞系RWPE-1标为NO，细胞系WPE1-NA22表为LI。本试验中包括的其它细胞系代表了一种具有中度侵袭潜能(MI)、高度侵袭潜能(HI)和极高度侵袭潜能(VH)的恶性的连续进程。

将细胞溶解，并在本文或先前PCT申请PCT/CA2009/000351(公开号WO 2009/117811)中所述分支DNA平台上使用对每种融合转录本具有特异性的定制探针进行分析，该PCT/CA2009/000351的全部内容通过引用并入本文。结果显示出高水平的表达(RLU值的范围为10⁶-10⁸)。每种融合转录本的量中观察到的一般趋势在于，从正常细胞到恶性细胞的初始转化(NO-LI)是由转录本量的显著变化、接着是由从LI到VH)发生的恶性进程的量的连续增加或连续减少所强调的。

虽然本发明参照某些具体实施方案进行了描述，其各种变形对于本领域技术人员而言是显而易见的，而不会脱离所附权利要求所列的本发明的目的和范围。本文提供的任何实施例仅包括说明本发明的目的，而不是以任何方式限制本发明。本文提供的任何附图仅是为了说明本发明的各个方面，而不是以任何方式划定范围或限制发明。本文引述的全部现有技术的公开文献以其全部内容通过引用并入本文。

文献

下列参考文献以及其它被引用于前述说明书中。这些参考文献的整体内容以引用的方式并入本文。

Claims

1.一种分离的线粒体融合蛋白，该蛋白质具有的氨基酸序列得自与线粒体DNA中的突变相应的线粒体融合转录本的翻译，其中所述融合蛋白是SEQ ID NO：58所述的氨基酸序列。

2.一种分离的线粒体融合转录本，其是SEQ ID NO：56所述的核酸序列。

3.编码权利要求2的融合转录本的分离的mtDNA。

4.权利要求3的分离的mtDNA，其是SEQ ID NO：57所述的序列。

5.具有与权利要求2的线粒体融合转录本的至少一部分互补的核酸序列的杂交探针在制备用于分析哺乳动物的组织样品中与癌症有关的至少一种线粒体融合蛋白转录本的存在以及用于检测哺乳动物癌症的试剂盒中的用途，所述部分包含编码剪接基因的连接点的核酸，其中该癌症是前列腺癌。