CN107011428A

CN107011428A - 异常线粒体dna、相关的融合转录物及其杂交探针

Info

Publication number: CN107011428A
Application number: CN201710183734.1A
Authority: CN
Inventors: 瑞安·帕尔; 布赖恩·赖古伊; 加布里埃尔·达库波; 珍妮弗·克里德; 凯丽·鲁滨逊
Original assignee: Mdna Life Sciences Ltd
Current assignee: Mdna Life Sciences Ltd
Priority date: 2008-03-28
Filing date: 2009-03-27
Publication date: 2017-08-04
Anticipated expiration: 2029-03-27
Also published as: KR101693387B1; AU2009227935A1; EP2274426B1; CN102388140A; SG192453A1; CN102388140B; CN102016039A; KR20110004860A; US20170152567A1; KR20170004033A; CN102016039B; US20110172113A1; CA3044262C; SG174514A1; US20190382846A1; CA3044262A1; US20130059299A1; CA2719718C; KR101819852B1; AU2009227935B2

Abstract

本发明提供了异常线粒体DNA、相关的融合转录物及其杂交探针。本发明提供用于预测、诊断和/或监测癌症的新型线粒体融合转录物和亲代突变的mtDNA分子。本发明还提供在本发明的方法中使用的和它们互补的杂交探针。

Description

异常线粒体DNA、相关的融合转录物及其杂交探针

本申请是申请日为2009年3月27日，申请号为200980114773.X，发明名称为“异常线粒体DNA、相关的融合转录物及其杂交探针”的发明专利申请的分案申请。

技术领域

本发明涉及线粒体基因组领域。在一个方面中，本发明涉及线粒体基因组融合转录物和杂交至所述线粒体基因组融合转录物的探针的鉴定和使用。

背景技术

线粒体基因组

线粒体基因组是紧凑但却至关重要的核酸序列。与33亿核酸碱基对(bp)的庞大核基因组(单倍体)相反，线粒体DNA或“mtDNA”包含16,569个bp的小基因组(Anderson等人，1981；Andrews等人，1999)。其遗传互补体比核细胞配对物小得多(0.0005％)。然而，个体细胞带有10³至10⁴中任意数目的线粒体，这取决于特定的细胞功能(Singh和Modica-Napolitano 2002)。在细胞核和线粒体基因组之间一般存在通讯或化学信号转导(Sherratt等人，1997)。而且，特定的细胞核组分负责线粒体序列的维持和完整性(Croteau等人，1999)。一旦发生受精，由于卵细胞中线粒体的克隆扩充，给定个体中所有mtDNA基因组是相同的。然而，诱变事件可引起反映为体细胞突变的序列多样性。这些突变可在全身的不同组织中在已知为异质性的条件下累积。

线粒体蛋白质组

需要约3,000种核基因来构建、操作和维持线粒体，其中只有37种由线粒体基因组编码，这表明了线粒体对核基因座的严重依赖。线粒体基因组编码24个基因的互补体，包括确保对于电子转移来说重要的其它13个基因的正确翻译的2个rRNA和22个tRNA(参见图1)。除了13种由线粒体基因组供应的多肽，线粒体基因组依赖于70种核编码蛋白以完成对于该重要功能而言必需的氧化和还原反应。核和线粒体蛋白形成跨越内线粒体膜的复合体，并且总体上产生80-90％的细胞代谢所需要的化学燃料腺苷三磷酸或ATP。除了产生能量，线粒体在其他代谢途径中也起到了重要作用。线粒体的重要功能是介导细胞死亡或凋亡(参见Green和Kroemer，2005)。实质上，存在渗透外线粒体膜或另外也渗透内线粒体膜的信号途径。当特定的线粒体蛋白释放到细胞溶胶中时，启动了不可逆的细胞死亡。该过程强调了一些线粒体蛋白具有的多功能作用。这些多任务(multi-tasking)蛋白表明还存在其他可具有替换功能的线粒体蛋白。

线粒体融合转录物组

线粒体基因组是不同寻常的，因为其是环状无内含子DNA分子。所述基因组散布有在特定长度的序列侧翼的重复模体。这些重复模体之间的序列易于在未被充分理解的情况下缺失。考虑到线粒体基因组中的重复模体的数量，存在许多可能的缺失。最有名的例子是4977“常见缺失”。该缺失和一些据称的病症与疾病相关，并且被认为增加衰老的频率(Dai等人，2004；Ro等人，2003；Barron等人，2001；Lewis等人，2000；Muller-Hocker，1998；Porteous等人，1998)(图4)。在线粒体基因组领域中目前的观点是线粒体缺失物只是通过诸如反应性氧物质之类的试剂和UVR损害线粒体基因组的有害的副产物(Krishnan等人，2008，Nature Genetics)。此外，尽管认识到由于缺少细胞修复所必需的基因序列，因此高水平的mtDNA缺失可对于细胞产生ATP形式的能量的能量产生严重的后果，但是没有预期到这些缺失的线粒体分子可以是下游途径的组分，具有期望的功能作用，并且可能可以更适合被认为是本申请人已经预期的的线粒体的识别的基因的替换天然形式。

mtDNA的序列动力学是重要的诊断工具。mtDNA中的突变通常是正在发生的疾病的初步指示物。例如，已经证实线粒体基因组中的点突变是前列腺中的肿瘤病灶的特征。这种趋势还延伸至和肿瘤组织相邻与远离的表现正常的组织(Parr等人，2006)。这表明线粒体突变在恶性转化途径早期发生。

例如，3.4kb线粒体缺失的频率在识别良性和恶性前列腺组织中具有优异的实用性(Maki等人，2008)。

线粒体融合转录物之前在文献中首先在大豆中报道过(Morgens等人，1984)，然后在患有Kearns-Sayre综合症(罕见的神经肌肉障碍)的两个患者中报道过(Nakase等人，1990)。重要地，这些转录物未被发现和任何人的癌症相关(或未对于和任何人类癌症的相关进行研究)。

发明内容

本发明的目的是提供异常线粒体DNA、及其相关的融合转录物和杂交探针。

依照本发明的方面，提供一种和癌症相关的分离的线粒体融合转录物。

依照本发明的方面，提供一种线粒体融合蛋白，其对应于上述融合转录物，并且具有SEQ ID NO:34至49和52中的任一者所阐述的序列。

依照本发明的另一个方面，提供一种编码本发明的融合转录物的分离的mtDNA。

依照本发明的另一个方面，提供一种杂交探针，其具有和本发明的线粒体融合转录物或者mtDNA中的至少一部分互补的核酸序列。

依照本发明的另一个方面，提供一种检测哺乳动物中的癌症的方法，该方法包括通过使样品和至少一种杂交探针杂交来测定来自所述哺乳动物的组织样品中存在和癌症相关的至少一种线粒体融合转录物，所述至少一种杂交探针具有和根据本发明的线粒体融合转录物中的至少一部分互补的核酸序列。

依照本发明的另一个方面，提供一种检测哺乳动物中的癌症的方法，该方法包括通过使样品和至少一种杂交探针杂交来测定来自所述哺乳动物的组织样品中存在和癌症相关的至少一种异常mtDNA，所述至少一种杂交探针具有和根据本发明的mtDNA中的至少一部分互补的核酸序列。

依照本发明的另一个方面，提供一种用于进行测定以检测哺乳动物中存在癌症的试剂盒，所述试剂盒包含和本发明的融合转录物或者mtDNA中的至少一部分互补的至少一种杂交探针。

依照本发明的另一个方面，提供一种筛选工具，其包含具有10、100或1000种线粒体融合转录物的微阵列以鉴定和癌症相关的那些线粒体融合转录物。

依照本发明的另一个方面，提供一种筛选工具，其包含具有10、100或1000种对应于线粒体融合转录物的线粒体DNA的微阵列以鉴定和癌症相关的那些线粒体DNA。

照本发明的另一个方面，提供一种筛选工具，其包含具有10、100或1000种线粒体融合转录物的多重分支DNA试样以鉴定和癌症相关的那些线粒体融合转录物。

依照本发明的另一个方面，提供一种筛选工具，包含具有10、100或1000种对应于线粒体融合转录物的线粒体DNA的多重分支DNA试样以鉴定和癌症相关的那些线粒体DNA。

附图说明

现在将参照附图仅通过例子的方式来对本发明的实施方案进行说明，其中：

图1是示出线粒体编码基因的示意图。

图2示出由3.4kb缺失的损失调用的前列腺样品中的聚腺苷酰化(polyadenalated)融合转录物。

图3示出由4977kb常见缺失的损失调用的前列腺样品中的聚腺苷酰化融合转录物。

图4示出由线粒体基因组的3.4kb区段的损失调用的乳房样品中的聚腺苷酰化融合转录物。

图5a和5b示出基因剪接之前和之后线粒体DNA区域的例子。

图6a至6g描述了本发明的转录物2、3、8、9、10、11和12在结肠直肠癌肿瘤的鉴定中的结果。

图7a至7d描述了本发明的转录物6、8、10和20在肺癌肿瘤的鉴定中的结果。

图8a至8g描述了本发明的转录物6、10、11、14、15、16和20在黑色素瘤的鉴定中的结果。

图9a至9h描述了本发明的转录物1、2、3、6、11、12、15和20在卵巢癌的鉴定中的结果。

图10a-图10b至图18a-图18b描述了本发明的转录物2、3、4、11、12、13、15、16和20在睾丸癌的鉴定中的结果。

具体实施方式

发明详述

本发明提供用于预测、诊断和/或监测癌症的新型线粒体融合转录物和亲代突变的mtDNA分子。本发明还提供用于融合转录物和相关的mtDNA分子检测的杂交探针以及这种探针的用途。

定义

除非另外定义，本文中使用的所有技术和科技术语具有和本发明所属领域中的普通技术人员的通常理解相同的意思。

如本文中所使用的，“异常”或“突变”包括野生型线粒体DNA序列中的任何修饰，所述修饰导致形成融合转录物，并且包括但不限于插入、易位、缺失、复制、重组、重排或其组合。

如本文中所定义的，“生物样品”是指含有这样的细胞的组织或体液，从该细胞中可以获得目标分子。例如，生物样品可衍生自组织，例如前列腺、乳房、结肠直肠、肺和皮肤，或衍生自血液、唾液、脑脊液、痰、尿液、黏液、滑液、腹膜液、羊水等。生物样品可以是外科手术样本或活组织检查样本。生物样品可以以得自来源直接使用或者在进行预处理以改变样品的特征后使用。因此，生物样品可以(例如)通过下列方式在使用前进行预处理：从血液中制备血浆或血清、分裂细胞、从固体材料中制备液体、稀释粘性流体、过滤液体、蒸馏液体、浓缩液体、灭活干扰组分、添加试剂等。

“连续”转录物是从剪接的基因的开端到末端都保持阅读框的融合转录物。“末端”转录物是在另一剪接的基因的起始终止密码子前导致形成提前终止密码子的融合转录物。

如本文中所使用的，“线粒体DNA”或“mtDNA”是线粒体中存在的DNA。

如本文中所使用的，表述“线粒体融合转录物”或“融合转录物”是指由于突变的线粒体DNA序列的转录而产生的RNA转录产物，其中这种突变可包括线粒体缺失和其他大量线粒体DNA重排。

计算机分析和序列靶向

如上所讨论的，线粒体融合转录物已经在大豆中报道过(Morgens等人，1984)，并在患有罕见的神经肌肉障碍的人中报道过(Nakase等人，1990)。然而，并未描述和人类癌症相关的融合转录物。

使用从对和癌症相关的人线粒体基因组的大量缺失进行作图、对高频率的这些缺失进行观察、和转录活性的突变的mtDNA分子的另一种有机体与另一种疾病类型中的证据获得的知识，申请人假设由于其涉及癌症，因此这些缺失可比DNA分子、以及损害和修复过程重要。为了验证该假设，进行线粒体基因组的计算机分析，特定于重复元件，这表明了许多潜在的缺失位点。在鉴定具有非邻近或非串联位置的线粒体序列中的独特重复的这种初始步骤后，使用过滤器以鉴定那些重复，在引发DNA分子中的缺失事件后，那些重复将可能重新闭合或重新连接以产生具有可读框(ORF)的融合的DNA序列。然后选择18个分子的亚型进行靶向以调查是否：1)它们以人的自然生物状态存在；和2)它们和恶性肿瘤相关。这些研究的结果在下文中描述。

基因组突变

线粒体DNA(mtDNA)动力学是重要的诊断工具。mtDNA中的突变通常是正在发生的疾病的初步指示物，并且起到指示和疾病发作有关的危险因素的生物标记的作用。根据本发明，线粒体基因组中的大量重排突变导致产生给癌症相关的融合转录物。因此，提供编码这种转录物的mtDNA和导向其的探针在检测、诊断和监测癌症中的用途。

本领域普通技术人员将意识到，本发明的方法中使用的mtDNA分子可通过分离天然存在的突变体而衍生到，或可基于本文中所述的任何融合转录物的互补序列。示例性mtDNA序列和融合转录物在申请人的美国优先权申请No.61/040,616中有所公开，其通过引用的方式全部并入本文中。

突变基因组序列的检测

根据本发明的突变mtDNA序列可包含导致产生融合转录物的任何修饰。这些修饰的非限制性例子包括插入、易位、缺失、复制、重组、重排或其组合。尽管修饰或改变的大小可以在从只有几个碱基到数千碱基之间变化很大，但是优选地，修饰导致大量缺失或其他大量基因组异常。

提取DNA以检测存在这种突变可使用本领域已知的方法来进行，然后对线粒体基因组的全部或区域进行扩增，并且可包括线粒体基因组的测序，如Current Protocols inMolecular Biology中所描述。可选择地，可以使用粗组织匀浆以及不需要对特定目标片段进行扩增的技术。

检测突变的步骤可选自本领域普通技术人员已知的任何技术。例如，分析mtDNA可包括：通过分支DNA选择靶、对mtDNA进行测序、通过PCR扩增mtDNA、Southern、Northern、Western South-Western印迹杂交、变性HPLC、杂交至微阵列、生物芯片或基因芯片、分子标记分析、生物传感器、熔融温度特性或上述任何的组合。

可以使用对线粒体DNA进行测序的任何合适的方式。优选地，在测序前mtDNA通过PCR进行扩增。PCR的方法是本领域所熟知的，并且可如Mullis and Faloona，1987，MethodsEnzymol.，155:335中所述那样进行。PCR产物可直接进行测序，或克隆到载体中，然后置于细菌宿主中。DNA测序方法的例子在下列文献中找到：Brumley,R.L.Jr.和Smith，L.M.，1991，Rapid DNA sequencing by horizontal ultrathin gel electrophoresis，NucleicAcids Res.19:4121-4126；和Luckey,J.A.,等人，1993，High speed DNA sequencing bycapillary gel electrophoresis，Methods Enzymol.218:154-172。PCR和mtDNA测序的联合使用在Hopgood,R.，等人，1992，Strategies for automated sequencing of humanmtDNA directly from PCR products,Biotechniques 13:82-92和Tanaka,M.等人，1996，Automated sequencing of mtDNA，Methods Enzymol.264:407-421中找到。

选择合适的序列以制备各种引物的方法也是本领域已知的。例如，所述引物可以使用常规固相合成法、利用市售设备来制备，例如所述市售设备得自Applied BiosystemsUSA Inc.(Foster City,California)、DuPont,(Wilmington,Del.)或Milligen(Bedford,Mass.)。

根据本发明的方面，为了确定候选物基因组序列，首先鉴定序列缺失的连接点。序列缺失主要通过在待在5’和3’端缺失的序列侧翼的直接和间接重复元件而鉴定。从基因组中除去一段核苷酸、接着连接基因组导致新型连接点的形成。

在鉴定连接点后，为了鉴定剪接的基因，测定在连接点侧翼的基因的核苷酸。典型地，剪接的基因包含来自第一基因的起始密码子和第二基因的终止密码子，并且可表达为连续的转录物，即从剪接的基因的开端到末端都保持阅读框的转录物。还可能的是，可以使用所述基因序列内含有的替换起始或终止密码子，如本文中所公开的SEQ ID No:2和SEQID No:17所证明。表1中提供一些已知的线粒体缺失，所述线粒体缺失被发现当重排的序列在间接位点重新接合时具有可读框(ORF)。

下面提供本发明的方法中使用的示例性mtDNA分子，其已经被证实在实验室中存活。这些mtDNA基于已知线粒体基因组(SEQ ID NO:1)的修饰，并且已经被指派融合或“FUS”的称号，其中A:B表示第一剪接的基因的最后线粒体核苷酸和第二剪接的基因的第一线粒体核苷酸之间的连接点。括号中提供剪接的基因的鉴定，接着是对应的序列识别号。如下面所提供的，(AltMet)和(OrigMet)分别是指替换和初始翻译的起始位点。

FUS 8469:13447(AltMet)(ATP合酶F0亚单位8至NADH脱氢酶亚单位)(SEQ ID No:2)

FUS 10744:14124(NADH脱氢酶亚单位4L(ND4L)至NADH脱氢酶亚单位5(ND5))(SEQID No:3)

FUS 7974:15496(细胞色素c氧化酶亚单位II(COII)至细胞色素b(Cytb))(SEQ IDNo:4)

FUS 7992:15730(细胞色素c氧化酶亚单位II(COII)至细胞色素b(Cytb))(SEQ IDNo:5)

FUS 8210:15339(细胞色素c氧化酶亚单位II(COII)至细胞色素b(Cytb))(SEQ IDNo:6)

FUS 8828:14896(ATP合酶F0亚单位6(腺苷三磷酸酶6)至细胞色素b(Cytb))(SEQID No:7)

FUS 10665:14856(NADH脱氢酶亚单位4L(ND4L)至细胞色素b(Cytb))(SEQ ID No:8)

FUS 6075:13799(细胞色素c氧化酶亚单位I(COI)至NADH脱氢酶亚单位5(ND5))(SEQ ID No:9)

FUS 6325:13989(细胞色素c氧化酶亚单位I(COI)至NADH脱氢酶亚单位5(ND5))(SEQ ID No:10)

FUS 7438:13476(细胞色素c氧化酶亚单位I(COI)至NADH脱氢酶亚单位5(ND5))(SEQ ID No:11)

FUS 7775:13532(细胞色素c氧化酶亚单位II(COII)至NADH脱氢酶亚单位5(ND5))(SEQ ID No:12)

FUS 8213:13991(细胞色素c氧化酶亚单位II(COII)至NADH脱氢酶亚单位5(ND5))(SEQ ID No:13)

FUS 9191:12909(ATP合酶F0亚单位6(腺苷三磷酸酶6)至NADH脱氢酶亚单位5(ND5))(SEQ ID No:14)

FUS 9574:12972(细胞色素c氧化酶亚单位III(COIII)至NADH脱氢酶亚单位5(ND5))(SEQ ID No:15)

FUS 10367:12829(NADH脱氢酶亚单位3(ND3)至NADH脱氢酶亚单位5(ND5))(SEQID No:16)

FUS 8469:13447(OrigMet)(ATP合酶F0亚单位8至NADH脱氢酶亚单位)(SEQ IDNo:17)

FUS 9144:13816((ATP合酶F0亚单位6(腺苷三磷酸酶6)至NADH脱氢酶亚单位5(ND5))(SEQ ID No:51)

本发明还提供这些序列的变体或片段在预测、诊断和/或监测癌症中的用途。

如本文中所使用的，“变体”是指区别于本发明的mtDNA序列、但是保持其基本性能的核酸。通常，变体和选择的mtDNA序列总的来说非常类似，并且在许多区域中相同。具体而言，本发明的变体包含剪接的基因的连接点的核苷酸中的至少一种，并且还可包含与其相邻的一种或多种核苷酸。在本发明的一个实施方案中，变体序列和本发明的mtDNA序列或其互补链中的任一者至少80％、85％、90％、95％、96％、97％、98％或99％相同。

在本发明中，“片段”是指为公开的基因组序列或其互补链的一部分的短核酸序列。该部分包括包含剪接的基因的连接点的核苷酸中的至少一者，并且还可包含与其相邻的一种或多种核苷酸。本发明的片段的长度优选至少约15nt，更优选至少约20nt，还更优选至少约30nt，甚至更优选至少约40nt、至少约50nt、至少约75nt或至少约150nt。例如，片段的“长度至少20nt”旨在包括上面列出的mtDNA序列中的任一者的20或更多个连续的碱基。在上下文中，“约”包括在一个末端或两个末端处的特定引述的值、大于或小于数个(5、4、3、2或1)核苷酸的值。这些片段具有的用途包括但不限于作为本文中所讨论的诊断探针和引物。当然，也涵盖更大的片段(例如50、150、500、600、2000个核苷酸)。

因此，在本发明的特定实施方案中，mtDNA序列选自由下列序列及其片段或变体构成的组：

SEQ ID NO:2(FUS 8469:13447；AltMet)

SEQ ID NO:3(FUS 10744:14124)

SEQ ID NO:4(FUS 7974:15496)

SEQ ID NO:5(FUS 7992:15730)

SEQ ID NO:6(FUS 8210:15339)

SEQ ID NO:7(FUS 8828:14896)

SEQ ID NO:8(FUS 10665:14856)

SEQ ID NO:9(FUS 6075:13799)

SEQ ID NO:10(FUS 6325:13989)

SEQ ID NO:11(FUS 7438:13476)

SEQ ID NO:12(FUS 7775:13532)

SEQ ID NO:13(FUS 8213:13991)

SEQ ID NO:14(FUS 9191:12909)

SEQ ID NO:15(FUS 9574:12972)

SEQ ID NO:16(FUS 10367:12829)

SEQ ID NO:17(FUS 8469:13447；OrigMet)

SEQ ID NO:51(FUS 9144:13816)，和

其片段和变体。

探针

本发明的另一个方面提供能够识别本发明的异常mtDNA序列的杂交探针。如本文中所使用的，术语“探针”是指这样的寡核苷酸，由于探针中的至少一个序列和靶区域中的序列互补性，因此所述寡核苷酸和靶核酸中的序列形成双螺旋结构。探针可以根据本领域中已知的方法来进行标记。

在鉴定和特定疾病相关的异常mtDNA后，例如，杂交至寡核苷酸阵列的mtDNA可用于鉴定特定突变，然而，可以使用任何已知的杂交方法。

正如本发明的引物一样，探针可以针对本发明的示例性mtDNA融合分子或者其片段或变体而直接产生。例如，SEQ ID NO:2-17和51中阐述的序列和表1中公开的那些序列可用于设计检测包含目标融合序列的核酸序列的引物或探针。如本领域普通技术人员将理解的，杂交至这些核酸分子的引物或探针可在严格性强的杂交条件或严格性弱的杂交条件下进行，这些条件是本领域普通技术人员已知的，并且在(例如)Current Protocols inMolecular Biology(John Wiley&Sons，New York(1989))，6.3.1-6.3.6中找到。

在本发明的特定实施方案中，本发明的探针含有和包含剪接的基因的连接点的异常mtDNA中的至少一部分互补的序列。该部分包含包括在连接点A:B中的核苷酸中的至少一者，并且还可包含与其相邻的一种或多种核苷酸。就此而言，本发明包括将使用包括在连接点A:B中和/或与其相邻的核苷酸来选择mtDNA分子的任何合适的靶向机理。

本发明涵盖本领域已知的各种类型的探针。例如，探针可以是杂交探针，其和靶核苷酸序列的结合可使用通常的DNA结合染料(例如溴化乙锭、 Green、Gold等)来检测。可选择地，探针可引入一种或多种可检测的标记。可检测的标记是这样的分子或部分，其性能或特性可直接或间接检测，并且被选择为使得探针和其靶序列杂交的能力不受影响。标记核酸序列的方法是本领域熟知的(例如参见Ausubel等人，(1997&updates)Current Protocols in Molecular Biology，Wiley&Sons，New York)。

适用于本发明的探针的标记包括可直接检测的那些，例如放射性同位素、荧光图、化学发光团、酶、胶体颗粒、荧光微粒等。本领域普通技术人员将理解可直接检测的标记可需要附加组分(例如底物、触发试剂、光等)，以能够检测所述标记。本发明还涵盖使用间接检测的标记。

本发明的探针的长度优选至少约15nt，更优选至少约20nt，还更优选至少约30nt，甚至更优选至少约40nt、至少约50nt、至少约75nt或至少约150nt。例如，探针的“长度至少20nt”旨在包括和本发明的mtDNA序列互补的20或更多个连续的碱基。当然，可优选更大的探针(例如50、150、500、600、2000个核苷酸)。

本发明的探针也将杂交至生物样品中的核酸分子，从而使得本发明的方法成为可能。因此，在本发明的一个方面中，提供一种在癌症的检测中使用的杂交探针，其中所述探针和异常mtDNA分子的至少一部分互补。在本发明的另一个方面中，提供一种探针以及这种探针在检测结肠直肠癌、肺癌、乳腺癌、卵巢癌、睾丸癌、前列腺癌和/或黑色素瘤皮肤癌中的用途(或使用方法)。

测定

测量生物样品中异常mtDNA的水平可确定受试者中存在一种或多种癌症。因此，本发明包括用于预测、诊断或监测癌症的方法，该方法包括获得一种或多种生物样品，从所述样品中提取mtDNA，以及通过下列方法测定样品的异常mtDNA：对样品中的一种或多种异常mtDNA序列的量进行定量，然后将检测的量和参照值进行比较。如本领域普通技术人员将理解的，参照值基于是否所述方法寻求预测、诊断或监控癌症。因此，参照值可涉及从随时间采集的一种或多种已知的非癌症生物样品、一种或多种已知的癌症生物样品、和/或一种或多种生物样品中收集的mtDNA数据。

在一个方面中，本发明提供一种检测哺乳动物中的癌症的方法，该方法包括测定来自所述哺乳动物的组织样品中存在上述异常线粒体DNA。本发明还提供这样的方法，该方法包括通过使样品和至少一种杂交探针杂交来测定来自所述哺乳动物的组织样品。如本文中所描述的，探针可针对本发明的突变线粒体DNA序列而产生。

在另一个方面中，本发明提供上述方法，其中所述测定包括：

a)使用至少一种探针来进行杂交反应，以允许所述至少一种探针杂交至互补的异常线粒体DNA序列；

b)通过对杂交至至少一种探针的线粒体DNA的量进行定量，来对所述样品中的所述至少一种异常线粒体DNA序列的量进行定量；以及

c)将所述样品中的线粒体DNA的量和至少一种已知参照值进行比较。

本发明中还包括用于预测、诊断或监测癌症的方法，该方法包括如下所述的诊断成像测定。本发明的诊断测定可容易地适用于高通量。高通量测定提供下列优点：同时和大量处理多种样品会减少筛选多种样品所需要的时间。因此，本发明涵盖在高通量筛选或测定中使用本发明的核苷酸以检测和/或定量多种测试样品中的靶核苷酸序列。

融合转录物

本发明还提供在用于预测、诊断和/或监测癌症的方法中使用的融合转录物和相关的杂交探针的鉴定。本领域普通技术人员将意识到这些分子可通过天然存在的转录物的分离、或可选择地通过根据本发明的方法分离的mtDNA的重组表达而衍生得到。如所讨论地，这些mtDNA典型地包含具有来自第一基因的起始密码子和第二基因的终止密码子的剪接的基因。因此，由其衍生的融合转录物包含和剪接的基因相关的连接点。

融合转录物的检测

天然存在的融合转录物可从生物样品中提取，并且根据本领域已知的任何合适的方法来鉴定，或者可根据实施例中所述的方法来进行。在本发明的一个实施方案中，稳定的聚腺苷酰化融合转录物使用寡(dT)引物(其使用聚-A尾部靶向转录物)、然后使用针对靶转录物设计的引物对进行RT-PCR来鉴定。

下列示例性融合转录物使用这些方法进行检测，并且发现在预测、诊断和/或监测癌症中是有用的，如实施例中所描述。同样，根据本发明的测定和方法，衍生自表1中鉴定的ORF序列的融合转录物可在预测、诊断和/或监测癌症中是有用的。

SEQ ID NO:18(转录物1；8469:13447；AltMet)

SEQ ID NO:19(转录物2；10744:14124)

SEQ ID NO:20(转录物3；7974:15496)

SEQ ID NO:21(转录物4；7992:15730)

SEQ ID NO:22(转录物5；8210:15339)

SEQ ID NO:23(转录物6；8828:14896)

SEQ ID NO:24(转录物7；10665:14856)

SEQ ID NO:25(转录物8；6075:13799)

SEQ ID NO:26(转录物9；6325:13989)

SEQ ID NO:27(转录物10；7438:13476)

SEQ ID NO:28(转录物11；7775:13532)

SEQ ID NO:29(转录物12；8213:13991)

SEQ ID NO:30(转录物14；9191:12909)

SEQ ID NO:31(转录物15；9574:12972)

SEQ ID NO:32(转录物16；10367:12829)

SEQ ID NO:33(转录物20；8469:13447；OrigMet)

SEQ ID NO:50(转录物13；9144:13816)。

此外，和本文中所述的那些特征类似的融合转录物也涵盖在临床肿瘤学领域的应用中。

融合转录物还可以通过本领域中已知的重组技术来制备。典型地，该技术包括使用包含目标mtDNA序列的表达载体来转化(包括转染、转导或感染)合适的宿主细胞。

还提供本文中鉴定的融合转录物的变体或片段。这些序列可坚持上面相对于基因组变体和片段而描述的尺寸限制和百分同一性，或者由本领域普通技术人员合适地确定。

另外，下面列出对应于转录物1-16和20的推定的蛋白序列。提供这些编码假设的融合蛋白的序列作为本发明的进一步的实施方案。

SEQ ID NO:34(转录物1)

SEQ ID NO:35(转录物2)

SEQ ID NO:36(转录物3)

SEQ ID NO:37(转录物4)

SEQ ID NO:38(转录物5)

SEQ ID NO:39(转录物6)

SEQ ID NO:40(转录物7)

SEQ ID NO:41(转录物8)

SEQ ID NO:42(转录物9)

SEQ ID NO:43(转录物10)

SEQ ID NO:44(转录物11)

SEQ ID NO:45(转录物12)

SEQ ID NO:46(转录物14)

SEQ ID NO:47(转录物15)

SEQ ID NO:48(转录物16)

SEQ ID NO:49(转录物20)

SEQ ID NO:52(转录物13)

探针

在表征融合转录物后，可以开发引物或探针以在生物样品中靶向转录物。这些引物和探针可使用任何已知的方法(如上述)或下面提供的实施例中所阐述的方法来制备。例如，探针可对于融合转录物而产生，并且检测技术，例如Panomics^TM的QuantiGene 2.0^TM，被用于检测样品中存在转录物。引物和探针可针对本发明的示例性融合转录物或者其片段或变体而直接产生。例如，SEQ ID NO:18-33和50中阐述的序列和表1中公开的那些序列可用于设计检测包含目标融合序列的核酸序列的探针。

如本领域普通技术人员将理解的，设计杂交至本发明的融合转录物的探针含有和表达剪接的基因的连接点的转录物中的至少一部分互补的序列。该部分包括和表达的连接点互补的核苷酸中的至少一者，并且还可包含与其相邻的一种或多种互补核苷酸。就此而言，本发明包括将使用包括在剪接的基因的连接点中和与其相邻的核苷酸来选择融合转录物的任何合适的靶向机理。

本领域中已知的各种类型的探针和标记方法都涵盖以制备转录物探针。这些类型和方法已经相对于基因组序列的检测而在上面描述。本发明的转录物探针的长度优选至少约15nt，更优选至少约20nt，还更优选至少约30nt，甚至更优选至少约40nt、至少约50nt、至少约75nt或至少约150nt。例如，探针的“长度至少20nt”旨在包括和本发明的mtDNA序列互补的20或更多个连续的碱基。当然，可优选更大的探针(例如50、150、500、600、2000个核苷酸)。

在一个方面中，本发明提供一种在癌症的检测中使用的杂交探针，其中所述探针和上面提供的线粒体融合转录物的至少一部分互补。

在另一个方面中，本发明提供一种探针以及这种探针在检测结肠直肠癌、肺癌、乳腺癌、卵巢癌、睾丸癌、前列腺癌或黑色素瘤皮肤癌中的用途(或使用方法)。

测定

测量生物样品中线粒体融合转录物的水平可确定受试者中存在一种或多种癌症。因此，本发明提供用于预测、诊断或监测癌症的方法，该方法包括获得一种或多种生物样品，从所述样品中提取线粒体RNA，以及通过下列方法测定样品的融合转录物：对样品中的一种或多种融合转录物的量进行定量，然后将检测的量和参照值进行比较。如本领域普通技术人员将理解的，参照值基于是否所述方法寻求预测、诊断或监控癌症。因此，参照值可涉及从随时间采集的一种或多种已知的非癌症生物样品、一种或多种已知的癌症生物样品、和/或一种或多种中生物样品收集的转录物数据。

在一个方面中，本发明提供一种检测哺乳动物中的癌症的方法，该方法包括通过使所述样品和至少一种杂交探针杂交来测定来自所述哺乳动物的组织样品中存在本发明的至少一种融合转录物，所述至少一种杂交探针具有和线粒体融合转录物中的至少一部分互补的核酸序列。

a)使用至少一种上述探针来进行杂交反应，以允许所述至少一种探针杂交至互补的线粒体融合转录物；

b)通过对杂交至所述至少一种探针的所述转录物的量进行定量，来对所述样品中的所述至少一种线粒体融合转录物的量进行定量；以及

c)将所述样品中的所述线粒体融合转录物的量和至少一种已知参照值进行比较。

如上所讨论的，本发明的诊断测定还可包含本文中所述的诊断方法和筛选工具，并且可容易地适用于高通量。因此，本发明涵盖在高通量筛选或测定中使用本发明的融合转录物和相关的探针以检测和/或定量多种测试样品中的靶核苷酸序列。

诊断方法和筛选工具

本文中还涵盖了用于诊断特定疾病或鉴定特定线粒体突变的方法和筛选工具。可以使用任何已知的杂交方法来进行这些方法，包括但不限于基于探针/引物的技术，例如分支DNA和qPCR、单重和多重的。还可以使用阵列技术，其具有匹配野生型或突变的区域的寡核苷酸探针和对照探针。市售阵列(例如微阵列)或基因芯片是核实后的。这些阵列在玻片或微芯片上含有数千的匹配的和对照的探针对，并且能够非常迅速地对整个基因组进行测序。描述微阵列在基因组和DNA序列分析中的用途的综述文献在线可得。

设计用于鉴定和给定的生物条件相关的靶的筛选工具可包括和特定疾病或紊乱相关的核酸的特定排列。因此，依照本发明的一个实施方案，提供一种筛选工具，其包含具有10、100或1000种线粒体融合转录物的微阵列以鉴定和一种或多种癌症相关的那些线粒体融合转录物。依照另一个实施方案，提供一种筛选工具，其包含具有10、100或1000种对应于线粒体融合转录物的线粒体DNA的微阵列以鉴定和一种或多种癌症相关的那些线粒体DNA。在进一步的实施方案中，提供一种筛选工具，其包含具有10、100或1000种线粒体融合转录物的多重分支DNA试样以鉴定和一种或多种癌症相关的那些线粒体融合转录物。在本发明的又一个实施方案中，提供一种筛选工具，其包含具有10、100或1000种对应于线粒体融合转录物的线粒体DNA的多重分支DNA试样以鉴定和一种或多种癌症相关的那些线粒体DNA。

在临床肿瘤学领域中有用的方案也涵盖在本文中，并且可包括诊断成像技术，例如正电子成像术(PET)、对比磁共振成像术(MRI)等。这些诊断方法是本领域普通技术人员熟知的，并且可在癌症的诊断和预测中使用。

诊断监测

本发明的方法还可包括基于一种或多种测定的结果而推荐监测制度或治疗路线。这允许临床医生通过监测患者的癌症(例如通过在发生起始或随后的突变时识别)或治疗(例如通过在突变稳定时识别)的进展来实施个性化用药，例如癌症的治疗。

使用手头的序列变异的分界的知识，所述信息可用于诊断癌症前病症或现有癌症病症。此外，通过对连续样品中的异常mtDNA随时间的量进行定量，可以监控癌症病症的进展，例如，为了确定异常是否已经发生改变，可以将通过在一个时间点测定患者的组织以从野生型中检测第一组突变而提供的数据和从随后的测定提供的数据进行比较。

如果在并未产生癌症症状的个体中发现突变，突变可以是产生癌症病症的基因易患性的指示。可基于这样的信息在定性的基础上进一步评价疾病易患性的确定或其存在的诊断，所述信息涉及在患者的家族史中癌症病症的流行性(如果有)和存在其他危险因素(例如暴露于环境因素)，以及是否患者的细胞也携带另一种突变。

生物样品

本发明提供用于诊断的试验，所述试验包括获得或收集一种或多种生物样品。在本发明的上下文中，“生物样品”是指含有这样的细胞的组织或体液，从该细胞中可以获得mtDNA和mtRNA。例如，生物样品可衍生自组织，包括但不限于皮肤、肺、乳房、前列腺、神经、肌肉、心脏、胃、结肠、直肠组织等；或衍生自血液、唾液、脑脊液、痰、尿液、黏液、滑液、腹膜液、羊水等。生物样品可以得自癌症或非癌症组织，并且可以但不限于是外科手术样本或活组织检查样本。

生物样品可以以得自来源直接使用或者在进行预处理以改善样品的特征后使用。因此，生物样品可以(例如)通过下列方式在使用前进行预处理：从血液中制备血浆或血清、分裂细胞、从固体材料中制备液体、稀释粘性流体、过滤液体、蒸馏液体、浓缩液体、灭活干扰组分、添加试剂等。

本领域普通技术人员将理解，在单次时间可以测定多于一种的样品类型(即用于检测多于一种的癌症)。此外，如果需要一段过程的收集，例如用于随着时间监测癌症，可以单独诊断给定样品，或者和在整个试验期间采集的其他样品一起诊断。就此而言，生物样品可以仅采集一次，或者以规则的间隔(两周、一月、半年或一年)采集。

试剂盒

本发明提供用于在临床环境下检测癌症的诊断/扫描试剂盒。这些试剂盒可包括一种或多种取样构件并联合根据本发明的一种或多种探针。

试剂盒可以任选地包括需要用于进行诊断测定的试剂，例如缓冲剂、盐、检测试剂等。试剂盒中也可以包括其他组分，例如用于生物样品的分离和/或处理的缓冲剂和溶液。所述试剂盒的一种或多种组分可冻干，并且所述试剂盒还可包含适于冻干的组分重建的试剂。

如果需要，所述试剂盒还可包含反应容器、混合容器和其他易于制备试样的组件。所述试剂盒还可任选地包括使用说明，其可以以纸的形式或计算机可读形式(例如磁盘、CD、DVD等)提供。

在本发明的一个实施方案中，提供一种用于诊断癌症的试剂盒，其包含取样构件和本发明的杂交探针。

将通过使用下列实施例描述来对本发明的各方面进行说明。本文中提供的实施例仅起到描述本发明的某些特定实施方案的作用，并且并非旨在以任何方式限制本发明的范围。

实施例

实施例1：线粒体融合转录物的检测

本申请人在PCT申请no.PCT/CA 2007/001711(其全部内容通过引用的方式并入)中之前鉴定的线粒体4977“常见缺失“和3.4kb缺失导致具有活性转录物的独特的可读框，如在前列腺组织中通过寡-dT选择所鉴定的(图2和3)。乳房组织样品的检查也揭示出源自3.4kb缺失的稳定的聚腺苷酰化融合转录物的存在(图4)。

用于缺失转录物检测的反转录-PCR方案

RNA分离cDNA合成

遵循制造商的说明并使用Aurum^TM总RNA脂肪和纤维组织试剂盒(Bio-Rad，Hercules，CA)，从速冻前列腺和乳房组织样品(恶性肿瘤和肿瘤附近的正常样品)中分离总RNA。由于在该实验中避免了基因组DNA污染，因此在使用本领域通知的方法的条件下包括NDA酶I处理步骤。使用ND-1000分光光度计( technologies)来测定RNA的数量和质量。从约100g的初始材料中，总RNA浓度从100至1000ng/μl之间变化，并且260/280比在1.89至2.10之间。将RNA浓度调解至100ng/μl，并且遵循制造商的说明，使用用于RT-PCR的Superscript^TM第一链合成系统(Invitrogen)将2μl的各模板用于第一链DNA的合成。为了鉴定稳定的聚腺苷酰化融合转录物，使用寡(dT)引物，其使用聚-A尾部靶向转录物。

PCR

使用5μl的各cDNA模板和iQ^TM Green Supermix(Bio-Rad，Hercules，CA)在DNA Engine2连续荧光检测系统(Bio-Rad，Hercules，CA)上进行实时PCR。靶向4977bp缺失的引物对为：8416F 5'-CCTTACACTATTCCTCATCAC-3'、13637R 5'-TGACCTGTTAGGGTGAGAAG-3'，并且用于3.4kb缺失的引物对为：ND4LF 5'-TCGCTCACACCTCATATCCTC-3'、ND5R 5'-TGTGATTAGGAGTAGGGTTAGG-3'。反应闪烁液(reaction cocktail)包括：2X Green Supermix(100mM KCL，40mM Tris-HCl，pH8.4，0.4mM的各dNTP[dATP、dCTP、dGTP和dTTP]、iTaq^TM DNA聚合酶、50units/ml、6mM MgCl₂、 Green 1、20nM的荧光素和稳定剂)、250nM的各引物、和双蒸水。PCR循环参数如下：(1)95℃2分钟，(2)95℃30秒，(3)55℃(对于4977bp缺失)和63℃(对于3.4kb缺失)30秒，(4)72℃45秒，(5)板读取，接着进行39个循环的步骤3至5，并且最终在4℃下孵育。除了循环阈值和熔融曲线分析，将样品在琼脂糖凝胶上运行以用于扩增产物的特定可视化(参见图2至4)。

图2是示出由线粒体基因组的3.4kb的损失调用的前列腺样品中的聚腺苷酰化融合转录物的琼脂糖凝胶图。图2的说明为：B-空白、泳道1-6为cDNA中检测的转录物；泳道7-12为用于泳道1-6中的样品的无反转录酶(RT)对照。

图3示出由4977kb常见缺失的损失调用的前列腺样品中的聚腺苷酰化融合转录物。图3的说明为：B-空白、泳道1-6为cDNA中检测的转录物；泳道7-12为用于泳道1-6中的样品的无RT对照。

图4示出由线粒体基因组的3.4kb的损失调用的乳房样品中的聚腺苷酰化融合转录物。图4的说明为：泳道2-8为来自乳房cDNA的转录物；泳道9为阴性对照(水)；泳道10和11为用于泳道2和3中的样品的阴性、无RT对照。

这些结果证实存在稳定的线粒体融合转录物。

实施例2：融合产物的鉴定和靶向

设计多种杂交探针以进行检测，并且进一步证实存在源自突变的线粒体基因组(例如3.4kb缺失)的新型转录物。为此，利用用于定量基因表达分析的单重分支DNA平台(QuantiGene 2.0^TM，Panomics^TM)。该实施例中列出的特定缺失和序列基于它们和整个mtDNA基因组(在SEQ ID NO:1中所示)的相对位置。四种转录物(在该实施例中探针被设计用于所述转录物)的核酸序列在本文中被鉴定为如下：转录物1(SEQ ID NO:18)、转录物2(SEQ ID NO:19)、转录物3(SEQ ID NO:20)和转录物4(SEQ ID NO:21)。

使用基因ND4L(NADH脱氢酶亚单位4L)和ND5(NADH脱氢酶亚单位5)产生3.4kb线粒体基因组缺失的连续转录物的例子。具有和SEQ ID NO:19互补的序列的探针被用于检测转录物2。在ND4L中的位置10745-10754和在ND5中的位置14124-14133产生重复元件。

3.4kb缺失导致除去ND4L的3'端、全长ND4基因、tRNA组氨酸、tRNA丝氨酸2、tRNA亮氨酸2和ND5的大部分的5'端(参见图5a)，从而导致ND4L和ND5用连接点10744(ND4L):14124(ND5)进行基因剪接(图5b)。SEQ ID NO:3是以上述方式检测的RNA转录物(SEQ ID NO:19)的互补的DNA序列。

类似地，转录物1是腺苷三磷酸酶8与和位置8469:13447相关的ND5之间的融合转录物(SEQ ID NO:18)。转录物3和4(分别为SEQ ID NO:20和SEQ ID NO:21)是分别和核苷酸位置7974:15496与7992:15730相关的COII与Cytb之间的融合转录物。表3提供了该实施例中使用的各种序列之间的关系的概述。表3包括检测融合转录物和与检测的融合转录物互补的DNA序列。

实施例3：应用于前列腺癌

使用四种融合转录物，即上面讨论的转录物1至4，分析来自一位患者的两种前列腺组织样品以评价新预计的融合转录物的定量差异。试验结果提供在下面的表2中，其中“Homog 1”是指患者的冷冻前列腺肿瘤组织的匀浆，“Homog 2”是指患者的肿瘤附近的冷冻正常前列腺组织的匀浆。这些样品根据生产商的方案( Sample ProcessingKit for Fresh or Frozen Animal Tissues；和2.0Reagent System UserManual)以25.8mg的Homog 1和28.9mg的Homog 2(测定安排示于表5a和5b中)开始进行处理。

明显证实的是和正常附近的前列腺组织相比，前列腺癌组织中存在的线粒体融合转录物增加。尽管水平非常低，但是融合转录物存在于正常组织中。探针杂交至靶转录物而产生的相对发光单位(RLU)直接和各转录物的丰富程度成比例。表2还指出从样品采集的读数的变异系数(CV，表示为％CV)。CV包含标准偏差除以平均值。这种在癌症组织中稳定地转录的线粒体基因产物的显著性暗示着疾病演变和发展。

实施例4：应用于乳腺癌

使用和实施例3相同的方案，但只集中于转录物2，和3.4kb线粒体基因组缺失有关的新型融合转录物，分析两种乳房肿瘤组织样品和两种这些肿瘤附近的无肿瘤组织的样品、以及三种前列腺肿瘤组织样品、一种包含附近的无肿瘤组织的样品。表4中提供了该实施例的结果。具有相应的正常组织切片的前列腺肿瘤组织样品证实和在实施例3中分析的前列腺样品类似的图案，因为较之正常附近的组织，肿瘤组织具有约2倍量的融合转录物。当和附近的无肿瘤组织相比时，乳房肿瘤样品证实融合转录物水平显著地增加。使用以1:100稀释的匀浆进行该分析，因为其在实施例3所引用的试验中最可再生地进行。

因此，上面讨论的结果表明了本发明的转录物在前列腺和乳房组织的肿瘤的检测中的应用。

实施例5：应用于结肠直肠癌

该研究旨在确定本发明的一些转录物在检测结肠直肠癌中的有效性。总共制备19种样品，包括9种对照(良性)组织样品(样品1至9)和10种肿瘤(恶性)组织样品(样品10至19)。将样品根据生产商的建议( Sample Processing Kit for Fresh orFrozen Animal Tissues；和Quantigene 2.0Reagent System User Manual)进行均质化。按照前面实施例中列出的方式制备7种靶转录物和1种持家转录物。转录物的特性概述如下：

表7：乳腺癌转录物的特性

应注意，转录物2和3和上面涉及实施例3和4所讨论的那些相同。

使用约25mg的来自OCT块的组织制备匀浆，对于转录物2和4以1:1稀释，对于转录物10和11以1:8稀释。在Glomax^TM多检测系统(Promega)上测量转录物的量(相对荧光单位RLU)。对于每种转录物，所有样品测定3次。也进行3次背景测量(无模板)。通过从样品的RLU值中减去下限来分析计算背景。通过使用式log₂ a RLU-log₂ h RLU来计算输入RNA，其中a是靶融合转录物，并且h是持家转录物。

数据分析包括下列步骤：

a)确定三次测定的CV(变异系数)，如果≤15％则可接受。

b)确定靶融合转录物(a)和持家转录物(h)三次测定的平均RLU值。

c)从背景RLU的三个值中确定下限(I)。

d)从(a)中减去下限(I)。

e)计算log₂ a RLU-log₂ h RLU。

结果概述：

上述分析的结果示于图6a至6g中，其包括log₂ a RLU-log₂ h RLU对样品数的图。还示出从各转录物的结果中确定的各ROC(接受者工作特征)曲线。

转录物2：在正常组(p<0.10)和恶性组(p>0.09)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的3.6129的截断值导致灵敏度为60％，特异度为89％，曲线下面积为0.73，这表明一般的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。

转录物3：在正常组(p<0.05)和恶性组(p＝0.03)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的4.0813的截断值导致灵敏度为60％，特异度为78％，曲线下面积为0.79，这表明一般至良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。

转录物8：在正常组(p<0.1)和恶性组(p＝0.06)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的-6.0975的截断值导致灵敏度为60％，特异度为89％，曲线下面积为0.76，这表明一般的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。

转录物9：在正常组(p<0.1)和恶性组(p＝0.06)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的-7.5555的截断值导致灵敏度为60％，特异度为89％，曲线下面积为0.76，这表明一般至良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。

转录物10：在正常组(p<0.01)和恶性组(p＝0.01)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的-3.8272的截断值导致灵敏度为90％，特异度为67％，曲线下面积为0.84，这表明良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。

转录物11：在正常组(p<0.1)和恶性组(p＝0.06)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的3.1753的截断值导致灵敏度为70％，特异度为78％，曲线下面积为0.76，这表明一般至良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。

转录物12：在正常组(p<0.1)和恶性组(p＝0.06)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的3.2626的截断值导致灵敏度为70％，特异度为78％，曲线下面积为0.76，这表明一般至良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。

结论：

上述结果示出转录物2、3、8、9、10、11和12在结肠直肠癌的检测和辨别恶性与正常结肠直肠组织中的实用性。如上所讨论的，还发现转录物2和3具有在前列腺癌检测中的实用性。还发现转录物2具有在乳腺癌检测中的实用性。还发现转录物11具有在黑色素瘤皮肤癌检测中的实用性。还发现转录物10具有在肺癌和黑色素瘤检测中的实用性。还发现转录物8具有在肺癌检测中的实用性。所述7种转录物中的任一种可以单独或联合用作在临床环境下检测结肠直肠癌的特征的工具。

实施例6：应用于肺癌

该研究旨在确定本发明的一些转录物在检测肺癌中的有效性。如实施例5中那样，将9种对照(良性)组织样品(样品1至9)和10种肿瘤(恶性)组织样品(样品10至19)。根据生产商的建议( Sample Processing Kit for Fresh or Frozen AnimalTissues；和Quantigene 2.0Reagent System User Manual)进行均质化。将匀浆以1:8稀释，并且在Glomax^TM多检测系统(Promega)上测量4种靶转录物和1种持家转录物的量(相对荧光单位RLU)。对于每种转录物，所有样品测定3次。也进行3次背景测量(无模板)。

制备下列转录物用于该实施例：

表8：肺癌转录物的特性

该实施例中使用的组织样品具有下列特性：

表9：肺癌样品的特性

样品	恶性	评论(组织来源)
			1	否	间质性肺病
2	否	肺气肿
			3	否	动脉瘤
4	否	支气管肺炎，COPD
			5	否	肝脏中的恶性肿瘤肺部中的起源未知、钙化肉芽肿瘤
6	否	死后12小时尸检，轻度肺气肿
			7	否	死后12小时尸检，大B细胞淋巴瘤，肺水肿，肺炎
8	否	肺炎，水肿，肺泡损害
			9	否	充血和水肿
10	是	腺癌，非小细胞
			11	是	小细胞
12	是	鳞状细胞癌，NSC，肺气肿
			13	是	腺癌，肺癌，nsc，转移性癌
14	是	鳞状细胞癌，非小细胞
			15	是	混合性鳞状癌和腺癌
16	是	非小细胞癌，鳞状
			17	是	小细胞癌
18	是	腺癌，肺癌，nsc
			19	是	腺癌，肺癌，nsc，转移性癌

根据实施例5中所述的方法来进行数据分析。结果示于图7a、7b、7c和7d中。

结果概述：

转录物6：在正常组(p＜0.1)和恶性组(p＝0.06)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的-6.5691的截断值导致灵敏度为80％，特异度为71％，曲线下面积为0.77，这表明一般的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。

转录物8：在正常组(p＜0.05)和恶性组(p＝0.02)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的-9.6166的截断值导致灵敏度为90％，特异度为86％，曲线下面积为0.86，这表明良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。

转录物10：在正常组(p＜0.01)和恶性组(p＝0.01)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的-10.6717的截断值导致灵敏度为90％，特异度为86％，曲线下面积为0.89，这表明良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。

转录物20：在正常组(p＜0.1)和恶性组(p＝0.1)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的2.5071的截断值导致灵敏度为70％，特异度为71％，曲线下面积为0.74，这表明一般的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。

结论：

实施例6的结果示出本发明的转录物6、8、10和20在肺癌肿瘤的检测和辨别恶性与正常肺组织中的实用性。这些转录物中的任一种可用于在临床环境下检测或表征肺癌。

实施例7：应用于黑色素瘤

该研究旨在确定本发明的一些转录物在检测黑色素瘤中的有效性。在该研究中，总共使用14种样品，包括5种对照(良性)组织样品和9种恶性组织样品。将所有样品用福尔马林固定和石蜡包埋(FFPE)。将FFPE组织样品切到管中，并且根据生产商的建议( Sample Processing Kit for FFPE Samples；和Quantigene 2.0 ReagentSystem User Manual)进行均质化，使得在均质化前各样品约20微米。将匀浆以1∶4稀释，并且在Glomax^TM多检测系统(Promega)上测量7种靶转录物和1种持家转录物的量(相对荧光单位RLU)。对于每种转录物，所有样品测定3次。也进行3次背景测量(无模板)。

该实施例中使用的14种组织样品具有下列特性：

表10：黑色素瘤癌样品的特征

样品	恶性	评论(组织来源)
			1	否	乳腺缩小组织(皮肤)
2	否	乳腺缩小组织(皮肤)
			3	否	乳腺缩小组织(皮肤)
4	否	乳腺缩小组织(皮肤)
			5	否	乳腺缩小组织(皮肤)
6	是	恶性雀斑样(黑色素瘤，原位) 不存在侵袭性黑色素瘤
			7	是	侵袭性雀斑样黑色素瘤
8	是	结节性雀斑样黑色素瘤，pT3b，恶性雀斑样痣黑素瘤的有关特征
			9	是	残余浅表扩散性、侵袭性雀斑样黑色素瘤，Clark水平II
10	是	浅表扩散性恶性黑色素瘤，Clark水平II
			11	是	结节性恶性黑色素瘤，Clark水平IV
12	是	浅表扩散性恶性黑色素瘤，原位，没有侵袭性证据
			13	是	浅表扩散性恶性黑色素瘤，Clark水平II，局部存在垂直相
14	是	浅表扩散性恶性黑色素瘤，原位，Clark水平I

为该实施例制备下列转录物：

表11：黑色素瘤癌转录物的特征

如所述，转录物10和11也在实施例5中使用。根据实施例5中描述的方法来进行数据分析。结果示于图8a-8g。

结果概述:

转录物6：在正常组(p<0.01)和恶性组(p＝0.01)的平均值之间存在统计上显著性差异。此外，使用通过ROC曲线证实的-5.9531的截断值导致灵敏度为89％，特异度为80％，曲线下面积为0.96，这表明非常良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。

转录物10：在正常组(p<0.05)和恶性组(p＝0.05)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的-4.7572的截断值导致灵敏度为89％，特异度为40％，曲线下面积为0.82，这表明良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。

转录物11：在正常组(p<0.05)和恶性组(p＝0.02)的平均值之间存在统计上显著性差异。此外，使用通过ROC曲线证实的1.6762的截断值导致灵敏度为78％，特异度为100％，曲线下面积为0.89，这表明良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。

转录物14：在正常组(p<0.05)和恶性组(p＝0.05)的平均值之间存在统计上显著性差异。此外，使用通过ROC曲线证实的-4.9118的截断值导致灵敏度为89％，特异度为60％，曲线下面积为0.82，这表明良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。

转录物15：在正常组(p<0.1)和恶性组(p＝0.07)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的-7.3107的截断值导致灵敏度为100％，特异度为67％，曲线下面积为0.80，这表明良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。

转录物16：在正常组(p<0.05)和恶性组(p＝0.03)的平均值之间存在统计上显著性差异。此外，使用通过ROC曲线证实的-10.5963的截断值导致灵敏度为89％，特异度为80％，曲线下面积为0.878，这表明良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。

转录物20：在正常组(p<0.05)和恶性组(p＝0.04)的平均值之间存在统计上显著性差异。此外，使用通过ROC曲线证实的-8.3543的截断值导致灵敏度为100％，特异度为80％，曲线下面积为0.89，这表明良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。

结论：

实施例7的结果示出本发明的转录物6、10、11、14、15、16和20在恶性黑色素瘤的检测中的实用性。如上所示，还发现转录物10和11具有在结肠直肠癌的检测中的实用性，而转录物6具有在肺癌的检测中的实用性。表6中提供了通过疾病进行的转录物概述。

实施例8：应用于卵巢癌

该研究旨在确定本发明的一些转录物在检测卵巢癌中的有效性。总共制备20种样品，包括10种对照(良性)组织样品(样品1至10)和10种肿瘤(恶性)组织样品(样品11至20)。根据生产商的建议( Sample Processing Kit for Fresh or FrozenAnimal Tissues；和Quantigene 2.0Reagent System User Manual)将样品均质化。以上述实施例中列出的方式制备8种靶转录物和1种持家转录物。

该实施例中使用的20种组织样品具有下列特性：

表12：卵巢癌样品的特性

样品	诊断	评论
			1	正常	卵泡囊肿
2	正常	纤维瘤
			3	正常	卵巢没有病理变化
4	正常	卵泡囊肿
			5	正常	细胞纤维瘤
6	正常	良性卵泡简单囊肿
			7	正常	子宫肌瘤，乳头状体
8	正常	乳头状体和上皮包含性囊肿
			9	正常	乳头状体
10	正常	乳头状体，表面包含性囊肿卵泡囊肿
			11	恶性	高级、较少分化、严重乳突癌，包括网膜
12	恶性	子宫内膜样腺癌，适度分化，并且具有局部严重分化
			13	恶性	严重乳突癌
14	恶性	混合性上皮癌，主要是严重乳突癌
			15	恶性	高度：严重的癌症，乳突和固体生长图案
16	恶性	高度(3/3)严重乳突癌
			17	恶性	严重乳突癌，高度细胞核分化
18	恶性	严重乳突囊肿钳，级别：III
			19	恶性	较少分化、严重乳突癌
20	恶性	适度分化的腺细胞癌，子宫内膜型，级别1

转录物的特性概述如下：

表13：卵巢癌转录物的特性

应注意，转录物1、2、3、6、11、12、15和20和上面涉及实施例3-7而讨论的那些相同。

使用25mg的冷冻组织制备匀浆并以1∶4稀释。在Glomax^TM多检测系统(Promega)上测量转录物的量(相对荧光单位RLU)。对于每种转录物，所有样品测定3次。也进行3次背景测量(无模板)。通过从样品的RLU值中减去下限来分析计算背景。通过使用式log₂ a RLU-log₂ h RLU来计算输入RNA，其中a是靶融合转录物，并且h是持家转录物。

数据分析包括下列步骤：

a)确定三次测定的CV(变异系数)，如果≤15％则可接受。

c)从背景RLU的三个值中确定下限(I)。

d)从(a)中减去下限(I)。

e)计算log₂ a RLU-log₂ h RLU。

结果概述：

上述分析的结果示于图9a至9h中，其包括log₂ a RLU-log₂ h RLU对样品数的图。还示出从各转录物的结果中确定的各ROC(接受者工作特征)曲线。

转录物1：在正常组(p<0.05)和恶性组(p＝0.002)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的-11.1503的截断值导致灵敏度为90％，特异度为80％，曲线下面积为0.91，这表明非常良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。

转录物2：在正常组(p<0.10)和恶性组(p＝0.001)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的0.6962的截断值导致灵敏度为90％，特异度为100％，曲线下面积为0.96，这表明非常良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。

转录物3：在正常组(p<0.01)和恶性组(p＝0.000)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的0.6754的截断值导致灵敏度为100％，特异度为100％，曲线下面积为1.00，这表明优异的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。

转录物6：在正常组(p<0.01)和恶性组(p＝0.007)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的-9.6479的截断值导致灵敏度为90％，特异度为70％，曲线下面积为0.86，这表明良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。

转录物11：在正常组(p<0.01)和恶性组(p＝0.000)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的-1.3794的截断值导致灵敏度为100％，特异度为90％，曲线下面积为0.99，这表明优异的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。

转录物12：在正常组(p<0.01)和恶性组(p＝0.001)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的-1.2379的截断值导致灵敏度为90％，特异度为100％，曲线下面积为0.96，这表明优异的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。

转录物15：在正常组(p<0.05)和恶性组(p＝0.023)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的-8.6926的截断值导致灵敏度为70％，特异度为80％，曲线下面积为0.80，这表明良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。

转录物20：在正常组(p<0.01)和恶性组(p＝0.000)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的0.6521的截断值导致灵敏度为100％，特异度为100％，曲线下面积为0.76，这表明一般至良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。

结论：

上述结果示出转录物1、2、3、6、11、12、15和20在卵巢癌的检测和辨别恶性与正常卵巢组织中的中的实用性。还发现转录物1、2和3具有在前列腺癌的检测中的实用性。还发现转录物6具有在黑色素瘤和肺癌的检测中的实用性。还发现转录物11具有在黑色素瘤皮肤癌、结肠直肠癌和睾丸癌的检测中的实用性。还发现转录物12具有在结肠直肠癌和睾丸癌的检测中的实用性。还发现转录物15具有在黑色素瘤和睾丸癌的检测中的实用性。还发现转录物20具有在结肠直肠癌、黑色素瘤、和睾丸癌的检测中的实用性。所述8种转录物中的任一种可以单独或联合用作在临床环境下检测或表征卵巢癌的工具。

实施例9：应用于睾丸癌

该研究旨在确定本发明的一些转录物在检测睾丸癌中的有效性。总共制备17种样品，包括8种对照(良性)组织样品(样品1至8)和和9种肿瘤(恶性)组织样品(样品9至17)。恶性样品中的5种为非精原细胞瘤(样品9-13)，4种为精原细胞瘤(样品14-17)。根据生产商的建议( Sample Processing Kit for Fresh or Frozen Animal Tissues；和Quantigene 2.0Reagent System User Manual)将样品均质化。以上述实施例中列出的方式制备10种靶转录物和1种持家转录物。

该实施例中使用的17种组织样品具有下列特性：

表14：睾丸癌样品的特性

样品	通常诊断	分层恶性诊断
			1	良性	良性
2	良性	良性
			3	良性	良性
4	良性	良性
			5	良性	良性
6	良性	良性
			7	良性	良性
8	良性	良性
			9	恶性	非精原细胞瘤
10	恶性	非精原细胞瘤
			11	恶性	非精原细胞瘤
12	恶性	非精原细胞瘤
			13	恶性	非精原细胞瘤
14	恶性	精原细胞瘤
			15	恶性	精原细胞瘤
16	恶性	精原细胞瘤
			17	恶性	精原细胞瘤

转录物的特性概述如下：

表15：睾丸癌转录物的特性

转录物ID	连接位点	基因连接
			2	10744：14124	ND4L：ND5
3	7974：15496	COII：Cytb
			4	7992：15730	COII：Cytb
11	7775：13532	COII：ND5
			12	8213：13991	COII：ND5
13	9144：13816	腺苷三磷酸酶6：ND5
			15	9574：12972	COIII：ND5
16	10367：12829	ND3：ND5
			20	8469：13447	腺苷三磷酸酶8：ND5
肽基脯氨酸异构酶B(PPIB)	N/A	N/A

应注意，转录物2、3、4、7、11、12、15、16和20和上面涉及实施例3-8而讨论的那些相同。

数据分析包括下列步骤：

a)确定三次测定的CV(变异系数)，如果≤15％则可接受。

c)从背景RLU的三个值中确定下限(I)。

d)从(a)中减去下限(I)。

e)计算log₂ a RLU-log₂ h RLU。

结果概述：

上述分析的结果示于图10a-图10b至图18a-图18b中，其包括log₂ a RLU-log₂ hRLU对样品数的图。还示出从各转录物的结果中确定的各ROC(接受者工作特征)曲线。

尽管一些转录物辨别良性和恶性睾丸组织，但是其他转录物证实了精原细胞瘤和非精原细胞瘤的肿瘤亚型和/或良性睾丸组织之间的区别。因此预计，联合各类的转录物将不仅促进睾丸癌的检测，还促进将其分类成精原细胞瘤或非精原细胞瘤的亚型。

转录物2：在正常组(p<0.05)和恶性精原细胞瘤组(p＝0.02)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的1.5621的截断值导致灵敏度为100％，特异度为100％，曲线下面积为1.00，这表明优异的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。在恶性精原细胞瘤(p<0.05)和恶性非精原细胞瘤(p＝0.024)的平均值之间也存在统计上显著性差异。使用通过ROC曲线证实的2.1006的截断值导致灵敏度为100％，特异度为80％，曲线下面积为0.90，这表明优异的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。

转录物3：在正常组(p<0.05)和恶性精原细胞瘤组(p＝0.018)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的0.969的截断值导致灵敏度为100％，特异度为87.5％，曲线下面积为0.969，这表明优异的精确度。在恶性精原细胞瘤(p<0.05)和恶性非精原细胞瘤(p＝0.017)的平均值之间也存在统计上显著性差异。使用通过ROC曲线证实的1.8181的截断值导致灵敏度为100％，特异度为80％，曲线下面积为0.9，这表明优异的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。

转录物4：在正常组(p<0.05)和恶性组(p＝0.034)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的-9.7628的截断值导致灵敏度为67％，特异度为100％，曲线下面积为0.833，这表明良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。

转录物11：在正常组(p<0.05)和恶性精原细胞瘤组(p＝0.016)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的0.732的截断值导致灵敏度为100％，特异度为100％，曲线下面积为1.00，这表明优异的检验精确度。在恶性精原细胞瘤(p<0.05)和恶性非精原细胞瘤(p＝0.016)的平均值之间也存在统计上显著性差异。使用通过ROC曲线证实的0.9884的截断值导致灵敏度为100％，特异度为80％，曲线下面积为0.90，这表明优异的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。

转录物12：在正常组(p<0.1)和恶性精原细胞瘤组(p＝0.056)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的1.5361的截断值导致灵敏度为100％，特异度为87.5％，曲线下面积为0.969，这表明优异的检验精确度。在恶性精原细胞瘤(p<0.05)和恶性非精原细胞瘤(p＝0.044)的平均值之间也存在统计上显著性差异。使用通过ROC曲线证实的1.6039的截断值导致灵敏度为100％，特异度为80％，曲线下面积为0.9，这表明优异的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。

转录物13：在正常组(p<0.05)和恶性组(p＝0.019)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的-9.8751的截断值导致灵敏度为87.5％，特异度为78％，曲线下面积为0.875，这表明非常良好的检验精确度。在恶性非精原细胞瘤组(p<0.01)和良性组(p＝0.000)的平均值之间也存在统计上显著性差异。使用通过ROC曲线证实的-13.9519的截断值导致灵敏度为100％，特异度为87.5％，曲线下面积为0.975，这表明优异的检验精确度。在恶性精原细胞瘤(p<0.01)和恶性非精原细胞瘤(p＝0.001)的平均值之间也存在统计上显著性差异。使用通过ROC曲线证实的-15.8501的截断值导致灵敏度为100％，特异度为100％，曲线下面积为1.00，这表明优异的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。

转录物15：在正常组(p<0.1)和恶性组(p＝0.065)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的-5.4916的截断值导致灵敏度为75％，特异度为89％，曲线下面积为0.835，这表明良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。

转录物16：在正常组(p<0.05)和恶性组(包括精原细胞瘤和非精原细胞瘤)(p＝0.037)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的-6.448的截断值导致灵敏度为89％，特异度为75％，曲线下面积为0.806，这表明良好的检验精确度。在正常(p<0.05)和恶性精原细胞瘤(p＝0.037)的平均值之间也存在统计上显著性差异。使用通过ROC曲线证实的-7.4575的截断值导致灵敏度为100％，特异度为87.5％，曲线下面积为0.938，这表明优异的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。

转录物20：在正常组(p<0.01)和恶性精原细胞瘤组(p＝0.006)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的1.8364的截断值导致灵敏度为100％，特异度为100％，曲线下面积为1.00，这表明优异的检验精确度。在恶性精原细胞瘤(p<0.01)和恶性非精原细胞瘤(p＝0.004)的平均值之间也存在统计上显著性差异。使用通过ROC曲线证实的1.6065的截断值导致灵敏度为100％，特异度为100％，曲线下面积为1.00，这表明优异的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。

结论：

上述结果示出转录物2、3、4、11、12、13、15、16和20在睾丸癌和睾丸癌亚型的检测以及辨别恶性和正常睾丸组织中的实用性。还发现转录物2具有在前列腺癌、乳腺癌、结肠直肠癌和卵巢癌的检测中的实用性。还发现转录物3具有在前列腺癌、乳腺癌、黑色素瘤结肠直肠癌和卵巢癌的检测中的实用性。还发现转录物4具有在前列腺癌和结肠直肠癌的检测中的实用性。还发现转录物11具有在结肠直肠癌、黑色素瘤和卵巢癌的检测中的实用性。还发现转录物12具有在结肠直肠癌和卵巢癌的检测中的实用性。还发现转录物15具有在黑色素瘤和卵巢癌的检测中的实用性。还发现转录物16具有在黑色素瘤皮肤癌的检测中的实用性。还发现转录物20具有在结肠直肠癌、黑色素瘤和卵巢癌的检测中的实用性。这些9种转录物中的任一种可在临床环境下单独或联合用作检测或表征睾丸癌的工具。

在一个方面中，本发明提供一种试剂盒，其进行测定以确定组织样品中存在癌症。所述试剂盒包括进行上述测定所需要的试剂。特别地，试剂盒包括一种或多种容器，所述容器含有一种或多种对应于上述转录物1至17和20的杂交探针。将理解，用于进行测定的试剂可包括任何必需的缓冲盐、盐、检测试剂等。此外，试剂盒可包括任何必需的样品收集装置、容器等以获得需要的组织样品、试剂或材料，从而通过(例如)均质化或核酸提取来制备组织样品，或为了进行受试者的测定或测定。试剂盒还可包括对照组织或样品以建立或确认用于疾病或非疾病组织的可接受的值。

尽管已经参照某些特定实施方案来说明了本发明，但是其各种改变对于本领域普通技术人员来说是显而易见的，只要其不偏离在所附权利要求书中所列出的本发明的精神和范围即可。在本申请中提到的所有的文件(文章、手册、专利申请等)都通过引用的方式并入本文。

参考文献目录

其中，下列文献在上述说明中引用。这些文献的全部内容都通过引用的方式并入本文。

表1：已知具有ORF的线粒体缺失

表6：通过疾病进行的转录物概述

序列表

<110> MDNA生命科学有限公司

<120> 异常线粒体DNA、相关的融合转录物及其杂交探针

<130> PW69153SEAN

<140> PCT/CA2009/000351

<141> 2009-03-27

<150> 61/040,616

<151> 2008-03-28

<160> 52

<170> PatentIn version 3.3

<210> 1

<211> 16568

<212> DNA

<213> 人

<400> 1

gatcacaggt ctatcaccct attaaccact cacgggagct ctccatgcat ttggtatttt 60

cgtctggggg gtatgcacgc gatagcattg cgagacgctg gagccggagc accctatgtc 120

gcagtatctg tctttgattc ctgcctcatc ctattattta tcgcacctac gttcaatatt 180

acaggcgaac atacttacta aagtgtgtta attaattaat gcttgtagga cataataata 240

acaattgaat gtctgcacag ccactttcca cacagacatc ataacaaaaa atttccacca 300

aaccccccct cccccgcttc tggccacagc acttaaacac atctctgcca aaccccaaaa 360

acaaagaacc ctaacaccag cctaaccaga tttcaaattt tatcttttgg cggtatgcac 420

ttttaacagt caccccccaa ctaacacatt attttcccct cccactccca tactactaat 480

ctcatcaata caacccccgc ccatcctacc cagcacacac acaccgctgc taaccccata 540

ccccgaacca accaaacccc aaagacaccc cccacagttt atgtagctta cctcctcaaa 600

gcaatacact gaaaatgttt agacgggctc acatcacccc ataaacaaat aggtttggtc 660

ctagcctttc tattagctct tagtaagatt acacatgcaa gcatccccgt tccagtgagt 720

tcaccctcta aatcaccacg atcaaaagga acaagcatca agcacgcagc aatgcagctc 780

aaaacgctta gcctagccac acccccacgg gaaacagcag tgattaacct ttagcaataa 840

acgaaagttt aactaagcta tactaacccc agggttggtc aatttcgtgc cagccaccgc 900

ggtcacacga ttaacccaag tcaatagaag ccggcgtaaa gagtgtttta gatcaccccc 960

tccccaataa agctaaaact cacctgagtt gtaaaaaact ccagttgaca caaaatagac 1020

tacgaaagtg gctttaacat atctgaacac acaatagcta agacccaaac tgggattaga 1080

taccccacta tgcttagccc taaacctcaa cagttaaatc aacaaaactg ctcgccagaa 1140

cactacgagc cacagcttaa aactcaaagg acctggcggt gcttcatatc cctctagagg 1200

agcctgttct gtaatcgata aaccccgatc aacctcacca cctcttgctc agcctatata 1260

ccgccatctt cagcaaaccc tgatgaaggc tacaaagtaa gcgcaagtac ccacgtaaag 1320

acgttaggtc aaggtgtagc ccatgaggtg gcaagaaatg ggctacattt tctaccccag 1380

aaaactacga tagcccttat gaaacttaag ggtcgaaggt ggatttagca gtaaactaag 1440

agtagagtgc ttagttgaac agggccctga agcgcgtaca caccgcccgt caccctcctc 1500

aagtatactt caaaggacat ttaactaaaa cccctacgca tttatataga ggagacaagt 1560

cgtaacatgg taagtgtact ggaaagtgca cttggacgaa ccagagtgta gcttaacaca 1620

aagcacccaa cttacactta ggagatttca acttaacttg accgctctga gctaaaccta 1680

gccccaaacc cactccacct tactaccaga caaccttagc caaaccattt acccaaataa 1740

agtataggcg atagaaattg aaacctggcg caatagatat agtaccgcaa gggaaagatg 1800

aaaaattata accaagcata atatagcaag gactaacccc tataccttct gcataatgaa 1860

ttaactagaa ataactttgc aaggagagcc aaagctaaga cccccgaaac cagacgagct 1920

acctaagaac agctaaaaga gcacacccgt ctatgtagca aaatagtggg aagatttata 1980

ggtagaggcg acaaacctac cgagcctggt gatagctggt tgtccaagat agaatcttag 2040

ttcaacttta aatttgccca cagaaccctc taaatcccct tgtaaattta actgttagtc 2100

caaagaggaa cagctctttg gacactagga aaaaaccttg tagagagagt aaaaaattta 2160

acacccatag taggcctaaa agcagccacc aattaagaaa gcgttcaagc tcaacaccca 2220

ctacctaaaa aatcccaaac atataactga actcctcaca cccaattgga ccaatctatc 2280

accctataga agaactaatg ttagtataag taacatgaaa acattctcct ccgcataagc 2340

ctgcgtcaga ttaaaacact gaactgacaa ttaacagccc aatatctaca atcaaccaac 2400

aagtcattat taccctcact gtcaacccaa cacaggcatg ctcataagga aaggttaaaa 2460

aaagtaaaag gaactcggca aatcttaccc cgcctgttta ccaaaaacat cacctctagc 2520

atcaccagta ttagaggcac cgcctgccca gtgacacatg tttaacggcc gcggtaccct 2580

aaccgtgcaa aggtagcata atcacttgtt ccttaaatag ggacctgtat gaatggctcc 2640

acgagggttc agctgtctct tacttttaac cagtgaaatt gacctgcccg tgaagaggcg 2700

ggcataacac agcaagacga gaagacccta tggagcttta atttattaat gcaaacagta 2760

cctaacaaac ccacaggtcc taaactacca aacctgcatt aaaaatttcg gttggggcga 2820

cctcggagca gaacccaacc tccgagcagt acatgctaag acttcaccag tcaaagcgaa 2880

ctactatact caattgatcc aataacttga ccaacggaac aagttaccct agggataaca 2940

gcgcaatcct attctagagt ccatatcaac aatagggttt acgacctcga tgttggatca 3000

ggacatcccg atggtgcagc cgctattaaa ggttcgtttg ttcaacgatt aaagtcctac 3060

gtgatctgag ttcagaccgg agtaatccag gtcggtttct atctacttca aattcctccc 3120

tgtacgaaag gacaagagaa ataaggccta cttcacaaag cgccttcccc cgtaaatgat 3180

atcatctcaa cttagtatta tacccacacc cacccaagaa cagggtttgt taagatggca 3240

gagcccggta atcgcataaa acttaaaact ttacagtcag aggttcaatt cctcttctta 3300

acaacatacc catggccaac ctcctactcc tcattgtacc cattctaatc gcaatggcat 3360

tcctaatgct taccgaacga aaaattctag gctatataca actacgcaaa ggccccaacg 3420

ttgtaggccc ctacgggcta ctacaaccct tcgctgacgc cataaaactc ttcaccaaag 3480

agcccctaaa acccgccaca tctaccatca ccctctacat caccgccccg accttagctc 3540

tcaccatcgc tcttctacta tgaacccccc tccccatacc caaccccctg gtcaacctca 3600

acctaggcct cctatttatt ctagccacct ctagcctagc cgtttactca atcctctgat 3660

cagggtgagc atcaaactca aactacgccc tgatcggcgc actgcgagca gtagcccaaa 3720

caatctcata tgaagtcacc ctagccatca ttctactatc aacattacta ataagtggct 3780

cctttaacct ctccaccctt atcacaacac aagaacacct ctgattactc ctgccatcat 3840

gacccttggc cataatatga tttatctcca cactagcaga gaccaaccga acccccttcg 3900

accttgccga aggggagtcc gaactagtct caggcttcaa catcgaatac gccgcaggcc 3960

ccttcgccct attcttcata gccgaataca caaacattat tataataaac accctcacca 4020

ctacaatctt cctaggaaca acatatgacg cactctcccc tgaactctac acaacatatt 4080

ttgtcaccaa gaccctactt ctaacctccc tgttcttatg aattcgaaca gcataccccc 4140

gattccgcta cgaccaactc atacacctcc tatgaaaaaa cttcctacca ctcaccctag 4200

cattacttat atgatatgtc tccataccca ttacaatctc cagcattccc cctcaaacct 4260

aagaaatatg tctgataaaa gagttacttt gatagagtaa ataataggag cttaaacccc 4320

cttatttcta ggactatgag aatcgaaccc atccctgaga atccaaaatt ctccgtgcca 4380

cctatcacac cccatcctaa agtaaggtca gctaaataag ctatcgggcc cataccccga 4440

aaatgttggt tatacccttc ccgtactaat taatcccctg gcccaacccg tcatctactc 4500

taccatcttt gcaggcacac tcatcacagc gctaagctcg cactgatttt ttacctgagt 4560

aggcctagaa ataaacatgc tagcttttat tccagttcta accaaaaaaa taaaccctcg 4620

ttccacagaa gctgccatca agtatttcct cacgcaagca accgcatcca taatccttct 4680

aatagctatc ctcttcaaca atatactctc cggacaatga accataacca atactaccaa 4740

tcaatactca tcattaataa tcataatagc tatagcaata aaactaggaa tagccccctt 4800

tcacttctga gtcccagagg ttacccaagg cacccctctg acatccggcc tgcttcttct 4860

cacatgacaa aaactagccc ccatctcaat catataccaa atctctccct cactaaacgt 4920

aagccttctc ctcactctct caatcttatc catcatagca ggcagttgag gtggattaaa 4980

ccaaacccag ctacgcaaaa tcttagcata ctcctcaatt acccacatag gatgaataat 5040

agcagttcta ccgtacaacc ctaacataac cattcttaat ttaactattt atattatcct 5100

aactactacc gcattcctac tactcaactt aaactccagc accacgaccc tactactatc 5160

tcgcacctga aacaagctaa catgactaac acccttaatt ccatccaccc tcctctccct 5220

aggaggcctg cccccgctaa ccggcttttt gcccaaatgg gccattatcg aagaattcac 5280

aaaaaacaat agcctcatca tccccaccat catagccacc atcaccctcc ttaacctcta 5340

cttctaccta cgcctaatct actccacctc aatcacacta ctccccatat ctaacaacgt 5400

aaaaataaaa tgacagtttg aacatacaaa acccacccca ttcctcccca cactcatcgc 5460

ccttaccacg ctactcctac ctatctcccc ttttatacta ataatcttat agaaatttag 5520

gttaaataca gaccaagagc cttcaaagcc ctcagtaagt tgcaatactt aatttctgta 5580

acagctaagg actgcaaaac cccactctgc atcaactgaa cgcaaatcag ccactttaat 5640

taagctaagc ccttactaga ccaatgggac ttaaacccac aaacacttag ttaacagcta 5700

agcaccctaa tcaactggct tcaatctact tctcccgccg ccgggaaaaa aggcgggaga 5760

agccccggca ggtttgaagc tgcttcttcg aatttgcaat tcaatatgaa aatcacctcg 5820

gagctggtaa aaagaggcct aacccctgtc tttagattta cagtccaatg cttcactcag 5880

ccattttacc tcacccccac tgatgttcgc cgaccgttga ctattctcta caaaccacaa 5940

agacattgga acactatacc tattattcgg cgcatgagct ggagtcctag gcacagctct 6000

aagcctcctt attcgagccg agctgggcca gccaggcaac cttctaggta acgaccacat 6060

ctacaacgtt atcgtcacag cccatgcatt tgtaataatc ttcttcatag taatacccat 6120

cataatcgga ggctttggca actgactagt tcccctaata atcggtgccc ccgatatggc 6180

gtttccccgc ataaacaaca taagcttctg actcttacct ccctctctcc tactcctgct 6240

cgcatctgct atagtggagg ccggagcagg aacaggttga acagtctacc ctcccttagc 6300

agggaactac tcccaccctg gagcctccgt agacctaacc atcttctcct tacacctagc 6360

aggtgtctcc tctatcttag gggccatcaa tttcatcaca acaattatca atataaaacc 6420

ccctgccata acccaatacc aaacgcccct cttcgtctga tccgtcctaa tcacagcagt 6480

cctacttctc ctatctctcc cagtcctagc tgctggcatc actatactac taacagaccg 6540

caacctcaac accaccttct tcgaccccgc cggaggagga gaccccattc tataccaaca 6600

cctattctga tttttcggtc accctgaagt ttatattctt atcctaccag gcttcggaat 6660

aatctcccat attgtaactt actactccgg aaaaaaagaa ccatttggat acataggtat 6720

ggtctgagct atgatatcaa ttggcttcct agggtttatc gtgtgagcac accatatatt 6780

tacagtagga atagacgtag acacacgagc atatttcacc tccgctacca taatcatcgc 6840

tatccccacc ggcgtcaaag tatttagctg actcgccaca ctccacggaa gcaatatgaa 6900

atgatctgct gcagtgctct gagccctagg attcatcttt cttttcaccg taggtggcct 6960

gactggcatt gtattagcaa actcatcact agacatcgta ctacacgaca cgtactacgt 7020

tgtagcccac ttccactatg tcctatcaat aggagctgta tttgccatca taggaggctt 7080

cattcactga tttcccctat tctcaggcta caccctagac caaacctacg ccaaaatcca 7140

tttcactatc atattcatcg gcgtaaatct aactttcttc ccacaacact ttctcggcct 7200

atccggaatg ccccgacgtt actcggacta ccccgatgca tacaccacat gaaacatcct 7260

atcatctgta ggctcattca tttctctaac agcagtaata ttaataattt tcatgatttg 7320

agaagccttc gcttcgaagc gaaaagtcct aatagtagaa gaaccctcca taaacctgga 7380

gtgactatat ggatgccccc caccctacca cacattcgaa gaacccgtat acataaaatc 7440

tagacaaaaa aggaaggaat cgaacccccc aaagctggtt tcaagccaac cccatggcct 7500

ccatgacttt ttcaaaaagg tattagaaaa accatttcat aactttgtca aagttaaatt 7560

ataggctaaa tcctatatat cttaatggca catgcagcgc aagtaggtct acaagacgct 7620

acttccccta tcatagaaga gcttatcacc tttcatgatc acgccctcat aatcattttc 7680

cttatctgct tcctagtcct gtatgccctt ttcctaacac tcacaacaaa actaactaat 7740

actaacatct cagacgctca ggaaatagaa accgtctgaa ctatcctgcc cgccatcatc 7800

ctagtcctca tcgccctccc atccctacgc atcctttaca taacagacga ggtcaacgat 7860

ccctccctta ccatcaaatc aattggccac caatggtact gaacctacga gtacaccgac 7920

tacggcggac taatcttcaa ctcctacata cttcccccat tattcctaga accaggcgac 7980

ctgcgactcc ttgacgttga caatcgagta gtactcccga ttgaagcccc cattcgtata 8040

ataattacat cacaagacgt cttgcactca tgagctgtcc ccacattagg cttaaaaaca 8100

gatgcaattc ccggacgtct aaaccaaacc actttcaccg ctacacgacc gggggtatac 8160

tacggtcaat gctctgaaat ctgtggagca aaccacagtt tcatgcccat cgtcctagaa 8220

ttaattcccc taaaaatctt tgaaataggg cccgtattta ccctatagca ccccctctac 8280

cccctctaga gcccactgta aagctaactt agcattaacc ttttaagtta aagattaaga 8340

gaaccaacac ctctttacag tgaaatgccc caactaaata ctaccgtatg gcccaccata 8400

attaccccca tactccttac actattcctc atcacccaac taaaaatatt aaacacaaac 8460

taccacctac ctccctcacc aaagcccata aaaataaaaa attataacaa accctgagaa 8520

ccaaaatgaa cgaaaatctg ttcgcttcat tcattgcccc cacaatccta ggcctacccg 8580

ccgcagtact gatcattcta tttccccctc tattgatccc cacctccaaa tatctcatca 8640

acaaccgact aatcaccacc caacaatgac taatcaaact aacctcaaaa caaatgataa 8700

ccatacacaa cactaaagga cgaacctgat ctcttatact agtatcctta atcattttta 8760

ttgccacaac taacctcctc ggactcctgc ctcactcatt tacaccaacc acccaactat 8820

ctataaacct agccatggcc atccccttat gagcgggcac agtgattata ggctttcgct 8880

ctaagattaa aaatgcccta gcccacttct taccacaagg cacacctaca ccccttatcc 8940

ccatactagt tattatcgaa accatcagcc tactcattca accaatagcc ctggccgtac 9000

gcctaaccgc taacattact gcaggccacc tactcatgca cctaattgga agcgccaccc 9060

tagcaatatc aaccattaac cttccctcta cacttatcat cttcacaatt ctaattctac 9120

tgactatcct agaaatcgct gtcgccttaa tccaagccta cgttttcaca cttctagtaa 9180

gcctctacct gcacgacaac acataatgac ccaccaatca catgcctatc atatagtaaa 9240

acccagccca tgacccctaa caggggccct ctcagccctc ctaatgacct ccggcctagc 9300

catgtgattt cacttccact ccataacgct cctcatacta ggcctactaa ccaacacact 9360

aaccatatac caatgatggc gcgatgtaac acgagaaagc acataccaag gccaccacac 9420

accacctgtc caaaaaggcc ttcgatacgg gataatccta tttattacct cagaagtttt 9480

tttcttcgca ggatttttct gagcctttta ccactccagc ctagccccta ccccccaatt 9540

aggagggcac tggcccccaa caggcatcac cccgctaaat cccctagaag tcccactcct 9600

aaacacatcc gtattactcg catcaggagt atcaatcacc tgagctcacc atagtctaat 9660

agaaaacaac cgaaaccaaa taattcaagc actgcttatt acaattttac tgggtctcta 9720

ttttaccctc ctacaagcct cagagtactt cgagtctccc ttcaccattt ccgacggcat 9780

ctacggctca acattttttg tagccacagg cttccacgga cttcacgtca ttattggctc 9840

aactttcctc actatctgct tcatccgcca actaatattt cactttacat ccaaacatca 9900

ctttggcttc gaagccgccg cctgatactg gcattttgta gatgtggttt gactatttct 9960

gtatgtctcc atctattgat gagggtctta ctcttttagt ataaatagta ccgttaactt 10020

ccaattaact agttttgaca acattcaaaa aagagtaata aacttcgcct taattttaat 10080

aatcaacacc ctcctagcct tactactaat aattattaca ttttgactac cacaactcaa 10140

cggctacata gaaaaatcca ccccttacga gtgcggcttc gaccctatat cccccgcccg 10200

cgtccctttc tccataaaat tcttcttagt agctattacc ttcttattat ttgatctaga 10260

aattgccctc cttttacccc taccatgagc cctacaaaca actaacctgc cactaatagt 10320

tatgtcatcc ctcttattaa tcatcatcct agccctaagt ctggcctatg agtgactaca 10380

aaaaggatta gactgaaccg aattggtata tagtttaaac aaaacgaatg atttcgactc 10440

attaaattat gataatcata tttaccaaat gcccctcatt tacataaata ttatactagc 10500

atttaccatc tcacttctag gaatactagt atatcgctca cacctcatat cctccctact 10560

atgcctagaa ggaataatac tatcgctgtt cattatagct actctcataa ccctcaacac 10620

ccactccctc ttagccaata ttgtgcctat tgccatacta gtctttgccg cctgcgaagc 10680

agcggtgggc ctagccctac tagtctcaat ctccaacaca tatggcctag actacgtaca 10740

taacctaaac ctactccaat gctaaaacta atcgtcccaa caattatatt actaccactg 10800

acatgacttt ccaaaaaaca cataatttga atcaacacaa ccacccacag cctaattatt 10860

agcatcatcc ctctactatt ttttaaccaa atcaacaaca acctatttag ctgttcccca 10920

accttttcct ccgaccccct aacaaccccc ctcctaatac taactacctg actcctaccc 10980

ctcacaatca tggcaagcca acgccactta tccagtgaac cactatcacg aaaaaaactc 11040

tacctctcta tactaatctc cctacaaatc tccttaatta taacattcac agccacagaa 11100

ctaatcatat tttatatctt cttcgaaacc acacttatcc ccaccttggc tatcatcacc 11160

cgatgaggca accagccaga acgcctgaac gcaggcacat acttcctatt ctacacccta 11220

gtaggctccc ttcccctact catcgcacta atttacactc acaacaccct aggctcacta 11280

aacattctac tactcactct cactgcccaa gaactatcaa actcctgagc caacaactta 11340

atatgactag cttacacaat agcttttata gtaaagatac ctctttacgg actccactta 11400

tgactcccta aagcccatgt cgaagccccc atcgctgggt caatagtact tgccgcagta 11460

ctcttaaaac taggcggcta tggtataata cgcctcacac tcattctcaa ccccctgaca 11520

aaacacatag cctacccctt ccttgtacta tccctatgag gcataattat aacaagctcc 11580

atctgcctac gacaaacaga cctaaaatcg ctcattgcat actcttcaat cagccacata 11640

gccctcgtag taacagccat tctcatccaa accccctgaa gcttcaccgg cgcagtcatt 11700

ctcataatcg cccacgggct tacatcctca ttactattct gcctagcaaa ctcaaactac 11760

gaacgcactc acagtcgcat cataatcctc tctcaaggac ttcaaactct actcccacta 11820

atagcttttt gatgacttct agcaagcctc gctaacctcg ccttaccccc cactattaac 11880

ctactgggag aactctctgt gctagtaacc acgttctcct gatcaaatat cactctccta 11940

cttacaggac tcaacatact agtcacagcc ctatactccc tctacatatt taccacaaca 12000

caatggggct cactcaccca ccacattaac aacataaaac cctcattcac acgagaaaac 12060

accctcatgt tcatacacct atcccccatt ctcctcctat ccctcaaccc cgacatcatt 12120

accgggtttt cctcttgtaa atatagttta accaaaacat cagattgtga atctgacaac 12180

agaggcttac gaccccttat ttaccgagaa agctcacaag aactgctaac tcatgccccc 12240

atgtctaaca acatggcttt ctcaactttt aaaggataac agctatccat tggtcttagg 12300

ccccaaaaat tttggtgcaa ctccaaataa aagtaataac catgcacact actataacca 12360

ccctaaccct gacttcccta attcccccca tccttaccac cctcgttaac cctaacaaaa 12420

aaaactcata cccccattat gtaaaatcca ttgtcgcatc cacctttatt atcagtctct 12480

tccccacaac aatattcatg tgcctagacc aagaagttat tatctcgaac tgacactgag 12540

ccacaaccca aacaacccag ctctccctaa gcttcaaact agactacttc tccataatat 12600

tcatccctgt agcattgttc gttacatggt ccatcataga attctcactg tgatatataa 12660

actcagaccc aaacattaat cagttcttca aatatctact catcttccta attaccatac 12720

taatcttagt taccgctaac aacctattcc aactgttcat cggctgagag ggcgtaggaa 12780

ttatatcctt cttgctcatc agttgatgat acgcccgagc agatgccaac acagcagcca 12840

ttcaagcaat cctatacaac cgtatcggcg atatcggttt catcctcgcc ttagcatgat 12900

ttatcctaca ctccaactca tgagacccac aacaaatagc ccttctaaac gctaatccaa 12960

gcctcacccc actactaggc ctcctcctag cagcagcagg caaatcagcc caattaggtc 13020

tccacccctg actcccctca gccatagaag gccccacccc agtctcagcc ctactccact 13080

caagcactat agttgtagca ggaatcttct tactcatccg cttccacccc ctagcagaaa 13140

atagcccact aatccaaact ctaacactat gcttaggcgc tatcaccact ctgttcgcag 13200

cagtctgcgc ccttacacaa aatgacatca aaaaaatcgt agccttctcc acttcaagtc 13260

aactaggact cataatagtt acaatcggca tcaaccaacc acacctagca ttcctgcaca 13320

tctgtaccca cgccttcttc aaagccatac tatttatgtg ctccgggtcc atcatccaca 13380

accttaacaa tgaacaagat attcgaaaaa taggaggact actcaaaacc atacctctca 13440

cttcaacctc cctcaccatt ggcagcctag cattagcagg aatacctttc ctcacaggtt 13500

tctactccaa agaccacatc atcgaaaccg caaacatatc atacacaaac gcctgagccc 13560

tatctattac tctcatcgct acctccctga caagcgccta tagcactcga ataattcttc 13620

tcaccctaac aggtcaacct cgcttcccca cccttactaa cattaacgaa aataacccca 13680

ccctactaaa ccccattaaa cgcctggcag ccggaagcct attcgcagga tttctcatta 13740

ctaacaacat ttcccccgca tcccccttcc aaacaacaat ccccctctac ctaaaactca 13800

cagccctcgc tgtcactttc ctaggacttc taacagccct agacctcaac tacctaacca 13860

acaaacttaa aataaaatcc ccactatgca cattttattt ctccaacata ctcggattct 13920

accctagcat cacacaccgc acaatcccct atctaggcct tcttacgagc caaaacctgc 13980

ccctactcct cctagaccta acctgactag aaaagctatt acctaaaaca atttcacagc 14040

accaaatctc cacctccatc atcacctcaa cccaaaaagg cataattaaa ctttacttcc 14100

tctctttctt cttcccactc atcctaaccc tactcctaat cacataacct attcccccga 14160

gcaatctcaa ttacaatata tacaccaaca aacaatgttc aaccagtaac tactactaat 14220

caacgcccat aatcatacaa agcccccgca ccaataggat cctcccgaat caaccctgac 14280

ccctctcctt cataaattat tcagcttcct acactattaa agtttaccac aaccaccacc 14340

ccatcatact ctttcaccca cagcaccaat cctacctcca tcgctaaccc cactaaaaca 14400

ctcaccaaga cctcaacccc tgacccccat gcctcaggat actcctcaat agccatcgct 14460

gtagtatatc caaagacaac catcattccc cctaaataaa ttaaaaaaac tattaaaccc 14520

atataacctc ccccaaaatt cagaataata acacacccga ccacaccgct aacaatcaat 14580

actaaacccc cataaatagg agaaggctta gaagaaaacc ccacaaaccc cattactaaa 14640

cccacactca acagaaacaa agcatacatc attattctcg cacggactac aaccacgacc 14700

aatgatatga aaaaccatcg ttgtatttca actacaagaa caccaatgac cccaatacgc 14760

aaaactaacc ccctaataaa attaattaac cactcattca tcgacctccc caccccatcc 14820

aacatctccg catgatgaaa cttcggctca ctccttggcg cctgcctgat cctccaaatc 14880

accacaggac tattcctagc catgcactac tcaccagacg cctcaaccgc cttttcatca 14940

atcgcccaca tcactcgaga cgtaaattat ggctgaatca tccgctacct tcacgccaat 15000

ggcgcctcaa tattctttat ctgcctcttc ctacacatcg ggcgaggcct atattacgga 15060

tcatttctct actcagaaac ctgaaacatc ggcattatcc tcctgcttgc aactatagca 15120

acagccttca taggctatgt cctcccgtga ggccaaatat cattctgagg ggccacagta 15180

attacaaact tactatccgc catcccatac attgggacag acctagttca atgaatctga 15240

ggaggctact cagtagacag tcccaccctc acacgattct ttacctttca cttcatcttg 15300

cccttcatta ttgcagccct agcaacactc cacctcctat tcttgcacga aacgggatca 15360

aacaaccccc taggaatcac ctcccattcc gataaaatca ccttccaccc ttactacaca 15420

atcaaagacg ccctcggctt acttctcttc cttctctcct taatgacatt aacactattc 15480

tcaccagacc tcctaggcga cccagacaat tataccctag ccaacccctt aaacacccct 15540

ccccacatca agcccgaatg atatttccta ttcgcctaca caattctccg atccgtccct 15600

aacaaactag gaggcgtcct tgccctatta ctatccatcc tcatcctagc aataatcccc 15660

atcctccata tatccaaaca acaaagcata atatttcgcc cactaagcca atcactttat 15720

tgactcctag ccgcagacct cctcattcta acctgaatcg gaggacaacc agtaagctac 15780

ccttttacca tcattggaca agtagcatcc gtactatact tcacaacaat cctaatccta 15840

ataccaacta tctccctaat tgaaaacaaa atactcaaat gggcctgtcc ttgtagtata 15900

aactaataca ccagtcttgt aaaccggaga tgaaaacctt tttccaagga caaatcagag 15960

aaaaagtctt taactccacc attagcaccc aaagctaaga ttctaattta aactattctc 16020

tgttctttca tggggaagca gatttgggta ccacccaagt attgactcac ccatcaacaa 16080

ccgctatgta tttcgtacat tactgccagc caccatgaat attgtacggt accataaata 16140

cttgaccacc tgtagtacat aaaaacccaa tccacatcaa aaccccctcc ccatgcttac 16200

aagcaagtac agcaatcaac cctcaactat cacacatcaa ctgcaactcc aaagccaccc 16260

ctcacccact aggataccaa caaacctacc cacccttaac agtacatagt acataaagcc 16320

atttaccgta catagcacat tacagtcaaa tcccttctcg tccccatgga tgacccccct 16380

cagatagggg tcccttgacc accatcctcc gtgaaatcaa tatcccgcac aagagtgcta 16440

ctctcctcgc tccgggccca taacacttgg gggtagctaa agtgaactgt atccgacatc 16500

tggttcctac ttcagggtca taaagcctaa atagcccaca cgttcccctt aaataagaca 16560

tcacgatg 16568

<210> 2

<211> 783

<212> DNA

<213> Artificial

<220>

<223> cDNA

<400> 2

atggcccacc ataattaccc ccatactcct tacactattc ctcatcaccc aactaaaaat 60

attaaacaca aactaccacc tacctccctc accattggca gcctagcatt agcaggaata 120

cctttcctca caggtttcta ctccaaagac cacatcatcg aaaccgcaaa catatcatac 180

acaaacgcct gagccctatc tattactctc atcgctacct ccctgacaag cgcctatagc 240

actcgaataa ttcttctcac cctaacaggt caacctcgct tccccaccct tactaacatt 300

aacgaaaata accccaccct actaaacccc attaaacgcc tggcagccgg aagcctattc 360

gcaggatttc tcattactaa caacatttcc cccgcatccc ccttccaaac aacaatcccc 420

ctctacctaa aactcacagc cctcgctgtc actttcctag gacttctaac agccctagac 480

ctcaactacc taaccaacaa acttaaaata aaatccccac tatgcacatt ttatttctcc 540

aacatactcg gattctaccc tagcatcaca caccgcacaa tcccctatct aggccttctt 600

acgagccaaa acctgcccct actcctccta gacctaacct gactagaaaa gctattacct 660

aaaacaattt cacagcacca aatctccacc tccatcatca cctcaaccca aaaaggcata 720

attaaacttt acttcctctc tttcttcttc ccactcatcc taaccctact cctaatcaca 780

taa 783

<210> 3

<211> 300

<212> DNA

<213> Artificial

<220>

<223> cDNA

<400> 3

atgcccctca tttacataaa tattatacta gcatttacca tctcacttct aggaatacta 60

gtatatcgct cacacctcat atcctcccta ctatgcctag aaggaataat actatcgctg 120

ttcattatag ctactctcat aaccctcaac acccactccc tcttagccaa tattgtgcct 180

attgccatac tagtctttgc cgcctgcgaa gcagcggtgg gcctagccct actagtctca 240

atctccaaca catatggcct agactacgta cataacctaa ccctactcct aatcacataa 300

<210> 4

<211> 781

<212> DNA

<213> Artificial

<220>

<223> cDNA

<400> 4

atggcacatg cagcgcaagt aggtctacaa gacgctactt cccctatcat agaagagctt 60

atcacctttc atgatcacgc cctcataatc attttcctta tctgcttcct agtcctgtat 120

gcccttttcc taacactcac aacaaaacta actaatacta acatctcaga cgctcaggaa 180

atagaaaccg tctgaactat cctgcccgcc atcatcctag tcctcatcgc cctcccatcc 240

ctacgcatcc tttacataac agacgaggtc aacgatccct cccttaccat caaatcaatt 300

ggccaccaat ggtactgaac ctacgagtac accgactacg gcggactaat cttcaactcc 360

tacatacttc ccccattatt cctagaacca ggcgacccag acaattatac cctagccaac 420

cccttaaaca cccctcccca catcaagccc gaatgatatt tcctattcgc ctacacaatt 480

ctccgatccg tccctaacaa actaggaggc gtccttgccc tattactatc catcctcatc 540

ctagcaataa tccccatcct ccatatatcc aaacaacaaa gcataatatt tcgcccacta 600

agccaatcac tttattgact cctagccgca gacctcctca ttctaacctg aatcggagga 660

caaccagtaa gctacccttt taccatcatt ggacaagtag catccgtact atacttcaca 720

acaatcctaa tcctaatacc aactatctcc ctaattgaaa acaaaatact caaatgggcc 780

t 781

<210> 5

<211> 565

<212> DNA

<213> Artificial

<220>

<223> cDNA

<400> 5

atggcacatg cagcgcaagt aggtctacaa gacgctactt cccctatcat agaagagctt 60

atcacctttc atgatcacgc cctcataatc attttcctta tctgcttcct agtcctgtat 120

gcccttttcc taacactcac aacaaaacta actaatacta acatctcaga cgctcaggaa 180

atagaaaccg tctgaactat cctgcccgcc atcatcctag tcctcatcgc cctcccatcc 240

ctacgcatcc tttacataac agacgaggtc aacgatccct cccttaccat caaatcaatt 300

ggccaccaat ggtactgaac ctacgagtac accgactacg gcggactaat cttcaactcc 360

tacatacttc ccccattatt cctagaacca ggcgacctgc gactcctagc cgcagacctc 420

ctcattctaa cctgaatcgg aggacaacca gtaagctacc cttttaccat cattggacaa 480

gtagcatccg tactatactt cacaacaatc ctaatcctaa taccaactat ctccctaatt 540

gaaaacaaaa tactcaaatg ggcct 565

<210> 6

<211> 1174

<212> DNA

<213> Artificial

<220>

<223> cDNA

<400> 6

atggcacatg cagcgcaagt aggtctacaa gacgctactt cccctatcat agaagagctt 60

atcacctttc atgatcacgc cctcataatc attttcctta tctgcttcct agtcctgtat 120

gcccttttcc taacactcac aacaaaacta actaatacta acatctcaga cgctcaggaa 180

atagaaaccg tctgaactat cctgcccgcc atcatcctag tcctcatcgc cctcccatcc 240

ctacgcatcc tttacataac agacgaggtc aacgatccct cccttaccat caaatcaatt 300

ggccaccaat ggtactgaac ctacgagtac accgactacg gcggactaat cttcaactcc 360

tacatacttc ccccattatt cctagaacca ggcgacctgc gactccttga cgttgacaat 420

cgagtagtac tcccgattga agcccccatt cgtataataa ttacatcaca agacgtcttg 480

cactcatgag ctgtccccac attaggctta aaaacagatg caattcccgg acgtctaaac 540

caaaccactt tcaccgctac acgaccgggg gtatactacg gtcaatgctc tgaaatctgt 600

ggagcaaacc acagtttcat gcccatattc ttgcacgaaa cgggatcaaa caacccccta 660

ggaatcacct cccattccga taaaatcacc ttccaccctt actacacaat caaagacgcc 720

ctcggcttac ttctcttcct tctctcctta atgacattaa cactattctc accagacctc 780

ctaggcgacc cagacaatta taccctagcc aaccccttaa acacccctcc ccacatcaag 840

cccgaatgat atttcctatt cgcctacaca attctccgat ccgtccctaa caaactagga 900

ggcgtccttg ccctattact atccatcctc atcctagcaa taatccccat cctccatata 960

tccaaacaac aaagcataat atttcgccca ctaagccaat cactttattg actcctagcc 1020

gcagacctcc tcattctaac ctgaatcgga ggacaaccag taagctaccc ttttaccatc 1080

attggacaag tagcatccgt actatacttc acaacaatcc taatcctaat accaactatc 1140

tccctaattg aaaacaaaat actcaaatgg gcct 1174

<210> 7

<211> 1294

<212> DNA

<213> Artificial

<220>

<223> cDNA

<400> 7

atgaacgaaa atctgttcgc ttcattcatt gcccccacaa tcctaggcct acccgccgca 60

gtactgatca ttctatttcc ccctctattg atccccacct ccaaatatct catcaacaac 120

cgactaatca ccacccaaca atgactaatc aaactaacct caaaacaaat gataaccata 180

cacaacacta aaggacgaac ctgatctctt atactagtat ccttaatcat ttttattgcc 240

acaactaacc tcctcggact cctgcctcac tcatttacac caaccaccca actatctata 300

aacctagcca tgcactactc accagacgcc tcaaccgcct tttcatcaat cgcccacatc 360

actcgagacg taaattatgg ctgaatcatc cgctaccttc acgccaatgg cgcctcaata 420

ttctttatct gcctcttcct acacatcggg cgaggcctat attacggatc atttctctac 480

tcagaaacct gaaacatcgg cattatcctc ctgcttgcaa ctatagcaac agccttcata 540

ggctatgtcc tcccgtgagg ccaaatatca ttctgagggg ccacagtaat tacaaactta 600

ctatccgcca tcccatacat tgggacagac ctagttcaat gaatctgagg aggctactca 660

gtagacagtc ccaccctcac acgattcttt acctttcact tcatcttgcc cttcattatt 720

gcagccctag caacactcca cctcctattc ttgcacgaaa cgggatcaaa caacccccta 780

ggaatcacct cccattccga taaaatcacc ttccaccctt actacacaat caaagacgcc 840

ctcggcttac ttctcttcct tctctcctta atgacattaa cactattctc accagacctc 900

ctaggcgacc cagacaatta taccctagcc aaccccttaa acacccctcc ccacatcaag 960

cccgaatgat atttcctatt cgcctacaca attctccgat ccgtccctaa caaactagga 1020

ggcgtccttg ccctattact atccatcctc atcctagcaa taatccccat cctccatata 1080

tccaaacaac aaagcataat atttcgccca ctaagccaat cactttattg actcctagcc 1140

gcagacctcc tcattctaac ctgaatcgga ggacaaccag taagctaccc ttttaccatc 1200

attggacaag tagcatccgt actatacttc acaacaatcc taatcctaat accaactatc 1260

tccctaattg aaaacaaaat actcaaatgg gcct 1294

<210> 8

<211> 1228

<212> DNA

<213> Artificial

<220>

<223> cDNA

<400> 8

atgcccctca tttacataaa tattatacta gcatttacca tctcacttct aggaatacta 60

gtatatcgct cacacctcat atcctcccta ctatgcctag aaggaataat actatcgctg 120

ttcattatag ctactctcat aaccctcaac acccactccc tcttagccaa tattgtgcct 180

attgccatac tagtctttgg cgcctgcctg atcctccaaa tcaccacagg actattccta 240

gccatgcact actcaccaga cgcctcaacc gccttttcat caatcgccca catcactcga 300

gacgtaaatt atggctgaat catccgctac cttcacgcca atggcgcctc aatattcttt 360

atctgcctct tcctacacat cgggcgaggc ctatattacg gatcatttct ctactcagaa 420

acctgaaaca tcggcattat cctcctgctt gcaactatag caacagcctt cataggctat 480

gtcctcccgt gaggccaaat atcattctga ggggccacag taattacaaa cttactatcc 540

gccatcccat acattgggac agacctagtt caatgaatct gaggaggcta ctcagtagac 600

agtcccaccc tcacacgatt ctttaccttt cacttcatct tgcccttcat tattgcagcc 660

ctagcaacac tccacctcct attcttgcac gaaacgggat caaacaaccc cctaggaatc 720

acctcccatt ccgataaaat caccttccac ccttactaca caatcaaaga cgccctcggc 780

ttacttctct tccttctctc cttaatgaca ttaacactat tctcaccaga cctcctaggc 840

gacccagaca attataccct agccaacccc ttaaacaccc ctccccacat caagcccgaa 900

tgatatttcc tattcgccta cacaattctc cgatccgtcc ctaacaaact aggaggcgtc 960

cttgccctat tactatccat cctcatccta gcaataatcc ccatcctcca tatatccaaa 1020

caacaaagca taatatttcg cccactaagc caatcacttt attgactcct agccgcagac 1080

ctcctcattc taacctgaat cggaggacaa ccagtaagct acccttttac catcattgga 1140

caagtagcat ccgtactata cttcacaaca atcctaatcc taataccaac tatctcccta 1200

attgaaaaca aaatactcaa atgggcct 1228

<210> 9

<211> 522

<212> DNA

<213> Artificial

<220>

<223> cDNA

<400> 9

atgttcgccg accgttgact attctctaca aaccacaaag acattggaac actataccta 60

ttattcggcg catgagctgg agtcctaggc acagctctaa gcctccttat tcgagccgag 120

ctgggccagc caggcaacct tctaggtaac gaccacatct acaacgttat cgtcacagcc 180

ctcgctgtca ctttcctagg acttctaaca gccctagacc tcaactacct aaccaacaaa 240

cttaaaataa aatccccact atgcacattt tatttctcca acatactcgg attctaccct 300

agcatcacac accgcacaat cccctatcta ggccttctta cgagccaaaa cctgccccta 360

ctcctcctag acctaacctg actagaaaag ctattaccta aaacaatttc acagcaccaa 420

atctccacct ccatcatcac ctcaacccaa aaaggcataa ttaaacttta cttcctctct 480

ttcttcttcc cactcatcct aaccctactc ctaatcacat aa 522

<210> 10

<211> 582

<212> DNA

<213> Artificial

<220>

<223> cDNA

<400> 10

atgttcgccg accgttgact attctctaca aaccacaaag acattggaac actataccta 60

ttattcggcg catgagctgg agtcctaggc acagctctaa gcctccttat tcgagccgag 120

ctgggccagc caggcaacct tctaggtaac gaccacatct acaacgttat cgtcacagcc 180

catgcatttg taataatctt cttcatagta atacccatca taatcggagg ctttggcaac 240

tgactagttc ccctaataat cggtgccccc gatatggcgt ttccccgcat aaacaacata 300

agcttctgac tcttacctcc ctctctccta ctcctgctcg catctgctat agtggaggcc 360

ggagcaggaa caggttgaac agtctaccct cccttagcag ggaactactc ccaccctgga 420

gccctcctag acctaacctg actagaaaag ctattaccta aaacaatttc acagcaccaa 480

atctccacct ccatcatcac ctcaacccaa aaaggcataa ttaaacttta cttcctctct 540

ttcttcttcc cactcatcct aaccctactc ctaatcacat aa 582

<210> 11

<211> 2208

<212> DNA

<213> Artificial

<220>

<223> cDNA

<400> 11

atgttcgccg accgttgact attctctaca aaccacaaag acattggaac actataccta 60

ttattcggcg catgagctgg agtcctaggc acagctctaa gcctccttat tcgagccgag 120

ctgggccagc caggcaacct tctaggtaac gaccacatct acaacgttat cgtcacagcc 180

catgcatttg taataatctt cttcatagta atacccatca taatcggagg ctttggcaac 240

tgactagttc ccctaataat cggtgccccc gatatggcgt ttccccgcat aaacaacata 300

agcttctgac tcttacctcc ctctctccta ctcctgctcg catctgctat agtggaggcc 360

ggagcaggaa caggttgaac agtctaccct cccttagcag ggaactactc ccaccctgga 420

gcctccgtag acctaaccat cttctcctta cacctagcag gtgtctcctc tatcttaggg 480

gccatcaatt tcatcacaac aattatcaat ataaaacccc ctgccataac ccaataccaa 540

acgcccctct tcgtctgatc cgtcctaatc acagcagtcc tacttctcct atctctccca 600

gtcctagctg ctggcatcac tatactacta acagaccgca acctcaacac caccttcttc 660

gaccccgccg gaggaggaga ccccattcta taccaacacc tattctgatt tttcggtcac 720

cctgaagttt atattcttat cctaccaggc ttcggaataa tctcccatat tgtaacttac 780

tactccggaa aaaaagaacc atttggatac ataggtatgg tctgagctat gatatcaatt 840

ggcttcctag ggtttatcgt gtgagcacac catatattta cagtaggaat agacgtagac 900

acacgagcat atttcacctc cgctaccata atcatcgcta tccccaccgg cgtcaaagta 960

tttagctgac tcgccacact ccacggaagc aatatgaaat gatctgctgc agtgctctga 1020

gccctaggat tcatctttct tttcaccgta ggtggcctga ctggcattgt attagcaaac 1080

tcatcactag acatcgtact acacgacacg tactacgttg tagcccactt ccactatgtc 1140

ctatcaatag gagctgtatt tgccatcata ggaggcttca ttcactgatt tcccctattc 1200

tcaggctaca ccctagacca aacctacgcc aaaatccatt tcactatcat attcatcggc 1260

gtaaatctaa ctttcttccc acaacacttt ctcggcctat ccggaatgcc ccgacgttac 1320

tcggactacc ccgatgcata caccacatga aacatcctat catctgtagg ctcattcatt 1380

tctctaacag cagtaatatt aataattttc atgatttgag aagccttcgc ttcgaagcga 1440

aaagtcctaa tagtagaaga accctccata aacctggagt gactatatgg atgcccccca 1500

ccctaccaca cattcgaaga acccgtatac ataaaagcag gaataccttt cctcacaggt 1560

ttctactcca aagaccacat catcgaaacc gcaaacatat catacacaaa cgcctgagcc 1620

ctatctatta ctctcatcgc tacctccctg acaagcgcct atagcactcg aataattctt 1680

ctcaccctaa caggtcaacc tcgcttcccc acccttacta acattaacga aaataacccc 1740

accctactaa accccattaa acgcctggca gccggaagcc tattcgcagg atttctcatt 1800

actaacaaca tttcccccgc atcccccttc caaacaacaa tccccctcta cctaaaactc 1860

acagccctcg ctgtcacttt cctaggactt ctaacagccc tagacctcaa ctacctaacc 1920

aacaaactta aaataaaatc cccactatgc acattttatt tctccaacat actcggattc 1980

taccctagca tcacacaccg cacaatcccc tatctaggcc ttcttacgag ccaaaacctg 2040

cccctactcc tcctagacct aacctgacta gaaaagctat tacctaaaac aatttcacag 2100

caccaaatct ccacctccat catcacctca acccaaaaag gcataattaa actttacttc 2160

ctctctttct tcttcccact catcctaacc ctactcctaa tcacataa 2208

<210> 12

<211> 807

<212> DNA

<213> Artificial

<220>

<223> cDNA

<400> 12

atggcacatg cagcgcaagt aggtctacaa gacgctactt cccctatcat agaagagctt 60

atcacctttc atgatcacgc cctcataatc attttcctta tctgcttcct agtcctgtat 120

gcccttttcc taacactcac aacaaaacta actaatacta acatctcaga cgctcaggaa 180

atagaaaccg caaacatatc atacacaaac gcctgagccc tatctattac tctcatcgct 240

acctccctga caagcgccta tagcactcga ataattcttc tcaccctaac aggtcaacct 300

cgcttcccca cccttactaa cattaacgaa aataacccca ccctactaaa ccccattaaa 360

cgcctggcag ccggaagcct attcgcagga tttctcatta ctaacaacat ttcccccgca 420

tcccccttcc aaacaacaat ccccctctac ctaaaactca cagccctcgc tgtcactttc 480

ctaggacttc taacagccct agacctcaac tacctaacca acaaacttaa aataaaatcc 540

ccactatgca cattttattt ctccaacata ctcggattct accctagcat cacacaccgc 600

acaatcccct atctaggcct tcttacgagc caaaacctgc ccctactcct cctagaccta 660

acctgactag aaaagctatt acctaaaaca atttcacagc accaaatctc cacctccatc 720

atcacctcaa cccaaaaagg cataattaaa ctttacttcc tctctttctt cttcccactc 780

atcctaaccc tactcctaat cacataa 807

<210> 13

<211> 786

<212> DNA

<213> Artificial

<220>

<223> cDNA

<400> 13

atggcacatg cagcgcaagt aggtctacaa gacgctactt cccctatcat agaagagctt 60

atcacctttc atgatcacgc cctcataatc attttcctta tctgcttcct agtcctgtat 120

gcccttttcc taacactcac aacaaaacta actaatacta acatctcaga cgctcaggaa 180

atagaaaccg tctgaactat cctgcccgcc atcatcctag tcctcatcgc cctcccatcc 240

ctacgcatcc tttacataac agacgaggtc aacgatccct cccttaccat caaatcaatt 300

ggccaccaat ggtactgaac ctacgagtac accgactacg gcggactaat cttcaactcc 360

tacatacttc ccccattatt cctagaacca ggcgacctgc gactccttga cgttgacaat 420

cgagtagtac tcccgattga agcccccatt cgtataataa ttacatcaca agacgtcttg 480

cactcatgag ctgtccccac attaggctta aaaacagatg caattcccgg acgtctaaac 540

caaaccactt tcaccgctac acgaccgggg gtatactacg gtcaatgctc tgaaatctgt 600

ggagcaaacc acagtttcat gcccatcgtc ctagacctaa cctgactaga aaagctatta 660

cctaaaacaa tttcacagca ccaaatctcc acctccatca tcacctcaac ccaaaaaggc 720

ataattaaac tttacttcct ctctttcttc ttcccactca tcctaaccct actcctaatc 780

acataa 786

<210> 14

<211> 1905

<212> DNA

<213> Artificial

<220>

<223> cDNA

<400> 14

atgaacgaaa atctgttcgc ttcattcatt gcccccacaa tcctaggcct acccgccgca 60

gtactgatca ttctatttcc ccctctattg atccccacct ccaaatatct catcaacaac 120

cgactaatca ccacccaaca atgactaatc aaactaacct caaaacaaat gataaccata 180

cacaacacta aaggacgaac ctgatctctt atactagtat ccttaatcat ttttattgcc 240

acaactaacc tcctcggact cctgcctcac tcatttacac caaccaccca actatctata 300

aacctagcca tggccatccc cttatgagcg ggcacagtga ttataggctt tcgctctaag 360

attaaaaatg ccctagccca cttcttacca caaggcacac ctacacccct tatccccata 420

ctagttatta tcgaaaccat cagcctactc attcaaccaa tagccctggc cgtacgccta 480

accgctaaca ttactgcagg ccacctactc atgcacctaa ttggaagcgc caccctagca 540

atatcaacca ttaaccttcc ctctacactt atcatcttca caattctaat tctactgact 600

atcctagaaa tcgctgtcgc cttaatccaa gcctacgttt tcacacttct agtaagcctc 660

tacctacact ccaactcatg agacccacaa caaatagccc ttctaaacgc taatccaagc 720

ctcaccccac tactaggcct cctcctagca gcagcaggca aatcagccca attaggtctc 780

cacccctgac tcccctcagc catagaaggc cccaccccag tctcagccct actccactca 840

agcactatag ttgtagcagg aatcttctta ctcatccgct tccaccccct agcagaaaat 900

agcccactaa tccaaactct aacactatgc ttaggcgcta tcaccactct gttcgcagca 960

gtctgcgccc ttacacaaaa tgacatcaaa aaaatcgtag ccttctccac ttcaagtcaa 1020

ctaggactca taatagttac aatcggcatc aaccaaccac acctagcatt cctgcacatc 1080

tgtacccacg ccttcttcaa agccatacta tttatgtgct ccgggtccat catccacaac 1140

cttaacaatg aacaagatat tcgaaaaata ggaggactac tcaaaaccat acctctcact 1200

tcaacctccc tcaccattgg cagcctagca ttagcaggaa tacctttcct cacaggtttc 1260

tactccaaag accacatcat cgaaaccgca aacatatcat acacaaacgc ctgagcccta 1320

tctattactc tcatcgctac ctccctgaca agcgcctata gcactcgaat aattcttctc 1380

accctaacag gtcaacctcg cttccccacc cttactaaca ttaacgaaaa taaccccacc 1440

ctactaaacc ccattaaacg cctggcagcc ggaagcctat tcgcaggatt tctcattact 1500

aacaacattt cccccgcatc ccccttccaa acaacaatcc ccctctacct aaaactcaca 1560

gccctcgctg tcactttcct aggacttcta acagccctag acctcaacta cctaaccaac 1620

aaacttaaaa taaaatcccc actatgcaca ttttatttct ccaacatact cggattctac 1680

cctagcatca cacaccgcac aatcccctat ctaggccttc ttacgagcca aaacctgccc 1740

ctactcctcc tagacctaac ctgactagaa aagctattac ctaaaacaat ttcacagcac 1800

caaatctcca cctccatcat cacctcaacc caaaaaggca taattaaact ttacttcctc 1860

tctttcttct tcccactcat cctaacccta ctcctaatca cataa 1905

<210> 15

<211> 1545

<212> DNA

<213> Artificial

<220>

<223> cDNA

<400> 15

atgacccacc aatcacatgc ctatcatata gtaaaaccca gcccatgacc cctaacaggg 60

gccctctcag ccctcctaat gacctccggc ctagccatgt gatttcactt ccactccata 120

acgctcctca tactaggcct actaaccaac acactaacca tataccaatg atggcgcgat 180

gtaacacgag aaagcacata ccaaggccac cacacaccac ctgtccaaaa aggccttcga 240

tacgggataa tcctatttat tacctcagaa gtttttttct tcgcaggatt tttctgagcc 300

ttttaccact ccagcctagc ccctaccccc caattaggag ggcactggcc cccaacaggc 360

atcaccccac tactaggcct cctcctagca gcagcaggca aatcagccca attaggtctc 420

cacccctgac tcccctcagc catagaaggc cccaccccag tctcagccct actccactca 480

agcactatag ttgtagcagg aatcttctta ctcatccgct tccaccccct agcagaaaat 540

agcccactaa tccaaactct aacactatgc ttaggcgcta tcaccactct gttcgcagca 600

gtctgcgccc ttacacaaaa tgacatcaaa aaaatcgtag ccttctccac ttcaagtcaa 660

ctaggactca taatagttac aatcggcatc aaccaaccac acctagcatt cctgcacatc 720

tgtacccacg ccttcttcaa agccatacta tttatgtgct ccgggtccat catccacaac 780

cttaacaatg aacaagatat tcgaaaaata ggaggactac tcaaaaccat acctctcact 840

tcaacctccc tcaccattgg cagcctagca ttagcaggaa tacctttcct cacaggtttc 900

tactccaaag accacatcat cgaaaccgca aacatatcat acacaaacgc ctgagcccta 960

tctattactc tcatcgctac ctccctgaca agcgcctata gcactcgaat aattcttctc 1020

accctaacag gtcaacctcg cttccccacc cttactaaca ttaacgaaaa taaccccacc 1080

ctactaaacc ccattaaacg cctggcagcc ggaagcctat tcgcaggatt tctcattact 1140

aacaacattt cccccgcatc ccccttccaa acaacaatcc ccctctacct aaaactcaca 1200

gccctcgctg tcactttcct aggacttcta acagccctag acctcaacta cctaaccaac 1260

aaacttaaaa taaaatcccc actatgcaca ttttatttct ccaacatact cggattctac 1320

cctagcatca cacaccgcac aatcccctat ctaggccttc ttacgagcca aaacctgccc 1380

ctactcctcc tagacctaac ctgactagaa aagctattac ctaaaacaat ttcacagcac 1440

caaatctcca cctccatcat cacctcaacc caaaaaggca taattaaact ttacttcctc 1500

tctttcttct tcccactcat cctaacccta ctcctaatca cataa 1545

<210> 16

<211> 1629

<212> DNA

<213> Artificial

<220>

<223> cDNA

<400> 16

ataaacttcg ccttaatttt aataatcaac accctcctag ccttactact aataattatt 60

acattttgac taccacaact caacggctac atagaaaaat ccacccctta cgagtgcggc 120

ttcgacccta tatcccccgc ccgcgtccct ttctccataa aattcttctt agtagctatt 180

accttcttat tatttgatct agaaattgcc ctccttttac ccctaccatg agccctacaa 240

acaactaacc tgccactaat agttatgtca tccctcttat taatcatcat cctagcccta 300

agtctggcca acacagcagc cattcaagca atcctataca accgtatcgg cgatatcggt 360

ttcatcctcg ccttagcatg atttatccta cactccaact catgagaccc acaacaaata 420

gcccttctaa acgctaatcc aagcctcacc ccactactag gcctcctcct agcagcagca 480

ggcaaatcag cccaattagg tctccacccc tgactcccct cagccataga aggccccacc 540

ccagtctcag ccctactcca ctcaagcact atagttgtag caggaatctt cttactcatc 600

cgcttccacc ccctagcaga aaatagccca ctaatccaaa ctctaacact atgcttaggc 660

gctatcacca ctctgttcgc agcagtctgc gcccttacac aaaatgacat caaaaaaatc 720

gtagccttct ccacttcaag tcaactagga ctcataatag ttacaatcgg catcaaccaa 780

ccacacctag cattcctgca catctgtacc cacgccttct tcaaagccat actatttatg 840

tgctccgggt ccatcatcca caaccttaac aatgaacaag atattcgaaa aataggagga 900

ctactcaaaa ccatacctct cacttcaacc tccctcacca ttggcagcct agcattagca 960

ggaatacctt tcctcacagg tttctactcc aaagaccaca tcatcgaaac cgcaaacata 1020

tcatacacaa acgcctgagc cctatctatt actctcatcg ctacctccct gacaagcgcc 1080

tatagcactc gaataattct tctcacccta acaggtcaac ctcgcttccc cacccttact 1140

aacattaacg aaaataaccc caccctacta aaccccatta aacgcctggc agccggaagc 1200

ctattcgcag gatttctcat tactaacaac atttcccccg catccccctt ccaaacaaca 1260

atccccctct acctaaaact cacagccctc gctgtcactt tcctaggact tctaacagcc 1320

ctagacctca actacctaac caacaaactt aaaataaaat ccccactatg cacattttat 1380

ttctccaaca tactcggatt ctaccctagc atcacacacc gcacaatccc ctatctaggc 1440

cttcttacga gccaaaacct gcccctactc ctcctagacc taacctgact agaaaagcta 1500

ttacctaaaa caatttcaca gcaccaaatc tccacctcca tcatcacctc aacccaaaaa 1560

ggcataatta aactttactt cctctctttc ttcttcccac tcatcctaac cctactccta 1620

atcacataa 1629

<210> 17

<211> 129

<212> DNA

<213> Artificial

<220>

<223> cDNA

<400> 17

atgccccaac taaatactac cgtatggccc accataatta cccccatact ccttacacta 60

ttcctcatca cccaactaaa aatattaaac acaaactacc acctacctcc ctcaccattg 120

gcagcctag 129

<210> 18

<211> 783

<212> RNA

<213> 人

<400> 18

auggcccacc auaauuaccc ccauacuccu uacacuauuc cucaucaccc aacuaaaaau 60

auuaaacaca aacuaccacc uaccucccuc accauuggca gccuagcauu agcaggaaua 120

ccuuuccuca cagguuucua cuccaaagac cacaucaucg aaaccgcaaa cauaucauac 180

acaaacgccu gagcccuauc uauuacucuc aucgcuaccu cccugacaag cgccuauagc 240

acucgaauaa uucuucucac ccuaacaggu caaccucgcu uccccacccu uacuaacauu 300

aacgaaaaua accccacccu acuaaacccc auuaaacgcc uggcagccgg aagccuauuc 360

gcaggauuuc ucauuacuaa caacauuucc cccgcauccc ccuuccaaac aacaaucccc 420

cucuaccuaa aacucacagc ccucgcuguc acuuuccuag gacuucuaac agcccuagac 480

cucaacuacc uaaccaacaa acuuaaaaua aaauccccac uaugcacauu uuauuucucc 540

aacauacucg gauucuaccc uagcaucaca caccgcacaa uccccuaucu aggccuucuu 600

acgagccaaa accugccccu acuccuccua gaccuaaccu gacuagaaaa gcuauuaccu 660

aaaacaauuu cacagcacca aaucuccacc uccaucauca ccucaaccca aaaaggcaua 720

auuaaacuuu acuuccucuc uuucuucuuc ccacucaucc uaacccuacu ccuaaucaca 780

uaa 783

<210> 19

<211> 300

<212> RNA

<213> 人

<400> 19

augccccuca uuuacauaaa uauuauacua gcauuuacca ucucacuucu aggaauacua 60

guauaucgcu cacaccucau auccucccua cuaugccuag aaggaauaau acuaucgcug 120

uucauuauag cuacucucau aacccucaac acccacuccc ucuuagccaa uauugugccu 180

auugccauac uagucuuugc cgccugcgaa gcagcggugg gccuagcccu acuagucuca 240

aucuccaaca cauauggccu agacuacgua cauaaccuaa cccuacuccu aaucacauaa 300

<210> 20

<211> 781

<212> RNA

<213> 人

<400> 20

auggcacaug cagcgcaagu aggucuacaa gacgcuacuu ccccuaucau agaagagcuu 60

aucaccuuuc augaucacgc ccucauaauc auuuuccuua ucugcuuccu aguccuguau 120

gcccuuuucc uaacacucac aacaaaacua acuaauacua acaucucaga cgcucaggaa 180

auagaaaccg ucugaacuau ccugcccgcc aucauccuag uccucaucgc ccucccaucc 240

cuacgcaucc uuuacauaac agacgagguc aacgaucccu cccuuaccau caaaucaauu 300

ggccaccaau gguacugaac cuacgaguac accgacuacg gcggacuaau cuucaacucc 360

uacauacuuc ccccauuauu ccuagaacca ggcgacccag acaauuauac ccuagccaac 420

cccuuaaaca ccccucccca caucaagccc gaaugauauu uccuauucgc cuacacaauu 480

cuccgauccg ucccuaacaa acuaggaggc guccuugccc uauuacuauc cauccucauc 540

cuagcaauaa uccccauccu ccauauaucc aaacaacaaa gcauaauauu ucgcccacua 600

agccaaucac uuuauugacu ccuagccgca gaccuccuca uucuaaccug aaucggagga 660

caaccaguaa gcuacccuuu uaccaucauu ggacaaguag cauccguacu auacuucaca 720

acaauccuaa uccuaauacc aacuaucucc cuaauugaaa acaaaauacu caaaugggcc 780

u 781

<210> 21

<211> 565

<212> RNA

<213> 人

<400> 21

auggcacaug cagcgcaagu aggucuacaa gacgcuacuu ccccuaucau agaagagcuu 60

aucaccuuuc augaucacgc ccucauaauc auuuuccuua ucugcuuccu aguccuguau 120

gcccuuuucc uaacacucac aacaaaacua acuaauacua acaucucaga cgcucaggaa 180

auagaaaccg ucugaacuau ccugcccgcc aucauccuag uccucaucgc ccucccaucc 240

cuacgcaucc uuuacauaac agacgagguc aacgaucccu cccuuaccau caaaucaauu 300

ggccaccaau gguacugaac cuacgaguac accgacuacg gcggacuaau cuucaacucc 360

uacauacuuc ccccauuauu ccuagaacca ggcgaccugc gacuccuagc cgcagaccuc 420

cucauucuaa ccugaaucgg aggacaacca guaagcuacc cuuuuaccau cauuggacaa 480

guagcauccg uacuauacuu cacaacaauc cuaauccuaa uaccaacuau cucccuaauu 540

gaaaacaaaa uacucaaaug ggccu 565

<210> 22

<211> 1174

<212> RNA

<213> 人

<400> 22

auggcacaug cagcgcaagu aggucuacaa gacgcuacuu ccccuaucau agaagagcuu 60

aucaccuuuc augaucacgc ccucauaauc auuuuccuua ucugcuuccu aguccuguau 120

gcccuuuucc uaacacucac aacaaaacua acuaauacua acaucucaga cgcucaggaa 180

auagaaaccg ucugaacuau ccugcccgcc aucauccuag uccucaucgc ccucccaucc 240

cuacgcaucc uuuacauaac agacgagguc aacgaucccu cccuuaccau caaaucaauu 300

ggccaccaau gguacugaac cuacgaguac accgacuacg gcggacuaau cuucaacucc 360

uacauacuuc ccccauuauu ccuagaacca ggcgaccugc gacuccuuga cguugacaau 420

cgaguaguac ucccgauuga agcccccauu cguauaauaa uuacaucaca agacgucuug 480

cacucaugag cuguccccac auuaggcuua aaaacagaug caauucccgg acgucuaaac 540

caaaccacuu ucaccgcuac acgaccgggg guauacuacg gucaaugcuc ugaaaucugu 600

ggagcaaacc acaguuucau gcccauauuc uugcacgaaa cgggaucaaa caacccccua 660

ggaaucaccu cccauuccga uaaaaucacc uuccacccuu acuacacaau caaagacgcc 720

cucggcuuac uucucuuccu ucucuccuua augacauuaa cacuauucuc accagaccuc 780

cuaggcgacc cagacaauua uacccuagcc aaccccuuaa acaccccucc ccacaucaag 840

cccgaaugau auuuccuauu cgccuacaca auucuccgau ccgucccuaa caaacuagga 900

ggcguccuug cccuauuacu auccauccuc auccuagcaa uaauccccau ccuccauaua 960

uccaaacaac aaagcauaau auuucgccca cuaagccaau cacuuuauug acuccuagcc 1020

gcagaccucc ucauucuaac cugaaucgga ggacaaccag uaagcuaccc uuuuaccauc 1080

auuggacaag uagcauccgu acuauacuuc acaacaaucc uaauccuaau accaacuauc 1140

ucccuaauug aaaacaaaau acucaaaugg gccu 1174

<210> 23

<211> 1294

<212> RNA

<213> 人

<400> 23

augaacgaaa aucuguucgc uucauucauu gcccccacaa uccuaggccu acccgccgca 60

guacugauca uucuauuucc cccucuauug auccccaccu ccaaauaucu caucaacaac 120

cgacuaauca ccacccaaca augacuaauc aaacuaaccu caaaacaaau gauaaccaua 180

cacaacacua aaggacgaac cugaucucuu auacuaguau ccuuaaucau uuuuauugcc 240

acaacuaacc uccucggacu ccugccucac ucauuuacac caaccaccca acuaucuaua 300

aaccuagcca ugcacuacuc accagacgcc ucaaccgccu uuucaucaau cgcccacauc 360

acucgagacg uaaauuaugg cugaaucauc cgcuaccuuc acgccaaugg cgccucaaua 420

uucuuuaucu gccucuuccu acacaucggg cgaggccuau auuacggauc auuucucuac 480

ucagaaaccu gaaacaucgg cauuauccuc cugcuugcaa cuauagcaac agccuucaua 540

ggcuaugucc ucccgugagg ccaaauauca uucugagggg ccacaguaau uacaaacuua 600

cuauccgcca ucccauacau ugggacagac cuaguucaau gaaucugagg aggcuacuca 660

guagacaguc ccacccucac acgauucuuu accuuucacu ucaucuugcc cuucauuauu 720

gcagcccuag caacacucca ccuccuauuc uugcacgaaa cgggaucaaa caacccccua 780

ggaaucaccu cccauuccga uaaaaucacc uuccacccuu acuacacaau caaagacgcc 840

cucggcuuac uucucuuccu ucucuccuua augacauuaa cacuauucuc accagaccuc 900

cuaggcgacc cagacaauua uacccuagcc aaccccuuaa acaccccucc ccacaucaag 960

cccgaaugau auuuccuauu cgccuacaca auucuccgau ccgucccuaa caaacuagga 1020

ggcguccuug cccuauuacu auccauccuc auccuagcaa uaauccccau ccuccauaua 1080

uccaaacaac aaagcauaau auuucgccca cuaagccaau cacuuuauug acuccuagcc 1140

gcagaccucc ucauucuaac cugaaucgga ggacaaccag uaagcuaccc uuuuaccauc 1200

auuggacaag uagcauccgu acuauacuuc acaacaaucc uaauccuaau accaacuauc 1260

ucccuaauug aaaacaaaau acucaaaugg gccu 1294

<210> 24

<211> 1228

<212> RNA

<213> 人

<400> 24

augccccuca uuuacauaaa uauuauacua gcauuuacca ucucacuucu aggaauacua 60

guauaucgcu cacaccucau auccucccua cuaugccuag aaggaauaau acuaucgcug 120

uucauuauag cuacucucau aacccucaac acccacuccc ucuuagccaa uauugugccu 180

auugccauac uagucuuugg cgccugccug auccuccaaa ucaccacagg acuauuccua 240

gccaugcacu acucaccaga cgccucaacc gccuuuucau caaucgccca caucacucga 300

gacguaaauu auggcugaau cauccgcuac cuucacgcca auggcgccuc aauauucuuu 360

aucugccucu uccuacacau cgggcgaggc cuauauuacg gaucauuucu cuacucagaa 420

accugaaaca ucggcauuau ccuccugcuu gcaacuauag caacagccuu cauaggcuau 480

guccucccgu gaggccaaau aucauucuga ggggccacag uaauuacaaa cuuacuaucc 540

gccaucccau acauugggac agaccuaguu caaugaaucu gaggaggcua cucaguagac 600

agucccaccc ucacacgauu cuuuaccuuu cacuucaucu ugcccuucau uauugcagcc 660

cuagcaacac uccaccuccu auucuugcac gaaacgggau caaacaaccc ccuaggaauc 720

accucccauu ccgauaaaau caccuuccac ccuuacuaca caaucaaaga cgcccucggc 780

uuacuucucu uccuucucuc cuuaaugaca uuaacacuau ucucaccaga ccuccuaggc 840

gacccagaca auuauacccu agccaacccc uuaaacaccc cuccccacau caagcccgaa 900

ugauauuucc uauucgccua cacaauucuc cgauccgucc cuaacaaacu aggaggcguc 960

cuugcccuau uacuauccau ccucauccua gcaauaaucc ccauccucca uauauccaaa 1020

caacaaagca uaauauuucg cccacuaagc caaucacuuu auugacuccu agccgcagac 1080

cuccucauuc uaaccugaau cggaggacaa ccaguaagcu acccuuuuac caucauugga 1140

caaguagcau ccguacuaua cuucacaaca auccuaaucc uaauaccaac uaucucccua 1200

auugaaaaca aaauacucaa augggccu 1228

<210> 25

<211> 522

<212> RNA

<213> 人

<400> 25

auguucgccg accguugacu auucucuaca aaccacaaag acauuggaac acuauaccua 60

uuauucggcg caugagcugg aguccuaggc acagcucuaa gccuccuuau ucgagccgag 120

cugggccagc caggcaaccu ucuagguaac gaccacaucu acaacguuau cgucacagcc 180

cucgcuguca cuuuccuagg acuucuaaca gcccuagacc ucaacuaccu aaccaacaaa 240

cuuaaaauaa aauccccacu augcacauuu uauuucucca acauacucgg auucuacccu 300

agcaucacac accgcacaau ccccuaucua ggccuucuua cgagccaaaa ccugccccua 360

cuccuccuag accuaaccug acuagaaaag cuauuaccua aaacaauuuc acagcaccaa 420

aucuccaccu ccaucaucac cucaacccaa aaaggcauaa uuaaacuuua cuuccucucu 480

uucuucuucc cacucauccu aacccuacuc cuaaucacau aa 522

<210> 26

<211> 582

<212> RNA

<213> 人

<400> 26

auguucgccg accguugacu auucucuaca aaccacaaag acauuggaac acuauaccua 60

uuauucggcg caugagcugg aguccuaggc acagcucuaa gccuccuuau ucgagccgag 120

cugggccagc caggcaaccu ucuagguaac gaccacaucu acaacguuau cgucacagcc 180

caugcauuug uaauaaucuu cuucauagua auacccauca uaaucggagg cuuuggcaac 240

ugacuaguuc cccuaauaau cggugccccc gauauggcgu uuccccgcau aaacaacaua 300

agcuucugac ucuuaccucc cucucuccua cuccugcucg caucugcuau aguggaggcc 360

ggagcaggaa cagguugaac agucuacccu cccuuagcag ggaacuacuc ccacccugga 420

gcccuccuag accuaaccug acuagaaaag cuauuaccua aaacaauuuc acagcaccaa 480

aucuccaccu ccaucaucac cucaacccaa aaaggcauaa uuaaacuuua cuuccucucu 540

uucuucuucc cacucauccu aacccuacuc cuaaucacau aa 582

<210> 27

<211> 2208

<212> RNA

<213> 人

<400> 27

auguucgccg accguugacu auucucuaca aaccacaaag acauuggaac acuauaccua 60

uuauucggcg caugagcugg aguccuaggc acagcucuaa gccuccuuau ucgagccgag 120

cugggccagc caggcaaccu ucuagguaac gaccacaucu acaacguuau cgucacagcc 180

caugcauuug uaauaaucuu cuucauagua auacccauca uaaucggagg cuuuggcaac 240

ugacuaguuc cccuaauaau cggugccccc gauauggcgu uuccccgcau aaacaacaua 300

agcuucugac ucuuaccucc cucucuccua cuccugcucg caucugcuau aguggaggcc 360

ggagcaggaa cagguugaac agucuacccu cccuuagcag ggaacuacuc ccacccugga 420

gccuccguag accuaaccau cuucuccuua caccuagcag gugucuccuc uaucuuaggg 480

gccaucaauu ucaucacaac aauuaucaau auaaaacccc cugccauaac ccaauaccaa 540

acgccccucu ucgucugauc cguccuaauc acagcagucc uacuucuccu aucucuccca 600

guccuagcug cuggcaucac uauacuacua acagaccgca accucaacac caccuucuuc 660

gaccccgccg gaggaggaga ccccauucua uaccaacacc uauucugauu uuucggucac 720

ccugaaguuu auauucuuau ccuaccaggc uucggaauaa ucucccauau uguaacuuac 780

uacuccggaa aaaaagaacc auuuggauac auagguaugg ucugagcuau gauaucaauu 840

ggcuuccuag gguuuaucgu gugagcacac cauauauuua caguaggaau agacguagac 900

acacgagcau auuucaccuc cgcuaccaua aucaucgcua uccccaccgg cgucaaagua 960

uuuagcugac ucgccacacu ccacggaagc aauaugaaau gaucugcugc agugcucuga 1020

gcccuaggau ucaucuuucu uuucaccgua gguggccuga cuggcauugu auuagcaaac 1080

ucaucacuag acaucguacu acacgacacg uacuacguug uagcccacuu ccacuauguc 1140

cuaucaauag gagcuguauu ugccaucaua ggaggcuuca uucacugauu uccccuauuc 1200

ucaggcuaca cccuagacca aaccuacgcc aaaauccauu ucacuaucau auucaucggc 1260

guaaaucuaa cuuucuuccc acaacacuuu cucggccuau ccggaaugcc ccgacguuac 1320

ucggacuacc ccgaugcaua caccacauga aacauccuau caucuguagg cucauucauu 1380

ucucuaacag caguaauauu aauaauuuuc augauuugag aagccuucgc uucgaagcga 1440

aaaguccuaa uaguagaaga acccuccaua aaccuggagu gacuauaugg augcccccca 1500

cccuaccaca cauucgaaga acccguauac auaaaagcag gaauaccuuu ccucacaggu 1560

uucuacucca aagaccacau caucgaaacc gcaaacauau cauacacaaa cgccugagcc 1620

cuaucuauua cucucaucgc uaccucccug acaagcgccu auagcacucg aauaauucuu 1680

cucacccuaa caggucaacc ucgcuucccc acccuuacua acauuaacga aaauaacccc 1740

acccuacuaa accccauuaa acgccuggca gccggaagcc uauucgcagg auuucucauu 1800

acuaacaaca uuucccccgc aucccccuuc caaacaacaa ucccccucua ccuaaaacuc 1860

acagcccucg cugucacuuu ccuaggacuu cuaacagccc uagaccucaa cuaccuaacc 1920

aacaaacuua aaauaaaauc cccacuaugc acauuuuauu ucuccaacau acucggauuc 1980

uacccuagca ucacacaccg cacaaucccc uaucuaggcc uucuuacgag ccaaaaccug 2040

ccccuacucc uccuagaccu aaccugacua gaaaagcuau uaccuaaaac aauuucacag 2100

caccaaaucu ccaccuccau caucaccuca acccaaaaag gcauaauuaa acuuuacuuc 2160

cucucuuucu ucuucccacu cauccuaacc cuacuccuaa ucacauaa 2208

<210> 28

<211> 807

<212> RNA

<213> 人

<400> 28

auggcacaug cagcgcaagu aggucuacaa gacgcuacuu ccccuaucau agaagagcuu 60

aucaccuuuc augaucacgc ccucauaauc auuuuccuua ucugcuuccu aguccuguau 120

gcccuuuucc uaacacucac aacaaaacua acuaauacua acaucucaga cgcucaggaa 180

auagaaaccg caaacauauc auacacaaac gccugagccc uaucuauuac ucucaucgcu 240

accucccuga caagcgccua uagcacucga auaauucuuc ucacccuaac aggucaaccu 300

cgcuucccca cccuuacuaa cauuaacgaa aauaacccca cccuacuaaa ccccauuaaa 360

cgccuggcag ccggaagccu auucgcagga uuucucauua cuaacaacau uucccccgca 420

ucccccuucc aaacaacaau cccccucuac cuaaaacuca cagcccucgc ugucacuuuc 480

cuaggacuuc uaacagcccu agaccucaac uaccuaacca acaaacuuaa aauaaaaucc 540

ccacuaugca cauuuuauuu cuccaacaua cucggauucu acccuagcau cacacaccgc 600

acaauccccu aucuaggccu ucuuacgagc caaaaccugc cccuacuccu ccuagaccua 660

accugacuag aaaagcuauu accuaaaaca auuucacagc accaaaucuc caccuccauc 720

aucaccucaa cccaaaaagg cauaauuaaa cuuuacuucc ucucuuucuu cuucccacuc 780

auccuaaccc uacuccuaau cacauaa 807

<210> 29

<211> 786

<212> RNA

<213> 人

<400> 29

auggcacaug cagcgcaagu aggucuacaa gacgcuacuu ccccuaucau agaagagcuu 60

aucaccuuuc augaucacgc ccucauaauc auuuuccuua ucugcuuccu aguccuguau 120

gcccuuuucc uaacacucac aacaaaacua acuaauacua acaucucaga cgcucaggaa 180

auagaaaccg ucugaacuau ccugcccgcc aucauccuag uccucaucgc ccucccaucc 240

cuacgcaucc uuuacauaac agacgagguc aacgaucccu cccuuaccau caaaucaauu 300

ggccaccaau gguacugaac cuacgaguac accgacuacg gcggacuaau cuucaacucc 360

uacauacuuc ccccauuauu ccuagaacca ggcgaccugc gacuccuuga cguugacaau 420

cgaguaguac ucccgauuga agcccccauu cguauaauaa uuacaucaca agacgucuug 480

cacucaugag cuguccccac auuaggcuua aaaacagaug caauucccgg acgucuaaac 540

caaaccacuu ucaccgcuac acgaccgggg guauacuacg gucaaugcuc ugaaaucugu 600

ggagcaaacc acaguuucau gcccaucguc cuagaccuaa ccugacuaga aaagcuauua 660

ccuaaaacaa uuucacagca ccaaaucucc accuccauca ucaccucaac ccaaaaaggc 720

auaauuaaac uuuacuuccu cucuuucuuc uucccacuca uccuaacccu acuccuaauc 780

acauaa 786

<210> 30

<211> 1905

<212> RNA

<213> 人

<400> 30

augaacgaaa aucuguucgc uucauucauu gcccccacaa uccuaggccu acccgccgca 60

guacugauca uucuauuucc cccucuauug auccccaccu ccaaauaucu caucaacaac 120

cgacuaauca ccacccaaca augacuaauc aaacuaaccu caaaacaaau gauaaccaua 180

cacaacacua aaggacgaac cugaucucuu auacuaguau ccuuaaucau uuuuauugcc 240

acaacuaacc uccucggacu ccugccucac ucauuuacac caaccaccca acuaucuaua 300

aaccuagcca uggccauccc cuuaugagcg ggcacaguga uuauaggcuu ucgcucuaag 360

auuaaaaaug cccuagccca cuucuuacca caaggcacac cuacaccccu uauccccaua 420

cuaguuauua ucgaaaccau cagccuacuc auucaaccaa uagcccuggc cguacgccua 480

accgcuaaca uuacugcagg ccaccuacuc augcaccuaa uuggaagcgc cacccuagca 540

auaucaacca uuaaccuucc cucuacacuu aucaucuuca caauucuaau ucuacugacu 600

auccuagaaa ucgcugucgc cuuaauccaa gccuacguuu ucacacuucu aguaagccuc 660

uaccuacacu ccaacucaug agacccacaa caaauagccc uucuaaacgc uaauccaagc 720

cucaccccac uacuaggccu ccuccuagca gcagcaggca aaucagccca auuaggucuc 780

caccccugac uccccucagc cauagaaggc cccaccccag ucucagcccu acuccacuca 840

agcacuauag uuguagcagg aaucuucuua cucauccgcu uccacccccu agcagaaaau 900

agcccacuaa uccaaacucu aacacuaugc uuaggcgcua ucaccacucu guucgcagca 960

gucugcgccc uuacacaaaa ugacaucaaa aaaaucguag ccuucuccac uucaagucaa 1020

cuaggacuca uaauaguuac aaucggcauc aaccaaccac accuagcauu ccugcacauc 1080

uguacccacg ccuucuucaa agccauacua uuuaugugcu ccggguccau cauccacaac 1140

cuuaacaaug aacaagauau ucgaaaaaua ggaggacuac ucaaaaccau accucucacu 1200

ucaaccuccc ucaccauugg cagccuagca uuagcaggaa uaccuuuccu cacagguuuc 1260

uacuccaaag accacaucau cgaaaccgca aacauaucau acacaaacgc cugagcccua 1320

ucuauuacuc ucaucgcuac cucccugaca agcgccuaua gcacucgaau aauucuucuc 1380

acccuaacag gucaaccucg cuuccccacc cuuacuaaca uuaacgaaaa uaaccccacc 1440

cuacuaaacc ccauuaaacg ccuggcagcc ggaagccuau ucgcaggauu ucucauuacu 1500

aacaacauuu cccccgcauc ccccuuccaa acaacaaucc cccucuaccu aaaacucaca 1560

gcccucgcug ucacuuuccu aggacuucua acagcccuag accucaacua ccuaaccaac 1620

aaacuuaaaa uaaaaucccc acuaugcaca uuuuauuucu ccaacauacu cggauucuac 1680

ccuagcauca cacaccgcac aauccccuau cuaggccuuc uuacgagcca aaaccugccc 1740

cuacuccucc uagaccuaac cugacuagaa aagcuauuac cuaaaacaau uucacagcac 1800

caaaucucca ccuccaucau caccucaacc caaaaaggca uaauuaaacu uuacuuccuc 1860

ucuuucuucu ucccacucau ccuaacccua cuccuaauca cauaa 1905

<210> 31

<211> 1545

<212> RNA

<213> 人

<400> 31

augacccacc aaucacaugc cuaucauaua guaaaaccca gcccaugacc ccuaacaggg 60

gcccucucag cccuccuaau gaccuccggc cuagccaugu gauuucacuu ccacuccaua 120

acgcuccuca uacuaggccu acuaaccaac acacuaacca uauaccaaug auggcgcgau 180

guaacacgag aaagcacaua ccaaggccac cacacaccac cuguccaaaa aggccuucga 240

uacgggauaa uccuauuuau uaccucagaa guuuuuuucu ucgcaggauu uuucugagcc 300

uuuuaccacu ccagccuagc cccuaccccc caauuaggag ggcacuggcc cccaacaggc 360

aucaccccac uacuaggccu ccuccuagca gcagcaggca aaucagccca auuaggucuc 420

caccccugac uccccucagc cauagaaggc cccaccccag ucucagcccu acuccacuca 480

agcacuauag uuguagcagg aaucuucuua cucauccgcu uccacccccu agcagaaaau 540

agcccacuaa uccaaacucu aacacuaugc uuaggcgcua ucaccacucu guucgcagca 600

gucugcgccc uuacacaaaa ugacaucaaa aaaaucguag ccuucuccac uucaagucaa 660

cuaggacuca uaauaguuac aaucggcauc aaccaaccac accuagcauu ccugcacauc 720

uguacccacg ccuucuucaa agccauacua uuuaugugcu ccggguccau cauccacaac 780

cuuaacaaug aacaagauau ucgaaaaaua ggaggacuac ucaaaaccau accucucacu 840

ucaaccuccc ucaccauugg cagccuagca uuagcaggaa uaccuuuccu cacagguuuc 900

uacuccaaag accacaucau cgaaaccgca aacauaucau acacaaacgc cugagcccua 960

ucuauuacuc ucaucgcuac cucccugaca agcgccuaua gcacucgaau aauucuucuc 1020

acccuaacag gucaaccucg cuuccccacc cuuacuaaca uuaacgaaaa uaaccccacc 1080

cuacuaaacc ccauuaaacg ccuggcagcc ggaagccuau ucgcaggauu ucucauuacu 1140

aacaacauuu cccccgcauc ccccuuccaa acaacaaucc cccucuaccu aaaacucaca 1200

gcccucgcug ucacuuuccu aggacuucua acagcccuag accucaacua ccuaaccaac 1260

aaacuuaaaa uaaaaucccc acuaugcaca uuuuauuucu ccaacauacu cggauucuac 1320

ccuagcauca cacaccgcac aauccccuau cuaggccuuc uuacgagcca aaaccugccc 1380

cuacuccucc uagaccuaac cugacuagaa aagcuauuac cuaaaacaau uucacagcac 1440

caaaucucca ccuccaucau caccucaacc caaaaaggca uaauuaaacu uuacuuccuc 1500

ucuuucuucu ucccacucau ccuaacccua cuccuaauca cauaa 1545

<210> 32

<211> 1629

<212> RNA

<213> 人

<400> 32

auaaacuucg ccuuaauuuu aauaaucaac acccuccuag ccuuacuacu aauaauuauu 60

acauuuugac uaccacaacu caacggcuac auagaaaaau ccaccccuua cgagugcggc 120

uucgacccua uaucccccgc ccgcgucccu uucuccauaa aauucuucuu aguagcuauu 180

accuucuuau uauuugaucu agaaauugcc cuccuuuuac cccuaccaug agcccuacaa 240

acaacuaacc ugccacuaau aguuauguca ucccucuuau uaaucaucau ccuagcccua 300

agucuggcca acacagcagc cauucaagca auccuauaca accguaucgg cgauaucggu 360

uucauccucg ccuuagcaug auuuauccua cacuccaacu caugagaccc acaacaaaua 420

gcccuucuaa acgcuaaucc aagccucacc ccacuacuag gccuccuccu agcagcagca 480

ggcaaaucag cccaauuagg ucuccacccc ugacuccccu cagccauaga aggccccacc 540

ccagucucag cccuacucca cucaagcacu auaguuguag caggaaucuu cuuacucauc 600

cgcuuccacc cccuagcaga aaauagccca cuaauccaaa cucuaacacu augcuuaggc 660

gcuaucacca cucuguucgc agcagucugc gcccuuacac aaaaugacau caaaaaaauc 720

guagccuucu ccacuucaag ucaacuagga cucauaauag uuacaaucgg caucaaccaa 780

ccacaccuag cauuccugca caucuguacc cacgccuucu ucaaagccau acuauuuaug 840

ugcuccgggu ccaucaucca caaccuuaac aaugaacaag auauucgaaa aauaggagga 900

cuacucaaaa ccauaccucu cacuucaacc ucccucacca uuggcagccu agcauuagca 960

ggaauaccuu uccucacagg uuucuacucc aaagaccaca ucaucgaaac cgcaaacaua 1020

ucauacacaa acgccugagc ccuaucuauu acucucaucg cuaccucccu gacaagcgcc 1080

uauagcacuc gaauaauucu ucucacccua acaggucaac cucgcuuccc cacccuuacu 1140

aacauuaacg aaaauaaccc cacccuacua aaccccauua aacgccuggc agccggaagc 1200

cuauucgcag gauuucucau uacuaacaac auuucccccg caucccccuu ccaaacaaca 1260

aucccccucu accuaaaacu cacagcccuc gcugucacuu uccuaggacu ucuaacagcc 1320

cuagaccuca acuaccuaac caacaaacuu aaaauaaaau ccccacuaug cacauuuuau 1380

uucuccaaca uacucggauu cuacccuagc aucacacacc gcacaauccc cuaucuaggc 1440

cuucuuacga gccaaaaccu gccccuacuc cuccuagacc uaaccugacu agaaaagcua 1500

uuaccuaaaa caauuucaca gcaccaaauc uccaccucca ucaucaccuc aacccaaaaa 1560

ggcauaauua aacuuuacuu ccucucuuuc uucuucccac ucauccuaac ccuacuccua 1620

aucacauaa 1629

<210> 33

<211> 129

<212> RNA

<213> 人

<400> 33

augccccaac uaaauacuac cguauggccc accauaauua cccccauacu ccuuacacua 60

uuccucauca cccaacuaaa aauauuaaac acaaacuacc accuaccucc cucaccauug 120

gcagccuag 129

<210> 34

<211> 261

<212> PRT

<213> Artificial

<220>

<223> 推定的蛋白序列

<220>

<221> misc_feature

<222> (261)..(261)

<223> Xaa可以是任何天然存在的氨基酸

<400> 34

Met Ala His His Asn Tyr Pro His Thr Pro Tyr Thr Ile Pro His His

1 5 10 15

Pro Thr Lys Asn Ile Lys His Lys Leu Pro Pro Thr Ser Leu Thr Ile

20 25 30

Gly Ser Leu Ala Leu Ala Gly Met Pro Phe Leu Thr Gly Phe Tyr Ser

35 40 45

Lys Asp His Ile Ile Glu Thr Ala Asn Met Ser Tyr Thr Asn Ala Trp

50 55 60

Ala Leu Ser Ile Thr Leu Ile Ala Thr Ser Leu Thr Ser Ala Tyr Ser

65 70 75 80

Thr Arg Met Ile Leu Leu Thr Leu Thr Gly Gln Pro Arg Phe Pro Thr

85 90 95

Leu Thr Asn Ile Asn Glu Asn Asn Pro Thr Leu Leu Asn Pro Ile Lys

100 105 110

Arg Leu Ala Ala Gly Ser Leu Phe Ala Gly Phe Leu Ile Thr Asn Asn

115 120 125

Ile Ser Pro Ala Ser Pro Phe Gln Thr Thr Ile Pro Leu Tyr Leu Lys

130 135 140

Leu Thr Ala Leu Ala Val Thr Phe Leu Gly Leu Leu Thr Ala Leu Asp

145 150 155 160

Leu Asn Tyr Leu Thr Asn Lys Leu Lys Met Lys Ser Pro Leu Cys Thr

165 170 175

Phe Tyr Phe Ser Asn Met Leu Gly Phe Tyr Pro Ser Ile Thr His Arg

180 185 190

Thr Ile Pro Tyr Leu Gly Leu Leu Thr Ser Gln Asn Leu Pro Leu Leu

195 200 205

Leu Leu Asp Leu Thr Trp Leu Glu Lys Leu Leu Pro Lys Thr Ile Ser

210 215 220

Gln His Gln Ile Ser Thr Ser Ile Ile Thr Ser Thr Gln Lys Gly Met

225 230 235 240

Ile Lys Leu Tyr Phe Leu Ser Phe Phe Phe Pro Leu Ile Leu Thr Leu

245 250 255

Leu Leu Ile Thr Xaa

260

<210> 35

<211> 100

<212> PRT

<213> Artificial

<220>

<223> 推定的蛋白序列

<220>

<221> misc_feature

<222> (100)..(100)

<223> Xaa可以是任何天然存在的氨基酸

<400> 35

Met Pro Leu Ile Tyr Met Asn Ile Met Leu Ala Phe Thr Ile Ser Leu

1 5 10 15

Leu Gly Met Leu Val Tyr Arg Ser His Leu Met Ser Ser Leu Leu Cys

20 25 30

Leu Glu Gly Met Met Leu Ser Leu Phe Ile Met Ala Thr Leu Met Thr

35 40 45

Leu Asn Thr His Ser Leu Leu Ala Asn Ile Val Pro Ile Ala Met Leu

50 55 60

Val Phe Ala Ala Cys Glu Ala Ala Val Gly Leu Ala Leu Leu Val Ser

65 70 75 80

Ile Ser Asn Thr Tyr Gly Leu Asp Tyr Val His Asn Leu Thr Leu Leu

85 90 95

Leu Ile Thr Xaa

100

<210> 36

<211> 261

<212> PRT

<213> Artificial

<220>

<223> 推定的蛋白序列

<220>

<221> misc_feature

<222> (261)..(261)

<223> Xaa可以是任何天然存在的氨基酸

<400> 36

Met Ala His Ala Ala Gln Val Gly Leu Gln Asp Ala Thr Ser Pro Ile

1 5 10 15

Met Glu Glu Leu Ile Thr Phe His Asp His Ala Leu Met Ile Ile Phe

20 25 30

Leu Ile Cys Phe Leu Val Leu Tyr Ala Leu Phe Leu Thr Leu Thr Thr

35 40 45

Lys Leu Thr Asn Thr Asn Ile Ser Asp Ala Gln Glu Met Glu Thr Val

50 55 60

Trp Thr Ile Leu Pro Ala Ile Ile Leu Val Leu Ile Ala Leu Pro Ser

65 70 75 80

Leu Arg Ile Leu Tyr Met Thr Asp Glu Val Asn Asp Pro Ser Leu Thr

85 90 95

Ile Lys Ser Ile Gly His Gln Trp Tyr Trp Thr Tyr Glu Tyr Thr Asp

100 105 110

Tyr Gly Gly Leu Ile Phe Asn Ser Tyr Met Leu Pro Pro Leu Phe Leu

115 120 125

Glu Pro Gly Asp Pro Asp Asn Tyr Thr Leu Ala Asn Pro Leu Asn Thr

130 135 140

Pro Pro His Ile Lys Pro Glu Trp Tyr Phe Leu Phe Ala Tyr Thr Ile

145 150 155 160

Leu Arg Ser Val Pro Asn Lys Leu Gly Gly Val Leu Ala Leu Leu Leu

165 170 175

Ser Ile Leu Ile Leu Ala Met Ile Pro Ile Leu His Met Ser Lys Gln

180 185 190

Gln Ser Met Met Phe Arg Pro Leu Ser Gln Ser Leu Tyr Trp Leu Leu

195 200 205

Ala Ala Asp Leu Leu Ile Leu Thr Trp Ile Gly Gly Gln Pro Val Ser

210 215 220

Tyr Pro Phe Thr Ile Ile Gly Gln Val Ala Ser Val Leu Tyr Phe Thr

225 230 235 240

Thr Ile Leu Ile Leu Met Pro Thr Ile Ser Leu Ile Glu Asn Lys Met

245 250 255

Leu Lys Trp Ala Xaa

260

<210> 37

<211> 189

<212> PRT

<213> Artificial

<220>

<223> 推定的蛋白序列

<220>

<221> misc_feature

<222> (189)..(189)

<223> Xaa可以是任何天然存在的氨基酸

<400> 37

Met Ala His Ala Ala Gln Val Gly Leu Gln Asp Ala Thr Ser Pro Ile

1 5 10 15

Met Glu Glu Leu Ile Thr Phe His Asp His Ala Leu Met Ile Ile Phe

20 25 30

Leu Ile Cys Phe Leu Val Leu Tyr Ala Leu Phe Leu Thr Leu Thr Thr

35 40 45

Lys Leu Thr Asn Thr Asn Ile Ser Asp Ala Gln Glu Met Glu Thr Val

50 55 60

Trp Thr Ile Leu Pro Ala Ile Ile Leu Val Leu Ile Ala Leu Pro Ser

65 70 75 80

Leu Arg Ile Leu Tyr Met Thr Asp Glu Val Asn Asp Pro Ser Leu Thr

85 90 95

Ile Lys Ser Ile Gly His Gln Trp Tyr Trp Thr Tyr Glu Tyr Thr Asp

100 105 110

Tyr Gly Gly Leu Ile Phe Asn Ser Tyr Met Leu Pro Pro Leu Phe Leu

115 120 125

Glu Pro Gly Asp Leu Arg Leu Leu Ala Ala Asp Leu Leu Ile Leu Thr

130 135 140

Trp Ile Gly Gly Gln Pro Val Ser Tyr Pro Phe Thr Ile Ile Gly Gln

145 150 155 160

Val Ala Ser Val Leu Tyr Phe Thr Thr Ile Leu Ile Leu Met Pro Thr

165 170 175

Ile Ser Leu Ile Glu Asn Lys Met Leu Lys Trp Ala Xaa

180 185

<210> 38

<211> 392

<212> PRT

<213> Artificial

<220>

<223> 推定的蛋白序列

<220>

<221> misc_feature

<222> (392)..(392)

<223> Xaa可以是任何天然存在的氨基酸

<400> 38

Met Ala His Ala Ala Gln Val Gly Leu Gln Asp Ala Thr Ser Pro Ile

1 5 10 15

Met Glu Glu Leu Ile Thr Phe His Asp His Ala Leu Met Ile Ile Phe

20 25 30

Leu Ile Cys Phe Leu Val Leu Tyr Ala Leu Phe Leu Thr Leu Thr Thr

35 40 45

Lys Leu Thr Asn Thr Asn Ile Ser Asp Ala Gln Glu Met Glu Thr Val

50 55 60

Trp Thr Ile Leu Pro Ala Ile Ile Leu Val Leu Ile Ala Leu Pro Ser

65 70 75 80

Leu Arg Ile Leu Tyr Met Thr Asp Glu Val Asn Asp Pro Ser Leu Thr

85 90 95

Ile Lys Ser Ile Gly His Gln Trp Tyr Trp Thr Tyr Glu Tyr Thr Asp

100 105 110

Tyr Gly Gly Leu Ile Phe Asn Ser Tyr Met Leu Pro Pro Leu Phe Leu

115 120 125

Glu Pro Gly Asp Leu Arg Leu Leu Asp Val Asp Asn Arg Val Val Leu

130 135 140

Pro Ile Glu Ala Pro Ile Arg Met Met Ile Thr Ser Gln Asp Val Leu

145 150 155 160

His Ser Trp Ala Val Pro Thr Leu Gly Leu Lys Thr Asp Ala Ile Pro

165 170 175

Gly Arg Leu Asn Gln Thr Thr Phe Thr Ala Thr Arg Pro Gly Val Tyr

180 185 190

Tyr Gly Gln Cys Ser Glu Ile Cys Gly Ala Asn His Ser Phe Met Pro

195 200 205

Met Phe Leu His Glu Thr Gly Ser Asn Asn Pro Leu Gly Ile Thr Ser

210 215 220

His Ser Asp Lys Ile Thr Phe His Pro Tyr Tyr Thr Ile Lys Asp Ala

225 230 235 240

Leu Gly Leu Leu Leu Phe Leu Leu Ser Leu Met Thr Leu Thr Leu Phe

245 250 255

Ser Pro Asp Leu Leu Gly Asp Pro Asp Asn Tyr Thr Leu Ala Asn Pro

260 265 270

Leu Asn Thr Pro Pro His Ile Lys Pro Glu Trp Tyr Phe Leu Phe Ala

275 280 285

Tyr Thr Ile Leu Arg Ser Val Pro Asn Lys Leu Gly Gly Val Leu Ala

290 295 300

Leu Leu Leu Ser Ile Leu Ile Leu Ala Met Ile Pro Ile Leu His Met

305 310 315 320

Ser Lys Gln Gln Ser Met Met Phe Arg Pro Leu Ser Gln Ser Leu Tyr

325 330 335

Trp Leu Leu Ala Ala Asp Leu Leu Ile Leu Thr Trp Ile Gly Gly Gln

340 345 350

Pro Val Ser Tyr Pro Phe Thr Ile Ile Gly Gln Val Ala Ser Val Leu

355 360 365

Tyr Phe Thr Thr Ile Leu Ile Leu Met Pro Thr Ile Ser Leu Ile Glu

370 375 380

Asn Lys Met Leu Lys Trp Ala Xaa

385 390

<210> 39

<211> 432

<212> PRT

<213> Artificial

<220>

<223> 推定的蛋白序列

<220>

<221> misc_feature

<222> (432)..(432)

<223> Xaa可以是任何天然存在的氨基酸

<400> 39

Met Asn Glu Asn Leu Phe Ala Ser Phe Ile Ala Pro Thr Ile Leu Gly

1 5 10 15

Leu Pro Ala Ala Val Leu Ile Ile Leu Phe Pro Pro Leu Leu Ile Pro

20 25 30

Thr Ser Lys Tyr Leu Ile Asn Asn Arg Leu Ile Thr Thr Gln Gln Trp

35 40 45

Leu Ile Lys Leu Thr Ser Lys Gln Met Met Thr Met His Asn Thr Lys

50 55 60

Gly Arg Thr Trp Ser Leu Met Leu Val Ser Leu Ile Ile Phe Ile Ala

65 70 75 80

Thr Thr Asn Leu Leu Gly Leu Leu Pro His Ser Phe Thr Pro Thr Thr

85 90 95

Gln Leu Ser Met Asn Leu Ala Met His Tyr Ser Pro Asp Ala Ser Thr

100 105 110

Ala Phe Ser Ser Ile Ala His Ile Thr Arg Asp Val Asn Tyr Gly Trp

115 120 125

Ile Ile Arg Tyr Leu His Ala Asn Gly Ala Ser Met Phe Phe Ile Cys

130 135 140

Leu Phe Leu His Ile Gly Arg Gly Leu Tyr Tyr Gly Ser Phe Leu Tyr

145 150 155 160

Ser Glu Thr Trp Asn Ile Gly Ile Ile Leu Leu Leu Ala Thr Met Ala

165 170 175

Thr Ala Phe Met Gly Tyr Val Leu Pro Trp Gly Gln Met Ser Phe Trp

180 185 190

Gly Ala Thr Val Ile Thr Asn Leu Leu Ser Ala Ile Pro Tyr Ile Gly

195 200 205

Thr Asp Leu Val Gln Trp Ile Trp Gly Gly Tyr Ser Val Asp Ser Pro

210 215 220

Thr Leu Thr Arg Phe Phe Thr Phe His Phe Ile Leu Pro Phe Ile Ile

225 230 235 240

Ala Ala Leu Ala Thr Leu His Leu Leu Phe Leu His Glu Thr Gly Ser

245 250 255

Asn Asn Pro Leu Gly Ile Thr Ser His Ser Asp Lys Ile Thr Phe His

260 265 270

Pro Tyr Tyr Thr Ile Lys Asp Ala Leu Gly Leu Leu Leu Phe Leu Leu

275 280 285

Ser Leu Met Thr Leu Thr Leu Phe Ser Pro Asp Leu Leu Gly Asp Pro

290 295 300

Asp Asn Tyr Thr Leu Ala Asn Pro Leu Asn Thr Pro Pro His Ile Lys

305 310 315 320

Pro Glu Trp Tyr Phe Leu Phe Ala Tyr Thr Ile Leu Arg Ser Val Pro

325 330 335

Asn Lys Leu Gly Gly Val Leu Ala Leu Leu Leu Ser Ile Leu Ile Leu

340 345 350

Ala Met Ile Pro Ile Leu His Met Ser Lys Gln Gln Ser Met Met Phe

355 360 365

Arg Pro Leu Ser Gln Ser Leu Tyr Trp Leu Leu Ala Ala Asp Leu Leu

370 375 380

Ile Leu Thr Trp Ile Gly Gly Gln Pro Val Ser Tyr Pro Phe Thr Ile

385 390 395 400

Ile Gly Gln Val Ala Ser Val Leu Tyr Phe Thr Thr Ile Leu Ile Leu

405 410 415

Met Pro Thr Ile Ser Leu Ile Glu Asn Lys Met Leu Lys Trp Ala Xaa

420 425 430

<210> 40

<211> 410

<212> PRT

<213> Artificial

<220>

<223> 推定的蛋白序列

<220>

<221> misc_feature

<222> (410)..(410)

<223> Xaa可以是任何天然存在的氨基酸

<400> 40

Met Pro Leu Ile Tyr Met Asn Ile Met Leu Ala Phe Thr Ile Ser Leu

1 5 10 15

Leu Gly Met Leu Val Tyr Arg Ser His Leu Met Ser Ser Leu Leu Cys

20 25 30

Leu Glu Gly Met Met Leu Ser Leu Phe Ile Met Ala Thr Leu Met Thr

35 40 45

Leu Asn Thr His Ser Leu Leu Ala Asn Ile Val Pro Ile Ala Met Leu

50 55 60

Val Phe Gly Ala Cys Leu Ile Leu Gln Ile Thr Thr Gly Leu Phe Leu

65 70 75 80

Ala Met His Tyr Ser Pro Asp Ala Ser Thr Ala Phe Ser Ser Ile Ala

85 90 95

His Ile Thr Arg Asp Val Asn Tyr Gly Trp Ile Ile Arg Tyr Leu His

100 105 110

Ala Asn Gly Ala Ser Met Phe Phe Ile Cys Leu Phe Leu His Ile Gly

115 120 125

Arg Gly Leu Tyr Tyr Gly Ser Phe Leu Tyr Ser Glu Thr Trp Asn Ile

130 135 140

Gly Ile Ile Leu Leu Leu Ala Thr Met Ala Thr Ala Phe Met Gly Tyr

145 150 155 160

Val Leu Pro Trp Gly Gln Met Ser Phe Trp Gly Ala Thr Val Ile Thr

165 170 175

Asn Leu Leu Ser Ala Ile Pro Tyr Ile Gly Thr Asp Leu Val Gln Trp

180 185 190

Ile Trp Gly Gly Tyr Ser Val Asp Ser Pro Thr Leu Thr Arg Phe Phe

195 200 205

Thr Phe His Phe Ile Leu Pro Phe Ile Ile Ala Ala Leu Ala Thr Leu

210 215 220

His Leu Leu Phe Leu His Glu Thr Gly Ser Asn Asn Pro Leu Gly Ile

225 230 235 240

Thr Ser His Ser Asp Lys Ile Thr Phe His Pro Tyr Tyr Thr Ile Lys

245 250 255

Asp Ala Leu Gly Leu Leu Leu Phe Leu Leu Ser Leu Met Thr Leu Thr

260 265 270

Leu Phe Ser Pro Asp Leu Leu Gly Asp Pro Asp Asn Tyr Thr Leu Ala

275 280 285

Asn Pro Leu Asn Thr Pro Pro His Ile Lys Pro Glu Trp Tyr Phe Leu

290 295 300

Phe Ala Tyr Thr Ile Leu Arg Ser Val Pro Asn Lys Leu Gly Gly Val

305 310 315 320

Leu Ala Leu Leu Leu Ser Ile Leu Ile Leu Ala Met Ile Pro Ile Leu

325 330 335

His Met Ser Lys Gln Gln Ser Met Met Phe Arg Pro Leu Ser Gln Ser

340 345 350

Leu Tyr Trp Leu Leu Ala Ala Asp Leu Leu Ile Leu Thr Trp Ile Gly

355 360 365

Gly Gln Pro Val Ser Tyr Pro Phe Thr Ile Ile Gly Gln Val Ala Ser

370 375 380

Val Leu Tyr Phe Thr Thr Ile Leu Ile Leu Met Pro Thr Ile Ser Leu

385 390 395 400

Ile Glu Asn Lys Met Leu Lys Trp Ala Xaa

405 410

<210> 41

<211> 174

<212> PRT

<213> Artificial

<220>

<223> 推定的蛋白序列

<220>

<221> misc_feature

<222> (174)..(174)

<223> Xaa可以是任何天然存在的氨基酸

<400> 41

Met Phe Ala Asp Arg Trp Leu Phe Ser Thr Asn His Lys Asp Ile Gly

1 5 10 15

Thr Leu Tyr Leu Leu Phe Gly Ala Trp Ala Gly Val Leu Gly Thr Ala

20 25 30

Leu Ser Leu Leu Ile Arg Ala Glu Leu Gly Gln Pro Gly Asn Leu Leu

35 40 45

Gly Asn Asp His Ile Tyr Asn Val Ile Val Thr Ala Leu Ala Val Thr

50 55 60

Phe Leu Gly Leu Leu Thr Ala Leu Asp Leu Asn Tyr Leu Thr Asn Lys

65 70 75 80

Leu Lys Met Lys Ser Pro Leu Cys Thr Phe Tyr Phe Ser Asn Met Leu

85 90 95

Gly Phe Tyr Pro Ser Ile Thr His Arg Thr Ile Pro Tyr Leu Gly Leu

100 105 110

Leu Thr Ser Gln Asn Leu Pro Leu Leu Leu Leu Asp Leu Thr Trp Leu

115 120 125

Glu Lys Leu Leu Pro Lys Thr Ile Ser Gln His Gln Ile Ser Thr Ser

130 135 140

Ile Ile Thr Ser Thr Gln Lys Gly Met Ile Lys Leu Tyr Phe Leu Ser

145 150 155 160

Phe Phe Phe Pro Leu Ile Leu Thr Leu Leu Leu Ile Thr Xaa

165 170

<210> 42

<211> 194

<212> PRT

<213> Artificial

<220>

<223> 推定的蛋白序列

<220>

<221> misc_feature

<222> (194)..(194)

<223> Xaa可以是任何天然存在的氨基酸

<400> 42

Met Phe Ala Asp Arg Trp Leu Phe Ser Thr Asn His Lys Asp Ile Gly

1 5 10 15

Thr Leu Tyr Leu Leu Phe Gly Ala Trp Ala Gly Val Leu Gly Thr Ala

20 25 30

Leu Ser Leu Leu Ile Arg Ala Glu Leu Gly Gln Pro Gly Asn Leu Leu

35 40 45

Gly Asn Asp His Ile Tyr Asn Val Ile Val Thr Ala His Ala Phe Val

50 55 60

Met Ile Phe Phe Met Val Met Pro Ile Met Ile Gly Gly Phe Gly Asn

65 70 75 80

Trp Leu Val Pro Leu Met Ile Gly Ala Pro Asp Met Ala Phe Pro Arg

85 90 95

Met Asn Asn Met Ser Phe Trp Leu Leu Pro Pro Ser Leu Leu Leu Leu

100 105 110

Leu Ala Ser Ala Met Val Glu Ala Gly Ala Gly Thr Gly Trp Thr Val

115 120 125

Tyr Pro Pro Leu Ala Gly Asn Tyr Ser His Pro Gly Ala Leu Leu Asp

130 135 140

Leu Thr Trp Leu Glu Lys Leu Leu Pro Lys Thr Ile Ser Gln His Gln

145 150 155 160

Ile Ser Thr Ser Ile Ile Thr Ser Thr Gln Lys Gly Met Ile Lys Leu

165 170 175

Tyr Phe Leu Ser Phe Phe Phe Pro Leu Ile Leu Thr Leu Leu Leu Ile

180 185 190

Thr Xaa

<210> 43

<211> 736

<212> PRT

<213> Artificial

<220>

<223> 推定的蛋白序列

<220>

<221> misc_feature

<222> (736)..(736)

<223> Xaa可以是任何天然存在的氨基酸

<400> 43

Met Phe Ala Asp Arg Trp Leu Phe Ser Thr Asn His Lys Asp Ile Gly

1 5 10 15

Thr Leu Tyr Leu Leu Phe Gly Ala Trp Ala Gly Val Leu Gly Thr Ala

20 25 30

Leu Ser Leu Leu Ile Arg Ala Glu Leu Gly Gln Pro Gly Asn Leu Leu

35 40 45

Gly Asn Asp His Ile Tyr Asn Val Ile Val Thr Ala His Ala Phe Val

50 55 60

Met Ile Phe Phe Met Val Met Pro Ile Met Ile Gly Gly Phe Gly Asn

65 70 75 80

Trp Leu Val Pro Leu Met Ile Gly Ala Pro Asp Met Ala Phe Pro Arg

85 90 95

Met Asn Asn Met Ser Phe Trp Leu Leu Pro Pro Ser Leu Leu Leu Leu

100 105 110

Leu Ala Ser Ala Met Val Glu Ala Gly Ala Gly Thr Gly Trp Thr Val

115 120 125

Tyr Pro Pro Leu Ala Gly Asn Tyr Ser His Pro Gly Ala Ser Val Asp

130 135 140

Leu Thr Ile Phe Ser Leu His Leu Ala Gly Val Ser Ser Ile Leu Gly

145 150 155 160

Ala Ile Asn Phe Ile Thr Thr Ile Ile Asn Met Lys Pro Pro Ala Met

165 170 175

Thr Gln Tyr Gln Thr Pro Leu Phe Val Trp Ser Val Leu Ile Thr Ala

180 185 190

Val Leu Leu Leu Leu Ser Leu Pro Val Leu Ala Ala Gly Ile Thr Met

195 200 205

Leu Leu Thr Asp Arg Asn Leu Asn Thr Thr Phe Phe Asp Pro Ala Gly

210 215 220

Gly Gly Asp Pro Ile Leu Tyr Gln His Leu Phe Trp Phe Phe Gly His

225 230 235 240

Pro Glu Val Tyr Ile Leu Ile Leu Pro Gly Phe Gly Met Ile Ser His

245 250 255

Ile Val Thr Tyr Tyr Ser Gly Lys Lys Glu Pro Phe Gly Tyr Met Gly

260 265 270

Met Val Trp Ala Met Met Ser Ile Gly Phe Leu Gly Phe Ile Val Trp

275 280 285

Ala His His Met Phe Thr Val Gly Met Asp Val Asp Thr Arg Ala Tyr

290 295 300

Phe Thr Ser Ala Thr Met Ile Ile Ala Ile Pro Thr Gly Val Lys Val

305 310 315 320

Phe Ser Trp Leu Ala Thr Leu His Gly Ser Asn Met Lys Trp Ser Ala

325 330 335

Ala Val Leu Trp Ala Leu Gly Phe Ile Phe Leu Phe Thr Val Gly Gly

340 345 350

Leu Thr Gly Ile Val Leu Ala Asn Ser Ser Leu Asp Ile Val Leu His

355 360 365

Asp Thr Tyr Tyr Val Val Ala His Phe His Tyr Val Leu Ser Met Gly

370 375 380

Ala Val Phe Ala Ile Met Gly Gly Phe Ile His Trp Phe Pro Leu Phe

385 390 395 400

Ser Gly Tyr Thr Leu Asp Gln Thr Tyr Ala Lys Ile His Phe Thr Ile

405 410 415

Met Phe Ile Gly Val Asn Leu Thr Phe Phe Pro Gln His Phe Leu Gly

420 425 430

Leu Ser Gly Met Pro Arg Arg Tyr Ser Asp Tyr Pro Asp Ala Tyr Thr

435 440 445

Thr Trp Asn Ile Leu Ser Ser Val Gly Ser Phe Ile Ser Leu Thr Ala

450 455 460

Val Met Leu Met Ile Phe Met Ile Trp Glu Ala Phe Ala Ser Lys Arg

465 470 475 480

Lys Val Leu Met Val Glu Glu Pro Ser Met Asn Leu Glu Trp Leu Tyr

485 490 495

Gly Cys Pro Pro Pro Tyr His Thr Phe Glu Glu Pro Val Tyr Met Lys

500 505 510

Ala Gly Met Pro Phe Leu Thr Gly Phe Tyr Ser Lys Asp His Ile Ile

515 520 525

Glu Thr Ala Asn Met Ser Tyr Thr Asn Ala Trp Ala Leu Ser Ile Thr

530 535 540

Leu Ile Ala Thr Ser Leu Thr Ser Ala Tyr Ser Thr Arg Met Ile Leu

545 550 555 560

Leu Thr Leu Thr Gly Gln Pro Arg Phe Pro Thr Leu Thr Asn Ile Asn

565 570 575

Glu Asn Asn Pro Thr Leu Leu Asn Pro Ile Lys Arg Leu Ala Ala Gly

580 585 590

Ser Leu Phe Ala Gly Phe Leu Ile Thr Asn Asn Ile Ser Pro Ala Ser

595 600 605

Pro Phe Gln Thr Thr Ile Pro Leu Tyr Leu Lys Leu Thr Ala Leu Ala

610 615 620

Val Thr Phe Leu Gly Leu Leu Thr Ala Leu Asp Leu Asn Tyr Leu Thr

625 630 635 640

Asn Lys Leu Lys Met Lys Ser Pro Leu Cys Thr Phe Tyr Phe Ser Asn

645 650 655

Met Leu Gly Phe Tyr Pro Ser Ile Thr His Arg Thr Ile Pro Tyr Leu

660 665 670

Gly Leu Leu Thr Ser Gln Asn Leu Pro Leu Leu Leu Leu Asp Leu Thr

675 680 685

Trp Leu Glu Lys Leu Leu Pro Lys Thr Ile Ser Gln His Gln Ile Ser

690 695 700

Thr Ser Ile Ile Thr Ser Thr Gln Lys Gly Met Ile Lys Leu Tyr Phe

705 710 715 720

Leu Ser Phe Phe Phe Pro Leu Ile Leu Thr Leu Leu Leu Ile Thr Xaa

725 730 735

<210> 44

<211> 269

<212> PRT

<213> Artificial

<220>

<223> 推定的蛋白序列

<220>

<221> misc_feature

<222> (269)..(269)

<223> Xaa可以是任何天然存在的氨基酸

<400> 44

Met Ala His Ala Ala Gln Val Gly Leu Gln Asp Ala Thr Ser Pro Ile

1 5 10 15

Met Glu Glu Leu Ile Thr Phe His Asp His Ala Leu Met Ile Ile Phe

20 25 30

Leu Ile Cys Phe Leu Val Leu Tyr Ala Leu Phe Leu Thr Leu Thr Thr

35 40 45

Lys Leu Thr Asn Thr Asn Ile Ser Asp Ala Gln Glu Met Glu Thr Ala

50 55 60

Asn Met Ser Tyr Thr Asn Ala Trp Ala Leu Ser Ile Thr Leu Ile Ala

65 70 75 80

Thr Ser Leu Thr Ser Ala Tyr Ser Thr Arg Met Ile Leu Leu Thr Leu

85 90 95

Thr Gly Gln Pro Arg Phe Pro Thr Leu Thr Asn Ile Asn Glu Asn Asn

100 105 110

Pro Thr Leu Leu Asn Pro Ile Lys Arg Leu Ala Ala Gly Ser Leu Phe

115 120 125

Ala Gly Phe Leu Ile Thr Asn Asn Ile Ser Pro Ala Ser Pro Phe Gln

130 135 140

Thr Thr Ile Pro Leu Tyr Leu Lys Leu Thr Ala Leu Ala Val Thr Phe

145 150 155 160

Leu Gly Leu Leu Thr Ala Leu Asp Leu Asn Tyr Leu Thr Asn Lys Leu

165 170 175

Lys Met Lys Ser Pro Leu Cys Thr Phe Tyr Phe Ser Asn Met Leu Gly

180 185 190

Phe Tyr Pro Ser Ile Thr His Arg Thr Ile Pro Tyr Leu Gly Leu Leu

195 200 205

Thr Ser Gln Asn Leu Pro Leu Leu Leu Leu Asp Leu Thr Trp Leu Glu

210 215 220

Lys Leu Leu Pro Lys Thr Ile Ser Gln His Gln Ile Ser Thr Ser Ile

225 230 235 240

Ile Thr Ser Thr Gln Lys Gly Met Ile Lys Leu Tyr Phe Leu Ser Phe

245 250 255

Phe Phe Pro Leu Ile Leu Thr Leu Leu Leu Ile Thr Xaa

260 265

<210> 45

<211> 262

<212> PRT

<213> Artificial

<220>

<223> 推定的蛋白序列

<220>

<221> misc_feature

<222> (262)..(262)

<223> Xaa可以是任何天然存在的氨基酸

<400> 45

Met Ala His Ala Ala Gln Val Gly Leu Gln Asp Ala Thr Ser Pro Ile

1 5 10 15

Met Glu Glu Leu Ile Thr Phe His Asp His Ala Leu Met Ile Ile Phe

20 25 30

Leu Ile Cys Phe Leu Val Leu Tyr Ala Leu Phe Leu Thr Leu Thr Thr

35 40 45

Lys Leu Thr Asn Thr Asn Ile Ser Asp Ala Gln Glu Met Glu Thr Val

50 55 60

Trp Thr Ile Leu Pro Ala Ile Ile Leu Val Leu Ile Ala Leu Pro Ser

65 70 75 80

Leu Arg Ile Leu Tyr Met Thr Asp Glu Val Asn Asp Pro Ser Leu Thr

85 90 95

Ile Lys Ser Ile Gly His Gln Trp Tyr Trp Thr Tyr Glu Tyr Thr Asp

100 105 110

Tyr Gly Gly Leu Ile Phe Asn Ser Tyr Met Leu Pro Pro Leu Phe Leu

115 120 125

Glu Pro Gly Asp Leu Arg Leu Leu Asp Val Asp Asn Arg Val Val Leu

130 135 140

Pro Ile Glu Ala Pro Ile Arg Met Met Ile Thr Ser Gln Asp Val Leu

145 150 155 160

His Ser Trp Ala Val Pro Thr Leu Gly Leu Lys Thr Asp Ala Ile Pro

165 170 175

Gly Arg Leu Asn Gln Thr Thr Phe Thr Ala Thr Arg Pro Gly Val Tyr

180 185 190

Tyr Gly Gln Cys Ser Glu Ile Cys Gly Ala Asn His Ser Phe Met Pro

195 200 205

Ile Val Leu Asp Leu Thr Trp Leu Glu Lys Leu Leu Pro Lys Thr Ile

210 215 220

Ser Gln His Gln Ile Ser Thr Ser Ile Ile Thr Ser Thr Gln Lys Gly

225 230 235 240

Met Ile Lys Leu Tyr Phe Leu Ser Phe Phe Phe Pro Leu Ile Leu Thr

245 250 255

Leu Leu Leu Ile Thr Xaa

260

<210> 46

<211> 635

<212> PRT

<213> Artificial

<220>

<223> 推定的蛋白序列

<220>

<221> misc_feature

<222> (635)..(635)

<223> Xaa可以是任何天然存在的氨基酸

<400> 46

Met Asn Glu Asn Leu Phe Ala Ser Phe Ile Ala Pro Thr Ile Leu Gly

1 5 10 15

Leu Pro Ala Ala Val Leu Ile Ile Leu Phe Pro Pro Leu Leu Ile Pro

20 25 30

Thr Ser Lys Tyr Leu Ile Asn Asn Arg Leu Ile Thr Thr Gln Gln Trp

35 40 45

Leu Ile Lys Leu Thr Ser Lys Gln Met Met Thr Met His Asn Thr Lys

50 55 60

Gly Arg Thr Trp Ser Leu Met Leu Val Ser Leu Ile Ile Phe Ile Ala

65 70 75 80

Thr Thr Asn Leu Leu Gly Leu Leu Pro His Ser Phe Thr Pro Thr Thr

85 90 95

Gln Leu Ser Met Asn Leu Ala Met Ala Ile Pro Leu Trp Ala Gly Thr

100 105 110

Val Ile Met Gly Phe Arg Ser Lys Ile Lys Asn Ala Leu Ala His Phe

115 120 125

Leu Pro Gln Gly Thr Pro Thr Pro Leu Ile Pro Met Leu Val Ile Ile

130 135 140

Glu Thr Ile Ser Leu Leu Ile Gln Pro Met Ala Leu Ala Val Arg Leu

145 150 155 160

Thr Ala Asn Ile Thr Ala Gly His Leu Leu Met His Leu Ile Gly Ser

165 170 175

Ala Thr Leu Ala Met Ser Thr Ile Asn Leu Pro Ser Thr Leu Ile Ile

180 185 190

Phe Thr Ile Leu Ile Leu Leu Thr Ile Leu Glu Ile Ala Val Ala Leu

195 200 205

Ile Gln Ala Tyr Val Phe Thr Leu Leu Val Ser Leu Tyr Leu His Ser

210 215 220

Asn Ser Trp Asp Pro Gln Gln Met Ala Leu Leu Asn Ala Asn Pro Ser

225 230 235 240

Leu Thr Pro Leu Leu Gly Leu Leu Leu Ala Ala Ala Gly Lys Ser Ala

245 250 255

Gln Leu Gly Leu His Pro Trp Leu Pro Ser Ala Met Glu Gly Pro Thr

260 265 270

Pro Val Ser Ala Leu Leu His Ser Ser Thr Met Val Val Ala Gly Ile

275 280 285

Phe Leu Leu Ile Arg Phe His Pro Leu Ala Glu Asn Ser Pro Leu Ile

290 295 300

Gln Thr Leu Thr Leu Cys Leu Gly Ala Ile Thr Thr Leu Phe Ala Ala

305 310 315 320

Val Cys Ala Leu Thr Gln Asn Asp Ile Lys Lys Ile Val Ala Phe Ser

325 330 335

Thr Ser Ser Gln Leu Gly Leu Met Met Val Thr Ile Gly Ile Asn Gln

340 345 350

Pro His Leu Ala Phe Leu His Ile Cys Thr His Ala Phe Phe Lys Ala

355 360 365

Met Leu Phe Met Cys Ser Gly Ser Ile Ile His Asn Leu Asn Asn Glu

370 375 380

Gln Asp Ile Arg Lys Met Gly Gly Leu Leu Lys Thr Met Pro Leu Thr

385 390 395 400

Ser Thr Ser Leu Thr Ile Gly Ser Leu Ala Leu Ala Gly Met Pro Phe

405 410 415

Leu Thr Gly Phe Tyr Ser Lys Asp His Ile Ile Glu Thr Ala Asn Met

420 425 430

Ser Tyr Thr Asn Ala Trp Ala Leu Ser Ile Thr Leu Ile Ala Thr Ser

435 440 445

Leu Thr Ser Ala Tyr Ser Thr Arg Met Ile Leu Leu Thr Leu Thr Gly

450 455 460

Gln Pro Arg Phe Pro Thr Leu Thr Asn Ile Asn Glu Asn Asn Pro Thr

465 470 475 480

Leu Leu Asn Pro Ile Lys Arg Leu Ala Ala Gly Ser Leu Phe Ala Gly

485 490 495

Phe Leu Ile Thr Asn Asn Ile Ser Pro Ala Ser Pro Phe Gln Thr Thr

500 505 510

Ile Pro Leu Tyr Leu Lys Leu Thr Ala Leu Ala Val Thr Phe Leu Gly

515 520 525

Leu Leu Thr Ala Leu Asp Leu Asn Tyr Leu Thr Asn Lys Leu Lys Met

530 535 540

Lys Ser Pro Leu Cys Thr Phe Tyr Phe Ser Asn Met Leu Gly Phe Tyr

545 550 555 560

Pro Ser Ile Thr His Arg Thr Ile Pro Tyr Leu Gly Leu Leu Thr Ser

565 570 575

Gln Asn Leu Pro Leu Leu Leu Leu Asp Leu Thr Trp Leu Glu Lys Leu

580 585 590

Leu Pro Lys Thr Ile Ser Gln His Gln Ile Ser Thr Ser Ile Ile Thr

595 600 605

Ser Thr Gln Lys Gly Met Ile Lys Leu Tyr Phe Leu Ser Phe Phe Phe

610 615 620

Pro Leu Ile Leu Thr Leu Leu Leu Ile Thr Xaa

625 630 635

<210> 47

<211> 515

<212> PRT

<213> Artificial

<220>

<223> 推定的蛋白序列

<220>

<221> misc_feature

<222> (515)..(515)

<223> Xaa可以是任何天然存在的氨基酸

<400> 47

Met Thr His Gln Ser His Ala Tyr His Met Val Lys Pro Ser Pro Trp

1 5 10 15

Pro Leu Thr Gly Ala Leu Ser Ala Leu Leu Met Thr Ser Gly Leu Ala

20 25 30

Met Trp Phe His Phe His Ser Met Thr Leu Leu Met Leu Gly Leu Leu

35 40 45

Thr Asn Thr Leu Thr Met Tyr Gln Trp Trp Arg Asp Val Thr Arg Glu

50 55 60

Ser Thr Tyr Gln Gly His His Thr Pro Pro Val Gln Lys Gly Leu Arg

65 70 75 80

Tyr Gly Met Ile Leu Phe Ile Thr Ser Glu Val Phe Phe Phe Ala Gly

85 90 95

Phe Phe Trp Ala Phe Tyr His Ser Ser Leu Ala Pro Thr Pro Gln Leu

100 105 110

Gly Gly His Trp Pro Pro Thr Gly Ile Thr Pro Leu Leu Gly Leu Leu

115 120 125

Leu Ala Ala Ala Gly Lys Ser Ala Gln Leu Gly Leu His Pro Trp Leu

130 135 140

Pro Ser Ala Met Glu Gly Pro Thr Pro Val Ser Ala Leu Leu His Ser

145 150 155 160

Ser Thr Met Val Val Ala Gly Ile Phe Leu Leu Ile Arg Phe His Pro

165 170 175

Leu Ala Glu Asn Ser Pro Leu Ile Gln Thr Leu Thr Leu Cys Leu Gly

180 185 190

Ala Ile Thr Thr Leu Phe Ala Ala Val Cys Ala Leu Thr Gln Asn Asp

195 200 205

Ile Lys Lys Ile Val Ala Phe Ser Thr Ser Ser Gln Leu Gly Leu Met

210 215 220

Met Val Thr Ile Gly Ile Asn Gln Pro His Leu Ala Phe Leu His Ile

225 230 235 240

Cys Thr His Ala Phe Phe Lys Ala Met Leu Phe Met Cys Ser Gly Ser

245 250 255

Ile Ile His Asn Leu Asn Asn Glu Gln Asp Ile Arg Lys Met Gly Gly

260 265 270

Leu Leu Lys Thr Met Pro Leu Thr Ser Thr Ser Leu Thr Ile Gly Ser

275 280 285

Leu Ala Leu Ala Gly Met Pro Phe Leu Thr Gly Phe Tyr Ser Lys Asp

290 295 300

His Ile Ile Glu Thr Ala Asn Met Ser Tyr Thr Asn Ala Trp Ala Leu

305 310 315 320

Ser Ile Thr Leu Ile Ala Thr Ser Leu Thr Ser Ala Tyr Ser Thr Arg

325 330 335

Met Ile Leu Leu Thr Leu Thr Gly Gln Pro Arg Phe Pro Thr Leu Thr

340 345 350

Asn Ile Asn Glu Asn Asn Pro Thr Leu Leu Asn Pro Ile Lys Arg Leu

355 360 365

Ala Ala Gly Ser Leu Phe Ala Gly Phe Leu Ile Thr Asn Asn Ile Ser

370 375 380

Pro Ala Ser Pro Phe Gln Thr Thr Ile Pro Leu Tyr Leu Lys Leu Thr

385 390 395 400

Ala Leu Ala Val Thr Phe Leu Gly Leu Leu Thr Ala Leu Asp Leu Asn

405 410 415

Tyr Leu Thr Asn Lys Leu Lys Met Lys Ser Pro Leu Cys Thr Phe Tyr

420 425 430

Phe Ser Asn Met Leu Gly Phe Tyr Pro Ser Ile Thr His Arg Thr Ile

435 440 445

Pro Tyr Leu Gly Leu Leu Thr Ser Gln Asn Leu Pro Leu Leu Leu Leu

450 455 460

Asp Leu Thr Trp Leu Glu Lys Leu Leu Pro Lys Thr Ile Ser Gln His

465 470 475 480

Gln Ile Ser Thr Ser Ile Ile Thr Ser Thr Gln Lys Gly Met Ile Lys

485 490 495

Leu Tyr Phe Leu Ser Phe Phe Phe Pro Leu Ile Leu Thr Leu Leu Leu

500 505 510

Ile Thr Xaa

515

<210> 48

<211> 543

<212> PRT

<213> Artificial

<220>

<223> 推定的蛋白序列

<220>

<221> misc_feature

<222> (543)..(543)

<223> Xaa可以是任何天然存在的氨基酸

<400> 48

Met Asn Phe Ala Leu Ile Leu Met Ile Asn Thr Leu Leu Ala Leu Leu

1 5 10 15

Leu Met Ile Ile Thr Phe Trp Leu Pro Gln Leu Asn Gly Tyr Met Glu

20 25 30

Lys Ser Thr Pro Tyr Glu Cys Gly Phe Asp Pro Met Ser Pro Ala Arg

35 40 45

Val Pro Phe Ser Met Lys Phe Phe Leu Val Ala Ile Thr Phe Leu Leu

50 55 60

Phe Asp Leu Glu Ile Ala Leu Leu Leu Pro Leu Pro Trp Ala Leu Gln

65 70 75 80

Thr Thr Asn Leu Pro Leu Met Val Met Ser Ser Leu Leu Leu Ile Ile

85 90 95

Ile Leu Ala Leu Ser Leu Ala Asn Thr Ala Ala Ile Gln Ala Ile Leu

100 105 110

Tyr Asn Arg Ile Gly Asp Ile Gly Phe Ile Leu Ala Leu Ala Trp Phe

115 120 125

Ile Leu His Ser Asn Ser Trp Asp Pro Gln Gln Met Ala Leu Leu Asn

130 135 140

Ala Asn Pro Ser Leu Thr Pro Leu Leu Gly Leu Leu Leu Ala Ala Ala

145 150 155 160

Gly Lys Ser Ala Gln Leu Gly Leu His Pro Trp Leu Pro Ser Ala Met

165 170 175

Glu Gly Pro Thr Pro Val Ser Ala Leu Leu His Ser Ser Thr Met Val

180 185 190

Val Ala Gly Ile Phe Leu Leu Ile Arg Phe His Pro Leu Ala Glu Asn

195 200 205

Ser Pro Leu Ile Gln Thr Leu Thr Leu Cys Leu Gly Ala Ile Thr Thr

210 215 220

Leu Phe Ala Ala Val Cys Ala Leu Thr Gln Asn Asp Ile Lys Lys Ile

225 230 235 240

Val Ala Phe Ser Thr Ser Ser Gln Leu Gly Leu Met Met Val Thr Ile

245 250 255

Gly Ile Asn Gln Pro His Leu Ala Phe Leu His Ile Cys Thr His Ala

260 265 270

Phe Phe Lys Ala Met Leu Phe Met Cys Ser Gly Ser Ile Ile His Asn

275 280 285

Leu Asn Asn Glu Gln Asp Ile Arg Lys Met Gly Gly Leu Leu Lys Thr

290 295 300

Met Pro Leu Thr Ser Thr Ser Leu Thr Ile Gly Ser Leu Ala Leu Ala

305 310 315 320

Gly Met Pro Phe Leu Thr Gly Phe Tyr Ser Lys Asp His Ile Ile Glu

325 330 335

Thr Ala Asn Met Ser Tyr Thr Asn Ala Trp Ala Leu Ser Ile Thr Leu

340 345 350

Ile Ala Thr Ser Leu Thr Ser Ala Tyr Ser Thr Arg Met Ile Leu Leu

355 360 365

Thr Leu Thr Gly Gln Pro Arg Phe Pro Thr Leu Thr Asn Ile Asn Glu

370 375 380

Asn Asn Pro Thr Leu Leu Asn Pro Ile Lys Arg Leu Ala Ala Gly Ser

385 390 395 400

Leu Phe Ala Gly Phe Leu Ile Thr Asn Asn Ile Ser Pro Ala Ser Pro

405 410 415

Phe Gln Thr Thr Ile Pro Leu Tyr Leu Lys Leu Thr Ala Leu Ala Val

420 425 430

Thr Phe Leu Gly Leu Leu Thr Ala Leu Asp Leu Asn Tyr Leu Thr Asn

435 440 445

Lys Leu Lys Met Lys Ser Pro Leu Cys Thr Phe Tyr Phe Ser Asn Met

450 455 460

Leu Gly Phe Tyr Pro Ser Ile Thr His Arg Thr Ile Pro Tyr Leu Gly

465 470 475 480

Leu Leu Thr Ser Gln Asn Leu Pro Leu Leu Leu Leu Asp Leu Thr Trp

485 490 495

Leu Glu Lys Leu Leu Pro Lys Thr Ile Ser Gln His Gln Ile Ser Thr

500 505 510

Ser Ile Ile Thr Ser Thr Gln Lys Gly Met Ile Lys Leu Tyr Phe Leu

515 520 525

Ser Phe Phe Phe Pro Leu Ile Leu Thr Leu Leu Leu Ile Thr Xaa

530 535 540

<210> 49

<211> 43

<212> PRT

<213> Artificial

<220>

<223> 推定的蛋白序列

<220>

<221> misc_feature

<222> (43)..(43)

<223> Xaa可以是任何天然存在的氨基酸

<400> 49

Met Pro Gln Leu Asn Thr Thr Val Trp Pro Thr Met Ile Thr Pro Met

1 5 10 15

Leu Leu Thr Leu Phe Leu Ile Thr Gln Leu Lys Met Leu Asn Thr Asn

20 25 30

Tyr His Leu Pro Pro Ser Pro Leu Ala Ala Xaa

35 40

<210> 50

<211> 951

<212> RNA

<213> 人

<400> 50

augaacgaaa aucuguucgc uucauucauu gcccccacaa uccuaggccu acccgccgca 60

guacugauca uucuauuucc cccucuauug auccccaccu ccaaauaucu caucaacaac 120

cgacuaauca ccacccaaca augacuaauc aaacuaaccu caaaacaaau gauaaccaua 180

cacaacacua aaggacgaac cugaucucuu auacuaguau ccuuaaucau uuuuauugcc 240

acaacuaacc uccucggacu ccugccucac ucauuuacac caaccaccca acuaucuaua 300

aaccuagcca uggccauccc cuuaugagcg ggcacaguga uuauaggcuu ucgcucuaag 360

auuaaaaaug cccuagccca cuucuuacca caaggcacac cuacaccccu uauccccaua 420

cuaguuauua ucgaaaccau cagccuacuc auucaaccaa uagcccuggc cguacgccua 480

accgcuaaca uuacugcagg ccaccuacuc augcaccuaa uuggaagcgc cacccuagca 540

auaucaacca uuaaccuucc cucuacacuu aucaucuuca caauucuaau ucuacugacu 600

auccuagaaa ucgcugucac uuuccuagga cuucuaacag cccuagaccu caacuaccua 660

accaacaaac uuaaaauaaa auccccacua ugcacauuuu auuucuccaa cauacucgga 720

uucuacccua gcaucacaca ccgcacaauc cccuaucuag gccuucuuac gagccaaaac 780

cugccccuac uccuccuaga ccuaaccuga cuagaaaagc uauuaccuaa aacaauuuca 840

cagcaccaaa ucuccaccuc caucaucacc ucaacccaaa aaggcauaau uaaacuuuac 900

uuccucucuu ucuucuuccc acucauccua acccuacucc uaaucacaua a 951

<210> 51

<211> 951

<212> DNA

<213> Artificial

<220>

<223> cDNA

<400> 51

atgaacgaaa atctgttcgc ttcattcatt gcccccacaa tcctaggcct acccgccgca 60

gtactgatca ttctatttcc ccctctattg atccccacct ccaaatatct catcaacaac 120

cgactaatca ccacccaaca atgactaatc aaactaacct caaaacaaat gataaccata 180

cacaacacta aaggacgaac ctgatctctt atactagtat ccttaatcat ttttattgcc 240

acaactaacc tcctcggact cctgcctcac tcatttacac caaccaccca actatctata 300

aacctagcca tggccatccc cttatgagcg ggcacagtga ttataggctt tcgctctaag 360

attaaaaatg ccctagccca cttcttacca caaggcacac ctacacccct tatccccata 420

ctagttatta tcgaaaccat cagcctactc attcaaccaa tagccctggc cgtacgccta 480

accgctaaca ttactgcagg ccacctactc atgcacctaa ttggaagcgc caccctagca 540

atatcaacca ttaaccttcc ctctacactt atcatcttca caattctaat tctactgact 600

atcctagaaa tcgctgtcac tttcctagga cttctaacag ccctagacct caactaccta 660

accaacaaac ttaaaataaa atccccacta tgcacatttt atttctccaa catactcgga 720

ttctacccta gcatcacaca ccgcacaatc ccctatctag gccttcttac gagccaaaac 780

ctgcccctac tcctcctaga cctaacctga ctagaaaagc tattacctaa aacaatttca 840

cagcaccaaa tctccacctc catcatcacc tcaacccaaa aaggcataat taaactttac 900

ttcctctctt tcttcttccc actcatccta accctactcc taatcacata a 951

<210> 52

<211> 317

<212> PRT

<213> Artificial

<220>

<223> 推定的蛋白序列

<220>

<221> misc_feature

<222> (317)..(317)

<223> Xaa可以是任何天然存在的氨基酸

<400> 52

Met Asn Glu Asn Leu Phe Ala Ser Phe Ile Ala Pro Thr Ile Leu Gly

1 5 10 15

Leu Pro Ala Ala Val Leu Ile Ile Leu Phe Pro Pro Leu Leu Ile Pro

20 25 30

Thr Ser Lys Tyr Leu Ile Asn Asn Arg Leu Ile Thr Thr Gln Gln Trp

35 40 45

Leu Ile Lys Leu Thr Ser Lys Gln Met Met Thr Met His Asn Thr Lys

50 55 60

Gly Arg Thr Trp Ser Leu Met Leu Val Ser Leu Ile Ile Phe Ile Ala

65 70 75 80

Thr Thr Asn Leu Leu Gly Leu Leu Pro His Ser Phe Thr Pro Thr Thr

85 90 95

Gln Leu Ser Met Asn Leu Ala Met Ala Ile Pro Leu Trp Ala Gly Thr

100 105 110

Val Ile Met Gly Phe Arg Ser Lys Ile Lys Asn Ala Leu Ala His Phe

115 120 125

Leu Pro Gln Gly Thr Pro Thr Pro Leu Ile Pro Met Leu Val Ile Ile

130 135 140

Glu Thr Ile Ser Leu Leu Ile Gln Pro Met Ala Leu Ala Val Arg Leu

145 150 155 160

Thr Ala Asn Ile Thr Ala Gly His Leu Leu Met His Leu Ile Gly Ser

165 170 175

Ala Thr Leu Ala Met Ser Thr Ile Asn Leu Pro Ser Thr Leu Ile Ile

180 185 190

Phe Thr Ile Leu Ile Leu Leu Thr Ile Leu Glu Ile Ala Val Thr Phe

195 200 205

Leu Gly Leu Leu Thr Ala Leu Asp Leu Asn Tyr Leu Thr Asn Lys Leu

210 215 220

Lys Met Lys Ser Pro Leu Cys Thr Phe Tyr Phe Ser Asn Met Leu Gly

225 230 235 240

Phe Tyr Pro Ser Ile Thr His Arg Thr Ile Pro Tyr Leu Gly Leu Leu

245 250 255

Thr Ser Gln Asn Leu Pro Leu Leu Leu Leu Asp Leu Thr Trp Leu Glu

260 265 270

Lys Leu Leu Pro Lys Thr Ile Ser Gln His Gln Ile Ser Thr Ser Ile

275 280 285

Ile Thr Ser Thr Gln Lys Gly Met Ile Lys Leu Tyr Phe Leu Ser Phe

290 295 300

Phe Phe Pro Leu Ile Leu Thr Leu Leu Leu Ile Thr Xaa

305 310 315

Claims

1.一种与癌症相关的分离的线粒体融合转录物，其中所述转录物包括在SEQ ID NO:19中所阐述的核酸序列。

2.根据权利要求1所述的分离的线粒体融合转录物，其中，所述癌症为前列腺癌、睾丸癌、卵巢癌、乳腺癌、结肠直肠癌、肺癌、黑色素瘤皮肤癌或者它们的组合。

3.一种线粒体融合蛋白，对应于权利要求1或2所述的融合转录物或者具有在SEQ IDNO:35中所阐述的氨基酸序列。

4.一种编码权利要求1或2所述的融合转录物的分离的线粒体DNA(mtDNA)分子。

5.根据权利要求4所述的分离的mtDNA，其中所述mtDNA分子包括在SEQ ID NO:3中所阐述的核酸序列。

6.一种杂交探针，包括与根据权利要求1或2所述的线粒体融合转录物或者权利要求4或5所述的mtDNA中的至少一部分互补的核酸序列，其中所述部分包括剪接的基因的连接点。

7.一种用于检测与癌症相关的至少一种线粒体融合转录物存在的组合物，所述组合物包括具有与根据权利要求1或2所述的线粒体融合转录物中的至少一部分互补的核酸序列的杂交探针，其中所述部分包括剪接的基因的连接点。

8.一种用于检测与癌症相关的至少一种异常mtDNA存在的组合物，所述组合物包括具有与根据权利要求4所述的mtDNA中的至少一部分互补的核酸序列的杂交探针，其中所述部分包括剪接的基因的连接点。

9.根据权利要求7所述的组合物，其中，所述癌症为前列腺癌、睾丸癌、卵巢癌、乳腺癌、或结肠直肠癌中的一种或多种。

10.根据权利要求8所述的组合物，其中，所述癌症为前列腺癌、睾丸癌、卵巢癌、乳腺癌、或结肠直肠癌中的一种或多种。

11.根据权利要求9或10所述的组合物，其中进行所述检测：

a)使用至少一种所述探针来进行杂交反应，以允许至少一种所述探针杂交至互补的线粒体融合转录物或mtDNA；

b)通过对杂交至至少一种所述探针的所述转录物或mtDNA的量进行定量，来对所述样品中的所述至少一种线粒体融合转录物或mtDNA的量进行定量；以及

c)将所述样品中的所述线粒体融合转录物或mtDNA的量与至少一种已知参照值进行比较。

12.根据权利要求11所述的组合物，其中所述检测使用诊断成像技术来进行。

13.根据权利要求12所述的组合物，其中所述诊断成像技术包括高通量微阵列分析。

14.根据权利要求13所述的组合物，其中所述检测使用分支DNA技术来进行。

15.根据权利要求14所述的组合物，其中所述检测使用PCR来进行。

16.一种用于进行测定以检测哺乳动物中存在癌症的试剂盒，所述试剂盒包含与权利要求1或2所述的融合转录物或者根据权利要求4或5所述的mtDNA中的至少一部分互补的至少一种杂交探针，其中所述部分包括剪接的基因的连接点。