CN107011428A - 异常线粒体dna、相关的融合转录物及其杂交探针 - Google Patents

异常线粒体dna、相关的融合转录物及其杂交探针 Download PDF

Info

Publication number
CN107011428A
CN107011428A CN201710183734.1A CN201710183734A CN107011428A CN 107011428 A CN107011428 A CN 107011428A CN 201710183734 A CN201710183734 A CN 201710183734A CN 107011428 A CN107011428 A CN 107011428A
Authority
CN
China
Prior art keywords
leu
thr
ile
ala
ser
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710183734.1A
Other languages
English (en)
Other versions
CN107011428B (zh
Inventor
瑞安·帕尔
布赖恩·赖古伊
加布里埃尔·达库波
珍妮弗·克里德
凯丽·鲁滨逊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mdna Life Sciences Ltd
Original Assignee
Mdna Life Sciences Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mdna Life Sciences Ltd filed Critical Mdna Life Sciences Ltd
Publication of CN107011428A publication Critical patent/CN107011428A/zh
Application granted granted Critical
Publication of CN107011428B publication Critical patent/CN107011428B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4748Tumour specific antigens; Tumour rejection antigen precursors [TRAP], e.g. MAGE
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B30/00Methods of screening libraries
    • C40B30/04Methods of screening libraries by measuring the ability to specifically bind a target molecule, e.g. antibody-antigen binding, receptor-ligand binding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Abstract

本发明提供了异常线粒体DNA、相关的融合转录物及其杂交探针。本发明提供用于预测、诊断和/或监测癌症的新型线粒体融合转录物和亲代突变的mtDNA分子。本发明还提供在本发明的方法中使用的和它们互补的杂交探针。

Description

异常线粒体DNA、相关的融合转录物及其杂交探针
本申请是申请日为2009年3月27日,申请号为200980114773.X,发明名称为“异常线粒体DNA、相关的融合转录物及其杂交探针”的发明专利申请的分案申请。
技术领域
本发明涉及线粒体基因组领域。在一个方面中,本发明涉及线粒体基因组融合转录物和杂交至所述线粒体基因组融合转录物的探针的鉴定和使用。
背景技术
线粒体基因组
线粒体基因组是紧凑但却至关重要的核酸序列。与33亿核酸碱基对(bp)的庞大核基因组(单倍体)相反,线粒体DNA或“mtDNA”包含16,569个bp的小基因组(Anderson等人,1981;Andrews等人,1999)。其遗传互补体比核细胞配对物小得多(0.0005%)。然而,个体细胞带有103至104中任意数目的线粒体,这取决于特定的细胞功能(Singh和Modica-Napolitano 2002)。在细胞核和线粒体基因组之间一般存在通讯或化学信号转导(Sherratt等人,1997)。而且,特定的细胞核组分负责线粒体序列的维持和完整性(Croteau等人,1999)。一旦发生受精,由于卵细胞中线粒体的克隆扩充,给定个体中所有mtDNA基因组是相同的。然而,诱变事件可引起反映为体细胞突变的序列多样性。这些突变可在全身的不同组织中在已知为异质性的条件下累积。
线粒体蛋白质组
需要约3,000种核基因来构建、操作和维持线粒体,其中只有37种由线粒体基因组编码,这表明了线粒体对核基因座的严重依赖。线粒体基因组编码24个基因的互补体,包括确保对于电子转移来说重要的其它13个基因的正确翻译的2个rRNA和22个tRNA(参见图1)。除了13种由线粒体基因组供应的多肽,线粒体基因组依赖于70种核编码蛋白以完成对于该重要功能而言必需的氧化和还原反应。核和线粒体蛋白形成跨越内线粒体膜的复合体,并且总体上产生80-90%的细胞代谢所需要的化学燃料腺苷三磷酸或ATP。除了产生能量,线粒体在其他代谢途径中也起到了重要作用。线粒体的重要功能是介导细胞死亡或凋亡(参见Green和Kroemer,2005)。实质上,存在渗透外线粒体膜或另外也渗透内线粒体膜的信号途径。当特定的线粒体蛋白释放到细胞溶胶中时,启动了不可逆的细胞死亡。该过程强调了一些线粒体蛋白具有的多功能作用。这些多任务(multi-tasking)蛋白表明还存在其他可具有替换功能的线粒体蛋白。
线粒体融合转录物组
线粒体基因组是不同寻常的,因为其是环状无内含子DNA分子。所述基因组散布有在特定长度的序列侧翼的重复模体。这些重复模体之间的序列易于在未被充分理解的情况下缺失。考虑到线粒体基因组中的重复模体的数量,存在许多可能的缺失。最有名的例子是4977“常见缺失”。该缺失和一些据称的病症与疾病相关,并且被认为增加衰老的频率(Dai等人,2004;Ro等人,2003;Barron等人,2001;Lewis等人,2000;Muller-Hocker,1998;Porteous等人,1998)(图4)。在线粒体基因组领域中目前的观点是线粒体缺失物只是通过诸如反应性氧物质之类的试剂和UVR损害线粒体基因组的有害的副产物(Krishnan等人,2008,Nature Genetics)。此外,尽管认识到由于缺少细胞修复所必需的基因序列,因此高水平的mtDNA缺失可对于细胞产生ATP形式的能量的能量产生严重的后果,但是没有预期到这些缺失的线粒体分子可以是下游途径的组分,具有期望的功能作用,并且可能可以更适合被认为是本申请人已经预期的的线粒体的识别的基因的替换天然形式。
mtDNA的序列动力学是重要的诊断工具。mtDNA中的突变通常是正在发生的疾病的初步指示物。例如,已经证实线粒体基因组中的点突变是前列腺中的肿瘤病灶的特征。这种趋势还延伸至和肿瘤组织相邻与远离的表现正常的组织(Parr等人,2006)。这表明线粒体突变在恶性转化途径早期发生。
例如,3.4kb线粒体缺失的频率在识别良性和恶性前列腺组织中具有优异的实用性(Maki等人,2008)。
线粒体融合转录物之前在文献中首先在大豆中报道过(Morgens等人,1984),然后在患有Kearns-Sayre综合症(罕见的神经肌肉障碍)的两个患者中报道过(Nakase等人,1990)。重要地,这些转录物未被发现和任何人的癌症相关(或未对于和任何人类癌症的相关进行研究)。
发明内容
本发明的目的是提供异常线粒体DNA、及其相关的融合转录物和杂交探针。
依照本发明的方面,提供一种和癌症相关的分离的线粒体融合转录物。
依照本发明的方面,提供一种线粒体融合蛋白,其对应于上述融合转录物,并且具有SEQ ID NO:34至49和52中的任一者所阐述的序列。
依照本发明的另一个方面,提供一种编码本发明的融合转录物的分离的mtDNA。
依照本发明的另一个方面,提供一种杂交探针,其具有和本发明的线粒体融合转录物或者mtDNA中的至少一部分互补的核酸序列。
依照本发明的另一个方面,提供一种检测哺乳动物中的癌症的方法,该方法包括通过使样品和至少一种杂交探针杂交来测定来自所述哺乳动物的组织样品中存在和癌症相关的至少一种线粒体融合转录物,所述至少一种杂交探针具有和根据本发明的线粒体融合转录物中的至少一部分互补的核酸序列。
依照本发明的另一个方面,提供一种检测哺乳动物中的癌症的方法,该方法包括通过使样品和至少一种杂交探针杂交来测定来自所述哺乳动物的组织样品中存在和癌症相关的至少一种异常mtDNA,所述至少一种杂交探针具有和根据本发明的mtDNA中的至少一部分互补的核酸序列。
依照本发明的另一个方面,提供一种用于进行测定以检测哺乳动物中存在癌症的试剂盒,所述试剂盒包含和本发明的融合转录物或者mtDNA中的至少一部分互补的至少一种杂交探针。
依照本发明的另一个方面,提供一种筛选工具,其包含具有10、100或1000种线粒体融合转录物的微阵列以鉴定和癌症相关的那些线粒体融合转录物。
依照本发明的另一个方面,提供一种筛选工具,其包含具有10、100或1000种对应于线粒体融合转录物的线粒体DNA的微阵列以鉴定和癌症相关的那些线粒体DNA。
照本发明的另一个方面,提供一种筛选工具,其包含具有10、100或1000种线粒体融合转录物的多重分支DNA试样以鉴定和癌症相关的那些线粒体融合转录物。
依照本发明的另一个方面,提供一种筛选工具,包含具有10、100或1000种对应于线粒体融合转录物的线粒体DNA的多重分支DNA试样以鉴定和癌症相关的那些线粒体DNA。
附图说明
现在将参照附图仅通过例子的方式来对本发明的实施方案进行说明,其中:
图1是示出线粒体编码基因的示意图。
图2示出由3.4kb缺失的损失调用的前列腺样品中的聚腺苷酰化(polyadenalated)融合转录物。
图3示出由4977kb常见缺失的损失调用的前列腺样品中的聚腺苷酰化融合转录物。
图4示出由线粒体基因组的3.4kb区段的损失调用的乳房样品中的聚腺苷酰化融合转录物。
图5a和5b示出基因剪接之前和之后线粒体DNA区域的例子。
图6a至6g描述了本发明的转录物2、3、8、9、10、11和12在结肠直肠癌肿瘤的鉴定中的结果。
图7a至7d描述了本发明的转录物6、8、10和20在肺癌肿瘤的鉴定中的结果。
图8a至8g描述了本发明的转录物6、10、11、14、15、16和20在黑色素瘤的鉴定中的结果。
图9a至9h描述了本发明的转录物1、2、3、6、11、12、15和20在卵巢癌的鉴定中的结果。
图10a-图10b至图18a-图18b描述了本发明的转录物2、3、4、11、12、13、15、16和20在睾丸癌的鉴定中的结果。
具体实施方式
发明详述
本发明提供用于预测、诊断和/或监测癌症的新型线粒体融合转录物和亲代突变的mtDNA分子。本发明还提供用于融合转录物和相关的mtDNA分子检测的杂交探针以及这种探针的用途。
定义
除非另外定义,本文中使用的所有技术和科技术语具有和本发明所属领域中的普通技术人员的通常理解相同的意思。
如本文中所使用的,“异常”或“突变”包括野生型线粒体DNA序列中的任何修饰,所述修饰导致形成融合转录物,并且包括但不限于插入、易位、缺失、复制、重组、重排或其组合。
如本文中所定义的,“生物样品”是指含有这样的细胞的组织或体液,从该细胞中可以获得目标分子。例如,生物样品可衍生自组织,例如前列腺、乳房、结肠直肠、肺和皮肤,或衍生自血液、唾液、脑脊液、痰、尿液、黏液、滑液、腹膜液、羊水等。生物样品可以是外科手术样本或活组织检查样本。生物样品可以以得自来源直接使用或者在进行预处理以改变样品的特征后使用。因此,生物样品可以(例如)通过下列方式在使用前进行预处理:从血液中制备血浆或血清、分裂细胞、从固体材料中制备液体、稀释粘性流体、过滤液体、蒸馏液体、浓缩液体、灭活干扰组分、添加试剂等。
“连续”转录物是从剪接的基因的开端到末端都保持阅读框的融合转录物。“末端”转录物是在另一剪接的基因的起始终止密码子前导致形成提前终止密码子的融合转录物。
如本文中所使用的,“线粒体DNA”或“mtDNA”是线粒体中存在的DNA。
如本文中所使用的,表述“线粒体融合转录物”或“融合转录物”是指由于突变的线粒体DNA序列的转录而产生的RNA转录产物,其中这种突变可包括线粒体缺失和其他大量线粒体DNA重排。
计算机分析和序列靶向
如上所讨论的,线粒体融合转录物已经在大豆中报道过(Morgens等人,1984),并在患有罕见的神经肌肉障碍的人中报道过(Nakase等人,1990)。然而,并未描述和人类癌症相关的融合转录物。
使用从对和癌症相关的人线粒体基因组的大量缺失进行作图、对高频率的这些缺失进行观察、和转录活性的突变的mtDNA分子的另一种有机体与另一种疾病类型中的证据获得的知识,申请人假设由于其涉及癌症,因此这些缺失可比DNA分子、以及损害和修复过程重要。为了验证该假设,进行线粒体基因组的计算机分析,特定于重复元件,这表明了许多潜在的缺失位点。在鉴定具有非邻近或非串联位置的线粒体序列中的独特重复的这种初始步骤后,使用过滤器以鉴定那些重复,在引发DNA分子中的缺失事件后,那些重复将可能重新闭合或重新连接以产生具有可读框(ORF)的融合的DNA序列。然后选择18个分子的亚型进行靶向以调查是否:1)它们以人的自然生物状态存在;和2)它们和恶性肿瘤相关。这些研究的结果在下文中描述。
基因组突变
线粒体DNA(mtDNA)动力学是重要的诊断工具。mtDNA中的突变通常是正在发生的疾病的初步指示物,并且起到指示和疾病发作有关的危险因素的生物标记的作用。根据本发明,线粒体基因组中的大量重排突变导致产生给癌症相关的融合转录物。因此,提供编码这种转录物的mtDNA和导向其的探针在检测、诊断和监测癌症中的用途。
本领域普通技术人员将意识到,本发明的方法中使用的mtDNA分子可通过分离天然存在的突变体而衍生到,或可基于本文中所述的任何融合转录物的互补序列。示例性mtDNA序列和融合转录物在申请人的美国优先权申请No.61/040,616中有所公开,其通过引用的方式全部并入本文中。
突变基因组序列的检测
根据本发明的突变mtDNA序列可包含导致产生融合转录物的任何修饰。这些修饰的非限制性例子包括插入、易位、缺失、复制、重组、重排或其组合。尽管修饰或改变的大小可以在从只有几个碱基到数千碱基之间变化很大,但是优选地,修饰导致大量缺失或其他大量基因组异常。
提取DNA以检测存在这种突变可使用本领域已知的方法来进行,然后对线粒体基因组的全部或区域进行扩增,并且可包括线粒体基因组的测序,如Current Protocols inMolecular Biology中所描述。可选择地,可以使用粗组织匀浆以及不需要对特定目标片段进行扩增的技术。
检测突变的步骤可选自本领域普通技术人员已知的任何技术。例如,分析mtDNA可包括:通过分支DNA选择靶、对mtDNA进行测序、通过PCR扩增mtDNA、Southern、Northern、Western South-Western印迹杂交、变性HPLC、杂交至微阵列、生物芯片或基因芯片、分子标记分析、生物传感器、熔融温度特性或上述任何的组合。
可以使用对线粒体DNA进行测序的任何合适的方式。优选地,在测序前mtDNA通过PCR进行扩增。PCR的方法是本领域所熟知的,并且可如Mullis and Faloona,1987,MethodsEnzymol.,155:335中所述那样进行。PCR产物可直接进行测序,或克隆到载体中,然后置于细菌宿主中。DNA测序方法的例子在下列文献中找到:Brumley,R.L.Jr.和Smith,L.M.,1991,Rapid DNA sequencing by horizontal ultrathin gel electrophoresis,NucleicAcids Res.19:4121-4126;和Luckey,J.A.,等人,1993,High speed DNA sequencing bycapillary gel electrophoresis,Methods Enzymol.218:154-172。PCR和mtDNA测序的联合使用在Hopgood,R.,等人,1992,Strategies for automated sequencing of humanmtDNA directly from PCR products,Biotechniques 13:82-92和Tanaka,M.等人,1996,Automated sequencing of mtDNA,Methods Enzymol.264:407-421中找到。
选择合适的序列以制备各种引物的方法也是本领域已知的。例如,所述引物可以使用常规固相合成法、利用市售设备来制备,例如所述市售设备得自Applied BiosystemsUSA Inc.(Foster City,California)、DuPont,(Wilmington,Del.)或Milligen(Bedford,Mass.)。
根据本发明的方面,为了确定候选物基因组序列,首先鉴定序列缺失的连接点。序列缺失主要通过在待在5’和3’端缺失的序列侧翼的直接和间接重复元件而鉴定。从基因组中除去一段核苷酸、接着连接基因组导致新型连接点的形成。
在鉴定连接点后,为了鉴定剪接的基因,测定在连接点侧翼的基因的核苷酸。典型地,剪接的基因包含来自第一基因的起始密码子和第二基因的终止密码子,并且可表达为连续的转录物,即从剪接的基因的开端到末端都保持阅读框的转录物。还可能的是,可以使用所述基因序列内含有的替换起始或终止密码子,如本文中所公开的SEQ ID No:2和SEQID No:17所证明。表1中提供一些已知的线粒体缺失,所述线粒体缺失被发现当重排的序列在间接位点重新接合时具有可读框(ORF)。
下面提供本发明的方法中使用的示例性mtDNA分子,其已经被证实在实验室中存活。这些mtDNA基于已知线粒体基因组(SEQ ID NO:1)的修饰,并且已经被指派融合或“FUS”的称号,其中A:B表示第一剪接的基因的最后线粒体核苷酸和第二剪接的基因的第一线粒体核苷酸之间的连接点。括号中提供剪接的基因的鉴定,接着是对应的序列识别号。如下面所提供的,(AltMet)和(OrigMet)分别是指替换和初始翻译的起始位点。
FUS 8469:13447(AltMet)(ATP合酶F0亚单位8至NADH脱氢酶亚单位)(SEQ ID No:2)
FUS 10744:14124(NADH脱氢酶亚单位4L(ND4L)至NADH脱氢酶亚单位5(ND5))(SEQID No:3)
FUS 7974:15496(细胞色素c氧化酶亚单位II(COII)至细胞色素b(Cytb))(SEQ IDNo:4)
FUS 7992:15730(细胞色素c氧化酶亚单位II(COII)至细胞色素b(Cytb))(SEQ IDNo:5)
FUS 8210:15339(细胞色素c氧化酶亚单位II(COII)至细胞色素b(Cytb))(SEQ IDNo:6)
FUS 8828:14896(ATP合酶F0亚单位6(腺苷三磷酸酶6)至细胞色素b(Cytb))(SEQID No:7)
FUS 10665:14856(NADH脱氢酶亚单位4L(ND4L)至细胞色素b(Cytb))(SEQ ID No:8)
FUS 6075:13799(细胞色素c氧化酶亚单位I(COI)至NADH脱氢酶亚单位5(ND5))(SEQ ID No:9)
FUS 6325:13989(细胞色素c氧化酶亚单位I(COI)至NADH脱氢酶亚单位5(ND5))(SEQ ID No:10)
FUS 7438:13476(细胞色素c氧化酶亚单位I(COI)至NADH脱氢酶亚单位5(ND5))(SEQ ID No:11)
FUS 7775:13532(细胞色素c氧化酶亚单位II(COII)至NADH脱氢酶亚单位5(ND5))(SEQ ID No:12)
FUS 8213:13991(细胞色素c氧化酶亚单位II(COII)至NADH脱氢酶亚单位5(ND5))(SEQ ID No:13)
FUS 9191:12909(ATP合酶F0亚单位6(腺苷三磷酸酶6)至NADH脱氢酶亚单位5(ND5))(SEQ ID No:14)
FUS 9574:12972(细胞色素c氧化酶亚单位III(COIII)至NADH脱氢酶亚单位5(ND5))(SEQ ID No:15)
FUS 10367:12829(NADH脱氢酶亚单位3(ND3)至NADH脱氢酶亚单位5(ND5))(SEQID No:16)
FUS 8469:13447(OrigMet)(ATP合酶F0亚单位8至NADH脱氢酶亚单位)(SEQ IDNo:17)
FUS 9144:13816((ATP合酶F0亚单位6(腺苷三磷酸酶6)至NADH脱氢酶亚单位5(ND5))(SEQ ID No:51)
本发明还提供这些序列的变体或片段在预测、诊断和/或监测癌症中的用途。
如本文中所使用的,“变体”是指区别于本发明的mtDNA序列、但是保持其基本性能的核酸。通常,变体和选择的mtDNA序列总的来说非常类似,并且在许多区域中相同。具体而言,本发明的变体包含剪接的基因的连接点的核苷酸中的至少一种,并且还可包含与其相邻的一种或多种核苷酸。在本发明的一个实施方案中,变体序列和本发明的mtDNA序列或其互补链中的任一者至少80%、85%、90%、95%、96%、97%、98%或99%相同。
在本发明中,“片段”是指为公开的基因组序列或其互补链的一部分的短核酸序列。该部分包括包含剪接的基因的连接点的核苷酸中的至少一者,并且还可包含与其相邻的一种或多种核苷酸。本发明的片段的长度优选至少约15nt,更优选至少约20nt,还更优选至少约30nt,甚至更优选至少约40nt、至少约50nt、至少约75nt或至少约150nt。例如,片段的“长度至少20nt”旨在包括上面列出的mtDNA序列中的任一者的20或更多个连续的碱基。在上下文中,“约”包括在一个末端或两个末端处的特定引述的值、大于或小于数个(5、4、3、2或1)核苷酸的值。这些片段具有的用途包括但不限于作为本文中所讨论的诊断探针和引物。当然,也涵盖更大的片段(例如50、150、500、600、2000个核苷酸)。
因此,在本发明的特定实施方案中,mtDNA序列选自由下列序列及其片段或变体构成的组:
SEQ ID NO:2(FUS 8469:13447;AltMet)
SEQ ID NO:3(FUS 10744:14124)
SEQ ID NO:4(FUS 7974:15496)
SEQ ID NO:5(FUS 7992:15730)
SEQ ID NO:6(FUS 8210:15339)
SEQ ID NO:7(FUS 8828:14896)
SEQ ID NO:8(FUS 10665:14856)
SEQ ID NO:9(FUS 6075:13799)
SEQ ID NO:10(FUS 6325:13989)
SEQ ID NO:11(FUS 7438:13476)
SEQ ID NO:12(FUS 7775:13532)
SEQ ID NO:13(FUS 8213:13991)
SEQ ID NO:14(FUS 9191:12909)
SEQ ID NO:15(FUS 9574:12972)
SEQ ID NO:16(FUS 10367:12829)
SEQ ID NO:17(FUS 8469:13447;OrigMet)
SEQ ID NO:51(FUS 9144:13816),和
其片段和变体。
探针
本发明的另一个方面提供能够识别本发明的异常mtDNA序列的杂交探针。如本文中所使用的,术语“探针”是指这样的寡核苷酸,由于探针中的至少一个序列和靶区域中的序列互补性,因此所述寡核苷酸和靶核酸中的序列形成双螺旋结构。探针可以根据本领域中已知的方法来进行标记。
在鉴定和特定疾病相关的异常mtDNA后,例如,杂交至寡核苷酸阵列的mtDNA可用于鉴定特定突变,然而,可以使用任何已知的杂交方法。
正如本发明的引物一样,探针可以针对本发明的示例性mtDNA融合分子或者其片段或变体而直接产生。例如,SEQ ID NO:2-17和51中阐述的序列和表1中公开的那些序列可用于设计检测包含目标融合序列的核酸序列的引物或探针。如本领域普通技术人员将理解的,杂交至这些核酸分子的引物或探针可在严格性强的杂交条件或严格性弱的杂交条件下进行,这些条件是本领域普通技术人员已知的,并且在(例如)Current Protocols inMolecular Biology(John Wiley&Sons,New York(1989)),6.3.1-6.3.6中找到。
在本发明的特定实施方案中,本发明的探针含有和包含剪接的基因的连接点的异常mtDNA中的至少一部分互补的序列。该部分包含包括在连接点A:B中的核苷酸中的至少一者,并且还可包含与其相邻的一种或多种核苷酸。就此而言,本发明包括将使用包括在连接点A:B中和/或与其相邻的核苷酸来选择mtDNA分子的任何合适的靶向机理。
本发明涵盖本领域已知的各种类型的探针。例如,探针可以是杂交探针,其和靶核苷酸序列的结合可使用通常的DNA结合染料(例如溴化乙锭、 Green、Gold等)来检测。可选择地,探针可引入一种或多种可检测的标记。可检测的标记是这样的分子或部分,其性能或特性可直接或间接检测,并且被选择为使得探针和其靶序列杂交的能力不受影响。标记核酸序列的方法是本领域熟知的(例如参见Ausubel等人,(1997&updates)Current Protocols in Molecular Biology,Wiley&Sons,New York)。
适用于本发明的探针的标记包括可直接检测的那些,例如放射性同位素、荧光图、化学发光团、酶、胶体颗粒、荧光微粒等。本领域普通技术人员将理解可直接检测的标记可需要附加组分(例如底物、触发试剂、光等),以能够检测所述标记。本发明还涵盖使用间接检测的标记。
本发明的探针的长度优选至少约15nt,更优选至少约20nt,还更优选至少约30nt,甚至更优选至少约40nt、至少约50nt、至少约75nt或至少约150nt。例如,探针的“长度至少20nt”旨在包括和本发明的mtDNA序列互补的20或更多个连续的碱基。当然,可优选更大的探针(例如50、150、500、600、2000个核苷酸)。
本发明的探针也将杂交至生物样品中的核酸分子,从而使得本发明的方法成为可能。因此,在本发明的一个方面中,提供一种在癌症的检测中使用的杂交探针,其中所述探针和异常mtDNA分子的至少一部分互补。在本发明的另一个方面中,提供一种探针以及这种探针在检测结肠直肠癌、肺癌、乳腺癌、卵巢癌、睾丸癌、前列腺癌和/或黑色素瘤皮肤癌中的用途(或使用方法)。
测定
测量生物样品中异常mtDNA的水平可确定受试者中存在一种或多种癌症。因此,本发明包括用于预测、诊断或监测癌症的方法,该方法包括获得一种或多种生物样品,从所述样品中提取mtDNA,以及通过下列方法测定样品的异常mtDNA:对样品中的一种或多种异常mtDNA序列的量进行定量,然后将检测的量和参照值进行比较。如本领域普通技术人员将理解的,参照值基于是否所述方法寻求预测、诊断或监控癌症。因此,参照值可涉及从随时间采集的一种或多种已知的非癌症生物样品、一种或多种已知的癌症生物样品、和/或一种或多种生物样品中收集的mtDNA数据。
在一个方面中,本发明提供一种检测哺乳动物中的癌症的方法,该方法包括测定来自所述哺乳动物的组织样品中存在上述异常线粒体DNA。本发明还提供这样的方法,该方法包括通过使样品和至少一种杂交探针杂交来测定来自所述哺乳动物的组织样品。如本文中所描述的,探针可针对本发明的突变线粒体DNA序列而产生。
在另一个方面中,本发明提供上述方法,其中所述测定包括:
a)使用至少一种探针来进行杂交反应,以允许所述至少一种探针杂交至互补的异常线粒体DNA序列;
b)通过对杂交至至少一种探针的线粒体DNA的量进行定量,来对所述样品中的所述至少一种异常线粒体DNA序列的量进行定量;以及
c)将所述样品中的线粒体DNA的量和至少一种已知参照值进行比较。
本发明中还包括用于预测、诊断或监测癌症的方法,该方法包括如下所述的诊断成像测定。本发明的诊断测定可容易地适用于高通量。高通量测定提供下列优点:同时和大量处理多种样品会减少筛选多种样品所需要的时间。因此,本发明涵盖在高通量筛选或测定中使用本发明的核苷酸以检测和/或定量多种测试样品中的靶核苷酸序列。
融合转录物
本发明还提供在用于预测、诊断和/或监测癌症的方法中使用的融合转录物和相关的杂交探针的鉴定。本领域普通技术人员将意识到这些分子可通过天然存在的转录物的分离、或可选择地通过根据本发明的方法分离的mtDNA的重组表达而衍生得到。如所讨论地,这些mtDNA典型地包含具有来自第一基因的起始密码子和第二基因的终止密码子的剪接的基因。因此,由其衍生的融合转录物包含和剪接的基因相关的连接点。
融合转录物的检测
天然存在的融合转录物可从生物样品中提取,并且根据本领域已知的任何合适的方法来鉴定,或者可根据实施例中所述的方法来进行。在本发明的一个实施方案中,稳定的聚腺苷酰化融合转录物使用寡(dT)引物(其使用聚-A尾部靶向转录物)、然后使用针对靶转录物设计的引物对进行RT-PCR来鉴定。
下列示例性融合转录物使用这些方法进行检测,并且发现在预测、诊断和/或监测癌症中是有用的,如实施例中所描述。同样,根据本发明的测定和方法,衍生自表1中鉴定的ORF序列的融合转录物可在预测、诊断和/或监测癌症中是有用的。
SEQ ID NO:18(转录物1;8469:13447;AltMet)
SEQ ID NO:19(转录物2;10744:14124)
SEQ ID NO:20(转录物3;7974:15496)
SEQ ID NO:21(转录物4;7992:15730)
SEQ ID NO:22(转录物5;8210:15339)
SEQ ID NO:23(转录物6;8828:14896)
SEQ ID NO:24(转录物7;10665:14856)
SEQ ID NO:25(转录物8;6075:13799)
SEQ ID NO:26(转录物9;6325:13989)
SEQ ID NO:27(转录物10;7438:13476)
SEQ ID NO:28(转录物11;7775:13532)
SEQ ID NO:29(转录物12;8213:13991)
SEQ ID NO:30(转录物14;9191:12909)
SEQ ID NO:31(转录物15;9574:12972)
SEQ ID NO:32(转录物16;10367:12829)
SEQ ID NO:33(转录物20;8469:13447;OrigMet)
SEQ ID NO:50(转录物13;9144:13816)。
此外,和本文中所述的那些特征类似的融合转录物也涵盖在临床肿瘤学领域的应用中。
融合转录物还可以通过本领域中已知的重组技术来制备。典型地,该技术包括使用包含目标mtDNA序列的表达载体来转化(包括转染、转导或感染)合适的宿主细胞。
还提供本文中鉴定的融合转录物的变体或片段。这些序列可坚持上面相对于基因组变体和片段而描述的尺寸限制和百分同一性,或者由本领域普通技术人员合适地确定。
另外,下面列出对应于转录物1-16和20的推定的蛋白序列。提供这些编码假设的融合蛋白的序列作为本发明的进一步的实施方案。
SEQ ID NO:34(转录物1)
SEQ ID NO:35(转录物2)
SEQ ID NO:36(转录物3)
SEQ ID NO:37(转录物4)
SEQ ID NO:38(转录物5)
SEQ ID NO:39(转录物6)
SEQ ID NO:40(转录物7)
SEQ ID NO:41(转录物8)
SEQ ID NO:42(转录物9)
SEQ ID NO:43(转录物10)
SEQ ID NO:44(转录物11)
SEQ ID NO:45(转录物12)
SEQ ID NO:46(转录物14)
SEQ ID NO:47(转录物15)
SEQ ID NO:48(转录物16)
SEQ ID NO:49(转录物20)
SEQ ID NO:52(转录物13)
探针
在表征融合转录物后,可以开发引物或探针以在生物样品中靶向转录物。这些引物和探针可使用任何已知的方法(如上述)或下面提供的实施例中所阐述的方法来制备。例如,探针可对于融合转录物而产生,并且检测技术,例如PanomicsTM的QuantiGene 2.0TM,被用于检测样品中存在转录物。引物和探针可针对本发明的示例性融合转录物或者其片段或变体而直接产生。例如,SEQ ID NO:18-33和50中阐述的序列和表1中公开的那些序列可用于设计检测包含目标融合序列的核酸序列的探针。
如本领域普通技术人员将理解的,设计杂交至本发明的融合转录物的探针含有和表达剪接的基因的连接点的转录物中的至少一部分互补的序列。该部分包括和表达的连接点互补的核苷酸中的至少一者,并且还可包含与其相邻的一种或多种互补核苷酸。就此而言,本发明包括将使用包括在剪接的基因的连接点中和与其相邻的核苷酸来选择融合转录物的任何合适的靶向机理。
本领域中已知的各种类型的探针和标记方法都涵盖以制备转录物探针。这些类型和方法已经相对于基因组序列的检测而在上面描述。本发明的转录物探针的长度优选至少约15nt,更优选至少约20nt,还更优选至少约30nt,甚至更优选至少约40nt、至少约50nt、至少约75nt或至少约150nt。例如,探针的“长度至少20nt”旨在包括和本发明的mtDNA序列互补的20或更多个连续的碱基。当然,可优选更大的探针(例如50、150、500、600、2000个核苷酸)。
在一个方面中,本发明提供一种在癌症的检测中使用的杂交探针,其中所述探针和上面提供的线粒体融合转录物的至少一部分互补。
在另一个方面中,本发明提供一种探针以及这种探针在检测结肠直肠癌、肺癌、乳腺癌、卵巢癌、睾丸癌、前列腺癌或黑色素瘤皮肤癌中的用途(或使用方法)。
测定
测量生物样品中线粒体融合转录物的水平可确定受试者中存在一种或多种癌症。因此,本发明提供用于预测、诊断或监测癌症的方法,该方法包括获得一种或多种生物样品,从所述样品中提取线粒体RNA,以及通过下列方法测定样品的融合转录物:对样品中的一种或多种融合转录物的量进行定量,然后将检测的量和参照值进行比较。如本领域普通技术人员将理解的,参照值基于是否所述方法寻求预测、诊断或监控癌症。因此,参照值可涉及从随时间采集的一种或多种已知的非癌症生物样品、一种或多种已知的癌症生物样品、和/或一种或多种中生物样品收集的转录物数据。
在一个方面中,本发明提供一种检测哺乳动物中的癌症的方法,该方法包括通过使所述样品和至少一种杂交探针杂交来测定来自所述哺乳动物的组织样品中存在本发明的至少一种融合转录物,所述至少一种杂交探针具有和线粒体融合转录物中的至少一部分互补的核酸序列。
在另一个方面中,本发明提供上述方法,其中所述测定包括:
a)使用至少一种上述探针来进行杂交反应,以允许所述至少一种探针杂交至互补的线粒体融合转录物;
b)通过对杂交至所述至少一种探针的所述转录物的量进行定量,来对所述样品中的所述至少一种线粒体融合转录物的量进行定量;以及
c)将所述样品中的所述线粒体融合转录物的量和至少一种已知参照值进行比较。
如上所讨论的,本发明的诊断测定还可包含本文中所述的诊断方法和筛选工具,并且可容易地适用于高通量。因此,本发明涵盖在高通量筛选或测定中使用本发明的融合转录物和相关的探针以检测和/或定量多种测试样品中的靶核苷酸序列。
诊断方法和筛选工具
本文中还涵盖了用于诊断特定疾病或鉴定特定线粒体突变的方法和筛选工具。可以使用任何已知的杂交方法来进行这些方法,包括但不限于基于探针/引物的技术,例如分支DNA和qPCR、单重和多重的。还可以使用阵列技术,其具有匹配野生型或突变的区域的寡核苷酸探针和对照探针。市售阵列(例如微阵列)或基因芯片是核实后的。这些阵列在玻片或微芯片上含有数千的匹配的和对照的探针对,并且能够非常迅速地对整个基因组进行测序。描述微阵列在基因组和DNA序列分析中的用途的综述文献在线可得。
设计用于鉴定和给定的生物条件相关的靶的筛选工具可包括和特定疾病或紊乱相关的核酸的特定排列。因此,依照本发明的一个实施方案,提供一种筛选工具,其包含具有10、100或1000种线粒体融合转录物的微阵列以鉴定和一种或多种癌症相关的那些线粒体融合转录物。依照另一个实施方案,提供一种筛选工具,其包含具有10、100或1000种对应于线粒体融合转录物的线粒体DNA的微阵列以鉴定和一种或多种癌症相关的那些线粒体DNA。在进一步的实施方案中,提供一种筛选工具,其包含具有10、100或1000种线粒体融合转录物的多重分支DNA试样以鉴定和一种或多种癌症相关的那些线粒体融合转录物。在本发明的又一个实施方案中,提供一种筛选工具,其包含具有10、100或1000种对应于线粒体融合转录物的线粒体DNA的多重分支DNA试样以鉴定和一种或多种癌症相关的那些线粒体DNA。
在临床肿瘤学领域中有用的方案也涵盖在本文中,并且可包括诊断成像技术,例如正电子成像术(PET)、对比磁共振成像术(MRI)等。这些诊断方法是本领域普通技术人员熟知的,并且可在癌症的诊断和预测中使用。
诊断监测
本发明的方法还可包括基于一种或多种测定的结果而推荐监测制度或治疗路线。这允许临床医生通过监测患者的癌症(例如通过在发生起始或随后的突变时识别)或治疗(例如通过在突变稳定时识别)的进展来实施个性化用药,例如癌症的治疗。
使用手头的序列变异的分界的知识,所述信息可用于诊断癌症前病症或现有癌症病症。此外,通过对连续样品中的异常mtDNA随时间的量进行定量,可以监控癌症病症的进展,例如,为了确定异常是否已经发生改变,可以将通过在一个时间点测定患者的组织以从野生型中检测第一组突变而提供的数据和从随后的测定提供的数据进行比较。
如果在并未产生癌症症状的个体中发现突变,突变可以是产生癌症病症的基因易患性的指示。可基于这样的信息在定性的基础上进一步评价疾病易患性的确定或其存在的诊断,所述信息涉及在患者的家族史中癌症病症的流行性(如果有)和存在其他危险因素(例如暴露于环境因素),以及是否患者的细胞也携带另一种突变。
生物样品
本发明提供用于诊断的试验,所述试验包括获得或收集一种或多种生物样品。在本发明的上下文中,“生物样品”是指含有这样的细胞的组织或体液,从该细胞中可以获得mtDNA和mtRNA。例如,生物样品可衍生自组织,包括但不限于皮肤、肺、乳房、前列腺、神经、肌肉、心脏、胃、结肠、直肠组织等;或衍生自血液、唾液、脑脊液、痰、尿液、黏液、滑液、腹膜液、羊水等。生物样品可以得自癌症或非癌症组织,并且可以但不限于是外科手术样本或活组织检查样本。
生物样品可以以得自来源直接使用或者在进行预处理以改善样品的特征后使用。因此,生物样品可以(例如)通过下列方式在使用前进行预处理:从血液中制备血浆或血清、分裂细胞、从固体材料中制备液体、稀释粘性流体、过滤液体、蒸馏液体、浓缩液体、灭活干扰组分、添加试剂等。
本领域普通技术人员将理解,在单次时间可以测定多于一种的样品类型(即用于检测多于一种的癌症)。此外,如果需要一段过程的收集,例如用于随着时间监测癌症,可以单独诊断给定样品,或者和在整个试验期间采集的其他样品一起诊断。就此而言,生物样品可以仅采集一次,或者以规则的间隔(两周、一月、半年或一年)采集。
试剂盒
本发明提供用于在临床环境下检测癌症的诊断/扫描试剂盒。这些试剂盒可包括一种或多种取样构件并联合根据本发明的一种或多种探针。
试剂盒可以任选地包括需要用于进行诊断测定的试剂,例如缓冲剂、盐、检测试剂等。试剂盒中也可以包括其他组分,例如用于生物样品的分离和/或处理的缓冲剂和溶液。所述试剂盒的一种或多种组分可冻干,并且所述试剂盒还可包含适于冻干的组分重建的试剂。
如果需要,所述试剂盒还可包含反应容器、混合容器和其他易于制备试样的组件。所述试剂盒还可任选地包括使用说明,其可以以纸的形式或计算机可读形式(例如磁盘、CD、DVD等)提供。
在本发明的一个实施方案中,提供一种用于诊断癌症的试剂盒,其包含取样构件和本发明的杂交探针。
将通过使用下列实施例描述来对本发明的各方面进行说明。本文中提供的实施例仅起到描述本发明的某些特定实施方案的作用,并且并非旨在以任何方式限制本发明的范围。
实施例
实施例1:线粒体融合转录物的检测
本申请人在PCT申请no.PCT/CA 2007/001711(其全部内容通过引用的方式并入)中之前鉴定的线粒体4977“常见缺失“和3.4kb缺失导致具有活性转录物的独特的可读框,如在前列腺组织中通过寡-dT选择所鉴定的(图2和3)。乳房组织样品的检查也揭示出源自3.4kb缺失的稳定的聚腺苷酰化融合转录物的存在(图4)。
用于缺失转录物检测的反转录-PCR方案
RNA分离cDNA合成
遵循制造商的说明并使用AurumTM总RNA脂肪和纤维组织试剂盒(Bio-Rad,Hercules,CA),从速冻前列腺和乳房组织样品(恶性肿瘤和肿瘤附近的正常样品)中分离总RNA。由于在该实验中避免了基因组DNA污染,因此在使用本领域通知的方法的条件下包括NDA酶I处理步骤。使用ND-1000分光光度计( technologies)来测定RNA的数量和质量。从约100g的初始材料中,总RNA浓度从100至1000ng/μl之间变化,并且260/280比在1.89至2.10之间。将RNA浓度调解至100ng/μl,并且遵循制造商的说明,使用用于RT-PCR的SuperscriptTM第一链合成系统(Invitrogen)将2μl的各模板用于第一链DNA的合成。为了鉴定稳定的聚腺苷酰化融合转录物,使用寡(dT)引物,其使用聚-A尾部靶向转录物。
PCR
使用5μl的各cDNA模板和iQTM Green Supermix(Bio-Rad,Hercules,CA)在DNA Engine2连续荧光检测系统(Bio-Rad,Hercules,CA)上进行实时PCR。靶向4977bp缺失的引物对为:8416F 5'-CCTTACACTATTCCTCATCAC-3'、13637R 5'-TGACCTGTTAGGGTGAGAAG-3',并且用于3.4kb缺失的引物对为:ND4LF 5'-TCGCTCACACCTCATATCCTC-3'、ND5R 5'-TGTGATTAGGAGTAGGGTTAGG-3'。反应闪烁液(reaction cocktail)包括:2X Green Supermix(100mM KCL,40mM Tris-HCl,pH8.4,0.4mM的各dNTP[dATP、dCTP、dGTP和dTTP]、iTaqTM DNA聚合酶、50units/ml、6mM MgCl2 Green 1、20nM的荧光素和稳定剂)、250nM的各引物、和双蒸水。PCR循环参数如下:(1)95℃2分钟,(2)95℃30秒,(3)55℃(对于4977bp缺失)和63℃(对于3.4kb缺失)30秒,(4)72℃45秒,(5)板读取,接着进行39个循环的步骤3至5,并且最终在4℃下孵育。除了循环阈值和熔融曲线分析,将样品在琼脂糖凝胶上运行以用于扩增产物的特定可视化(参见图2至4)。
图2是示出由线粒体基因组的3.4kb的损失调用的前列腺样品中的聚腺苷酰化融合转录物的琼脂糖凝胶图。图2的说明为:B-空白、泳道1-6为cDNA中检测的转录物;泳道7-12为用于泳道1-6中的样品的无反转录酶(RT)对照。
图3示出由4977kb常见缺失的损失调用的前列腺样品中的聚腺苷酰化融合转录物。图3的说明为:B-空白、泳道1-6为cDNA中检测的转录物;泳道7-12为用于泳道1-6中的样品的无RT对照。
图4示出由线粒体基因组的3.4kb的损失调用的乳房样品中的聚腺苷酰化融合转录物。图4的说明为:泳道2-8为来自乳房cDNA的转录物;泳道9为阴性对照(水);泳道10和11为用于泳道2和3中的样品的阴性、无RT对照。
这些结果证实存在稳定的线粒体融合转录物。
实施例2:融合产物的鉴定和靶向
设计多种杂交探针以进行检测,并且进一步证实存在源自突变的线粒体基因组(例如3.4kb缺失)的新型转录物。为此,利用用于定量基因表达分析的单重分支DNA平台(QuantiGene 2.0TM,PanomicsTM)。该实施例中列出的特定缺失和序列基于它们和整个mtDNA基因组(在SEQ ID NO:1中所示)的相对位置。四种转录物(在该实施例中探针被设计用于所述转录物)的核酸序列在本文中被鉴定为如下:转录物1(SEQ ID NO:18)、转录物2(SEQ ID NO:19)、转录物3(SEQ ID NO:20)和转录物4(SEQ ID NO:21)。
使用基因ND4L(NADH脱氢酶亚单位4L)和ND5(NADH脱氢酶亚单位5)产生3.4kb线粒体基因组缺失的连续转录物的例子。具有和SEQ ID NO:19互补的序列的探针被用于检测转录物2。在ND4L中的位置10745-10754和在ND5中的位置14124-14133产生重复元件。
3.4kb缺失导致除去ND4L的3'端、全长ND4基因、tRNA组氨酸、tRNA丝氨酸2、tRNA亮氨酸2和ND5的大部分的5'端(参见图5a),从而导致ND4L和ND5用连接点10744(ND4L):14124(ND5)进行基因剪接(图5b)。SEQ ID NO:3是以上述方式检测的RNA转录物(SEQ ID NO:19)的互补的DNA序列。
类似地,转录物1是腺苷三磷酸酶8与和位置8469:13447相关的ND5之间的融合转录物(SEQ ID NO:18)。转录物3和4(分别为SEQ ID NO:20和SEQ ID NO:21)是分别和核苷酸位置7974:15496与7992:15730相关的COII与Cytb之间的融合转录物。表3提供了该实施例中使用的各种序列之间的关系的概述。表3包括检测融合转录物和与检测的融合转录物互补的DNA序列。
实施例3:应用于前列腺癌
使用四种融合转录物,即上面讨论的转录物1至4,分析来自一位患者的两种前列腺组织样品以评价新预计的融合转录物的定量差异。试验结果提供在下面的表2中,其中“Homog 1”是指患者的冷冻前列腺肿瘤组织的匀浆,“Homog 2”是指患者的肿瘤附近的冷冻正常前列腺组织的匀浆。这些样品根据生产商的方案( Sample ProcessingKit for Fresh or Frozen Animal Tissues;和2.0Reagent System UserManual)以25.8mg的Homog 1和28.9mg的Homog 2(测定安排示于表5a和5b中)开始进行处理。
明显证实的是和正常附近的前列腺组织相比,前列腺癌组织中存在的线粒体融合转录物增加。尽管水平非常低,但是融合转录物存在于正常组织中。探针杂交至靶转录物而产生的相对发光单位(RLU)直接和各转录物的丰富程度成比例。表2还指出从样品采集的读数的变异系数(CV,表示为%CV)。CV包含标准偏差除以平均值。这种在癌症组织中稳定地转录的线粒体基因产物的显著性暗示着疾病演变和发展。
实施例4:应用于乳腺癌
使用和实施例3相同的方案,但只集中于转录物2,和3.4kb线粒体基因组缺失有关的新型融合转录物,分析两种乳房肿瘤组织样品和两种这些肿瘤附近的无肿瘤组织的样品、以及三种前列腺肿瘤组织样品、一种包含附近的无肿瘤组织的样品。表4中提供了该实施例的结果。具有相应的正常组织切片的前列腺肿瘤组织样品证实和在实施例3中分析的前列腺样品类似的图案,因为较之正常附近的组织,肿瘤组织具有约2倍量的融合转录物。当和附近的无肿瘤组织相比时,乳房肿瘤样品证实融合转录物水平显著地增加。使用以1:100稀释的匀浆进行该分析,因为其在实施例3所引用的试验中最可再生地进行。
因此,上面讨论的结果表明了本发明的转录物在前列腺和乳房组织的肿瘤的检测中的应用。
实施例5:应用于结肠直肠癌
该研究旨在确定本发明的一些转录物在检测结肠直肠癌中的有效性。总共制备19种样品,包括9种对照(良性)组织样品(样品1至9)和10种肿瘤(恶性)组织样品(样品10至19)。将样品根据生产商的建议( Sample Processing Kit for Fresh orFrozen Animal Tissues;和Quantigene 2.0Reagent System User Manual)进行均质化。按照前面实施例中列出的方式制备7种靶转录物和1种持家转录物。转录物的特性概述如下:
表7:乳腺癌转录物的特性
应注意,转录物2和3和上面涉及实施例3和4所讨论的那些相同。
使用约25mg的来自OCT块的组织制备匀浆,对于转录物2和4以1:1稀释,对于转录物10和11以1:8稀释。在GlomaxTM多检测系统(Promega)上测量转录物的量(相对荧光单位RLU)。对于每种转录物,所有样品测定3次。也进行3次背景测量(无模板)。通过从样品的RLU值中减去下限来分析计算背景。通过使用式log2 a RLU-log2 h RLU来计算输入RNA,其中a是靶融合转录物,并且h是持家转录物。
数据分析包括下列步骤:
a)确定三次测定的CV(变异系数),如果≤15%则可接受。
b)确定靶融合转录物(a)和持家转录物(h)三次测定的平均RLU值。
c)从背景RLU的三个值中确定下限(I)。
d)从(a)中减去下限(I)。
e)计算log2 a RLU-log2 h RLU。
结果概述:
上述分析的结果示于图6a至6g中,其包括log2 a RLU-log2 h RLU对样品数的图。还示出从各转录物的结果中确定的各ROC(接受者工作特征)曲线。
转录物2:在正常组(p<0.10)和恶性组(p>0.09)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的3.6129的截断值导致灵敏度为60%,特异度为89%,曲线下面积为0.73,这表明一般的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。
转录物3:在正常组(p<0.05)和恶性组(p=0.03)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的4.0813的截断值导致灵敏度为60%,特异度为78%,曲线下面积为0.79,这表明一般至良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。
转录物8:在正常组(p<0.1)和恶性组(p=0.06)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的-6.0975的截断值导致灵敏度为60%,特异度为89%,曲线下面积为0.76,这表明一般的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。
转录物9:在正常组(p<0.1)和恶性组(p=0.06)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的-7.5555的截断值导致灵敏度为60%,特异度为89%,曲线下面积为0.76,这表明一般至良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。
转录物10:在正常组(p<0.01)和恶性组(p=0.01)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的-3.8272的截断值导致灵敏度为90%,特异度为67%,曲线下面积为0.84,这表明良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。
转录物11:在正常组(p<0.1)和恶性组(p=0.06)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的3.1753的截断值导致灵敏度为70%,特异度为78%,曲线下面积为0.76,这表明一般至良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。
转录物12:在正常组(p<0.1)和恶性组(p=0.06)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的3.2626的截断值导致灵敏度为70%,特异度为78%,曲线下面积为0.76,这表明一般至良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。
结论:
上述结果示出转录物2、3、8、9、10、11和12在结肠直肠癌的检测和辨别恶性与正常结肠直肠组织中的实用性。如上所讨论的,还发现转录物2和3具有在前列腺癌检测中的实用性。还发现转录物2具有在乳腺癌检测中的实用性。还发现转录物11具有在黑色素瘤皮肤癌检测中的实用性。还发现转录物10具有在肺癌和黑色素瘤检测中的实用性。还发现转录物8具有在肺癌检测中的实用性。所述7种转录物中的任一种可以单独或联合用作在临床环境下检测结肠直肠癌的特征的工具。
实施例6:应用于肺癌
该研究旨在确定本发明的一些转录物在检测肺癌中的有效性。如实施例5中那样,将9种对照(良性)组织样品(样品1至9)和10种肿瘤(恶性)组织样品(样品10至19)。根据生产商的建议( Sample Processing Kit for Fresh or Frozen AnimalTissues;和Quantigene 2.0Reagent System User Manual)进行均质化。将匀浆以1:8稀释,并且在GlomaxTM多检测系统(Promega)上测量4种靶转录物和1种持家转录物的量(相对荧光单位RLU)。对于每种转录物,所有样品测定3次。也进行3次背景测量(无模板)。
制备下列转录物用于该实施例:
表8:肺癌转录物的特性
该实施例中使用的组织样品具有下列特性:
表9:肺癌样品的特性
样品 恶性 评论(组织来源)
1 间质性肺病
2 肺气肿
3 动脉瘤
4 支气管肺炎,COPD
5 肝脏中的恶性肿瘤 肺部中的起源未知、钙化肉芽肿瘤
6 死后12小时尸检,轻度肺气肿
7 死后12小时尸检,大B细胞淋巴瘤,肺水肿,肺炎
8 肺炎,水肿,肺泡损害
9 充血和水肿
10 腺癌,非小细胞
11 小细胞
12 鳞状细胞癌,NSC,肺气肿
13 腺癌,肺癌,nsc,转移性癌
14 鳞状细胞癌,非小细胞
15 混合性鳞状癌和腺癌
16 非小细胞癌,鳞状
17 小细胞癌
18 腺癌,肺癌,nsc
19 腺癌,肺癌,nsc,转移性癌
根据实施例5中所述的方法来进行数据分析。结果示于图7a、7b、7c和7d中。
结果概述:
转录物6:在正常组(p<0.1)和恶性组(p=0.06)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的-6.5691的截断值导致灵敏度为80%,特异度为71%,曲线下面积为0.77,这表明一般的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。
转录物8:在正常组(p<0.05)和恶性组(p=0.02)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的-9.6166的截断值导致灵敏度为90%,特异度为86%,曲线下面积为0.86,这表明良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。
转录物10:在正常组(p<0.01)和恶性组(p=0.01)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的-10.6717的截断值导致灵敏度为90%,特异度为86%,曲线下面积为0.89,这表明良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。
转录物20:在正常组(p<0.1)和恶性组(p=0.1)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的2.5071的截断值导致灵敏度为70%,特异度为71%,曲线下面积为0.74,这表明一般的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。
结论:
实施例6的结果示出本发明的转录物6、8、10和20在肺癌肿瘤的检测和辨别恶性与正常肺组织中的实用性。这些转录物中的任一种可用于在临床环境下检测或表征肺癌。
实施例7:应用于黑色素瘤
该研究旨在确定本发明的一些转录物在检测黑色素瘤中的有效性。在该研究中,总共使用14种样品,包括5种对照(良性)组织样品和9种恶性组织样品。将所有样品用福尔马林固定和石蜡包埋(FFPE)。将FFPE组织样品切到管中,并且根据生产商的建议( Sample Processing Kit for FFPE Samples;和Quantigene 2.0 ReagentSystem User Manual)进行均质化,使得在均质化前各样品约20微米。将匀浆以1∶4稀释,并且在GlomaxTM多检测系统(Promega)上测量7种靶转录物和1种持家转录物的量(相对荧光单位RLU)。对于每种转录物,所有样品测定3次。也进行3次背景测量(无模板)。
该实施例中使用的14种组织样品具有下列特性:
表10:黑色素瘤癌样品的特征
样品 恶性 评论(组织来源)
1 乳腺缩小组织(皮肤)
2 乳腺缩小组织(皮肤)
3 乳腺缩小组织(皮肤)
4 乳腺缩小组织(皮肤)
5 乳腺缩小组织(皮肤)
6 恶性雀斑样(黑色素瘤,原位) 不存在侵袭性黑色素瘤
7 侵袭性雀斑样黑色素瘤
8 结节性雀斑样黑色素瘤,pT3b,恶性雀斑样痣黑素瘤的有关特征
9 残余浅表扩散性、侵袭性雀斑样黑色素瘤,Clark水平II
10 浅表扩散性恶性黑色素瘤,Clark水平II
11 结节性恶性黑色素瘤,Clark水平IV
12 浅表扩散性恶性黑色素瘤,原位,没有侵袭性证据
13 浅表扩散性恶性黑色素瘤,Clark水平II,局部存在垂直相
14 浅表扩散性恶性黑色素瘤,原位,Clark水平I
为该实施例制备下列转录物:
表11:黑色素瘤癌转录物的特征
如所述,转录物10和11也在实施例5中使用。根据实施例5中描述的方法来进行数据分析。结果示于图8a-8g。
结果概述:
转录物6:在正常组(p<0.01)和恶性组(p=0.01)的平均值之间存在统计上显著性差异。此外,使用通过ROC曲线证实的-5.9531的截断值导致灵敏度为89%,特异度为80%,曲线下面积为0.96,这表明非常良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。
转录物10:在正常组(p<0.05)和恶性组(p=0.05)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的-4.7572的截断值导致灵敏度为89%,特异度为40%,曲线下面积为0.82,这表明良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。
转录物11:在正常组(p<0.05)和恶性组(p=0.02)的平均值之间存在统计上显著性差异。此外,使用通过ROC曲线证实的1.6762的截断值导致灵敏度为78%,特异度为100%,曲线下面积为0.89,这表明良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。
转录物14:在正常组(p<0.05)和恶性组(p=0.05)的平均值之间存在统计上显著性差异。此外,使用通过ROC曲线证实的-4.9118的截断值导致灵敏度为89%,特异度为60%,曲线下面积为0.82,这表明良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。
转录物15:在正常组(p<0.1)和恶性组(p=0.07)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的-7.3107的截断值导致灵敏度为100%,特异度为67%,曲线下面积为0.80,这表明良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。
转录物16:在正常组(p<0.05)和恶性组(p=0.03)的平均值之间存在统计上显著性差异。此外,使用通过ROC曲线证实的-10.5963的截断值导致灵敏度为89%,特异度为80%,曲线下面积为0.878,这表明良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。
转录物20:在正常组(p<0.05)和恶性组(p=0.04)的平均值之间存在统计上显著性差异。此外,使用通过ROC曲线证实的-8.3543的截断值导致灵敏度为100%,特异度为80%,曲线下面积为0.89,这表明良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。
结论:
实施例7的结果示出本发明的转录物6、10、11、14、15、16和20在恶性黑色素瘤的检测中的实用性。如上所示,还发现转录物10和11具有在结肠直肠癌的检测中的实用性,而转录物6具有在肺癌的检测中的实用性。表6中提供了通过疾病进行的转录物概述。
实施例8:应用于卵巢癌
该研究旨在确定本发明的一些转录物在检测卵巢癌中的有效性。总共制备20种样品,包括10种对照(良性)组织样品(样品1至10)和10种肿瘤(恶性)组织样品(样品11至20)。根据生产商的建议( Sample Processing Kit for Fresh or FrozenAnimal Tissues;和Quantigene 2.0Reagent System User Manual)将样品均质化。以上述实施例中列出的方式制备8种靶转录物和1种持家转录物。
该实施例中使用的20种组织样品具有下列特性:
表12:卵巢癌样品的特性
样品 诊断 评论
1 正常 卵泡囊肿
2 正常 纤维瘤
3 正常 卵巢没有病理变化
4 正常 卵泡囊肿
5 正常 细胞纤维瘤
6 正常 良性卵泡简单囊肿
7 正常 子宫肌瘤,乳头状体
8 正常 乳头状体和上皮包含性囊肿
9 正常 乳头状体
10 正常 乳头状体,表面包含性囊肿卵泡囊肿
11 恶性 高级、较少分化、严重乳突癌,包括网膜
12 恶性 子宫内膜样腺癌,适度分化,并且具有局部严重分化
13 恶性 严重乳突癌
14 恶性 混合性上皮癌,主要是严重乳突癌
15 恶性 高度:严重的癌症,乳突和固体生长图案
16 恶性 高度(3/3)严重乳突癌
17 恶性 严重乳突癌,高度细胞核分化
18 恶性 严重乳突囊肿钳,级别:III
19 恶性 较少分化、严重乳突癌
20 恶性 适度分化的腺细胞癌,子宫内膜型,级别1
转录物的特性概述如下:
表13:卵巢癌转录物的特性
应注意,转录物1、2、3、6、11、12、15和20和上面涉及实施例3-7而讨论的那些相同。
使用25mg的冷冻组织制备匀浆并以1∶4稀释。在GlomaxTM多检测系统(Promega)上测量转录物的量(相对荧光单位RLU)。对于每种转录物,所有样品测定3次。也进行3次背景测量(无模板)。通过从样品的RLU值中减去下限来分析计算背景。通过使用式log2 a RLU-log2 h RLU来计算输入RNA,其中a是靶融合转录物,并且h是持家转录物。
数据分析包括下列步骤:
a)确定三次测定的CV(变异系数),如果≤15%则可接受。
b)确定靶融合转录物(a)和持家转录物(h)三次测定的平均RLU值。
c)从背景RLU的三个值中确定下限(I)。
d)从(a)中减去下限(I)。
e)计算log2 a RLU-log2 h RLU。
结果概述:
上述分析的结果示于图9a至9h中,其包括log2 a RLU-log2 h RLU对样品数的图。还示出从各转录物的结果中确定的各ROC(接受者工作特征)曲线。
转录物1:在正常组(p<0.05)和恶性组(p=0.002)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的-11.1503的截断值导致灵敏度为90%,特异度为80%,曲线下面积为0.91,这表明非常良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。
转录物2:在正常组(p<0.10)和恶性组(p=0.001)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的0.6962的截断值导致灵敏度为90%,特异度为100%,曲线下面积为0.96,这表明非常良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。
转录物3:在正常组(p<0.01)和恶性组(p=0.000)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的0.6754的截断值导致灵敏度为100%,特异度为100%,曲线下面积为1.00,这表明优异的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。
转录物6:在正常组(p<0.01)和恶性组(p=0.007)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的-9.6479的截断值导致灵敏度为90%,特异度为70%,曲线下面积为0.86,这表明良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。
转录物11:在正常组(p<0.01)和恶性组(p=0.000)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的-1.3794的截断值导致灵敏度为100%,特异度为90%,曲线下面积为0.99,这表明优异的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。
转录物12:在正常组(p<0.01)和恶性组(p=0.001)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的-1.2379的截断值导致灵敏度为90%,特异度为100%,曲线下面积为0.96,这表明优异的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。
转录物15:在正常组(p<0.05)和恶性组(p=0.023)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的-8.6926的截断值导致灵敏度为70%,特异度为80%,曲线下面积为0.80,这表明良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。
转录物20:在正常组(p<0.01)和恶性组(p=0.000)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的0.6521的截断值导致灵敏度为100%,特异度为100%,曲线下面积为0.76,这表明一般至良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。
结论:
上述结果示出转录物1、2、3、6、11、12、15和20在卵巢癌的检测和辨别恶性与正常卵巢组织中的中的实用性。还发现转录物1、2和3具有在前列腺癌的检测中的实用性。还发现转录物6具有在黑色素瘤和肺癌的检测中的实用性。还发现转录物11具有在黑色素瘤皮肤癌、结肠直肠癌和睾丸癌的检测中的实用性。还发现转录物12具有在结肠直肠癌和睾丸癌的检测中的实用性。还发现转录物15具有在黑色素瘤和睾丸癌的检测中的实用性。还发现转录物20具有在结肠直肠癌、黑色素瘤、和睾丸癌的检测中的实用性。所述8种转录物中的任一种可以单独或联合用作在临床环境下检测或表征卵巢癌的工具。
实施例9:应用于睾丸癌
该研究旨在确定本发明的一些转录物在检测睾丸癌中的有效性。总共制备17种样品,包括8种对照(良性)组织样品(样品1至8)和和9种肿瘤(恶性)组织样品(样品9至17)。恶性样品中的5种为非精原细胞瘤(样品9-13),4种为精原细胞瘤(样品14-17)。根据生产商的建议( Sample Processing Kit for Fresh or Frozen Animal Tissues;和Quantigene 2.0Reagent System User Manual)将样品均质化。以上述实施例中列出的方式制备10种靶转录物和1种持家转录物。
该实施例中使用的17种组织样品具有下列特性:
表14:睾丸癌样品的特性
样品 通常诊断 分层恶性诊断
1 良性 良性
2 良性 良性
3 良性 良性
4 良性 良性
5 良性 良性
6 良性 良性
7 良性 良性
8 良性 良性
9 恶性 非精原细胞瘤
10 恶性 非精原细胞瘤
11 恶性 非精原细胞瘤
12 恶性 非精原细胞瘤
13 恶性 非精原细胞瘤
14 恶性 精原细胞瘤
15 恶性 精原细胞瘤
16 恶性 精原细胞瘤
17 恶性 精原细胞瘤
转录物的特性概述如下:
表15:睾丸癌转录物的特性
转录物ID 连接位点 基因连接
2 10744:14124 ND4L:ND5
3 7974:15496 COII:Cytb
4 7992:15730 COII:Cytb
11 7775:13532 COII:ND5
12 8213:13991 COII:ND5
13 9144:13816 腺苷三磷酸酶6:ND5
15 9574:12972 COIII:ND5
16 10367:12829 ND3:ND5
20 8469:13447 腺苷三磷酸酶8:ND5
肽基脯氨酸异构酶B(PPIB) N/A N/A
应注意,转录物2、3、4、7、11、12、15、16和20和上面涉及实施例3-8而讨论的那些相同。
使用25mg的冷冻组织制备匀浆并以1∶4稀释。在GlomaxTM多检测系统(Promega)上测量转录物的量(相对荧光单位RLU)。对于每种转录物,所有样品测定3次。也进行3次背景测量(无模板)。通过从样品的RLU值中减去下限来分析计算背景。通过使用式log2 a RLU-log2 h RLU来计算输入RNA,其中a是靶融合转录物,并且h是持家转录物。
数据分析包括下列步骤:
a)确定三次测定的CV(变异系数),如果≤15%则可接受。
b)确定靶融合转录物(a)和持家转录物(h)三次测定的平均RLU值。
c)从背景RLU的三个值中确定下限(I)。
d)从(a)中减去下限(I)。
e)计算log2 a RLU-log2 h RLU。
结果概述:
上述分析的结果示于图10a-图10b至图18a-图18b中,其包括log2 a RLU-log2 hRLU对样品数的图。还示出从各转录物的结果中确定的各ROC(接受者工作特征)曲线。
尽管一些转录物辨别良性和恶性睾丸组织,但是其他转录物证实了精原细胞瘤和非精原细胞瘤的肿瘤亚型和/或良性睾丸组织之间的区别。因此预计,联合各类的转录物将不仅促进睾丸癌的检测,还促进将其分类成精原细胞瘤或非精原细胞瘤的亚型。
转录物2:在正常组(p<0.05)和恶性精原细胞瘤组(p=0.02)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的1.5621的截断值导致灵敏度为100%,特异度为100%,曲线下面积为1.00,这表明优异的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。在恶性精原细胞瘤(p<0.05)和恶性非精原细胞瘤(p=0.024)的平均值之间也存在统计上显著性差异。使用通过ROC曲线证实的2.1006的截断值导致灵敏度为100%,特异度为80%,曲线下面积为0.90,这表明优异的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。
转录物3:在正常组(p<0.05)和恶性精原细胞瘤组(p=0.018)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的0.969的截断值导致灵敏度为100%,特异度为87.5%,曲线下面积为0.969,这表明优异的精确度。在恶性精原细胞瘤(p<0.05)和恶性非精原细胞瘤(p=0.017)的平均值之间也存在统计上显著性差异。使用通过ROC曲线证实的1.8181的截断值导致灵敏度为100%,特异度为80%,曲线下面积为0.9,这表明优异的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。
转录物4:在正常组(p<0.05)和恶性组(p=0.034)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的-9.7628的截断值导致灵敏度为67%,特异度为100%,曲线下面积为0.833,这表明良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。
转录物11:在正常组(p<0.05)和恶性精原细胞瘤组(p=0.016)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的0.732的截断值导致灵敏度为100%,特异度为100%,曲线下面积为1.00,这表明优异的检验精确度。在恶性精原细胞瘤(p<0.05)和恶性非精原细胞瘤(p=0.016)的平均值之间也存在统计上显著性差异。使用通过ROC曲线证实的0.9884的截断值导致灵敏度为100%,特异度为80%,曲线下面积为0.90,这表明优异的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。
转录物12:在正常组(p<0.1)和恶性精原细胞瘤组(p=0.056)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的1.5361的截断值导致灵敏度为100%,特异度为87.5%,曲线下面积为0.969,这表明优异的检验精确度。在恶性精原细胞瘤(p<0.05)和恶性非精原细胞瘤(p=0.044)的平均值之间也存在统计上显著性差异。使用通过ROC曲线证实的1.6039的截断值导致灵敏度为100%,特异度为80%,曲线下面积为0.9,这表明优异的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。
转录物13:在正常组(p<0.05)和恶性组(p=0.019)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的-9.8751的截断值导致灵敏度为87.5%,特异度为78%,曲线下面积为0.875,这表明非常良好的检验精确度。在恶性非精原细胞瘤组(p<0.01)和良性组(p=0.000)的平均值之间也存在统计上显著性差异。使用通过ROC曲线证实的-13.9519的截断值导致灵敏度为100%,特异度为87.5%,曲线下面积为0.975,这表明优异的检验精确度。在恶性精原细胞瘤(p<0.01)和恶性非精原细胞瘤(p=0.001)的平均值之间也存在统计上显著性差异。使用通过ROC曲线证实的-15.8501的截断值导致灵敏度为100%,特异度为100%,曲线下面积为1.00,这表明优异的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。
转录物15:在正常组(p<0.1)和恶性组(p=0.065)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的-5.4916的截断值导致灵敏度为75%,特异度为89%,曲线下面积为0.835,这表明良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。
转录物16:在正常组(p<0.05)和恶性组(包括精原细胞瘤和非精原细胞瘤)(p=0.037)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的-6.448的截断值导致灵敏度为89%,特异度为75%,曲线下面积为0.806,这表明良好的检验精确度。在正常(p<0.05)和恶性精原细胞瘤(p=0.037)的平均值之间也存在统计上显著性差异。使用通过ROC曲线证实的-7.4575的截断值导致灵敏度为100%,特异度为87.5%,曲线下面积为0.938,这表明优异的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。
转录物20:在正常组(p<0.01)和恶性精原细胞瘤组(p=0.006)的平均值之间存在统计上显著性差异。使用通过ROC曲线证实的1.8364的截断值导致灵敏度为100%,特异度为100%,曲线下面积为1.00,这表明优异的检验精确度。在恶性精原细胞瘤(p<0.01)和恶性非精原细胞瘤(p=0.004)的平均值之间也存在统计上显著性差异。使用通过ROC曲线证实的1.6065的截断值导致灵敏度为100%,特异度为100%,曲线下面积为1.00,这表明优异的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。
结论:
上述结果示出转录物2、3、4、11、12、13、15、16和20在睾丸癌和睾丸癌亚型的检测以及辨别恶性和正常睾丸组织中的实用性。还发现转录物2具有在前列腺癌、乳腺癌、结肠直肠癌和卵巢癌的检测中的实用性。还发现转录物3具有在前列腺癌、乳腺癌、黑色素瘤结肠直肠癌和卵巢癌的检测中的实用性。还发现转录物4具有在前列腺癌和结肠直肠癌的检测中的实用性。还发现转录物11具有在结肠直肠癌、黑色素瘤和卵巢癌的检测中的实用性。还发现转录物12具有在结肠直肠癌和卵巢癌的检测中的实用性。还发现转录物15具有在黑色素瘤和卵巢癌的检测中的实用性。还发现转录物16具有在黑色素瘤皮肤癌的检测中的实用性。还发现转录物20具有在结肠直肠癌、黑色素瘤和卵巢癌的检测中的实用性。这些9种转录物中的任一种可在临床环境下单独或联合用作检测或表征睾丸癌的工具。
在一个方面中,本发明提供一种试剂盒,其进行测定以确定组织样品中存在癌症。所述试剂盒包括进行上述测定所需要的试剂。特别地,试剂盒包括一种或多种容器,所述容器含有一种或多种对应于上述转录物1至17和20的杂交探针。将理解,用于进行测定的试剂可包括任何必需的缓冲盐、盐、检测试剂等。此外,试剂盒可包括任何必需的样品收集装置、容器等以获得需要的组织样品、试剂或材料,从而通过(例如)均质化或核酸提取来制备组织样品,或为了进行受试者的测定或测定。试剂盒还可包括对照组织或样品以建立或确认用于疾病或非疾病组织的可接受的值。
尽管已经参照某些特定实施方案来说明了本发明,但是其各种改变对于本领域普通技术人员来说是显而易见的,只要其不偏离在所附权利要求书中所列出的本发明的精神和范围即可。在本申请中提到的所有的文件(文章、手册、专利申请等)都通过引用的方式并入本文。
参考文献目录
其中,下列文献在上述说明中引用。这些文献的全部内容都通过引用的方式并入本文。
表1:已知具有ORF的线粒体缺失
表6:通过疾病进行的转录物概述
序列表
<110> MDNA生命科学有限公司
<120> 异常线粒体DNA、相关的融合转录物及其杂交探针
<130> PW69153SEAN
<140> PCT/CA2009/000351
<141> 2009-03-27
<150> 61/040,616
<151> 2008-03-28
<160> 52
<170> PatentIn version 3.3
<210> 1
<211> 16568
<212> DNA
<213> 人
<400> 1
gatcacaggt ctatcaccct attaaccact cacgggagct ctccatgcat ttggtatttt 60
cgtctggggg gtatgcacgc gatagcattg cgagacgctg gagccggagc accctatgtc 120
gcagtatctg tctttgattc ctgcctcatc ctattattta tcgcacctac gttcaatatt 180
acaggcgaac atacttacta aagtgtgtta attaattaat gcttgtagga cataataata 240
acaattgaat gtctgcacag ccactttcca cacagacatc ataacaaaaa atttccacca 300
aaccccccct cccccgcttc tggccacagc acttaaacac atctctgcca aaccccaaaa 360
acaaagaacc ctaacaccag cctaaccaga tttcaaattt tatcttttgg cggtatgcac 420
ttttaacagt caccccccaa ctaacacatt attttcccct cccactccca tactactaat 480
ctcatcaata caacccccgc ccatcctacc cagcacacac acaccgctgc taaccccata 540
ccccgaacca accaaacccc aaagacaccc cccacagttt atgtagctta cctcctcaaa 600
gcaatacact gaaaatgttt agacgggctc acatcacccc ataaacaaat aggtttggtc 660
ctagcctttc tattagctct tagtaagatt acacatgcaa gcatccccgt tccagtgagt 720
tcaccctcta aatcaccacg atcaaaagga acaagcatca agcacgcagc aatgcagctc 780
aaaacgctta gcctagccac acccccacgg gaaacagcag tgattaacct ttagcaataa 840
acgaaagttt aactaagcta tactaacccc agggttggtc aatttcgtgc cagccaccgc 900
ggtcacacga ttaacccaag tcaatagaag ccggcgtaaa gagtgtttta gatcaccccc 960
tccccaataa agctaaaact cacctgagtt gtaaaaaact ccagttgaca caaaatagac 1020
tacgaaagtg gctttaacat atctgaacac acaatagcta agacccaaac tgggattaga 1080
taccccacta tgcttagccc taaacctcaa cagttaaatc aacaaaactg ctcgccagaa 1140
cactacgagc cacagcttaa aactcaaagg acctggcggt gcttcatatc cctctagagg 1200
agcctgttct gtaatcgata aaccccgatc aacctcacca cctcttgctc agcctatata 1260
ccgccatctt cagcaaaccc tgatgaaggc tacaaagtaa gcgcaagtac ccacgtaaag 1320
acgttaggtc aaggtgtagc ccatgaggtg gcaagaaatg ggctacattt tctaccccag 1380
aaaactacga tagcccttat gaaacttaag ggtcgaaggt ggatttagca gtaaactaag 1440
agtagagtgc ttagttgaac agggccctga agcgcgtaca caccgcccgt caccctcctc 1500
aagtatactt caaaggacat ttaactaaaa cccctacgca tttatataga ggagacaagt 1560
cgtaacatgg taagtgtact ggaaagtgca cttggacgaa ccagagtgta gcttaacaca 1620
aagcacccaa cttacactta ggagatttca acttaacttg accgctctga gctaaaccta 1680
gccccaaacc cactccacct tactaccaga caaccttagc caaaccattt acccaaataa 1740
agtataggcg atagaaattg aaacctggcg caatagatat agtaccgcaa gggaaagatg 1800
aaaaattata accaagcata atatagcaag gactaacccc tataccttct gcataatgaa 1860
ttaactagaa ataactttgc aaggagagcc aaagctaaga cccccgaaac cagacgagct 1920
acctaagaac agctaaaaga gcacacccgt ctatgtagca aaatagtggg aagatttata 1980
ggtagaggcg acaaacctac cgagcctggt gatagctggt tgtccaagat agaatcttag 2040
ttcaacttta aatttgccca cagaaccctc taaatcccct tgtaaattta actgttagtc 2100
caaagaggaa cagctctttg gacactagga aaaaaccttg tagagagagt aaaaaattta 2160
acacccatag taggcctaaa agcagccacc aattaagaaa gcgttcaagc tcaacaccca 2220
ctacctaaaa aatcccaaac atataactga actcctcaca cccaattgga ccaatctatc 2280
accctataga agaactaatg ttagtataag taacatgaaa acattctcct ccgcataagc 2340
ctgcgtcaga ttaaaacact gaactgacaa ttaacagccc aatatctaca atcaaccaac 2400
aagtcattat taccctcact gtcaacccaa cacaggcatg ctcataagga aaggttaaaa 2460
aaagtaaaag gaactcggca aatcttaccc cgcctgttta ccaaaaacat cacctctagc 2520
atcaccagta ttagaggcac cgcctgccca gtgacacatg tttaacggcc gcggtaccct 2580
aaccgtgcaa aggtagcata atcacttgtt ccttaaatag ggacctgtat gaatggctcc 2640
acgagggttc agctgtctct tacttttaac cagtgaaatt gacctgcccg tgaagaggcg 2700
ggcataacac agcaagacga gaagacccta tggagcttta atttattaat gcaaacagta 2760
cctaacaaac ccacaggtcc taaactacca aacctgcatt aaaaatttcg gttggggcga 2820
cctcggagca gaacccaacc tccgagcagt acatgctaag acttcaccag tcaaagcgaa 2880
ctactatact caattgatcc aataacttga ccaacggaac aagttaccct agggataaca 2940
gcgcaatcct attctagagt ccatatcaac aatagggttt acgacctcga tgttggatca 3000
ggacatcccg atggtgcagc cgctattaaa ggttcgtttg ttcaacgatt aaagtcctac 3060
gtgatctgag ttcagaccgg agtaatccag gtcggtttct atctacttca aattcctccc 3120
tgtacgaaag gacaagagaa ataaggccta cttcacaaag cgccttcccc cgtaaatgat 3180
atcatctcaa cttagtatta tacccacacc cacccaagaa cagggtttgt taagatggca 3240
gagcccggta atcgcataaa acttaaaact ttacagtcag aggttcaatt cctcttctta 3300
acaacatacc catggccaac ctcctactcc tcattgtacc cattctaatc gcaatggcat 3360
tcctaatgct taccgaacga aaaattctag gctatataca actacgcaaa ggccccaacg 3420
ttgtaggccc ctacgggcta ctacaaccct tcgctgacgc cataaaactc ttcaccaaag 3480
agcccctaaa acccgccaca tctaccatca ccctctacat caccgccccg accttagctc 3540
tcaccatcgc tcttctacta tgaacccccc tccccatacc caaccccctg gtcaacctca 3600
acctaggcct cctatttatt ctagccacct ctagcctagc cgtttactca atcctctgat 3660
cagggtgagc atcaaactca aactacgccc tgatcggcgc actgcgagca gtagcccaaa 3720
caatctcata tgaagtcacc ctagccatca ttctactatc aacattacta ataagtggct 3780
cctttaacct ctccaccctt atcacaacac aagaacacct ctgattactc ctgccatcat 3840
gacccttggc cataatatga tttatctcca cactagcaga gaccaaccga acccccttcg 3900
accttgccga aggggagtcc gaactagtct caggcttcaa catcgaatac gccgcaggcc 3960
ccttcgccct attcttcata gccgaataca caaacattat tataataaac accctcacca 4020
ctacaatctt cctaggaaca acatatgacg cactctcccc tgaactctac acaacatatt 4080
ttgtcaccaa gaccctactt ctaacctccc tgttcttatg aattcgaaca gcataccccc 4140
gattccgcta cgaccaactc atacacctcc tatgaaaaaa cttcctacca ctcaccctag 4200
cattacttat atgatatgtc tccataccca ttacaatctc cagcattccc cctcaaacct 4260
aagaaatatg tctgataaaa gagttacttt gatagagtaa ataataggag cttaaacccc 4320
cttatttcta ggactatgag aatcgaaccc atccctgaga atccaaaatt ctccgtgcca 4380
cctatcacac cccatcctaa agtaaggtca gctaaataag ctatcgggcc cataccccga 4440
aaatgttggt tatacccttc ccgtactaat taatcccctg gcccaacccg tcatctactc 4500
taccatcttt gcaggcacac tcatcacagc gctaagctcg cactgatttt ttacctgagt 4560
aggcctagaa ataaacatgc tagcttttat tccagttcta accaaaaaaa taaaccctcg 4620
ttccacagaa gctgccatca agtatttcct cacgcaagca accgcatcca taatccttct 4680
aatagctatc ctcttcaaca atatactctc cggacaatga accataacca atactaccaa 4740
tcaatactca tcattaataa tcataatagc tatagcaata aaactaggaa tagccccctt 4800
tcacttctga gtcccagagg ttacccaagg cacccctctg acatccggcc tgcttcttct 4860
cacatgacaa aaactagccc ccatctcaat catataccaa atctctccct cactaaacgt 4920
aagccttctc ctcactctct caatcttatc catcatagca ggcagttgag gtggattaaa 4980
ccaaacccag ctacgcaaaa tcttagcata ctcctcaatt acccacatag gatgaataat 5040
agcagttcta ccgtacaacc ctaacataac cattcttaat ttaactattt atattatcct 5100
aactactacc gcattcctac tactcaactt aaactccagc accacgaccc tactactatc 5160
tcgcacctga aacaagctaa catgactaac acccttaatt ccatccaccc tcctctccct 5220
aggaggcctg cccccgctaa ccggcttttt gcccaaatgg gccattatcg aagaattcac 5280
aaaaaacaat agcctcatca tccccaccat catagccacc atcaccctcc ttaacctcta 5340
cttctaccta cgcctaatct actccacctc aatcacacta ctccccatat ctaacaacgt 5400
aaaaataaaa tgacagtttg aacatacaaa acccacccca ttcctcccca cactcatcgc 5460
ccttaccacg ctactcctac ctatctcccc ttttatacta ataatcttat agaaatttag 5520
gttaaataca gaccaagagc cttcaaagcc ctcagtaagt tgcaatactt aatttctgta 5580
acagctaagg actgcaaaac cccactctgc atcaactgaa cgcaaatcag ccactttaat 5640
taagctaagc ccttactaga ccaatgggac ttaaacccac aaacacttag ttaacagcta 5700
agcaccctaa tcaactggct tcaatctact tctcccgccg ccgggaaaaa aggcgggaga 5760
agccccggca ggtttgaagc tgcttcttcg aatttgcaat tcaatatgaa aatcacctcg 5820
gagctggtaa aaagaggcct aacccctgtc tttagattta cagtccaatg cttcactcag 5880
ccattttacc tcacccccac tgatgttcgc cgaccgttga ctattctcta caaaccacaa 5940
agacattgga acactatacc tattattcgg cgcatgagct ggagtcctag gcacagctct 6000
aagcctcctt attcgagccg agctgggcca gccaggcaac cttctaggta acgaccacat 6060
ctacaacgtt atcgtcacag cccatgcatt tgtaataatc ttcttcatag taatacccat 6120
cataatcgga ggctttggca actgactagt tcccctaata atcggtgccc ccgatatggc 6180
gtttccccgc ataaacaaca taagcttctg actcttacct ccctctctcc tactcctgct 6240
cgcatctgct atagtggagg ccggagcagg aacaggttga acagtctacc ctcccttagc 6300
agggaactac tcccaccctg gagcctccgt agacctaacc atcttctcct tacacctagc 6360
aggtgtctcc tctatcttag gggccatcaa tttcatcaca acaattatca atataaaacc 6420
ccctgccata acccaatacc aaacgcccct cttcgtctga tccgtcctaa tcacagcagt 6480
cctacttctc ctatctctcc cagtcctagc tgctggcatc actatactac taacagaccg 6540
caacctcaac accaccttct tcgaccccgc cggaggagga gaccccattc tataccaaca 6600
cctattctga tttttcggtc accctgaagt ttatattctt atcctaccag gcttcggaat 6660
aatctcccat attgtaactt actactccgg aaaaaaagaa ccatttggat acataggtat 6720
ggtctgagct atgatatcaa ttggcttcct agggtttatc gtgtgagcac accatatatt 6780
tacagtagga atagacgtag acacacgagc atatttcacc tccgctacca taatcatcgc 6840
tatccccacc ggcgtcaaag tatttagctg actcgccaca ctccacggaa gcaatatgaa 6900
atgatctgct gcagtgctct gagccctagg attcatcttt cttttcaccg taggtggcct 6960
gactggcatt gtattagcaa actcatcact agacatcgta ctacacgaca cgtactacgt 7020
tgtagcccac ttccactatg tcctatcaat aggagctgta tttgccatca taggaggctt 7080
cattcactga tttcccctat tctcaggcta caccctagac caaacctacg ccaaaatcca 7140
tttcactatc atattcatcg gcgtaaatct aactttcttc ccacaacact ttctcggcct 7200
atccggaatg ccccgacgtt actcggacta ccccgatgca tacaccacat gaaacatcct 7260
atcatctgta ggctcattca tttctctaac agcagtaata ttaataattt tcatgatttg 7320
agaagccttc gcttcgaagc gaaaagtcct aatagtagaa gaaccctcca taaacctgga 7380
gtgactatat ggatgccccc caccctacca cacattcgaa gaacccgtat acataaaatc 7440
tagacaaaaa aggaaggaat cgaacccccc aaagctggtt tcaagccaac cccatggcct 7500
ccatgacttt ttcaaaaagg tattagaaaa accatttcat aactttgtca aagttaaatt 7560
ataggctaaa tcctatatat cttaatggca catgcagcgc aagtaggtct acaagacgct 7620
acttccccta tcatagaaga gcttatcacc tttcatgatc acgccctcat aatcattttc 7680
cttatctgct tcctagtcct gtatgccctt ttcctaacac tcacaacaaa actaactaat 7740
actaacatct cagacgctca ggaaatagaa accgtctgaa ctatcctgcc cgccatcatc 7800
ctagtcctca tcgccctccc atccctacgc atcctttaca taacagacga ggtcaacgat 7860
ccctccctta ccatcaaatc aattggccac caatggtact gaacctacga gtacaccgac 7920
tacggcggac taatcttcaa ctcctacata cttcccccat tattcctaga accaggcgac 7980
ctgcgactcc ttgacgttga caatcgagta gtactcccga ttgaagcccc cattcgtata 8040
ataattacat cacaagacgt cttgcactca tgagctgtcc ccacattagg cttaaaaaca 8100
gatgcaattc ccggacgtct aaaccaaacc actttcaccg ctacacgacc gggggtatac 8160
tacggtcaat gctctgaaat ctgtggagca aaccacagtt tcatgcccat cgtcctagaa 8220
ttaattcccc taaaaatctt tgaaataggg cccgtattta ccctatagca ccccctctac 8280
cccctctaga gcccactgta aagctaactt agcattaacc ttttaagtta aagattaaga 8340
gaaccaacac ctctttacag tgaaatgccc caactaaata ctaccgtatg gcccaccata 8400
attaccccca tactccttac actattcctc atcacccaac taaaaatatt aaacacaaac 8460
taccacctac ctccctcacc aaagcccata aaaataaaaa attataacaa accctgagaa 8520
ccaaaatgaa cgaaaatctg ttcgcttcat tcattgcccc cacaatccta ggcctacccg 8580
ccgcagtact gatcattcta tttccccctc tattgatccc cacctccaaa tatctcatca 8640
acaaccgact aatcaccacc caacaatgac taatcaaact aacctcaaaa caaatgataa 8700
ccatacacaa cactaaagga cgaacctgat ctcttatact agtatcctta atcattttta 8760
ttgccacaac taacctcctc ggactcctgc ctcactcatt tacaccaacc acccaactat 8820
ctataaacct agccatggcc atccccttat gagcgggcac agtgattata ggctttcgct 8880
ctaagattaa aaatgcccta gcccacttct taccacaagg cacacctaca ccccttatcc 8940
ccatactagt tattatcgaa accatcagcc tactcattca accaatagcc ctggccgtac 9000
gcctaaccgc taacattact gcaggccacc tactcatgca cctaattgga agcgccaccc 9060
tagcaatatc aaccattaac cttccctcta cacttatcat cttcacaatt ctaattctac 9120
tgactatcct agaaatcgct gtcgccttaa tccaagccta cgttttcaca cttctagtaa 9180
gcctctacct gcacgacaac acataatgac ccaccaatca catgcctatc atatagtaaa 9240
acccagccca tgacccctaa caggggccct ctcagccctc ctaatgacct ccggcctagc 9300
catgtgattt cacttccact ccataacgct cctcatacta ggcctactaa ccaacacact 9360
aaccatatac caatgatggc gcgatgtaac acgagaaagc acataccaag gccaccacac 9420
accacctgtc caaaaaggcc ttcgatacgg gataatccta tttattacct cagaagtttt 9480
tttcttcgca ggatttttct gagcctttta ccactccagc ctagccccta ccccccaatt 9540
aggagggcac tggcccccaa caggcatcac cccgctaaat cccctagaag tcccactcct 9600
aaacacatcc gtattactcg catcaggagt atcaatcacc tgagctcacc atagtctaat 9660
agaaaacaac cgaaaccaaa taattcaagc actgcttatt acaattttac tgggtctcta 9720
ttttaccctc ctacaagcct cagagtactt cgagtctccc ttcaccattt ccgacggcat 9780
ctacggctca acattttttg tagccacagg cttccacgga cttcacgtca ttattggctc 9840
aactttcctc actatctgct tcatccgcca actaatattt cactttacat ccaaacatca 9900
ctttggcttc gaagccgccg cctgatactg gcattttgta gatgtggttt gactatttct 9960
gtatgtctcc atctattgat gagggtctta ctcttttagt ataaatagta ccgttaactt 10020
ccaattaact agttttgaca acattcaaaa aagagtaata aacttcgcct taattttaat 10080
aatcaacacc ctcctagcct tactactaat aattattaca ttttgactac cacaactcaa 10140
cggctacata gaaaaatcca ccccttacga gtgcggcttc gaccctatat cccccgcccg 10200
cgtccctttc tccataaaat tcttcttagt agctattacc ttcttattat ttgatctaga 10260
aattgccctc cttttacccc taccatgagc cctacaaaca actaacctgc cactaatagt 10320
tatgtcatcc ctcttattaa tcatcatcct agccctaagt ctggcctatg agtgactaca 10380
aaaaggatta gactgaaccg aattggtata tagtttaaac aaaacgaatg atttcgactc 10440
attaaattat gataatcata tttaccaaat gcccctcatt tacataaata ttatactagc 10500
atttaccatc tcacttctag gaatactagt atatcgctca cacctcatat cctccctact 10560
atgcctagaa ggaataatac tatcgctgtt cattatagct actctcataa ccctcaacac 10620
ccactccctc ttagccaata ttgtgcctat tgccatacta gtctttgccg cctgcgaagc 10680
agcggtgggc ctagccctac tagtctcaat ctccaacaca tatggcctag actacgtaca 10740
taacctaaac ctactccaat gctaaaacta atcgtcccaa caattatatt actaccactg 10800
acatgacttt ccaaaaaaca cataatttga atcaacacaa ccacccacag cctaattatt 10860
agcatcatcc ctctactatt ttttaaccaa atcaacaaca acctatttag ctgttcccca 10920
accttttcct ccgaccccct aacaaccccc ctcctaatac taactacctg actcctaccc 10980
ctcacaatca tggcaagcca acgccactta tccagtgaac cactatcacg aaaaaaactc 11040
tacctctcta tactaatctc cctacaaatc tccttaatta taacattcac agccacagaa 11100
ctaatcatat tttatatctt cttcgaaacc acacttatcc ccaccttggc tatcatcacc 11160
cgatgaggca accagccaga acgcctgaac gcaggcacat acttcctatt ctacacccta 11220
gtaggctccc ttcccctact catcgcacta atttacactc acaacaccct aggctcacta 11280
aacattctac tactcactct cactgcccaa gaactatcaa actcctgagc caacaactta 11340
atatgactag cttacacaat agcttttata gtaaagatac ctctttacgg actccactta 11400
tgactcccta aagcccatgt cgaagccccc atcgctgggt caatagtact tgccgcagta 11460
ctcttaaaac taggcggcta tggtataata cgcctcacac tcattctcaa ccccctgaca 11520
aaacacatag cctacccctt ccttgtacta tccctatgag gcataattat aacaagctcc 11580
atctgcctac gacaaacaga cctaaaatcg ctcattgcat actcttcaat cagccacata 11640
gccctcgtag taacagccat tctcatccaa accccctgaa gcttcaccgg cgcagtcatt 11700
ctcataatcg cccacgggct tacatcctca ttactattct gcctagcaaa ctcaaactac 11760
gaacgcactc acagtcgcat cataatcctc tctcaaggac ttcaaactct actcccacta 11820
atagcttttt gatgacttct agcaagcctc gctaacctcg ccttaccccc cactattaac 11880
ctactgggag aactctctgt gctagtaacc acgttctcct gatcaaatat cactctccta 11940
cttacaggac tcaacatact agtcacagcc ctatactccc tctacatatt taccacaaca 12000
caatggggct cactcaccca ccacattaac aacataaaac cctcattcac acgagaaaac 12060
accctcatgt tcatacacct atcccccatt ctcctcctat ccctcaaccc cgacatcatt 12120
accgggtttt cctcttgtaa atatagttta accaaaacat cagattgtga atctgacaac 12180
agaggcttac gaccccttat ttaccgagaa agctcacaag aactgctaac tcatgccccc 12240
atgtctaaca acatggcttt ctcaactttt aaaggataac agctatccat tggtcttagg 12300
ccccaaaaat tttggtgcaa ctccaaataa aagtaataac catgcacact actataacca 12360
ccctaaccct gacttcccta attcccccca tccttaccac cctcgttaac cctaacaaaa 12420
aaaactcata cccccattat gtaaaatcca ttgtcgcatc cacctttatt atcagtctct 12480
tccccacaac aatattcatg tgcctagacc aagaagttat tatctcgaac tgacactgag 12540
ccacaaccca aacaacccag ctctccctaa gcttcaaact agactacttc tccataatat 12600
tcatccctgt agcattgttc gttacatggt ccatcataga attctcactg tgatatataa 12660
actcagaccc aaacattaat cagttcttca aatatctact catcttccta attaccatac 12720
taatcttagt taccgctaac aacctattcc aactgttcat cggctgagag ggcgtaggaa 12780
ttatatcctt cttgctcatc agttgatgat acgcccgagc agatgccaac acagcagcca 12840
ttcaagcaat cctatacaac cgtatcggcg atatcggttt catcctcgcc ttagcatgat 12900
ttatcctaca ctccaactca tgagacccac aacaaatagc ccttctaaac gctaatccaa 12960
gcctcacccc actactaggc ctcctcctag cagcagcagg caaatcagcc caattaggtc 13020
tccacccctg actcccctca gccatagaag gccccacccc agtctcagcc ctactccact 13080
caagcactat agttgtagca ggaatcttct tactcatccg cttccacccc ctagcagaaa 13140
atagcccact aatccaaact ctaacactat gcttaggcgc tatcaccact ctgttcgcag 13200
cagtctgcgc ccttacacaa aatgacatca aaaaaatcgt agccttctcc acttcaagtc 13260
aactaggact cataatagtt acaatcggca tcaaccaacc acacctagca ttcctgcaca 13320
tctgtaccca cgccttcttc aaagccatac tatttatgtg ctccgggtcc atcatccaca 13380
accttaacaa tgaacaagat attcgaaaaa taggaggact actcaaaacc atacctctca 13440
cttcaacctc cctcaccatt ggcagcctag cattagcagg aatacctttc ctcacaggtt 13500
tctactccaa agaccacatc atcgaaaccg caaacatatc atacacaaac gcctgagccc 13560
tatctattac tctcatcgct acctccctga caagcgccta tagcactcga ataattcttc 13620
tcaccctaac aggtcaacct cgcttcccca cccttactaa cattaacgaa aataacccca 13680
ccctactaaa ccccattaaa cgcctggcag ccggaagcct attcgcagga tttctcatta 13740
ctaacaacat ttcccccgca tcccccttcc aaacaacaat ccccctctac ctaaaactca 13800
cagccctcgc tgtcactttc ctaggacttc taacagccct agacctcaac tacctaacca 13860
acaaacttaa aataaaatcc ccactatgca cattttattt ctccaacata ctcggattct 13920
accctagcat cacacaccgc acaatcccct atctaggcct tcttacgagc caaaacctgc 13980
ccctactcct cctagaccta acctgactag aaaagctatt acctaaaaca atttcacagc 14040
accaaatctc cacctccatc atcacctcaa cccaaaaagg cataattaaa ctttacttcc 14100
tctctttctt cttcccactc atcctaaccc tactcctaat cacataacct attcccccga 14160
gcaatctcaa ttacaatata tacaccaaca aacaatgttc aaccagtaac tactactaat 14220
caacgcccat aatcatacaa agcccccgca ccaataggat cctcccgaat caaccctgac 14280
ccctctcctt cataaattat tcagcttcct acactattaa agtttaccac aaccaccacc 14340
ccatcatact ctttcaccca cagcaccaat cctacctcca tcgctaaccc cactaaaaca 14400
ctcaccaaga cctcaacccc tgacccccat gcctcaggat actcctcaat agccatcgct 14460
gtagtatatc caaagacaac catcattccc cctaaataaa ttaaaaaaac tattaaaccc 14520
atataacctc ccccaaaatt cagaataata acacacccga ccacaccgct aacaatcaat 14580
actaaacccc cataaatagg agaaggctta gaagaaaacc ccacaaaccc cattactaaa 14640
cccacactca acagaaacaa agcatacatc attattctcg cacggactac aaccacgacc 14700
aatgatatga aaaaccatcg ttgtatttca actacaagaa caccaatgac cccaatacgc 14760
aaaactaacc ccctaataaa attaattaac cactcattca tcgacctccc caccccatcc 14820
aacatctccg catgatgaaa cttcggctca ctccttggcg cctgcctgat cctccaaatc 14880
accacaggac tattcctagc catgcactac tcaccagacg cctcaaccgc cttttcatca 14940
atcgcccaca tcactcgaga cgtaaattat ggctgaatca tccgctacct tcacgccaat 15000
ggcgcctcaa tattctttat ctgcctcttc ctacacatcg ggcgaggcct atattacgga 15060
tcatttctct actcagaaac ctgaaacatc ggcattatcc tcctgcttgc aactatagca 15120
acagccttca taggctatgt cctcccgtga ggccaaatat cattctgagg ggccacagta 15180
attacaaact tactatccgc catcccatac attgggacag acctagttca atgaatctga 15240
ggaggctact cagtagacag tcccaccctc acacgattct ttacctttca cttcatcttg 15300
cccttcatta ttgcagccct agcaacactc cacctcctat tcttgcacga aacgggatca 15360
aacaaccccc taggaatcac ctcccattcc gataaaatca ccttccaccc ttactacaca 15420
atcaaagacg ccctcggctt acttctcttc cttctctcct taatgacatt aacactattc 15480
tcaccagacc tcctaggcga cccagacaat tataccctag ccaacccctt aaacacccct 15540
ccccacatca agcccgaatg atatttccta ttcgcctaca caattctccg atccgtccct 15600
aacaaactag gaggcgtcct tgccctatta ctatccatcc tcatcctagc aataatcccc 15660
atcctccata tatccaaaca acaaagcata atatttcgcc cactaagcca atcactttat 15720
tgactcctag ccgcagacct cctcattcta acctgaatcg gaggacaacc agtaagctac 15780
ccttttacca tcattggaca agtagcatcc gtactatact tcacaacaat cctaatccta 15840
ataccaacta tctccctaat tgaaaacaaa atactcaaat gggcctgtcc ttgtagtata 15900
aactaataca ccagtcttgt aaaccggaga tgaaaacctt tttccaagga caaatcagag 15960
aaaaagtctt taactccacc attagcaccc aaagctaaga ttctaattta aactattctc 16020
tgttctttca tggggaagca gatttgggta ccacccaagt attgactcac ccatcaacaa 16080
ccgctatgta tttcgtacat tactgccagc caccatgaat attgtacggt accataaata 16140
cttgaccacc tgtagtacat aaaaacccaa tccacatcaa aaccccctcc ccatgcttac 16200
aagcaagtac agcaatcaac cctcaactat cacacatcaa ctgcaactcc aaagccaccc 16260
ctcacccact aggataccaa caaacctacc cacccttaac agtacatagt acataaagcc 16320
atttaccgta catagcacat tacagtcaaa tcccttctcg tccccatgga tgacccccct 16380
cagatagggg tcccttgacc accatcctcc gtgaaatcaa tatcccgcac aagagtgcta 16440
ctctcctcgc tccgggccca taacacttgg gggtagctaa agtgaactgt atccgacatc 16500
tggttcctac ttcagggtca taaagcctaa atagcccaca cgttcccctt aaataagaca 16560
tcacgatg 16568
<210> 2
<211> 783
<212> DNA
<213> Artificial
<220>
<223> cDNA
<400> 2
atggcccacc ataattaccc ccatactcct tacactattc ctcatcaccc aactaaaaat 60
attaaacaca aactaccacc tacctccctc accattggca gcctagcatt agcaggaata 120
cctttcctca caggtttcta ctccaaagac cacatcatcg aaaccgcaaa catatcatac 180
acaaacgcct gagccctatc tattactctc atcgctacct ccctgacaag cgcctatagc 240
actcgaataa ttcttctcac cctaacaggt caacctcgct tccccaccct tactaacatt 300
aacgaaaata accccaccct actaaacccc attaaacgcc tggcagccgg aagcctattc 360
gcaggatttc tcattactaa caacatttcc cccgcatccc ccttccaaac aacaatcccc 420
ctctacctaa aactcacagc cctcgctgtc actttcctag gacttctaac agccctagac 480
ctcaactacc taaccaacaa acttaaaata aaatccccac tatgcacatt ttatttctcc 540
aacatactcg gattctaccc tagcatcaca caccgcacaa tcccctatct aggccttctt 600
acgagccaaa acctgcccct actcctccta gacctaacct gactagaaaa gctattacct 660
aaaacaattt cacagcacca aatctccacc tccatcatca cctcaaccca aaaaggcata 720
attaaacttt acttcctctc tttcttcttc ccactcatcc taaccctact cctaatcaca 780
taa 783
<210> 3
<211> 300
<212> DNA
<213> Artificial
<220>
<223> cDNA
<400> 3
atgcccctca tttacataaa tattatacta gcatttacca tctcacttct aggaatacta 60
gtatatcgct cacacctcat atcctcccta ctatgcctag aaggaataat actatcgctg 120
ttcattatag ctactctcat aaccctcaac acccactccc tcttagccaa tattgtgcct 180
attgccatac tagtctttgc cgcctgcgaa gcagcggtgg gcctagccct actagtctca 240
atctccaaca catatggcct agactacgta cataacctaa ccctactcct aatcacataa 300
<210> 4
<211> 781
<212> DNA
<213> Artificial
<220>
<223> cDNA
<400> 4
atggcacatg cagcgcaagt aggtctacaa gacgctactt cccctatcat agaagagctt 60
atcacctttc atgatcacgc cctcataatc attttcctta tctgcttcct agtcctgtat 120
gcccttttcc taacactcac aacaaaacta actaatacta acatctcaga cgctcaggaa 180
atagaaaccg tctgaactat cctgcccgcc atcatcctag tcctcatcgc cctcccatcc 240
ctacgcatcc tttacataac agacgaggtc aacgatccct cccttaccat caaatcaatt 300
ggccaccaat ggtactgaac ctacgagtac accgactacg gcggactaat cttcaactcc 360
tacatacttc ccccattatt cctagaacca ggcgacccag acaattatac cctagccaac 420
cccttaaaca cccctcccca catcaagccc gaatgatatt tcctattcgc ctacacaatt 480
ctccgatccg tccctaacaa actaggaggc gtccttgccc tattactatc catcctcatc 540
ctagcaataa tccccatcct ccatatatcc aaacaacaaa gcataatatt tcgcccacta 600
agccaatcac tttattgact cctagccgca gacctcctca ttctaacctg aatcggagga 660
caaccagtaa gctacccttt taccatcatt ggacaagtag catccgtact atacttcaca 720
acaatcctaa tcctaatacc aactatctcc ctaattgaaa acaaaatact caaatgggcc 780
t 781
<210> 5
<211> 565
<212> DNA
<213> Artificial
<220>
<223> cDNA
<400> 5
atggcacatg cagcgcaagt aggtctacaa gacgctactt cccctatcat agaagagctt 60
atcacctttc atgatcacgc cctcataatc attttcctta tctgcttcct agtcctgtat 120
gcccttttcc taacactcac aacaaaacta actaatacta acatctcaga cgctcaggaa 180
atagaaaccg tctgaactat cctgcccgcc atcatcctag tcctcatcgc cctcccatcc 240
ctacgcatcc tttacataac agacgaggtc aacgatccct cccttaccat caaatcaatt 300
ggccaccaat ggtactgaac ctacgagtac accgactacg gcggactaat cttcaactcc 360
tacatacttc ccccattatt cctagaacca ggcgacctgc gactcctagc cgcagacctc 420
ctcattctaa cctgaatcgg aggacaacca gtaagctacc cttttaccat cattggacaa 480
gtagcatccg tactatactt cacaacaatc ctaatcctaa taccaactat ctccctaatt 540
gaaaacaaaa tactcaaatg ggcct 565
<210> 6
<211> 1174
<212> DNA
<213> Artificial
<220>
<223> cDNA
<400> 6
atggcacatg cagcgcaagt aggtctacaa gacgctactt cccctatcat agaagagctt 60
atcacctttc atgatcacgc cctcataatc attttcctta tctgcttcct agtcctgtat 120
gcccttttcc taacactcac aacaaaacta actaatacta acatctcaga cgctcaggaa 180
atagaaaccg tctgaactat cctgcccgcc atcatcctag tcctcatcgc cctcccatcc 240
ctacgcatcc tttacataac agacgaggtc aacgatccct cccttaccat caaatcaatt 300
ggccaccaat ggtactgaac ctacgagtac accgactacg gcggactaat cttcaactcc 360
tacatacttc ccccattatt cctagaacca ggcgacctgc gactccttga cgttgacaat 420
cgagtagtac tcccgattga agcccccatt cgtataataa ttacatcaca agacgtcttg 480
cactcatgag ctgtccccac attaggctta aaaacagatg caattcccgg acgtctaaac 540
caaaccactt tcaccgctac acgaccgggg gtatactacg gtcaatgctc tgaaatctgt 600
ggagcaaacc acagtttcat gcccatattc ttgcacgaaa cgggatcaaa caacccccta 660
ggaatcacct cccattccga taaaatcacc ttccaccctt actacacaat caaagacgcc 720
ctcggcttac ttctcttcct tctctcctta atgacattaa cactattctc accagacctc 780
ctaggcgacc cagacaatta taccctagcc aaccccttaa acacccctcc ccacatcaag 840
cccgaatgat atttcctatt cgcctacaca attctccgat ccgtccctaa caaactagga 900
ggcgtccttg ccctattact atccatcctc atcctagcaa taatccccat cctccatata 960
tccaaacaac aaagcataat atttcgccca ctaagccaat cactttattg actcctagcc 1020
gcagacctcc tcattctaac ctgaatcgga ggacaaccag taagctaccc ttttaccatc 1080
attggacaag tagcatccgt actatacttc acaacaatcc taatcctaat accaactatc 1140
tccctaattg aaaacaaaat actcaaatgg gcct 1174
<210> 7
<211> 1294
<212> DNA
<213> Artificial
<220>
<223> cDNA
<400> 7
atgaacgaaa atctgttcgc ttcattcatt gcccccacaa tcctaggcct acccgccgca 60
gtactgatca ttctatttcc ccctctattg atccccacct ccaaatatct catcaacaac 120
cgactaatca ccacccaaca atgactaatc aaactaacct caaaacaaat gataaccata 180
cacaacacta aaggacgaac ctgatctctt atactagtat ccttaatcat ttttattgcc 240
acaactaacc tcctcggact cctgcctcac tcatttacac caaccaccca actatctata 300
aacctagcca tgcactactc accagacgcc tcaaccgcct tttcatcaat cgcccacatc 360
actcgagacg taaattatgg ctgaatcatc cgctaccttc acgccaatgg cgcctcaata 420
ttctttatct gcctcttcct acacatcggg cgaggcctat attacggatc atttctctac 480
tcagaaacct gaaacatcgg cattatcctc ctgcttgcaa ctatagcaac agccttcata 540
ggctatgtcc tcccgtgagg ccaaatatca ttctgagggg ccacagtaat tacaaactta 600
ctatccgcca tcccatacat tgggacagac ctagttcaat gaatctgagg aggctactca 660
gtagacagtc ccaccctcac acgattcttt acctttcact tcatcttgcc cttcattatt 720
gcagccctag caacactcca cctcctattc ttgcacgaaa cgggatcaaa caacccccta 780
ggaatcacct cccattccga taaaatcacc ttccaccctt actacacaat caaagacgcc 840
ctcggcttac ttctcttcct tctctcctta atgacattaa cactattctc accagacctc 900
ctaggcgacc cagacaatta taccctagcc aaccccttaa acacccctcc ccacatcaag 960
cccgaatgat atttcctatt cgcctacaca attctccgat ccgtccctaa caaactagga 1020
ggcgtccttg ccctattact atccatcctc atcctagcaa taatccccat cctccatata 1080
tccaaacaac aaagcataat atttcgccca ctaagccaat cactttattg actcctagcc 1140
gcagacctcc tcattctaac ctgaatcgga ggacaaccag taagctaccc ttttaccatc 1200
attggacaag tagcatccgt actatacttc acaacaatcc taatcctaat accaactatc 1260
tccctaattg aaaacaaaat actcaaatgg gcct 1294
<210> 8
<211> 1228
<212> DNA
<213> Artificial
<220>
<223> cDNA
<400> 8
atgcccctca tttacataaa tattatacta gcatttacca tctcacttct aggaatacta 60
gtatatcgct cacacctcat atcctcccta ctatgcctag aaggaataat actatcgctg 120
ttcattatag ctactctcat aaccctcaac acccactccc tcttagccaa tattgtgcct 180
attgccatac tagtctttgg cgcctgcctg atcctccaaa tcaccacagg actattccta 240
gccatgcact actcaccaga cgcctcaacc gccttttcat caatcgccca catcactcga 300
gacgtaaatt atggctgaat catccgctac cttcacgcca atggcgcctc aatattcttt 360
atctgcctct tcctacacat cgggcgaggc ctatattacg gatcatttct ctactcagaa 420
acctgaaaca tcggcattat cctcctgctt gcaactatag caacagcctt cataggctat 480
gtcctcccgt gaggccaaat atcattctga ggggccacag taattacaaa cttactatcc 540
gccatcccat acattgggac agacctagtt caatgaatct gaggaggcta ctcagtagac 600
agtcccaccc tcacacgatt ctttaccttt cacttcatct tgcccttcat tattgcagcc 660
ctagcaacac tccacctcct attcttgcac gaaacgggat caaacaaccc cctaggaatc 720
acctcccatt ccgataaaat caccttccac ccttactaca caatcaaaga cgccctcggc 780
ttacttctct tccttctctc cttaatgaca ttaacactat tctcaccaga cctcctaggc 840
gacccagaca attataccct agccaacccc ttaaacaccc ctccccacat caagcccgaa 900
tgatatttcc tattcgccta cacaattctc cgatccgtcc ctaacaaact aggaggcgtc 960
cttgccctat tactatccat cctcatccta gcaataatcc ccatcctcca tatatccaaa 1020
caacaaagca taatatttcg cccactaagc caatcacttt attgactcct agccgcagac 1080
ctcctcattc taacctgaat cggaggacaa ccagtaagct acccttttac catcattgga 1140
caagtagcat ccgtactata cttcacaaca atcctaatcc taataccaac tatctcccta 1200
attgaaaaca aaatactcaa atgggcct 1228
<210> 9
<211> 522
<212> DNA
<213> Artificial
<220>
<223> cDNA
<400> 9
atgttcgccg accgttgact attctctaca aaccacaaag acattggaac actataccta 60
ttattcggcg catgagctgg agtcctaggc acagctctaa gcctccttat tcgagccgag 120
ctgggccagc caggcaacct tctaggtaac gaccacatct acaacgttat cgtcacagcc 180
ctcgctgtca ctttcctagg acttctaaca gccctagacc tcaactacct aaccaacaaa 240
cttaaaataa aatccccact atgcacattt tatttctcca acatactcgg attctaccct 300
agcatcacac accgcacaat cccctatcta ggccttctta cgagccaaaa cctgccccta 360
ctcctcctag acctaacctg actagaaaag ctattaccta aaacaatttc acagcaccaa 420
atctccacct ccatcatcac ctcaacccaa aaaggcataa ttaaacttta cttcctctct 480
ttcttcttcc cactcatcct aaccctactc ctaatcacat aa 522
<210> 10
<211> 582
<212> DNA
<213> Artificial
<220>
<223> cDNA
<400> 10
atgttcgccg accgttgact attctctaca aaccacaaag acattggaac actataccta 60
ttattcggcg catgagctgg agtcctaggc acagctctaa gcctccttat tcgagccgag 120
ctgggccagc caggcaacct tctaggtaac gaccacatct acaacgttat cgtcacagcc 180
catgcatttg taataatctt cttcatagta atacccatca taatcggagg ctttggcaac 240
tgactagttc ccctaataat cggtgccccc gatatggcgt ttccccgcat aaacaacata 300
agcttctgac tcttacctcc ctctctccta ctcctgctcg catctgctat agtggaggcc 360
ggagcaggaa caggttgaac agtctaccct cccttagcag ggaactactc ccaccctgga 420
gccctcctag acctaacctg actagaaaag ctattaccta aaacaatttc acagcaccaa 480
atctccacct ccatcatcac ctcaacccaa aaaggcataa ttaaacttta cttcctctct 540
ttcttcttcc cactcatcct aaccctactc ctaatcacat aa 582
<210> 11
<211> 2208
<212> DNA
<213> Artificial
<220>
<223> cDNA
<400> 11
atgttcgccg accgttgact attctctaca aaccacaaag acattggaac actataccta 60
ttattcggcg catgagctgg agtcctaggc acagctctaa gcctccttat tcgagccgag 120
ctgggccagc caggcaacct tctaggtaac gaccacatct acaacgttat cgtcacagcc 180
catgcatttg taataatctt cttcatagta atacccatca taatcggagg ctttggcaac 240
tgactagttc ccctaataat cggtgccccc gatatggcgt ttccccgcat aaacaacata 300
agcttctgac tcttacctcc ctctctccta ctcctgctcg catctgctat agtggaggcc 360
ggagcaggaa caggttgaac agtctaccct cccttagcag ggaactactc ccaccctgga 420
gcctccgtag acctaaccat cttctcctta cacctagcag gtgtctcctc tatcttaggg 480
gccatcaatt tcatcacaac aattatcaat ataaaacccc ctgccataac ccaataccaa 540
acgcccctct tcgtctgatc cgtcctaatc acagcagtcc tacttctcct atctctccca 600
gtcctagctg ctggcatcac tatactacta acagaccgca acctcaacac caccttcttc 660
gaccccgccg gaggaggaga ccccattcta taccaacacc tattctgatt tttcggtcac 720
cctgaagttt atattcttat cctaccaggc ttcggaataa tctcccatat tgtaacttac 780
tactccggaa aaaaagaacc atttggatac ataggtatgg tctgagctat gatatcaatt 840
ggcttcctag ggtttatcgt gtgagcacac catatattta cagtaggaat agacgtagac 900
acacgagcat atttcacctc cgctaccata atcatcgcta tccccaccgg cgtcaaagta 960
tttagctgac tcgccacact ccacggaagc aatatgaaat gatctgctgc agtgctctga 1020
gccctaggat tcatctttct tttcaccgta ggtggcctga ctggcattgt attagcaaac 1080
tcatcactag acatcgtact acacgacacg tactacgttg tagcccactt ccactatgtc 1140
ctatcaatag gagctgtatt tgccatcata ggaggcttca ttcactgatt tcccctattc 1200
tcaggctaca ccctagacca aacctacgcc aaaatccatt tcactatcat attcatcggc 1260
gtaaatctaa ctttcttccc acaacacttt ctcggcctat ccggaatgcc ccgacgttac 1320
tcggactacc ccgatgcata caccacatga aacatcctat catctgtagg ctcattcatt 1380
tctctaacag cagtaatatt aataattttc atgatttgag aagccttcgc ttcgaagcga 1440
aaagtcctaa tagtagaaga accctccata aacctggagt gactatatgg atgcccccca 1500
ccctaccaca cattcgaaga acccgtatac ataaaagcag gaataccttt cctcacaggt 1560
ttctactcca aagaccacat catcgaaacc gcaaacatat catacacaaa cgcctgagcc 1620
ctatctatta ctctcatcgc tacctccctg acaagcgcct atagcactcg aataattctt 1680
ctcaccctaa caggtcaacc tcgcttcccc acccttacta acattaacga aaataacccc 1740
accctactaa accccattaa acgcctggca gccggaagcc tattcgcagg atttctcatt 1800
actaacaaca tttcccccgc atcccccttc caaacaacaa tccccctcta cctaaaactc 1860
acagccctcg ctgtcacttt cctaggactt ctaacagccc tagacctcaa ctacctaacc 1920
aacaaactta aaataaaatc cccactatgc acattttatt tctccaacat actcggattc 1980
taccctagca tcacacaccg cacaatcccc tatctaggcc ttcttacgag ccaaaacctg 2040
cccctactcc tcctagacct aacctgacta gaaaagctat tacctaaaac aatttcacag 2100
caccaaatct ccacctccat catcacctca acccaaaaag gcataattaa actttacttc 2160
ctctctttct tcttcccact catcctaacc ctactcctaa tcacataa 2208
<210> 12
<211> 807
<212> DNA
<213> Artificial
<220>
<223> cDNA
<400> 12
atggcacatg cagcgcaagt aggtctacaa gacgctactt cccctatcat agaagagctt 60
atcacctttc atgatcacgc cctcataatc attttcctta tctgcttcct agtcctgtat 120
gcccttttcc taacactcac aacaaaacta actaatacta acatctcaga cgctcaggaa 180
atagaaaccg caaacatatc atacacaaac gcctgagccc tatctattac tctcatcgct 240
acctccctga caagcgccta tagcactcga ataattcttc tcaccctaac aggtcaacct 300
cgcttcccca cccttactaa cattaacgaa aataacccca ccctactaaa ccccattaaa 360
cgcctggcag ccggaagcct attcgcagga tttctcatta ctaacaacat ttcccccgca 420
tcccccttcc aaacaacaat ccccctctac ctaaaactca cagccctcgc tgtcactttc 480
ctaggacttc taacagccct agacctcaac tacctaacca acaaacttaa aataaaatcc 540
ccactatgca cattttattt ctccaacata ctcggattct accctagcat cacacaccgc 600
acaatcccct atctaggcct tcttacgagc caaaacctgc ccctactcct cctagaccta 660
acctgactag aaaagctatt acctaaaaca atttcacagc accaaatctc cacctccatc 720
atcacctcaa cccaaaaagg cataattaaa ctttacttcc tctctttctt cttcccactc 780
atcctaaccc tactcctaat cacataa 807
<210> 13
<211> 786
<212> DNA
<213> Artificial
<220>
<223> cDNA
<400> 13
atggcacatg cagcgcaagt aggtctacaa gacgctactt cccctatcat agaagagctt 60
atcacctttc atgatcacgc cctcataatc attttcctta tctgcttcct agtcctgtat 120
gcccttttcc taacactcac aacaaaacta actaatacta acatctcaga cgctcaggaa 180
atagaaaccg tctgaactat cctgcccgcc atcatcctag tcctcatcgc cctcccatcc 240
ctacgcatcc tttacataac agacgaggtc aacgatccct cccttaccat caaatcaatt 300
ggccaccaat ggtactgaac ctacgagtac accgactacg gcggactaat cttcaactcc 360
tacatacttc ccccattatt cctagaacca ggcgacctgc gactccttga cgttgacaat 420
cgagtagtac tcccgattga agcccccatt cgtataataa ttacatcaca agacgtcttg 480
cactcatgag ctgtccccac attaggctta aaaacagatg caattcccgg acgtctaaac 540
caaaccactt tcaccgctac acgaccgggg gtatactacg gtcaatgctc tgaaatctgt 600
ggagcaaacc acagtttcat gcccatcgtc ctagacctaa cctgactaga aaagctatta 660
cctaaaacaa tttcacagca ccaaatctcc acctccatca tcacctcaac ccaaaaaggc 720
ataattaaac tttacttcct ctctttcttc ttcccactca tcctaaccct actcctaatc 780
acataa 786
<210> 14
<211> 1905
<212> DNA
<213> Artificial
<220>
<223> cDNA
<400> 14
atgaacgaaa atctgttcgc ttcattcatt gcccccacaa tcctaggcct acccgccgca 60
gtactgatca ttctatttcc ccctctattg atccccacct ccaaatatct catcaacaac 120
cgactaatca ccacccaaca atgactaatc aaactaacct caaaacaaat gataaccata 180
cacaacacta aaggacgaac ctgatctctt atactagtat ccttaatcat ttttattgcc 240
acaactaacc tcctcggact cctgcctcac tcatttacac caaccaccca actatctata 300
aacctagcca tggccatccc cttatgagcg ggcacagtga ttataggctt tcgctctaag 360
attaaaaatg ccctagccca cttcttacca caaggcacac ctacacccct tatccccata 420
ctagttatta tcgaaaccat cagcctactc attcaaccaa tagccctggc cgtacgccta 480
accgctaaca ttactgcagg ccacctactc atgcacctaa ttggaagcgc caccctagca 540
atatcaacca ttaaccttcc ctctacactt atcatcttca caattctaat tctactgact 600
atcctagaaa tcgctgtcgc cttaatccaa gcctacgttt tcacacttct agtaagcctc 660
tacctacact ccaactcatg agacccacaa caaatagccc ttctaaacgc taatccaagc 720
ctcaccccac tactaggcct cctcctagca gcagcaggca aatcagccca attaggtctc 780
cacccctgac tcccctcagc catagaaggc cccaccccag tctcagccct actccactca 840
agcactatag ttgtagcagg aatcttctta ctcatccgct tccaccccct agcagaaaat 900
agcccactaa tccaaactct aacactatgc ttaggcgcta tcaccactct gttcgcagca 960
gtctgcgccc ttacacaaaa tgacatcaaa aaaatcgtag ccttctccac ttcaagtcaa 1020
ctaggactca taatagttac aatcggcatc aaccaaccac acctagcatt cctgcacatc 1080
tgtacccacg ccttcttcaa agccatacta tttatgtgct ccgggtccat catccacaac 1140
cttaacaatg aacaagatat tcgaaaaata ggaggactac tcaaaaccat acctctcact 1200
tcaacctccc tcaccattgg cagcctagca ttagcaggaa tacctttcct cacaggtttc 1260
tactccaaag accacatcat cgaaaccgca aacatatcat acacaaacgc ctgagcccta 1320
tctattactc tcatcgctac ctccctgaca agcgcctata gcactcgaat aattcttctc 1380
accctaacag gtcaacctcg cttccccacc cttactaaca ttaacgaaaa taaccccacc 1440
ctactaaacc ccattaaacg cctggcagcc ggaagcctat tcgcaggatt tctcattact 1500
aacaacattt cccccgcatc ccccttccaa acaacaatcc ccctctacct aaaactcaca 1560
gccctcgctg tcactttcct aggacttcta acagccctag acctcaacta cctaaccaac 1620
aaacttaaaa taaaatcccc actatgcaca ttttatttct ccaacatact cggattctac 1680
cctagcatca cacaccgcac aatcccctat ctaggccttc ttacgagcca aaacctgccc 1740
ctactcctcc tagacctaac ctgactagaa aagctattac ctaaaacaat ttcacagcac 1800
caaatctcca cctccatcat cacctcaacc caaaaaggca taattaaact ttacttcctc 1860
tctttcttct tcccactcat cctaacccta ctcctaatca cataa 1905
<210> 15
<211> 1545
<212> DNA
<213> Artificial
<220>
<223> cDNA
<400> 15
atgacccacc aatcacatgc ctatcatata gtaaaaccca gcccatgacc cctaacaggg 60
gccctctcag ccctcctaat gacctccggc ctagccatgt gatttcactt ccactccata 120
acgctcctca tactaggcct actaaccaac acactaacca tataccaatg atggcgcgat 180
gtaacacgag aaagcacata ccaaggccac cacacaccac ctgtccaaaa aggccttcga 240
tacgggataa tcctatttat tacctcagaa gtttttttct tcgcaggatt tttctgagcc 300
ttttaccact ccagcctagc ccctaccccc caattaggag ggcactggcc cccaacaggc 360
atcaccccac tactaggcct cctcctagca gcagcaggca aatcagccca attaggtctc 420
cacccctgac tcccctcagc catagaaggc cccaccccag tctcagccct actccactca 480
agcactatag ttgtagcagg aatcttctta ctcatccgct tccaccccct agcagaaaat 540
agcccactaa tccaaactct aacactatgc ttaggcgcta tcaccactct gttcgcagca 600
gtctgcgccc ttacacaaaa tgacatcaaa aaaatcgtag ccttctccac ttcaagtcaa 660
ctaggactca taatagttac aatcggcatc aaccaaccac acctagcatt cctgcacatc 720
tgtacccacg ccttcttcaa agccatacta tttatgtgct ccgggtccat catccacaac 780
cttaacaatg aacaagatat tcgaaaaata ggaggactac tcaaaaccat acctctcact 840
tcaacctccc tcaccattgg cagcctagca ttagcaggaa tacctttcct cacaggtttc 900
tactccaaag accacatcat cgaaaccgca aacatatcat acacaaacgc ctgagcccta 960
tctattactc tcatcgctac ctccctgaca agcgcctata gcactcgaat aattcttctc 1020
accctaacag gtcaacctcg cttccccacc cttactaaca ttaacgaaaa taaccccacc 1080
ctactaaacc ccattaaacg cctggcagcc ggaagcctat tcgcaggatt tctcattact 1140
aacaacattt cccccgcatc ccccttccaa acaacaatcc ccctctacct aaaactcaca 1200
gccctcgctg tcactttcct aggacttcta acagccctag acctcaacta cctaaccaac 1260
aaacttaaaa taaaatcccc actatgcaca ttttatttct ccaacatact cggattctac 1320
cctagcatca cacaccgcac aatcccctat ctaggccttc ttacgagcca aaacctgccc 1380
ctactcctcc tagacctaac ctgactagaa aagctattac ctaaaacaat ttcacagcac 1440
caaatctcca cctccatcat cacctcaacc caaaaaggca taattaaact ttacttcctc 1500
tctttcttct tcccactcat cctaacccta ctcctaatca cataa 1545
<210> 16
<211> 1629
<212> DNA
<213> Artificial
<220>
<223> cDNA
<400> 16
ataaacttcg ccttaatttt aataatcaac accctcctag ccttactact aataattatt 60
acattttgac taccacaact caacggctac atagaaaaat ccacccctta cgagtgcggc 120
ttcgacccta tatcccccgc ccgcgtccct ttctccataa aattcttctt agtagctatt 180
accttcttat tatttgatct agaaattgcc ctccttttac ccctaccatg agccctacaa 240
acaactaacc tgccactaat agttatgtca tccctcttat taatcatcat cctagcccta 300
agtctggcca acacagcagc cattcaagca atcctataca accgtatcgg cgatatcggt 360
ttcatcctcg ccttagcatg atttatccta cactccaact catgagaccc acaacaaata 420
gcccttctaa acgctaatcc aagcctcacc ccactactag gcctcctcct agcagcagca 480
ggcaaatcag cccaattagg tctccacccc tgactcccct cagccataga aggccccacc 540
ccagtctcag ccctactcca ctcaagcact atagttgtag caggaatctt cttactcatc 600
cgcttccacc ccctagcaga aaatagccca ctaatccaaa ctctaacact atgcttaggc 660
gctatcacca ctctgttcgc agcagtctgc gcccttacac aaaatgacat caaaaaaatc 720
gtagccttct ccacttcaag tcaactagga ctcataatag ttacaatcgg catcaaccaa 780
ccacacctag cattcctgca catctgtacc cacgccttct tcaaagccat actatttatg 840
tgctccgggt ccatcatcca caaccttaac aatgaacaag atattcgaaa aataggagga 900
ctactcaaaa ccatacctct cacttcaacc tccctcacca ttggcagcct agcattagca 960
ggaatacctt tcctcacagg tttctactcc aaagaccaca tcatcgaaac cgcaaacata 1020
tcatacacaa acgcctgagc cctatctatt actctcatcg ctacctccct gacaagcgcc 1080
tatagcactc gaataattct tctcacccta acaggtcaac ctcgcttccc cacccttact 1140
aacattaacg aaaataaccc caccctacta aaccccatta aacgcctggc agccggaagc 1200
ctattcgcag gatttctcat tactaacaac atttcccccg catccccctt ccaaacaaca 1260
atccccctct acctaaaact cacagccctc gctgtcactt tcctaggact tctaacagcc 1320
ctagacctca actacctaac caacaaactt aaaataaaat ccccactatg cacattttat 1380
ttctccaaca tactcggatt ctaccctagc atcacacacc gcacaatccc ctatctaggc 1440
cttcttacga gccaaaacct gcccctactc ctcctagacc taacctgact agaaaagcta 1500
ttacctaaaa caatttcaca gcaccaaatc tccacctcca tcatcacctc aacccaaaaa 1560
ggcataatta aactttactt cctctctttc ttcttcccac tcatcctaac cctactccta 1620
atcacataa 1629
<210> 17
<211> 129
<212> DNA
<213> Artificial
<220>
<223> cDNA
<400> 17
atgccccaac taaatactac cgtatggccc accataatta cccccatact ccttacacta 60
ttcctcatca cccaactaaa aatattaaac acaaactacc acctacctcc ctcaccattg 120
gcagcctag 129
<210> 18
<211> 783
<212> RNA
<213> 人
<400> 18
auggcccacc auaauuaccc ccauacuccu uacacuauuc cucaucaccc aacuaaaaau 60
auuaaacaca aacuaccacc uaccucccuc accauuggca gccuagcauu agcaggaaua 120
ccuuuccuca cagguuucua cuccaaagac cacaucaucg aaaccgcaaa cauaucauac 180
acaaacgccu gagcccuauc uauuacucuc aucgcuaccu cccugacaag cgccuauagc 240
acucgaauaa uucuucucac ccuaacaggu caaccucgcu uccccacccu uacuaacauu 300
aacgaaaaua accccacccu acuaaacccc auuaaacgcc uggcagccgg aagccuauuc 360
gcaggauuuc ucauuacuaa caacauuucc cccgcauccc ccuuccaaac aacaaucccc 420
cucuaccuaa aacucacagc ccucgcuguc acuuuccuag gacuucuaac agcccuagac 480
cucaacuacc uaaccaacaa acuuaaaaua aaauccccac uaugcacauu uuauuucucc 540
aacauacucg gauucuaccc uagcaucaca caccgcacaa uccccuaucu aggccuucuu 600
acgagccaaa accugccccu acuccuccua gaccuaaccu gacuagaaaa gcuauuaccu 660
aaaacaauuu cacagcacca aaucuccacc uccaucauca ccucaaccca aaaaggcaua 720
auuaaacuuu acuuccucuc uuucuucuuc ccacucaucc uaacccuacu ccuaaucaca 780
uaa 783
<210> 19
<211> 300
<212> RNA
<213> 人
<400> 19
augccccuca uuuacauaaa uauuauacua gcauuuacca ucucacuucu aggaauacua 60
guauaucgcu cacaccucau auccucccua cuaugccuag aaggaauaau acuaucgcug 120
uucauuauag cuacucucau aacccucaac acccacuccc ucuuagccaa uauugugccu 180
auugccauac uagucuuugc cgccugcgaa gcagcggugg gccuagcccu acuagucuca 240
aucuccaaca cauauggccu agacuacgua cauaaccuaa cccuacuccu aaucacauaa 300
<210> 20
<211> 781
<212> RNA
<213> 人
<400> 20
auggcacaug cagcgcaagu aggucuacaa gacgcuacuu ccccuaucau agaagagcuu 60
aucaccuuuc augaucacgc ccucauaauc auuuuccuua ucugcuuccu aguccuguau 120
gcccuuuucc uaacacucac aacaaaacua acuaauacua acaucucaga cgcucaggaa 180
auagaaaccg ucugaacuau ccugcccgcc aucauccuag uccucaucgc ccucccaucc 240
cuacgcaucc uuuacauaac agacgagguc aacgaucccu cccuuaccau caaaucaauu 300
ggccaccaau gguacugaac cuacgaguac accgacuacg gcggacuaau cuucaacucc 360
uacauacuuc ccccauuauu ccuagaacca ggcgacccag acaauuauac ccuagccaac 420
cccuuaaaca ccccucccca caucaagccc gaaugauauu uccuauucgc cuacacaauu 480
cuccgauccg ucccuaacaa acuaggaggc guccuugccc uauuacuauc cauccucauc 540
cuagcaauaa uccccauccu ccauauaucc aaacaacaaa gcauaauauu ucgcccacua 600
agccaaucac uuuauugacu ccuagccgca gaccuccuca uucuaaccug aaucggagga 660
caaccaguaa gcuacccuuu uaccaucauu ggacaaguag cauccguacu auacuucaca 720
acaauccuaa uccuaauacc aacuaucucc cuaauugaaa acaaaauacu caaaugggcc 780
u 781
<210> 21
<211> 565
<212> RNA
<213> 人
<400> 21
auggcacaug cagcgcaagu aggucuacaa gacgcuacuu ccccuaucau agaagagcuu 60
aucaccuuuc augaucacgc ccucauaauc auuuuccuua ucugcuuccu aguccuguau 120
gcccuuuucc uaacacucac aacaaaacua acuaauacua acaucucaga cgcucaggaa 180
auagaaaccg ucugaacuau ccugcccgcc aucauccuag uccucaucgc ccucccaucc 240
cuacgcaucc uuuacauaac agacgagguc aacgaucccu cccuuaccau caaaucaauu 300
ggccaccaau gguacugaac cuacgaguac accgacuacg gcggacuaau cuucaacucc 360
uacauacuuc ccccauuauu ccuagaacca ggcgaccugc gacuccuagc cgcagaccuc 420
cucauucuaa ccugaaucgg aggacaacca guaagcuacc cuuuuaccau cauuggacaa 480
guagcauccg uacuauacuu cacaacaauc cuaauccuaa uaccaacuau cucccuaauu 540
gaaaacaaaa uacucaaaug ggccu 565
<210> 22
<211> 1174
<212> RNA
<213> 人
<400> 22
auggcacaug cagcgcaagu aggucuacaa gacgcuacuu ccccuaucau agaagagcuu 60
aucaccuuuc augaucacgc ccucauaauc auuuuccuua ucugcuuccu aguccuguau 120
gcccuuuucc uaacacucac aacaaaacua acuaauacua acaucucaga cgcucaggaa 180
auagaaaccg ucugaacuau ccugcccgcc aucauccuag uccucaucgc ccucccaucc 240
cuacgcaucc uuuacauaac agacgagguc aacgaucccu cccuuaccau caaaucaauu 300
ggccaccaau gguacugaac cuacgaguac accgacuacg gcggacuaau cuucaacucc 360
uacauacuuc ccccauuauu ccuagaacca ggcgaccugc gacuccuuga cguugacaau 420
cgaguaguac ucccgauuga agcccccauu cguauaauaa uuacaucaca agacgucuug 480
cacucaugag cuguccccac auuaggcuua aaaacagaug caauucccgg acgucuaaac 540
caaaccacuu ucaccgcuac acgaccgggg guauacuacg gucaaugcuc ugaaaucugu 600
ggagcaaacc acaguuucau gcccauauuc uugcacgaaa cgggaucaaa caacccccua 660
ggaaucaccu cccauuccga uaaaaucacc uuccacccuu acuacacaau caaagacgcc 720
cucggcuuac uucucuuccu ucucuccuua augacauuaa cacuauucuc accagaccuc 780
cuaggcgacc cagacaauua uacccuagcc aaccccuuaa acaccccucc ccacaucaag 840
cccgaaugau auuuccuauu cgccuacaca auucuccgau ccgucccuaa caaacuagga 900
ggcguccuug cccuauuacu auccauccuc auccuagcaa uaauccccau ccuccauaua 960
uccaaacaac aaagcauaau auuucgccca cuaagccaau cacuuuauug acuccuagcc 1020
gcagaccucc ucauucuaac cugaaucgga ggacaaccag uaagcuaccc uuuuaccauc 1080
auuggacaag uagcauccgu acuauacuuc acaacaaucc uaauccuaau accaacuauc 1140
ucccuaauug aaaacaaaau acucaaaugg gccu 1174
<210> 23
<211> 1294
<212> RNA
<213> 人
<400> 23
augaacgaaa aucuguucgc uucauucauu gcccccacaa uccuaggccu acccgccgca 60
guacugauca uucuauuucc cccucuauug auccccaccu ccaaauaucu caucaacaac 120
cgacuaauca ccacccaaca augacuaauc aaacuaaccu caaaacaaau gauaaccaua 180
cacaacacua aaggacgaac cugaucucuu auacuaguau ccuuaaucau uuuuauugcc 240
acaacuaacc uccucggacu ccugccucac ucauuuacac caaccaccca acuaucuaua 300
aaccuagcca ugcacuacuc accagacgcc ucaaccgccu uuucaucaau cgcccacauc 360
acucgagacg uaaauuaugg cugaaucauc cgcuaccuuc acgccaaugg cgccucaaua 420
uucuuuaucu gccucuuccu acacaucggg cgaggccuau auuacggauc auuucucuac 480
ucagaaaccu gaaacaucgg cauuauccuc cugcuugcaa cuauagcaac agccuucaua 540
ggcuaugucc ucccgugagg ccaaauauca uucugagggg ccacaguaau uacaaacuua 600
cuauccgcca ucccauacau ugggacagac cuaguucaau gaaucugagg aggcuacuca 660
guagacaguc ccacccucac acgauucuuu accuuucacu ucaucuugcc cuucauuauu 720
gcagcccuag caacacucca ccuccuauuc uugcacgaaa cgggaucaaa caacccccua 780
ggaaucaccu cccauuccga uaaaaucacc uuccacccuu acuacacaau caaagacgcc 840
cucggcuuac uucucuuccu ucucuccuua augacauuaa cacuauucuc accagaccuc 900
cuaggcgacc cagacaauua uacccuagcc aaccccuuaa acaccccucc ccacaucaag 960
cccgaaugau auuuccuauu cgccuacaca auucuccgau ccgucccuaa caaacuagga 1020
ggcguccuug cccuauuacu auccauccuc auccuagcaa uaauccccau ccuccauaua 1080
uccaaacaac aaagcauaau auuucgccca cuaagccaau cacuuuauug acuccuagcc 1140
gcagaccucc ucauucuaac cugaaucgga ggacaaccag uaagcuaccc uuuuaccauc 1200
auuggacaag uagcauccgu acuauacuuc acaacaaucc uaauccuaau accaacuauc 1260
ucccuaauug aaaacaaaau acucaaaugg gccu 1294
<210> 24
<211> 1228
<212> RNA
<213> 人
<400> 24
augccccuca uuuacauaaa uauuauacua gcauuuacca ucucacuucu aggaauacua 60
guauaucgcu cacaccucau auccucccua cuaugccuag aaggaauaau acuaucgcug 120
uucauuauag cuacucucau aacccucaac acccacuccc ucuuagccaa uauugugccu 180
auugccauac uagucuuugg cgccugccug auccuccaaa ucaccacagg acuauuccua 240
gccaugcacu acucaccaga cgccucaacc gccuuuucau caaucgccca caucacucga 300
gacguaaauu auggcugaau cauccgcuac cuucacgcca auggcgccuc aauauucuuu 360
aucugccucu uccuacacau cgggcgaggc cuauauuacg gaucauuucu cuacucagaa 420
accugaaaca ucggcauuau ccuccugcuu gcaacuauag caacagccuu cauaggcuau 480
guccucccgu gaggccaaau aucauucuga ggggccacag uaauuacaaa cuuacuaucc 540
gccaucccau acauugggac agaccuaguu caaugaaucu gaggaggcua cucaguagac 600
agucccaccc ucacacgauu cuuuaccuuu cacuucaucu ugcccuucau uauugcagcc 660
cuagcaacac uccaccuccu auucuugcac gaaacgggau caaacaaccc ccuaggaauc 720
accucccauu ccgauaaaau caccuuccac ccuuacuaca caaucaaaga cgcccucggc 780
uuacuucucu uccuucucuc cuuaaugaca uuaacacuau ucucaccaga ccuccuaggc 840
gacccagaca auuauacccu agccaacccc uuaaacaccc cuccccacau caagcccgaa 900
ugauauuucc uauucgccua cacaauucuc cgauccgucc cuaacaaacu aggaggcguc 960
cuugcccuau uacuauccau ccucauccua gcaauaaucc ccauccucca uauauccaaa 1020
caacaaagca uaauauuucg cccacuaagc caaucacuuu auugacuccu agccgcagac 1080
cuccucauuc uaaccugaau cggaggacaa ccaguaagcu acccuuuuac caucauugga 1140
caaguagcau ccguacuaua cuucacaaca auccuaaucc uaauaccaac uaucucccua 1200
auugaaaaca aaauacucaa augggccu 1228
<210> 25
<211> 522
<212> RNA
<213> 人
<400> 25
auguucgccg accguugacu auucucuaca aaccacaaag acauuggaac acuauaccua 60
uuauucggcg caugagcugg aguccuaggc acagcucuaa gccuccuuau ucgagccgag 120
cugggccagc caggcaaccu ucuagguaac gaccacaucu acaacguuau cgucacagcc 180
cucgcuguca cuuuccuagg acuucuaaca gcccuagacc ucaacuaccu aaccaacaaa 240
cuuaaaauaa aauccccacu augcacauuu uauuucucca acauacucgg auucuacccu 300
agcaucacac accgcacaau ccccuaucua ggccuucuua cgagccaaaa ccugccccua 360
cuccuccuag accuaaccug acuagaaaag cuauuaccua aaacaauuuc acagcaccaa 420
aucuccaccu ccaucaucac cucaacccaa aaaggcauaa uuaaacuuua cuuccucucu 480
uucuucuucc cacucauccu aacccuacuc cuaaucacau aa 522
<210> 26
<211> 582
<212> RNA
<213> 人
<400> 26
auguucgccg accguugacu auucucuaca aaccacaaag acauuggaac acuauaccua 60
uuauucggcg caugagcugg aguccuaggc acagcucuaa gccuccuuau ucgagccgag 120
cugggccagc caggcaaccu ucuagguaac gaccacaucu acaacguuau cgucacagcc 180
caugcauuug uaauaaucuu cuucauagua auacccauca uaaucggagg cuuuggcaac 240
ugacuaguuc cccuaauaau cggugccccc gauauggcgu uuccccgcau aaacaacaua 300
agcuucugac ucuuaccucc cucucuccua cuccugcucg caucugcuau aguggaggcc 360
ggagcaggaa cagguugaac agucuacccu cccuuagcag ggaacuacuc ccacccugga 420
gcccuccuag accuaaccug acuagaaaag cuauuaccua aaacaauuuc acagcaccaa 480
aucuccaccu ccaucaucac cucaacccaa aaaggcauaa uuaaacuuua cuuccucucu 540
uucuucuucc cacucauccu aacccuacuc cuaaucacau aa 582
<210> 27
<211> 2208
<212> RNA
<213> 人
<400> 27
auguucgccg accguugacu auucucuaca aaccacaaag acauuggaac acuauaccua 60
uuauucggcg caugagcugg aguccuaggc acagcucuaa gccuccuuau ucgagccgag 120
cugggccagc caggcaaccu ucuagguaac gaccacaucu acaacguuau cgucacagcc 180
caugcauuug uaauaaucuu cuucauagua auacccauca uaaucggagg cuuuggcaac 240
ugacuaguuc cccuaauaau cggugccccc gauauggcgu uuccccgcau aaacaacaua 300
agcuucugac ucuuaccucc cucucuccua cuccugcucg caucugcuau aguggaggcc 360
ggagcaggaa cagguugaac agucuacccu cccuuagcag ggaacuacuc ccacccugga 420
gccuccguag accuaaccau cuucuccuua caccuagcag gugucuccuc uaucuuaggg 480
gccaucaauu ucaucacaac aauuaucaau auaaaacccc cugccauaac ccaauaccaa 540
acgccccucu ucgucugauc cguccuaauc acagcagucc uacuucuccu aucucuccca 600
guccuagcug cuggcaucac uauacuacua acagaccgca accucaacac caccuucuuc 660
gaccccgccg gaggaggaga ccccauucua uaccaacacc uauucugauu uuucggucac 720
ccugaaguuu auauucuuau ccuaccaggc uucggaauaa ucucccauau uguaacuuac 780
uacuccggaa aaaaagaacc auuuggauac auagguaugg ucugagcuau gauaucaauu 840
ggcuuccuag gguuuaucgu gugagcacac cauauauuua caguaggaau agacguagac 900
acacgagcau auuucaccuc cgcuaccaua aucaucgcua uccccaccgg cgucaaagua 960
uuuagcugac ucgccacacu ccacggaagc aauaugaaau gaucugcugc agugcucuga 1020
gcccuaggau ucaucuuucu uuucaccgua gguggccuga cuggcauugu auuagcaaac 1080
ucaucacuag acaucguacu acacgacacg uacuacguug uagcccacuu ccacuauguc 1140
cuaucaauag gagcuguauu ugccaucaua ggaggcuuca uucacugauu uccccuauuc 1200
ucaggcuaca cccuagacca aaccuacgcc aaaauccauu ucacuaucau auucaucggc 1260
guaaaucuaa cuuucuuccc acaacacuuu cucggccuau ccggaaugcc ccgacguuac 1320
ucggacuacc ccgaugcaua caccacauga aacauccuau caucuguagg cucauucauu 1380
ucucuaacag caguaauauu aauaauuuuc augauuugag aagccuucgc uucgaagcga 1440
aaaguccuaa uaguagaaga acccuccaua aaccuggagu gacuauaugg augcccccca 1500
cccuaccaca cauucgaaga acccguauac auaaaagcag gaauaccuuu ccucacaggu 1560
uucuacucca aagaccacau caucgaaacc gcaaacauau cauacacaaa cgccugagcc 1620
cuaucuauua cucucaucgc uaccucccug acaagcgccu auagcacucg aauaauucuu 1680
cucacccuaa caggucaacc ucgcuucccc acccuuacua acauuaacga aaauaacccc 1740
acccuacuaa accccauuaa acgccuggca gccggaagcc uauucgcagg auuucucauu 1800
acuaacaaca uuucccccgc aucccccuuc caaacaacaa ucccccucua ccuaaaacuc 1860
acagcccucg cugucacuuu ccuaggacuu cuaacagccc uagaccucaa cuaccuaacc 1920
aacaaacuua aaauaaaauc cccacuaugc acauuuuauu ucuccaacau acucggauuc 1980
uacccuagca ucacacaccg cacaaucccc uaucuaggcc uucuuacgag ccaaaaccug 2040
ccccuacucc uccuagaccu aaccugacua gaaaagcuau uaccuaaaac aauuucacag 2100
caccaaaucu ccaccuccau caucaccuca acccaaaaag gcauaauuaa acuuuacuuc 2160
cucucuuucu ucuucccacu cauccuaacc cuacuccuaa ucacauaa 2208
<210> 28
<211> 807
<212> RNA
<213> 人
<400> 28
auggcacaug cagcgcaagu aggucuacaa gacgcuacuu ccccuaucau agaagagcuu 60
aucaccuuuc augaucacgc ccucauaauc auuuuccuua ucugcuuccu aguccuguau 120
gcccuuuucc uaacacucac aacaaaacua acuaauacua acaucucaga cgcucaggaa 180
auagaaaccg caaacauauc auacacaaac gccugagccc uaucuauuac ucucaucgcu 240
accucccuga caagcgccua uagcacucga auaauucuuc ucacccuaac aggucaaccu 300
cgcuucccca cccuuacuaa cauuaacgaa aauaacccca cccuacuaaa ccccauuaaa 360
cgccuggcag ccggaagccu auucgcagga uuucucauua cuaacaacau uucccccgca 420
ucccccuucc aaacaacaau cccccucuac cuaaaacuca cagcccucgc ugucacuuuc 480
cuaggacuuc uaacagcccu agaccucaac uaccuaacca acaaacuuaa aauaaaaucc 540
ccacuaugca cauuuuauuu cuccaacaua cucggauucu acccuagcau cacacaccgc 600
acaauccccu aucuaggccu ucuuacgagc caaaaccugc cccuacuccu ccuagaccua 660
accugacuag aaaagcuauu accuaaaaca auuucacagc accaaaucuc caccuccauc 720
aucaccucaa cccaaaaagg cauaauuaaa cuuuacuucc ucucuuucuu cuucccacuc 780
auccuaaccc uacuccuaau cacauaa 807
<210> 29
<211> 786
<212> RNA
<213> 人
<400> 29
auggcacaug cagcgcaagu aggucuacaa gacgcuacuu ccccuaucau agaagagcuu 60
aucaccuuuc augaucacgc ccucauaauc auuuuccuua ucugcuuccu aguccuguau 120
gcccuuuucc uaacacucac aacaaaacua acuaauacua acaucucaga cgcucaggaa 180
auagaaaccg ucugaacuau ccugcccgcc aucauccuag uccucaucgc ccucccaucc 240
cuacgcaucc uuuacauaac agacgagguc aacgaucccu cccuuaccau caaaucaauu 300
ggccaccaau gguacugaac cuacgaguac accgacuacg gcggacuaau cuucaacucc 360
uacauacuuc ccccauuauu ccuagaacca ggcgaccugc gacuccuuga cguugacaau 420
cgaguaguac ucccgauuga agcccccauu cguauaauaa uuacaucaca agacgucuug 480
cacucaugag cuguccccac auuaggcuua aaaacagaug caauucccgg acgucuaaac 540
caaaccacuu ucaccgcuac acgaccgggg guauacuacg gucaaugcuc ugaaaucugu 600
ggagcaaacc acaguuucau gcccaucguc cuagaccuaa ccugacuaga aaagcuauua 660
ccuaaaacaa uuucacagca ccaaaucucc accuccauca ucaccucaac ccaaaaaggc 720
auaauuaaac uuuacuuccu cucuuucuuc uucccacuca uccuaacccu acuccuaauc 780
acauaa 786
<210> 30
<211> 1905
<212> RNA
<213> 人
<400> 30
augaacgaaa aucuguucgc uucauucauu gcccccacaa uccuaggccu acccgccgca 60
guacugauca uucuauuucc cccucuauug auccccaccu ccaaauaucu caucaacaac 120
cgacuaauca ccacccaaca augacuaauc aaacuaaccu caaaacaaau gauaaccaua 180
cacaacacua aaggacgaac cugaucucuu auacuaguau ccuuaaucau uuuuauugcc 240
acaacuaacc uccucggacu ccugccucac ucauuuacac caaccaccca acuaucuaua 300
aaccuagcca uggccauccc cuuaugagcg ggcacaguga uuauaggcuu ucgcucuaag 360
auuaaaaaug cccuagccca cuucuuacca caaggcacac cuacaccccu uauccccaua 420
cuaguuauua ucgaaaccau cagccuacuc auucaaccaa uagcccuggc cguacgccua 480
accgcuaaca uuacugcagg ccaccuacuc augcaccuaa uuggaagcgc cacccuagca 540
auaucaacca uuaaccuucc cucuacacuu aucaucuuca caauucuaau ucuacugacu 600
auccuagaaa ucgcugucgc cuuaauccaa gccuacguuu ucacacuucu aguaagccuc 660
uaccuacacu ccaacucaug agacccacaa caaauagccc uucuaaacgc uaauccaagc 720
cucaccccac uacuaggccu ccuccuagca gcagcaggca aaucagccca auuaggucuc 780
caccccugac uccccucagc cauagaaggc cccaccccag ucucagcccu acuccacuca 840
agcacuauag uuguagcagg aaucuucuua cucauccgcu uccacccccu agcagaaaau 900
agcccacuaa uccaaacucu aacacuaugc uuaggcgcua ucaccacucu guucgcagca 960
gucugcgccc uuacacaaaa ugacaucaaa aaaaucguag ccuucuccac uucaagucaa 1020
cuaggacuca uaauaguuac aaucggcauc aaccaaccac accuagcauu ccugcacauc 1080
uguacccacg ccuucuucaa agccauacua uuuaugugcu ccggguccau cauccacaac 1140
cuuaacaaug aacaagauau ucgaaaaaua ggaggacuac ucaaaaccau accucucacu 1200
ucaaccuccc ucaccauugg cagccuagca uuagcaggaa uaccuuuccu cacagguuuc 1260
uacuccaaag accacaucau cgaaaccgca aacauaucau acacaaacgc cugagcccua 1320
ucuauuacuc ucaucgcuac cucccugaca agcgccuaua gcacucgaau aauucuucuc 1380
acccuaacag gucaaccucg cuuccccacc cuuacuaaca uuaacgaaaa uaaccccacc 1440
cuacuaaacc ccauuaaacg ccuggcagcc ggaagccuau ucgcaggauu ucucauuacu 1500
aacaacauuu cccccgcauc ccccuuccaa acaacaaucc cccucuaccu aaaacucaca 1560
gcccucgcug ucacuuuccu aggacuucua acagcccuag accucaacua ccuaaccaac 1620
aaacuuaaaa uaaaaucccc acuaugcaca uuuuauuucu ccaacauacu cggauucuac 1680
ccuagcauca cacaccgcac aauccccuau cuaggccuuc uuacgagcca aaaccugccc 1740
cuacuccucc uagaccuaac cugacuagaa aagcuauuac cuaaaacaau uucacagcac 1800
caaaucucca ccuccaucau caccucaacc caaaaaggca uaauuaaacu uuacuuccuc 1860
ucuuucuucu ucccacucau ccuaacccua cuccuaauca cauaa 1905
<210> 31
<211> 1545
<212> RNA
<213> 人
<400> 31
augacccacc aaucacaugc cuaucauaua guaaaaccca gcccaugacc ccuaacaggg 60
gcccucucag cccuccuaau gaccuccggc cuagccaugu gauuucacuu ccacuccaua 120
acgcuccuca uacuaggccu acuaaccaac acacuaacca uauaccaaug auggcgcgau 180
guaacacgag aaagcacaua ccaaggccac cacacaccac cuguccaaaa aggccuucga 240
uacgggauaa uccuauuuau uaccucagaa guuuuuuucu ucgcaggauu uuucugagcc 300
uuuuaccacu ccagccuagc cccuaccccc caauuaggag ggcacuggcc cccaacaggc 360
aucaccccac uacuaggccu ccuccuagca gcagcaggca aaucagccca auuaggucuc 420
caccccugac uccccucagc cauagaaggc cccaccccag ucucagcccu acuccacuca 480
agcacuauag uuguagcagg aaucuucuua cucauccgcu uccacccccu agcagaaaau 540
agcccacuaa uccaaacucu aacacuaugc uuaggcgcua ucaccacucu guucgcagca 600
gucugcgccc uuacacaaaa ugacaucaaa aaaaucguag ccuucuccac uucaagucaa 660
cuaggacuca uaauaguuac aaucggcauc aaccaaccac accuagcauu ccugcacauc 720
uguacccacg ccuucuucaa agccauacua uuuaugugcu ccggguccau cauccacaac 780
cuuaacaaug aacaagauau ucgaaaaaua ggaggacuac ucaaaaccau accucucacu 840
ucaaccuccc ucaccauugg cagccuagca uuagcaggaa uaccuuuccu cacagguuuc 900
uacuccaaag accacaucau cgaaaccgca aacauaucau acacaaacgc cugagcccua 960
ucuauuacuc ucaucgcuac cucccugaca agcgccuaua gcacucgaau aauucuucuc 1020
acccuaacag gucaaccucg cuuccccacc cuuacuaaca uuaacgaaaa uaaccccacc 1080
cuacuaaacc ccauuaaacg ccuggcagcc ggaagccuau ucgcaggauu ucucauuacu 1140
aacaacauuu cccccgcauc ccccuuccaa acaacaaucc cccucuaccu aaaacucaca 1200
gcccucgcug ucacuuuccu aggacuucua acagcccuag accucaacua ccuaaccaac 1260
aaacuuaaaa uaaaaucccc acuaugcaca uuuuauuucu ccaacauacu cggauucuac 1320
ccuagcauca cacaccgcac aauccccuau cuaggccuuc uuacgagcca aaaccugccc 1380
cuacuccucc uagaccuaac cugacuagaa aagcuauuac cuaaaacaau uucacagcac 1440
caaaucucca ccuccaucau caccucaacc caaaaaggca uaauuaaacu uuacuuccuc 1500
ucuuucuucu ucccacucau ccuaacccua cuccuaauca cauaa 1545
<210> 32
<211> 1629
<212> RNA
<213> 人
<400> 32
auaaacuucg ccuuaauuuu aauaaucaac acccuccuag ccuuacuacu aauaauuauu 60
acauuuugac uaccacaacu caacggcuac auagaaaaau ccaccccuua cgagugcggc 120
uucgacccua uaucccccgc ccgcgucccu uucuccauaa aauucuucuu aguagcuauu 180
accuucuuau uauuugaucu agaaauugcc cuccuuuuac cccuaccaug agcccuacaa 240
acaacuaacc ugccacuaau aguuauguca ucccucuuau uaaucaucau ccuagcccua 300
agucuggcca acacagcagc cauucaagca auccuauaca accguaucgg cgauaucggu 360
uucauccucg ccuuagcaug auuuauccua cacuccaacu caugagaccc acaacaaaua 420
gcccuucuaa acgcuaaucc aagccucacc ccacuacuag gccuccuccu agcagcagca 480
ggcaaaucag cccaauuagg ucuccacccc ugacuccccu cagccauaga aggccccacc 540
ccagucucag cccuacucca cucaagcacu auaguuguag caggaaucuu cuuacucauc 600
cgcuuccacc cccuagcaga aaauagccca cuaauccaaa cucuaacacu augcuuaggc 660
gcuaucacca cucuguucgc agcagucugc gcccuuacac aaaaugacau caaaaaaauc 720
guagccuucu ccacuucaag ucaacuagga cucauaauag uuacaaucgg caucaaccaa 780
ccacaccuag cauuccugca caucuguacc cacgccuucu ucaaagccau acuauuuaug 840
ugcuccgggu ccaucaucca caaccuuaac aaugaacaag auauucgaaa aauaggagga 900
cuacucaaaa ccauaccucu cacuucaacc ucccucacca uuggcagccu agcauuagca 960
ggaauaccuu uccucacagg uuucuacucc aaagaccaca ucaucgaaac cgcaaacaua 1020
ucauacacaa acgccugagc ccuaucuauu acucucaucg cuaccucccu gacaagcgcc 1080
uauagcacuc gaauaauucu ucucacccua acaggucaac cucgcuuccc cacccuuacu 1140
aacauuaacg aaaauaaccc cacccuacua aaccccauua aacgccuggc agccggaagc 1200
cuauucgcag gauuucucau uacuaacaac auuucccccg caucccccuu ccaaacaaca 1260
aucccccucu accuaaaacu cacagcccuc gcugucacuu uccuaggacu ucuaacagcc 1320
cuagaccuca acuaccuaac caacaaacuu aaaauaaaau ccccacuaug cacauuuuau 1380
uucuccaaca uacucggauu cuacccuagc aucacacacc gcacaauccc cuaucuaggc 1440
cuucuuacga gccaaaaccu gccccuacuc cuccuagacc uaaccugacu agaaaagcua 1500
uuaccuaaaa caauuucaca gcaccaaauc uccaccucca ucaucaccuc aacccaaaaa 1560
ggcauaauua aacuuuacuu ccucucuuuc uucuucccac ucauccuaac ccuacuccua 1620
aucacauaa 1629
<210> 33
<211> 129
<212> RNA
<213> 人
<400> 33
augccccaac uaaauacuac cguauggccc accauaauua cccccauacu ccuuacacua 60
uuccucauca cccaacuaaa aauauuaaac acaaacuacc accuaccucc cucaccauug 120
gcagccuag 129
<210> 34
<211> 261
<212> PRT
<213> Artificial
<220>
<223> 推定的蛋白序列
<220>
<221> misc_feature
<222> (261)..(261)
<223> Xaa可以是任何天然存在的氨基酸
<400> 34
Met Ala His His Asn Tyr Pro His Thr Pro Tyr Thr Ile Pro His His
1 5 10 15
Pro Thr Lys Asn Ile Lys His Lys Leu Pro Pro Thr Ser Leu Thr Ile
20 25 30
Gly Ser Leu Ala Leu Ala Gly Met Pro Phe Leu Thr Gly Phe Tyr Ser
35 40 45
Lys Asp His Ile Ile Glu Thr Ala Asn Met Ser Tyr Thr Asn Ala Trp
50 55 60
Ala Leu Ser Ile Thr Leu Ile Ala Thr Ser Leu Thr Ser Ala Tyr Ser
65 70 75 80
Thr Arg Met Ile Leu Leu Thr Leu Thr Gly Gln Pro Arg Phe Pro Thr
85 90 95
Leu Thr Asn Ile Asn Glu Asn Asn Pro Thr Leu Leu Asn Pro Ile Lys
100 105 110
Arg Leu Ala Ala Gly Ser Leu Phe Ala Gly Phe Leu Ile Thr Asn Asn
115 120 125
Ile Ser Pro Ala Ser Pro Phe Gln Thr Thr Ile Pro Leu Tyr Leu Lys
130 135 140
Leu Thr Ala Leu Ala Val Thr Phe Leu Gly Leu Leu Thr Ala Leu Asp
145 150 155 160
Leu Asn Tyr Leu Thr Asn Lys Leu Lys Met Lys Ser Pro Leu Cys Thr
165 170 175
Phe Tyr Phe Ser Asn Met Leu Gly Phe Tyr Pro Ser Ile Thr His Arg
180 185 190
Thr Ile Pro Tyr Leu Gly Leu Leu Thr Ser Gln Asn Leu Pro Leu Leu
195 200 205
Leu Leu Asp Leu Thr Trp Leu Glu Lys Leu Leu Pro Lys Thr Ile Ser
210 215 220
Gln His Gln Ile Ser Thr Ser Ile Ile Thr Ser Thr Gln Lys Gly Met
225 230 235 240
Ile Lys Leu Tyr Phe Leu Ser Phe Phe Phe Pro Leu Ile Leu Thr Leu
245 250 255
Leu Leu Ile Thr Xaa
260
<210> 35
<211> 100
<212> PRT
<213> Artificial
<220>
<223> 推定的蛋白序列
<220>
<221> misc_feature
<222> (100)..(100)
<223> Xaa可以是任何天然存在的氨基酸
<400> 35
Met Pro Leu Ile Tyr Met Asn Ile Met Leu Ala Phe Thr Ile Ser Leu
1 5 10 15
Leu Gly Met Leu Val Tyr Arg Ser His Leu Met Ser Ser Leu Leu Cys
20 25 30
Leu Glu Gly Met Met Leu Ser Leu Phe Ile Met Ala Thr Leu Met Thr
35 40 45
Leu Asn Thr His Ser Leu Leu Ala Asn Ile Val Pro Ile Ala Met Leu
50 55 60
Val Phe Ala Ala Cys Glu Ala Ala Val Gly Leu Ala Leu Leu Val Ser
65 70 75 80
Ile Ser Asn Thr Tyr Gly Leu Asp Tyr Val His Asn Leu Thr Leu Leu
85 90 95
Leu Ile Thr Xaa
100
<210> 36
<211> 261
<212> PRT
<213> Artificial
<220>
<223> 推定的蛋白序列
<220>
<221> misc_feature
<222> (261)..(261)
<223> Xaa可以是任何天然存在的氨基酸
<400> 36
Met Ala His Ala Ala Gln Val Gly Leu Gln Asp Ala Thr Ser Pro Ile
1 5 10 15
Met Glu Glu Leu Ile Thr Phe His Asp His Ala Leu Met Ile Ile Phe
20 25 30
Leu Ile Cys Phe Leu Val Leu Tyr Ala Leu Phe Leu Thr Leu Thr Thr
35 40 45
Lys Leu Thr Asn Thr Asn Ile Ser Asp Ala Gln Glu Met Glu Thr Val
50 55 60
Trp Thr Ile Leu Pro Ala Ile Ile Leu Val Leu Ile Ala Leu Pro Ser
65 70 75 80
Leu Arg Ile Leu Tyr Met Thr Asp Glu Val Asn Asp Pro Ser Leu Thr
85 90 95
Ile Lys Ser Ile Gly His Gln Trp Tyr Trp Thr Tyr Glu Tyr Thr Asp
100 105 110
Tyr Gly Gly Leu Ile Phe Asn Ser Tyr Met Leu Pro Pro Leu Phe Leu
115 120 125
Glu Pro Gly Asp Pro Asp Asn Tyr Thr Leu Ala Asn Pro Leu Asn Thr
130 135 140
Pro Pro His Ile Lys Pro Glu Trp Tyr Phe Leu Phe Ala Tyr Thr Ile
145 150 155 160
Leu Arg Ser Val Pro Asn Lys Leu Gly Gly Val Leu Ala Leu Leu Leu
165 170 175
Ser Ile Leu Ile Leu Ala Met Ile Pro Ile Leu His Met Ser Lys Gln
180 185 190
Gln Ser Met Met Phe Arg Pro Leu Ser Gln Ser Leu Tyr Trp Leu Leu
195 200 205
Ala Ala Asp Leu Leu Ile Leu Thr Trp Ile Gly Gly Gln Pro Val Ser
210 215 220
Tyr Pro Phe Thr Ile Ile Gly Gln Val Ala Ser Val Leu Tyr Phe Thr
225 230 235 240
Thr Ile Leu Ile Leu Met Pro Thr Ile Ser Leu Ile Glu Asn Lys Met
245 250 255
Leu Lys Trp Ala Xaa
260
<210> 37
<211> 189
<212> PRT
<213> Artificial
<220>
<223> 推定的蛋白序列
<220>
<221> misc_feature
<222> (189)..(189)
<223> Xaa可以是任何天然存在的氨基酸
<400> 37
Met Ala His Ala Ala Gln Val Gly Leu Gln Asp Ala Thr Ser Pro Ile
1 5 10 15
Met Glu Glu Leu Ile Thr Phe His Asp His Ala Leu Met Ile Ile Phe
20 25 30
Leu Ile Cys Phe Leu Val Leu Tyr Ala Leu Phe Leu Thr Leu Thr Thr
35 40 45
Lys Leu Thr Asn Thr Asn Ile Ser Asp Ala Gln Glu Met Glu Thr Val
50 55 60
Trp Thr Ile Leu Pro Ala Ile Ile Leu Val Leu Ile Ala Leu Pro Ser
65 70 75 80
Leu Arg Ile Leu Tyr Met Thr Asp Glu Val Asn Asp Pro Ser Leu Thr
85 90 95
Ile Lys Ser Ile Gly His Gln Trp Tyr Trp Thr Tyr Glu Tyr Thr Asp
100 105 110
Tyr Gly Gly Leu Ile Phe Asn Ser Tyr Met Leu Pro Pro Leu Phe Leu
115 120 125
Glu Pro Gly Asp Leu Arg Leu Leu Ala Ala Asp Leu Leu Ile Leu Thr
130 135 140
Trp Ile Gly Gly Gln Pro Val Ser Tyr Pro Phe Thr Ile Ile Gly Gln
145 150 155 160
Val Ala Ser Val Leu Tyr Phe Thr Thr Ile Leu Ile Leu Met Pro Thr
165 170 175
Ile Ser Leu Ile Glu Asn Lys Met Leu Lys Trp Ala Xaa
180 185
<210> 38
<211> 392
<212> PRT
<213> Artificial
<220>
<223> 推定的蛋白序列
<220>
<221> misc_feature
<222> (392)..(392)
<223> Xaa可以是任何天然存在的氨基酸
<400> 38
Met Ala His Ala Ala Gln Val Gly Leu Gln Asp Ala Thr Ser Pro Ile
1 5 10 15
Met Glu Glu Leu Ile Thr Phe His Asp His Ala Leu Met Ile Ile Phe
20 25 30
Leu Ile Cys Phe Leu Val Leu Tyr Ala Leu Phe Leu Thr Leu Thr Thr
35 40 45
Lys Leu Thr Asn Thr Asn Ile Ser Asp Ala Gln Glu Met Glu Thr Val
50 55 60
Trp Thr Ile Leu Pro Ala Ile Ile Leu Val Leu Ile Ala Leu Pro Ser
65 70 75 80
Leu Arg Ile Leu Tyr Met Thr Asp Glu Val Asn Asp Pro Ser Leu Thr
85 90 95
Ile Lys Ser Ile Gly His Gln Trp Tyr Trp Thr Tyr Glu Tyr Thr Asp
100 105 110
Tyr Gly Gly Leu Ile Phe Asn Ser Tyr Met Leu Pro Pro Leu Phe Leu
115 120 125
Glu Pro Gly Asp Leu Arg Leu Leu Asp Val Asp Asn Arg Val Val Leu
130 135 140
Pro Ile Glu Ala Pro Ile Arg Met Met Ile Thr Ser Gln Asp Val Leu
145 150 155 160
His Ser Trp Ala Val Pro Thr Leu Gly Leu Lys Thr Asp Ala Ile Pro
165 170 175
Gly Arg Leu Asn Gln Thr Thr Phe Thr Ala Thr Arg Pro Gly Val Tyr
180 185 190
Tyr Gly Gln Cys Ser Glu Ile Cys Gly Ala Asn His Ser Phe Met Pro
195 200 205
Met Phe Leu His Glu Thr Gly Ser Asn Asn Pro Leu Gly Ile Thr Ser
210 215 220
His Ser Asp Lys Ile Thr Phe His Pro Tyr Tyr Thr Ile Lys Asp Ala
225 230 235 240
Leu Gly Leu Leu Leu Phe Leu Leu Ser Leu Met Thr Leu Thr Leu Phe
245 250 255
Ser Pro Asp Leu Leu Gly Asp Pro Asp Asn Tyr Thr Leu Ala Asn Pro
260 265 270
Leu Asn Thr Pro Pro His Ile Lys Pro Glu Trp Tyr Phe Leu Phe Ala
275 280 285
Tyr Thr Ile Leu Arg Ser Val Pro Asn Lys Leu Gly Gly Val Leu Ala
290 295 300
Leu Leu Leu Ser Ile Leu Ile Leu Ala Met Ile Pro Ile Leu His Met
305 310 315 320
Ser Lys Gln Gln Ser Met Met Phe Arg Pro Leu Ser Gln Ser Leu Tyr
325 330 335
Trp Leu Leu Ala Ala Asp Leu Leu Ile Leu Thr Trp Ile Gly Gly Gln
340 345 350
Pro Val Ser Tyr Pro Phe Thr Ile Ile Gly Gln Val Ala Ser Val Leu
355 360 365
Tyr Phe Thr Thr Ile Leu Ile Leu Met Pro Thr Ile Ser Leu Ile Glu
370 375 380
Asn Lys Met Leu Lys Trp Ala Xaa
385 390
<210> 39
<211> 432
<212> PRT
<213> Artificial
<220>
<223> 推定的蛋白序列
<220>
<221> misc_feature
<222> (432)..(432)
<223> Xaa可以是任何天然存在的氨基酸
<400> 39
Met Asn Glu Asn Leu Phe Ala Ser Phe Ile Ala Pro Thr Ile Leu Gly
1 5 10 15
Leu Pro Ala Ala Val Leu Ile Ile Leu Phe Pro Pro Leu Leu Ile Pro
20 25 30
Thr Ser Lys Tyr Leu Ile Asn Asn Arg Leu Ile Thr Thr Gln Gln Trp
35 40 45
Leu Ile Lys Leu Thr Ser Lys Gln Met Met Thr Met His Asn Thr Lys
50 55 60
Gly Arg Thr Trp Ser Leu Met Leu Val Ser Leu Ile Ile Phe Ile Ala
65 70 75 80
Thr Thr Asn Leu Leu Gly Leu Leu Pro His Ser Phe Thr Pro Thr Thr
85 90 95
Gln Leu Ser Met Asn Leu Ala Met His Tyr Ser Pro Asp Ala Ser Thr
100 105 110
Ala Phe Ser Ser Ile Ala His Ile Thr Arg Asp Val Asn Tyr Gly Trp
115 120 125
Ile Ile Arg Tyr Leu His Ala Asn Gly Ala Ser Met Phe Phe Ile Cys
130 135 140
Leu Phe Leu His Ile Gly Arg Gly Leu Tyr Tyr Gly Ser Phe Leu Tyr
145 150 155 160
Ser Glu Thr Trp Asn Ile Gly Ile Ile Leu Leu Leu Ala Thr Met Ala
165 170 175
Thr Ala Phe Met Gly Tyr Val Leu Pro Trp Gly Gln Met Ser Phe Trp
180 185 190
Gly Ala Thr Val Ile Thr Asn Leu Leu Ser Ala Ile Pro Tyr Ile Gly
195 200 205
Thr Asp Leu Val Gln Trp Ile Trp Gly Gly Tyr Ser Val Asp Ser Pro
210 215 220
Thr Leu Thr Arg Phe Phe Thr Phe His Phe Ile Leu Pro Phe Ile Ile
225 230 235 240
Ala Ala Leu Ala Thr Leu His Leu Leu Phe Leu His Glu Thr Gly Ser
245 250 255
Asn Asn Pro Leu Gly Ile Thr Ser His Ser Asp Lys Ile Thr Phe His
260 265 270
Pro Tyr Tyr Thr Ile Lys Asp Ala Leu Gly Leu Leu Leu Phe Leu Leu
275 280 285
Ser Leu Met Thr Leu Thr Leu Phe Ser Pro Asp Leu Leu Gly Asp Pro
290 295 300
Asp Asn Tyr Thr Leu Ala Asn Pro Leu Asn Thr Pro Pro His Ile Lys
305 310 315 320
Pro Glu Trp Tyr Phe Leu Phe Ala Tyr Thr Ile Leu Arg Ser Val Pro
325 330 335
Asn Lys Leu Gly Gly Val Leu Ala Leu Leu Leu Ser Ile Leu Ile Leu
340 345 350
Ala Met Ile Pro Ile Leu His Met Ser Lys Gln Gln Ser Met Met Phe
355 360 365
Arg Pro Leu Ser Gln Ser Leu Tyr Trp Leu Leu Ala Ala Asp Leu Leu
370 375 380
Ile Leu Thr Trp Ile Gly Gly Gln Pro Val Ser Tyr Pro Phe Thr Ile
385 390 395 400
Ile Gly Gln Val Ala Ser Val Leu Tyr Phe Thr Thr Ile Leu Ile Leu
405 410 415
Met Pro Thr Ile Ser Leu Ile Glu Asn Lys Met Leu Lys Trp Ala Xaa
420 425 430
<210> 40
<211> 410
<212> PRT
<213> Artificial
<220>
<223> 推定的蛋白序列
<220>
<221> misc_feature
<222> (410)..(410)
<223> Xaa可以是任何天然存在的氨基酸
<400> 40
Met Pro Leu Ile Tyr Met Asn Ile Met Leu Ala Phe Thr Ile Ser Leu
1 5 10 15
Leu Gly Met Leu Val Tyr Arg Ser His Leu Met Ser Ser Leu Leu Cys
20 25 30
Leu Glu Gly Met Met Leu Ser Leu Phe Ile Met Ala Thr Leu Met Thr
35 40 45
Leu Asn Thr His Ser Leu Leu Ala Asn Ile Val Pro Ile Ala Met Leu
50 55 60
Val Phe Gly Ala Cys Leu Ile Leu Gln Ile Thr Thr Gly Leu Phe Leu
65 70 75 80
Ala Met His Tyr Ser Pro Asp Ala Ser Thr Ala Phe Ser Ser Ile Ala
85 90 95
His Ile Thr Arg Asp Val Asn Tyr Gly Trp Ile Ile Arg Tyr Leu His
100 105 110
Ala Asn Gly Ala Ser Met Phe Phe Ile Cys Leu Phe Leu His Ile Gly
115 120 125
Arg Gly Leu Tyr Tyr Gly Ser Phe Leu Tyr Ser Glu Thr Trp Asn Ile
130 135 140
Gly Ile Ile Leu Leu Leu Ala Thr Met Ala Thr Ala Phe Met Gly Tyr
145 150 155 160
Val Leu Pro Trp Gly Gln Met Ser Phe Trp Gly Ala Thr Val Ile Thr
165 170 175
Asn Leu Leu Ser Ala Ile Pro Tyr Ile Gly Thr Asp Leu Val Gln Trp
180 185 190
Ile Trp Gly Gly Tyr Ser Val Asp Ser Pro Thr Leu Thr Arg Phe Phe
195 200 205
Thr Phe His Phe Ile Leu Pro Phe Ile Ile Ala Ala Leu Ala Thr Leu
210 215 220
His Leu Leu Phe Leu His Glu Thr Gly Ser Asn Asn Pro Leu Gly Ile
225 230 235 240
Thr Ser His Ser Asp Lys Ile Thr Phe His Pro Tyr Tyr Thr Ile Lys
245 250 255
Asp Ala Leu Gly Leu Leu Leu Phe Leu Leu Ser Leu Met Thr Leu Thr
260 265 270
Leu Phe Ser Pro Asp Leu Leu Gly Asp Pro Asp Asn Tyr Thr Leu Ala
275 280 285
Asn Pro Leu Asn Thr Pro Pro His Ile Lys Pro Glu Trp Tyr Phe Leu
290 295 300
Phe Ala Tyr Thr Ile Leu Arg Ser Val Pro Asn Lys Leu Gly Gly Val
305 310 315 320
Leu Ala Leu Leu Leu Ser Ile Leu Ile Leu Ala Met Ile Pro Ile Leu
325 330 335
His Met Ser Lys Gln Gln Ser Met Met Phe Arg Pro Leu Ser Gln Ser
340 345 350
Leu Tyr Trp Leu Leu Ala Ala Asp Leu Leu Ile Leu Thr Trp Ile Gly
355 360 365
Gly Gln Pro Val Ser Tyr Pro Phe Thr Ile Ile Gly Gln Val Ala Ser
370 375 380
Val Leu Tyr Phe Thr Thr Ile Leu Ile Leu Met Pro Thr Ile Ser Leu
385 390 395 400
Ile Glu Asn Lys Met Leu Lys Trp Ala Xaa
405 410
<210> 41
<211> 174
<212> PRT
<213> Artificial
<220>
<223> 推定的蛋白序列
<220>
<221> misc_feature
<222> (174)..(174)
<223> Xaa可以是任何天然存在的氨基酸
<400> 41
Met Phe Ala Asp Arg Trp Leu Phe Ser Thr Asn His Lys Asp Ile Gly
1 5 10 15
Thr Leu Tyr Leu Leu Phe Gly Ala Trp Ala Gly Val Leu Gly Thr Ala
20 25 30
Leu Ser Leu Leu Ile Arg Ala Glu Leu Gly Gln Pro Gly Asn Leu Leu
35 40 45
Gly Asn Asp His Ile Tyr Asn Val Ile Val Thr Ala Leu Ala Val Thr
50 55 60
Phe Leu Gly Leu Leu Thr Ala Leu Asp Leu Asn Tyr Leu Thr Asn Lys
65 70 75 80
Leu Lys Met Lys Ser Pro Leu Cys Thr Phe Tyr Phe Ser Asn Met Leu
85 90 95
Gly Phe Tyr Pro Ser Ile Thr His Arg Thr Ile Pro Tyr Leu Gly Leu
100 105 110
Leu Thr Ser Gln Asn Leu Pro Leu Leu Leu Leu Asp Leu Thr Trp Leu
115 120 125
Glu Lys Leu Leu Pro Lys Thr Ile Ser Gln His Gln Ile Ser Thr Ser
130 135 140
Ile Ile Thr Ser Thr Gln Lys Gly Met Ile Lys Leu Tyr Phe Leu Ser
145 150 155 160
Phe Phe Phe Pro Leu Ile Leu Thr Leu Leu Leu Ile Thr Xaa
165 170
<210> 42
<211> 194
<212> PRT
<213> Artificial
<220>
<223> 推定的蛋白序列
<220>
<221> misc_feature
<222> (194)..(194)
<223> Xaa可以是任何天然存在的氨基酸
<400> 42
Met Phe Ala Asp Arg Trp Leu Phe Ser Thr Asn His Lys Asp Ile Gly
1 5 10 15
Thr Leu Tyr Leu Leu Phe Gly Ala Trp Ala Gly Val Leu Gly Thr Ala
20 25 30
Leu Ser Leu Leu Ile Arg Ala Glu Leu Gly Gln Pro Gly Asn Leu Leu
35 40 45
Gly Asn Asp His Ile Tyr Asn Val Ile Val Thr Ala His Ala Phe Val
50 55 60
Met Ile Phe Phe Met Val Met Pro Ile Met Ile Gly Gly Phe Gly Asn
65 70 75 80
Trp Leu Val Pro Leu Met Ile Gly Ala Pro Asp Met Ala Phe Pro Arg
85 90 95
Met Asn Asn Met Ser Phe Trp Leu Leu Pro Pro Ser Leu Leu Leu Leu
100 105 110
Leu Ala Ser Ala Met Val Glu Ala Gly Ala Gly Thr Gly Trp Thr Val
115 120 125
Tyr Pro Pro Leu Ala Gly Asn Tyr Ser His Pro Gly Ala Leu Leu Asp
130 135 140
Leu Thr Trp Leu Glu Lys Leu Leu Pro Lys Thr Ile Ser Gln His Gln
145 150 155 160
Ile Ser Thr Ser Ile Ile Thr Ser Thr Gln Lys Gly Met Ile Lys Leu
165 170 175
Tyr Phe Leu Ser Phe Phe Phe Pro Leu Ile Leu Thr Leu Leu Leu Ile
180 185 190
Thr Xaa
<210> 43
<211> 736
<212> PRT
<213> Artificial
<220>
<223> 推定的蛋白序列
<220>
<221> misc_feature
<222> (736)..(736)
<223> Xaa可以是任何天然存在的氨基酸
<400> 43
Met Phe Ala Asp Arg Trp Leu Phe Ser Thr Asn His Lys Asp Ile Gly
1 5 10 15
Thr Leu Tyr Leu Leu Phe Gly Ala Trp Ala Gly Val Leu Gly Thr Ala
20 25 30
Leu Ser Leu Leu Ile Arg Ala Glu Leu Gly Gln Pro Gly Asn Leu Leu
35 40 45
Gly Asn Asp His Ile Tyr Asn Val Ile Val Thr Ala His Ala Phe Val
50 55 60
Met Ile Phe Phe Met Val Met Pro Ile Met Ile Gly Gly Phe Gly Asn
65 70 75 80
Trp Leu Val Pro Leu Met Ile Gly Ala Pro Asp Met Ala Phe Pro Arg
85 90 95
Met Asn Asn Met Ser Phe Trp Leu Leu Pro Pro Ser Leu Leu Leu Leu
100 105 110
Leu Ala Ser Ala Met Val Glu Ala Gly Ala Gly Thr Gly Trp Thr Val
115 120 125
Tyr Pro Pro Leu Ala Gly Asn Tyr Ser His Pro Gly Ala Ser Val Asp
130 135 140
Leu Thr Ile Phe Ser Leu His Leu Ala Gly Val Ser Ser Ile Leu Gly
145 150 155 160
Ala Ile Asn Phe Ile Thr Thr Ile Ile Asn Met Lys Pro Pro Ala Met
165 170 175
Thr Gln Tyr Gln Thr Pro Leu Phe Val Trp Ser Val Leu Ile Thr Ala
180 185 190
Val Leu Leu Leu Leu Ser Leu Pro Val Leu Ala Ala Gly Ile Thr Met
195 200 205
Leu Leu Thr Asp Arg Asn Leu Asn Thr Thr Phe Phe Asp Pro Ala Gly
210 215 220
Gly Gly Asp Pro Ile Leu Tyr Gln His Leu Phe Trp Phe Phe Gly His
225 230 235 240
Pro Glu Val Tyr Ile Leu Ile Leu Pro Gly Phe Gly Met Ile Ser His
245 250 255
Ile Val Thr Tyr Tyr Ser Gly Lys Lys Glu Pro Phe Gly Tyr Met Gly
260 265 270
Met Val Trp Ala Met Met Ser Ile Gly Phe Leu Gly Phe Ile Val Trp
275 280 285
Ala His His Met Phe Thr Val Gly Met Asp Val Asp Thr Arg Ala Tyr
290 295 300
Phe Thr Ser Ala Thr Met Ile Ile Ala Ile Pro Thr Gly Val Lys Val
305 310 315 320
Phe Ser Trp Leu Ala Thr Leu His Gly Ser Asn Met Lys Trp Ser Ala
325 330 335
Ala Val Leu Trp Ala Leu Gly Phe Ile Phe Leu Phe Thr Val Gly Gly
340 345 350
Leu Thr Gly Ile Val Leu Ala Asn Ser Ser Leu Asp Ile Val Leu His
355 360 365
Asp Thr Tyr Tyr Val Val Ala His Phe His Tyr Val Leu Ser Met Gly
370 375 380
Ala Val Phe Ala Ile Met Gly Gly Phe Ile His Trp Phe Pro Leu Phe
385 390 395 400
Ser Gly Tyr Thr Leu Asp Gln Thr Tyr Ala Lys Ile His Phe Thr Ile
405 410 415
Met Phe Ile Gly Val Asn Leu Thr Phe Phe Pro Gln His Phe Leu Gly
420 425 430
Leu Ser Gly Met Pro Arg Arg Tyr Ser Asp Tyr Pro Asp Ala Tyr Thr
435 440 445
Thr Trp Asn Ile Leu Ser Ser Val Gly Ser Phe Ile Ser Leu Thr Ala
450 455 460
Val Met Leu Met Ile Phe Met Ile Trp Glu Ala Phe Ala Ser Lys Arg
465 470 475 480
Lys Val Leu Met Val Glu Glu Pro Ser Met Asn Leu Glu Trp Leu Tyr
485 490 495
Gly Cys Pro Pro Pro Tyr His Thr Phe Glu Glu Pro Val Tyr Met Lys
500 505 510
Ala Gly Met Pro Phe Leu Thr Gly Phe Tyr Ser Lys Asp His Ile Ile
515 520 525
Glu Thr Ala Asn Met Ser Tyr Thr Asn Ala Trp Ala Leu Ser Ile Thr
530 535 540
Leu Ile Ala Thr Ser Leu Thr Ser Ala Tyr Ser Thr Arg Met Ile Leu
545 550 555 560
Leu Thr Leu Thr Gly Gln Pro Arg Phe Pro Thr Leu Thr Asn Ile Asn
565 570 575
Glu Asn Asn Pro Thr Leu Leu Asn Pro Ile Lys Arg Leu Ala Ala Gly
580 585 590
Ser Leu Phe Ala Gly Phe Leu Ile Thr Asn Asn Ile Ser Pro Ala Ser
595 600 605
Pro Phe Gln Thr Thr Ile Pro Leu Tyr Leu Lys Leu Thr Ala Leu Ala
610 615 620
Val Thr Phe Leu Gly Leu Leu Thr Ala Leu Asp Leu Asn Tyr Leu Thr
625 630 635 640
Asn Lys Leu Lys Met Lys Ser Pro Leu Cys Thr Phe Tyr Phe Ser Asn
645 650 655
Met Leu Gly Phe Tyr Pro Ser Ile Thr His Arg Thr Ile Pro Tyr Leu
660 665 670
Gly Leu Leu Thr Ser Gln Asn Leu Pro Leu Leu Leu Leu Asp Leu Thr
675 680 685
Trp Leu Glu Lys Leu Leu Pro Lys Thr Ile Ser Gln His Gln Ile Ser
690 695 700
Thr Ser Ile Ile Thr Ser Thr Gln Lys Gly Met Ile Lys Leu Tyr Phe
705 710 715 720
Leu Ser Phe Phe Phe Pro Leu Ile Leu Thr Leu Leu Leu Ile Thr Xaa
725 730 735
<210> 44
<211> 269
<212> PRT
<213> Artificial
<220>
<223> 推定的蛋白序列
<220>
<221> misc_feature
<222> (269)..(269)
<223> Xaa可以是任何天然存在的氨基酸
<400> 44
Met Ala His Ala Ala Gln Val Gly Leu Gln Asp Ala Thr Ser Pro Ile
1 5 10 15
Met Glu Glu Leu Ile Thr Phe His Asp His Ala Leu Met Ile Ile Phe
20 25 30
Leu Ile Cys Phe Leu Val Leu Tyr Ala Leu Phe Leu Thr Leu Thr Thr
35 40 45
Lys Leu Thr Asn Thr Asn Ile Ser Asp Ala Gln Glu Met Glu Thr Ala
50 55 60
Asn Met Ser Tyr Thr Asn Ala Trp Ala Leu Ser Ile Thr Leu Ile Ala
65 70 75 80
Thr Ser Leu Thr Ser Ala Tyr Ser Thr Arg Met Ile Leu Leu Thr Leu
85 90 95
Thr Gly Gln Pro Arg Phe Pro Thr Leu Thr Asn Ile Asn Glu Asn Asn
100 105 110
Pro Thr Leu Leu Asn Pro Ile Lys Arg Leu Ala Ala Gly Ser Leu Phe
115 120 125
Ala Gly Phe Leu Ile Thr Asn Asn Ile Ser Pro Ala Ser Pro Phe Gln
130 135 140
Thr Thr Ile Pro Leu Tyr Leu Lys Leu Thr Ala Leu Ala Val Thr Phe
145 150 155 160
Leu Gly Leu Leu Thr Ala Leu Asp Leu Asn Tyr Leu Thr Asn Lys Leu
165 170 175
Lys Met Lys Ser Pro Leu Cys Thr Phe Tyr Phe Ser Asn Met Leu Gly
180 185 190
Phe Tyr Pro Ser Ile Thr His Arg Thr Ile Pro Tyr Leu Gly Leu Leu
195 200 205
Thr Ser Gln Asn Leu Pro Leu Leu Leu Leu Asp Leu Thr Trp Leu Glu
210 215 220
Lys Leu Leu Pro Lys Thr Ile Ser Gln His Gln Ile Ser Thr Ser Ile
225 230 235 240
Ile Thr Ser Thr Gln Lys Gly Met Ile Lys Leu Tyr Phe Leu Ser Phe
245 250 255
Phe Phe Pro Leu Ile Leu Thr Leu Leu Leu Ile Thr Xaa
260 265
<210> 45
<211> 262
<212> PRT
<213> Artificial
<220>
<223> 推定的蛋白序列
<220>
<221> misc_feature
<222> (262)..(262)
<223> Xaa可以是任何天然存在的氨基酸
<400> 45
Met Ala His Ala Ala Gln Val Gly Leu Gln Asp Ala Thr Ser Pro Ile
1 5 10 15
Met Glu Glu Leu Ile Thr Phe His Asp His Ala Leu Met Ile Ile Phe
20 25 30
Leu Ile Cys Phe Leu Val Leu Tyr Ala Leu Phe Leu Thr Leu Thr Thr
35 40 45
Lys Leu Thr Asn Thr Asn Ile Ser Asp Ala Gln Glu Met Glu Thr Val
50 55 60
Trp Thr Ile Leu Pro Ala Ile Ile Leu Val Leu Ile Ala Leu Pro Ser
65 70 75 80
Leu Arg Ile Leu Tyr Met Thr Asp Glu Val Asn Asp Pro Ser Leu Thr
85 90 95
Ile Lys Ser Ile Gly His Gln Trp Tyr Trp Thr Tyr Glu Tyr Thr Asp
100 105 110
Tyr Gly Gly Leu Ile Phe Asn Ser Tyr Met Leu Pro Pro Leu Phe Leu
115 120 125
Glu Pro Gly Asp Leu Arg Leu Leu Asp Val Asp Asn Arg Val Val Leu
130 135 140
Pro Ile Glu Ala Pro Ile Arg Met Met Ile Thr Ser Gln Asp Val Leu
145 150 155 160
His Ser Trp Ala Val Pro Thr Leu Gly Leu Lys Thr Asp Ala Ile Pro
165 170 175
Gly Arg Leu Asn Gln Thr Thr Phe Thr Ala Thr Arg Pro Gly Val Tyr
180 185 190
Tyr Gly Gln Cys Ser Glu Ile Cys Gly Ala Asn His Ser Phe Met Pro
195 200 205
Ile Val Leu Asp Leu Thr Trp Leu Glu Lys Leu Leu Pro Lys Thr Ile
210 215 220
Ser Gln His Gln Ile Ser Thr Ser Ile Ile Thr Ser Thr Gln Lys Gly
225 230 235 240
Met Ile Lys Leu Tyr Phe Leu Ser Phe Phe Phe Pro Leu Ile Leu Thr
245 250 255
Leu Leu Leu Ile Thr Xaa
260
<210> 46
<211> 635
<212> PRT
<213> Artificial
<220>
<223> 推定的蛋白序列
<220>
<221> misc_feature
<222> (635)..(635)
<223> Xaa可以是任何天然存在的氨基酸
<400> 46
Met Asn Glu Asn Leu Phe Ala Ser Phe Ile Ala Pro Thr Ile Leu Gly
1 5 10 15
Leu Pro Ala Ala Val Leu Ile Ile Leu Phe Pro Pro Leu Leu Ile Pro
20 25 30
Thr Ser Lys Tyr Leu Ile Asn Asn Arg Leu Ile Thr Thr Gln Gln Trp
35 40 45
Leu Ile Lys Leu Thr Ser Lys Gln Met Met Thr Met His Asn Thr Lys
50 55 60
Gly Arg Thr Trp Ser Leu Met Leu Val Ser Leu Ile Ile Phe Ile Ala
65 70 75 80
Thr Thr Asn Leu Leu Gly Leu Leu Pro His Ser Phe Thr Pro Thr Thr
85 90 95
Gln Leu Ser Met Asn Leu Ala Met Ala Ile Pro Leu Trp Ala Gly Thr
100 105 110
Val Ile Met Gly Phe Arg Ser Lys Ile Lys Asn Ala Leu Ala His Phe
115 120 125
Leu Pro Gln Gly Thr Pro Thr Pro Leu Ile Pro Met Leu Val Ile Ile
130 135 140
Glu Thr Ile Ser Leu Leu Ile Gln Pro Met Ala Leu Ala Val Arg Leu
145 150 155 160
Thr Ala Asn Ile Thr Ala Gly His Leu Leu Met His Leu Ile Gly Ser
165 170 175
Ala Thr Leu Ala Met Ser Thr Ile Asn Leu Pro Ser Thr Leu Ile Ile
180 185 190
Phe Thr Ile Leu Ile Leu Leu Thr Ile Leu Glu Ile Ala Val Ala Leu
195 200 205
Ile Gln Ala Tyr Val Phe Thr Leu Leu Val Ser Leu Tyr Leu His Ser
210 215 220
Asn Ser Trp Asp Pro Gln Gln Met Ala Leu Leu Asn Ala Asn Pro Ser
225 230 235 240
Leu Thr Pro Leu Leu Gly Leu Leu Leu Ala Ala Ala Gly Lys Ser Ala
245 250 255
Gln Leu Gly Leu His Pro Trp Leu Pro Ser Ala Met Glu Gly Pro Thr
260 265 270
Pro Val Ser Ala Leu Leu His Ser Ser Thr Met Val Val Ala Gly Ile
275 280 285
Phe Leu Leu Ile Arg Phe His Pro Leu Ala Glu Asn Ser Pro Leu Ile
290 295 300
Gln Thr Leu Thr Leu Cys Leu Gly Ala Ile Thr Thr Leu Phe Ala Ala
305 310 315 320
Val Cys Ala Leu Thr Gln Asn Asp Ile Lys Lys Ile Val Ala Phe Ser
325 330 335
Thr Ser Ser Gln Leu Gly Leu Met Met Val Thr Ile Gly Ile Asn Gln
340 345 350
Pro His Leu Ala Phe Leu His Ile Cys Thr His Ala Phe Phe Lys Ala
355 360 365
Met Leu Phe Met Cys Ser Gly Ser Ile Ile His Asn Leu Asn Asn Glu
370 375 380
Gln Asp Ile Arg Lys Met Gly Gly Leu Leu Lys Thr Met Pro Leu Thr
385 390 395 400
Ser Thr Ser Leu Thr Ile Gly Ser Leu Ala Leu Ala Gly Met Pro Phe
405 410 415
Leu Thr Gly Phe Tyr Ser Lys Asp His Ile Ile Glu Thr Ala Asn Met
420 425 430
Ser Tyr Thr Asn Ala Trp Ala Leu Ser Ile Thr Leu Ile Ala Thr Ser
435 440 445
Leu Thr Ser Ala Tyr Ser Thr Arg Met Ile Leu Leu Thr Leu Thr Gly
450 455 460
Gln Pro Arg Phe Pro Thr Leu Thr Asn Ile Asn Glu Asn Asn Pro Thr
465 470 475 480
Leu Leu Asn Pro Ile Lys Arg Leu Ala Ala Gly Ser Leu Phe Ala Gly
485 490 495
Phe Leu Ile Thr Asn Asn Ile Ser Pro Ala Ser Pro Phe Gln Thr Thr
500 505 510
Ile Pro Leu Tyr Leu Lys Leu Thr Ala Leu Ala Val Thr Phe Leu Gly
515 520 525
Leu Leu Thr Ala Leu Asp Leu Asn Tyr Leu Thr Asn Lys Leu Lys Met
530 535 540
Lys Ser Pro Leu Cys Thr Phe Tyr Phe Ser Asn Met Leu Gly Phe Tyr
545 550 555 560
Pro Ser Ile Thr His Arg Thr Ile Pro Tyr Leu Gly Leu Leu Thr Ser
565 570 575
Gln Asn Leu Pro Leu Leu Leu Leu Asp Leu Thr Trp Leu Glu Lys Leu
580 585 590
Leu Pro Lys Thr Ile Ser Gln His Gln Ile Ser Thr Ser Ile Ile Thr
595 600 605
Ser Thr Gln Lys Gly Met Ile Lys Leu Tyr Phe Leu Ser Phe Phe Phe
610 615 620
Pro Leu Ile Leu Thr Leu Leu Leu Ile Thr Xaa
625 630 635
<210> 47
<211> 515
<212> PRT
<213> Artificial
<220>
<223> 推定的蛋白序列
<220>
<221> misc_feature
<222> (515)..(515)
<223> Xaa可以是任何天然存在的氨基酸
<400> 47
Met Thr His Gln Ser His Ala Tyr His Met Val Lys Pro Ser Pro Trp
1 5 10 15
Pro Leu Thr Gly Ala Leu Ser Ala Leu Leu Met Thr Ser Gly Leu Ala
20 25 30
Met Trp Phe His Phe His Ser Met Thr Leu Leu Met Leu Gly Leu Leu
35 40 45
Thr Asn Thr Leu Thr Met Tyr Gln Trp Trp Arg Asp Val Thr Arg Glu
50 55 60
Ser Thr Tyr Gln Gly His His Thr Pro Pro Val Gln Lys Gly Leu Arg
65 70 75 80
Tyr Gly Met Ile Leu Phe Ile Thr Ser Glu Val Phe Phe Phe Ala Gly
85 90 95
Phe Phe Trp Ala Phe Tyr His Ser Ser Leu Ala Pro Thr Pro Gln Leu
100 105 110
Gly Gly His Trp Pro Pro Thr Gly Ile Thr Pro Leu Leu Gly Leu Leu
115 120 125
Leu Ala Ala Ala Gly Lys Ser Ala Gln Leu Gly Leu His Pro Trp Leu
130 135 140
Pro Ser Ala Met Glu Gly Pro Thr Pro Val Ser Ala Leu Leu His Ser
145 150 155 160
Ser Thr Met Val Val Ala Gly Ile Phe Leu Leu Ile Arg Phe His Pro
165 170 175
Leu Ala Glu Asn Ser Pro Leu Ile Gln Thr Leu Thr Leu Cys Leu Gly
180 185 190
Ala Ile Thr Thr Leu Phe Ala Ala Val Cys Ala Leu Thr Gln Asn Asp
195 200 205
Ile Lys Lys Ile Val Ala Phe Ser Thr Ser Ser Gln Leu Gly Leu Met
210 215 220
Met Val Thr Ile Gly Ile Asn Gln Pro His Leu Ala Phe Leu His Ile
225 230 235 240
Cys Thr His Ala Phe Phe Lys Ala Met Leu Phe Met Cys Ser Gly Ser
245 250 255
Ile Ile His Asn Leu Asn Asn Glu Gln Asp Ile Arg Lys Met Gly Gly
260 265 270
Leu Leu Lys Thr Met Pro Leu Thr Ser Thr Ser Leu Thr Ile Gly Ser
275 280 285
Leu Ala Leu Ala Gly Met Pro Phe Leu Thr Gly Phe Tyr Ser Lys Asp
290 295 300
His Ile Ile Glu Thr Ala Asn Met Ser Tyr Thr Asn Ala Trp Ala Leu
305 310 315 320
Ser Ile Thr Leu Ile Ala Thr Ser Leu Thr Ser Ala Tyr Ser Thr Arg
325 330 335
Met Ile Leu Leu Thr Leu Thr Gly Gln Pro Arg Phe Pro Thr Leu Thr
340 345 350
Asn Ile Asn Glu Asn Asn Pro Thr Leu Leu Asn Pro Ile Lys Arg Leu
355 360 365
Ala Ala Gly Ser Leu Phe Ala Gly Phe Leu Ile Thr Asn Asn Ile Ser
370 375 380
Pro Ala Ser Pro Phe Gln Thr Thr Ile Pro Leu Tyr Leu Lys Leu Thr
385 390 395 400
Ala Leu Ala Val Thr Phe Leu Gly Leu Leu Thr Ala Leu Asp Leu Asn
405 410 415
Tyr Leu Thr Asn Lys Leu Lys Met Lys Ser Pro Leu Cys Thr Phe Tyr
420 425 430
Phe Ser Asn Met Leu Gly Phe Tyr Pro Ser Ile Thr His Arg Thr Ile
435 440 445
Pro Tyr Leu Gly Leu Leu Thr Ser Gln Asn Leu Pro Leu Leu Leu Leu
450 455 460
Asp Leu Thr Trp Leu Glu Lys Leu Leu Pro Lys Thr Ile Ser Gln His
465 470 475 480
Gln Ile Ser Thr Ser Ile Ile Thr Ser Thr Gln Lys Gly Met Ile Lys
485 490 495
Leu Tyr Phe Leu Ser Phe Phe Phe Pro Leu Ile Leu Thr Leu Leu Leu
500 505 510
Ile Thr Xaa
515
<210> 48
<211> 543
<212> PRT
<213> Artificial
<220>
<223> 推定的蛋白序列
<220>
<221> misc_feature
<222> (543)..(543)
<223> Xaa可以是任何天然存在的氨基酸
<400> 48
Met Asn Phe Ala Leu Ile Leu Met Ile Asn Thr Leu Leu Ala Leu Leu
1 5 10 15
Leu Met Ile Ile Thr Phe Trp Leu Pro Gln Leu Asn Gly Tyr Met Glu
20 25 30
Lys Ser Thr Pro Tyr Glu Cys Gly Phe Asp Pro Met Ser Pro Ala Arg
35 40 45
Val Pro Phe Ser Met Lys Phe Phe Leu Val Ala Ile Thr Phe Leu Leu
50 55 60
Phe Asp Leu Glu Ile Ala Leu Leu Leu Pro Leu Pro Trp Ala Leu Gln
65 70 75 80
Thr Thr Asn Leu Pro Leu Met Val Met Ser Ser Leu Leu Leu Ile Ile
85 90 95
Ile Leu Ala Leu Ser Leu Ala Asn Thr Ala Ala Ile Gln Ala Ile Leu
100 105 110
Tyr Asn Arg Ile Gly Asp Ile Gly Phe Ile Leu Ala Leu Ala Trp Phe
115 120 125
Ile Leu His Ser Asn Ser Trp Asp Pro Gln Gln Met Ala Leu Leu Asn
130 135 140
Ala Asn Pro Ser Leu Thr Pro Leu Leu Gly Leu Leu Leu Ala Ala Ala
145 150 155 160
Gly Lys Ser Ala Gln Leu Gly Leu His Pro Trp Leu Pro Ser Ala Met
165 170 175
Glu Gly Pro Thr Pro Val Ser Ala Leu Leu His Ser Ser Thr Met Val
180 185 190
Val Ala Gly Ile Phe Leu Leu Ile Arg Phe His Pro Leu Ala Glu Asn
195 200 205
Ser Pro Leu Ile Gln Thr Leu Thr Leu Cys Leu Gly Ala Ile Thr Thr
210 215 220
Leu Phe Ala Ala Val Cys Ala Leu Thr Gln Asn Asp Ile Lys Lys Ile
225 230 235 240
Val Ala Phe Ser Thr Ser Ser Gln Leu Gly Leu Met Met Val Thr Ile
245 250 255
Gly Ile Asn Gln Pro His Leu Ala Phe Leu His Ile Cys Thr His Ala
260 265 270
Phe Phe Lys Ala Met Leu Phe Met Cys Ser Gly Ser Ile Ile His Asn
275 280 285
Leu Asn Asn Glu Gln Asp Ile Arg Lys Met Gly Gly Leu Leu Lys Thr
290 295 300
Met Pro Leu Thr Ser Thr Ser Leu Thr Ile Gly Ser Leu Ala Leu Ala
305 310 315 320
Gly Met Pro Phe Leu Thr Gly Phe Tyr Ser Lys Asp His Ile Ile Glu
325 330 335
Thr Ala Asn Met Ser Tyr Thr Asn Ala Trp Ala Leu Ser Ile Thr Leu
340 345 350
Ile Ala Thr Ser Leu Thr Ser Ala Tyr Ser Thr Arg Met Ile Leu Leu
355 360 365
Thr Leu Thr Gly Gln Pro Arg Phe Pro Thr Leu Thr Asn Ile Asn Glu
370 375 380
Asn Asn Pro Thr Leu Leu Asn Pro Ile Lys Arg Leu Ala Ala Gly Ser
385 390 395 400
Leu Phe Ala Gly Phe Leu Ile Thr Asn Asn Ile Ser Pro Ala Ser Pro
405 410 415
Phe Gln Thr Thr Ile Pro Leu Tyr Leu Lys Leu Thr Ala Leu Ala Val
420 425 430
Thr Phe Leu Gly Leu Leu Thr Ala Leu Asp Leu Asn Tyr Leu Thr Asn
435 440 445
Lys Leu Lys Met Lys Ser Pro Leu Cys Thr Phe Tyr Phe Ser Asn Met
450 455 460
Leu Gly Phe Tyr Pro Ser Ile Thr His Arg Thr Ile Pro Tyr Leu Gly
465 470 475 480
Leu Leu Thr Ser Gln Asn Leu Pro Leu Leu Leu Leu Asp Leu Thr Trp
485 490 495
Leu Glu Lys Leu Leu Pro Lys Thr Ile Ser Gln His Gln Ile Ser Thr
500 505 510
Ser Ile Ile Thr Ser Thr Gln Lys Gly Met Ile Lys Leu Tyr Phe Leu
515 520 525
Ser Phe Phe Phe Pro Leu Ile Leu Thr Leu Leu Leu Ile Thr Xaa
530 535 540
<210> 49
<211> 43
<212> PRT
<213> Artificial
<220>
<223> 推定的蛋白序列
<220>
<221> misc_feature
<222> (43)..(43)
<223> Xaa可以是任何天然存在的氨基酸
<400> 49
Met Pro Gln Leu Asn Thr Thr Val Trp Pro Thr Met Ile Thr Pro Met
1 5 10 15
Leu Leu Thr Leu Phe Leu Ile Thr Gln Leu Lys Met Leu Asn Thr Asn
20 25 30
Tyr His Leu Pro Pro Ser Pro Leu Ala Ala Xaa
35 40
<210> 50
<211> 951
<212> RNA
<213> 人
<400> 50
augaacgaaa aucuguucgc uucauucauu gcccccacaa uccuaggccu acccgccgca 60
guacugauca uucuauuucc cccucuauug auccccaccu ccaaauaucu caucaacaac 120
cgacuaauca ccacccaaca augacuaauc aaacuaaccu caaaacaaau gauaaccaua 180
cacaacacua aaggacgaac cugaucucuu auacuaguau ccuuaaucau uuuuauugcc 240
acaacuaacc uccucggacu ccugccucac ucauuuacac caaccaccca acuaucuaua 300
aaccuagcca uggccauccc cuuaugagcg ggcacaguga uuauaggcuu ucgcucuaag 360
auuaaaaaug cccuagccca cuucuuacca caaggcacac cuacaccccu uauccccaua 420
cuaguuauua ucgaaaccau cagccuacuc auucaaccaa uagcccuggc cguacgccua 480
accgcuaaca uuacugcagg ccaccuacuc augcaccuaa uuggaagcgc cacccuagca 540
auaucaacca uuaaccuucc cucuacacuu aucaucuuca caauucuaau ucuacugacu 600
auccuagaaa ucgcugucac uuuccuagga cuucuaacag cccuagaccu caacuaccua 660
accaacaaac uuaaaauaaa auccccacua ugcacauuuu auuucuccaa cauacucgga 720
uucuacccua gcaucacaca ccgcacaauc cccuaucuag gccuucuuac gagccaaaac 780
cugccccuac uccuccuaga ccuaaccuga cuagaaaagc uauuaccuaa aacaauuuca 840
cagcaccaaa ucuccaccuc caucaucacc ucaacccaaa aaggcauaau uaaacuuuac 900
uuccucucuu ucuucuuccc acucauccua acccuacucc uaaucacaua a 951
<210> 51
<211> 951
<212> DNA
<213> Artificial
<220>
<223> cDNA
<400> 51
atgaacgaaa atctgttcgc ttcattcatt gcccccacaa tcctaggcct acccgccgca 60
gtactgatca ttctatttcc ccctctattg atccccacct ccaaatatct catcaacaac 120
cgactaatca ccacccaaca atgactaatc aaactaacct caaaacaaat gataaccata 180
cacaacacta aaggacgaac ctgatctctt atactagtat ccttaatcat ttttattgcc 240
acaactaacc tcctcggact cctgcctcac tcatttacac caaccaccca actatctata 300
aacctagcca tggccatccc cttatgagcg ggcacagtga ttataggctt tcgctctaag 360
attaaaaatg ccctagccca cttcttacca caaggcacac ctacacccct tatccccata 420
ctagttatta tcgaaaccat cagcctactc attcaaccaa tagccctggc cgtacgccta 480
accgctaaca ttactgcagg ccacctactc atgcacctaa ttggaagcgc caccctagca 540
atatcaacca ttaaccttcc ctctacactt atcatcttca caattctaat tctactgact 600
atcctagaaa tcgctgtcac tttcctagga cttctaacag ccctagacct caactaccta 660
accaacaaac ttaaaataaa atccccacta tgcacatttt atttctccaa catactcgga 720
ttctacccta gcatcacaca ccgcacaatc ccctatctag gccttcttac gagccaaaac 780
ctgcccctac tcctcctaga cctaacctga ctagaaaagc tattacctaa aacaatttca 840
cagcaccaaa tctccacctc catcatcacc tcaacccaaa aaggcataat taaactttac 900
ttcctctctt tcttcttccc actcatccta accctactcc taatcacata a 951
<210> 52
<211> 317
<212> PRT
<213> Artificial
<220>
<223> 推定的蛋白序列
<220>
<221> misc_feature
<222> (317)..(317)
<223> Xaa可以是任何天然存在的氨基酸
<400> 52
Met Asn Glu Asn Leu Phe Ala Ser Phe Ile Ala Pro Thr Ile Leu Gly
1 5 10 15
Leu Pro Ala Ala Val Leu Ile Ile Leu Phe Pro Pro Leu Leu Ile Pro
20 25 30
Thr Ser Lys Tyr Leu Ile Asn Asn Arg Leu Ile Thr Thr Gln Gln Trp
35 40 45
Leu Ile Lys Leu Thr Ser Lys Gln Met Met Thr Met His Asn Thr Lys
50 55 60
Gly Arg Thr Trp Ser Leu Met Leu Val Ser Leu Ile Ile Phe Ile Ala
65 70 75 80
Thr Thr Asn Leu Leu Gly Leu Leu Pro His Ser Phe Thr Pro Thr Thr
85 90 95
Gln Leu Ser Met Asn Leu Ala Met Ala Ile Pro Leu Trp Ala Gly Thr
100 105 110
Val Ile Met Gly Phe Arg Ser Lys Ile Lys Asn Ala Leu Ala His Phe
115 120 125
Leu Pro Gln Gly Thr Pro Thr Pro Leu Ile Pro Met Leu Val Ile Ile
130 135 140
Glu Thr Ile Ser Leu Leu Ile Gln Pro Met Ala Leu Ala Val Arg Leu
145 150 155 160
Thr Ala Asn Ile Thr Ala Gly His Leu Leu Met His Leu Ile Gly Ser
165 170 175
Ala Thr Leu Ala Met Ser Thr Ile Asn Leu Pro Ser Thr Leu Ile Ile
180 185 190
Phe Thr Ile Leu Ile Leu Leu Thr Ile Leu Glu Ile Ala Val Thr Phe
195 200 205
Leu Gly Leu Leu Thr Ala Leu Asp Leu Asn Tyr Leu Thr Asn Lys Leu
210 215 220
Lys Met Lys Ser Pro Leu Cys Thr Phe Tyr Phe Ser Asn Met Leu Gly
225 230 235 240
Phe Tyr Pro Ser Ile Thr His Arg Thr Ile Pro Tyr Leu Gly Leu Leu
245 250 255
Thr Ser Gln Asn Leu Pro Leu Leu Leu Leu Asp Leu Thr Trp Leu Glu
260 265 270
Lys Leu Leu Pro Lys Thr Ile Ser Gln His Gln Ile Ser Thr Ser Ile
275 280 285
Ile Thr Ser Thr Gln Lys Gly Met Ile Lys Leu Tyr Phe Leu Ser Phe
290 295 300
Phe Phe Pro Leu Ile Leu Thr Leu Leu Leu Ile Thr Xaa
305 310 315

Claims (16)

1.一种与癌症相关的分离的线粒体融合转录物,其中所述转录物包括在SEQ ID NO:19中所阐述的核酸序列。
2.根据权利要求1所述的分离的线粒体融合转录物,其中,所述癌症为前列腺癌、睾丸癌、卵巢癌、乳腺癌、结肠直肠癌、肺癌、黑色素瘤皮肤癌或者它们的组合。
3.一种线粒体融合蛋白,对应于权利要求1或2所述的融合转录物或者具有在SEQ IDNO:35中所阐述的氨基酸序列。
4.一种编码权利要求1或2所述的融合转录物的分离的线粒体DNA(mtDNA)分子。
5.根据权利要求4所述的分离的mtDNA,其中所述mtDNA分子包括在SEQ ID NO:3中所阐述的核酸序列。
6.一种杂交探针,包括与根据权利要求1或2所述的线粒体融合转录物或者权利要求4或5所述的mtDNA中的至少一部分互补的核酸序列,其中所述部分包括剪接的基因的连接点。
7.一种用于检测与癌症相关的至少一种线粒体融合转录物存在的组合物,所述组合物包括具有与根据权利要求1或2所述的线粒体融合转录物中的至少一部分互补的核酸序列的杂交探针,其中所述部分包括剪接的基因的连接点。
8.一种用于检测与癌症相关的至少一种异常mtDNA存在的组合物,所述组合物包括具有与根据权利要求4所述的mtDNA中的至少一部分互补的核酸序列的杂交探针,其中所述部分包括剪接的基因的连接点。
9.根据权利要求7所述的组合物,其中,所述癌症为前列腺癌、睾丸癌、卵巢癌、乳腺癌、或结肠直肠癌中的一种或多种。
10.根据权利要求8所述的组合物,其中,所述癌症为前列腺癌、睾丸癌、卵巢癌、乳腺癌、或结肠直肠癌中的一种或多种。
11.根据权利要求9或10所述的组合物,其中进行所述检测:
a)使用至少一种所述探针来进行杂交反应,以允许至少一种所述探针杂交至互补的线粒体融合转录物或mtDNA;
b)通过对杂交至至少一种所述探针的所述转录物或mtDNA的量进行定量,来对所述样品中的所述至少一种线粒体融合转录物或mtDNA的量进行定量;以及
c)将所述样品中的所述线粒体融合转录物或mtDNA的量与至少一种已知参照值进行比较。
12.根据权利要求11所述的组合物,其中所述检测使用诊断成像技术来进行。
13.根据权利要求12所述的组合物,其中所述诊断成像技术包括高通量微阵列分析。
14.根据权利要求13所述的组合物,其中所述检测使用分支DNA技术来进行。
15.根据权利要求14所述的组合物,其中所述检测使用PCR来进行。
16.一种用于进行测定以检测哺乳动物中存在癌症的试剂盒,所述试剂盒包含与权利要求1或2所述的融合转录物或者根据权利要求4或5所述的mtDNA中的至少一部分互补的至少一种杂交探针,其中所述部分包括剪接的基因的连接点。
CN201710183734.1A 2008-03-28 2009-03-27 异常线粒体dna、相关的融合转录物及其杂交探针 Active CN107011428B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US4061608P 2008-03-28 2008-03-28
US61/040,616 2008-03-28
CN200980114773.XA CN102016039B (zh) 2008-03-28 2009-03-27 异常线粒体dna、相关的融合转录物及其杂交探针

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN200980114773.XA Division CN102016039B (zh) 2008-03-28 2009-03-27 异常线粒体dna、相关的融合转录物及其杂交探针

Publications (2)

Publication Number Publication Date
CN107011428A true CN107011428A (zh) 2017-08-04
CN107011428B CN107011428B (zh) 2022-02-25

Family

ID=41112880

Family Applications (3)

Application Number Title Priority Date Filing Date
CN200980114773.XA Expired - Fee Related CN102016039B (zh) 2008-03-28 2009-03-27 异常线粒体dna、相关的融合转录物及其杂交探针
CN201710183734.1A Active CN107011428B (zh) 2008-03-28 2009-03-27 异常线粒体dna、相关的融合转录物及其杂交探针
CN201080014122.6A Expired - Fee Related CN102388140B (zh) 2008-03-28 2010-03-29 异常线粒体dna、相关的融合转录本和翻译产物及其杂交探针

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN200980114773.XA Expired - Fee Related CN102016039B (zh) 2008-03-28 2009-03-27 异常线粒体dna、相关的融合转录物及其杂交探针

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201080014122.6A Expired - Fee Related CN102388140B (zh) 2008-03-28 2010-03-29 异常线粒体dna、相关的融合转录本和翻译产物及其杂交探针

Country Status (10)

Country Link
US (4) US20110172113A1 (zh)
EP (1) EP2274426B1 (zh)
JP (1) JP5938690B2 (zh)
KR (2) KR101819852B1 (zh)
CN (3) CN102016039B (zh)
AU (1) AU2009227935B2 (zh)
CA (2) CA3044262C (zh)
NZ (2) NZ602175A (zh)
SG (3) SG192453A1 (zh)
WO (1) WO2009117811A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117384269A (zh) * 2023-09-21 2024-01-12 南方医科大学南方医院 短肽mfrlp及其在制备动脉重塑相关疾病药物中的应用

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102016039B (zh) * 2008-03-28 2017-06-09 Mdna生命科学有限公司 异常线粒体dna、相关的融合转录物及其杂交探针
RU2011137486A (ru) 2009-03-27 2013-05-10 Митомикс Инк. Аберрантная митохондриальная днк, ассоциированные с ней слитые транскрипты, продукты трансляции и гибрадизационные зонды
WO2011106892A1 (en) * 2010-03-01 2011-09-09 Mitomics Inc. Uv associated mtdna fusion transcripts and methods and uses thereof
US9850296B2 (en) 2010-08-10 2017-12-26 Ecole Polytechnique Federale De Lausanne (Epfl) Erythrocyte-binding therapeutics
AU2011289579B2 (en) 2010-08-10 2016-11-17 Ecole Polytechnique Federale De Lausanne Erythrocyte-binding therapeutics
US9517257B2 (en) 2010-08-10 2016-12-13 Ecole Polytechnique Federale De Lausanne (Epfl) Erythrocyte-binding therapeutics
SG10202010936RA (en) 2014-02-21 2020-12-30 Ecole Polytecnique Fed De Lausanne Epfl Epfl Tto Glycotargeting therapeutics
US10953101B2 (en) 2014-02-21 2021-03-23 École Polytechnique Fédérale De Lausanne (Epfl) Glycotargeting therapeutics
US10046056B2 (en) 2014-02-21 2018-08-14 École Polytechnique Fédérale De Lausanne (Epfl) Glycotargeting therapeutics
US10946079B2 (en) 2014-02-21 2021-03-16 Ecole Polytechnique Federale De Lausanne Glycotargeting therapeutics
EP3475448B1 (en) * 2016-06-22 2022-03-30 Degen Zhuo Method and kit for detecting fusion transcripts
WO2018144782A1 (en) * 2017-02-01 2018-08-09 The Translational Genomics Research Institute Methods of detecting somatic and germline variants in impure tumors
EP3638296A1 (en) 2017-06-16 2020-04-22 The University Of Chicago Compositions and methods for inducing immune tolerance
WO2019191079A1 (en) * 2018-03-26 2019-10-03 The University Of Chicago Methods and compositions for targeting liver and lymph node sinusoidal endothelial cell c-type lectin (lsectin)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2380194A (en) * 2001-10-01 2003-04-02 Roger Michael Marchbanks Mitochondrial mutation associated with schizophrenia
US20050026167A1 (en) * 2001-06-11 2005-02-03 Mark Birch-Machin Complete mitochondrial genome sequences as a diagnostic tool for the health sciences
CN1746314A (zh) * 2004-09-09 2006-03-15 霍夫曼-拉罗奇有限公司 添加焦磷酸酶的实时pcr
WO2006111029A1 (en) * 2005-04-18 2006-10-26 Genesis Genomics Inc. Mitochondrial mutations and rearrangements as a diagnostic tool for the detection of sun exposure, prostate cancer and other cancers

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL154598B (nl) * 1970-11-10 1977-09-15 Organon Nv Werkwijze voor het aantonen en bepalen van laagmoleculire verbindingen en van eiwitten die deze verbindingen specifiek kunnen binden, alsmede testverpakking.
US3817837A (en) * 1971-05-14 1974-06-18 Syva Corp Enzyme amplification assay
US3939350A (en) * 1974-04-29 1976-02-17 Board Of Trustees Of The Leland Stanford Junior University Fluorescent immunoassay employing total reflection for activation
US3996345A (en) * 1974-08-12 1976-12-07 Syva Company Fluorescence quenching with immunological pairs in immunoassays
US4277437A (en) * 1978-04-05 1981-07-07 Syva Company Kit for carrying out chemically induced fluorescence immunoassay
US4275149A (en) * 1978-11-24 1981-06-23 Syva Company Macromolecular environment control in specific receptor assays
US4366241A (en) * 1980-08-07 1982-12-28 Syva Company Concentrating zone method in heterogeneous immunoassays
US5807522A (en) * 1994-06-17 1998-09-15 The Board Of Trustees Of The Leland Stanford Junior University Methods for fabricating microarrays of biological samples
US6605433B1 (en) * 1998-08-20 2003-08-12 The Johns Hopkins University Mitochondrial dosimeter
US6203990B1 (en) * 1998-11-06 2001-03-20 Mitokor Method and system for pattern analysis, such as for analyzing oligonucleotide primer extension assay products
US6933120B2 (en) * 2000-06-20 2005-08-23 Michael D. Seidman Method of determining biological/molecular age
US20030162174A1 (en) * 2001-06-11 2003-08-28 Sutherland John W. Detecting nucleic acid deletion sequences
JP2005506057A (ja) * 2001-06-11 2005-03-03 1304854 オンタリオ・リミテッド 健康科学のための診断ツールとしての全ミトコンドリアゲノム配列
US20070134678A1 (en) * 2005-12-12 2007-06-14 Rees Dianne M Comparative genome hybridization of organelle genomes
AU2007359381B2 (en) 2007-09-26 2015-06-18 Mitomics Inc. 3.4 kb mitochondrial DNA deletion for use in the detection of cancer
CN102016039B (zh) 2008-03-28 2017-06-09 Mdna生命科学有限公司 异常线粒体dna、相关的融合转录物及其杂交探针
RU2011137486A (ru) 2009-03-27 2013-05-10 Митомикс Инк. Аберрантная митохондриальная днк, ассоциированные с ней слитые транскрипты, продукты трансляции и гибрадизационные зонды
WO2011106892A1 (en) * 2010-03-01 2011-09-09 Mitomics Inc. Uv associated mtdna fusion transcripts and methods and uses thereof

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050026167A1 (en) * 2001-06-11 2005-02-03 Mark Birch-Machin Complete mitochondrial genome sequences as a diagnostic tool for the health sciences
GB2380194A (en) * 2001-10-01 2003-04-02 Roger Michael Marchbanks Mitochondrial mutation associated with schizophrenia
CN1746314A (zh) * 2004-09-09 2006-03-15 霍夫曼-拉罗奇有限公司 添加焦磷酸酶的实时pcr
WO2006111029A1 (en) * 2005-04-18 2006-10-26 Genesis Genomics Inc. Mitochondrial mutations and rearrangements as a diagnostic tool for the detection of sun exposure, prostate cancer and other cancers

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
WEIZHU,ZHU等: "Large-scale mitochondrial DNA deletion mutations and nuclear genome instability in human breast cancer", 《CANCER DETECTION AND PREVENTION》 *
龚渭华: "线粒体DNA在癌症中的意义", 《国外医学情报》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117384269A (zh) * 2023-09-21 2024-01-12 南方医科大学南方医院 短肽mfrlp及其在制备动脉重塑相关疾病药物中的应用

Also Published As

Publication number Publication date
KR101693387B1 (ko) 2017-01-05
AU2009227935A1 (en) 2009-10-01
EP2274426B1 (en) 2016-11-16
CN102388140A (zh) 2012-03-21
SG192453A1 (en) 2013-08-30
CN102388140B (zh) 2015-07-08
CN102016039A (zh) 2011-04-13
KR20110004860A (ko) 2011-01-14
US20170152567A1 (en) 2017-06-01
KR20170004033A (ko) 2017-01-10
CN102016039B (zh) 2017-06-09
US20110172113A1 (en) 2011-07-14
CA3044262C (en) 2023-02-28
SG174514A1 (en) 2011-10-28
US20190382846A1 (en) 2019-12-19
CA3044262A1 (en) 2009-10-01
US20130059299A1 (en) 2013-03-07
CA2719718C (en) 2019-07-02
KR101819852B1 (ko) 2018-02-28
AU2009227935B2 (en) 2015-07-09
EP2274426A1 (en) 2011-01-19
US8715960B2 (en) 2014-05-06
CA2719718A1 (en) 2009-10-01
SG10201400985RA (en) 2014-05-29
CN107011428B (zh) 2022-02-25
WO2009117811A1 (en) 2009-10-01
EP2274426A4 (en) 2011-11-16
US10266899B2 (en) 2019-04-23
NZ602175A (en) 2014-03-28
JP2011515091A (ja) 2011-05-19
JP5938690B2 (ja) 2016-06-22
NZ588658A (en) 2012-10-26

Similar Documents

Publication Publication Date Title
CN107011428A (zh) 异常线粒体dna、相关的融合转录物及其杂交探针
KR102023584B1 (ko) 위장관췌장 신경내분비 신생물 (GEP-NENs)의 예측 방법
CN109423515B (zh) 一组用于肝癌检测的基因标志物及其应用
CN110129425A (zh) 脓毒症生物标志物及其应用
CN110564850B (zh) 一种ewsr1-tfeb融合基因及其检测引物和应用
CN104178487B (zh) Atm基因突变体及其应用
CN112391466A (zh) 用于检测乳腺癌的甲基化生物标记物或其组合和应用
KR101720555B1 (ko) 이상 미토콘드리아 디엔에이, 관련된 융합 전사물 및 번역 산물 및 이에 대한 하이브리드화 탐침
KR101064561B1 (ko) 폐선암 수술 후 초기 재발 예측용 바이오마커
CN106460047B (zh) 用于鉴定癌前结肠直肠息肉和结肠直肠癌的方法及试剂盒
US20080181894A1 (en) Identification of Human Gene Sequences of Cancer Antigens Expressed in Metastatic Carcinoma Involved in Metastasis Formation, and Their Use in Cancer Diagnosis, Prognosis and Therapy
CN106520970B (zh) 用于诊断脑卒中的标志物
CN107287326B (zh) 一种Xp11.2的新易位伴侣FUBP1及其检测引物和应用
CN110205381A (zh) 用于阿尔茨海默症检测的血细胞转录基因标志物及其应用
JP2006166789A (ja) 癌の新規診断方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1244815

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant