CN1268180A - 广谱δ-内毒素 - Google Patents

广谱δ-内毒素 Download PDF

Info

Publication number
CN1268180A
CN1268180A CN97181395A CN97181395A CN1268180A CN 1268180 A CN1268180 A CN 1268180A CN 97181395 A CN97181395 A CN 97181395A CN 97181395 A CN97181395 A CN 97181395A CN 1268180 A CN1268180 A CN 1268180A
Authority
CN
China
Prior art keywords
seq
cell
nrrl
sequence
arbitrary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN97181395A
Other languages
English (en)
Other versions
CN1210402C (zh
Inventor
T·马尔瓦
A·J·吉尔默
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Monsanto Technology LLC
Original Assignee
Ecogen Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US08/754,490 external-priority patent/US6017534A/en
Application filed by Ecogen Inc filed Critical Ecogen Inc
Publication of CN1268180A publication Critical patent/CN1268180A/zh
Application granted granted Critical
Publication of CN1210402C publication Critical patent/CN1210402C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8279Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
    • C12N15/8286Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance for insect resistance
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/32Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bacillus (G)
    • C07K14/325Bacillus thuringiensis crystal protein (delta-endotoxin)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S435/00Chemistry: molecular biology and microbiology
    • Y10S435/975Kit
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S977/00Nanotechnology
    • Y10S977/902Specified use of nanostructure
    • Y10S977/904Specified use of nanostructure for medical, immunological, body treatment, or diagnosis
    • Y10S977/914Protein engineering
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S977/00Nanotechnology
    • Y10S977/902Specified use of nanostructure
    • Y10S977/904Specified use of nanostructure for medical, immunological, body treatment, or diagnosis
    • Y10S977/924Specified use of nanostructure for medical, immunological, body treatment, or diagnosis using nanostructure as support of dna analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S977/00Nanotechnology
    • Y10S977/902Specified use of nanostructure
    • Y10S977/904Specified use of nanostructure for medical, immunological, body treatment, or diagnosis
    • Y10S977/925Bioelectrical

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Zoology (AREA)
  • Pest Control & Pesticides (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Plant Pathology (AREA)
  • Insects & Arthropods (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Agricultural Chemicals And Associated Chemicals (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

公开的为新的人工修饰的苏云金芽孢杆菌嵌合晶体蛋白,其对鞘翅目、双翅目和鳞翅目昆虫具有增强的杀虫活性。也公开了编码这些新肽的核酸片段。制备和使用这些基因和蛋白的方法以及用于重组表达和合适宿主细胞的转化方法也被公开。表达该修饰内毒素的转化的宿主细胞和转基因植物也是本发明的内容。

Description

广谱δ-内毒素
1.0发明背景
本发明是1997年9月3日提交的美国专利申请系列No 08/922,505的部分延续,后者是1996年11月20日提交的美国专利申请系列No 08/754,490的部分延续,特异性在此插入其全部内容供参考。1.1发明领域
本发明提供新的编码对鞘翅目、双翅目和鳞翅目昆虫具有毒性的苏云金芽孢杆菌(Bacillus thuringiensis)晶体蛋白的基因,同时提供的是包括具有增强杀虫活性和增加杀虫特异性嵌合晶体蛋白的蛋白组合物。1.2相关领域描述1.2.1苏云金芽孢杆菌晶体蛋白
众所周知格兰氏阳性土壤细菌苏云金芽孢杆菌产生对多种鳞翅目、鞘翅目和双翅目幼虫具有毒性的蛋白伴胞晶体或δ-内毒素。苏云金芽孢杆菌在芽胞形成过程中产生对某些种昆虫具有特异性毒性的晶体蛋白。已显示苏云金芽孢杆菌的不同菌株产生杀虫晶体蛋白,并且由于其对特定目标昆虫的毒性而对植物和其它非目标生物没有毒性,包括产生具有杀虫活性蛋白的苏云金芽孢杆菌菌株的组合物已在商业上用作环境可接受的杀虫剂。
自然产生的苏云金芽孢杆菌分离物的商业制剂已长期用于农业害虫的生物控制。在商业制备中,浓缩和制备从发酵过程中获得的芽胞和晶体用于根据常规的农业实践进行施用。1.2.2晶体蛋白的命名
Hfte等(1989)的综述描述了有关鉴定出的对抵抗鳞翅目昆虫,即毛毛虫类昆虫具有活性的大多数杀虫性苏云金芽孢杆菌菌株领域的一般状态。该论文也描述了对双翅目昆虫(即苍蝇和蚊子)和鞘翅目昆虫(即,甲虫)具有杀虫活性的苏云金芽孢杆菌菌株。已从数种苏云金芽孢杆菌菌株中克隆了许多编码晶体蛋白的基因。Hfte等(1989)讨论了在1990年之前在苏云金芽孢杆菌中鉴定出的基因和蛋白,并且提出了已常规应用于苏云金芽孢杆菌基因和蛋白的命名和分类方案。cry1基因编码鳞翅目-毒性的Cry 1蛋白。cry 2基因编码同时对鳞翅目和双翅目具有毒性的Cry 2蛋白。cry 3基因编码鞘翅目-毒性的Cry 3蛋白,而cry 4基因编码双翅目-毒性的Cry 4蛋白等。
最近提出一种新的命名方法,其根据氨基酸序列同源性而不是昆虫目标的特异性系统地对Cry蛋白进行分类。该分类方案总结于表1中。
                            表1
            修订的苏云金芽孢杆菌δ-内毒素命名A新                            旧                       GenBank许可号Cry1Aa                        CryIA(a)                 M11250Cry1Ab                        CryIA(b)                 M13898Cry1Ac                        CryIA(c)                 M11068Cry1Ad                        CryIA(d)                 M73250Cry1Ae                        CryIA(e)                 M65252Cry1Ba                        CryIB                    X06711Cry1Bb                        ET5                      L32020Cry1Bc                        PEG5                     Z46442Cry1Bd                        CryE1                    U70726Cry1Ca                        CryIC                    X07518Cry1Cb                        CryIC(b)                 M97880新                         旧                       GenBank许可号Cry1Da                     CryID                    X54160Cry1Db                     PrtB                     Z22511Cry1Ea                     CryIE                    X53985Cry1Eb                     CryIE(b)                 M73253Cry1Fa                     CryIF                    M63897Cry1Fb                     PrtD                     Z22512Cry1Ga                     PrtA                     Z22510Cry1Gb                     CryH2                    U70725Cry1Ha                     PrtC                     Z22513Cry1Hb                                              U35780Cry1Ia                     CryV                     X62821Cry1Ib                     CryV                     U07642Cry1Ja                     ET4                      L32019Cry1Jb                     ET1                      U31527Cry1K                                               U28801Cry2Aa                     CryIIA                   M31738Cry2Ab                     CryIIB                   M23724Cry2Ac                     CryIIC                   X57252Cry3A                      CryIIIA                  M22472Cry3Ba                     CryIIIB                  X17123Cry3Bb                     CryIIIB2                 M89794Cry3C                      CryIIID                  X59797Cry4A                      CryIVA                   Y00423Cry4B                      CryIVB                   X07423Cry5Aa                     CryVA(a)                 L07025Cry5Ab                     CryVA(b)                 L07026Cry5B                                               U19725Cry6A                      CryVIA                   L07022Cry6B                      CryVIB                   L07024Cry7Aa                     CryIIIC                  M64478新                        旧                        GenBank许可号Cry7Ab                    CryIIICb                  U04367Cry8A                     CryIIIE                   U04364Cry8B                     CryIIIG                   U04365Cry8C                     CryIIIF                   U04366Cry9A                     CryIG                     X58120Cry9B                     CryIX                     X75019Cry9C                     CryIH                     Z37527Cry10A                    CryIVC                    M12662Cry11A                    CryIVD                    M31737Cry11B                    Jeg80                     X86902Cry12A                    CryVB                     L07027Cry13A                    CryVC                     L07023Cry14A                    CryVD                     U13955Cry15A                    34kDa                     M76442Cry16A                    cbm71                     X94146Cry17A                    cbm71                     X99478Cry18A                    CryBP1                    X99049Cry19A                    Jeg65                     Y08920Cyt1Aa                    CytA                      X03182Cyt1Ab                    CytM                      X98793Cyt1B                                               U37196Cyt2A                     CytB                      Z14147Cyt2B                     CytB                      U52043
a节选自:http://epunix.biols.susx.ac.uk/Home/Neil_Crickmore/Bt/index.html1.2.3晶体蛋白毒性的模式
所有的δ-内毒素晶体通过摄食而对昆虫幼虫具有毒性。该晶体在昆虫中肠中的溶解释放前毒素形式的δ-内毒素,在大多数情况下其随后被中肠蛋白酶加工成活性的毒素。活化的毒素经受体蛋白识别并结合到昆虫中肠上皮的刷状缘上。从一些昆虫幼虫中已分离出数种推断性的晶体蛋白受体(Knight等,1995;Gill等,1995;Masson等,1995)。活性毒素结合后插入和聚集毒素分子以在中肠上皮内形成穿孔。该过程导致形成中肠上皮衬里的细胞渗透失衡、膨胀、裂解,并且最终幼虫死亡。1.2.4δ-内毒素的分子生物学
随着分子遗传技术的到来,已分离各种δ-内毒素基因并且测定其DNA序列。这些基因已用于构建一些已获准商业使用的遗传工程苏云金芽孢杆菌产品。最近的进展又见到新开发出的δ-内毒素转运系统,包括含有并表达遗传工程操作的δ-内毒素基因的植物。
Hfte和Whiteley在1989年已描述和总结过对多种苏云金芽孢杆菌菌株的许多δ-内毒素基因的克隆和测序。设计用于在大肠杆菌或苏云金芽孢杆菌中克隆与表达δ-内毒素基因的质粒穿梭载体由Gawron-Burke和Baum(1991)描述过。美国专利No.5,441,884公开了用于构建含有无苏云金芽孢杆菌外源DNA的δ-内毒素基因重组苏云金芽孢杆菌菌株的定点重组系统。
主要对抵抗鳞翅目害虫具有活性的Cry 1家族晶体蛋白是研究最为彻底的一类δ-内毒素。前毒素形式的Cry 1δ-内毒素由2个大致相同长度的片段所组成。羧基端或前-毒素片段没有毒性并且认为对于晶体形成是重要的(Arvidson等,1989)。前毒素的氨基端包括Cry 1分子活性的毒素片段并且通过最近所述的Cry 1 Aaδ-内毒素活性毒素片段的晶体学结构测定可进一步分为三个结构域(Grochulski等,1995)。结构域1占据该活性毒素的头三分之一并且对于通道的形成是必需的(Thompson等,1995)。结构域2和结构域3分别占据该活性毒性毒素的中部和后三分之一。依据被检测的昆虫和δ-内毒素,结构域2和3均涉及受体结合和昆虫的特异性(Thompson等,1995)。1.2.5嵌合晶体蛋白
近些年,研究者集中致力于构建杂合δ-内毒素,从而希望制备具有增强活性或改进特性的蛋白。过去十年中分子遗传学领域的进展促进了加工具有改进特性蛋白的逻辑和有条不紊的方法。定点和随机诱变方法、聚合酶链式反应(PCRTM)方法学的出现和开发用于产生基因融合和构建嵌合蛋白的重组方法促进对以下方法的分类,包括改变蛋白的氨基酸序列、将两个或更多个蛋白成分一起融合到一个重组蛋白中和改变编码商业目的蛋白的遗传序列。
不幸的是,对于结晶蛋白,这些技术仅仅以有限的方式得到利用。从众多已鉴定出天然蛋白部分中随机产生具有增强特性嵌合蛋白的可能性很少得到复杂性质的蛋白结构、折叠、寡聚化、活化和正确加工嵌合的前毒素成为活性的部分。仅仅通过对每种蛋白内部特性靶区域的细心筛选和随后的蛋白加工才可合成具有改进杀虫活性的毒素。
然而,文献中已报导过在该领域的一些成功。例如,在下面有关领域中报导了一些杂合δ-内毒素的构建:国际专利申请公开No.WO95/30753公开了用于在荧光假单胞菌(Pseudomonas  fluorescens)中制备的杂合苏云金假单胞菌δ-内毒素的构建,其中的Cry 1 F的非毒性前毒素片段已由美国专利5,128,130中公开的Cry 1 Ac/Cry 1 Ab的非毒性前毒素片段所代替。
美国专利5,128,130公开了用于在荧光假单胞菌中制备的杂合苏云金假单胞菌δ-内毒素的构建,其中的Cry 1 Ac的非毒性前毒素片段的部分已由Cry 1 Ab的相应非毒性前毒素片段所代替。美国专利5,055,294公开了在Cry 1 Ac(氨基酸残基1-466)和Cry 1 Ab(氨基酸残基466-1155)之间构建用于在荧光假单胞菌中制备的特异性杂合δ-内毒素。尽管前述的专利公开了在活性毒素片段内杂合毒素的构建,但没有列出有关该杂合毒素杀虫活性的特异性。国际专利申请公开No.WO95/30752公开了用于在荧光假单胞菌中制备的杂合苏云金假单胞菌δ-内毒素的构建,其中的Cry 1 C的非毒性前毒素片段已由Cry 1 Ab的非毒性前毒素片段所替代。前述的申请进一步公开了该杂合δ-内毒素抗甜菜夜蛾的活性高于母本活性毒素,Cry 1 C的活性。
国际专利申请公开No.WO95/06730公开了由偶联到结构域3上的结构域1和2和Cry 1 C非毒性前毒素片段所组成的杂合苏云金芽孢杆菌δ-内毒素的构建。对烟草天蛾(Manduca sexta)(对Cry 1 C和Cry 1 E敏感)、甜菜夜蛾(Spodoptera exigua)(对Cry 1 C敏感)和甘蓝夜蛾(Mamestra brassicae)(对Cry 1 C敏感)进行的昆虫生物测定显示该杂合Cry 1 E/Cry 1 C杂合毒素对抵抗烟草天蛾、甜菜夜蛾和烟草夜蛾是有活性的。该生物分析结果表示为EC50值(得到50%生长降低的毒素浓度)而不是LC50值(得到50%死亡率的毒素浓度)。尽管用于生物分析的δ-内毒素在苏云金芽孢杆菌中制备,但是仅仅使用人工产生的δ-内毒素的活性片段,而不使用由存在于商业苏云金芽孢杆菌制剂中的苏云金芽孢杆菌一般产生的天然产生的晶体。生物分析结果表明该杂合Cry 1 E/Cry 1 C晶体抗草地贪夜蛾(S.frugiperda)的LC50值较天然Cry 1 C低1.5到1.7倍(活性更高)。该文章也公开了在Cry 1 Ab(结构域1和2)和Cry 1 C(结构域3和非毒性前毒素片段)之间构建杂合的苏云金芽孢杆菌δ-内毒素,尽管没有得到有关该杂合毒素活性或使用的数据。
Lee等(1995)报导了在活性的毒素片段内部建Cry 1 Ac和Cry 1Aa之间的杂合苏云金芽孢杆菌δ-内毒素。将人工产生的该杂合毒素的活性片段用于在易感昆虫刷状缘膜囊泡(BBMV)中检测蛋白的相互作用。没有报导该杂合毒素的生物活性。
Honee等(1991)报导了Cry 1 C(结构域1)和Cry 1 Ab(结构域2和3)之间杂合δ-内毒素的构建和Cry 1 Ab(结构域1)和Cry1 C(结构域2和3)之间交互杂合体的构建。这些杂合体在抵抗易感昆虫活性中没有显示出明显的增加。此外,发现Cry 1 C(结构域1)/Cry1 Ab(结构域2和3)杂合毒素对蛋白酶降解是超敏的。Schnepf等(1991)的报导公开了Cry 1 Ac杂合毒素的构建,其中的结构域2的小部分由Cry 1 Aa的相应区域所代替,虽然没有观察到抵抗易感昆虫幼虫活性明显的增加。1.3现有技术的缺陷
在制备具有增强活性嵌合晶体蛋白中有限的成功通过挫败制备用于商业开发的重组加工晶体蛋白和扩展已知内毒素的毒性特征和宿主特异性的努力而对本领域产生负面影响。因此,现有技术中所缺少的是可靠的方法和包括重组加工晶体蛋白的组合物,其中的晶体蛋白具有增强的杀虫活性,广谱的宿主特异性(broad-host-range)并且适于在苏云金芽孢杆菌中商业制备。2.0发明概述
本发明通过提供具有增强的杀虫特性和广谱特异性的新的嵌合δ-内毒素而克服了现有技术中的这些或其它的局限性。
公开的为构建包括天然Cry 1 Ac和Cry 1 F晶体蛋白氨基酸序列的苏云金芽孢杆菌杂合δ-内毒素的构建。这些杂合蛋白(其中的全部或部分的Cry 1 Ac结构域2、全部或部分的Cry 1 Ac结构域3以及全部或部分的Cry 1 Ac前毒素片段由Cry 1 F的相应部分所代替)不仅具有母本δ-内毒素的杀虫特征,而且具有没有预期到和增强的广谱特异性的显著特性,该特性在从中加工嵌合蛋白的2个天然δ-内毒素中没有任何一个充分表现出来。
具体地,本发明公开并且要求保护包括融合到Cry 1 F晶体蛋白部分上的Cry 1 Ac晶体蛋白部分的遗传加工的杂合δ-内毒素。这些嵌合的内毒素对在此所述的害虫具有广谱特异性。
在进一步的实施方案中,本发明也公开并要求保护包括Cry 1 Ab、Cry 1 F和Cry 1 Ac部分的重组苏云金芽孢杆菌杂合内毒素,其中的全部或部分的Cry 1 Ab结构域2或全部或部分的Cry 1 Ab结构域3由Cry1 F的相应部分所代替并且全部或部分的Cry 1 Ab前毒素片段由Cry 1Ac的相应部分所代替。Cry 1 Ab和Cry 1 F之间杂合δ-内毒素的实例鉴定于SEQ ID NO:13和SEQ ID NO:14中。
本发明的一个方面显示了没有预料到的如下结果,即一些来源于Cry 1 Ac和Cry 1 F蛋白的杂合δ-内毒素不仅显示出母本δ-内毒素的杀虫特征,而且具有2个母本δ-内毒素中任何一个均没有充分显示出来的杀虫活性。
本发明的另一方面进一步显示了没有预料到的如下结果,即一些嵌合的Cry 1 Ab/Cry 1 F蛋白不仅维持了母本δ-内毒素的杀虫特征,而且显示出天然Cry 1 Ab或Cry 1 F内毒素中任何一个均没有显示出的杀虫活性。
本发明也包括维持对在苏云金芽孢杆菌中商业制备所必需特征的Cry 1 Ac/Cry 1 F和Cry 1 Ab/Cry 1 F杂合δ-内毒素。具体地,在SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ IDNO:26、SEQ ID NO:28、SEQ ID NO:30和SEQ ID NO:34中鉴定出的杂合δ-内毒素可在苏云金芽孢杆菌中有效地形成蛋白伴胞包涵物并且具有母本δ-内毒素溶解性、蛋白酶敏感性和杀虫活性的有利特征。
在进一步的实施方案中,本发明也公开并且要求保护包括Cry 1 Ac和Cry 1 C部分的重组苏云金芽孢杆菌杂合δ-内毒素,其中的全部或部分的Cry 1 Ac结构域3由Cry 1 C的相应部分所代替并且全部或部分的Cry 1 Ac前毒素片段由Cry 1 C的相应部分所代替。Cry 1 Ac和Cry1 C之间杂合δ-内毒素的实例鉴定于SEQ ID NO:29和SEQ IDNO:30中。
本发明的一个方面显示了没有预料到的如下结果,即虽然Cry 1 Ac和Cry 1 C均不具有草地贪夜蛾活性,但是由SEQ ID NO:29和SEQ IDNO:30所鉴定出的Cry 1 Ac/Cry 1 C杂合δ-内毒素具有显著的抗草地贪夜蛾的活性。此外,由SEQ ID NO:29和SEQ ID NO:30所鉴定出的Cry 1 Ac/Cry 1 C杂合δ-内毒素较Cry 1 C母本δ-内毒素具有显著更好的抗甜菜夜蛾的活性。
构建这些和其它杂合δ-内毒素的动力是产生具有增强杀虫活性、增加的宿主范围特异性和改进的制备特征的新的毒素。列于表8中的DNA序列定义了与本发明有关的杂合δ-内毒素的交换位点并且作为寡核苷酸引物,可在适当到高度严格条件下通过Southern或菌落杂交而用于鉴定同样或类似的杂合δ-内毒素。本领域熟练的研究人员将认识到在二种或更多种δ-内毒素之间选定的交换位点的重要性可用众多的体内或体外分子遗传技术加以完成。在二种或更多种δ-内毒素之间的交换区域中的微小变异可能产生类似的结果或者,如EG 11062和EG11063所显示,对所需特征产生负面影响。类似地,如EG 11063和EG11074所显示,在二种或更多种δ-内毒素之间的交换区域中的大的变异可能对所需特征没有影响,或者如EG 11060和EG 11063所显示,可能对所需特征产生负面影响。
关于增强的杀虫活性、增加的宿主范围和改进的制备特征的有利特征可通过其它这样的杂合δ-内毒素加以完成,包括但不限于cry 1、cry 2、cry 3、cry 4、cry 5、cry 6、cry 7、cry 8、cry 9、cry 10、cry 11、cry 12、cry 13、cry 14、cry 15类δ-内毒素基因和苏云金芽孢杆菌细胞裂解性cyt 1和cyt 2基因。这类苏云金芽孢杆菌杀虫剂蛋白的成员包括但不限于Cry 1 Aa、Cry 1 Ab、Cry 1 Ac、Cry 1Ad、Cry 1 Ae、Cry 1 Ba、Cry 1 Bb、Cry 1 Ca、Cry 1 Cb、Cry1 Da、Cry 1 Db、Cry 1 Ea、Cry 1 Eb、Cry 1 Fa、Cry 1 Fb、Cry1 Ga、Cry 1 Ha、Cry 2a、Cry 2b、Cry 1 Ja、Cry 1 Ka、Cry 11Aa、Cry 11 Ab、Cry 12 Aa、Cry 3 Ba、Cry 3 Bb、Cry 3 C、Cry4a、Cry 4 Ba、Cry 5a、Cry 5 Ab、Cry 6 Aa、Cry 6 Ba、Cry 7Aa、Cry 7 Ab、Cry 8 Aa、Cry 8 Ba、Cry 8 Ca、Cry 9 Aa、Cry9 Ba、Cry 9 Ca、Cry 10 Aa、Cry 11 Aa、Cry 12 Aa、Cry 13 Aa、Cry 14 Aa、Cry 15 Aa、Cyt 1 Aa和Cyt 2 Aa。有关的杂合δ-内毒素将由前述δ-内毒素中的其中一种毒素的氨基部分所组成,该部分包括融合到另一种前述δ-内毒素全部或部分结构域3上的全部或部分的结构域1或结构域2。该杂合δ-内毒素的无活性前毒素片段可由任何一种前述的可稳定该杂合δ-内毒素的δ-内毒素前毒素片段所组成,如EG 11087和EG 11091所显示(参见,如表5)。与本发明中所述的δ-内毒素具有类似特征的杂合δ-内毒素可通过在杂合δ-内毒素内部保守或“类似”的氨基酸替代而加以构建。这种替代将模仿该蛋白中任何位置天然氨基酸的生化和生物物理特性。认为类似的氨基酸包括,例如,但不限于:
Ala、Ser和Thr;
Asp和Glu;
Asn和Gln;
Lys和Arg;
Ile、Leu、Met和Val;和
Phe、Tyr和Trp。
本领域的技术人员将认识到赋予杂合δ-内毒素的增强的杀虫活性、增加的宿主范围和改进的制备特征可通过改变将杂合δ-内毒素中一个或更多个氨基酸位置的遗传密码从而使该位置或这些位置由任何其它的氨基酸所代替而得到进一步改进。这可通过任何种类确定的诱变技术,包括与本发明有关的那些方法针对该蛋白的某一或某些区域进行诱变而完成。这些技术包括定点诱变(Kunkel,1985;Kunkel等,1987)、DNA改组(Shuffling)(Stemmer,1994)和PCRTM重叠延伸(Horton等,1989)。由于位于或靠近蛋白表面的氨基酸很可能负责其与其它蛋白或非蛋白成分之间的相互作用,故它们可用作诱变的“目标”区域。该表面裸露的区域可能由,但不限于该蛋白活性毒素片段内的表面裸露的氨基酸残基所组成并且包括在结构域1内部分隔α-螺旋的δ-内毒素的中间-α-螺旋或中间-β-链“环”-区域和结构域2和结构域3内部的β-链。该步骤可有利地改变此蛋白的生化和生物物理特征或其作用方式,如第1部分中所总结的。这些特征包括但不限于:1)增强的晶体形成,2)增强的蛋白稳定性或降低的蛋白酶降解,3)增强的昆虫膜受体识别和结合,4)在昆虫中肠上皮中增强的寡聚化或通道形成,和5)由于上述任何一种或所有原因所致的增强的杀虫活性或杀虫特异性。
本发明提供了编码包括SEQ ID NO:10、SEQ ID NO:12、SEQID NO:14、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30或SEQ ID NO:34氨基酸序列的多肽的分离的核酸片段。优选该核酸片段编码具有抗草地贪夜蛾、甜菜夜蛾、烟芽夜蛾(Heliothisvirescens)、玉米穗夜蛾(Helicoverpa zea)或欧洲玉米螟(Ostrinianubilalis)杀虫活性的多肽。该核酸片段可分别从苏云金芽孢杆菌NRRLB-21579、NRRL B-21580、NRRL B-21581、NRRL B-21635、NRRL B-21636、NRRL B-21780或NRRL B-21781细胞中得到分离。
在优选的实施方案中,这些核酸片段与具有SEQ ID NO:9、SEQID NO:11、SEQ ID NO:13、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29或SEQ ID NO:33序列或其互补序列的核酸片段特异性杂交,并且在高度优选的实施方案中,这些核酸片段包括分别在SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ IDNO:25、SEQ ID NO:27、SEQ ID NO:29和SEQ ID NO:33中公开的核酸序列。
可将这样的核酸片段可操作地连接到启动子上以在宿主细胞中表达该核酸片段。在该实施方案中,可将此核酸片段包括进重组载体如质粒、粘粒、噬菌体、噬菌粒、病毒、杆状病毒、细菌人工染色体或酵母人工染色体中。质粒载体的实例包括载体pEG 1068、pEG 1077、pEG11092、pEG 11093、pEG 365、pEG 378和pEG 381。
本发明的进一步方面涉及这里所述的核酸片段在制备重组多肽组合物、产生用于制备转化宿主细胞的载体和产生昆虫抗性的转基因植物中的使用。
宿主细胞也代表本发明重要的方面。该宿主细胞一般包括上述一种或更多种的核酸片段。优选的宿主细胞包括细菌细胞如大肠杆菌、苏云金芽孢杆菌、枯草芽孢杆菌、巨大芽孢杆菌(B.megaterium)和假单胞菌细胞,其中的苏云金芽孢杆菌EG 11060、EG 11062、EG 11063、EG 11071、EG 11073、EG 11074、EG 11090、EG 11091、EG11092、EG 11735、EG 11751、EG 11768、NRRL B-21579、NRRL B-21580、NRRL B-21581、NRRL B-21635、NRRLB-21636、NRRL B-21780和NRRL B-21781细胞是特别优选的。优选的宿主细胞也可包括真核细胞,如植物和动物细胞。优选的植物细胞包括谷物、树木、蔬菜、水果、浆果、板栗、草、仙人掌、肉质和观赏植物的细胞,其中商业作物如玉米、水稻、烟草、土豆、番茄、亚麻、canola、向日葵、棉花、小麦、燕麦、大麦和黑麦是特别优选的。
在一个实施方案中,可将此宿主细胞包括进转基因植物或可用于制备转基因植物或产生多能植物细胞。或者,该宿主细胞可用于晶体蛋白的重组表达或包括一种或更多种这里公开的毒素的杀虫多肽制剂的制备。该组合物优选包括一种或更多种具有SEQ ID NO:10、SEQ IDNO:12、SEQ ID NO:14、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30或SEQ ID NO:34氨基酸序列的分离的多肽。这样的组合物在杀死昆虫细胞、制备杀虫制剂和制备植保喷剂中具有特别的使用。
本发明也提供了用于制备苏云金芽孢杆菌晶体蛋白的方法。该方法一般包括在有效产生苏云金芽孢杆菌晶体蛋白的条件下培养苏云金芽孢杆菌NRRL B-21579、NRRL B-21580、NRRL B-21581、NRRL B-21635、NRRL B-21636、NRRL B-21780、NRRLB-21781、EG 11768、EG 11090、EG 11063、EG 11074、EG11092、EG 11735或EG 11751细胞且然后从该细胞中获取所述的苏云金芽孢杆菌晶体蛋白。这些方法在重组制备这里公开的晶体蛋白中相当有用。
本发明也公开和要求保护杀死昆虫细胞的方法。该方法一般包括提供给昆虫细胞杀虫有效量的一种或更多种这里公开的杀虫组合物。该细胞可以为分离的细胞,或者作为选择,可包括进昆虫本身体内。一般地,该组合物将通过下面任一种方式提供给昆虫,包括直接喷洒昆虫,或者通过昆虫直接摄入该组合物,或者通过摄入已被此组合物覆盖的植物,或者通过摄入表达一种或更多种杀虫组合物的转基因植物的一部分。
本发明的进一步方面是与包括SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:26、SEQ ID NO:28、SEQID NO:30或SEQ ID NO:34氨基酸序列的多肽特异性结合的纯化抗体。可将该抗体可操作地附着到可检测的标记上,在免疫检测试剂盒中加以提供或者用于通过以下方法检测生物样品中杀虫多肽的方法中,其中的方法包括将怀疑含有所述杀虫多肽的生物样品在有效形成免疫复合物的条件下与该抗体接触并且然后检测形成的免疫复合物。
本发明另一个重要的方面涉及其基因组中掺入有转基因的转基因植物,其中的转基因编码包括SEQ ID NO:10、SEQ ID NO:12、SEQID NO:14、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30或SEQ ID NO:34氨基酸序列的多肽。优选地,该转基因植物将包括一种或更多种在SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29和SEQID NO:33中公开的核酸序列。该转基因植物的子代和种子及其后代或子代也是本发明的重要方面,这将在本文别处详细描述。2.1晶体蛋白转基因和转基因植物
在另一方面,本发明提供了制备表达编码本发明新的嵌合晶体蛋白核酸片段的转基因植物的方法。制备转基因植物的方法在本领域中是众所周知的。一般地,该方法包括用下面的DNA片段转化合适的宿主细胞,该DNA片段含有可操作地连接到编码苏云金芽孢杆菌Cry 1 Ac-1F或Cry 1 Ab-1F、Cry 1 Ac-1C或Cry 1 Ab-1 Ac-1F嵌合晶体蛋白编码区域上的启动子。该编码区一般可操作地连接到转录终止区域,而该启动子能够驱动编码区在细胞中的转录,并且因此提供细胞以体内产生该重组蛋白的能力。作为选择,当需要控制、调节或减少在特定的转基因细胞中表达的特定重组晶体蛋白的量时,本发明也提供用于晶体蛋白表达的反义mRNA。反义mRNA在细胞中作为控制或降低给定目的蛋白量的方法的使用在本领域中是众所周知的。
本发明的另一方面包括表达编码一种或更多种这里所公开新多肽组合物基因或基因片段的转基因植物。如这里所使用的,术语“转基因植物”意指具有掺入DNA序列的植物,该序列包括但不限于也许正常不存在的基因。正常不转录成RNA或翻译成蛋白(“表达”)的DNA序列、或者人们希望导入非转化植物中的任何其它基因或DNA序列,如可能正常存在于非转化植物中但人们希望遗传加工或具有改变表达的基因。植物中合成苏云金芽孢杆菌基因的构建与表达已详细描述于美国专利5,500,365和5,380,831(每个特异性地在此掺入供参考)中。
应该注意到有时本发明转基因植物的基因组经过稳定导入一种或更多种天然、人工修饰或进一步突变的cry 1 Ac-IF、cry 1 Ab-IF、cry1 Ac-1C、或cry 1 Ab-1 Ac-1F转基因后将会增大。在有些情况,多于一种转基因将被掺入到转化宿主植物细胞的基因组中。当将多于一种晶体蛋白编码DNA片段掺入到这样植物的基因组中时的情况便是实例。在有些情况中,在转化的转基因植物中掺入和稳定表达一种、二种、三种或甚至更多种苏云金芽孢杆菌晶体蛋白(或者是天然的或者是重组加工的)可能是必要的。
优选的基因,如可被导入的在SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:25、SEQ ID NO:27、SEQ IDNO:29和SEQ ID NO:33中公开的那些基因包括,例如,细菌来源的晶体蛋白编码DNA序列和特别是从芽孢杆菌获得的一种或更多种这种公开的那些基因。高度优选的核酸序列为那些从苏云金芽孢杆菌中获得的序列或被遗传加工以降低或增加在这样的转化宿主细胞中该晶体蛋白杀虫活性的那些序列中的任何序列。
用于转化植物细胞并且制备转基因细胞系的方法在本领域中是众所周知的,并且在此进行讨论。用于转化该细胞的载体、质粒、粘粒、酵母人工染色体(YACs)和核酸片段当然一般包括天然或合成产生的本发明操纵子、基因或基因的衍生序列并且特别是那些编码已公开晶体蛋白的基因。这些DNA构建体可进一步包括这些结构,如启动子、增强子、多接头或者甚至是按需要正负调节特定目的基因活性的基因序列。此DNA片段或基因可能编码将要在得到的重组细胞中表达并且/或者将赋予再生植物改进表型的天然或修饰的晶体蛋白。被优化用于在植物中表达的核酸序列已公开于国际专利申请公开No.WO93/07278(特异性在此掺入供参考)。
通过向该植物中掺入编码具有广泛昆虫特异性的Cry 1 Ac-1F和/或Cry 1 Ac-1C、和/或Cry 1 Ab-1F和/或Cry 1 Ab-1 Ac-1F晶体蛋白的转基因DNA片段,该转基因植物可能对增加单子叶或双子叶植物的杀虫抗性是理想的。特别优选的植物如谷物,包括但不限于玉米(corn)、小麦、黑麦、水稻、玉米(maize)和大麦;棉花;大豆及其它豆科植物;树木,包括但不限于观赏植物、灌木、果树、板栗;蔬菜、草皮和牧草、浆果、柑橘和其它商业目的的作物;如园艺作物和/或居室植物(houseplants)、肉汁植物、仙人掌及开花的种类。
在有关方面,本发明也包括由转化植物产生的种子、由该种子来源的后代和根据上述方法产生的最初转基因植物的后代产生的种子。此后代和种子将稳定地具有稳定掺入其基因组中的晶体蛋白转基因,并且该后代植物将以孟德尔方式遗传通过稳定转基因的导入而赋予的特征。其基因组中具有掺入的编码一种或更多种嵌合晶体蛋白或多肽转基因DNA片段的所有这些转基因植物均是本发明的方面。2.2晶体蛋白的筛选和免疫检测试剂盒
本发明涉及到用于筛选怀疑含有晶体蛋白多肽或晶体蛋白有关多肽的样品或产生这样多肽的细胞的方法和试剂盒。这些蛋白的实例包括在SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ IDNO:26、SEQ ID NO:28、SEQ ID NO:30和SEQ ID NO:34中公开的那些蛋白。所述的试剂盒可能含有本发明的核酸片段或抗体。该试剂盒可能含有用于检测样品和本发明核酸或抗体之间相互作用的试剂。该提供的试剂可能被放射、荧光或酶标记。该试剂盒可能含有能够与本发明核酸或抗体结合或相互作用的已知的放射性标记试剂。
该试剂盒的试剂可用附着到固体支持物上的液体溶液或干粉形式提供。优选地,当该试剂以液体溶液形式提供时,该液体溶液为水溶液。优选地,当该提供的试剂附着到固体支持物上时,该固体支持物可以为层析介质、多孔测试平板或显微镜载玻片。当提供的试剂为干粉时,可通过加入可能已提供的适当溶剂而重新调制此粉末。
在更进一步的实施方案中,本发明涉及免疫检测方法和有关的试剂盒。已经提出本发明的晶体蛋白或肽可以用于检测与其具有反应性的抗体,或者,根据本发明制备的抗体可用于检测晶体蛋白或含有晶体蛋白相关表位的肽。一般地,这些方法将包括首先获取怀疑含有该蛋白、肽或抗体的样品,在有效形成免疫复合物的条件下,可根据实情将该样品与本发明的抗体或肽接触,并且然后检测该免疫复合物的存在。
一般地,免疫复合物形成的检测在本领域中是十分熟知的并且可用众多的方法完成。例如,本发明涉及到应用ELISA、RIA、免疫印迹(如,点印迹)、间接免疫荧光技术等。一般地,免疫复合物的形成将通过使用标记,如放射标记或酶标签(如碱性磷酸酶、辣根过氧化物酶等)加以检测。当然,通过使用二级结合配体如本领域已知的二级抗体或生物素/亲合素配体结合组合,人们可能会发现其它的优势。
为了分析的目的,已提出实际上可以利用根据实际情况待测的怀疑包括晶体蛋白或肽或晶体蛋白有关的肽或抗体的任何样品。应该注意到这样的实施方案可能在筛选杂交瘤等的抗原或抗体样品滴定中具有应用。在有关的实施方案中,本发明涉及到可用于检测样品中晶体蛋白或有关的肽和/或抗体的存在。样品可以包括怀疑含有晶体蛋白或肽的细胞、细胞上清液、细胞悬液、细胞提取物、酶的馏份、蛋白提取物或其它无细胞组合物。一般来说,根据本发明的试剂盒将包括合适的晶体蛋白、肽或抗该蛋白或肽的抗体以及免疫测定试剂和用于容纳该抗体或抗原和试剂的方式。免疫测定试剂将一般包括与该抗体或抗原有关或与二级结合配体有关的标记。配体的实例可以包括抗一级抗体的二级抗体或抗原或者生物素或具有有关标记的亲合素(或链霉亲和素)。当然,如上所述,许多标记的实例在本领域中是已知的并且这些标记可与本发明结合使用。
容器将一般包括其中可放置抗体、抗原或检测试剂并且优选适当分装的小瓶。本发明试剂盒一般也将包括为了商业销售而在密闭条件下容纳该抗体、抗原和试剂容器的方式。这些容器可以包括其中放置所需小瓶的注射或吹制塑料容器。2.3 ELISA和免疫沉淀
ELISA可与本发明联合使用。在ELISA分析中,将掺入晶体蛋白抗原序列的蛋白或肽固定于选定的表面,优选是显示出蛋白亲和力的表面如聚苯乙烯微滴定板的小孔。在清洗以去除不完全吸附的物质后,以非特异性蛋白结合或包被分析平板小孔是必要,该非特异性蛋白已知在抗原上与测试抗血清如牛血清蛋白(BSA)、酪蛋白或奶粉溶液是无关的(neutral)。这样便封闭了固定表面上的非特异性吸附位点且因此减少由非特异性结合抗血清至该表面上所造成的背景。
结合抗原物质至小孔上以后,以非反应性物质包被以降低背景并且清洗以去除未结合的物质,以有利于免疫复合物(抗原/抗体)形成的方式将固定的表面与待测的抗血清或临床或生物学提取物接触。该条件优选包括以稀释剂如BSA、牛γ球蛋白(BGG)和磷酸缓冲盐(PBS)/Tween稀释该抗血清。这些加入的试剂也趋向于有助于降低非特异性背景。然后使分层的抗血清在优选约25℃到约27℃水平的温度孵育约2到4小时。孵育后,清洗该接触抗血清的表面从而去除非免疫复合的物质。优选的清洗方法包括以溶液如PBS/Tween或硼酸盐缓冲液清洗。
在测试样品与结合抗原之间形成特异性免疫复合物并且随后清洗后,可通过将此样品与对第一级抗体具有特异性的二级抗体接触而测定免疫复合物形成的频率且甚至是形成的量。为了提供检测手段,该二级抗体将优选与酶结合,当与适当的生色底物孵育时该酶将产生一定的颜色。因而,例如,人们希望在有利于免疫复合物形成的条件(如在含有PBS的溶液如PBS-Tween中于室温孵育2小时)下接触并孵育结合抗血清的表面与脲酶或过氧化物酶-交联的抗-人IgG一段时间。
与二级酶标抗体孵育并且随后清洗以去除未结合的物质后,通过在作为酶标的过氧化物酶存在下与生色底物如尿素和溴甲酚紫或2,2′-连氮-双-(3-乙基-苯噻唑啉)-6-磺酸(ABTS)和H2O2孵育加以定量。然后通过,如,用可见光分光光度计测定生色的程度而完成定量。
本发明的抗-晶体蛋白抗体对于通过免疫沉淀分离其它的晶体蛋白抗原特别有用。免疫沉淀包括从复合物的混合物中分离靶抗原成分,并且用于区分或分离微量的蛋白。对于膜蛋白的分离,必须将细胞溶解成去污剂微团。非离子盐是优选的,因为其它试剂如胆盐在酸性pH或在二价阳离子存在下沉淀。
在候选的实施方案中,本发明的抗体对紧密并联二种抗原是有用的。这对于增加特定位置抗原的浓度,如酶底物对是特别有用的。2.4 Western印迹
本发明的组合物在免疫印迹或western印迹分析中将会发现有巨大的应用价值。该抗-肽的抗体可用作鉴定固定到固相支持基质,如硝酸纤维素、尼龙或其组合上蛋白的高亲和一级试剂。与免疫沉淀连用,然后凝胶电泳,这些可用作用于检测抗原中的单一步骤的试剂,其中的用于检测抗原的二级试剂导致相反的背景。当研究过的抗原为免疫球蛋白(排除使用结合免疫球蛋白的细菌细胞壁成分),这些研究过的抗原与检测试剂起交叉反应或者它们作为交叉-反应信号以相同的相对分子量进行迁移时这将特别有用。
用于与Western印迹交联的基于免疫学的检测方法包括认为抗毒素成分的酶、放射标记或荧光标记的二级抗体在此方面有特别的使用。2.5表位核心序列
本发明也涉及无完整细胞和其它肽的蛋白或肽组合物,其包括掺入在免疫学上与一种或更多种抗-晶体蛋白抗体交叉反应的表位的纯化蛋白或肽。特别地,本发明涉及来自Cry蛋白或肽的表位核心序列。
如这里所使用的,术语“掺入在免疫学上与一种或更多种抗-晶体蛋白抗体交叉反应的表位”意指包括与位于晶体蛋白或多肽内部的表位类似的一级、二级或三级结构的肽或蛋白抗原。类似的水平将一般达到这样的水平,即抗该晶体蛋白或多肽的单克隆或多克隆抗体将同时与交叉反应肽或蛋白抗原结合,起反应或对其进行识别。各种免疫分析方法,如Western印迹、ELISA、RIA等可与这些抗体联合使用,这些方法对于本领域中的技术人员来说是已知的。
适用于疫苗中的Cry免疫显性表位和/或其功能等价物的鉴定是相对简单的事情。例如,人们可以利用美国专利4,554,101(在此引入供参考)中讲述的Hopp方法,该方法讲述了根据氨基酸序列的亲水性鉴定和制备表位。在几篇其它论文中所述的方法和基于其的软件程序也可用于鉴定表位核心序列(参见,例如,Jameson和Wolf,1988;Wolf等,1988;美国专利。4,554,101)。然后可经过用肽合成或重组技术容易地将这些“表位核心序列”的氨基酸序列掺入到肽中。
根据本发明优选使用的肽将一般在约8到20个氨基酸长度,并且更为优选约8到15个氨基酸长度。已提出较短的抗原晶体蛋白-衍生的肽将在有些情况,例如,在准备免疫学检测分析中具有优势。优势的实例包括制备和纯化的简单易行、相对较低的成本和提高的制备重复性以及优越的生物分布。
已提出本发明的特定优势可通过制备合成肽加以实现,该合成肽包括修饰和/或延伸的表位/免疫原性核心序列,其导致对晶体蛋白且特别是Cry和Cry-有关的序列“广泛”的表位肽。在此特定方面鉴定出这些表位核心序列为特定多肽抗原的亲水区域。已提出这些区域代表最有可能促进T-细胞或B-细胞刺激,并且,因此引发特异性抗体产生的那些区域。
这里使用的表位核心序列是相对短的氨基酸片段,其与这里公开的针对晶体蛋白的抗体上的抗原结合位点“互补”并且因此将与之结合。此外,或者作为选择,表位核心序列为将要引发与针对本发明肽组合物抗体起交叉反应的抗体的序列。应该明白在本文的上下文中,术语“互补”指相互间显示出吸引力的氨基酸或肽。因此,可根据与相应的抗-蛋白抗血清之间竞争结合所需蛋白抗原或者也许是代替它们之间结合的能力而可操性地定义本发明的一些表位核心序列。
一般地,只要其至少足够大以带有鉴定出的核心序列或多个序列,那么该多肽抗原的大小不认为是特别重要的。本发明预期的最小有用的核心序列一般将为大约8个氨基酸的长度,其中10到20个氨基酸长度的序列是优选的。因此,该大小将一般相应于根据本发明制备的最小的肽抗原。然而,只要其含有基本的表位核心序列,那么该抗原的大小在需要时可以更大些。
表位核心序列的鉴定对于本领域的技术人员是已知的,例如,如美国专利4,554,101中所述,在此掺入供参考,其中讲述了根据氨基酸的亲水性鉴定和制备表位。然而,众多的计算机程序可用于预言蛋白的抗原部分(参见,如,Jameson和Wolf,1988;Wolf等,1988)。计算机肽序列分析程序(如,DNAStar软件,DNAStar,公司,Madison,WI)也可用于设计根据本发明的合成肽。
在其序列内部包括抗原表位的表位序列或肽的合成用常规的合成技术如固相方法可容易地完成(如,通过使用商业可得到的肽合成仪如应用生物系统430A型肽合成仪)。然后将从该方式合成的肽抗原以预定的量分装并且以常规方式,如水溶液或,甚至更为优选以粉末或冻干状态贮存备用。
一般地,由于肽的相对稳定性,如果需要,它们可实际上容易地贮存于任何水溶液中相当长时间,如达6个月或更长时间而没有可觉察到的降解或抗原活性的丧失。然而,当需要大量贮存时,其一般有必要将包括含有缓冲液如Tris或磷酸缓冲液的试剂从维持约7.0到7.5的pH。此外,包括将会抑制微生物生长的试剂,如叠氮化钠或硫柳汞可能是必要的。为了在水中大量贮存,于大约4℃,或更为优选冰冻下贮存溶液将是必要的。当然,当这些肽以冻干或粉末状态贮存时,它们实际上可,如以固定的等份无限制地贮存,这些等份在使用前可以预定量的水(优选蒸馏过的)或缓冲液重新水化。2.6编码晶体蛋白嵌合体的核酸片段
本发明也涉及可以合成或从实际上任何来源分离的天然、合成和诱变的DNA片段,其不含总基因组DNA并且编码这里公开的新的嵌合肽。编码这些肽的DNA片段可能证明是编码晶体蛋白有关的蛋白、多肽、亚单位、功能域等或其它无关的基因产物。此外,这些DNA片段可用本领域技术人员熟知的方法在体外完整地合成。
如这里所使用的,术语“DNA片段”指分离的无特定物种总基因组DNA的DNA分子。因此,编码晶体蛋白或肽的DNA片段指含有晶体蛋白编码序列然而是从获得该DNA片段的物种总基因组DNA中分离或纯化的DNA片段,其中的基因组直接的是格兰氏阳性细菌,芽孢杆菌属的基因组,并且特别是称为苏云金芽孢杆菌的那些芽孢杆菌的基因组。术语“DNA片段”所包括的有DNA片段和该片段更小的片段,并且也包括重组载体,包括,例如,质粒、粘粒、噬菌粒、噬菌体、病毒等。
类似地,包括分离或纯化的编码晶体蛋白基因的DNA片段指除了可包括肽编码序列外,还包括一些其它元件,如,实际上从其它天然基因或蛋白编码序列分离的调节序列的DNA片段。在该方面,术语“基因”为了简洁而使用从而指有功能蛋白-、多肽-或肽-编码单位。本领域人员将会明白,该功能术语同时包括表达或可以被加工表达蛋白、多肽或肽的基因组序列、操纵子序列和更小加工的基因片段。
“基本上与其它编码序列相分离”意为此时的目的基因,编码细菌晶体蛋白的基因形成了该DNA片段编码区的重要部分并且该DNA片段不含有大片段的天然编码DNA,如大的染色体片段或其它有功能的基因或操纵子编码区。当然,这是指最初分离的DNA片段并且不排除后来人工添加到该片段上的基因、重组基因、合成接头或编码区。
在特定的实施方案中,本发明涉及分离的DNA片段和重组载体,其中掺入有编码多种Cry肽的DNA序列,这些Cry肽的氨基酸序列内包括基本上由SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ IDNO:34中列出的氨基酸序列。
术语“基本上由SEQ ID NO:10、SEQ ID NO:12、SEQ IDNO:14、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30或SEQ ID NO:34中列出的序列”意为该序列基本上相应于SEQ IDNO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30或SEQ ID NO:34序列的一部分并且与这些序列中的任何一个序列的氨基酸具有很少不相同、生物学功能相当的氨基酸。术语“生物学功能相当”在本领域中众所周知并在此进一步详细描述(如,参见说明性实施方案)。因此,与SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:26、SEQID NO:28、SEQ ID NO:30或SEQ ID NO:34的氨基酸具有约70%到80%,或更为优选具有81%到90%,或甚至更为优选具有约91%到99%氨基酸序列一致性或功能等价的序列将是“基本上由SEQ IDNO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30或SEQ ID NO:34所列出的”序列。
也将明白该氨基酸和核酸序列可以包括额外的残基,如额外的N-或C-末端氨基酸或5′或3′序列,并且只要该序列达到上述标准,包括当蛋白表达时维持蛋白的生物学活性,那么该序列仍然为基本上由这里公开的其中一个序列所列出。添加末端序列特别应用于这样的核酸序列,即,例如其可包括在该编码区5′或3′部分的各种侧翼非编码序列或可包括各种内部序列,即已知在基因内部出现的内含子。
本发明的核酸片段,无论其本身编码序列有多长,都可与其它DNA序列,如启动子、多腺苷信号、额外的限制酶位点、多克隆位点、其它的编码片段等连接从而它们的整体长度可能有相当大变化。因此,应注意到可以使用几乎任何长度的核酸片段,其总长度优选由在目的重组DNA方法中制备和使用的简便性而加以确定。例如,可制备这样的核酸片段,即其包括编码在SEQ ID NO:10、SEQ ID NO:12、SEQ IDNO:14、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30或SEQ ID NO:34中公开的任一肽序列的短的连续片段,或其与编码SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ IDNO:26、SEQ ID NO:28、SEQ ID NO:30或SEQ ID NO:34中公开的任何一种肽的DNA序列相同或互补,且特别是与SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:25、SEQ IDNO:27、SEQ ID NO:29或SEQ ID NO:33中公开的那些DNA片段相同或互补。例如,约14个核苷酸,并且达约10,000、约5,000、约3,000、约2,000、约1,000、约500、约200、约100、约50和约14个碱基对长度(包括所有居间长度)的DNA序列也被认为是有用的。
将容易理解上下文中的“居间长度”意为引用范围之间的任何长度,如14、15、16、17、18、19、20等;21、22、23等;30、31、32等;50、51、52、53等;100、101、102、103等;150、151、152、153等;包括200-500的所有整数;500-1,000;1,000-2,000;2,000-3,000;3,000-5,000;并且达到并包括约10,000个核苷酸的序列等。
也应认为本发明不限于编码本发明肽的特定核酸序列或编码SEQID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30或SEQ ID NO:34氨基酸序列的特定核酸序列,包括特别是在SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:25、SEQ ID NO:27、SEQID NO:29或SEQ ID NO:33中公开的那些DNA序列。重组载体和分离的DNA片段可能因此多样性地包括肽编码区本身、在碱基编码区域中具有选定改变或修饰的编码区,或者它们可编码只不过包括这些肽编码区的较大多肽或者可编码具有变异氨基酸序列的生物学上有功能的等价蛋白或肽。
本发明的DNA片段包括生物学上有功能的等价肽。这些序列可能是由已知天然出现于核酸序列内和其编码的蛋白内的密码子多余和功能等价的后果所致。作为选择,可通过应用重组DNA技术产生功能上相当的蛋白或肽,其中可根据被交换氨基酸的特性加工该蛋白结构中的改变。人工设计的改变可经应用定点诱变技术而导入从而,如,导入对该蛋白抗原性的改进或为了在分子水平检测活性而测试突变子。
如果必要,人们也可制备融合蛋白和肽,如,有时将该肽编码区与其它具有所需功能,如用于纯化或免疫检测目的(如,蛋白可分别通过亲和层析和酶标编码区加以纯化)的其它蛋白或肽位于相同的表达单位中。
重组载体形成本发明进一步的方面。特别有用的载体认为是其中的DNA片段的编码区,无论编码全长蛋白或更小的肽,位于启动子控制下的那些载体。该启动子可以为与编码本发明肽基因天然连接的启动子形式,其可,例如,用重组克隆和/或PCRTM技术联合这里公开的组合物通过分离位于该编码片段或外显子上游的5′非-编码序列而获得。2.7重组载体和蛋白表达
在其它实施方案中,已注意到将编码DNA片段置于重组、或异源启动子控制下将会获得一些优势。正如这里所使用的,重组或异源启动子意指通常在自然环境中不与编码晶体蛋白或肽的DNA片段连接。这些启动子可以包括通常与其它基因相连接的启动子和/或从任何细菌、病毒、真核或植物细胞中分离的启动子。一般地,利用在选定用于表达的细胞类型、有机体或甚至是动物中有效指导DNA片段表达的启动子将是重要的。启动子和用于蛋白表达的细胞类型组合的使用对于分子生物学领域中的技术人员一般是已知的,例如,参见Sambrook等,1989。利用的启动子可以是组成性的或可诱导的,并且可在适当的条件下使用以指导导入DNA片段的高水平表达,这在大规模制备重组蛋白或肽中是有利的。打算用于高水平表达的适当启动子系统包括但不限于毕赤酵母表达载体系统(发玛西亚LKB生物技术公司)。
在与表达实例连接以制备重组蛋白和肽的过程中,应该考虑到较长的DNA片段将是最常使用的,其中编码完整肽序列的DNA片段最为优选。然而,应该明白使用较短的DNA片段以指导晶体肽或表位核心区域的表达从而可用于产生抗晶体蛋白抗体,这也在本发明范围之内。认为编码约8到50个氨基酸长度、或更为优选地,从约8到30个氨基酸长度,或甚至更为优选地,从约8到约20个氨基酸长度肽抗原的DNA片段特别有用。这样的肽表位可以是包括来自SEQ ID NO:10、SEQ IDNO:12、SEQ ID NO:14、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30或SEQ ID NO:34的连续氨基酸序列的氨基酸序列或是由SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:33的核酸序列所编码的任何肽表位。
用于重组表达晶体蛋白的方法和用于表达编码晶体蛋白的DNA构建体的载体描述于国际专利申请公开No.WO95/02058,在此特异性掺入供参考。2.8重组宿主细胞
已根据布达佩斯条约的条款保藏的本发明重组宿主细胞列于表2中。
                             表2
              具有布达佩斯条约NRRL的保藏的菌株菌株            质粒             许可号             保藏日期EG 11063        pEG 1068        NRRL B-21579        1996年6月26日EG 11074        pEG 1077        NRRL B-21580        1996年6月26日EG 11091        pEG 1092        NRRL B-21780        1997年5月21日EG 11092        pEG 1093        NRRL B-21635        1996年11月14日EG 11735        pEG 365         NRRL B-21581        1996年6月26日EG 11751        pEG 378         NRRL B-21636        1996年11月14日EG 11768        pEG 381         NRRL B-21781        1997年5月21日2.9作为杂交探针和引物的DNA片段
除了其在指导本发明晶体蛋白或肽表达中的使用外,在此涉及的核酸序列也具有多种其它的用途。例如,它们也可用作核酸杂交实施方案中的探针或引物。尽管如此,但应注意到包括由至少14个核苷酸长的连续序列所组成序列区域的核酸片段将会有特别的用途,其中的连续序列与SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ IDNO:25、SEQ ID NO:27、SEQ ID NO:29或SEQ ID NO:33中的14个核苷酸长的连续DNA片段具有相同的序列或与其互补。同样,编码来自SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30或SEQ IDNO:34的至少6个氨基酸连续序列的核酸片段也是优选的。更长连续且相同或互补的序列,如,约20、30、40、50、100、200、500、1000、2000、5000、10000等(包括所有居间长度并且达到和包括全长序列的那些序列也将在有些实施方案中是有用的。
这样的核酸探针与晶体蛋白-编码序列特异性杂交的能力将使其能够用于检测给定样品中互补序列的存在。然而,又发现其它的用途,包括用该序列信息制备突变种类的引物或用于制备其它遗传构建体的引物。
具有由与SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29或SEQ IDNO:33 DNA序列相同或互补的大约10-14、15-20、30、50、或甚至100-200个核苷酸的连续核苷酸片段所组成序列区域的核酸分子被特别认为用作,如Southern和Northern印迹中的杂交探针。较小的片段一般将在杂交实施方案中具有用途,其中的连续互补区域的长度可以改变,如在约10-14到约100或200个核苷酸之间,但是根据人们希望检测的互补序列的长度可以使用较大的连续互补片段。
当然,也可通过其它技术,如,机械剪切或限制酶消化而获得这些片段。小的核酸片段或节段可容易地通过,例如,化学方法直接合成该片段而加以制备,这可用自动寡核苷酸合成仪常规地完成。同样,可通过应用核酸复制技术,如美国专利4,683,195和4,683,202(在此特异性地掺入每例供参考)的PCRTM技术、将选定的序列导入用于重组制备的重组载体中和分子生物学领域中技术人员通常已知的其它重组DNA技术获得这些片段。
因此,可以使用本发明核苷酸序列与互补DNA片段选择性形成双链分子的能力。根据观察到的应用,人们希望利用不同的杂交条件来完成不同程度选择性检测靶序列。对于要求高选择性的应用,人们一般将希望利用相对严格的条件以形成杂交体,如,人们将选择相对低盐和/或高温条件,如约0.02M到0.15M NaCl,约50℃到70℃的温度条件。该选择性条件耐受,如果有的话是极少的探针与模板或靶链之间的错配,并且将特别适用于分离编码晶体蛋白的DNA片段。通过杂交检测DNA片段对本领域的技术人员是众所周知的,并且美国专利4,965,188和5,176,995(在此特异性地掺入每例供参考)的讲义是这些杂交分析方法的实例。特别有关的讲义,如在Maloy等,1994;Segal 1976;Prokop,1991;和Kuby,1994的文章中出现的内容。
当然,对于有些应用,例如,当人们希望用杂交到潜在(underlying)模板上的突变引物链制备突变体或寻求从有关种类、功能等价物等中分离编码晶体蛋白的序列时,为了形成异源双链一般将需要较少严格的杂交条件。在这些情况中,人们可能希望利用这样的条件,如约0.15M到0.9M的盐,约20℃到55℃的温度范围。因此,相对于对照杂交,交叉杂交的种类可容易地鉴定为阳性杂交信号。在任何情况,一般应该明白这些条件可通过加入逐渐增加量的甲醛而变得更为严格,其中的甲醛用于随着温度的增加以相同的方式使杂交双链变得不稳定。因此,杂交条件可以容易地进行操作,并因此一般将根据所需的结果成为最佳方法。
在有些实施方案中,联合使用本发明的核酸序列与适当的方法,如用于检测杂交的探针将是优越的。多种适当的指示方式在本领域中是已知的,包括荧光、放射性、酶或其它配体,如亲合素/生物素,它们能够得到可检测的信号。在优选的实施方案中,人们将很可能希望利用荧光标记或酶标记,如脲酶、碱性磷酸酶或过氧化物酶代替放射性或其它对环境不利的试剂。在酶标记的案例中,比色指示底物是已知的。它们可用于提供对人眼可见的手段或分光光度的手段从而鉴定出与含有互补核酸样品之间的特异性杂交。
一般地,已观察到这里所述的杂交探针将可同时用作溶液杂交中的试剂以及利用固相的实施方案中。在包括固相的实施方案中,将测试DNA(或RNA)吸附或附着到选定的基质或表面上。然后将该固定的单链核酸在所需的条件下与选定的探针进行特异性杂交。根据所需的特定标准(例如,依据G+C含量、靶核酸的类型、核酸的来源、杂交探针的大小等),此选定的条件将依赖于特定的情况。清洗杂交表面以去除非特异性结合的探针分子后,检测特异性杂交,或者甚至通过标记方式加以定量。2.10生物学功能等价物
在本发明肽结构或编码它们的DNA片段中可造成修饰和改变并且仍然获得编码具有所需特征蛋白或肽的有功能的分子。下面是基于改变蛋白的氨基酸以产生等价物,或者甚至是改进的、二代分子的讨论。在本发明特定的实施方案中,认为突变的晶体蛋白对于增强该蛋白的杀虫活性并且因此增强该重组转基因在植物细胞中的杀虫活性和/或表达是有用的。氨基酸改变可根据表3中列出的密码子改变该DNA序列的密码子来完成。
                          表3
   氨基酸                        密码子丙氨酸      Ala    A  GCA  GCC  GCG  GCU半胱氨酸    Cys    C  UGC  UGU天冬氨酸    Asp    D  GAC  GAU谷氨酸      Glu    E  GAA  GAG苯丙氨酸    Phe    F  UUC  UUU甘氨酸      Gly    G  GGA  GGC  GGG  GGU组氨酸      His    H  CAC  CAU异亮氨酸    Ile    I  AUA  AUC  AUU赖氨酸      Lys    K  AAA  AAG亮氨酸      Leu    L  UUA  UUG  CUA  CUC  CUG  CUU甲硫氨酸    Met    M  AUG天冬酰胺    Asn    N  AAC  AAU脯氨酸      Pro    P  CCA  CCC  CCG  CCU谷氨酰胺    Gln    Q  CAA  CAG精氨酸      Arg    R  AGA  AGG  CGA  CGC  CGG  CGU丝氨酸      Ser    S  AGC  AGU  UCA  UCC  UCG  UCU苏氨酸      Thr    T  ACA  ACC  ACG  ACU缬氨酸      Val    V  GUA  GUC  GUG  GUU色氨酸      Trp    W  UGG酪氨酸      Tyr    Y  UAC  UAU
例如,在蛋白结构中有些氨基酸可以用其它氨基酸代替而没有可觉察到的与一些结构,如抗体的抗原结合区或底物分子上的结合位点之间相互结合能力的丧失。由正是蛋白的这种相互间作用能力和性质决定了该蛋白的生物学功能活性,故可以在蛋白序列,和,当然其潜在的DNA编码序列中造成一些氨基酸序列替代但是可得到具有同样特性的蛋白。因此,本发明者考虑到了在此公开的组合物肽序列或编码所述肽的相应DNA序列中可造成各种变化而其生物学用途或活性没有可觉察到的丧失。
在进行这样的变化中,可以考虑氨基酸的亲水性指数。亲水性氨基酸指数在赋予蛋白相互间生物功能中的重要性在本领域中已得到一致认同(Kyte和Doolittle,1982,在此掺入供参考)。现已接受氨基酸的相对亲水特征赋予所得到蛋白的二级结构,其反过来又决定了该蛋白与其它分子,例如,酶、底物、受体、DNA、抗体、抗原等之间的相互作用。
根据其疏水性和电荷特征,每种氨基酸均被赋予一亲水指数(Kyte和Doolittle,1982),它们是:异亮氨酸(+4.5);缬氨酸(+4.2);亮氨酸(+3.8);苯丙氨酸(+2.8);半胱氨酸/胱氨酸(+2.5);甲硫氨酸(+1.9);丙氨酸(+1.8);甘氨酸(-0.4);苏氨酸(-0.7);丝氨酸(-0.8);色氨酸(-0.9);酪氨酸(-1.3);脯氨酸(-1.6);组氨酸(-3.2);谷氨酸(-3.5);谷氨酰胺(-3.5);天冬氨酸(-3.5);天冬酰胺(-3.5);赖氨酸(-3.9);和精氨酸(-4.5)。
在本领域中已知有些氨酸可由具有类似亲水指数或得分的其它氨基酸所代替并且仍可得到具有类似生物学活性的蛋白,即,仍然获得生物功能相当的蛋白。在制备这样的改变中,替代其亲水指数在±2以内的氨基酸是优选的,替代其亲水指数在±1以内的那些氨基酸是特别优选的,并且替代那些亲水指数在±0.5以内的那些氨基酸甚至是更为特别优选的。
也应明白在本领域中替代类似的氨基酸可根据疏水性而有效地完成。美国专利4,554,101(在此掺入供参考)叙述了由其邻近氨基酸亲水性所支配的蛋白最大局部平均亲水性与该蛋白的生物学特性相关。
如在美国专利4,554,101中所详述的,下面的疏水值被赋予每个氨基酸:精氨酸(+3.0);赖氨酸(+3.0);天冬氨酸(+3.0±1);谷氨酸(+3.0±1);丝氨酸(+0.3);天冬酰胺(+0.2);谷氨酰胺(+0.2);甘氨酸(0);苏氨酸(-0.4);脯氨酸(-0.5+1);丙氨酸(-0.5);组氨酸(-0.5);半胱氨酸(-1.0);甲硫氨酸(-1.3);缬氨酸(-1.5);亮氨酸(-1.8);异亮氨酸(-1.8);酪氨酸(-2.3);苯丙氨酸(-2.5);色氨酸(-3.4)。
应该明白氨基酸可由具有类似疏水值的其它氨基酸所代替并且仍然获得生物学上相当的,且特别是免疫学上相当的蛋白。在这些改变中,替代其疏水值在±2以内的氨基酸是优选的,替代其疏水值在±1以内的氨基酸是特别优选的,并且替代其疏水值在+0.5以内的氨基酸是甚至更为特别优选的。
如上面所总结的,因此氨基酸替代一般是根据氨基酸侧-链替代物的相对类似性,例如疏水性、亲水性、电荷、大小等。考虑到前述各种特征的替代的实例对本领域的技术人员是众所周知的并且包括:精氨酸与赖氨酸;谷氨酸与天冬氨酸;丝氨酸与苏氨酸;谷氨酰胺与天冬酰胺;以及缬氨酸、亮氨酸与异亮氨酸。2.11定点诱变
定点诱变是经过特异性诱变潜在DNA而用于制备单个肽、或生物学功能相当的蛋白或肽的技术。该技术进一步提供通过导入一种或更多种核苷酸序列改变至该DNA中而制备和测试,例如,掺入一种或更多种前述因素的序列突变体的即用能力。定点诱变使能够经过使用特异性的寡核苷酸序列而制备突变体,其中的寡核苷酸序列编码所需突变的DNA序列以及足够数目的相邻核苷酸以提供足够大小的引物序列和序列复杂度从而在跨越缺失接头处的二侧形成稳定的双链。一般地,约17到25个核苷酸长度的引物是优选的,其中待改变序列接头的二侧具有约5到10个残基。
一般来说,定点诱变技术在本领域中是众所周知的,如各种出版物中所列举的那样。应当明白,该技术一般利用既表现出单链又表现出双链形式的噬菌体载体。用于定点诱变的典型载体包括载体如M13噬菌体。该噬菌体在商业上容易得到并且其使用对于本领域的技术人员是众所周知的。双链质粒也经常用于定点诱变从而免除了将目的基因从质粒转移至噬菌体的步骤。
一般地,根据这里的定点诱变通过首先获得单链载体或使在其序列中包括编码所需肽的DNA序列的双链载体二条链解链而完成。制备,一般是合成制备具有所需突变序列的寡核苷酸引物。然后将该引物与单链载体退火,并且用DNA聚合酶如大肠杆菌聚合酶I Klenow片段以完成具有突变链的合成。这样,形成了异源双链,其中的一条链编码原初的非突变序列并且第二条链具有所需的突变。然后将此异源双链载体用于转化合适的细胞,如大肠杆菌细胞,并且筛选出包括有突变序列组合的重组载体的克隆。
用定点诱变制备编码选定肽的DNA片段的序列体将提供为制备十分有用物种的手段并且并非意在只限于此因为还有其它方法,在这些方法中可获得肽的序列突变体和编码它们的DNA序列。例如,可以用诱变剂,如羟胺处理编码所需肽序列的重组载体以获得序列变异体。2.12作为杀虫剂的晶体蛋白组合物和使用方法
本发明人考虑到在此公开的嵌合晶体蛋白组合物作为局部和/或系统施用至田间作物、草、果树和蔬菜以及观赏植物的杀虫剂将会有特别的用途。在优选的实施方案中,该生物杀虫剂组合物包括表达这里公开的新晶体蛋白细菌细胞的油性可流动的悬液。优选地,这些细胞为苏云金芽孢杆菌细胞,然而,认为表达这里公开的新的核酸片段并且产生晶体蛋白的任何这样的细菌宿主细胞均是有用的,如巨大芽孢杆菌、枯草芽孢杆菌、大肠杆菌或假单胞菌。
在另一个重要的实施方案中,该生物杀虫剂组合物包括可在水中分散的微粒。该微粒包括表达这里公开的新的晶体蛋白的细菌细胞。优选的细菌细胞为苏云金芽孢杆菌细胞,然而,以这里公开的DNA片段转化并且表达晶体蛋白的细菌如巨大芽孢杆菌、枯草芽孢杆菌、大肠杆菌或假单胞菌细胞也认为是有用的。
在第三个重要的实施方案中,该生物杀虫剂组合物包括可增湿的粉末、粉末(dust)、颗粒(pellet)或胶态浓缩物。该粉末包括表达这里公开的新的晶体蛋白的细菌细胞。优选的细菌细胞为苏云金芽孢杆菌细胞,然而,以这里公开的DNA片段转化并且表达该晶体蛋白的细菌如巨大芽孢杆菌、枯草芽孢杆菌、大肠杆菌或假单胞菌也认为是有用的。可制备这种干燥形式的杀虫组合物从而在增湿时立即溶解,或者作为选择,以控释、缓释或其它时间依赖性的方式溶解。
在第四个重要的实施方案中,该生物杀虫剂组合物包括细菌细胞如上述的表达该晶体蛋白的那些细菌细胞的水悬液。此水悬液可提供为浓缩的贮备液,在施用前稀释、或者作为选择,提供为即用的稀释液。
对于包括施用细菌细胞的这些方法,含有该晶体蛋白基因的细胞宿主可培养于任何方便的营养培养基中,其中的DNA构建体提供了选择优势,提供选择培养基从而基本上全部或所有的细胞均带有苏云金芽孢杆菌基因。然后根据常规方式收获这些细胞。作为选择,可在收获之前处理这些细胞。
当该杀虫剂组合物包括表达目的蛋白的完整苏云金芽孢杆菌细胞时,可以多种方法制备这种细菌。通过与各种惰性材料,如无机矿物质(页硅酸盐、碳酸盐、硫酸盐、磷酸盐等)或植物材料(粉末状玉米穗轴、稻壳、板栗壳等)混合,它们可用作可增湿的粉末、微粒或粉末。这些制品可包括分散-粘着佐剂、稳定剂、其它杀虫添加剂或表面活性剂。液体制剂可以为基于水或无水的形式并且可用作泡沫、悬液、可乳化的浓缩物等。这些成分可包括流变剂、表面活性剂、乳化剂、分散剂或聚合物。
通过重组细菌表达系统在体外可制备新的嵌合Cry蛋白并且分离用于随后的田间施用。该蛋白可以位于粗细胞裂解液、悬液、胶体等中或在配制成活性的生物杀虫剂制剂之前可被纯化、提炼、缓冲和/或进一步加工。同样,在有些情况下,从表达该晶体蛋白的细菌培养物中分离晶体和/或孢子并且施用作为活性生物杀虫剂组合物的该晶体和/或孢子的溶液、悬液或胶体制品可能是必要的。
无论施用方法如何,以杀虫有效的量施用该活性组合物,这个量将依赖于这些因素,如待控制的具体的鞘翅目昆虫、待处理的具体植物或作物、环境条件和施用该杀虫-活性组合物的方法、速度和量。
所述的杀虫剂组合物可通过配制该细菌细胞、晶体和/或孢子悬液、或分离的蛋白组分与所需的农业上可接受的载体而完成。该组合物可在施用之前以适当的方式配制,如冷冻干燥、冰冻干燥、脱水或位于水性载体、介质或合适的稀释剂,如盐或其它缓冲液。该配制的组合物可以为粉末或微粒物质的形式、或油(蔬菜或矿物油)中的悬液的形式、或者水或油/水乳剂的形式、或者为可增湿的粉末形式或者与任何其它适于农业施用的载体材料联合使用的形式。合适的农业载体可以为固体或液体并且在本领域中是众所周知的。术语“农业上可接受的载体”包括所有的佐剂,如,通常用于杀虫剂制备技术中的惰性成分、分散剂、表面活性剂、粘剂(tackifiers)、粘合剂等;这些对于杀虫剂制备的技术人员来说是众所周知的。该制剂可与一种或更多种固体或液体佐剂混合并且用常规的制备技术通过各种方法,如均匀混合、混和(blend)和/或研磨该杀虫组合物与合适的佐剂加以制备。
本发明的杀虫剂组合物施用至目标鞘翅目昆虫的环境中,一般通过常规方法,优选通过喷洒施用至该植物或要保护的作物的叶片上。杀虫剂施用的强度和时间将依据待处理的特定害虫、作物的具体状况和特定的环境条件来确定。活性成分对载体的比例将一般依赖于该杀虫剂组合物的化学性质和稳定性以及所涉及的特定配方。
在某些情况下,如导致根部或茎部感染的昆虫或施用至纤弱的植物或观赏植物,其它施用技术,如,喷粉、喷灌、浸泡、土壤注射、种子涂层(coating)、幼苗涂层、喷洒、通气(aerating)、喷雾(misting)、雾化(atomizing)等也是可行的并且可能是必要的。这些施用方法对于本领域中的技术人员也是众所周知的。
本发明的杀虫剂组合物可以仅仅用于本发明方法中或者与其它化合物,包括但不限于其它杀虫剂联合使用。本发明方法也可与其它处理方案,如表面活性剂、去污剂、聚合物或时间-释放制剂联合使用。本发明的杀虫剂组合物可以配制成系统或局部使用。
用于环境、系统、或叶片施用的杀虫剂组合物的浓度将依据特定制剂、施用方式、环境条件和生物杀虫活性的程度而有较大变化。一般地,该生物杀虫剂组合物将以至少约0.5%重量的浓度存在于施用的制剂中并且可达到并包括约99%的重量。该组合物的干制剂可以是约0.5%到99%或更多该组合物的重量,而液体制剂可一般包括约0.5%到99%或更多该活性成分的重量。包括完整细菌细胞的制剂将一般含有约104到1012个细胞/mg。
该杀虫剂制剂根据需要可以一次或更多次施用至特定的植物或靶区域,每公顷的典型田间施用量在约50g至约500g活性成分的范围,或者约500g到约1000g、或者约1000g到约5000g或更多活性成分的范围。2.13抗体组合物和制备方法
在特定的实施方案中,本发明者考虑到了与这里公开的晶体蛋白结合的单克隆或多克隆抗体的使用。用于制备这些抗体并对其进行特征分析的方法在本领域中是已知的(参见,如,Harlow和Lane,1988;在此掺入供参考)。用于制备单克隆抗体(mAbs)的方法一般与用于制备多克隆抗体的方法以相同的路线开始。简言之,通过以根据本发明的免疫原性组合物免疫动物并且从该免疫的动物中收集抗血清而制备多克隆抗体。多种动物种类可用于抗血清的制备。一般用于制备抗血清的动物为兔子、小鼠、大鼠、仓鼠、豚鼠或山羊。由于兔子的血量较大,故兔子是用于制备多克隆抗体的优选的选择。
正如在本领域中所众所周知的,一种给定的组合物的免疫原性可以改变。因此,增强宿主免疫系统常是必需的,这可通过将肽或多肽免疫原偶联至载体上而完成。优选载体的实例有匙孔血蓝蛋白(KLH)和牛血清蛋白(BSA)。其它清蛋白如卵清蛋白、小鼠血清蛋白或兔血清蛋白也可用作载体。用于将多肽交联至载体蛋白上的方法在本领域中是众所周知的并且包括戊二醛、间马来酰亚胺苯甲酰-N-羟琥珀酰亚胺酯、碳化二亚胺和双二氮化联苯胺。
正如同样在本领域中所众所周知的,可通过使用非特异性的名为佐剂的免疫应答刺激剂而增强特定免疫原组合物的免疫原性。优选佐剂的实例包括完全弗氏佐剂(含有灭活结核分枝杆菌(Mycobacteriumtuberculosis)的免疫应答非特异性的刺激剂)、不完全弗氏佐剂和氢氧化铝佐剂。
用于制备多克隆抗体中的免疫原组合物的量依据该免疫原的性质以及用于免疫的动物而改变。可用多种途径施用免疫原(皮下、肌肉内、皮内、静脉内和腹膜内)。多克隆抗体的产生可通过在免疫后不同的时间点采集免疫动物的血样加以监测。也可能要给以第二次增强注射。重复增强和滴定的过程直到达到合适的滴度。当获得所需水平的免疫原性时,将免疫的动物放血并且分离和贮存血清,且/或将该动物用于产生mAbs。
通过使用众所周知的技术,如在美国专利4,196,265(在此特异性掺入供参考)中例举的技术可容易地制备mAbs。一般地,该技术包括以选定的免疫原组合物,如纯化或部分纯化的晶体蛋白免疫合适的动物。以有效刺激产生抗体的细胞的方式施用该免疫组合物。啮齿动物如小鼠和大鼠是优选的动物,然而,使用兔子、绵羊、蛙细胞也是可能的。使用大鼠可能提供某些优势(Goding,1986,60-61页),但小鼠是优选的,其中BALB/c小鼠是最为优选的因为其最常使用并且一般达到更高百分比的稳定融合体。
免疫后,筛选出具有产生抗体能力的体细胞,特别是B淋巴细胞(B细胞)用于mAb的制备方法中。这些细胞可荻自活检的脾脏、扁桃体或淋巴结,或者获自外周血样品。脾脏细胞和外周血细胞是优选的,前者是因为它们为处于分裂的浆母细胞期产生抗体细胞的丰富来源,并且后者是因为外周血容易得到。通常,将免疫一组动物并且取出具有最高抗体滴度的动物脾脏且然后通过用注射器搅匀脾脏而获取脾脏淋巴细胞。一般地,来自免疫小鼠的脾脏含有大约5×107到2×108个淋巴细胞。
然后将来自免疫动物的该产生抗体的B淋巴细胞与永生的骨髓瘤细胞,一般是与该免疫动物相同种动物的一种细胞融合。适用于产生杂交瘤融合方法中的杂交瘤细胞系优选为不产生抗体、具有高的融合效率和酶的缺失、此缺失然后使其不能够培养于一些支持仅仅所需融合细胞(杂交瘤)生长的选择培养基中。
可以使用众多骨髓瘤细胞中的任何一种,这些对于本领域的技术人员来说是已知的(Goding,pp.65-66,1986;Campbell,pp.75-83,1984)。例如,其中的免疫动物为小鼠时,人们可以使用P 3-X 63/Ag 8、X 63-Ag 8.653、NS 1/1.Ag 41、Sp 210-Ag 14、FO、NSO/U、MPC-11、MPC 11-X 45-GTG 1.7和S 194/5 XX0 Bul;对于大鼠,人们可以使用R 210.RCY 3、Y 3-Ag 1.2.3、IR 983 F和4B 210;并且U-266、GM 1500-GRG 2、LICR-LON-HMy 2和UC 729-6均可与人类细胞融合联用。
一种优选的鼠骨髓瘤细胞为NS-1骨髓瘤细胞系(也称为P 3-NS-1-Ag4-1),其通过查寻细胞系保藏号GM 3573可容易地从NIGMS人类遗传突变细胞贮藏库中得到。另一种可用的小鼠骨髓瘤细胞系为不产生抗-8-氮鸟嘌呤小鼠骨髓瘤SP 2/0的细胞系。
用于制备产生抗体的脾脏或淋巴结细胞与骨髓瘤细胞的杂交体的方法通常包括在一种或多种促进细胞膜融合(化学或电)试剂存在下以2∶1的比例混合体细胞与骨髓瘤细胞,但该比例可分别从约20∶1变化至约1∶1。已描述过用仙台病毒的融合方法(Kohler和Milstein,1975;1976)和用聚乙二醇(PEG),如37%(体积/体积)PEG(Gefter等,1977)的方法。使用电诱导融合方法也是适当的(Goding,1986,pp.71-74)。
融合方法通常以低频率,约1×10-6到1×10-8产生存活的杂交体。然而,这将不会带来麻烦,因为通过在选择培养基中培养就可从母本未融合的细胞(特别是将正常继续无限分裂的未融合骨髓瘤细胞)中分离出活的融合杂交体。选择培养基一般为含有阻止在组织培养基中核苷酸从头合成试剂的培养基。优选试剂的实例为氨基喋呤、氨甲喋呤和重氮丝氨酸。氨基喋呤和氨甲喋呤同时阻止嘌呤和嘧啶的从头合成,而重氮丝氨酸仅阻止嘌呤的合成。当使用氨基喋呤或氨甲喋呤时,向该培养基中补充次黄嘌呤和胸苷作为核苷酸的来源(HAT培养基)。当使用重氮丝氨酸时,该培养基补充以次黄嘌呤。
优选的选择培养基为HAT。仅仅能够运行核苷酸补救途径的细胞才能够在HAT培养基中存活。骨髓瘤细胞缺少补救途径的关键酶,如,次黄嘌呤磷酸核糖基转移酶(HPRT)并且它们不能够存活。B-细胞可运行该途径,但它们在培养中具有有限的生活周期并且一般在大约2周内死亡。因此,仅仅是可在选择培养基中存活的细胞才是由骨髓瘤和B-细胞所形成的那些杂交体。
该培养提供了杂交瘤种群,从中可筛选出特异性的杂交瘤。一般地,通过在微滴定板中的单克隆稀释培养细胞,然后测试该单克隆上清液的所需反应性(大约2到3周后)来完成杂交瘤的筛选。此分析应该是敏感、简单而快速的,如放免分析、酶免分析、细胞毒性分析、噬菌斑分析、点印迹结合分析等。
然后将系列稀释这些筛选出的杂交瘤并且克隆成为产生单一抗体的细胞系,然后可无限扩增这些克隆以提供mAbs。该细胞系可以二种基本的方式利用于mAb的制备。可将该杂交瘤样品注射(经常是进入腹腔)到组织相容性的动物类型中,该种动物是用于提供原初融合的体细胞和骨髓瘤细胞。注射后的动物形成分泌由该融合细胞杂交体产生的特异性单克隆抗体的肿瘤。然后可排出该动物的体液,如血清或腹水以提供高浓度的mAbs。也可在体外培养该单个细胞系,其中的mAbs自然分泌至培养基中,从中可容易地获取高浓度的mAbs。如果必要,可用过滤、离心和各种层析方法如HPLC或亲和层析进一步纯化由这两种方法中任何一种所产生的mAbs。3.0附图简述
下面的附图形成了本说明书的一部分并且被包括进是进一步说明的有些方面。通过参考一个或更多个这些附图结合这里列出的具体实施方案的详述可更好地理解本发明。
图.1.图1A中描绘了野生型δ-内毒素和用于构建与本发明有关的杂合δ-内毒素的有关限制性位点。显示了仅仅为编码含在所示质粒(由“pEG”前缀鉴别)中δ-内毒素的DNA。含有所示质粒的苏云金芽孢杆菌菌株由“EG”前缀所鉴别。本发明中所述的杂合δ-内毒素描绘于图1B中并且与图1A中的野生型δ-内毒素作比较。
图.2.通过SDS-PAGE分析相同量的每种清洗过的形成芽孢的苏云金芽孢杆菌培养物。a道:产生Cry 1 Ac的对照苏云金芽孢杆菌菌株EG 11070、b:EG 11060、c:EG 11062、d:EG11063、e:EG 11065、f:EG 11067、g:EG 11071、h:EG 11073、i:EG11074、j:EG 11088、k:EG 11090、和l:EG 11091。
图.3.将溶解的杂合δ-内毒素暴露于胰蛋白酶0、15、30、60和120分钟。通过SDS-PAGE分析得到的物质。通过用分子动力学300A型光密度计进行光密度扫描定量残余活性δ-内毒素片段的量。残余活性毒素的百分比对时间作图。野生型Cry 1 Ac δ-内毒素(空方框)用作对照。
图.4.图示用于构建由pEG 381所编码的并且在EG 11768中表达的杂合δ-内毒素的野生型毒素和有关的限制位点。仅仅显示编码含于所示质粒(由“pEG”前缀所识别)中δ-内毒素的DNA。4.0序列标识简述
SEQ ID NO:1为寡核苷酸引物A。
SEQ ID NO:2为寡核苷酸引物B。
SEQ ID NO:3为寡核苷酸引物C。
SEQ ID NO:4为寡核苷酸引物D。
SEQ ID NO:5为寡核苷酸引物E。
SEQ ID NO:6为寡核苷酸引物F。
SEQ ID NO:7为寡核苷酸引物G。
SEQ ID NO:8为寡核苷酸引物H。
SEQ ID NO:9为EG 11063杂合δ-内毒素的核苷酸和推导的氨基酸序列。
SEQ ID NO:10以三-字母的简写形式表示在SEQ ID NO:9中定义的杂合δ-内毒素的氨基酸序列。
SEQ ID NO:11为EG 11074杂合δ-内毒素的核苷酸和推导的氨基酸序列。
SEQ ID NO:12以三-字母的简写形式表示在SEQ ID NO:11中定义的杂合δ-内毒素的氨基酸序列。
SEQ ID NO:13为EG 11735杂合δ-内毒素的核苷酸和推导的氨基酸序列。
SEQ ID NO:14以三-字母简写形式表示在SEQ ID NO:13中定义的杂合δ-内毒素的氨基酸序列。
SEQ ID NO:15为pEG 1065、pEG 1070和pEG 1074的5′交换位点。
SEQ ID NO:16为pEG 1067、pEG 1072和pEG 1076的5′交换位点。
SEQ ID NO:17为pEG 1068、pEG 1077和pEG 365的5′交换位点。
SEQ ID NO:18为pEG 1088和pEG 1092的5′交换位点。
SEQ ID NO:19为pEG 1089的5′交换位点和pEG 1070和pEG1072的3′交换位点。
SEQ ID NO:20为pEG 1091的5′交换位点。
SEQ ID NO:21为pEG 1065、pEG 1067、pEG 1068、pEG1093、pEG 378和pEG 365的3′交换位点。
SEQ ID NO:22为pEG 1088的3′交换位点。
SEQ ID NO:23为寡核苷酸引物I。
SEQ ID NO:24为寡核苷酸引物J。
SEQ ID NO:25为EG 11092的编码杂合晶体蛋白基因的核酸序列和推导的氨基酸序列。
SEQ ID NO:26为由SEQ ID NO:25所编码的菌株EG 11092所产生的杂合晶体蛋白的三-字母简写形式的氨基酸序列。
SEQ ID NO:27为EG 11751的编码杂合晶体蛋白基团的核酸序列和推导的氨基酸序列。
SEQ ID NO:28为由SEQ ID NO:27所编码的菌株EG 11751所产生的杂合晶体蛋白的三-字母简写形式的氨基酸序列。
SEQ ID NO:29为EG 11091的编码杂合晶体蛋白基因的核酸序列和推导的氨基酸序列。
SEQ ID NO:30为由SEQ ID NO:29所编码的菌株EG 11091所产生的杂合晶体蛋白的三-字母简写形式的氨基酸序列。
SEQ ID NO:31为寡核苷酸引物K。
SEQ ID NO:32为pEG 378和pEG 381的5′交换位点。
SEQ ID NO:33为EG 11768的编码杂合晶体蛋白基因的核酸序列和推导的氨基酸序列。
SEQ ID NO:34以三-字母的简写形式表示由SEQ ID NO:33所编码的菌株EG 11768产生的杂合晶体蛋白的氨基酸序列。
SEQ ID NO:35为pEG 1074、pEG 1076、pEG 1077和pEG 381的3′交换位点。5.0说明性实施方案的描述5.1用于培养苏云金芽孢杆菌以制备Cry蛋白的方法
可用已知标准的培养基和发酵技术培养这里所述的苏云金芽孢杆菌菌株。发酵循环完成后,可通过本领域中众所周知的方法首先从发酵培养基中分离苏云金芽孢杆菌孢子和晶体而收获细菌。回收的苏云金芽孢和晶体可通过添加表面活性剂、分散剂、惰性载体和其它成分而配制成可增湿的粉末、液体浓缩物、微粒或其它制剂以利于处理和施用至特定的靶害虫。此配制和施用方法在本领域中是众所周知的并且与抗鳞翅目,如毛虫的活性苏云金芽孢杆菌(HD-1)商业菌株一起使用。5.2用于CRY基因表达的重组宿主细胞
本发明的核苷酸序列可导入多种微生物宿主中。毒素基因的表达直接或间接导致了细胞内产生和具有杀虫剂。对于适宜的宿主,如假单胞菌,可将该微生物施用至鳞翅目昆虫的位点,这些昆虫将在此繁殖并且摄食这些微生物。结果是控制了不需要的昆虫。作为选择,可在延长细胞中产生毒素活性的条件下处理具有毒素基因的微生物。然后将处理的细胞施用至靶害虫的环境中。得到的产物维持有苏云金芽孢杆菌毒素的毒性。
合适的宿主细胞(其中将处理含有杀虫剂的细胞以延长细胞中毒素的活性,然后将处理的细胞施用至靶害虫的环境中)可以包括原核或真核生物,一般限于不产生对高等生物,如哺乳动物具有毒性物质的那些细胞。然而,当该毒素不稳定或施用水平足够低从而避免对哺乳动物宿主任何可能性或毒性时,也可使用产生对高等生物具有毒性物质的生物。作为宿主,特别感兴趣的将是原核生物和低等的真核生物,如真菌。说明性的格兰氏-阴性和格兰氏-阳性原核生物包括肠杆菌科,如埃希氏菌属、欧文氏菌属、志贺氏菌属、沙门氏菌属、和变形菌属;芽孢杆菌科;根瘤菌科,如根瘤菌属;螺菌科,如发光杆菌属、发酵单胞菌属、沙雷氏菌属、气单胞菌属、弧菌属、脱硫弧菌属、螺菌属;乳杆菌科,假单胞菌科,如假单胞菌属和醋杆菌属;固氮菌科,放线菌目和硝化杆菌科。真核生物中有真菌,如藻状菌纲和子囊菌纲,其包括酵母如酵母属和裂殖酵母属;和担子菌纲酵母,如红酵母属、短柄霉属、掷孢酵母属等。
在筛选用于制备宿主细胞中的特定目的特征包括导入苏云金芽孢杆菌基因至宿主中的简单易行性、表达系统的可获得性、表达的效率、宿主中杀虫剂的稳定性和辅助性遗传能力的存在。用作杀虫剂微胶囊(microcapsule)目的的特征包括对杀虫剂的保护性特征,如厚的细胞壁、色素形成、和细胞内包装或形成包涵体;叶片亲和性;缺乏哺乳动物毒性;对害虫摄食的趣向性;杀死和固定而不损害毒素的简单易行性等。其它因素包括配制和处理的简单易行性、经济性、贮存的稳定性等。
特定目的的宿主生物包括酵母,如红酵母属、短柄霉属、酵母属和掷孢酵母属等;叶面(phylloplane)生物如假单胞菌属、欧文氏菌属和黄杆菌属的种类;或者一些其它的生物如埃希氏菌属、乳杆菌属、芽孢杆菌属、链霉菌属等。具体的生物包括铜绿假单胞菌、荧光假单胞菌、啤酒糖酵母、苏云金芽孢杆菌、枯草芽孢杆菌、大肠杆菌、浅青紫链霉菌等。
只要其既不有害地影响毒素的特性,又不降低细胞保护该毒素的能力,那么可用化学或物理方法,或同时用化学和/或物理方法处理微生物细胞,如含有苏云金芽孢杆菌毒素基因的微生物。化学试剂的实例为卤化试剂,特别是原子序数在17-80的卤素。更为特别地,碘可在温和条件下和达到所需结果的足够时间下可以使用。其它合适的技术包括以下面的试剂处理,包括醛,如甲醛和戊二醛;抗菌剂,如苯扎氯铵和氯化十六烷基吡啶;醇,如异丙醇和乙醇;各种组织学固定剂,如卢戈尔碘溶液、布安固定剂和Helly′s固定剂(参见,如,Humason,1967);或者物(热)和化学试剂的组合,当将细胞施用至适宜的宿主时它们保持并延长细胞中产生的毒素的活性。物理方法的实例有短波长辐射如γ-辐射和X-辐射、冷冻、UV照射、冷冻干燥等。尽管在有些情况可以利用孢子,但利用的细胞将一般是完整的并且当被处理时基本上为增殖的形式而不是孢子的形式。
当通过合适的载体将苏云金芽孢杆菌毒素基因导入到微生物宿主中,并且将所述活性形式的宿主施用至环境中时,使用某些宿主微生物是必要的。筛选出已知占据一种或更多种目的作物“植物圈”(叶面、叶际(phyllosphere)、根际、和/或根表)的微生物宿主。筛选出这些微生物是为了在特定的环境中(作物和其它昆虫栖息地)能够与野生型微生物成功地竞争,提供表达该多肽杀虫剂基因的稳定的维持与表达,并且,最理想地是将对该杀虫剂更好的保护从而免受环境降解和失活。
已知多种微生物栖息于许多种重要作物的叶面(植物叶子表面)和/或根际(围绕植物根的土壤)。这些微生物包括细菌、藻类和真菌。具有特别意义的微生物有,如细菌,例如,芽孢杆菌属、假单胞菌属、欧文氏菌属、沙雷氏菌属、克雷伯氏菌属、Zanthomonas、链霉菌属、根瘤菌属、红假单胞菌属、嗜甲基菌属、农杆菌属、醋杆菌属、乳杆菌属、节杆菌属、固氮菌属、明串珠菌属和产碱菌属;真菌,特别是酵母、如糖酵母属、隐球酵母属、克鲁维酵母属、掷孢酵母属、红酵母属和短柄霉属。特别有意义的植物圈细菌种类如丁香假单胞菌、荧光假单胞菌、粘质沙雷氏菌、木醋杆菌、根癌农杆菌、类球红细菌、野油菜黄单胞菌、苜蓿根瘤菌、真氧产碱菌和棕色固氮菌;和植物圈酵母种类如深红酵母(Rhodotorula rubra)、胶粘红酵母(R.glutinis)、海滨红酵母(R.marina)、橙黄红酵母(R.aurantiaca)、浅白色隐球酵母(Cryptococcusalbidus)、流散隐球酵母(C.diffluens)、罗仑氏隐球酵母(C.1aurentii)、罗茜糖酵母(Saccharomyces rosei)、善地糖酵母(S.pretoriensis)、啤酒糖酵母、红色掷孢酵母(Sporobolomyces roseus)、香气掷孢酵母(S.odorus)、佛地克鲁维氏酵母(Kluyveromycesveronae)和出芽短柄霉(Aureobasidium pollulans)。5.3定义
下面的单词和词语具有以下的意义。
广-谱:指广泛的昆虫种类。
广-谱杀虫活性:对各种昆虫种类的毒性。
表达:细胞内过程的组合,包括由编码的DNA分子如结构基因的转录和翻译以产生多肽。
杀虫活性:对昆虫的毒性。
杀虫特异性:由晶体蛋白对多种昆虫种类所显示的毒性。
目内特异性(Intraorder Specificity):特定的晶体蛋白对一个目内(如,鳞翅目)昆虫种类的毒性。
目间特异性:特定的晶体蛋白对不同目(如鳞翅目和双翅目)昆虫种类的毒性。
LC50:导致处理的昆虫50%死亡率的晶体蛋白的致死浓度。
LC95:导致处理的昆虫95%死亡率的晶体蛋白的致死浓度。
启动子:一个或一组DNA序上提供结构基因表达控制元件的识别位点并且RNA聚合酶特异性地结合到该基因的此位置并起始RNA合成(转录)。
再生:从植物细胞(如,植物原生质体或外植体)中长出植物的过程。
结构基因:被表达以产生多肽的基因。
转化:将外源DNA序列(如,载体、重组DNA分子)导入细胞或原生质体中的过程,该外源DNA序列掺入到细胞或原生质体的染色体中或能够自主复制。
转化的细胞:通过导入外源DNA分子到该细胞中而变了其DNA的细胞。
转基因:当经过如转化、电穿孔、粒子轰击等方法而导入到宿主细胞的基因组中时由该宿主细胞表达并且整合入这些细胞的基因组中从而由该转基因的表达所产生的一个或多个特征遗传至该转化细胞的后代中的外源基因。
转基因细胞:从转化的细胞衍生或再生的或从转基因细胞衍生的任何细胞。转基因细胞的实例包括源自转化植物细胞的植物愈伤组织和特定的细胞如叶、根、茎,如获自转基因植物的体细胞或生殖(胚芽)细胞。
转基因植物:源自转化植物细胞或原生质体的植物或其后代,其中的植物DNA含有最初不存在于天然、非-转基因相同品系的植物中的外源DNA分子。术语“转基因植物”和“转化的植物”有时在本领域中用作同义语以表示其DNA含有外源DNA分子的植物。然而,认为称获自转化植物细胞或原生质体的再生植物或愈伤组织为转基因植物是更为科学而准确的,并且其用途将在后面描述。
载体:能够在宿主细胞中复制并且/或可与另一种DNA片段可操作地连接从而导致附着片段的复制的DNA分子。质粒为载体的实例。5.4探针和引物
在另一方面,由本发明提供的DNA序列信息允许制备具有与这里公开的筛选出的多核苷酸基因序列特异性杂交能力的相对较短的DNA(或RNA)序列。在这些方面,根据筛选出晶体蛋白基因序列,如在SEQ IDNO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29或SEQ ID NO:33中显示出的序列制备适当长度的核酸探针。该核酸探针与编码晶体蛋白基因序列特异性杂交的能力赋予它们在多种实施方案中特定的用途。更为重要的是,这些探针可用于多种分析中以用于测定互补序列在给定样品中的存在。
在一些实施方案中,使用寡核苷酸引物是优越的。用本发明的多核苷酸设计这些引物序列从而用PCRTM技术测定、扩增或突变苏云金芽孢杆菌晶体蛋白一定的片段。来自其它种类有关晶体蛋白基因片段也可用这些引物通过PCRTM加以扩增。
为了提供根据本发明的一些优势,用于杂交研究或分析的优选的核酸序列包括与编码晶体蛋白序列的至少14到30个左右核苷酸长度的片段互补的序列,编码晶体蛋白的序列片段如SEQ ID NO:9、SEQ IDNO:11、SEQ ID NO:13、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29或SEQ ID NO:33中所显示,至少14个核苷酸长度的大小有助于保证该片段将形成稳定而选择性的双链分子的足够长度。为了增加杂交体的稳定性和选择性并且因此提高获得的特异性杂交分子的质量和程度,具有与跨越大于14个碱基长度片段互补序列的分子一般是优选的。当需要时,人们将一般喜欢设计具有14到20个核苷酸基因互补片段的核酸分子或更长的分子。例如,通过化学方法直接合成该片段,通过用核酸复制技术,如美国专利4,683,195和4,683,202的PCRTM技术(在此特异性掺入每个仅供参考),或通过从含有适当插入子和适当限制位点的重组质粒中切下选定的DNA片段可容易地制备这些片段。5.5表达载体
本发明涉及包括本发明多核苷酸的表达载体。因此,在一个实施方案中,表达载体为包括可操作地连接到编码本发明多肽编码区上的启动子的分离纯化的DNA分子,其编码区可操作地连接到转录终止区域,继而该启动子驱动此编码区域的转录。
如这里所使用的,术语“可操作地连接”意为以这样的方式将启动子连接到编码区上从而该编码区的转录受该启动子的控制和调节。用于可操作地连接启动子到编码区上的方法在本领域中是众所周知的。
在细菌中起作用的启动子在本领域中是众所周知的。用于芽孢杆菌晶体蛋白的优选启动子实例包括sig A、sig E和sig K基因启动子。作为选择,也可使用编码天然、诱变或重组晶体蛋白基因的启动子本身。
当本发明的表达载体要用于转化植物时,选择具有在植物中驱动表达能力的启动子。在植物中起作用的启动子在本领域中是众所周知的。在植物中表达该多肽中有用的启动子有可诱导的、病毒的、合成的、组成性的启动子,如已描述过的那样(Poszkowski等,1989;Odell等,1985)和时间调控、空间调控和时-空调控的启动子(Chau等,1989)。
也选择这样的启动子,其具有介导转化植物细胞或转基因植物编码区转录活性的能力。结构基因可由植物组织中多种启动子所驱动。启动子可以是近-组成性的,如影响双子叶或单子叶的CaMV 35 S启动子、或组织特异性或发育特异性启动子。
当该启动子为近-组成性启动子如CaMV-35 S时,发现在多种转化的植物组织中有多肽表达的增加(如,愈伤组织、叶片、种子和根部)。作为选择,通过用含有组织特异性启动子的植物整合载体可将转化的效应归结于特定的植物组织。
组织特异性启动子的实例为对种子组织特异性的凝集素启动子。大豆中的该凝集素蛋白由单基因(Lel)所编码,其仅在种子成熟过程中表达并且占种子总mRNA的约2%到5%。此凝集素基因和种子-特异性启动子已进行过彻底的特征分析并用于在转基因烟草植物中指导种子特异性的表达(Vodkin等,1983;Lindstrom等,1990)。
将含有编码目的多肽编码区的表达载体进行加工从而使其在凝集素启动子的控制下并且用,例如,原生质体转化方法(Dhir等,1991)将该载体导入植物中。该多肽的表达具体与该转基因植物的种子有关。
从以组织特异性启动子转化的植物细胞制备的本发明转基因植物可与从以不同组织特异性启动子转化的植物细胞形成的第二种转基因植物杂交从而制备显示出不止一种特异性组织中转化效应的杂交转基因植物。
组织特异性启动子的实例有玉米蔗糖合成酶1(Yang等,1990)、玉米乙醇脱氢酶1(Vogel等,1989)、玉米集光复合体(Simpson,1986)、玉米热休克蛋白(Odell等,1985)、豌豆小亚单位RuBP羧化酶(Poulsen等,1986;Cashmore等,1983)、Ti质粒甘露氨酸合酶(Langridge等,1989)、Ti质粒胭脂氨酸合酶(Langridge等,1989)、矮牵牛查耳酮异构酶(Van Tunen等,1988)、蚕豆富含甘氨酸蛋白1(Keller等,1989)、CaMV 35 s转录本(Odell等,1985)和土豆patatin(Wenzler等,1989)的启动子。优选的启动子为花椰菜花叶病毒(CaMV 35 S)启动子和S-E9小亚单位RuBP羧化酶启动子。
表达载体和最终多肽编码区与哪一个启动子可操作地连接的选择直接依赖于所需的功能特性,如蛋白表达的位置和时间选择,和待转化的宿主细胞。这些是在构建重组DNA分子领域中众所周知的固有限制。然而,用于完成本发明的载体能够指导与载体可操作地连接的多肽编码区域的表达。
用于高等植物中基因表达的典型载体在本领域中是众所周知的并且包括来源于已述根癌农杆菌诱导-肿瘤(Ti)质粒的载体(Rogers等,1987)。然而,已知数种其它植物整合载体系统在植物中起作用,包括已述的pCaMVCN转移控制载体(Fromm等,1985)。pCaMVCN(可从Pharmacia,Piscataway,NJ获得)包括花椰菜花叶病毒CaMV 35 S启动子。
在优选的实施方案中,用于表达该多肽的载体包括在植物细胞中有效的选择标记,优选为药物抗性选择标记。一种优选的药物抗性标记为其表达导致卡那霉素抗性的基因,即已述的含有胭脂氨酸合酶启动子、Tn 5新霉素磷酸转移酶II(npt II)和胭脂氨酸合酶3′非翻译区的嵌合基因(Rogers等,1988)。
RNA聚合酶经过聚腺苷酸化出现的位点转录编码DNA序列。一般地,位于聚腺苷酸化下游数百个碱基对处的DNA序列用于终止转录。这些DNA序列在此称为转录终止区。这些区域对于转录信使RNA(mRNA)的有效聚腺苷酸化是必需的。
用于制备表达载体的方法在本领域中是众所周知的。用于转化植物(转化载体)的表达和制备这些载体的方法描述于美国专利4,971,908、4,940,835、4,769,091和4,757,011(在此特异性地掺入每例供参考)中。可修饰这些载体以包括根据本发明的编码序列。
已开发出多种通过互补粘性末端或钝端可操作地将DNA连接到载体上的方法。例如,将互补的同聚物特征添加到待插入的DNA片段上和载体DNA上。然后通过互补同聚物尾部之间的氢键连接载体与DNA片段以形成重组DNA分子。
编码具有赋予细胞杀虫活性多肽的编码区优选为嵌合的编码苏云金芽孢杆菌晶体蛋白的基因。在优选的实施方案中,该多肽具有SEQ lDNO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30或SEQ ID NO:34的氨基酸残基序列;或这些序列中一个或更多个功能等价物的序列。根据此实施方案,包括SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29或SEQ IDNO:33 DNA序列的编码区域也是优选的。5.6转化或转基因植物细胞
以本发明表达载体转化的细菌、酵母细胞、或植物细胞或植物也被涉及到。来自该转化或转基因细胞的转基因细菌、酵母细胞、植物细胞或植物也被涉及到。用于转化细菌和酵母细胞的方法在本领域中是众所周知的。一般地,转化的方法与众所周知的用于转化其它细菌或酵母如大肠杆菌或啤酒糖酵母的方法类似。
用于植物细胞DNA转化的方法包括农杆菌-介导的植物转化、原生质体转化、基因转移入花粉、注射至生殖器官中、注射至未成熟胚胎和粒子轰击。这些方法中的每一个具有独特的优点和缺点。因此,一种将基因导入特定植物品系中的特定方法可能不一定对于另一种植物品系是最为有效的,但是哪一种方法对于特定植物品系是有用的是众所周知的。
有许多种将转化DNA片段导入细胞中的方法,但并不是所有方法均适用于将DNA运载至植物细胞中。认为适宜的方法包括实际上可将DNA导入细胞中的任何方法,如根癌农杆菌及有关农杆菌的感染、DNA的直接转运,如,通过PEG-介导的原生质体转化(Omirulleh等,1993)、干燥/抑制-介导的DNA摄入、电穿孔、碳化硅纤维的搅拌、DNA包被粒子的加速等。在有些实施方案中,加速方法是优选的并且包括,例如,微粒轰击等。
用于导入DNA至细胞中的技术对于本领域中的技术人员是众所周知的。已描述过四种将基因导入细胞中的常用方法:(1)化学方法(Graham和van der Eb,1973);(2)物理方法如显微注射(Capecchi,1980)、电穿孔(Wong和Neumann,1982;Fromm等,1985)和基因枪(Johnston和Tang,1994;Fynan等,1993);(3)病毒载体(Clapp,1993;Lu等,1993;Eglitis和Anderson,1988a;1988b);和(4)受体-介导的机制(Curiel等,1991;1992;Wagner等,1992)。5.6.1电穿孔
应用简单、高压电脉冲至多种动植物细胞导致在质膜上形成纳米大小的孔。然后或者经过这些孔或者由于伴随孔的闭合而膜组分的重组而直接将DNA摄入细胞质中。电穿孔可能是极其有效的并且可同时用于克隆基因的短暂表达和带有目的基因整合拷贝的细胞系的建立。电穿孔,与磷酸钙-介导的转染和原生质体融合相比,频繁得到带有一个,或至多数个外源基因整合拷贝的细胞系。
通过电穿孔方法导入DNA对于本领域的技术人员是众所周知的。在该方法中,利用一些降解细胞壁的酶,如降解果胶的酶使靶受体细胞较未处理的细胞对于电穿孔转化更为敏感。作为选择,通过机械研磨使受体细胞对转化更为敏感。为了完成电穿孔转化,人们可以利用易碎的组织如细胞悬液,或胚胎发育的愈伤组织,或者作为选择,人们可以直接转化未成熟胚胎或其它结构的组织。人们将通过将其暴露于降解果胶的酶(溶果胶酶)或以控制的方式机械研磨而部分地降解选定细胞的细胞壁。然后这些细胞将对于电穿孔的DNA转移是感受态的(recipient),可在此时完成该过程,且然后根据新掺入DNA的性质通过合适的筛选或选择步骤鉴定转化的细胞。5.6.2微粒轰击
用于转运转化的DNA片段至植物细胞的进一步优越的方法是粒子轰击。在该方法中,粒子可以核酸包被并且通过推进力转入细胞中。粒子的实例包括钨、金、铂等。
除了其是可重复而稳定转化单子叶植物的有效方法外,粒子轰击的优势在于其既不需要分离原生质体(Cristou等,1988)又不需对农杆菌感染的易感性。用于通过加速将DNA运载至玉米细胞中的方法的说明性实施方案为Biolistics Particle Delivery System,其可于经筛子、如不锈钢或Nytex筛子将包被DNA或细胞的粒子推进至覆盖有培养悬液中玉蜀黍(corn)细胞的滤膜表面。此筛子分散这些颗粒从而它们不以大团块的形式运载至受体细胞中。据认为在发射器与待轰击细胞之间的筛子减少投射物的大小并且可通过减少太大的投射物对受体细胞造成的损害而促进更高频率的转化。
对于轰击,悬液中的细胞优选于滤膜上或固体培养基上进行浓缩。作为选择,未成熟胚胎或其它靶细胞可安排于固体培养基上。将待轰击的细胞放置于大粒子(macroprojectile)终止板下适当的距离处。如果必要,在加速器和待轰击细胞间也可放置一个或更多个筛子。通过使用前述的技术,人们可以获得达1000或更多灶(foci)短暂表达标记基因的细胞。细胞灶中轰击48小时后表达外源基因产物的细胞数目常为1到10并平均1到3个。
在轰击转化中,人们可优化轰击前的培养条件和轰击参数从而产生最大数目的稳定转化子。轰击的物理和生物学参数在该技术中是重要的。物理因素为包括操作DNA/微粒沉淀物的那些因素或影响大或小微粒飞行和速度的那些因素。生物学因素包括涉及轰击前和轰击后即刻操作细胞的所有步骤、为了帮助减轻与轰击有关的损伤而对靶细胞的渗透调节和转化DNA的性质,如线性DNA或完整超螺旋质粒。据认为轰击前的操作对于成功转化未成熟胚胎是特别重要的。
因此,应该考虑到人们在小规模研究中可能希望调整各种轰击参数以彻底地优化条件。人们可能特别希望调整物理参数如间隙距离(gapdistance)、飞行距离、组织间距、和氦压。通过改变影响受体细胞生理状态的条件并且因此可影响转化和整合效率,人们也可最大限度地减少损伤减少因素(TRFs)。例如,可从调整渗透状态、组织水化和传代培养时期或受体细胞的细胞周期以用于最佳转化。根据本发明内容指导下,进行其它常规的调整对于本领域中的技术人员将是众所周知的。
粒子-介导的转化方法对于本领域中的技术人员是众所周知的。美国专利5,015,580(特异性在此掺入供参考)描述了用该技术对大豆的转化。5.6.3农杆菌-介导的转移
农杆菌-介导的转移是可广泛用于将基因导入植物细胞中的系统,因为该DNA可导入完整的植物组织中,继而绕过了从原生质体再生完整植株的必要。用农杆菌介导的植物整合载体将DNA导入植物细胞中在本领域中是众所周知的。参见,例如,已述的方法(Fraley等,1985;Rogers等,1987)。用农杆菌-介导的转移对棉花植物的遗传工程描述于美国专利5,004,863(在此特异性地掺入供参考)中,而莴苣植物的转化描述于美国专利5,349,124(在此特异性地掺入供参考)中。此外,Ti-DNA的整合是很少导致重排的相对精确的方法。待转移的DNA区域由边界序列所限定,并且通常按已述将间插DNA插入到植物基因组中(Spielmann等,1986;Jorgensen等,1987)。
当今的农杆菌转化载体能够在大肠杆菌以及农杆菌中复制,能够按所述进行方便的操作(Klee等,1985)。此外,最近在农杆菌-介导基因转移载体中的技术进展改进了载体中基因和限制位点组织从而利于构建能够表达各种多肽编码基因的载体。所述的载体(Roger等,1987)具有方便的多接头区域并且适用于本发明的目的,其中多接头区域的二侧为用于插入多肽编码基因直接表达的启动子和聚腺苷酸化位点。此外,同时含有有臂(armed)和无臂(disarmed)Ti基因的农杆菌可用于转化。在农杆菌-介导的转化有效的那些植物品系中,由于基因转移简单易行且特定的性质而成为最佳的方法。
农杆菌介导的对叶片和其它组织如子叶和下胚轴的转化似乎限于农杆菌自然感染的植物。农杆菌介导的转化在双子叶植物中最为有效。尽管已按所述用农杆菌在芦笋中制备了转基因植物(Bytebier等,1987),但很少单子叶植物似乎是农杆菌的天然宿主。因此,商业重要的禾谷如水稻、玉蜀黍和小麦通常必须用其它方法加以转化。然而,如上述,也可用农杆菌完成对芦笋的转化(参见,如Bytebier等,1987)。
用农杆菌转化方法形成的转基因植物一般在染色体上含有一个基因。由于该添加的基因,此转基因植物可称为杂合的。然而,由于单词“杂合”的使用通常指在一对染色体的第二条染色体相同位点存在互补基因,并且在此处含有一个添加基因的植物中没有这样的基因,认为这样植物更为准确的名字为独立的分离子,因为添加的外源基因在有丝分裂和减数分裂期间独立地分离。
更为优选的是转基因植物对于添加的结构基因是纯合的;即含有2个添加基因的转基因植物,即在一对染色体的每条染色体相同位点各具一个基因。纯合的转基因植物可通过以下方法而获得,包括有性交配(自交)含有一个添加基因的独立分离的转基因植物、萌发一些产生的种子并且分析得到植物较对照(天然、非转基因)或独立分离转基因植物增强的羧化酶活性。
应当明白也可交配两种不同的转基因植物以制备含有二种独立分离的添加外源基因的后代。适当后代的自交可以产生对编码目的多肽的2个添加外源基因均为纯合的植物。也可考虑与母本植物的回交和与非-转基因植物的异型杂交。
植物原生质体的转化可根据下面的方法完成,包括磷酸钙沉淀、聚乙二醇沉淀、电穿孔、和这些处理的组合(参见,如,Potrykus等,1985;Lorz等,1985;Fromm等,1985;Uchimiya等,1986;Callis等,1987;Macrott等,1988)。
不同植物品系中这些系统的施用依赖于从原生质体中再生此特定植物的能力。已描述过从原生质体中再生禾谷类的说明性方法(参见,如Fujimura等,1985;Toriyama等,1986;Yamada等,1986;Abdullah等,1986)。
为了转化不能从原生质体中成功再生的植物品系,可以利用其它将DNA导入完整细胞或组织中的方法。例如,按所述可从未成熟胚胎或外植体中再生出禾谷类(Vasil,1988)。此外,可以利用“粒子枪”或高速微粒技术(Vasil,1992)。
用此后者技术,按所述将DNA经细胞壁带入小金属颗粒上的原生质体中(Klein等,1987;Klein等,1988;McCabe等,1988)。该金属粒子穿透数层细胞且因而允许对组织外植体内部细胞的转化。5.6.4植物中基因的表达
与单细胞生物相比,植物编码子的使用更与人类和其它高等生物类似的事实,未修饰的细菌基因常在转基因植物中表达较差。在密码子第三位对GC含量的明显的总的偏向性已由Murray等(1990)进行过详述。该书中描述的207种植物基因允许对植物中氨基酸密码子的倾向性进行编辑(compilation)。这些作者描述了在单子叶和双子叶植物中密码子使用的差异以及叶绿体编码基因与核编码基因之间密码子使用的差异。利用供给的密码子频率表,本领域中的技术人员通过修饰该DNA序列可加工此细菌序列用于在植物中表达从而提供在第三位置密码子对G或C的偏向性。
Diehn等(1996)的工作详述了修饰原核生物来源的基因序列以让其在植物中表达。Iannacone等(1997)描述了以编码cry 3类内毒素的遗传工程苏云金芽孢杆菌基因对番茄(egg plant)的转化。利用避免聚腺苷酸化序列,ATTA序列和剪切位点,构建使编码的毒素在植物体内表达的合成基因。Rouwendal等(1997)已描述水母绿色荧光蛋白在转基因烟草中的表达。用合成的基因,建立第三位置的密码子对C+G的偏向性从而使外源基因在植物中表达。
Fütterer和Hohn(1996)描述了mRNA序列、前导序列、多顺反子信息和内部核糖体结合位点motis对植物中表达的影响。通过构建合成基因对这些序列的修饰使病毒mRNA能够在转基因植物细胞中表达。
尽管近年在制备表达细菌蛋白如苏云金芽孢杆菌晶体蛋白的植物中取得巨大的进展,但在植物中表达天然细菌基因的结果又常是令人失望的。与微生物遗传学不同,有关影响外源基因在植物中异源表达因素的早期植物遗传学知之甚少。然而,近年来,数种重要的因素作为主导者参与改变特定编码序列的蛋白表达水平的程度。例如,科学家现已知道在细胞中维持显著水平的特定mRNA的确是关键因素。不幸的是,编码外源蛋白mRNA的低稳定状态水平原因有很多。首先,全长RNA合成可能不以高频率发现。这可能,例如,由于转录期间RNA的提早终止或者由于转录期间没有预期到的mRNA加工所造成的。其次,植物细胞中可能产生全长RNA,但然后在核中以产生无功能mRNA的方式进行加工(剪切、polyA添加)。如果该RNA没有被适当合成、终止和聚腺苷酸化,其不能够移动到细胞质中用于翻译。类似地,在细胞质中,如果mRNA具有降低的半寿期(由其一级或二级结构序列所测定),那么将产生不充足的蛋白产物。此外,还不能确定翻译效率对mRNA半寿期影响的幅度。此外,每种RNA分子折叠成由其序列所决定的特定的结构或结构家族。任何RNA的特定结构可能导致细胞质中更大或更少的稳定性。结构本身也可能是核内mRNA加工的决定因素。不幸的是,不可能预言并且几乎不可能测定体外或体内任何RNA(除tRNA)的结构。然而,很可能剧烈地改变RNA的序列将对其折叠的结构具有较大的影响。很可能结构本身或特定的结构特征在决定RNA稳定性中也具有作用。
为了克服在外源基因表达中的这些局限,研究人员已鉴定出RNA中对其稳定性具有特定影响的特定序列和信号。在本发明的一些实施方案中,因此,需要优化公开的核酸序列片段在植物体内的表达。这样做的一个特定方法是通过改变细菌基因以去除降低在转化的植物细胞中表达的序列或基序。加工编码序列从而在植物体中最佳表达的过程经常称为“植物化”DNA序列。
特别麻烦的序列是富含A+T的那些序列。不幸的是,由于苏云金芽孢杆菌具有富含A+T的基因组,故必须经常修饰天然晶体蛋白基因序列从而在植物中最佳表达。基序ATTTA(或当其出现于RNA中的AUUUA)已用作对哺乳动物细胞mRNA进行去稳定化的序列(Shaw和Kamen,1986)。许多短寿命的mRNA具有富含A+T的3′非翻译区,并且这些区域经常具有ATTTA序列,有时以多拷贝或多聚体(如,ATTTATTTA…)存在。Shaw和Kamen显示将不稳定mRNA的3′末端转移至稳定的RNA(珠蛋白或VA 1)大大降低了稳定RNA的半寿期。他们进一步显示五聚体ATTTA对稳定的信使具有复杂的脱稳定效应,并且此信号无论位于3′末端或编码序列内部均可发挥其效应。然而,ATTTA序列的数目和/或其所处位置左右的序列对于决定是否它们作为去稳定序列而起作用中也是重要的。Shaw和Kamen显示ATTTA三聚体较五聚体对mRNA稳定性的影响要少得多并且二聚体或单聚体对其稳定性没有影响(Shaw和Kamen,1987)。注意到ATTTA多聚体如五聚体自动产生富含A+T的区域。这被显示为细胞质效应,而非核效应。在其它不稳定的mRNA中,此ATTTA序列可能仅以单拷贝存在,但其经常含于富含A+T的区域中。根据目前收集到的动物细胞数据,似乎至少在一些序列中的ATTTA在稳定性中是重要的,但仍不可能预言ATTTA的哪一种出现几率为去稳定因素或者是否这些效应中的任何一个效应有可能在植物中见到。
对动物细胞中mRNA降解的一些研究表明RNA降解有时可能在富含A+T区域中开始受到核苷酸降解攻击。还不清楚是否这些降解在ATTTA序列处出现。也有这样的mRNA实例,即依据其表达的细胞类型或其表达所处的细胞周期时期而具有不同的稳定性。例如,组蛋白mRNA在DNA合成过程中是稳定的但如果DNA合成被打断则不稳定。有些组蛋白mRNA的3′末端似乎负责此效应(Pandey和Merzluff,1987)。其似乎不是由ATTTA所介导,也不清楚是什么控制了该mRNA的不同稳定性。另一个实例是在B细胞成熟过程中B淋巴细胞中IgGmRNA的不同稳定性(Genovese和Milcarek,1988)。最后一个实例是突变的β-thallesemic珠蛋白mRNA的不稳定性。在其中的该基因正常表达的骨髓细胞中,突变的mRNA是不稳定的,而野生型mRNA是稳定的。当突变的基因在体外的Hela或L细胞中表达时,此突变的mRNA没有显示出不稳定性(Lim等,1988)。这些实例均提供了这样的证据,即mRNA稳定性可由细胞类型或细胞特异性因素所介导。此外,此种不稳定性还与特异的序列无关。有了这些不确定性,预言哪一种RNA可能在给定的细胞中是不稳定的是不可能的。此外,根据其中存在RNA的细胞的性质,甚至ATTTA基序可起不同作用。Shaw和Kamen(1987)报导了蛋白激酶C的活化可阻止ATTTA介导的降解。
添加聚腺苷酸链3′末端对于大多数真核mRNA,包括植物和动物mRNA是常见的事。当今已接受的polyA添加的观点是新生的转录本延伸越过成熟的3′末端。此转录本中含有的是聚腺苷酸化和适当的3′末端形成的信号。此3′末端处的加工包括mRNA的切割和添加polyA至成熟的3′末端。通过寻找动物和植物mRNA中靠近polyA的序列(tract)处的共有序列,鉴定明显参与polyA添加和3′末端切割的共有序列已是可能的。相同的共有序列似乎对这两种过程均是重要的。这些信号通常是在序列AATATT上的变异。在动物细胞中,已鉴定出此序列有功能的一些变异体;在植物细胞中,似乎存存在广泛范围的功能序列(Wickens和Stephenson,1984;Dean等,1986)。因为这些共有序列在AATAAA上具有变异,故它们是富含A+T的序列。发此序列一般为成熟mRNA中polyA序列前的15到20bp。动物细胞中的研究表明此序列同时参与polyA添加和3′成熟。此序列中的定点突变可破坏这些功能(Conway和Wickens,1988;Wickens等,1987)。然而,已观察到推断的polyA信号3′达50到100bp的序列也是必需的,即,具有正常AATAAA但在下游已被代替或破坏的基因没有得到适当的聚腺苷酸化(Gil和Proudfoot,1984;Sadofsky和Alwine,1984;McDevitt等,1984)。即,polyA信号本身对于完全而适当的加工是不够的。仍不知道除了polyA信号外,什么特定的下游序列是必需的,或者是否有具有该功能的特异性序列。因此,序列分析仅可鉴定潜在的polyA信号。
在正常聚腺苷酸化的天然mRNA中,已观察到通过改变该mRNA中的polyA信号或其它序列,可获得功能mRNA水平的复杂效应。这已在数种天然mRNA中观察到,目前已有特异基因的结果。
已显示在天然mRNA中,适当的聚腺苷酸化在mRNA积累中是重要的,并且破坏该过程可显著影响mRNA水平。然而,预言在正常基因中变化的效应方面的知识存在还不充足。在杂合基因中,预言此后果甚至更为困难。然而,鉴定出的推断位点功能失常是可能的。即,这些位点可能不是作为适当的polyA位点而起作用,相反,是作为异常位点而起作用从而得到不稳定的mRNA。
在动物细胞系统中,AATAAA是在polyA上游mRNA中鉴定出最为常见的信号,但至少已发现4种变异体(Wickens和Stephenson,1984)。在植物中,还没有做出这么多的分析,但很明显可以使用类似于A..TAAA的多个序列。表4中称为主要或次要植物位点仅仅指Dean等(1986)的研究,其仅仅分析了三种植物基因。聚腺苷酸化位点命名为主要或次要仅仅指其在已分析过的天然基因中作为有功能位点而出现的频率。在植物中这方面数据很有限。以任何确定性预言存在于杂合基因如编码本发明晶体蛋白那些基因中命名为主要或次要位点更有可能或更少有可能部分或完全起作用是困难的。
                         表4
              植物基因中聚腺苷酸化位点PA                     AATAAA                  主要共有位点P1A                    AATAAT                  主要植物位点P2A                    AACCAA                  次要植物位点P3A                    ATATAA                  ″P4A                    AATCAA                  ″P5A                    ATACTA                  ″P6A                    ATAAAA                  ″P7A                    ATGAAA                  ″P8A                    AAGCAT                  ″P9A                    ATTAAT                  ″P10A                   ATACAT                  ″P11A                   AAAATA                  ″P12A                   ATTAAA                  次要动物位点P13A                   AATTAA                  ″P14A                   AATACA                  ″P15A                   CATAAA                  ″
本发明提供用于制备合成植物基因的方法,该基因较以前通常用于植物转化的野生型基因以显著更高的水平表达其蛋白产物。在另一方面,本发明也提供了编码非-植物蛋白的新的合成植物基因。
如上述,天然苏云金芽孢杆菌基因在植物中的表达经常是困难的。苏云金芽孢杆菌基因编码序列的性质使其与植物中的基因以及许多其它在植物中表达的杂合基因有所不同。特别地,苏云金芽孢杆菌基因富含(~62%)腺嘌呤(A)和胸腺嘧啶(T)而植物基因和大多数其它在植物中表达的细菌基因在45~55%A+T的数量级。
由于遗传密码子的简并性和任何氨基酸密码子选择数目的限制,有些芽孢杆菌的结构编码序列的大多数“过多”A+T位于密码子的第三位。即,一些芽孢杆菌基因在许多密码子中具有A或T作为第三个核苷酸。因此A+T含量可部分决定密码子使用偏向性。此外,很明显在其进化的生物中,基因向最大的功能进化。这意味着位于一种生物基因中的特定核苷酸序列(在该生物中此基因除了编码特定片段的氨基酸外可能没有作用)有可能在另一种生物中被识别为基因调控元件(如转录启动子或终止子、polyA添加位点、内含子剪切位点、或特异性mRNA降解信号)。此错读的信号不是异源基因表达的更为常见的特征,但这可部分地由许多生物相对均一A+T含量(~50%)加以解释。此A+T含量加上遗传密码的性质对任何特定寡核苷酸序列出现的可能性赋予清晰的限制。因此,与苏云金芽孢杆菌基因相比,具有50%A+T含量的大肠杆菌基因很少有可能含有任何特定的富含A+T的片段。
通常,为了获得δ-内毒素基因在植物中高水平的表达,通过对包括结构基因DNA的定点诱变而去除ATTTA序列和推断的聚腺苷酸化信号而修饰编码该δ-内毒素的已存在的结构编码序列(“结构基因”)。虽然已观察到仅部分去除上面鉴定出的任一序列时有增加的表达水平,但是基本上去除所有聚腺苷酸化信号和ATTTA序列是最为优选的。作为选择,如果制备编码用于目的蛋白表达的合成基因,选择的密码子应避开ATTTA序列和推断的聚腺酸化信号。对于本发明的目的,推断的聚腺苷酸化信号包括但不一定限于AATAAA、AATAAT、AACCAA、ATATAA、AATCAA、ATACTA、ATAAAA、ATGAAA、AAGCAT、ATTAAT、ATACAT、AAAATA、ATTAAA、AATTAA、AATACA和CATAAA。在替代ATTTA序列和聚腺苷酸化信号中,优选利用避开很少见于植物基因组中密码子的密码子。
扫描选定的DNA序列以鉴定出具有大于4个连续腺嘌呤(A)或胸腺嘧啶(T)核苷酸的区域。扫描出A+T区域潜在的植物聚腺苷酸化信号。虽然缺乏5个或更多个连续A或T核苷酸排除了大多数植物的聚腺苷酸化信号,但如果在相互间的10个核苷酸内鉴定出多于一个次要聚腺苷酸化信号时,那么优选改变此区域的核苷酸序列以去除这些信号而同时维持原先编码的氨基酸序列。
第二步是考虑在步骤一中鉴定出的富含A+T区域周围的大约15到30个左右的核苷酸残基。如果周围区域的A+T含量不到80%,那么应该检查该区域的聚腺苷酸化信号。依据聚腺苷酸化信号对该区域的改变依赖于(1)存在的聚腺苷酸化信号的数目和(2)主要植物聚腺苷酸化信号的存在。
检查延伸区域植物聚腺苷酸化信号的存在。通过对该DNA序列的定点诱变而去除聚腺苷酸化信号。也检查延伸区域中的多拷贝ATTTA序列,其也通过诱变去除。
破坏包括许多连续A+T碱基或G+C碱基的区域也是优选的因为预期这些区域由于自身互补性而具有形成发夹结构更高的可能性。因此,插入异源碱基对将减小自身-互补二级结构形成的可能性,已知该二级结构在有些生物中抑制转录和/或翻译。在大多数情况,通过使用不含有多于5个连续A+T或G+C序列可最大限度地减少副作用。5.7昆虫抗性转基因植物的制备
因此,通过用粒子轰击方法转化这些植物可增该植物如玉蜀黍中编码目的多肽基因的量(即,具有抗一种或更多种昆虫杀虫活性的细菌晶体蛋白或多肽)。通过实例的方式,用粒子枪运载包被于微粒上的DNA将含有苏云金芽孢杆菌晶体蛋白编码区和适当可选择标记的表达载体转化入玉米(玉蜀黍)胚胎细胞悬液中。从表达该公开杀虫剂晶体蛋白的转化胚胎愈伤组织中再生转基因植物。粒子轰击已用于成功转化小麦(Vasil等,1992)。
也可按所述通过直接将DNA转入花粉中而将DNA导入植物中(Zhou等,1983;Hess,1987;Luo等,1988)。也可按所述将DNA注射入植物的生殖器官而获得编码多肽基因的表达(Pena等,1987)。也可按所述将DNA直接注射入未成熟胚胎的细胞中并且对干燥的胚胎进行重新水合(Neuhaus等,1987;Benbrook等,1986)。
从单个植物原生质体或各种外植体中或再生植株在本领域中是众所周知的(Weissbach和Weissbach,1988)。此再生和生长方法一般包括筛选转化的细胞、培养这些单个化的细胞经过胚胎发育的正常期经过生根的小植株时期。类似地再生转基因胚胎和种子。之后将得到的转基因生根的幼枝种植于适当的植物培养基中如土壤中。
可按所述的本领域中众所周知的方法从叶片外植体中发育或再生含有通过农杆菌导入的编码目的多肽外源基因的植株(Horsch等,1985)。在该方法中,按所述在选择试剂存在下和诱导被转化植物品系中幼枝再生的培养基中培养转化子(Fraley等,1983)。特别地,美国专利5,349,124(在此掺入说明书供参考)详述了遗传转化莴苣细胞的产生和从其中得到表达赋予该植物对鳞翅目幼虫杀虫活性杂合晶体蛋白的植物。
此方法一般在2到4个月内产生幼枝并且然后将这些幼枝转移至适当的含有筛选剂和抗生素的诱导根的培养基中从而防止细菌的生长。然后将在选择剂存在下生根以形成小植株的幼苗移植至土壤或其它培养基中以便能够生根。这些方法随着所用的特定植物品系而变化,此变化在本领域中是众所周知的。
优选地,按前述将再生的植物自花传粉以提供纯合的转基因植物。或者,将获自此再生植物的花粉与农业上重要的种子培育出的植物、优选为近交系进行杂交。反过来,用这些重要品系植物的花粉给再生植物授粉。用对本领域中技术人员众所周知的方法培养含有所需多肽的本发明转基因植物。
本发明的转基因植物因此具有编码一种或更多种这里公开的嵌合Cry多肽的增加量的编码区(如,cry基因)。优选的转基因植物为独立的分离子并且可将该基因和其活性传递至其子代中。更为优选的转基因植物为该基因的纯合体并且将该基因在有性交配中传递至其所有子代中。转基因植物的种子可种植于田野或温室中,并将得到的有性成熟转基因植物自花传粉以产生真正的生育植物。通过实例的方式,这些植物的子代变成真正的生育系,评估其在一定的环境条件下,优选在田间对鞘翅目昆虫具有增加的杀虫能力。本发明者考虑到了本发明在产生下列转基因植物中将会有特别的应用,包括玉蜀黍(corn)、大豆、棉花、烟草、番茄、土豆、亚麻、黑麦、大麦、canola、小麦、燕麦、水稻、其它谷物、蔬菜、水果、果树、浆果、草坪草、观赏植物、藻木和乔木。5.8核酶
核酶是切割特定mRNA种类的酶促RNA分子。在有些实施方案中,本发明者考虑到选择和利用能够切割本发明RNA片段的核酶及其用于减少靶mRNA在特定细胞类型或组织中的活性。
目前已知天然酶促RNA有6种基本的变异体。在生理条件下每个可催化反式RNA磷酸二酯键的水解(并且因此可切割其它RNA分子)。一般地,酶促核酸通过首先结合到靶RNA上而起作用。此结合经过靶向结合酶促核酸部分而发生,该部分紧紧与起切割靶RNA作用分子的酶促部分相邻。因此,该酶促核酸首先经过互补碱基-配对识别且然后结合靶RNA,且一旦结合到正确的位点,起酶促作用以切割靶RNA。策略性切割此靶RNA将破坏其指导编码蛋白合成的能力。酶促核酸结合并切割其RNA靶子后,其从该RNA中释放出来以寻找另一个靶子并可反复结合和切割新的靶子。
核酶的酶促性质优越于许多技术,如反义技术(其中核酸分子简单地结合到核酸靶子上以阻止其翻译)因为完成治疗所必需的核酶浓度低于反义寡核苷酸的浓度。此优势反映了核酶酶促作用的能力。因此,单个核酶分子能够切割许多分子的靶RNA。此外,核酶为高度特异性的抑制剂,其抑制特异性不仅依赖于结合到靶RNA上的碱基配对机制,而且依赖于靶RNA的切割机制。靠近切割位点的单个错配或碱基替代可完全消除核酶的催化活性。在反义分子中类似的错配不阻止其作用(Woolf等,1992)。因此,核酶作用的特异性大于结合相同RNA位点的反义寡核苷酸的特异性。
酶促核酸分子可形成于锤头、发夹、肝炎δ病毒、组I内含子或RNasePRNA(与RNA前导序列有关)或Neurospora VS RNA基序中。锤头基序的实例由Rossi等(1992)描述过;发夹基序的实例由Hampel等描述过(欧洲专利,EP0360257),Hampel和Tritz(1989),Hampel等(1990)和Cech等(美国专利,5,631,359);肝炎δ病毒基序的实例由Perrotta和Been(1992)描述过;RNaseP基序的实例由Gruerrier-Takada等(1983)描述过,Neurospora VS RNA核酶基序由Collins描述过(Saville和Collins,1990;Saville和Collins,1991;Collins和Olive,1993);并且I组内含子的实例由Cech等描述过(美国专利4,987,071)。本发明酶促核酸分子中所有重要的因素是其具有与一种或更多种靶基因RNA区域互补的特异性底物结合位点并且其在底物结合位点内部或周围具有赋予该分子RNA切割活性的核苷酸序列。因此该核酶构建体不必要限制于这里所述的特定基序。
本发明提供了用于制备一类对所需靶RNA显示出高度特异性酶促切割试剂的方法。该酶促核酸分子优选靶向于靶RNA高度保守的序列区域从而可提供一种或数种酶促核酸给特定疾病或病情的治疗中。此酶促核酸分子可外源性地运载至所需的特异性细胞。作为选择,此核酶可由运载至特定细胞的DNA或RNA载体所表达。
小的酶促核酸基序(如,锤头或发夹结构)可用于外源运输。这些分子的简单结构增加了此酶促核酸侵袭mRNA结构靶区域的能力。作为选择,催化RNA分子可在细胞中由真核生物启动子控制下表达(如,Scanlon等,1991;Kashani-Sabet等,1992;Dropulic等,1992;Weerasinghe等,1991;Ojwang等,1992;Chen等,1992;Sarver等,1990)。本领域中的技术人员认识到任何核酶均可在真核细胞的适当DNA载体中表达。通过第二种核酶使其从初级转录本中释放可增加此核酶的活性(Draper等,国际专利申请公开No.WO93/23569,和Sullivan等,国际专利申请公开No.WO94/02595,在此掺入此二者供参考其完整性;Ohkawa等,1992;Taira等,1991;Ventura等,1993)。
核酶可直接加入、或可与阳离子脂复合、脂类复合物、包装于脂质体中或其它方式运载至靶细胞中。此RNA或RNA复合物可经注射、烟雾剂吸入、灌注泵或stent,掺入或不掺入生物聚合物而局部施用至体内外的有关组织。
按Draper等所述(国际专利申请公开No.WO93/23569)或Sullivan等所述(国际专利申请公开No.WO94/02595)设计核酶并合成从而按所述进行体内外测试。也可优化此核酶以用于运输。虽然提供了具体的实例,当必要时本领域中的人员将认识到可以利用其它种类中的相当的RNA靶子。
可通过计算机折叠(Jaeger等,1989)单个地分析锤头或发夹核酶以评价是否此核酶序列折叠成适当的二级结构。对具有不利的分子内结合臂与催化核心之间相互作用的那些核酶不予考虑。可选择改变结合臂长度以优化活性。一般地,每条臂上的至少5个碱基能够与靶RNA结合或与其相互作用。
可设计锤头或发夹基序的核酶从而与mRNA信使中的各种位点退火,并可对其化学合成。所用的合成方法按照Usman等(1987)和Scaringe等(1990)所述的通常RNA合成方法并且使用常规的核酸保护和偶联基团,如5′-末端的二甲氧三苯甲基和3′-末端的亚磷酰胺。平均每步的偶联产量一般>98%。可以两部分合成发夹核酶并且退火以重建活性的核酶(Chowrira和Burke,1992)。通过修饰核酸酶抗性基因,例如,2′-氨基、2′-C-烯丙基、2′-氟基、2′-O-甲基、2′-H可广泛地修饰核酶以增强稳定性(综述参见Usmen和Cedergren,1992)。可通过用一般方法的凝胶电泳或高压液相色谱来纯化核酶并重悬于水中。
核酶活性可通过以下方法加以优化,包括改变核酶结合臂的长度或化学合成具有防止其被血清核糖核酸酶降解修饰的核酶(参见,如,国际专利申请公开No.WO92/07065;Perrault等,1990;Pieken等,1991;Usman和Cedergren,1992;国际专利申请公开No.WO93/15187;国际专利申请公开No.WO91/03162;美国专利5,334,711;和国际专利申请公开No.WO94/13688,其中描述了可制备对酶促RNA分子的糖部分进行的各种化学修饰),该核酶具有增强其在细胞中效率的修饰并去除了茎段II碱基以缩短RNA合成时间和降低化学需求。
Sullivan等(国际专利申请公开No.WO94/02595)描述了用于运载酶促RNA分子的一般方法。可通过各种已知的对本领域熟练人员熟悉的方法,包括但不限于脂质体包被、离子电渗疗法或插入其它载体,如水凝胶、环化糊精、生物可降的微胶囊和生物粘性微球体将核酶施用至细胞。对于有些情况,可在体外直接将核酶运载至具有或不具有前述载体的细胞或组织。作为选择,可通过直接吸入、直接注射或用导管、灌注泵或stent局部运载RNA/载体组合。其它运载途径包括但不限于血管内、肌肉内、皮下或联合注射、烟雾剂吸入、口腔(片剂或药物形式)、局部、全身、眼、腹膜内和/或子囊内(intrathecal)的运载。核酶运载和施用更为详细的描述提供于Sullivan等(国际专利申请公开No.WO94/02595)和Draper等(国际专利申请公开No.WO93/23569)文献中,在此引用供参考。
另一种在细胞中积累高浓度核酶的方法是掺入编码核酶的序列到DNA表达载体中。核酶序列的转录由真核生物RNA聚合酶I(pol I)、RNA聚合酶II(pol II)或RNA聚合酶III(pol III)的启动子所驱动。pol II或pol III启动子的转录本将以高水平在所有细胞中表达;在给定细胞类型中给定pol II启动子的水平将依赖于附近存在的基因调控序列(增强子、沉寂子等)的性质。如果原核生物RNA聚合酶在适当的细胞中表达,则也可使用原核生物RNA聚合酶启动子(Elroy-Stein和Moss,1990;Gao和Huang,1993;Lieber等,1993;Zhou等,1990)。由这些启动子表达的核酶可在哺乳动物细胞中起作用(如,Kashani-Saber等,1992;Ojwang等,1992;Chen等,1992;Yu等,1993;L′Huillier等,1992;Lisziewicz等,1993)。此转录单位可掺入多种用于导入哺乳动物中的载体,包括但不限于质粒DNA载体、病毒DNA载体(如腺病毒或腺相关载体)、或病毒RNA载体(如逆转录病毒、semliki森林病毒、新培斯病毒载体)。
本发明的核酶可作诊断手段以检测细胞系或细胞类型中的遗传漂变和突变。它们也可用于分析靶RNA分子的水平。核酶活性与靶RNA结构间的密切关系使能够检测该分子中任何区域改变靶RNA碱基配对和三维结构的突变。通过用本发明所述的多种核酶,人们可在体外以及细胞和组织中找出对RNA结构重要的核苷酸改变。用核酶切割靶RNA可用于抑制特定细胞或细胞类型中的基因表达并且(基本上)限定特定基因产物的作用。5.9同源基因和基因片段的分离
根据本发明的基因和δ-内毒素不仅包括这里公开的全长序列,而且包括具有这里特异性例举序列特征性杀虫活性的这些序列的片段或融合蛋白。
可经过数种方法鉴定和获得杀虫剂δ-内毒素,这一点对于本领域的技术人员来说应是显而易见的。此特异性基因或其部分可获自培养库或通过例如,用基因仪合成构建。用制备点突变的标准技术可容易地构建这些基因的变异形式。同样,也可根据标准的方法用商业上可得到的外切核酸酶或内切核酸酶制备这些基因的片段。例如,可用酶如Bal 31或定点诱变从这些基因的末端系统地切下核苷酸。同样,用多种其它限制酶可获得编码活性片段的基因。蛋白酶可用于直接获得这些δ-内毒素的活性片段。
也可用这里提供的讲义从芽孢杆菌菌株和/或DNA文库中分离等价δ-内毒素和/或编码这些等价δ-内毒素的基因。例如,这里公开并要求保护的抗δ-内毒素抗体可用于从蛋白混合物中鉴定和分离其它δ-内毒素。具体地,可产生针对该δ-内毒素中最为常见而又与其它苏云金芽孢杆菌δ-内毒素最为不同的部分的抗体。这些抗体可用于鉴定等价的δ-内毒素,该内毒素通过免疫沉淀、酶联免疫分析(ELISA)或Western印迹等分析而具有特征性的杀虫活性。
用于鉴定本发明δ-内毒素和基因的进一步方法是通过使用寡核苷酸探针。这些探针为具有可检测标记的核苷酸序列。如本领域中所众所周知的,如果探针分子和核酸样品通过在二个分子间形成强键而杂交,那么可有理由认为该探针与样品是基本上一致的。探针的可检测标记提供了从已知方式检测无论什么杂交的方法。此探针分析提供了用于鉴定本发明灭蚁δ-内毒素基因的快速方法。
用作本发明探针的核苷酸片段可通过用标准的方法用DNA合成仪加以合成。因此核苷酸片段作为探针时,用本领域技术人员已知的任何适当的标记,包括放射和非-放射性标记标记特定的探针。典型的放射标记包括32P、125I、35S等。可用DNA酶和DNA聚合酶通过常规的缺口翻译反应从与DNA样品互补的核苷酸序列中构建放射性同位素标记的探针。然后可将该探针和样品混合于杂交缓冲液中并维持于适当的温度中直至退火出现。之后,洗去膜上的外源物质,一般通过放射自显影和/或液闪计数检测和定量样品和结合的探针分子。
非放射性标记包括,例如,配体如生物素或甲状腺素,以及酶如水解酶或过氧化物酶或各种化学发光剂如萤光素、或萤光化合物样荧光素及其衍生物。为了分离的方便,例如,也可通过用在上述一个末端以同位素标记并且在另一端用生物素标记而以不同种标记在2个末端同时标记探针。
双链形成和稳定性依赖于2条杂交链间实质的互补性,并且如上所述,可耐受一定程度的错配。因此,本发明的探针包括突变(单个及多个)、缺失、插入所述的序列及其组合,其中所述的突变、插入和缺失允许与目的靶核苷酸形成稳定的杂交体。可通过对普通技术人员目前已知的方法并且或许通过将来可能弄清的其它方法以多种方式在给定的多核苷酸序列中制备突变、插入和缺失。列出探针中潜在的变异部分是由于遗传密码的丰余性。由于遗传密码的丰余性,即不止一种编码的核苷酸三联体(密码子)可用于制备蛋白的大多数氨基酸。因此,不同的核苷酸序列可编码特定的某一氨基酸。因此,可通过编码该蛋白或肽的相同氨基酸序列的等价核苷酸序列制备苏云金芽孢杆菌δ-内毒素和肽的氨基酸序列。因此,本发明包括这种等价的核苷酸序列。同样,反向或互补序列也是本发明的一方面并可由本领域的技术人员容易地使用。此外,已显示如果此改变不影响蛋白的二级结构可通过改变氨基酸序列而构建已鉴定过结构和功能的蛋白(Kaiser和Kezdy,1984)。因此,本发明包括这里所述的不改变蛋白二级结构的氨基酸序列突变体或,如果结构被改变,但生物学活性基本上未变的氨基酸序列突变体。此外,本发明也包括具有完整或部分本发明编码δ-内毒素基因生物的突变体。此突变体可通过对本领域技术人员众所周知的技术加以制备。例如,可用UV照射制备宿主生物的突变体。同样,此突变体可包括也可通过本领域众所周知的方法而制备的不产芽孢的宿主细胞。6.0实施例
包括进下面的实例以说明本发明优选的实施方案。本发明的技术人员应该明白在后面的实施例中公开的技术代表着由本发明者发现的技术从而在完成本发明中很好地发挥作用,且因此可认为构成该实践优选的方式。然而,在本发明的指导下,本领域中的技术人员应该明白在不偏离本发明精神和范围情况下,在已公开的特定实施方案中可制备许多改变并且仍可获得同样或类似的结果。6.1实施例1--杂合苏云金芽孢杆菌δ-内毒素的构建
由于本发明的苏云金芽孢杆菌穿梭载体pEG 853、pEG 854和pEG857已描述过(Baum等,1990)。pEG 857含有作为SphI-BamHIDNA片段而克隆入pEG 853中的Cry 1 Ac基因。以这种方式构建pEG1064,保存cry 1 Ac基因内部的KpnI位点并且去掉pEG 857多克隆位点(MCS)中的KpnI位点。这通过以下一系列的方法完成,包括对pEG857 DNA进行有限的KpnI消化从而切掉唯一的KpnI位点。通过DNA聚合酶I Klenow片段补平KpnI 5′突出端从而产生平的DNA末端,并且通过T4 DNA连接酶连接此DNA的平末端。pEG 318含有作XhoI-SalI DNA片段而克隆入pEG 854 XhoI位点中的cry 1F基因(Chambers等,1991)。pEG 315含有作为SalI-BamHI DNA片段而克隆入pEG 854XhoI-BamHI位点中的菌株EG 6346的cry 1C基因(Chambers等,1991)。
图1A图解显示分别编码pEG 854/pEG 1064、pEG 20、pEG 315和pEG 318中含有的完整cry 1 Ac、cry 1 Ab、cry 1C和cry 1F基因的DNA。同时显示了用于构建一些杂合基因的独特限制性位点。图1B图解显示与本发明有关的杂合基因。在有些情况,用以诱变寡核苷酸引物的标准PCRTM扩增将适当的限制位点掺入到用于杂合基因构建的DNA片段中。一些杂合基因的构建不能够通过限制性片段亚克隆来完成。在这些情况,用PCRTM重叠延伸(POE)构建所需的杂合基因(Horton等,1989)。使用了下面的寡核苷酸引物(购自整合DNA技术公司,Coralville,IA):引物A:5′-GGATAGCACTCATCAAAGGTACC-3′(SEQ ID NO:1)引物B:5′-GAAGATATCCAATTCGAACAGTTTCCC-3′(SEQ ID NO:2)引物C:5′-CATATTCTGCCTCGAGTGTTGCAGTAAC-3′(SEQ ID NO:3)引物D:5′-CCCGATCGGCCGCATGC-3′(SEQ ID NO:4)引物E:5′-CATTGGAGCTCTCCATG-3′(SEQ ID NO:5)引物F:5′-GCACTACGATGTATCC-3′(SEQ ID NO:6)引物G:5′-CATCGTAGTGCAACTCTTAC-3′(SEQ ID NO:7)引物H:5′-CCAAGAAAATACTAGAGCTCTTGTTAAAAAAGGTGTTCC-3′(SEQ ID NO:8)引物I:5′-ATTTGAGTAATACTATCC-3′(SEQ ID NO:23)引物J:5′-ATTACTCAAATACCATTGG-3′(SEQ ID NO:24)引物K:5′-TCGTTGCTCTGTTCCCG-3′(SEQ ID NO:31)
图1B中所述的含有与本发明有关的杂合δ-内毒素基因的质粒描述如下。通过限制性消化质粒DNA、PCRTM扩增或POE而产生的DNA片段的分离或纯化指依次应用琼脂糖-TAE凝胶电泳并根据制造商建议使用Geneclean试剂盒(Bio 101)。通过用引物对A和B以及pEG 318作为模板对cry 1F DNA片段进行PCRTM扩增而构建pEG 1065。分离得到的PCRTM产物、以AsuII和KpnI切割并用于代替pEG 857中相应的AsuII-KpnI DNA片段。用分别从pEG 318和pEG 857中分离的POE和DNA片段,cry 1F的SauI-KpnI和cry 1 Ac的AsuII-ClaI构建质粒pEG 1067。将得到的POE产物用引物对A和B进行PCRTM扩增、以AsuII和KpnI切割并且用于代替pEG 857中相应的AsuII-KpnI片段。
通过以从cry 1F(pEG 318)中分离的相应的SacI-KpnI DNA片段代替从pEG 857中分离的cry 1 Ac的SacI-KpnI DNA片段构建pEG 1068。通过以从cry 1 Ac(pEG 857)中分离的相应的SacI-KpnIDNA片段代替从pEG 1065中分离的SacI-KpnI DNA片段而构建pEG1070。通过以从cry 1 Ac(pEG 857)中分离的相应SacI-KpnI DNA片段代替从pEG 1067中分离的SacI-KpnI DNA片段而构建pEG1072。用引物对C和D分别以从pEG 1065、pEG 1067、pEG 1068中PCRTM扩增出的SphI-XhoI DNA片段代替pEG 1064中的SphI-XhoI DNA片段而构建pEG 1074、pEG 1076和pEG 1077。以分离的并且以SphI和SacI切割的用引物对D和E并以模板pEG 318而产生的cry 1F PCRTM产物代替pEG 1064的SphI-SacI DNA片段而构建pEG 1089。
通过以分离的并从SphI和SacI切割的用引物对D和H以及模板pEG 315而产生的cry 1C的PCRTM产物代替pEG 1064的SphI-SacIDNA片段而构建pEG 1091。
用引物对B和F而产生的cry 1 Ac DNA片段和用引物A和G而产生的cry 1C DNA片段通过POE而构建pEG 1088。从得到的POE产物中分离SacI-KpnI片段并用于代替pEG 1064中的相应SacI-KpnI片段。
通过首先以从pEG 20中分离的相应cry 1 Ab DNA片段代替pEG1065的SphI-KpnI DNA片段以得到pEG 364而构建pEG 365。
通过以从pEG 315中分离的相应的DNA片段代替pEG 1088中的KpnI-BamHI DNA片段而构建pEG 1092。pEG 1092不同于国际专利申请公开No.WO95/06730中公开的cry 1 Ab/cry 1C杂合δ-内毒素基因。
通过以从pEG 20中分离的相应的SphI-AsuII DNA片段代替pEG1068中的SphI-AsuII DNA片段而构建pEG 1093.
用引物对B和I及pEG 857作为模板而产生的cry 1 Ac DNA片段和用引物对A和J及pEG 318作为模板而产生的cry 1F DNA片段通过POE构建pEG 378。将得到的POE产物以AsuII和KpnI切割并将得到的分离的DNA片段用于代替pEG 1064中相应的AsuII-KpnIDNA片段。
通过从以用引物对C和K对pEG 378的PCRTM扩增中分离的相应的AsuII-XhoI DNA片段代替pEG 1064中的AsuII-XhoI DNA片段构建pEG 381。6.2实施例2--在苏云金芽孢杆菌中杂合毒素的制备
按所述将实施例1中所述的编码杂合毒素的质粒转化入苏云金芽孢杆菌中(Mettus和Macaluso,1990)。将得到的苏云金芽孢杆菌菌株培养于50ml C-2培养基中直至该培养物完全形成芽孢并被裂解(大约48小时)。由于晶体的形成是在苏云金芽孢杆菌中对δ-内毒素进行有效商业制备的前提,故用显微镜分析来鉴定形成孢子培养物中的晶体(表5)。
                           表5
                  杂合δ-内毒素的晶体形成菌株                质粒            母本δ-内毒素          晶体形成EG11060             pEG1065         Cry1Ac+Cry1F           +EG11062             pEG1067         Cry1Ac+Cry1F           +EG11063             pEG1068         Cry1Ac+Cry1F           +EG11065             pEG1070         Cry1Ac+Cry1F           -EG11067             pEG1072         Cry1Ac+Cry1F           -EG11071             pEG1074         Cry1Ac+Cry1F           +EG11073             pEG1076         Cry1Ac+Cry1F           +EG11074             pEG1077         Cry1Ac+Cry1F           +EG11087             pEG1088         Cry1Ac+Cry1C           -EG11088             pEG1089         Cry1F+Cry1Ac           -EG11090             pEG1091         Cry1C+Cry1Ac           -EG11091             pEG1092         Cry1Ac+Cry1C           +EG11092             pEG1093         Cry1Ab+Cry1Ac+Cry1F    +EG11735             pEG365          Cry1Ab+Cry1F+Cry1Ac    +EG11751             pEG378          Cry1Ac+Cry1F           +EG11768             pEG381          Cry1Ac+Cry1F           +
按Baum等,1990所述通过十二烷基磺酸钠聚丙烯酰胺凝胶电泳(SDS-PAGE)检测表5中列出的一些苏云金芽孢杆菌菌株δ-内毒素的产生。在C-2培养基中培养每种苏云金芽孢杆菌菌株等体积的培养物直到完全形成芽孢并被裂解。离心培养物并以等体积的去离子蒸馏水洗芽胞/晶体沉淀物两次。将最终的沉淀物悬浮于一半体积的0.005%Triton X-100中。通过SDS-PAGE分析等体积的每种洗过的培养物,如图2中所示。
包括Cry 1 Ac和Cry 1 F的大多数杂交体在苏云金芽孢杆菌中形成稳定的晶体。一个明显的例外是EG 11088,其中的活性毒素片段将是EG 11063的互换形式。包括Cry 1 Ac与Cry 1 C、EG 11087和EG11090的三个杂交体中的两个未能在苏云金芽孢杆菌中产生的晶体即使这些交互杂交体模仿活化的编码晶体的EG 11063和EG 11074的毒素片段。
由SDS-PAGE检测的每种菌株均产生一定水平的δ-内毒素。然而,如所预期的,那些鉴定为晶体阴性的培养物产生很少的蛋白(如,e道:EG 11065,f道:EG 11067,j道:EG 11088和k道:EG11090)。例如,显示了形成δ-内毒素晶体Cry 1 Ac(a道)的一般产量。数种杂合δ-内毒素产生相近水平的蛋白,包括EG 11060(b道),EG 11062(c道),EG 11063(d道;SEQ ID NO:10)和EG 11074(i道;SEQ ID NO:12)。此数据清晰地显示在苏云金芽孢杆菌中有效的杂合δ-内毒素的产量是不可预期的并且随着用于构建该杂合体的母本δ-内毒素而变化。6.3实施例3--杂合δ-内毒素的蛋白水解加工
一旦δ-内毒素晶体溶解于幼虫中肠时前毒素形式的δ-内毒素蛋白降解成稳定活性的毒素。对δ-内毒素潜在活性的一个测定是活性的δ-内毒素在蛋白水解环境中的稳定性。为了测试此杂合δ-内毒素的蛋白酶水解敏感性,将溶解的毒素用胰蛋白酶消化。从形成芽胞的苏云金芽孢杆菌培养物中纯化δ-内毒素并按所述定量(Chembers等,1991)。精确地将250μg的每种杂合δ-内毒素晶体溶解于30mMNaHCO3、10mM DTT(总体积0.5ml)中。以1∶10的比例向溶解的毒素中加入胰蛋白酶。在适当的时间点取出50μl等份至50μlLaemmli缓冲液中,加热至100℃3分钟,并且冷冻于干冷的乙醇浴中用于随后的分析。通过SDS-PAGE分析溶解毒素的胰蛋白酶消化产物并且用光密度定量每个时间点活性δ-内毒素的量。这些研究结果图示于图3中。
快速将野生型Cry 1 Ac加工成在整个研究期间均稳定的活性δ-内毒素片段。也加工EG 11063和EG 11074的杂合δ-内毒素成为整个研究期间均稳定的活性δ-内毒素。以更慢的速度和此活性δ-内毒素片段以更高百分比维持在每个时间点对EG 11063 δ-内毒素进行加工。尽管此EG 11060与EG 11062的杂合δ-内毒素被加工成活性的δ-内毒素片段,但是这些片段对进一步切割更为敏感并在研究期间以不同的速度降解。EG 11062和EG 11063δ-内毒素cry 1 Ac与cry 1 F之间的5′交换位点得到仅有21个氨基酸残基不同的毒素(见图1)。然而,由于EG 11062 δ-内毒素更为快速的降解,在这些位置维持Cry 1Ac序列的重要性是明显的。这些数据显示用相同的母本δ-内毒素构建的不同杂合δ-内毒素在生物化学特征如蛋白水解稳定性中可有显著不同。6.4实施例4--杂合δ-内毒素的生物活性
将表达所需δ-内毒素的苏云金芽孢杆菌培养物培养至完全形成芽胞并被裂解且按实施例2中所述进行清洗。按所述(Baum等,1990)通过SDS-PAGE定量每种培养物δ-内毒素的水平。在生物测定筛选时,将单个适当浓度的每种洗过的δ-内毒素培养物局部放置于每孔含有1.0ml人工营养物的30个小孔中(表面积175mm2)。将新生的单个幼虫置于每个处理过的小孔中并将栽培木箱覆盖上一层有孔的干净聚酯薄膜。摄食7天后计数幼虫的致死率并将百分致死率表示为死亡幼虫数目对处理的总的幼虫数目的比例,为32。
在LC50测定(得到50%致死率的δ-内毒素浓度)中,从苏云金芽孢杆菌培养物中纯化δ-内毒素并按Chambers等(1991)所述进行定量。通过在0.005%的Triton X-100中连续稀释而制备8种浓度的δ-内毒素并将每种浓度局部施用至含有1.0ml人工营养物的小孔中。摄食7天后计数幼虫致死率(每种δ-内毒素浓度32只幼虫)。在所有情况,将稀释剂用作对照。
通过生物测定筛选对Cry 1 A/cry 1 F杂合毒素的比较示于表6中。菌株EG 11063和EG 11074的杂合δ-内毒素维持有母本Cry 1 A和Cry 1 Fδ-内毒素的活性。此外,EG 11735杂合δ-内毒素维持有其母本Cry 1 Ab和Cry 1 Fδ-内毒素的活性。由菌株EG 11061、EG 11062、EG 11071和EG 11073所产生的δ-内毒素对测试的昆虫幼虫没有杀虫活性尽管其1)至少包括一种对抵抗所示幼虫有活性的母本δ-内毒素和2)在苏云金芽孢杆菌中形成稳定、十分确切的晶体。这些结果显示杂合毒素构建体不可预期的性质。
数据列于表6中。测试所有菌株洗过的形成芽胞的培养物。对于每种测试的昆虫,使用相同量的δ-内毒素并且杀虫活性是基于表现出最高百分致死率的菌株(++++)。
                                 表6
                杂合CRY1A/CRY1Fδ-内毒素的生物测定筛选菌株       草地贪夜蛾     甜菜夜蛾     烟草夜蛾     玉米穗夜蛾  欧洲玉米螟Cry1Ac     -              -            ++++         ++++        +++Cry1F      ++++           ++           ++           ++          ++Cry1Ab     ++             +            +++          ++          +++EG11060    -              -            -            -           -EG11062    -              -            -            -           -EG11063    ++++           ++++         +++          +++         ++++EG11071    -              -            -            -           -EG11073    -              -            -            -           -EG11074    ++++           ++++         +++          +++         ++++EG11090    -              +++          -            -           -EG11091    ++++           ++++         -            -           N.D.EG11092    ++++           ++++         +++          +++         N.D.EG11735    ++++           ++++         +++          +++         N.D.EG11751    N.D.a         ++++         N.D.         ++++        N.D.aN.D.=未测定。
测试图1中所述的并在生物检测筛选中显示出杀虫活性的δ-内毒素纯化晶体以测定其LC50(见表7)。与任何一种测试过的野生型δ-内毒素相比,从菌株EG 11063、EG 11074、EG 11091和EG 11735中纯化的δ-内毒素均显示出增加的(抗)粘虫(草地贪夜蛾和甜菜夜蛾)活性。EG 11063和EG 11074δ-内毒素将产生相同活性的毒素片段(图1B),这由其对检测过的昆虫的类似LC50值所证明。这些数据所证明的没有预料到的结果是杂合δ-内毒素如EG 11063、EG11092、EG 11074、EG 11735或EG 11751可维持其各自母本δ-内毒素活性并且抗一些昆虫如甜菜夜蛾,并且可能具有较任何一种母本δ-内毒素大得多的活性。接近或低于母本δ-内毒素时该广泛的杀虫活性以及野生型水平的毒素产生(实施例2)使这些蛋白特别适用于在苏云金芽孢杆菌中产生。虽然EG 11091来源的δ-内毒素较其母本δ-内毒素具有更好的抗草地贪夜蛾和甜菜夜蛾活性,但其丧失母本Cry 1Ac的烟草夜蛾和玉米穗夜蛾活性。EG 11091δ-内毒素(实施例2)有限的宿主范围以及观察到的降低的毒素产量使其较少适于在苏云金芽孢杆菌中产生。
                                       表7
                          纯化杂合δ-内毒素的LC50A毒素          草地贪夜蛾     甜菜夜蛾    烟草夜蛾    玉米穗夜蛾    欧洲玉米螟Cry1Ac        >10000        >10000     9           100           23Cry1Ab        1435           4740        118         400           17Cry1C         >10000        490         >10000     >10000       >10000Cry1F         1027           3233        54          800           51EG11063       550            114         33          80            7(Cry1Ac/1F)EG11074       468            77          25          76            9(Cry1Ac/1F)EG11091       21             21          219         >10000       N.D.a(Cry1Ac/1C)aN.D.=未测定。
在表7中,LC50值以每孔(175mm2)中纯化的δ-内毒素的纳克数表示并且是2到6个同样样品的复合(composite)值。
                                  表8
                    CRY1杂合δ-内毒素的DNA交换位点
质粒    SEQ ID NO:   5′交换位点     SEQ ID NO:   3′交换位点
pEG1065    15    TATCCAATTCGAACGTCATC    21    ACTACCAGGTACCTTTGATGpEG1067    16    TTTAGTCATCGATTAAATCA    21    ACTACCAGGTACCTTTGATGpEG1068    17    ATAATAAGAGCTCCAATGTT    21    ACTACCAGGTACCTTTGATGpEG1070    15    TATCCAATTCGAACGTCATC    19    TCATGGAGAGCTCCTATGTTpEG1072    16    TTTAGTCATCGATTAAATCA    19    TCATGGAGAGCTCCTATGTTpEG1074    15    TATCCAATTCGAACGTCATC    35    TGCAACACTCGAGGCTGAATpEG1076    16    TTTAGTCATCGATTAAATCA    35    TGCAACACTCGAGGCTGAATpEG1077    17    ATAATAAGAGCTCCAATGTT    35    TGCAACACTCGAGGCTGAATpEG1088    18    TACATCGTAGTGCAACTCTT    22    ACTACCGGGTACCTTTGATApEG1089    19    TCATGGAGAGCTCCTATGTT    -             NApEG1091    20    TTAACAAGAGCTCCTATGTT    -             NApEG1092    18    TACATCGTAGTGCAACTCTT    -             NApEG1093    -             NDb            21    ACTACCAGGTACCTTTGATGpEG365     17    ATAATAAGAGCTCCAATGTT    21    ACTACCAGGTACCTTTGATGpEG378     32    TCAAATACCATTGGTAAAAG    21    ACTACCAGGTACCTTTGATGpEG381     32    TCAAATACCATTGGTAAAAG    35    TGCAACACTCGAGGCTGAAT
aNA=不可施用。这些杂合毒素仅含有一个交换位点,如图1中所示。bND=不可区分。这些杂合蛋白的交换位点由与任何一种母本毒素不可区分的DNA序列所鉴定。
表8描述了与本发明有关的杂合δ-内毒素5′和3′交换位点周围的DNA。由该SEQ ID NO所证实,有些杂合δ-内毒素具有相同的交换位点。
为了检测其它小的改变在选定用于杂合内毒素构建的交换位点中的作用,比较EG 11751和EG 11063对甜菜夜蛾和玉米穗夜蛾的活性。这些数据清楚地显示通过改变2个母本δ-内毒素之间的交换位点可得到对杂合δ-内毒素的改进。在该实施例中,与EG 11063δ-内毒素相比,EG 11751δ-内毒素中的交换位点去除了3′的75个碱基对并且得到增强的杀虫活性。虽然在EG 11063和EG 11751之间没有观察到对甜菜夜蛾活性的显著改进,但观察到EG 11751对玉米穗夜蛾活性有几乎4倍的明显提高。注意到通过改变交换位点而提高杂合δ-内毒素生物活性是不可预期的,这点很重要。在EG 11062情况时,去除EG 11063交换位点5′的63个碱基对交换位点破坏了其杀虫活性,如表8中所示。
                          表9
             EG 11063和EG 11751的生物活性苏云金芽孢杆菌菌株         清洗过形成芽胞培养物的LC50
                       甜菜夜蛾          玉米穗夜蛾EG 11063                     106               38EG 11751                     90                10
为了进一步检测杂合δ-内毒素交换位点中改变的效应,比较由pEG 381编码的杂合δ-内毒素与由pEG 378和pEG 1068所编码的杂合δ-内毒素。在此实施例中,与pEG 378杂合δ-内毒素相比,编码pEG 381的杂合δ-内毒素的3′交换位点被去除5′的340个碱基对。表9中的数据显示与编码pEG 378和pEG 1066的δ-内毒素相比,此改变得到对草地贪夜蛾活性的增加而同时维持所观察到的编码pEG 378δ-内毒素较编码pEG 1068的δ-内毒素增加的活性(参见表8)。这些结果是没有预料到的因为来自编码pEG 378和pEG 381δ-内毒素蛋白水解的活化的毒素应该是相同的。此实施例进一步证明δ-内毒素的前毒素片段内的交换位点对杀虫活性可具有复杂的效应。
                     表10
由pEG 378、pEG 381和pEG 1068编码的毒素的生物活性
质粒                     纯化晶体的LC50
             草地贪夜蛾    T.ni      米穗夜蛾    P.xylostella
pEG 378      464           57.7        37.5        3.02
pEG 381      274           56.0        36.6        2.03
pEG 1068     476           66.7        72.7        3.836.5实施例5--杂合毒素对其它害虫的活性
也对本发明的毒素抗其它害虫的活性进行生物测定,包括西南玉米蛀虫和两种大豆害虫。溶解毒素蛋白、加入营养物中并生物分析其抗靶害虫的活性。该杂合毒素对所有三种害虫表现出很有效的控制。
                           表11
         杂合毒素对西南玉米蛀虫的LC50和EC50范围1,2
      EG 11063       EG 11074      EG 11091    EG 11751LC50       20             10-20         10-20       10-20EC50     0.2-2            0.2-2         0.2-2       0.2-21所有值以μg/ml营养物表示。2SWCB数据范围分别代表LC50和EC50范围(由>第1龄期虫%所测定)。
                          表12
              嵌合晶体蛋白对大豆害虫的LC501害虫          EG 11063    EG 11074    EG 11091    EG 11751    EG 11768绒毛豆毛虫      0.9         0.6         0.3         0.1         0.06大豆尺蠖        0.9         0.8         0.6         0.7         0.21所有值以μg/ml营养物表示。2绒毛豆毛虫(Anticarsia gemmatalis)和大豆尺蠖(Psuedoplusiincludens)均为夜蛾科成员。6.6实施例6--新的晶体蛋白的氨基酸序列6.6.1 EG 11063晶体蛋白的氨基酸序列(SEQ ID NO:10)MetAspAsnAsnProAsnIleAsnGluCysIleProTyrAsnCysLeuSerAsnProGluValGluValLeuGlyGlyGluArgIleGluThrGlyTyrThrProIleAspIleSerLeuSerLeuThrGlnPheLeuLeuSerGluPheValProGlyAlaGlyPheValLeuGlyLeuValAspIleIleTrpGlyIlePheGlyProSerGlnTrpAspAlaPheLeuValGlnIleGluGlnLeuIleAsnGlnArgIleGluGluPheAlaArgAsnGlnAlaIleSerArgLeuGluGlyLeuSerAsnLeuTyrGlnIleTyrAlaGluSerPheArgGluTrpGluAlaAspProThrAsnProAlaLeuArgGluGluMetArgIleGlnPheAsnAspMetAsnSerAlaLeuThrThrAlaIleProLeuPheAlaValGlnAsnTyrGlnValProLeuLeuSerValTyrValGlnAlaAlaAsnLeuHisLeuSerValLeuArgAspValSerValPheGlyGlnArgTrpGlyPheAspAlaAlaThrIleAsnSerArgTyrAsnAspLeuThrArgLeuIleGlyAsnTyrThrAspTyrAlaValArgTrpTyrAsnThrGlyLeuGluArgValTrpGlyProAspSerArgAspTrpValArgTyrAsnGlnPheArgArgGluLeuThrLeuThrValLeuAspIleValAlaLeuPheProAsnTyrAspSerArgArgTyrProIleArgThrValSerGlnLeuThrArgGluIleTyrThrAsnProValLeuGluAsnPheAspGlySerPheArgGlySerAlaGlnGlyIleGluArgSerIleArgSerProHisLeuMetAspIleLeuAsnSerIleThrIleTyrThrAspAlaHisArgGlyTyrTyrTyrTrpSerGlyHisGlnIleMetAlaSerProValGlyPheSerGlyProGluPheThrPheProLeuTyrGlyThrMetGlyAsnAlaAlaProGlnGlnArgIleValAlaGlnLeuGlyGlnGlyValTyrArgThrLeuSerSerThrLeuTyrArgArgProPheAsnIleGlyIleAsnAsnGlnGlnLeuSerValLeuAspGlyThrGluPheAlaTyrGlyThrSerSerAsnLeuProSerAlaValTyrArgLysSerGlyThrValAspSerLeuAspGluIleProProGlnAsnAsnAsnValProProArgGlnGlyPheSerHisArgLeuSerHisValSerMetPheArgSerGlyPheSerAsnSerSerValSerIleIleArgAlaProMetPheSerTrpThrHisArgSerAlaThrProThrAsnThrIleAspProGluArgIleThrGlnIleProLeuValLysAlaHisThrLeuGlnSerGlyThrThrValValArgGlyProGlyPheThrGlyGlyAspIleLeuArgArgThrSerGlyGlyProPheAlaTyrThrIleValAsnIleAsnGlyGlnLeuProGlnArgTyrArgAlaArgIleArgTyrAlaSerThrThrAsnLeuArgIleTyrValThrValAlaGlyGluArgIlePheAlaGlyGlnPheAsnLysThrMetAspThrGlyAspProLeuThrPheGlnSerPheSerTyrAlaThrIleAsnThrAlaPheThrPheProMetSerGlnSerSerPheThrValGlyAlaAspThrPheSerSerGlyAsnGluValTyrIleAspArgPheGluLeuIleProValThrAlaThrPheGluAlaGluTyrAspLeuGluArgAlaGlnLysAlaValAsnAlaLeuPheThrSerIleAsnGlnIleGlyIleLysThrAspValThrAspTyrHisIleAspGlnValSerAsnLeuValAspCysLeuSerAspGluPheCysLeuAspGluLysArgGluLeuSerGluLysValLysHisAlaLysArgLeuSerAspGluArgAsnLeuLeuGlnAspProAsnPheLysGlyIleAsnArgGlnLeuAspArgGlyTrpArgGlySerThrAspIleThrIleGlnArgGlyAspAspValPheLysGluAsnTyrValThrLeuProGlyThrPheAspGluCysTyrProThrTyrLeuTyrGlnLysIleAspGluSerLysLeuLysAlaPheThrArgTyrGlnLeuArgGlyTyrIleGluAspSerGlnAspLeuGluIleTyrLeuIleArgTyrAsnAlaLysHisGluThrValAsnValProGlyThrGlySerLeuTrpProLeuSerAlaGlnSerProIleGlyLysCysGlyGluProAsnArgCysAlaProHisLeuGluTrpAsnProAspLeuAspCysSerCysArgAspGlyGluLysCysAlaHisHisSerHisHisPheSerLeuAspIleAspValGlyCysThrAspLeuAsnGluAspLeuGlyValTrpValIlePheLysIleLysThrGlnAspGlyHisAlaArgLeuGlyAsnLeuGluPheLeuGluGluLysProLeuValGlyGluAlaLeuAlaArgValLysArgAlaGluLysLysTrpArgAspLysArgGluLysLeuGluTrpGluThrAsnIleValTyrLysGluAlaLysGluSerValAspAlaLeuPheValAsnSerGlnTyrAspGlnLeuGlnAlaAspThrAsnIleAlaMetIleHisAlaAlaAspLysArgValHisSerIleArgGluAlaTyrLeuProGluLeuSerValIleProGlyValAsnAlaAlaIlePheGluGluLeuGluGlyArgIlePheThrAlaPheSerLeuTyrAspAlaArgAsnValIleLysAsnGlyAspPheAsnAsnGlyLeuSerCysTrpAsnValLysGlyHisValAspValGluGluGlnAsnAsnGlnArgSerValLeuValValProGluTrpGluAlaGluValSerGlnGluValArgValCysProGlyArgGlyTyrIleLeuArgValThrAlaTyrLysGluGlyTyrGlyGluGlyCysValThrIleHisGluIleGluAsnAsnThrAspGluLeuLysPheSerAsnCysValGluGluGluIleTyrProAsnAsnThrValThrCysAsnAspTyrThrValAsnGlnGluGluTyrGlyGlyAlaTyrThrSerArgAsnArgGlyTyrAsnGluAlaProSerValProAlaAspTyrAlaSerValTyrGluGluLysSerTyrThrAspGlyArgArgGluAsnProCysGluPheAsnArgGlyTyrArgAspTyrThrProLeuProValGlyTyrValThrLysGluLeuGluTyrPheProGluThrAspLysValTrpIleGluIleGlyGluThrGluGlyThrPheIleValAspSerValGluLeuLeuLeuMetGluGlu6.6.2 EG 11074晶体蛋白的氨基酸序列(SEQ ID NO:12)MetAspAsnAsnProAsnIleAsnGluCysIleProTyrAsnCysLeuSerAsnProGluValGluValLeuGlyGlyGluArgIleGluThrGlyTyrThrProIleAspIleSerLeuSerLeuThrGlnPheLeuLeuSerGluPheValProGlyAlaGlyPheValLeuGlyLeuValAspIleIleTrpGlyIlePheGlyProSerGlnTrpAspAlaPheLeuValGlnIleGluGlrLeuIleAsnGlnArgIleGluGluPheAlaArgAsnGlnAlaIleSerArgLeuGluGlyLeuSerAsnLeuTyrGlnIleTyrAlaGluSerPheArgGluTrpGluAlaAspProThrAsnProAlaLeuArgGluGluMetArgIleGlnPheAsnAspMetAsnSerAlaLeuThrThrAlaIleProLeuPheAlaValGlnAsnTyrGlnValProLeuLeuSerValTyrValGlnAlaAlaAsnLeuHisLeuSerValLeuArgAspValSerValPheGlyGlnArgTrpGlyPheAspAlaAlaThrIleAsnSerArgTyrAsnAspLeuThrArgLeuIleGlyAsnTyrThrAspTyrAlaValArgTrpTyrAsnThrGlyLeuGluArgValTrpGlyProAspSerArgAspTrpValArgTyrAsnGlnPheArgArgGluLeuThrLeuThrValLeuAspIleValAlaLeuPheProAsnTyrAspSerArgArgTyrProIleArgThrValSerGlnLeuThrArgGluIleTyrThrAsnProValLeuGluAsnPheAspGlySerPheArgGlySerAlaGlnGlyIleGluArgSerIleArgSerProHisLeuMetAspIleLeuAsnSerIleThrIleTyrThrAspAlaHisArgGlyTyrTyrTyrTrpSerGlyHisGlnIleMetAlaSerProValGlyPheSerGlyProGluPheThrPheProLeuTyrGlyThrMetGlyAsnAlaAlaProGlnGlnArgIleValAlaGlnLeuGlyGlnGlyValTyrArgThrLeuSerSerThrLeuTyrArgArgProPheAsnIleGlyIleAsnAsnGlnGlnLeuSerValLeuAspGlyThrGluPheAlaTyrGlyThrSerSerAsnLeuProSerAlaValTyrArgLysSerGlyThrValAspSerLeuAspGluIleProProGlnAsnAsnAsnValProProArgGlnGlyPheSerHisArgLeuSerHisValSerMetPheArgSerGlyPheSerAsnSerSerValSerIleIleArgAlaProMetPheSerTrpThrHisArgSerAlaThrProThrAsnThrIleAspProGluArgIleThrGlnIleProLeuValLysAlaHisThrLeuGlnSerGlyThrThrValValArgGlyProGlyPheThrGlyGlyAspIleLeuArgArgThrSerGlyGlyProPheAlaTyrThrIleValAsnIleAsnGlyGlnLeuProGlnArgTyrArgAlaArgIleArgTyrAlaSerThrThrAsnLeuArgIleTyrValThrValAlaGlyGluArgIlePheAlaGlyGlnPheAsnLysThrMetAspThrGlyAspProLeuThrPheGlnSerPheSerTyrAlaThrIleAsnThrAlaPheThrPheProMetSerGlnSerSerPheThrValGlyAlaAspThrPheSerSerGlyAsnGluValTyrIleAspArgPheGluLeuIleProValThrAlaThrLeuGluAlaGluTyrAsnLeuGluArgAlaGlnLysAlaValAsnAlaLeuPheThrSerThrAsnGlnLeuGlyLeuLysThrAsnValThrAspTyrHisIleAspGlnValSerAsnLeuValThrTyrLeuSerAspGluPheCysLeuAspGluLysArgGluLeuSerGluLysValLysHisAlaLysArgLeuSerAspGluArgAsnLeuLeuGlnAspSerAsnPheLysAspIleAsnArgGlnProGluArgGlyTrpGlyGlySerThrGlyIleThrIleGlnGlyGlyAspAspValPheLysGluAsnTyrValThrLeuSerGlyThrPheAspGluCysTyrProThrTyrLeuTyrGlnLysIleAspGluSerLysLeuLysAlaPheThrArgTyrGlnLeuArgGlyTyrIleGluAspSerGlnAspLeuGluIleTyrLeuIleArgTyrAsnAlaLysHisGluThrValAsnValProGlyThrGlySerLeuTrpProLeuSerAlaGlnSerProIleGlyLysCysGlyGluProAsnArgCysAlaProHisLeuGluTrpAsnProAspLeuAspCysSerCysArgAspGlyGluLysCysAlaHisHisSerHisHisPheSerLeuAspIleAspValGlyCysThrAspLeuAsnGluAspLeuGlyValTrpValIlePheLysIleLysThrGlnAspGlyHisAlaArgLeuGlyAsnLeuGluPheLeuGluGluLysProLeuValGlyGluAlaLeuAlaArgValLysArgAlaGluLysLysTrpArgAspLysArgGluLysLeuGluTrpGluThrAsnIleValTyrLysGluAlaLysGluSerValAspAlaLeuPheValAsnSerGlnTyrAspGlnLeuGlnAlaAspThrAsnIleAlaMetIleHisAlaAlaAspLysArgValHisSerIleArgGluAlaTyrLeuProGluLeuSerValIleProGlyValAsnAlaAlaIlePheGluGluLeuGluGlyArgIlePheThrAlaPheSerLeuTyrAspAlaArgAsnValIleLysAsnGlyAspPheAsnAsnGlyLeuSerCysTrpAsnValLysGlyHisValAspValGluGluGlnAsnAsnGlnArgSerValLeuValValProGluTrpGluAlaGluValSerGlnGluValArgValCysProGlyArgGlyTyrIleLeuArgValThrAlaTyrLysGluGlyTyrGlyGluGlyCysValThrIleHisGluIleGluAsnAsnThrAspGluLeuLysPheSerAsnCysValGluGluGluIleTyrProAsnAsnThrValThrCysAsnAspTyrThrValAsnGlnGluGluTyrGlyGlyAlaTyrThrSerArgAsnArgGlyTyrAsnGluAlaProSerValProAlaAspTyrAlaSerValTyrGluGluLysSerTyrThrAspGlyArgArgGluAsnProCysGluPheAsnArgGlyTyrArgAspTyrThrProLeuProValGlyTyrValThrLysGluLeuGluTyrPheProGluThrAspLysValTrpIleGluIleGlyGluThrGluGlyThrPheIleValAspSerValGluLeuLeuLeuMetGluGlu6.6.3 EG 11735晶体蛋白的氨基酸序列(SEQ ID NO:14)MetAspAsnAsnProAsnIleAsnGluCysIleProTyrAsnCysLeuSerAsnProGluValGluValLeuGlyGlyGluArgIleGluThrGlyTyrThrProIleAspIleSerLeuSerLeuThrGlnPheLeuLeuSerGluPheValProGlyAlaGlyPheValLeuGlyLeuValAspIleIleTrpGlyIlePheGlyProSerGlnTrpAspAlaPheLeuValGlnIleGluGlnLeuIleAsnGlnArgIleGluGluPheAlaArgAsnGlnAlaIleSerArgLeuGluGlyLeuSerAsnLeuTyrGlnIleTyrAlaGluSerPheArgGluTrpGluAlaAspProThrAsnProAlaLeuArgGluGluMetArgIleGlnPheAsnAspMetAsnSerAlaLeuThrThrAlaIleProLeuPheAlaValGlnAsnTyrGlnValProLeuLeuSerValTyrValGlnAlaAlaAsnLeuHisLeuSerValLeuArgAspValSerValPheGlyGlnArgTrpGlyPheAspAlaAlaThrIleAsnSerArgTyrAsnAspLeuThrArgLeuIleGlyAsnTyrThrAspHisAlaValArgTrpTyrAsnThrGlyLeuGluArgValTrpGlyProAspSerArgAspTrpIleArgTyrAsnGlnPheArgArgGluLeuThrLeuThrValLeuAspIleValSerLeuPheProAsnTyrAspSerArgThrTyrProIleArgThrValSerGlnLeuThrArgGluIleTyrThrAsnProValLeuGluAsnPheAspGlySerPheArgGlySerAlaGlnGlyIleGluGlySerIleArgSerProHisLeuMetAspIleLeuAsnSerIleThrIleTyrThrAspAlaHisArgGlyGluTyrTyrTrpSerGlyHisGlnIleMetAlaSerProValGlyPheSerGlyProGluPheThrPheProLeuTyrGlyThrMetGlyAsnAlaAlaProGlnGlnArgIleValAlaGlnLeuGlyGlnGlyValTyrArgThrLeuSerSerThrLeuTyrArgArgProPheAsnIleGlyIleAsnAsnGlnGlnLeuSerValLeuAspGlyThrGluPheAlaTyrGlyThrSerSerAsnLeuProSerAlaValTyrArgLysSerGlyThrValAspSerLeuAspGluIleProProGlnAsnAsnAsnValProProArgGlnGlyPheSerHisArgLeuSerHisValSerMetPheArgSerGlyPheSerAsnSerSerValSerIleIleArgAlaProMetPheSerTrpThrHisArgSerAlaThrProThrAsnThrIleAspProGluArgIleThrGlnIleProLeuValLysAlaHisThrLeuGlnSerGlyThrThrValValArgGlyProGlyPheThrGlyGlyAspIleLeuArgArgThrSerGlyGlyProPheAlaTyrThrIleValAsnIleAsnGlyGlnLeuProGlnArgTyrArgAlaArgIleArgTyrAlaSerThrThrAsnLeuArgIleTyrValThrValAlaGlyGluArgIlePheAlaGlyGlnPheAsnLysThrMetAspThrGlyAspProLeuThrPheGlnSerPheSerTyrAlaThrIleAsnThrAlaPheThrPheProMetSerGlnSerSerPheThrValGlyAlaAspThrPheSerSerGlyAsnGluValTyrIleAspArgPheGluLeuIleProValThrAlaThrPheGluAlaGluTyrAspLeuGluArgAlaGlnLysAlaValAsnAlaLeuPheThrSerIleAsnGlnIleGlyIleLysThrAspValThrAspTyrHisIleAspGlnValSerAsnLeuValAspCysLeuSerAspGluPheCysLeuAspGluLysArgGluLeuSerGluLysValLysHisAlaLysArgLeuSerAspGluArgAsnLeuLeuGlnAspProAsnPheLysGlyIleAsnArgGlnLeuAspArgGlyTrpArgGlySerThrAspIleThrIleGlnArgGlyAspAspValPheLysGluAsnTyrValThrLeuProGlyThrPheAspGluCysTyrProThrTyrLeuTyrGlnLysIleAspGluSerLysLeuLysAlaPheThrArgTyrGlnLeuArgGlyTyrIleGluAspSerGlnAspLeuGluIleTyrLeuIleArgTyrAsnAlaLysHisGluThrValAsnValProGlyThrGlySerLeuTrpProLeuSerAlaGlnSerProIleGlyLysCysGlyGluProAsnArgCysAlaProHisLeuGluTrpAsnProAspLeuAspCysSerCysArgAspGlyGluLysCysAlaHisHisSerHisHisPheSerLeuAspIleAspValGlyCysThrAspLeuAsnGluAspLeuGlyValTrpValIlePheLysIleLysThrGlnAspGlyHisAlaArgLeuGlyAsnLeuGluPheLeuGluGluLysProLeuValGlyGluAlaLeuAlaArgValLysArgAlaGluLysLysTrpArgAspLysArgGluLysLeuGluTrpGluThrAsnIleValTyrLysGluAlaLysGluSerValAspAlaLeuPheValAsnSerGlnTyrAspGlnLeuGlnAlaAspThrAsnIleAlaMetIleHisAlaAlaAspLysArgValHisSerIleArgGluAlaTyrLeuProGluLeuSerValIleProGlyValAsnAlaAlaIlePheGluGluLeuGluGlyArgIlePheThrAlaPheSerLeuTyrAspAlaArgAsnValIleLysAsnGlyAspPheAsnAsnGlyLeuSerCysTrpAsnValLysGlyHisValAspValGluGluGlnAsnAsnGlnArgSerValLeuValValProGluTrpGluAlaGluValSerGlnGluValArgValCysProGlyArgGlyTyrIleLeuArgValThrAlaTyrLysGluGlyTyrGlyGluGlyCysValThrIleHisGluIleGluAsnAsnThrAspGluLeuLysPheSerAsnCysValGluGluGluIleTyrProAsnAsnThrValThrCysAsnAspTyrThrValAsnGlnGluGluTyrGlyGlyAlaTyrThrSerArgAsnArgGlyTyrAsnGluAlaProSerValProAlaAspTyrAlaSerValTyrGluGluLysSerTyrThrAspGlyArgArgGluAsnProCysGluPheAsnArgGlyTyrArgAspTyrThrProLeuProValGlyTyrValThrLysGluLeuGluTyrPheProGluThrAspLysValTrpIleGluIleGlyGluThrGluGlyThrPheIleValAspSerValGluLeuLeuLeuMetGluGlu6.6.4 EG 11092晶体蛋白的氨基酸序列(SEQ ID NO:26)MetAspAsnAsnProAsnIleAsnGluCysIleProTyrAsnCysLeuSerAsnProGluValGluValLeuGlyGlyGluArgIleGluThrGlyTyrThrProIleAspIleSerLeuSerLeuThrGlnPheLeuLeuSerGluPheValProGlyAlaGlyPheValLeuGlyLeuValAspIleIleTrpGlyIlePheGlyProSerGlnTrpAspAlaPheLeuValGlnIleGluGlnLeuIleAsnGlnArgIleGluGluPheAlaArgAsnGlnAlaIleSerArgLeuGluGlyLeuSerAsnLeuTyrGlnIleTyrAlaGluSerPheArgGluTrpGluAlaAspProThrAsnProAlaLeuArgGluGluMetArgIleGlnPheAsnAspMetAsnSerAlaLeuThrThrAlaIleProLeuPheAlaValGlnAsnTyrGlnValProLeuLeuSerValTyrValGlnAlaAlaAsnLeuHisLeuSerValLeuArgAspValSerValPheGlyGlnArgTrpGlyPheAspAlaAlaThrIleAsnSerArgTyrAsnAspLeuThrArgLeuIleGlyAsnTyrThrAspHisAlaValArgTrpTyrAsnThrGlyLeuGluArgValTrpGlyProAspSerArgAspTrpIleArgTyrAsnGlnPheArgArgGluLeuThrLeuThrValLeuAspIleValSerLeuPheProAsnTyrAspSerArgThrTyrProIleArgThrValSerGlnLeuThrArgGluIleTyrThrAsnProValLeuGluAsnPheAspGlySerPheArgGlySerAlaGlnGlyIleGluArgSerIleArgSerProHisLeuMetAspIleLeuAsnSerIleThrIleTyrThrAspAlaHisArgGlyTyrTyrTyrTrpSerGlyHisGlnIleMetAlaSerProValGlyPheSerGlyProGluPheThrPheProLeuTyrGlyThrMetGlyAsnAlaAlaProGlnGlnArgIleValAlaGlnLeuGlyGlnGlyValTyrArgThrLeuSerSerThrLeuTyrArgArgProPheAsnIleGlyIleAsnAsnGlnGlnLeuSerValLeuAspGlyThrGluPheAlaTyrGlyThrSerSerAsnLeuProSerAlaValTyrArgLysSerGlyThrValAspSerLeuAspGluIleProProGlnAsnAsnAsnValProProArgGlnGlyPheSerHisArgLeuSerHisValSerMetPheArgSerGlyPheSerAsnSerSerValSerIleIleArgAlaProMetPheSerTrpThrHisArgSerAlaThrProThrAsnThrIleAspProGluArgIleThrGlnIleProLeuValLysAlaHisThrLeuGlnSerGlyThrThrValValArgGlyProGlyPheThrGlyGlyAspIleLeuArgArgThrSerGlyGlyProPheAlaTyrThrIleValAsnIleAsnGlyGlnLeuProGlnArgTyrArgAlaArgIleArgTyrAlaSerThrThrAsnLeuArgIleTyrValThrValAlaGlyGluArgIlePheAlaGlyGlnPheAsnLysThrMetAspThrGlyAspProLeuThrPheGlnSerPheSerTyrAlaThrIleAsnThrAlaPheThrPheProMetSerGlnSerSerPheThrValGlyAlaAspThrPheSerSerGlyAsnGluValTyrIleAspArgPheGluLeuIleProValThrAlaThrPheGluAlaGluTyrAspLeuGluArgAlaGlnLysAlaValAsnAlaLeuPheThrSerIleAsnGlnIleGlyIleLysThrAspValThrAspTyrHisIleAspGlnValSerAsnLeuValAspCysLeuSerAspGluPheCysLeuAspGluLysArgGluLeuSerGluLysValLysHisAlaLysArgLeuSerAspGluArgAsnLeuLeuGlnAspProAsnPheLysGlyIleAsnArgGlnLeuAspArgGlyTrpArgGlySerThrAspIleThrIleGlnArgGlyAspAspValPheLysGluAsnTyrValThrLeuProGlyThrPheAspGluCysTyrProThrTyrLeuTyrGlnLysIleAspGluSerLysLeuLysAlaPheThrArgTyrGlnLeuArgGlyTyrIleGluAspSerGlnAspLeuGluIleTyrLeuIleArgTyrAsnAlaLysHisGluThrValAsnValProGlyThrGlySerLeuTrpProLeuSerAlaGlnSerProIleGlyLysCysGlyGluProAsnArgCysAlaProHisLeuGluTrpAsnProAspLeuAspCysSerCysArgAspGlyGluLysCysAlaHisHisSerHisHisPheSerLeuAspIleAspValGlyCysThrAspLeuAsnGluAspLeuGlyValTrpValIlePheLysIleLysThrGlnAspGlyHisAlaArgLeuGlyAsnLeuGluPheLeuGluGluLysProLeuValGlyGluAlaLeuAlaArgValLysArgAlaGluLysLysTrpArgAspLysArgGluLysLeuGluTrpGluThrAsnIleValTyrLysGluAlaLysGluSerValAspAlaLeuPheValAsnSerGlnTyrAspGlnLeuGlnAlaAspThrAsnIleAlaMetIleHisAlaAlaAspLysArgValHisSerIleArgGluAlaTyrLeuProGluLeuSerValIleProGlyValAsnAlaAlaIlePheGluGluLeuGluGlyArgIlePheThrAlaPheSerLeuTyrAspAlaArgAsnValIleLysAsnGlyAspPheAsnAsnGlyLeuSerCysTrpAsnValLysGlyHisValAspValGluGluGlnAsnAsnGlnArgSerValLeuValValProGluTrpGluAlaGluValSerGlnGluValArgValCysProGlyArgGlyTyrIleLeuArgValThrAlaTyrLysGluGlyTyrGlyGluGlyCysValThrIleHisGluIleGluAsnAsnThrAspGluLeuLysPheSerAsnCysValGluGluGluIleTyrProAsnAsnThrValThrCysAsnAspTyrThrValAsnGlnGluGluTyrGlyGlyAlaTyrThrSerArgAsnArgGlyTyrAsnGluAlaProSerValProAlaAspTyrAlaSerValTyrGluGluLysSerTyrThrAspGlyArgArgGluAsnProCysGluPheAsnArgGlyTyrArgAspTyrThrProLeuProValGlyTyrValThrLysGluLeuGluTyrPheProGluThrAspLysValTrpIleGluIleGlyGluThrGluGlyThrPheIleValAspSerValGluLeuLeuLeuMetGluGlu6.6.5 EG 11751晶体蛋白的氨基酸序列(SEQ ID NO:28)MetAspAsnAsnProAsnIleAsnGluCysIleProTyrAsnCysLeuSerAsnProGluValGluValLeuGlyGlyGluArgIleGluThrGlyTyrThrProIleAspIleSerLeuSerLeuThrGlnPheLeuLeuSerGluPheValProGlyAlaGlyPheValLeuGlyLeuValAspIleIleTrpGlyIlePheGlyProSerGlnTrpAspAlaPheLeuValGlnIleGluGlnLeuIleAsnGlnArgIleGluGluPheAlaArgAsnGlnAlaIleSerArgLeuGluGlyLeuSerAsnLeuTyrGlnIleTyrAlaGluSerPheArgGluTrpGluAlaAspProThrAsnProAlaLeuArgGluGluMetArgIleGlnPheAsnAspMetAsnSerAlaLeuThrThrAlaIleProLeuPheAlaValGlnAsnTyrGlnValProLeuLeuSerValTyrValGlnAlaAlaAsnLeuHisLeuSerValLeuArgAspValSerValPheGlyGlnArgTrpGlyPheAspAlaAlaThrIleAsnSerArgTyrAsnAspLeuThrArgLeuIleGlyAsnTyrThrAspTyrAlaValArgTrpTyrAsnThrGlyLeuGluArgValTrpGlyProAspSerArgAspTrpValArgTyrAsnGlnPheArgArgGluLeuThrLeuThrValLeuAspIleValAlaLeuPheProAsnTyrAspSerArgArgTyrProIleArgThrValSerGlnLeuThrArgGluIleTyrThrAsnProValLeuGluAsnPheAspGlySerPheArgGlySerAlaGlnGlyIleGluArgSerIleArgSerProHisLeuMetAspIleLeuAsnSerIleThrIleTyrThrAspAlaHisArgGlyTyrTyrTyrTrpSerGlyHisGlnIleMetAlaSerProValGlyPheSerGlyProGluPheThrPheProLeuTyrGlyThrMetGlyAsnAlaAlaProGlnGlnArgIleValAlaGlnLeuGlyGlnGlyValTyrArgThrLeuSerSerThrLeuTyrArgArgProPheAsnIleGlyIleAsnAsnGlnGlnLeuSerValLeuAspGlyThrGluPheAlaTyrGlyThrSerSerAsnLeuProSerAlaValTyrArgLysSerGlyThrValAspSerLeuAspGluIleProProGlnAsnAsnAsnValProProArgGlnGlyPheSerHisArgLeuSerHisValSerMetPheArgSerGlyPheSerAsnSerSerValSerIleIleArgAlaProMetPheSerTrpIleHisArgSerAlaGluPheAsnAsnIleIleAlaSerAspSerIleThrGlnIleProLeuValLysAlaHisThrLeuGlnSerGlyThrThrValValArgGlyProGlyPheThrGlyGlyAspIleLeuArgArgThrSerGlyGlyProPheAlaTyrThrIleValAsnIleAsnGlyGlnLeuProGlnArgTyrArgAlaArgIleArgTyrAlaSerThrThrAsnLeuArgIleTyrValThrValAlaGlyGluArgIlePheAlaGlyGlnPheAsnLysThrMetAspThrGlyAspProLeuThrPheGlnSerPheSerTyrAlaThrIleAsnThrAlaPheThrPheProMetSerGlnSerSerPheThrValGlyAlaAspThrPheSerSerGlyAsnGluValTyrIleAspArgPheGluLeuIleProValThrAlaThrPheGluAlaGluTyrAspLeuGluArgAlaGlnLysAlaValAsnAlaLeuPheThrSerIleAsnGlnIleGlyIleLysThrAspValThrAspTyrHisIleAspGlnValSerAsnLeuValAspCysLeuSerAspGluPheCysLeuAspGluLysArgGluLeuSerGluLysValLysHisAlaLysArgLeuSerAspGluArgAsnLeuLeuGlnAspProAsnPheLysGlyIleAsnArgGlnLeuAspArgGlyTrpArgGlySerThrAspIleThrIleGlnArgGlyAspAspValPheLysGluAsnTyrValThrLeuProGlyThrPheAspGluCysTyrProThrTyrLeuTyrGlnLysIleAspGluSerLysLeuLysAlaPheThrArgTyrGlnLeuArgGlyTyrIleGluAspSerGlnAspLeuGluIleTyrLeuIleArgTyrAsnAlaLysHisGluThrValAsnValProGlyThrGlySerLeuTrpProLeuSerAlaGlnSerProIleGlyLysCysGlyGluProAsnArgCysAlaProHisLeuGluTrpAsnProAspLeuAspCysSerCysArgAspGlyGluLysCysAlaHisHisSerHisHisPheSerLeuAspIleAspValGlyCysThrAspLeuAsnGluAspLeuGlyValTrpValIlePheLysIleLysThrGlnAspGlyHisAlaArgLeuGlyAsnLeuGluPheLeuGluGluLysProLeuValGlyGluAlaLeuAlaArgValLysArgAlaGluLysLysTrpArgAspLysArgGluLysLeuGluTrpGluThrAsnIleValTyrLysGluAlaLysGluSerValAspAlaLeuPheValAsnSerGlnTyrAspGlnLeuGlnAlaAspThrAsnIleAlaMetIleHisAlaAlaAspLysArgValHisSerIleArgGluAlaTyrLeuProGluLeuSerValIleProGlyValAsnAlaAlaIlePheGluGluLeuGluGlyArgIlePheThrAlaPheSerLeuTyrAspAlaArgAsnValIleLysAsnGlyAspPheAsnAsnGlyLeuSerCysTrpAsnValLysGlyHisValAspValGluGluGlnAsnAsnGlnArgSerValLeuValValProGluTrpGluAlaGluValSerGlnGluValArgValCysProGlyArgGlyTyrIleLeuArgValThrAlaTyrLysGluGlyTyrGlyGluGlyCysValThrIleHisGluIleGluAsnAsnThrAspGluLeuLysPheSerAsnCysValGluGluGluIleTyrProAsnAsnThrValThrCysAsnAspTyrThrValAsnGlnGluGluTyrGlyGlyAlaTyrThrSerArgAsnArgGlyTyrAsnGluAlaProSerValProAlaAspTyrAlaSerValTyrGluGluLysSerTyrThrAspGlyArgArgGluAsnProCysGluPheAsnArgGlyTyrArgAspTyrThrProLeuProValGlyTyrValThrLysGluLeuGluTyrPheProGluThrAspLysValTrpIleGluIleGlyGluThrGluGlyThrPheIleValAspSerValGluLeuLeuLeuMetGluGlu6.6.6 EG 11091晶体蛋白的氨基酸序列(SEQ ID NO:30)MetAspAsnAsnProAsnIleAsnGluCysIleProTyrAsnCysLeuSerAsnProGluValGluValLeuGlyGlyGluArgIleGluThrGlyTyrThrProIleAspIleSerLeuSerLeuThrGlnPheLeuLeuSerGluPheValProGlyAlaGlyPheValLeuGlyLeuValAspIleIleTrpGlyIlePheGlyProSerGlnTrpAspAlaPheLeuValGlnIleGluGlnLeuIleAsnGlnArgIleGluGluPheAlaArgAsnGlnAlaIleSerArgLeuGluGlyLeuSerAsnLeuTyrGlnIleTyrAlaGluSerPheArgGluTrpGluAlaAspProThrAsnProAlaLeuArgGluGluMetArgIleGlnPheAsnAspMetAsnSerAlaLeuThrThrAlaIleProLeuPheAlaValGlnAsnTyrGlnValProLeuLeuSerValTyrValGlnAlaAlaAsnLeuHisLeuSerValLeuArgAspValSerValPheGlyGlnArgTrpGlyPheAspAlaAlaThrIleAsnSerArgTyrAsnAspLeuThrArgLeuIleGlyAsnTyrThrAspTyrAlaValArgTrpTyrAsnThrGlyLeuGluArgValTrpGlyProAspSerArgAspTrpValArgTyrAsnGlnPheArgArgGluLeuThrLeuThrValLeuAspIleValAlaLeuPheProAsnTyrAspSerArgArgTyrProIleArgThrValSerGlnLeuThrArgGluIleTyrThrAsnProValLeuGluAsnPheAspGlySerPheArgGlySerAlaGlnGlyIleGluArgSerIleArgSerProHisLeuMetAspIleLeuAsnSerIleThrIleTyrThrAspAlaHisArgGlyTyrTyrTyrTrpSerGlyHisGlnIleMetAlaSerProValGlyPheSerGlyProGluPheThrPheProLeuTyrGlyThrMetGlyAsnAlaAlaProGlnGlnArgIleValAlaGlnLeuGlyGlnGlyValTyrArgThrLeuSerSerThrLeuTyrArgArgProPheAsnIleGlyIleAsnAsnGlnGlnLeuSerValLeuAspGlyThrGluPheAlaTyrGlyThrSerSerAsnLeuProSerAlaValTyrArgLysSerGlyThrValAspSerLeuAspGluIleProProGlnAsnAsnAsnValProProArgGlnGlyPheSerHisArgLeuSerHisValSerMetPheArgSerGlyPheSerAsnSerSerValSerIleIleArgAlaProMetPheSerTrpIleHisArgSerAlaThrLeuThrAsnThrIleAspProGluArgIleAsnGlnIleProLeuValLysGlyPheArgValTrpGlyGlyThrSerValIleThrGlyProGlyPheThrGlyGlyAspIleLeuArgArgAsnThrPheGlyAspPheValSerLeuGlnValAsnIleAsnSerProIleThrGlnArgTyrArgLeuArgPheArgTyrAlaSerSerArgAspAlaArgValIleValLeuThrGlyAlaAlaSerThrGlyValGlyGlyGlnValSerValAsnMetProLeuGlnLysThrMetGluIleGlyGluAsnLeuThrSerArgThrPheArgTyrThrAspPheSerAsnProPheSerPheArgAlaAsnProAspIleIleGlyIleSerGluGlnProLeuPheGlyAlaGlySerIleSerSerGlyGluLeuTyrIleAspLysIleGluIleIleLeuAlaAspAlaThrPheGluAlaGluSerAspLeuGluArgAlaGlnLysAlaValAsnAlaLeuPheThrSerSerAsnGlnIleGlyLeuLysThrAspValThrAspTyrHisIleAspGlnValSerAsnLeuValAspCysLeuSerAspGluPheCysLeuAspGluLysArgGluLeuSerGluLysValLysHisAlaLysArgLeuSerAspGluArgAsnLeuLeuGlnAspProAsnPheArgGlyIleAsnArgGlnProAspArgGlyTrpArgGlySerThrAspIleThrIleGlnGlyGlyAspAspValPheLysGluAsnTyrValThrLeuProGlyThrValAspGluCysTyrProThrTyrLeuTyrGlnLysIleAspGluSerLysLeuLysAlaTyrThrArgTyrGluLeuArgGlyTyrIleGluAspSerGlnAspLeuGluIleTyrLeuIleArgTyrAsnAlaLysHisGluIleValAsnValProGlyThrGlySerLeuTrpProLeuSerAlaGlnSerProIleGlyLysCysGlyGluProAsnArgCysAlaProHisLeuGluTrpAsnProAspLeuAspCysSerCysArgAspGlyGluLysCysAlaHisHisSerHisHisPheThrLeuAspIleAspValGlyCysThrAspLeuAsnGluAspLeuGlyValTrpValIlePheLysIleLysThrGlnAspGlyHisAlaArgLeuGlyAsnLeuGluPheLeuGluGluLysProLeuLeuGlyGluAlaLeuAlaArgValLysArgAlaGluLysLysTrpArgAspLysArgGluLysLeuGlnLeuGluThrAsnIleValTyrLysGluAlaLysGluSerValAspAlaLeuPheValAsnSerGlnTyrAspArgLeuGlnValAspThrAsnIleAlaMetIleHisAlaAlaAspLysArgValHisArgIleArgGluAlaTyrLeuProGluLeuSerValIleProGlyValAsnAlaAlaIlePheGluGluLeuGluGlyArgIlePheThrAlaTyrSerLeuTyrAspAlaArgAsnValIleLysAsnGlyAspPheAsnAsnGlyLeuLeuCysTrpAsnValLysGlyHisValAspValGluGluGlnAsnAsnHisArgSerValLeuValIleProGluTrpGluAlaGluValSerGlnGluValArgValCysProGlyArgGlyTyrIleLeuArgValThrAlaTyrLysGluGlyTyrGlyGluGlyCysValThrIleHisGluIleGluAspAsnThrAspGluLeuLysPheSerAsnCysValGluGluGluValTyrProAsnAsnThrValThrCysAsnAsnTyrThrGlyThrGlnGluGluTyrGluGlyThrTyrThrSerArgAsnGlnGlyTyrAspGluAlaTyrGlyAsnAsnProSerValProAlaAspTyrAlaSerValTyrGluGluLysSerTyrThrAspGlyArgArgGluAsnProCysGluSerAsnArgGlyTyrGlyAspTyrThrProLeuProAlaGlyTyrValThrLysAspLeuGluTyrPheProGluThrAspLysValTrpIleGluIleGlyGluThrGluGlyThrPheIleValAspSerValGluLeuLeuLeuMetGluGlu6.6.7 EG 11768晶体蛋白的氨基酸序列(SEQ ID NO:34)MetAspAsnAsnProAsnIleAsnGluCysIleProTyrAsnCysLeuSerAsnProGluValGluValLeuGlyGlyGluArgIleGluThrGlyTyrThrProIleAspIleSerLeuSerLeuThrGlnPheLeuLeuSerGluPheValProGlyAlaGlyPheValLeuGlyLeuValAspIleIleTrpGlyIlePheGlyProSerGlnTrpAspAlaPheLeuValGlnIleGluGlnLeuIleAsnGlnArgIleGluGluPheAlaArgAsnGlnAlaIleSerArgLeuGluGlyLeuSerAsnLeuTyrGlnIleTyrAlaGluSerPheArgGluTrpGluAlaAspProThrAsnProAlaLeuArgGluGluMetArgIleGlnPheAsnAspMetAsnSerAlaLeuThrThrAlaIleProLeuPheAlaValGlnAsnTyrGlnValProLeuLeuSerValTyrValGlnAlaAlaAsnLeuHisLeuSerValLeuArgAspValSerValPheGlyGlnArgTrpGlyPheAspAlaAlaThrIleAsnSerArgTyrAsnAspLeuThrArgLeuIleGlyAsnTyrThrAspTyrAlaValArgTrpTyrAsnThrGlyLeuGluArgValTrpGlyProAspSerArgAspTrpValArgTyrAsnGlnPheArgArgGluLeuThrLeuThrValLeuAspIleValAlaLeuPheProAsnTyrAspSerArgArgTyrProIleArgThrValSerGlnLeuThrArgGluIleTyrThrAsnProValLeuGluAsnPheAspGlySerPheArgGlySerAlaGlnGlyIleGluArgSerIleArgSerProHisLeuMetAspIleLeuAsnSerIleThrIleTyrThrAspAlaHisArgGlyTyrTyrTyrTrpSerGlyHisGlnIleMetAlaSerProValGlyPheSerGlyProGluPheThrPheProLeuTyrGlyThrMetGlyAsnAlaAlaProGlnGlnArgIleValAlaGlnLeuGlyGlnGlyValTyrArgThrLeuSerSerThrLeuTyrArgArgProPheAsnIleGlyIleAsnAsnGlnGlnLeuSerValLeuAspGlyThrGluPheAlaTyrGlyThrSerSerAsnLeuProSerAlaValTyrArgLysSerGlyThrValAspSerLeuAspGluIleProProGlnAsnAsnAsnValProProArgGlnGlyPheSerHisArgLeuSerHisValSerMetPheArgSerGlyPheSerAsnSerSerValSerIleIleArgAlaProMetPheSerTrpIleHisArgSerAlaGluPheAsnAsnIleIleAlaSerAspSerIleThrGlnIleProLeuValLysAlaHisThrLeuGlnSerGlyThrThrValValArgGlyProGlyPheThrGlyGlyAspIleLeuArgArgThrSerGlyGlyProPheAlaTyrThrIleValAsnIleAsnGlyGlnLeuProGlnArgTyrArgAlaArgIleArgTyrAlaSerThrThrAsnLeuArgIleTyrValThrValAlaGlyGluArgIlePheAlaGlyGlnPheAsnLysThrMetAspThrGlyAspProLeuThrPheGlnSerPheSerTyrAlaThrIleAsnThrAlaPheThrPheProMetSerGlnSerSerPheThrValGlyAlaAspThrPheSerSerGlyAsnGluValTyrIleAspArgPheGluLeuIleProValThrAlaThrLeuGluAlaGluTyrAsnLeuGluArgAlaGlnLysAlaValAsnAlaLeuPheThrSerThrAsnGlnLeuGlyLeuLysThrAsnValThrAspTyrHisIleAspGlnValSerAsnLeuValThrTyrLeuSerAspGluPheCysLeuAspGluLysArgGluLeuSerGluLysValLysHisAlaLysArgLeuSerAspGluArgAsnLeuLeuGlnAspSerAsnPheLysAspIleAsnArgGlnProGluArgGlyTrpGlyGlySerThrGlyIleThrIleGlnGlyGlyAspAspValPheLysGluAsnTyrValThrLeuSerGlyThrPheAspGluCysTyrProThrTyrLeuTyrGlnLysIleAspGluSerLysLeuLysAlaPheThrArgTyrGInLeuArgGlyTyrIleGluAspSerGlnAspLeuGluIleTyrLeuIleArgTyrAsnAlaLysHisGluThrValAsnValProGlyThrGlySerLeuTrpProLeuSerAlaGlnSerProIleGlyLysCysGlyGluProAsnArgCysAlaProHisLeuGluTrpAsnProAspLeuAspCysSerCysArgAspGlyGluLysCysAlaHisHisSerHisHisPheSerLeuAspIleAspValGlyCysThrAspLeuAsnGluAspLeuGlyValTrpValIlePheLysIleLysThrGlnAspGlyHisAlaArgLeuGlyAsnLeuGluPheLeuGluGluLysProLeuValGlyGluAlaLeuAlaArgValLysArgAlaGluLysLysTrpArgAspLysArgGluLysLeuGluTrpGluThrAsnIleValTyrLysGluAlaLysGluSerValAspAlaLeuPheValAsnSerGlnTyrAspGlnLeuGlnAlaAspThrAsnIleAlaMetIleHisAlaAlaAspLysArgValHisSerIleArgGluAlaTyrLeuProGluLeuSerValIleProGlyValAsnAlaAlaIlePheGluGluLeuGluGlyArgIlePheThrAlaPheSerLeuTyrAspAlaArgAsnValIleLysAsnGlyAspPheAsnAsnGlyLeuSerCysTrpAsnValLysGlyHisValAspValGluGluGlnAsnAsnGlnArgSerValLeuValValProGluTrpGluAlaGluValSerGlnGluValArgValCysProGlyArgGlyTyrIleLeuArgValThrAlaTyrLysGluGlyTyrGlyGluGlyCysValThrIleHisGluIleGluAsnAsnThrAspGluLeuLysPheSerAsnCysValGluGluGluIleTyrProAsnAsnThrValThrCysAsnAspTyrThrValAsnGlnGluGluTyrGlyGlyAlaTyrThrSerArgAsnArgGlyTyrAsnGluAlaProSerValProAlaAspTyrAlaSerValTyrGluGluLysSerTyrThrAspGlyArgArgGluAsnProCysGluPheAsnArgGlyTyrArgAspTyrThrProLeuProValGlyTyrValThrLysGluLeuGluTyrPheProGluThrAspLysValTrpIleGluIleGlyGluThrGluGlyThrPheIleValAspSerValGluLeuLeuLeuMetGluGlu6.7实施例7--编码新的晶体蛋白的DNA序列6.7.1编码EG 11063晶体蛋白的DNA序列(SEQ ID NO:9)ATG   GAT   AAC   AAT   CCG   AAC   ATC   AAT   GAA   TGC   ATT   CCT   TAT   AAT   TGT   TTA               48AGT   AAC   CCT   GAA   GTA   GAA   GTA   TTA   GGT   GGA   GAA   AGA   ATA   GAA   ACT   GGT               96TAC   ACC   CCA   ATC   GAT   ATT   TCC   TTG   TCG   CTA   ACG   CAA   TTT   CTT   TTG   AGT              144GAA   TTT   GTT   CCC   GGT   GCT   GGA   TTT   GTG   TTA   GGA   CTA   GTT   GAT   ATA   ATA              192TGG   GGA   ATT   TTT   GGT   CCC   TCT   CAA   TGG   GAC   GCA   TTT   CTT   GTA   CAA   ATT              240GAA   CAG   TTA   ATT   AAC   CAA   AGA   ATA   GAA   GAA   TTC   GCT   AGG   AAC   CAA   GCC              288ATT   TCT   AGA   TTA   GAA   GGA   CTA   AGC   AAT   CTT   TAT   CAA   ATT   TAC   GCA   GAA              336TCT   TTT   AGA   GAG   TGG   GAA   GCA   GAT   CCT   ACT   AAT   CCA   GCA   TTA   AGA   GAA              384GAG   ATG   CGT   ATT   CAA   TTC   AAT   GAC   ATG   AAC   AGT   GCC   CTT   ACA   ACC   GCT              432ATT   CCT   CTT   TTT   GCA   GTT   CAA   AAT   TAT   CAA   GTT   CCT   CTT   TTA   TCA   GTA              480TAT   GTT   CAA   GCT   GCA   AAT   TTA   CAT   TTA   TCA   GTT   TTG   AGA   GAT   GTT   TCA              528GTG   TTT   GGA   CAA   AGG   TGG   GGA   TTT   GAT   GCC   GCG   ACT   ATC   AAT   AGT   CGT              576TAT   AAT   GAT   TTA   ACT   AGG   CTT   ATT   GGC   AAC   TAT   ACA   GAT   TAT   GCT   GTA              624CGC   TGG   TAC   AAT   ACG   GGA   TTA   GAA   CGT   GTA   TGG   GGA   CCG   GAT   TCT   AGA              672GAT   TGG   GTA   AGG   TAT   AAT   CAA   TTT   AGA   AGA   GAA   TTA   ACA   CTA   ACT   GTA              720TTA   GAT   ATC   GTT   GCT   CTG   TTC   CCG   AAT   TAT   GAT   AGT   AGA   AGA   TAT   CCA              768ATT   CGA   ACA   GTT   TCC   CAA   TTA   ACA   AGA   GAA   ATT   TAT   ACA   AAC   CCA   GTA              816TTA   GAA   AAT   TTT   GAT   GGT   AGT   TTT   CGA   GGC   TCG   GCT   CAG   GGC   ATA   GAA              864AGA   AGT   ATT   AGG   AGT   CCA   CAT   TTG   ATG   GAT   ATA   CTT   AAC   AGT   ATA   ACC              912ATC   TAT   ACG   GAT   GCT   CAT   AGG   GGT   TAT   TAT   TAT   TGG   TCA   GGG   CAT   CAA              960ATA   ATG   GCT   TCT   CCT   GTA   GGG   TTT   TCG   GGG   CCA   GAA   TTC   ACT   TTT   CCG             1008CTA   TAT   GGA   ACT   ATG   GGA   AAT   GCA   GCT   CCA   CAA   CAA   CGT   ATT   GTT   GCT             1056CAA   CTA   GGT   CAG   GGC   GTG   TAT   AGA   ACA   TTA   TCG   TCC   ACT   TTA   TAT   AGA             1104AGA   CCT   TTT   AAT   ATA   GGG   ATA   AAT   AAT   CAA   CAA   CTA   TCT   GTT   CTT   GAC             1152GGG   ACA   GAA   TTT   GCT   TAT   GGA   ACC   TCC   TCA   AAT   TTG   CCA   TCC   GCT   GTA         1200TAC   AGA   AAA   AGC   GGA   ACG   GTA   GAT   TCG   CTG   GAT   GAA   ATA   CCG   CCA   CAG         1248AAT   AAC   AAC   GTG   CCA   CCT   AGG   CAA   GGA   TTT   AGT   CAT   CGA   TTA   AGC   CAT         1296GTT   TCA   ATG   TTT   CGT   TCA   GGC   TTT   AGT   AAT   AGT   AGT   GTA   AGT   ATA   ATA         1344AGA   GCT   CCA   ATG   TTT   TCT   TGG   ACG   CAC   CGT   AGT   GCA   ACC   CCT   ACA   AAT         1392ACA   ATT   GAT   CCG   GAG   AGG   ATT   ACT   CAA   ATA   CCA   TTG   GTA   AAA   GCA   CAT         1440ACA   CTT   CAG   TCA   GGT   ACT   ACT   GTT   GTA   AGA   GGG   CCC   GGG   TTT   ACG   GGA         1488GGA   GAT   ATT   CTT   CGA   CGA   ACA   AGT   GGA   GGA   CCA   TTT   GCT   TAT   ACT   ATT         1536GTT   AAT   ATA   AAT   GGG   CAA   TTA   CCC   CAA   AGG   TAT   CGT   GCA   AGA   ATA   CGC         1584TAT   GCC   TCT   ACT   ACA   AAT   CTA   AGA   ATT   TAC   GTA   ACG   GTT   GCA   GGT   GAA         1632CGG   ATT   TTT   GCT   GGT   CAA   TTT   AAC   AAA   ACA   ATG   GAT   ACC   GGT   GAC   CCA         1680TTA   ACA   TTC   CAA   TCT   TTT   AGT   TAC   GCA   ACT   ATT   AAT   ACA   GCT   TTT   ACA         1728TTC   CCA   ATG   AGC   CAG   AGT   AGT   TTC   ACA   GTA   GGT   GCT   GAT   ACT   TTT   AGT         1776TCA   GGG   AAT   GAA   GTT   TAT   ATA   GAC   AGA   TTT   GAA   TTG   ATT   CCA   GTT   ACT         1824GCA   ACA   TTT   GAA   GCA   GAA   TAT   GAT   TTA   GAA   AGA   GCA   CAA   AAG   GCG   GTG         1872AAT   GCG   CTG   TTT   ACT   TCT   ATA   AAC   CAA   ATA   GGG   ATA   AAA   ACA   GAT   GTG         1920ACG   GAT   TAT   CAT   ATT   GAT   CAA   GTA   TCC   AAT   TTA   GTG   GAT   TGT   TTA   TCA         1968GAT   GAA   TTT   TGT   CTG   GAT   GAA   AAG   CGA   GAA   TTG   TCC   GAG   AAA   GTC   AAA         2016CAT   GCG   AAG   CGA   CTC   AGT   GAT   GAG   CGG   AAT   TTA   CTT   CAA   GAT   CCA   AAC         2064TTC   AAA   GGC   ATC   AAT   AGG   CAA   CTA   GAC   CGT   GGT   TGG   AGA   GGA   AGT   ACG         2112GAT   ATT   ACC   ATC   CAA   AGA   GGA   GAT   GAC   GTA   TTC   AAA   GAA   AAT   TAT   GTC         2160ACA   CTA   CCA   GGT   ACC   TTT   GAT   GAG   TGC   TAT   CCA   ACA   TAT   TTG   TAT   CAA         2208AAA   ATC   GAT   GAA   TCA   AAA   TTA   AAA   GCC   TTT   ACC   CGT   TAT   CAA   TTA   AGA         2256GGG   TAT   ATC   GAA   GAT   AGT   CAA   GAC   TTA   GAA   ATC   TAT   TTA   ATT   CGC   TAC         2304AAT   GCA   AAA   CAT   GAA   ACA   GTA   AAT   GTG   CCA   GGT   ACG   GGT   TCC   TTA   TGG         2352CCG   CTT   TCA   GCC   CAA   AGT   CCA   ATC   GGA   AAG   TGT   GGA   GAG   CCG   AAT   CGA         2400TGC   GCG   CCA   CAC   CTT   GAA   TGG   AAT   CCT   GAC   TTA   GAT   TGT   TCG   TGT   AGG         2448GAT   GGA   GAA   AAG   TGT   GCC   CAT   CAT   TCG   CAT   CAT   TTC   TCC   TTA   GAC   ATT         2496GAT   GTA   GGA   TGT   ACA   GAC   TTA   AAT   GAG   GAC   CTA   GGT   GTA   TGG   GTG   ATC         2544TTT   AAG   ATT   AAG   ACG   CAA   GAT   GGG   CAC   GCA   AGA   CTA   GGG   AAT   CTA   GAG         2592TTT   CTC   GAA   GAG   AAA   CCA   TTA   GTA   GGA   GAA   GCG   CTA   GCT   CGT   GTG   AAA         2640AGA   GCG   GAG   AAA   AAA   TGG   AGA   GAC   AAA   CGT   GAA   AAA   TTG   GAA   TGG   GAA         2688ACA   AAT   ATC   GTT   TAT   AAA   GAG   GCA   AAA   GAA   TCT   GTA   GAT   GCT   TTA   TTT         2736GTA   AAC   TCT   CAA   TAT   GAT   CAA   TTA   CAA   GCG   GAT   ACG   AAT   ATT   GCC   ATG         2784ATT   CAT   GCG   GCA   GAT   AAA   CGT   GTT   CAT   AGC   ATT   CGA   GAA   GCT   TAT   CTG         2832CCT   GAG   CTG   TCT   GTG   ATT   CCG   GGT   GTC   AAT   GCG   GCT   ATT   TTT   GAA   GAA         2880TTA   GAA   GGG   CGT   ATT   TTC   ACT   GCA   TTC   TCC   CTA   TAT   GAT   GCG   AGA   AAT         2928GTC   ATT   AAA   AAT   GGT   GAT   TTT   AAT   AAT   GGC   TTA   TCC   TGC   TGG   AAC   GTG         2976AAA   GGG   CAT   GTA   GAT   GTA   GAA   GAA   CAA   AAC   AAC   CAA   CGT   TCG   GTC   CTT          3024GTT   GTT   CCG   GAA   TGG   GAA   GCA   GAA   GTG   TCA   CAA   GAA   GTT   CGT   GTC   TGT          3072CCG   GGT   CGT   GGC   TAT   ATC   CTT   CGT   GTC   ACA   GCG   TAC   AAG   GAG   GGA   TAT          3120GGA   GAA   GGT   TGC   GTA   ACC   ATT   CAT   GAG   ATC   GAG   AAC   AAT   ACA   GAC   GAA          3168CTG   AAG   TTT   AGC   AAC   TGC   GTA   GAA   GAG   GAA   ATC   TAT   CCA   AAT   AAC   ACG          3216GTA   ACG   TGT   AAT   GAT   TAT   ACT   GTA   AAT   CAA   GAA   GAA   TAC   GGA   GGT   GCG          3264TAC   ACT   TCT   CGT   AAT   CGA   GGA   TAT   AAC   GAA   GCT   CCT   TCC   GTA   CCA   GCT          3312GAT   TAT   GCG   TCA   GTC   TAT   GAA   GAA   AAA   TCG   TAT   ACA   GAT   GGA   CGA   AGA          3360GAG   AAT   CCT   TGT   GAA   TTT   AAC   AGA   GGG   TAT   AGG   GAT   TAC   ACG   CCA   CTA          3408CCA   GTT   GGT   TAT   GTG   ACA   AAA   GAA   TTA   GAA   TAC   TTC   CCA   GAA   ACC   GAT          3456AAG   GTA   TGG   ATT   GAG   ATT   GGA   GAA   ACG   GAA   GGA   ACA   TTT   ATC   GTG   GAC          3504AGC   GTG   GAA   TTA   CTC   CTT   ATG   GAG   GAA                                                    35316.7.2编码EG 11074晶体蛋白的DNA序列(SEQ ID NO:11)ATG   GAT   AAC   AAT   CCG   AAC   ATC   AAT   GAA   TGC   ATT   CCT   TAT   AAT   TGT   TTA            48AGT   AAC   CCT   GAA   GTA   GAA   GTA   TTA   GGT   GGA   GAA   AGA   ATA   GAA   ACT   GGT            96TAC   ACC   CCA   ATC   GAT   ATT   TCC   TTG   TCG   CTA   ACG   CAA   TTT   CTT   TTG   AGT           144GAA   TTT   GTT   CCC   GGT   GCT   GGA   TTT   GTG   TTA   GGA   CTA   GTT   GAT   ATA   ATA           192TGG   GGA   ATT   TTT   GGT   CCC   TCT   CAA   TGG   GAC   GCA   TTT   CTT   GTA   CAA   ATT           240GAA   CAG   TTA   ATT   AAC   CAA   AGA   ATA   GAA   GAA   TTC   GCT   AGG   AAC   CAA   GCC           288ATT   TCT   AGA   TTA   GAA   GGA   CTA   AGC   AAT   CTT   TAT   CAA   ATT   TAC   GCA   GAA           336TCT   TTT   AGA   GAG   TGG   GAA   GCA   GAT   CCT   ACT   AAT   CCA   GCA   TTA   AGA   GAA           384GAG   ATG   CGT   ATT   CAA   TTC   AAT   GAC   ATG   AAC   AGT   GCC   CTT   ACA   ACC   GCT           432ATT   CCT   CTT   TTT   GCA   GTT   CAA   AAT   TAT   CAA   GTT   CCT   CTT   TTA   TCA   GTA           480TAT   GTT   CAA   GCT   GCA   AAT   TTA   CAT   TTA   TCA   GTT   TTG   AGA   GAT   GTT   TCA           528GTG   TTT   GGA   CAA   AGG   TGG   GGA   TTT   GAT   GCC   GCG   ACT   ATC   AAT   AGT   CGT           576TAT   AAT   GAT   TTA   ACT   AGG   CTT   ATT   GGC   AAC   TAT   ACA   GAT   TAT   GCT   GTA           624CGC   TGG   TAC   AAT   ACG   GGA   TTA   GAA   CGT   GTA   TGG   GGA   CCG   GAT   TCT   AGA           672GAT   TGG   GTA   AGG   TAT   AAT   CAA   TTT   AGA   AGA   GAA   TTA   ACA   CTA   ACT   GTA           720TTA   GAT   ATC   GTT   GCT   CTG   TTC   CCG   AAT   TAT   GAT   AGT   AGA   AGA   TAT   CCA           768ATT   CGA   ACA   GTT   TCC   CAA   TTA   ACA   AGA   GAA   ATT   TAT   ACA   AAC   CCA   GTA           816TTA   GAA   AAT   TTT   GAT   GGT   AGT   TTT   CGA   GGC   TCG   GCT   CAG   GGC   ATA   GAA           864AGA   AGT   ATT   AGG   AGT   CCA   CAT   TTG   ATG   GAT   ATA   CTT   AAC   AGT   ATA   ACC           912ATC   TAT   ACG   GAT   GCT   CAT   AGG   GGT   TAT   TAT   TAT   TGG   TCA   GGG   CAT   CAA           960ATA   ATG   GCT   TCT   CCT   GTA   GGG   TTT   TCG   GGG   CCA   GAA   TTC   ACT   TTT   CCG          1008CTA   TAT   GGA   ACT   ATG   GGA   AAT   GCA   GCT   CCA   CAA   CAA   CGT   ATT   GTT   GCT          1056CAA   CTA   GGT   CAG   GGC   GTG   TAT   AGA   ACA   TTA   TCG   TCC   ACT   TTA   TAT   AGA          1104AGA   CCT   TTT   AAT   ATA   GGG   ATA   AAT   AAT   CAA   CAA   CTA   TCT   GTT   CTT   GAC          1152GGG   ACA   GAA   TTT   GCT   TAT   GGA   ACC   TCC   TCA   AAT   TTG   CCA   TCC   GCT   GTA          1200TAC   AGA   AAA   AGC   GGA   ACG   GTA   GAT   TCG   CTG   GAT   GAA   ATA   CCG   CCA   CAG          1248AAT   AAC   AAC   GTG   CCA   CCT   AGG   CAA   GGA   TTT   AGT   CAT   CGA   TTA   AGC   CAT          1296GTT   TCA   ATG   TTT   CGT   TCA   GGC   TTT   AGT   AAT   AGT   AGT   GTA   AGT   ATA   ATA          1344AGA   GCT   CCA   ATG   TTT   TCT   TGG   ACG   CAC   CGT   AGT   GCA   ACC   CCT   ACA   AAT          1392ACA   ATT   GAT   CCG   GAG   AGG   ATT   ACT   CAA   ATA   CCA   TTG   GTA   AAA   GCA   CAT          1440ACA   CTT   CAG   TCA   GGT   ACT   ACT   GTT   GTA   AGA   GGG   CCC   GGG   TTT   ACG   GGA          1488GGA   GAT   ATT   CTT   CGA   CGA   ACA   AGT   GGA   GGA   CCA   TTT   GCT   TAT   ACT   ATT          1536GTT   AAT   ATA   AAT   GGG   CAA   TTA   CCC   CAA   AGG   TAT   CGT   GCA   AGA   ATA   CGC          1584TAT   GCC   TCT   ACT   ACA   AAT   CTA   AGA   ATT   TAC   GTA   ACG   GTT   GCA   GGT   GAA          1632CGG   ATT   TTT   GCT   GGT   CAA   TTT   AAC   AAA   ACA   ATG   GAT   ACC   GGT   GAC   CCA          1680TTA   ACA   TTC   CAA   TCT   TTT   AGT   TAC   GCA   ACT   ATT   AAT   ACA   GCT   TTT   ACA          1728TTC   CCA   ATG   AGC   CAG   AGT   AGT   TTC   ACA   GTA   GGT   GCT   GAT   ACT   TTT   AGT          1776TCA   GGG   AAT   GAA   GTT   TAT   ATA   GAC   AGA   TTT   GAA   TTG   ATT   CCA   GTT   ACT          1824GCA   ACA   CTC   GAG   GCT   GAA   TAT   AAT   CTG   GAA   AGA   GCG   CAG   AAG   GCG   GTG          1872AAT   GCG   CTG   TTT   ACG   TCT   ACA   AAC   CAA   CTA   GGG   CTA   AAA   ACA   AAT   GTA          1920ACG   GAT   TAT   CAT   ATT   GAT   CAA   GTG   TCC   AAT   TTA   GTT   ACG   TAT   TTA   TCG          1968GAT   GAA   TTT   TGT   CTG   GAT   GAA   AAG   CGA   GAA   TTG   TCC   GAG   AAA   GTC   AAA          2016CAT   GCG   AAG   CGA   CTC   AGT   GAT   GAA   CGC   AAT   TTA   CTC   CAA   GAT   TCA   AAT          2064TTC   AAA   GAC   ATT   AAT   AGG   CAA   CCA   GAA   CGT   GGG   TGG   GGC   GGA   AGT   ACA          2112GGG   ATT   ACC   ATC   CAA   GGA   GGG   GAT   GAC   GTA   TTT   AAA   GAA   AAT   TAC   GTC          2160ACA   CTA   TCA   GGT   ACC   TTT   GAT   GAG   TGC   TAT   CCA   ACA   TAT   TTG   TAT   CAA          2208AAA   ATC   GAT   GAA   TCA   AAA   TTA   AAA   GCC   TTT   ACC   CGT   TAT   CAA   TTA   AGA          2256GGG   TAT   ATC   GAA   GAT   AGT   CAA   GAC   TTA   GAA   ATC   TAT   TTA   ATT   CGC   TAC          2304AAT   GCA   AAA   CAT   GAA   ACA   GTA   AAT   GTG   CCA   GGT   ACG   GGT   TCC   TTA   TGG          2352CCG   CTT   TCA   GCC   CAA   AGT   CCA   ATC   GGA   AAG   TGT   GGA   GAG   CCG   AAT   CGA          2400TGC   GCG   CCA   CAC   CTT   GAA   TGG   AAT   CCT   GAC   TTA   GAT   TGT   TCG   TGT   AGG          2448GAT   GGA   GAA   AAG   TGT   GCC   CAT   CAT   TCG   CAT   CAT   TTC   TCC   TTA   GAC   ATT          2496GAT   GTA   GGA   TGT   ACA   GAC   TTA   AAT   GAG   GAC   CTA   GGT   GTA   TGG   GTG   ATC          2544TTT   AAG   ATT   AAG   ACG   CAA   GAT   GGG   CAC   GCA   AGA   CTA   GGG   AAT   CTA   GAG          2592TTT   CTC   GAA   GAG   AAA   CCA   TTA   GTA   GGA   GAA   GCG   CTA   GCT   CGT   GTG   AAA          2640AGA   GCG   GAG   AAA   AAA   TGG   AGA   GAC   AAA   CGT   GAA   AAA   TTG   GAA   TGG   GAA          2688ACA   AAT   ATC   GTT   TAT   AAA   GAG   GCA   AAA   GAA   TCT   GTA   GAT   GCT   TTA   TTT          2736GTA   AAC   TCT   CAA   TAT   GAT   CAA   TTA   CAA   GCG   GAT   ACG   AAT   ATT   GCC   ATG          2784ATT   CAT   GCG   GCA   GAT   AAA   CGT   GTT   CAT   AGC   ATT   CGA   GAA   GCT   TAT   CTG          2832CCT   GAG   CTG   TCT   GTG   ATT   CCG   GGT   GTC   AAT   GCG   GCT   ATT   TTT   GAA   GAA          2880TTA   GAA   GGG   CGT   ATT   TTC   ACT   GCA   TTC   TCC   CTA   TAT   GAT   GCG   AGA   AAT          2928GTC   ATT   AAA   AAT   GGT   GAT   TTT   AAT   AAT   GGC   TTA   TCC   TGC   TGG   AAC   GTG         2976AAA   GGG   CAT   GTA   GAT   GTA   GAA   GAA   CAA   AAC   AAC   CAA   CGT   TCG   GTC   CTT         3024GTT   GTT   CCG   GAA   TGG   GAA   GCA   GAA   GTG   TCA   CAA   GAA   GTT   CGT   GTC   TGT         3072CCG   GGT   CGT   GGC   TAT   ATC   CTT   CGT   GTC   ACA   GCG   TAC   AAG   GAG   GGA   TAT         3120GGA   GAA   GGT   TGC   GTA   ACC   ATT   CAT   GAG   ATC   GAG   AAC   AAT   ACA   GAC   GAA         3168CTG   AAG   TTT   AGC   AAC   TGC   GTA   GAA   GAG   GAA   ATC   TAT   CCA   AAT   AAC   ACG         3216GTA   ACG   TGT   AAT   GAT   TAT   ACT   GTA   AAT   CAA   GAA   GAA   TAC   GGA   GGT   GCG         3264TAC   ACT   TCT   CGT   AAT   CGA   GGA   TAT   AAC   GAA   GCT   CCT   TCC   GTA   CCA   GCT         3312GAT   TAT   GCG   TCA   GTC   TAT   GAA   GAA   AAA   TCG   TAT   ACA   GAT   GGA   CGA   AGA         3360GAG   AAT   CCT   TGT   GAA   TTT   AAC   AGA   GGG   TAT   AGG   GAT   TAC   ACG   CCA   CTA         3408CCA   GTT   GGT   TAT   GTG   ACA   AAA   GAA   TTA   GAA   TAC   TTC   CCA   GAA   ACC   GAT         3456AAG   GTA   TGG   ATT   GAG   ATT   GGA   GAA   ACG   GAA   GGA   ACA   TTT   ATC   GTG   GAC         3504AGC   GTG   GAA   TTA   CTC   CTT   ATG   GAG   GAA                                                   35316.7.3编码EG 11735晶体蛋白的DNA序列(SEQ ID NO:13)ATG   GAT   AAC   AAT   CCG   AAC   ATC   AAT   GAA   TGC   ATT   CCT   TAT   AAT   TGT   TTA           48AGT   AAC   CCT   GAA   GTA   GAA   GTA   TTA   GGT   GGA   GAA   AGA   ATA   GAA   ACT   GGT           96TAC   ACC   CCA   ATC   GAT   ATT   TCC   TTG   TCG   CTA   ACG   CAA   TTT   CTT   TTG   AGT          144GAA   TTT   GTT   CCC   GGT   GCT   GGA   TTT   GTG   TTA   GGA   CTA   GTT   GAT   ATA   ATA          192TGG   GGA   ATT   TTT   GGT   CCC   TCT   CAA   TGG   GAC   GCA   TTT   CTT   GTA   CAA   ATT          240GAA   CAG   TTA   ATT   AAC   CAA   AGA   ATA   GAA   GAA   TTC   GCT   AGG   AAC   CAA   GCC          288ATT   TCT   AGA   TTA   GAA   GGA   CTA   AGC   AAT   CTT   TAT   CAA   ATT   TAC   GCA   GAA          336TCT   TTT   AGA   GAG   TGG   GAA   GCA   GAT   CCT   ACT   AAT   CCA   GCA   TTA   AGA   GAA          384GAG   ATG   CGT   ATT   CAA   TTC   AAT   GAC   ATG   AAC   AGT   GCC   CTT   ACA   ACC   GCT          432ATT   CCT   CTT   TTT   GCA   GTT   CAA   AAT   TAT   CAA   GTT   CCT   CTT   TTA   TCA   GTA          480TAT   GTT   CAA   GCT   GCA   AAT   TTA   CAT   TTA   TCA   GTT   TTG   AGA   GAT   GTT   TCA          528GTG   TTT   GGA   CAA   AGG   TGG   GGA   TTT   GAT   GCC   GCG   ACT   ATC   AAT   AGT   CGT          576TAT   AAT   GAT   TTA   ACT   AGG   CTT   ATT   GGC   AAC   TAT   ACA   GAT   CAT   GCT   GTA          624CGC   TGG   TAC   AAT   ACG   GGA   TTA   GAG   CGT   GTA   TGG   GGA   CCG   GAT   TCT   AGA          672GAT   TGG   ATA   AGA   TAT   AAT   CAA   TTT   AGA   AGA   GAA   TTA   ACA   CTA   ACT   GTA          720TTA   GAT   ATC   GTT   TCT   CTA   TTT   CCG   AAC   TAT   GAT   AGT   AGA   ACG   TAT   CCA          768ATT   CGA   ACA   GTT   TCC   CAA   TTA   ACA   AGA   GAA   ATT   TAT   ACA   AAC   CCA   GTA          816TTA   GAA   AAT   TTT   GAT   GGT   AGT   TTT   CGA   GGC   TCG   GCT   CAG   GGC   ATA   GAA          864GGA   AGT   ATT   AGG   AGT   CCA   CAT   TTG   ATG   GAT   ATA   CTT   AAC   AGT   ATA   ACC          912ATC   TAT   ACG   GAT   GCT   CAT   AGA   GGA   GAA   TAT   TAT   TGG   TCA   GGG   CAT   CAA          960ATA   ATG   GCT   TCT   CCT   GTA   GGG   TTT   TCG   GGG   CCA   GAA   TTC   ACT   TTT   CCG         1008CTA   TAT   GGA   ACT   ATG   GGA   AAT   GCA   GCT   CCA   CAA   CAA   CGT   ATT   GTT   GCT         1056CAA   CTA   GGT   CAG   GGC   GTG   TAT   AGA   ACA   TTA   TCG   TCC   ACT   TTA   TAT   AGA         1104AGA   CCT   TTT   AAT   ATA   GGG   ATA   AAT   AAT   CAA   CAA   CTA   TCT   GTT   CTT   GAC           1152GGG   ACA   GAA   TTT   GCT   TAT   GGA   ACC   TCC   TCA   AAT   TTG   CCA   TCC   GCT   GTA           1200TAC   AGA   AAA   AGC   GGA   ACG   GTA   GAT   TCG   CTG   GAT   GAA   ATA   CCG   CCA   CAG           1248AAT   AAC   AAC   GTG   CCA   CCT   AGG   CAA   GGA   TTT   AGT   CAT   CGA   TTA   AGC   CAT           1296GTT   TCA   ATG   TTT   CGT   TCA   GGC   TTT   AGT   AAT   AGT   AGT   GTA   AGT   ATA   ATA           1344AGA   GCT   CCA   ATG   TTT   TCT   TGG   ACG   CAC   CGT   AGT   GCA   ACC   CCT   ACA   AAT           1392ACA   ATT   GAT   CCG   GAG   AGG   ATT   ACT   CAA   ATA   CCA   TTG   GTA   AAA   GCA   CAT           1440ACA   CTT   CAG   TCA   GGT   ACT   ACT   GTT   GTA   AGA   GGG   CCC   GGG   TTT   ACG   GGA           1488GGA   GAT   ATT   CTT   CGA   CGA   ACA   AGT   GGA   GGA   CCA   TTT   GCT   TAT   ACT   ATT           1536GTT   AAT   ATA   AAT   GGG   CAA   TTA   CCC   CAA   AGG   TAT   CGT   GCA   AGA   ATA   CGC           1584TAT   GCC   TCT   ACT   ACA   AAT   CTA   AGA   ATT   TAC   GTA   ACG   GTT   GCA   GGT   GAA           1632CGG   ATT   TTT   GCT   GGT   CAA   TTT   AAC   AAA   ACA   ATG   GAT   ACC   GGT   GAC   CCA           1680TTA   ACA   TTC   CAA   TCT   TTT   AGT   TAC   GCA   ACT   ATT   AAT   ACA   GCT   TTT   ACA           1728TTC   CCA   ATG   AGC   CAG   AGT   AGT   TTC   ACA   GTA   GGT   GCT   GAT   ACT   TTT   AGT           1776TCA   GGG   AAT   GAA   GTT   TAT   ATA   GAC   AGA   TTT   GAA   TTG   ATT   CCA   GTT   ACT           1824GCA   ACA   TTT   GAA   GCA   GAA   TAT   GAT   TTA   GAA   AGA   GCA   CAA   AAG   GCG   GTG           1872AAT   GCG   CTG   TTT   ACT   TCT   ATA   AAC   CAA   ATA   GGG   ATA   AAA   ACA   GAT   GTG           1920ACG   GAT   TAT   CAT   ATT   GAT   CAA   GTA   TCC   AAT   TTA   GTG   GAT   TGT   TTA   TCA           1968GAT   GAA   TTT   TGT   CTG   GAT   GAA   AAG   CGA   GAA   TTG   TCC   GAG   AAA   GTC   AAA           2016CAT   GCG   AAG   CGA   CTC   AGT   GAT   GAG   CGG   AAT   TTA   CTT   CAA   GAT   CCA   AAC           2064TTC   AAA   GGC   ATC   AAT   AGG   CAA   CTA   GAC   CGT   GGT   TGG   AGA   GGA   AGT   ACG           2112GAT   ATT   ACC   ATC   CAA   AGA   GGA   GAT   GAC   GTA   TTC   AAA   GAA   AAT   TAT   GTC           2160ACA   CTA   CCA   GGT   ACC   TTT   GAT   GAG   TGC   TAT   CCA   ACA   TAT   TTG   TAT   CAA           2208AAA   ATC   GAT   GAA   TCA   AAA   TTA   AAA   GCC   TTT   ACC   CGT   TAT   CAA   TTA   AGA           2256GGG   TAT   ATC   GAA   GAT   AGT   CAA   GAC   TTA   GAA   ATC   TAT   TTA   ATT   CGC   TAC           2304AAT   GCA   AAA   CAT   GAA   ACA   GTA   AAT   GTG   CCA   GGT   ACG   GGT   TCC   TTA   TGG           2352CCG   CTT   TCA   GCC   CAA   AGT   CCA   ATC   GGA   AAG   TGT   GGA   GAG   CCG   AAT   CGA           2400TGC   GCG   CCA   CAC   CTT   GAA   TGG   AAT   CCT   GAC   TTA   GAT   TGT   TCG   TGT   AGG           2448GAT   GGA   GAA   AAG   TGT   GCC   CAT   CAT   TCG   CAT   CAT   TTC   TCC   TTA   GAC   ATT           2496GAT   GTA   GGA   TGT   ACA   GAC   TTA   AAT   GAG   GAC   CTA   GGT   GTA   TGG   GTG   ATC           2544TTT   AAG   ATT   AAG   ACG   CAA   GAT   GGG   CAC   GCA   AGA   CTA   GGG   AAT   CTA   GAG           2592TTT   CTC   GAA   GAG   AAA   CCA   TTA   GTA   GGA   GAA   GCG   CTA   GCT   CGT   GTG   AAA           2640AGA   GCG   GAG   AAA   AAA   TGG   AGA   GAC   AAA   CGT   GAA   AAA   TTG   GAA   TGG   GAA           2688ACA   AAT   ATC   GTT   TAT   AAA   GAG   GCA   AAA   GAA   TCT   GTA   GAT   GCT   TTA   TTT           2736GTA   AAC   TCT   CAA   TAT   GAT   CAA   TTA   CAA   GCG   GAT   ACG   AAT   ATT   GCC   ATG           2784ATT   CAT   GCG   GCA   GAT   AAA   CGT   GTT   CAT   AGC   ATT   CGA   GAA   GCT   TAT   CTG           2832CCT   GAG   CTG   TCT   GTG   ATT   CCG   GGT   GTC   AAT   GCG   GCT   ATT   TTT   GAA   GAA           2880TTA   GAA   GGG   CGT   ATT   TTC   ACT   GCA   TTC   TCC   CTA   TAT   GAT   GCG   AGA   AAT           2928GTC   ATT   AAA   AAT   GGT   GAT   TTT   AAT   AAT   GGC   TTA   TCC   TGC   TGG   AAC   GTG          2976AAA   GGG   CAT   GTA   GAT   GTA   GAA   GAA   CAA   AAC   AAC   CAA   CGT   TCG   GTC   CTT          3024GTT   GTT   CCG   GAA   TGG   GAA   GCA   GAA   GTG   TCA   CAA   GAA   GTT   CGT   GTC   TGT          3072CCG   GGT   CGT   GGC   TAT   ATC   CTT   CGT   GTC   ACA   GCG   TAC   AAG   GAG   GGA   TAT          3120GGA   GAA   GGT   TGC   GTA   ACC   ATT   CAT   GAG   ATC   GAG   AAC   AAT   ACA   GAC   GAA          3168CTG   AAG   TTT   AGC   AAC   TGC   GTA   GAA   GAG   GAA   ATC   TAT   CCA   AAT   AAC   ACG          3216GTA   ACG   TGT   AAT   GAT   TAT   ACT   GTA   AAT   CAA   GAA   GAA   TAC   GGA   GGT   GCG          3264TAC   ACT   TCT   CGT   AAT   CGA   GGA   TAT   AAC   GAA   GCT   CCT   TCC   GTA   CCA   GCT          3312GAT   TAT   GCG   TCA   GTC   TAT   GAA   GAA   AAA   TCG   TAT   ACA   GAT   GGA   CGA   AGA          3360GAG   AAT   CCT   TGT   GAA   TTT   AAC   AGA   GGG   TAT   AGG   GAT   TAC   ACG   CCA   CTA          3408CCA   GTT   GGT   TAT   GTG   ACA   AAA   GAA   TTA   GAA   TAC   TTC   CCA   GAA   ACC   GAT          3456AAG   GTA   TGG   ATT   GAG   ATT   GGA   GAA   ACG   GAA   GGA   ACA   TTT   ATC   GTG   GAC          3504AGC   GTG   GAA   TTA   CTC   CTT   ATG   GAG   GAA                                                    35316.7.4编码EG 11092晶体蛋白的DNA序列(SEQ ID NO:25)ATG   GAT   AAC   AAT   CCG   AAC   ATC   AAT   GAA   TGC   ATT   CCT   TAT   AAT   TGT   TTA            48AGT   AAC   CCT   GAA   GTA   GAA   GTA   TTA   GGT   GGA   GAA   AGA   ATA   GAA   ACT   GGT            96TAC   ACC   CCA   ATC   GAT   ATT   TCC   TTG   TCG   CTA   ACG   CAA   TTT   CTT   TTG   AGT           144GAA   TTT   GTT   CCC   GGT   GCT   GGA   TTT   GTG   TTA   GGA   CTA   GTT   GAT   ATA   ATA           192TGG   GGA   ATT   TTT   GGT   CCC   TCT   CAA   TGG   GAC   GCA   TTT   CTT   GTA   CAA   ATT           240GAA   CAG   TTA   ATT   AAC   CAA   AGA   ATA   GAA   GAA   TTC   GCT   AGG   AAC   CAA   GCC           288ATT   TCT   AGA   TTA   GAA   GGA   CTA   AGC   AAT   CTT   TAT   CAA   ATT   TAC   GCA   GAA           336TCT   TTT   AGA   GAG   TGG   GAA   GCA   GAT   CCT   ACT   AAT   CCA   GCA   TTA   AGA   GAA           384GAG   ATG   CGT   ATT   CAA   TTC   AAT   GAC   ATG   AAC   AGT   GCC   CTT   ACA   ACC   GCT           432ATT   CCT   CTT   TTT   GCA   GTT   CAA   AAT   TAT   CAA   GTT   CCT   CTT   TTA   TCA   GTA           480TAT   GTT   CAA   GCT   GCA   AAT   TTA   CAT   TTA   TCA   GTT   TTG   AGA   GAT   GTT   TCA           528GTG   TTT   GGA   CAA   AGG   TGG   GGA   TTT   GAT   GCC   GCG   ACT   ATC   AAT   AGT   CGT           576TAT   AAT   GAT   TTA   ACT   AGG   CTT   ATC   GGC   AAC   TAT   ACA   GAT   CAT   GCT   GTA           624CGC   TGG   TAC   AAT   ACG   GGA   TTA   GAG   CGT   GTA   TGG   GGA   CCG   GAT   TCT   AGA           672GAT   TGG   ATA   AGA   TAT   AAT   CAA   TTT   AGA   AGA   GAA   TTA   ACA   CTA   ACT   GTA           720TTA   GAT   ATC   GTT   TCT   CTA   TTT   CCG   AAC   TAT   GAT   AGT   AGA   ACG   TAT   CCA           768ATT   CGA   ACA   GTT   TCC   CAA   TTA   ACA   AGA   GAA   ATT   TAT   ACA   AAC   CCA   GTA           816TTA   GAA   AAT   TTT   GAT   GGT   AGT   TTT   CGA   GGC   TCG   GCT   CAG   GGC   ATA   GAA           824AGA   AGT   ATT   AGG   AGT   CCA   CAT   TTG   ATG   GAT   ATA   CTT   AAC   AGT   ATA   ACC           912ATC   TAT   ACG   GAT   GCT   CAT   AGG   GGT   TAT   TAT   TAT   TGG   TCA   GGG   CAT   CAA           960ATA   ATG   GCT   TCT   CCT   GTA   GGG   TTT   TCG   GGG   CCA   GAA   TTC   ACT   TTT   CCG          1008CTA   TAT   GGA   ACT   ATG   GGA   AAT   GCA   GCT   CCA   CAA   CAA   CGT   ATT   GTT   GCT          1056CAA   CTA   GGT   CAG   GGC   GTG   TAT   AGA   ACA   TTA   TCG   TCC   ACT   TTA   TAT   AGA          1104AGA   CCT   TTT   AAT   ATA   GGG   ATA   AAT   AAT   CAA   CAA   CTA   TCT   GTT   CTT   GAC          1152GGG   ACA   GAA   TTT   GCT   TAT   GGA   ACC   TCC   TCA   AAT   TTG   CCA   TCC   GCT   GTA          1200TAC   AGA   AAA   AGC   GGA   ACG   GTA   GAT   TCG   CTG   GAT   GAA   ATA   CCG   CCA   CAG          1248AAT   AAC   AAC   GTG   CCA   CCT   AGG   CAA   GGA   TTT   AGT   CAT   CGA   TTA   AGC   CAT          1296GTT   TCA   ATG   TTT   CGT   TCA   GGC   TTT   AGT   AAT   AGT   AGT   GTA   AGT   ATA   ATA          1344AGA   GCT   CCA   ATG   TTT   TCT   TGG   ACG   CAC   CGT   AGT   GCA   ACC   CCT   ACA   AAT          1392ACA   ATT   GAT   CCG   GAG   AGG   ATT   ACT   CAA   ATA   CCA   TTG   GTA   AAA   GCA   CAT          1440ACA   CTT   CAG   TCA   GGT   ACT   ACT   GTT   GTA   AGA   GGG   CCC   GGG   TTT   ACG   GGA          1488GGA   GAT   ATT   CTT   CGA   CGA   ACA   AGT   GGA   GGA   CCA   TTT   GCT   TAT   ACT   ATT          1536GTT   AAT   ATA   AAT   GGG   CAA   TTA   CCC   CAA   AGG   TAT   CGT   GCA   AGA   ATA   CGC          1584TAT   GCC   TCT   ACT   ACA   AAT   CTA   AGA   ATT   TAC   GTA   ACG   GTT   GCA   GGT   GAA          1632CGG   ATT   TTT   GCT   GGT   CAA   TTT   AAC   AAA   ACA   ATG   GAT   ACC   GGT   GAC   CCA          1680TTA   ACA   TTC   CAA   TCT   TTT   AGT   TAC   GCA   ACT   ATT   AAT   ACA   GCT   TTT   ACA          1728TTC   CCA   ATG   AGC   CAG   AGT   AGT   TTC   ACA   GTA   GGT   GCT   GAT   ACT   TTT   AGT          1776TCA   GGG   AAT   GAA   GTT   TAT   ATA   GAC   AGA   TTT   GAA   TTG   ATT   CCA   GTT   ACT          1824GCA   ACA   TTT   GAA   GCA   GAA   TAT   GAT   TTA   GAA   AGA   GCA   CAA   AAG   GCG   GTG          1872AAT   GCG   CTG   TTT   ACT   TCT   ATA   AAC   CAA   ATA   GGG   ATA   AAA   ACA   GAT   GTG          1920ACG   GAT   TAT   CAT   ATT   GAT   CAA   GTA   TCC   AAT   TTA   GTG   GAT   TGT   TTA   TCA          1968GAT   GAA   TTT   TGT   CTG   GAT   GAA   AAG   CGA   GAA   TTG   TCC   GAG   AAA   GTC   AAA          2016CAT   GCG   AAG   CGA   CTC   AGT   GAT   GAG   CGG   AAT   TTA   CTT   CAA   GAT   CCA   AAC          2064TTC   AAA   GGC   ATC   AAT   AGG   CAA   CTA   GAC   CGT   GGT   TGG   AGA   GGA   AGT   ACG          2112GAT   ATT   ACC   ATC   CAA   AGA   GGA   GAT   GAC   GTA   TTC   AAA   GAA   AAT   TAT   GTC          2160ACA   CTA   CCA   GGT   ACC   TTT   GAT   GAG   TGC   TAT   CCA   ACA   TAT   TTG   TAT   CAA          2208AAA   ATC   GAT   GAA   TCA   AAA   TTA   AAA   GCC   TTT   ACC   CGT   TAT   CAA   TTA   AGA          2256GGG   TAT   ATC   GAA   GAT   AGT   CAA   GAC   TTA   GAA   ATC   TAT   TTA   ATT   CGC   TAC          2304AAT   GCA   AAA   CAT   GAA   ACA   GTA   AAT   GTG   CCA   GGT   ACG   GGT   TCC   TTA   TGG          2352CCG   CTT   TCA   GCC   CAA   AGT   CCA   ATC   GGA   AAG   TGT   GGA   GAG   CCG   AAT   CGA          2400TGC   GCG   CCA   CAC   CTT   GAA   TGG   AAT   CCT   GAC   TTA   GAT   TGT   TCG   TGT   AGG          2448GAT   GGA   GAA   AAG   TGT   GCC   CAT   CAT   TCG   CAT   CAT   TTC   TCC   TTA   GAC   ATT          2496GAT   GTA   GGA   TGT   ACA   GAC   TTA   AAT   GAG   GAC   CTA   GGT   GTA   TGG   GTG   ATC          2544TTT   AAG   ATT   AAG   ACG   CAA   GAT   GGG   CAC   GCA   AGA   CTA   GGG   AAT   CTA   GAG          2592TTT   CTC   GAA   GAG   AAA   CCA   TTA   GTA   GGA   GAA   GCG   CTA   GCT   CGT   GTG   AAA          2640AGA   GCG   GAG   AAA   AAA   TGG   AGA   GAC   AAA   CGT   GAA   AAA   TTG   GAA   TGG   GAA          2688ACA   AAT   ATC   GTT   TAT   AAA   GAG   GCA   AAA   GAA   TCT   GTA   GAT   GCT   TTA   TTT          2736GTA   AAC   TCT   CAA   TAT   GAT   CAA   TTA   CAA   GCG   GAT   ACG   AAT   ATT   GCC   ATG          2784ATT   CAT   GCG   GCA   GAT   AAA   CGT   GTT   CAT   AGC   ATT   CGA   GAA   GCT   TAT   CTG          2832CCT   GAG   CTG   TCT   GTG   ATT   CCG   GGT   GTC   AAT   GCG   GCT   ATT   TTT   GAA   GAA          2880TTA   GAA   GGG   CGT   ATT   TTC   ACT   GCA   TTC   TCC   CTA   TAT   GAT   GCG   AGA   AAT        2928GTC   ATT   AAA   AAT   GGT   GAT   TTT   AAT   AAT   GGC   TTA   TCC   TGC   TGG   AAC   GTG        2976AAA   GGG   CAT   GTA   GAT   GTA   GAA   GAA   CAA   AAC   AAC   CAA   CGT   TCG   GTC   CTT        3024GTT   GTT   CCG   GAA   TGG   GAA   GCA   GAA   GTG   TCA   CAA   GAA   GTT   CGT   GTC   TGT        3072CCG   GGT   CGT   GGC   TAT   ATC   CTT   CGT   GTC   ACA   GCG   TAC   AAG   GAG   GGA   TAT        3120GGA   GAA   GGT   TGC   GTA   ACC   ATT   CAT   GAG   ATC   GAG   AAC   AAT   ACA   GAC   GAA        3168CTG   AAG   TTT   AGC   AAC   TGC   GTA   GAA   GAG   GAA   ATC   TAT   CCA   AAT   AAC   ACG        3216GTA   ACG   TGT   AAT   GAT   TAT   ACT   GTA   AAT   CAA   GAA   GAA   TAC   GGA   GGT   GCG        3264TAC   ACT   TCT   CGT   AAT   CGA   GGA   TAT   AAC   GAA   GCT   CCT   TCC   GTA   CCA   GCT        3312GAT   TAT   GCG   TCA   GTC   TAT   GAA   GAA   AAA   TCG   TAT   ACA   GAT   GGA   CGA   AGA        3360GAG   AAT   CCT   TGT   GAA   TTT   AAC   AGA   GGG   TAT   AGG   GAT   TAC   ACG   CCA   CTA        3408CCA   GTT   GGT   TAT   GTG   ACA   AAA   GAA   TTA   GAA   TAC   TTC   CCA   GAA   ACC   GAT        3456AAG   GTA   TGG   ATT   GAG   ATT   GGA   GAA   ACG   GAA   GGA   ACA   TTT   ATC   GTG   GAC        3504AGC   GTG   GAA   TTA   CTC   CTT   ATG   GAG   GAA   TAG                                            35346.7.5编码EG 11751晶体蛋白的DNA序列(SEQ ID NO:27)ATG   GAT   AAC   AAT   CCG   AAC   ATC   AAT   GAA   TGC   ATT   CCT   TAT   AAT   TGT   TTA          48AGT   AAC   CCT   GAA   GTA   GAA   GTA   TTA   GGT   GGA   GAA   AGA   ATA   GAA   ACT   GGT          96TAC   ACC   CCA   ATC   GAT   ATT   TCC   TTG   TCG   CTA   ACG   CAA   TTT   CTT   TTG   AGT         144GAA   TTT   GTT   CCC   GGT   GCT   GGA   TTT   GTG   TTA   GGA   CTA   GTT   GAT   ATA   ATA         192TGG   GGA   ATT   TTT   GGT   CCC   TCT   CAA   TGG   GAC   GCA   TTT   CTT   GTA   CAA   ATT         240GAA   CAG   TTA   ATT   AAC   CAA   AGA   ATA   GAA   GAA   TTC   GCT   AGG   AAC   CAA   GCC         288ATT   TCT   AGA   TTA   GAA   GGA   CTA   AGC   AAT   CTT   TAT   CAA   ATT   TAC   GCA   GAA         336TCT   TTT   AGA   GAG   TGG   GAA   GCA   GAT   CCT   ACT   AAT   CCA   GCA   TTA   AGA   GAA         384GAG   ATG   CGT   ATT   CAA   TTC   AAT   GAC   ATG   AAC   AGT   GCC   CTT   ACA   ACC   GCT         432ATT   CCT   CTT   TTT   GCA   GTT   CAA   AAT   TAT   CAA   GTT   CCT   CTT   TTA   TCA   GTA         480TAT   GTT   CAA   GCT   GCA   AAT   TTA   CAT   TTA   TCA   GTT   TTG   AGA   GAT   GTT   TCA         528GTG   TTT   GGA   CAA   AGG   TGG   GGA   TTT   GAT   GCC   GCG   ACT   ATC   AAT   AGT   CGT         576TAT   AAT   GAT   TTA   ACT   AGG   CTT   ATT   GGC   AAC   TAT   ACA   GAT   TAT   GCT   GTA         624CGC   TGG   TAC   AAT   ACG   GGA   TTA   GAA   CGT   GTA   TGG   GGA   CCG   GAT   TCT   AGA         672GAT   TGG   GTA   AGG   TAT   AAT   CAA   TTT   AGA   AGA   GAA   TTA   ACA   CTA   ACT   GTA         720TTA   GAT   ATC   GTT   GCT   CTG   TTC   CCG   AAT   TAT   GAT   AGT   AGA   AGA   TAT   CCA         768ATT   CGA   ACA   GTT   TCC   CAA   TTA   ACA   AGA   GAA   ATT   TAT   ACA   AAC   CCA   GTA         816TTA   GAA   AAT   TTT   GAT   GGT   AGT   TTT   CGA   GGC   TCG   GCT   CAG   GGC   ATA   GAA         864AGA   AGT   ATT   AGG   AGT   CCA   CAT   TTG   ATG   GAT   ATA   CTT   AAC   AGT   ATA   ACC         912ATC   TAT   ACG   GAT   GCT   CAT   AGG   GGT   TAT   TAT   TAT   TGG   TCA   GGG   CAT   CAA         960ATA   ATG   GCT   TCT   CCT   GTA   GGG   TTT   TCG   GGG   CCA   GAA   TTC   ACT   TTT   CCG        1008CTA   TAT   GGA   ACT   ATG   GGA   AAT   GCA   GCT   CCA   CAA   CAA   CGT   ATT   GTT   GCT        1056CAA   CTA   GGT   CAG   GGC   GTG   TAT   AGA   ACA   TTA   TCG   TCC   ACT   TTA   TAT   AGA        1104AGA   CCT   TTT   AAT   ATA   GGG   ATA   AAT   AAT   CAA   CAA   CTA   TCT   GTT   CTT   GAC        1152GGG   ACA   GAA   TTT   GCT   TAT   GGA   ACC   TCC   TCA   AAT   TTG   CCA   TCC   GCT   GTA        1200TAC   AGA   AAA   AGC   GGA   ACG   GTA   GAT   TCG   CTG   GAT   GAA   ATA   CCG   CCA   CAG        1248AAT   AAC   AAC   GTG   CCA   CCT   AGG   CAA   GGA   TTT   AGT   CAT   CGA   TTA   AGC   CAT        1296GTT   TCA   ATG   TTT   CGT   TCA   GGC   TTT   AGT   AAT   AGT   AGT   GTA   AGT   ATA   ATA        1344AGA   GCT   CCT   ATG   TTC   TCT   TGG   ATA   CAT   CGT   AGT   GCT   GAA   TTT   AAT   AAT        1392ATA   ATT   GCA   TCG   GAT   AGT   ATT   ACT   CAA   ATA   CCA   TTG   GTA   AAA   GCA   CAT        1440ACA   CTT   CAG   TCA   GGT   ACT   ACT   GTT   GTA   AGA   GGG   CCC   GGG   TTT   ACG   GGA        1488GGA   GAT   ATT   CTT   CGA   CGA   ACA   AGT   GGA   GGA   CCA   TTT   GCT   TAT   ACT   ATT        1536GTT   AAT   ATA   AAT   GGG   CAA   TTA   CCC   CAA   AGG   TAT   CGT   GCA   AGA   ATA   CGC        1584TAT   GCC   TCT   ACT   ACA   AAT   CTA   AGA   ATT   TAC   GTA   ACG   GTT   GCA   GGT   GAA        1632CGG   ATT   TTT   GCT   GGT   CAA   TTT   AAC   AAA   ACA   ATG   GAT   ACC   GGT   GAC   CCA        1680TTA   ACA   TTC   CAA   TCT   TTT   AGT   TAC   GCA   ACT   ATT   AAT   ACA   GCT   TTT   ACA        1728TTC   CCA   ATG   AGC   CAG   AGT   AGT   TTC   ACA   GTA   GGT   GCT   GAT   ACT   TTT   AGT        1776TCA   GGG   AAT   GAA   GTT   TAT   ATA   GAC   AGA   TTT   GAA   TTG   ATT   CCA   GTT   ACT        1824GCA   ACA   TTT   GAA   GCA   GAA   TAT   GAT   TTA   GAA   AGA   GCA   CAA   AAG   GCG   GTG        1872AAT   GCG   CTG   TTT   ACT   TCT   ATA   AAC   CAA   ATA   GGG   ATA   AAA   ACA   GAT   GTG        1920ACG   GAT   TAT   CAT   ATT   GAT   CAA   GTA   TCC   AAT   TTA   GTG   GAT   TGT   TTA   TCA        1968GAT   GAA   TTT   TGT   CTG   GAT   GAA   AAG   CGA   GAA   TTG   TCC   GAG   AAA   GTC   AAA        2016CAT   GCG   AAG   CGA   CTC   AGT   GAT   GAG   CGG   AAT   TTA   CTT   CAA   GAT   CCA   AAC        2064TTC   AAA   GGC   ATC   AAT   AGG   CAA   CTA   GAC   CGT   GGT   TGG   AGA   GGA   AGT   ACG        2112GAT   ATT   ACC   ATC   CAA   AGA   GGA   GAT   GAC   GTA   TTC   AAA   GAA   AAT   TAT   GTC        2160ACA   CTA   CCA   GGT   ACC   TTT   GAT   GAG   TGC   TAT   CCA   ACA   TAT   TTG   TAT   CAA        2208AAA   ATC   GAT   GAA   TCA   AAA   TTA   AAA   GCC   TTT   ACC   CGT   TAT   CAA   TTA   AGA        2256GGG   TAT   ATC   GAA   GAT   AGT   CAA   GAC   TTA   GAA   ATC   TAT   TTA   ATT   CGC   TAC        2304AAT   GCA   AAA   CAT   GAA   ACA   GTA   AAT   GTG   CCA   GGT   ACG   GGT   TCC   TTA   TGG        2352CCG   CTT   TCA   GCC   CAA   AGT   CCA   ATC   GGA   AAG   TGT   GGA   GAG   CCG   AAT   CGA        2400TGC   GCG   CCA   CAC   CTT   GAA   TGG   AAT   CCT   GAC   TTA   GAT   TGT   TCG   TGT   AGG        2448GAT   GGA   GAA   AAG   TGT   GCC   CAT   CAT   TCG   CAT   CAT   TTC   TCC   TTA   GAC   ATT        2496GAT   GTA   GGA   TGT   ACA   GAC   TTA   AAT   GAG   GAC   CTA   GGT   GTA   TGG   GTG   ATC        2544TTT   AAG   ATT   AAG   ACG   CAA   GAT   GGG   CAC   GCA   AGA   CTA   GGG   AAT   CTA   GAG        2592TTT   CTC   GAA   GAG   AAA   CCA   TTA   GTA   GGA   GAA   GCG   CTA   GCT   CGT   GTG   AAA        2640AGA   GCG   GAG   AAA   AAA   TGG   AGA   GAC   AAA   CGT   GAA   AAA   TTG   GAA   TGG   GAA        2688ACA   AAT   ATC   GTT   TAT   AAA   GAG   GCA   AAA   GAA   TCT   GTA   GAT   GCT   TTA   TTT        2736GTA   AAC   TCT   CAA   TAT   GAT   CAA   TTA   CAA   GCG   GAT   ACG   AAT   ATT   GCC   ATG        2784ATT   CAT   GCG   GCA   GAT   AAA   CGT   GTT   CAT   AGC   ATT   CGA   GAA   GCT   TAT   CTG        2832CCT   GAG   CTG   TCT   GTG   ATT   CCG   GGT   GTC   AAT   GCG   GCT   ATT   TTT   GAA   GAA          2880TTA   GAA   GGG   CGT   ATT   TTC   ACT   GCA   TTC   TCC   CTA   TAT   GAT   GCG   AGA   AAT          2928GTC   ATT   AAA   AAT   GGT   GAT   TTT   AAT   AAT   GGC   TTA   TCC   TGC   TGG   AAC   GTG          2976AAA   GGG   CAT   GTA   GAT   GTA   GAA   GAA   CAA   AAC   AAC   CAA   CGT   TCG   GTC   CTT          3024GTT   GTT   CCG   GAA   TGG   GAA   GCA   GAA   GTG   TCA   CAA   GAA   GTT   CGT   GTC   TGT          3072CCG   GGT   CGT   GGC   TAT   ATC   CTT   CGT   GTC   ACA   GCG   TAC   AAG   GAG   GGA   TAT          3120GGA   GAA   GGT   TGC   GTA   ACC   ATT   CAT   GAG   ATC   GAG   AAC   AAT   ACA   GAC   GAA          3168CTG   AAG   TTT   AGC   AAC   TGC   GTA   GAA   GAG   GAA   ATC   TAT   CCA   AAT   AAC   ACG          3216GTA   ACG   TGT   AAT   GAT   TAT   ACT   GTA   AAT   CAA   GAA   GAA   TAC   GGA   GGT   GCG          3264TAC   ACT   TCT   CGT   AAT   CGA   GGA   TAT   AAC   GAA   GCT   CCT   TCC   GTA   CCA   GCT          3312GAT   TAT   GCG   TCA   GTC   TAT   GAA   GAA   AAA   TCG   TAT   ACA   GAT   GGA   CGA   AGA          3360GAG   AAT   CCT   TGT   GAA   TTT   AAC   AGA   GGG   TAT   AGG   GAT   TAC   ACG   CCA   CTA          3408CCA   GTT   GGT   TAT   GTG   ACA   AAA   GAA   TTA   GAA   TAC   TTC   CCA   GAA   ACC   GAT          3456AAG   GTA   TGG   ATT   GAG   ATT   GGA   GAA   ACG   GAA   GGA   ACA   TTT   ATC   GTG   GAC          3504AGC   GTG   GAA   TTA   CTC   CTT   ATG   GAG   GAA   TAG                                              35346.7.6编码EG 11091晶体蛋白的DNA序列(SEQ ID NO:29)ATG   GAT   AAC   AAT   CCG   AAC   ATC   AAT   GAA   TGC   ATT   CCT   TAT   AAT   TGT   TTA            48AGT   AAC   CCT   GAA   GTA   GAA   GTA   TTA   GGT   GGA   GAA   AGA   ATA   GAA   ACT   GGT            96TAC   ACC   CCA   ATC   GAT   ATT   TCC   TTG   TCG   CTA   ACG   CAA   TTT   CTT   TTG   AGT           144GAA   TTT   GTT   CCC   GGT   GCT   GGA   TTT   GTG   TTA   GGA   CTA   GTT   GAT   ATA   ATA           192TGG   GGA   ATT   TTT   GGT   CCC   TCT   CAA   TGG   GAC   GCA   TTT   CTT   GTA   CAA   ATT           240GAA   CAG   TTA   ATT   AAC   CAA   AGA   ATA   GAA   GAA   TTC   GCT   AGG   AAC   CAA   GCC           288ATT   TCT   AGA   TTA   GAA   GGA   CTA   AGC   AAT   CTT   TAT   CAA   ATT   TAC   GCA   GAA           336TCT   TTT   AGA   GAG   TGG   GAA   GCA   GAT   CCT   ACT   AAT   CCA   GCA   TTA   AGA   GAA           384GAG   ATG   CGT   ATT   CAA   TTC   AAT   GAC   ATG   AAC   AGT   GCC   CTT   ACA   ACC   GCT           432ATT   CCT   CTT   TTT   GCA   GTT   CAA   AAT   TAT   CAA   GTT   CCT   CTT   TTA   TCA   GTA           480TAT   GTT   CAA   GCT   GCA   AAT   TTA   CAT   TTA   TCA   GTT   TTG   AGA   GAT   GTT   TCA           528GTG   TTT   GGA   CAA   AGG   TGG   GGA   TTT   GAT   GCC   GCG   ACT   ATC   AAT   AGT   CGT           576TAT   AAT   GAT   TTA   ACT   AGG   CTT   ATT   GGC   AAC   TAT   ACA   GAT   TAT   GCT   GTA           624CGC   TGG   TAC   AAT   ACG   GGA   TTA   GAA   CGT   GTA   TGG   GGA   CCG   GAT   TCT   AGA           672GAT   TGG   GTA   AGG   TAT   AAT   CAA   TTT   AGA   AGA   GAA   TTA   ACA   CTA   ACT   GTA           720TTA   GAT   ATC   GTT   GCT   CTG   TTC   CCG   AAT   TAT   GAT   AGT   AGA   AGA   TAT   CCA           768ATT   CGA   ACA   GTT   TCC   CAA   TTA   ACA   AGA   GAA   ATT   TAT   ACA   AAC   CCA   GTA           816TTA   GAA   AAT   TTT   GAT   GGT   AGT   TTT   CGA   GGC   TCG   GCT   CAG   GGC   ATA   GAA           864AGA   AGT   ATT   AGG   AGT   CCA   CAT   TTG   ATG   GAT   ATA   CTT   AAC   AGT   ATA   ACC           912ATC   TAT   ACG   GAT   GCT   CAT   AGG   GGT   TAT   TAT   TAT   TGG   TCA   GGG   CAT   CAA           960ATA   ATG   GCT   TCT   CCT   GTA   GGG   TTT   TCG   GGG   CCA   GAA   TTC   ACT   TTT   CCG     1008CTA   TAT   GGA   ACT   ATG   GGA   AAT   GCA   GCT   CCA   CAA   CAA   CGT   ATT   GTT   GCT     1056CAA   CTA   GGT   CAG   GGC   GTG   TAT   AGA   ACA   TTA   TCG   TCC   ACT   TTA   TAT   AGA     1104AGA   CCT   TTT   AAT   ATA   GGG   ATA   AAT   AAT   CAA   CAA   CTA   TCT   GTT   CTT   GAC     1152GGG   ACA   GAA   TTT   GCT   TAT   GGA   ACC   TCC   TCA   AAT   TTG   CCA   TCC   GCT   GTA     1200TAC   AGA   AAA   AGC   GGA   ACG   GTA   GAT   TCG   CTG   GAT   GAA   ATA   CCG   CCA   CAG     1248AAT   AAC   AAC   GTG   CCA   CCT   AGG   CAA   GGA   TTT   AGT   CAT   CGA   TTA   AGC   CAT     1296GTT   TCA   ATG   TTT   CGT   TCA   GGC   TTT   AGT   AAT   AGT   AGT   GTA   AGT   ATA   ATA     1344AGA   GCT   CCT   ATG   TTC   TCT   TGG   ATA   CAT   CGT   AGT   GCA   ACT   CTT   ACA   AAT     1392ACA   ATT   GAT   CCA   GAG   AGA   ATT   AAT   CAA   ATA   CCT   TTA   GTG   AAA   GGA   TTT     1440AGA   GTT   TGG   GGG   GGC   ACC   TCT   GTC   ATT   ACA   GGA   CCA   GGA   TTT   ACA   GGA     1488GGG   GAT   ATC   CTT   CGA   AGA   AAT   ACC   TTT   GGT   GAT   TTT   GTA   TCT   CTA   CAA     1536GTC   AAT   ATT   AAT   TCA   CCA   ATT   ACC   CAA   AGA   TAC   CGT   TTA   AGA   TTT   CGT     1584TAC   GCT   TCC   AGT   AGG   GAT   GCA   CGA   GTT   ATA   GTA   TTA   ACA   GGA   GCG   GCA     1632TCC   ACA   GGA   GTG   GGA   GGC   CAA   GTT   AGT   GTA   AAT   ATG   CCT   CTT   CAG   AAA     1680ACT   ATG   GAA   ATA   GGG   GAG   AAC   TTA   ACA   TCT   AGA   ACA   TTT   AGA   TAT   ACC     1728GAT   TTT   AGT   AAT   CCT   TTT   TCA   TTT   AGA   GCT   AAT   CCA   GAT   ATA   ATT   GGG     1776ATA   AGT   GAA   CAA   CCT   CTA   TTT   GGT   GCA   GGT   TCT   ATT   AGT   AGC   GGT   GAA     1824CTT   TAT   ATA   GAT   AAA   ATT   GAA   ATT   ATT   CTA   GCA   GAT   GCA   ACA   TTT   GAA     1872GCA   GAA   TCT   GAT   TTA   GAA   AGA   GCA   CAA   AAG   GCG   GTG   AAT   GCC   CTG   TTT     1920ACT   TCT   TCC   AAT   CAA   ATC   GGG   TTA   AAA   ACC   GAT   GTG   ACG   GAT   TAT   CAT     1968ATT   GAT   CAA   GTA   TCC   AAT   TTA   GTG   GAT   TGT   TTA   TCA   GAT   GAA   TTT   TGT     2016CTG   GAT   GAA   AAG   CGA   GAA   TTG   TCC   GAG   AAA   GTC   AAA   CAT   GCG   AAG   CGA     2064CTC   AGT   GAT   GAG   CGG   AAT   TTA   CTT   CAA   GAT   CCA   AAC   TTC   AGA   GGG   ATC     2112AAT   AGA   CAA   CCA   GAC   CGT   GGC   TGG   AGA   GGA   AGT   ACA   GAT   ATT   ACC   ATC     2160CAA   GGA   GGA   GAT   GAC   GTA   TTC   AAA   GAG   AAT   TAC   GTC   ACA   CTA   CCG   GGT     2208ACC   GTT   GAT   GAG   TGC   TAT   CCA   ACG   TAT   TTA   TAT   CAG   AAA   ATA   GAT   GAG     2256TCG   AAA   TTA   AAA   GCT   TAT   ACC   CGT   TAT   GAA   TTA   AGA   GGG   TAT   ATC   GAA     2304GAT   AGT   CAA   GAC   TTA   GAA   ATC   TAT   TTG   ATC   CGT   TAC   AAT   GCA   AAA   CAC     2352GAA   ATA   GTA   AAT   GTG   CCA   GGC   ACG   GGT   TCC   TTA   TGG   CCG   CTT   TCA   GCC     2400CAA   AGT   CCA   ATC   GGA   AAG   TGT   GGA   GAA   CCG   AAT   CGA   TGC   GCG   CCA   CAC     2448CTT   GAA   TGG   AAT   CCT   GAT   CTA   GAT   TGT   TCC   TGC   AGA   GAC   GGG   GAA   AAA     2496TGT   GCA   CAT   CAT   TCC   CAT   CAT   TTC   ACC   TTG   GAT   ATT   GAT   GTT   GGA   TGT     2544ACA   GAC   TTA   AAT   GAG   GAC   TTA   GGT   GTA   TGG   GTG   ATA   TTC   AAG   ATT   AAG     2592ACG   CAA   GAT   GGC   CAT   GCA   AGA   CTA   GGG   AAT   CTA   GAG   TTT   CTC   GAA   GAG     2640AAA   CCA   TTA   TTA   GGG   GAA   GCA   CTA   GCT   CGT   GTG   AAA   AGA   GCG   GAG   AAG     2688AAG   TGG   AGA   GAC   AAA   CGA   GAG   AAA   CTG   CAG   TTG   GAA   ACA   AAT   ATT   GTT     2736TAT   AAA   GAG   GCA   AAA   GAA   TCT   GTA   GAT   GCT   TTA   TTT   GTA   AAC   TCT   CAA     2784TAT   GAT   AGA   TTA   CAA   GTG   GAT   ACG   AAC   ATC   GCA   ATG   ATT   CAT   GCG   GCA          2832GAT   AAA   CGC   GTT   CAT   AGA   ATC   CGG   GAA   GCG   TAT   CTG   CCA   GAG   TTG   TCT          2880GTG   ATT   CCA   GGT   GTC   AAT   GCG   GCC   ATT   TTC   GAA   GAA   TTA   GAG   GGA   CGT          2928ATT   TTT   ACA   GCG   TAT   TCC   TTA   TAT   GAT   GCG   AGA   AAT   GTC   ATT   AAA   AAT          2976GGC   GAT   TTC   AAT   AAT   GGC   TTA   TTA   TGC   TGG   AAC   GTG   AAA   GGT   CAT   GTA          3024GAT   GTA   GAA   GAG   CAA   AAC   AAC   CAC   CGT   TCG   GTC   CTT   GTT   ATC   CCA   GAA          3072TGG   GAG   GCA   GAA   GTG   TCA   CAA   GAG   GTT   CGT   GTC   TGT   CCA   GGT   CGT   GGC          3120TAT   ATC   CTT   CGT   GTC   ACA   GCA   TAT   AAA   GAG   GGA   TAT   GGA   GAG   GGC   TGC          3168GTA   ACG   ATC   CAT   GAG   ATC   GAA   GAC   AAT   ACA   GAC   GAA   CTG   AAA   TTC   AGC          3216AAC   TGT   GTA   GAA   GAG   GAA   GTA   TAT   CCA   AAC   AAC   ACA   GTA   ACG   TGT   AAT          3264AAT   TAT   ACT   GGG   ACT   CAA   GAA   GAA   TAT   GAG   GGT   ACG   TAC   ACT   TCT   CGT          3312AAT   CAA   GGA   TAT   GAC   GAA   GCC   TAT   GGT   AAT   AAC   CCT   TCC   GTA   CCA   GCT          3360GAT   TAC   GCT   TCA   GTC   TAT   GAA   GAA   AAA   TCG   TAT   ACA   GAT   GGA   CGA   AGA          3408GAG   AAT   CCT   TGT   GAA   TCT   AAC   AGA   GGC   TAT   GGG   GAT   TAC   ACA   CCA   CTA          3456CCG   GCT   GGT   TAT   GTA   ACA   AAG   GAT   TTA   GAG   TAC   TTC   CCA   GAG   ACC   GAT          3504AAG   GTA   TGG   ATT   GAG   ATC   GGA   GAA   ACA   GAA   GGA   ACA   TTC   ATC   GTG   GAT          3552AGC   GTG   GAA   TTA   CTC   CTT   ATG   GAG   GAA                                                    35796.7.7编码EG 11768晶体蛋白的DNA序列(SEQ ID NO:33)ATG   GAT   AAC   AAT   CCG   AAC   ATC   AAT   GAA   TGC   ATT   CCT   TAT   AAT   TGT   TTA            48AGT   AAC   CCT   GAA   GTA   GAA   GTA   TTA   GGT   GGA   GAA   AGA   ATA   GAA   ACT   GGT            96TAC   ACC   CCA   ATC   GAT   ATT   TCC   TTG   TCG   CTA   ACG   CAA   TTT   CTT   TTG   AGT           144GAA   TTT   GTT   CCC   GGT   GCT   GGA   TTT   GTG   TTA   GGA   CTA   GTT   GAT   ATA   ATA           192TGG   GGA   ATT   TTT   GGT   CCC   TCT   CAA   TGG   GAC   GCA   TTT   CTT   GTA   CAA   ATT           240GAA   CAG   TTA   ATT   AAC   CAA   AGA   ATA   GAA   GAA   TTC   GCT   AGG   AAC   CAA   GCC           288ATT   TCT   AGA   TTA   GAA   GGA   CTA   AGC   AAT   CTT   TAT   CAA   ATT   TAC   GCA   GAA           336TCT   TTT   AGA   GAG   TGG   GAA   GCA   GAT   CCT   ACT   AAT   CCA   GCA   TTA   AGA   GAA           384GAG   ATG   CGT   ATT   CAA   TTC   AAT   GAC   ATG   AAC   AGT   GCC   CTT   AGA   ACC   GCT           432ATT   CCT   CTT   TTT   GCA   GTT   CAA   AAT   TAT   CAA   GTT   CCT   CTT   TTA   TCA   GTA           480TAT   GTT   CAA   GCT   GCA   AAT   TTA   CAT   TTA   TCA   GTT   TTG   AGA   GAT   GTT   TCA           528GTG   TTT   GGA   CAA   AGG   TGG   GGA   TTT   GAT   GCC   GCG   ACT   ATC   AAT   AGT   CGT           576TAT   AAT   GAT   TTA   ACT   AGG   CTT   ATT   GGC   AAC   TAT   ACA   GAT   TAT   GCT   GTA           624CGC   TGG   TAC   AAT   ACG   GGA   TTA   GAA   CGT   GTA   TGG   GGA   CCG   GAT   TCT   AGA           672GAT   TGG   GTA   AGG   TAT   AAT   CAA   TTT   AGA   AGA   GAA   TTA   ACA   CTA   ACT   GTA           720TTA   GAT   ATC   GTT   GCT   CTG   TTC   CCG   AAT   TAT   GAT   AGT   AGA   AGA   TAT   CCA           768ATT   CGA   ACA   GTT   TCC   CAA   TTA   ACA   AGA   GAA   ATT   TAT   ACA   AAC   CCA   GTA           816TTA   GAA   AAT   TTT   GAT   GGT   AGT   TTT   CGA   GGC   TCG   GCT   CAG   GGC   ATA   GAA           864AGA   AGT   ATT   AGG   AGT   CCA   CAT   TTG   ATG   GAT   ATA   CTT   AAC   AGT   ATA   ACC           912ATC   TAT   ACG   GAT   GCT   CAT   AGG   GGT   TAT   TAT   TAT   TGG   TCA   GGG   CAT   CAA           960ATA   ATG   GCT   TCT   CCT   GTA   GGG   TTT   TCG   GGG   CCA   GAA   TTC   ACT   TTT   CCG          1008CTA   TAT   GGA   ACT   ATG   GGA   AAT   GCA   GCT   CCA   CAA   CAA   CGT   ATT   GTT   GCT          1056GAA   CTA   GGT   CAG   GGC   GTG   TAT   AGA   ACA   TTA   TCG   TCC   ACT   TTA   TAT   AGA          1104AGA   CCT   TTT   AAT   ATA   GGG   ATA   AAT   AAT   CAA   CAA   CTA   TCT   GTT   CTT   GAC          1152GGG   ACA   GAA   TTT   GCT   TAT   GGA   ACC   TCC   TCA   AAT   TTG   CCA   TCC   GCT   GTA          1200TAC   AGA   AAA   AGC   GGA   ACG   GTA   GAT   TCG   CTG   GAT   GAA   ATA   CCG   CCA   CAG          1248AAT   AAC   AAC   GTG   CCA   CCT   AGG   CAA   GGA   TTT   AGT   CAT   CGA   TTA   AGC   CAT          1296GTT   TCA   ATG   TTT   CGT   TCA   GGC   TTT   AGT   AAT   AGT   AGT   GTA   AGT   ATA   ATA          1344AGA   GCT   CCT   ATG   TTC   TCT   TGG   ATA   CAT   CGT   AGT   GCT   GAA   TTT   AAT   AAT          1392ATA   ATT   GCA   TCG   GAT   AGT   ATT   ACT   CAA   ATA   CCA   TTG   GTA   AAA   GCA   CAT          1440ACA   CTT   CAG   TCA   GGT   ACT   ACT   GTT   GTA   AGA   GGG   CCC   GGG   TTT   ACG   GGA          1488GGA   GAT   ATT   CTT   CGA   CGA   ACA   AGT   GGA   GGA   CCA   TTT   GCT   TAT   ACT   ATT          1536GTT   AAT   ATA   AAT   GGG   CAA   TTA   CCC   CAA   AGG   TAT   CGT   GCA   AGA   ATA   CGC          1584TAT   GCC   TCT   ACT   ACA   AAT   CTA   AGA   ATT   TAC   GTA   ACG   GTT   GCA   GGT   GAA          1632CGG   ATT   TTT   GCT   GGT   CAA   TTT   AAC   AAA   ACA   ATG   GAT   ACC   GGT   GAC   CCA          1680TTA   ACA   TTC   CAA   TCT   TTT   AGT   TAC   GCA   ACT   ATT   AAT   ACA   GCT   TTT   ACA          1728TTC   CCA   ATG   AGC   CAG   AGT   AGT   TTC   ACA   GTA   GGT   GCT   GAT   ACT   TTT   AGT          1776TCA   GGG   AAT   GAA   GTT   TAT   ATA   GAC   AGA   TTT   GAA   TTG   ATT   CCA   GTT   ACT          1824GCA   ACA   CTC   GAG   GCT   GAA   TAT   AAT   CTG   GAA   AGA   GCG   CAG   AAG   GCG   GTG          1872AAT   GCG   CTG   TTT   ACG   TCT   ACA   AAC   CAA   CTA   GGG   CTA   AAA   ACA   AAT   GTA          1920ACG   GAT   TAT   CAT   ATT   GAT   CAA   GTG   TCC   AAT   TTA   GTT   ACG   TAT   TTA   TCG          1968GAT   GAA   TTT   TGT   CTG   GAT   GAA   AAG   CGA   GAA   TTG   TCC   GAG   AAA   GTC   AAA          2016CAT   GCG   AAG   CGA   CTC   AGT   GAT   GAA   CGC   AAT   TTA   CTC   CAA   GAT   TCA   AAT          2064TTC   AAA   GAC   ATT   AAT   AGG   CAA   CCA   GAA   CGT   GGG   TGG   GGC   GGA   AGT   ACA          2112GGG   ATT   ACC   ATC   CAA   GGA   GGG   GAT   GAC   GTA   TTT   AAA   GAA   AAT   TAC   GTC          2160ACA   CTA   TCA   GGT   ACC   TTT   GAT   GAG   TGC   TAT   CCA   ACA   TAT   TTG   TAT   CAA          2208AAA   ATC   GAT   GAA   TCA   AAA   TTA   AAA   GCC   TTT   ACC   CGT   TAT   CAA   TTA   AGA          2256GGG   TAT   ATC   GAA   GAT   AGT   CAA   GAC   TTA   GAA   ATC   TAT   TTA   ATT   CGC   TAC          2304AAT   GCA   AAA   CAT   GAA   ACA   GTA   AAT   GTG   CCA   GGT   ACG   GGT   TCC   TTA   TGG          2352CCG   CTT   TCA   GCC   CAA   AGT   CCA   ATC   GGA   AAG   TGT   GGA   GAG   CCG   AAT   CGA          2400TGC   GCG   CCA   CAC   CTT   GAA   TGG   AAT   CCT   GAC   TTA   GAT   TGT   TCG   TGT   AGG          2448GAT   GGA   GAA   AAG   TGT   GCC   CAT   CAT   TCG   CAT   CAT   TTC   TCC   TTA   GAC   ATT          2496GAT   GTA   GGA   TGT   ACA   GAC   TTA   AAT   GAG   GAC   CTA   GGT   GTA   TGG   GTG   ATC          2544TTT   AAG   ATT   AAG   ACG   CAA   GAT   GGG   CAC   GCA   AGA   CTA   GGG   AAT   CTA   GAG          2592TTT   CTC   GAA   GAG   AAA   CCA   TTA   GTA   GGA   GAA   GCG   CTA   GCT   CGT   GTG   AAA          2640AGA   GCG   GAG   AAA   AAA   TGG   AGA   GAC   AAA   CGT   GAA   AAA   TTG   GAA   TGG   GAA          2688ACA   AAT   ATC   GTT   TAT   AAA   GAG   GCA   AAA   GAA   TCT   GTA   GAT   GCT   TTA   TTT          2736GTA   AAC   TCT   CAA   TAT   GAT   CAA   TTA   CAA   GCG   GAT   ACG   AAT   ATT   GCC   ATG    2784ATT   CAT   GCG   GCA   GAT   AAA   CGT   GTT   CAT   AGC   ATT   CGA   GAA   GCT   TAT   CTG    2832CCT   GAG   CTG   TCT   GTG   ATT   CCG   GGT   GTC   AAT   GCG   GCT   ATT   TTT   GAA   GAA    2880TTA   GAA   GGG   CGT   ATT   TTC   ACT   GCA   TTC   TCC   CTA   TAT   GAT   GCG   AGA   AAT    2928GTC   ATT   AAA   AAT   GGT   GAT   TTT   AAT   AAT   GGC   TTA   TCC   TGC   TGG   AAC   GTG    2976AAA   GGG   CAT   GTA   GAT   GTA   GAA   GAA   CAA   AAC   AAC   CAA   CGT   TCG   GTC   CTT    3024GTT   GTT   CCG   GAA   TGG   GAA   GCA   GAA   GTG   TCA   CAA   GAA   GTT   CGT   GTC   TGT    3072CCG   GGT   CGT   GGC   TAT   ATC   CTT   CGT   GTC   ACA   GCG   TAC   AAG   GAG   GGA   TAT    3120GGA   GAA   GGT   TGC   GTA   ACC   ATT   CAT   GAG   ATC   GAG   AAC   AAT   ACA   GAC   GAA    3168CTG   AAG   TTT   AGC   AAC   TGC   GTA   GAA   GAG   GAA   ATC   TAT   CCA   AAT   AAC   ACG    3216GTA   ACG   TGT   AAT   GAT   TAT   ACT   GTA   AAT   CAA   GAA   GAA   TAC   GGA   GGT   GCG    3264TAC   ACT   TCT   CGT   AAT   CGA   GGA   TAT   AAC   GAA   GCT   CCT   TCC   GTA   CCA   GCT    3312GAT   TAT   GCG   TCA   GTC   TAT   GAA   GAA   AAA   TCG   TAT   ACA   GAT   GGA   CGA   AGA    3360GAG   AAT   CCT   TGT   GAA   TTT   AAC   AGA   GGG   TAT   AGG   GAT   TAC   ACG   CCA   CTA    3408CCA   GTT   GGT   TAT   GTG   ACA   AAA   GAA   TTA   GAA   TAC   TTC   CCA   GAA   ACC   GAT    3456AAG   GTA   TGG   ATT   GAG   ATT   GGA   GAA   ACG   GAA   GGA   ACA   TTT   ATC   GTG   GAC    3504AGC   GTG   GAA   TTA   CTC   CTT   ATG   GAG   GAA   TAG                                        35346.8实施例8--对CRY *变异体抗性的转基因植物的分离6.8.1植物基因的构建
以双链DNA形式存在的植物基因的表达包括由RNA聚合酶从该DNA的一条链转录出信使RNA(mRNA)以及随后在核内对mRNA初级转录本的加工。此加工包括3′非翻译区,其中添加聚腺苷酸核苷酸至该RNA的3′末端。DNA到mRNA的转录受到常称为“启动子”的DNA区域的调控。此启动子区域含有指导(signal)RNA聚合酶与DNA结合并用该DNA的一条链作为模板起始mRNA转录以形成相应的RNA链的碱基序列。
文献中已描述过许多在植物细胞中有活性的启动子。这些启动子可获自植物或植物病毒,并且包括但不限于胭脂氨酸合酶(NOS)和章鱼氨酸合酶(OCS)启动子(根癌农杆菌的诱导肿瘤的质粒中带有它们)、花椰菜花叶病毒(CaMV)19S和35S启动子、核酮糖-1,5-二磷酸羧化酶(ssRUBISCO,一种很丰富的植物多肽)小亚单位的光诱导启动子、玄参花叶病毒(FMV)35S启动子。所有这些启动子已用于建立在植物中表达的各种DNA构建体(参见,如美国专利No.5,463,175,在此特异性引入供参考)。
选定的特定启动子应该能够导致酶编码序列充分表达从而产生足够量的蛋白。一套优选的启动子为组成性启动子如在大多数植物中产生高水平表达的CaMV 35S或FMV 35S启动子(美国专利No.5,378,619,在此特异性掺入供参考)。另一套优选的启动子为根部增强或特异性的启动子如CaMV来源的4 as-1启动子或小麦POX 1启动子(美国专利No.5,023,179,在此特异性掺入供参考;Hertig等,1991)。根部增强的或特异性的启动子对于在转基因玉米植物中控制玉米根虫(rootworm)(Diabroticus spp.)。
如果必要,可修饰用于本发明DNA构建体(即嵌合的植物基因)中的启动子以影响其控制特征。例如,可将在无光时抑制ssRUBISCO表达的CaMV 35S启动子连接到ssRUBISCO基因的部分以构建在叶片中有活性而在根部无活性的启动子。可按这里所述使用得到的嵌合启动子。为了描述的目的,术语“CaMV 35S”启动子因此包括CaMV 35S启动子的变异体,和通过与随或控制诱变等的操纵子区连接而得到的启动子。此外,可改变该启动子以含有多个“增强子序列”以利于提高基因表达。
由本发明DNA构建体而产生的RNA也含有5′非翻译的前导区序列。此序列可来自被选定表达该基因的启动子并可特异性地加以修饰从而增加mRNA的翻译。5′非翻译区也可获自病毒RNA、适当的真核基因或合成的基因序列。本发明不限于其中的非翻译区源自伴随该启动子序列5′非翻译序列的构建体。
为了优化在单子叶植物如玉米中的表达,内含子也应包括进该DNA表达构建体中。此内含子将一般位于靠近mRNA 5′末端的非翻译序列中。该内含子可从但不限于由玉米hsp 70内含子(美国专利No.5,424,412,在此特异性掺入供参考)或水稻Act 1内含子(McElory等,1990)所组成的一套内含子中获得。如下面所示,玉米hsp 70内含子在本发明中是有用的。
如上述,本发明嵌合植物基因的3′非翻译区含有在植物中起作用的聚腺苷酸化信号从而导致添加腺苷酸核苷酸至该RNA的3′末端。优选3′区域的实例有(1)含有农杆菌诱导肿瘤(Ti)质粒基因聚腺苷酸信号的3′转录的非翻译区,如胭脂氨酸合酶(NOS)基因和(2)植物基因如豌豆ssRUBISCO E9基因(Fischhoff等,1987)。6.8.2植物转化与表达
可通过任何合适的方法如这里详述的那些方法将本发明含有结构编码序列的嵌合转基因插入到植物的基因组中。适当的植物转化载体包括来自根癌农杆菌Ti质粒的那些载体以及,如由Herrera-Estrella(1983)、Bevan(1983)、Klee(1985)和欧洲专利申请公开No.EP0120516中公开的那些载体。除了来自农杆菌Ti或诱导根部(Ri)质粒的植物转化载体外,可用其它方法将本发明的DNA构建体插入到植物细胞中。这些方法可包括,例如,使用脂质体、电穿孔、通过微粒轰击而增加自由DNA摄入、自由DNA转运的化学物质以及用病毒或花粉的转化(Fromm等,1986;Armstrong等,1990;Fromm等,1990)。6.8.3用于CRY*转基因的植物表达载体的构建
为了在此公开的cry*变异体在转基因植物中的有效表达,编码该变异体的基因必须具有适当的序列组成(Diehn等,1996)。
为了将cry*基因置于适于在单子叶植物中表达的载体中(即,在增强的花椰菜花叶病毒35S启动子的控制下并连接到hsp 70内含子上,后接胭脂氨酸合酶聚腺苷酸化位点,如美国专利No.5,424,412中所述,在此特异性掺入供参考),用适当的酶如NcoI和EcoRI消化载体。然后电泳纯化约4.6kb的较大的载体片段并用T4 DNA连接酶连接至含有植物化cry*基因的适当限制性片段上。然后将连接混合物转化入大肠杆菌中,回收羧苄青霉素抗性的菌落并通过DNA小量制备方法回收质粒DNA。然后可将DNA以酶如NcoI和EcoRI(共同)、NotI、和PstI进行限制性内切核酸酶分析以鉴定出含有在增强的CaMV 35S启动子控制下融合到hsp 70内含子上cry*基因编码序列的克隆。
为了将基因置于适于回收稳定转化和昆虫抗性植物的载体中,可通过凝胶电泳和纯化分离来自pMON 33708含有在增强的CaMV 35S启动子控制下融合到hsp 70内含子上赖氨酸氧化酶编码序列的限制片段。然后可将此片段与载体如以NotI和牛肠碱性磷酸酶处理过的pMON 30460连接(pMON 30460含有在CaMV 35S启动子控制下的新霉素磷酸转移酶编码序列)。然后可通过将此连接混合物转化入大肠杆菌中而获得卡那霉素抗性的菌落并且可通过以限制性内切核酸酶消化小量制备的DNA而鉴定含有得到质粒的菌落。限制酶如NotI、EcoRV、HindIII、NcoI、EcoRI和BglII可用于鉴定含有以适当方向插入到pMON 30460的相应位点中从而使2个基因为串联重复(即,将cry*基因表达弹夹的3′末端连接到nptIII表达弹夹的5′末端上)限制性片段的适当的克隆。然后通过将载体电穿孔进入原生质体中然后进行蛋白印迹和ELISA分析而确定在植物原生质体中由得到载体对cry*蛋白的表达。可基本上按美国专利No.5,424,412中所述,在此特异性掺入供参考,通过粒子枪轰击将此载体导入植物胚胎如玉米的基因组DNA中,然后通过巴龙霉素筛选以获得表达cry*基因的玉米植物。在该实施例中,通过以赋予潮霉素抗性质粒共轰击(cobombardment)而将载体导入玉米未成熟胚胎的盾片中,然后进行潮霉素筛选和再生。然后通过ELISA分析鉴定表达cry*蛋白的转基因玉米品系。然后测试这些过程的子代种子对易感昆虫摄食的保护。7.0参考文献
下面的参考文献提供例举性方案或其它与这里提出内容互补性的细节,在此特异性地掺入它们供参考之用。
1980年4月1日授权的美国专利4,196,265。
1985年11月19日授权的美国专利4,554,101。
1987年7月28日授权的美国专利4,683,195。
1987年7月28日授权的美国专利4,683,202。
1987年10月27日授权的美国专利4,702,914。
1988年7月12日授权的美国专利4,757,011。
1988年9月6日授权的美国专利4,769,061。
1990年7月10日授权的美国专利4,940,835。
1990年10月23日授权的美国专利4,965,188。
1990年11月20日授权的美国专利4,971,908。
1991年1月22日授权的美国专利4,987,071。
1991年4月2日授权的美国专利5,004,863。
1991年5月14日授权的美国专利5,015,580。
1991年6月11日授权的美国专利5,023,179。
1991年10月8日授权的美国专利5,055,294。
1992年7月7日授权的美国专利5,128,130。
1993年1月5日授权的美国专利5,176,995。
1994年9月20日授权的美国专利5,349,124。
1995年1月3日授权的美国专利5,378,619。
1995年1月10日授权的美国专利5,380,831。
1995年1月24日授权的美国专利5,384,253。
1995年5月16日授权的美国专利5,416,102。
1995年6月13日授权的美国专利5,424,412。
1995年8月15日授权的美国专利5,441,884。
1995年9月12日授权的美国专利5,449,681。
1995年10月31日授权的美国专利5,463,175。
1996年3月19日授权的美国专利5,500,365。
1997年5月20日授权的美国专利5,631,359。
1997年8月19日授权的美国专利5,659,123。
1984年10月3日授权的欧洲专利EP0120516。
1990年3月28日授权的欧洲专利EP0360257。
1991年7月25日公开的国际专利申请公开No.WO91/10725。
1993年4月15日公开的国际专利申请公开No.WO93/07278。
1995年1月19日公开的国际专利申请公开No.WO95/02058。
1995年3月19日公开的国际专利申请公开No.WO95/06730。
1995年11月16日公开的国际专利申请公开No.WO95/30752。
1995年11月16日公开的国际专利申请公开No.WO95/30753。
1992年4月30日授权的国际专利WO92/07065。
1993年8月5日授权的国际专利WO93/15187。
1993年11月25日授权的国际专利WO93/23569。
1994年2月3日授权的国际专利WO94/02595。
1994年6月23日授权的国际专利WO94/13688。
1991年3月21日授权的国际专利WO91/03162。
Abdullah等,生物技术,4:1087,1986。
Adami和Nevins,在:RNA加工,冷泉港实验室,p.26,1988。
Adang等,在:用于作物保护的分子策略,Alan R.Liss,公司,pp.345-357,1987。
Adelman等,DNA,213:183-193,1983。
Allen和Choun,“具有低度摄入网状内皮系统的大的单层脂质体”,FEBS通讯,223:42-46,1987。
Altschul等,“基本的局部对比搜寻工具”,分子生物学杂志,215:403-410,1990。
Arvidson等,分子生物学,3:1533-1534,1989。
Barton等,植物生理,85:1103-1109,1987。
Baum等,应用环境微生物学,56:3420-3428,1990。
Benbrook等,In:Proceedings Bio Expo 1986,Butterworth,Stoneham,MA,pp.27-54,1986。
Bevan等,自然,304:184,1983。
Bolivar等,基因,2:95,1977。
Bosch等,“具有新特性的重组苏云金芽孢杆菌:用于抗性管理的可能性”,生物/技术,12:915-918,1994。
Brady和Wold,在:RNA加工,冷泉港实验室,p.224,1988。
Brown,核酸研究,14(24):9549,1986。
Bytebier等,美国自然科学院院报,84:5345,1987。
Callis等,基因发育,1:1183,1987。
Callis,Fromm,Walbot,基因与发育,1:1183-1200,1987。
Campbell,在:单克隆抗体技术、生化与分子生物学实验技术,13卷,Burden与Von Knippenberg,编,pp.75-83,Elsevier,Amsterdam,1984。
Capecchi,“直接显微注射DNA至培养的哺乳动物细胞所致的高效转化”,细胞,22(2):479-488,1980。
Cashmore等,植物遗传工程,Plenum出版社,纽约,29-38,1983。
Chambers等,细菌学杂志,173:3966-3976,1991。
Chang等,自然,375:615,1978。
Chau等,科学,244:174-181,1989。
Chen等,核酸研究,20:4581-9,1992。
Clapp.“进入造血细胞内部的体细胞基因治疗。当前的地位和将来的应用”,Clin.Perinatol.20(1):155-168,1993。
Collins和Olive,生物化学,32:2795-2799,1993。
Conway和Wickens,在:RNA加工,冷泉港实验室,p.40,1988。
Cornellssen等,EMBO J,5(1):37-40,1986。
Couvreur等,“微胶囊(Nanocapsules),一种新的溶酶体性(lysosomotrropic)载体”,FEBS通讯,84:323-326,1977。
Couvreur,“作为胶体药物载体的Polyalkyleyanoacrylates”,Crit.Rev.Ther.Drug Carrier Syst.,5:1-20,1988。
Crickmore等,Abstr.28th Annu.Meet.Soc.Invert.Pathol.,康奈尔大学,Ithaca,纽约,1995。
Cristou等,植物生理学,87:671-674,1988。
Curiel,Agarwal,Wagner,Cotten,“腺病毒增强转铁蛋白-聚赖氨酸-介导的基因转运”,美国自然科学院院报,88(19):8850-8854,1991。
Curiel,Wagner,Cotten,Birnstiel,Agarwal,Li,Loechel,Hu,“由偶联至DNA-聚赖氨酸复合物上腺病毒介导的高效基因转移”,人类基因治疗,3(2):147-154,1992。
Daar等,在:RNA加工,冷泉港实验室,p.45,1988。
Dean等,核酸研究,14(5):2229,1986。
Dedrick等,生物化学杂志,262(19):90098-1106,1987。
Dhir等,植物细胞报告,10:97,1991。
Diehn,De Rocher,Green,“限制外源基因在植物中表达的困难:从B.t.毒素基因取得的教训”,在:遗传工程,18卷,J.K.Setlow编,Plenum出版社,纽约,1996。
Donovan等,生物化学杂志,263(1):561-567,1988。
Doyle等,生物化学杂志,261(20):9228-9236,1986。
Dropulic等,病毒学杂志,66:1432-41,1992。
Eglitis与Anderson,“用于将基因导入哺乳动物细胞中的逆转录病毒载体”,生物技术,6(7):608-614,1988。
Eglitis,Kantoff,Kohn,Karson,Moen,Lothrop,Blaese,Anderson,“逆转录病毒介导的基因进入造血细胞”,实验医学生物学进展,241:19-27,1988。
Eichenlaub,细菌学杂志,138(2):559-566,1979。
Elionor等,分子遗传遗传学,218:78-86,1989。
Elroy-Stein与Moss,美国自然科学院院报,87:6743-7,1990。
Fiers等,自然,273:113,1978。
Fischhoff等,生物/技术,5:807,1987。
Fraley等,美国自然科学院院报,80:4803,1983。
Fraley等,生物/技术,3:629-635,1985。
Fromm,Taylor,Walbot,自然,319:791-793,1986。
Fromm,Taylor,Walbot,“由电穿孔转入单子叶和双子叶植物中基因的表达”,美国自然科学院院报,82(17):5824-5828,1985。
Fromm等,“嵌合基因在转基因玉米植物中的遗传与表达”,生物技术(NY),8(9):833-839,1990。
Fujimura等,植物组织培养通讯,2:74,1985。
Fütterer和Hohn,“植物中翻译-规律与例外”,植物分子生物学,32:159-189,1996。
Fynan,Webster,Fuller,Haynes,Santoro,Robinson,“DNA疫苗:由肠道外、粘膜和基因枪接种所致的保护性免疫”,美国自然科学院院报,90(24):11478-11482,1993。
Gallego与Nadal-Ginard,在:RNA加工,冷泉港实验室,p.61,1988。
Gao与Huang,核酸研究,21:2867-72,1993。
Gawron-Burke与Baum,遗传工程,13:237-263,1991。
Gefter等,体细胞遗传学,3:231-236,1977。
Genovese与Mrlcarek,在:RNA加工,冷泉港实验室,p.62,1988。
Gil与Proudfoot,自然。312:473,1984。
Gill等,生物化学杂志,270:27277-27282,1995。
Goding,“单克隆抗体:原理与实践”,pp.60-74,第2版,学术出版社,Orlando,FL,1986。
Goeddel等,自然,281:544,1979。
Goeddel等,核酸研究,8:4057,1980。
Goodall等,在:RNA加工,冷泉港实验室,p.63,1988。
Graham与Van der Eb,“通过人腺病毒5 DNA转化大鼠细胞”,病毒学,54(2):536-539,1973。
Green,核酸研究。16(1):369,1988。
Grochulski等,分子生物学杂志,254:457-464,1995。
Gross等,在:RNA加工,冷泉港实验室,p.128,1988。
Guerrier-Takada等,细胞,35:849,1983。
Hampel与Tritz,生物化学,28:4929,1989。
Hampel等,核酸研究,18:299,1990。
Hampson与Rottman,在:RNA加工,冷泉港实验室,p.68,1988。
Hanley与Schuler,核酸研究,16(14):7159,1988。
Harlow与Lane,在:抗体:实验指南,冷泉港实验室,冷泉港,纽约,1988。
Helfman与Ricci,在:RNA加工,冷泉港实验室,p.219,1988。
Henry-Michelland等,“附着抗生素至微粒上;在体外的制备、药物释放与抗-微生物活性,国际药物学杂志,35:121-127,1987。
Herrera-Estrella等,自然,303:209,1983。
Hess等,J.Adv.Enzyme Reg.,7:149,1968。
Hertig等,“小麦(Triticum aestivum L.)推断性过氧化物酶基因的序列与组织特异性表达”,植物分子生物学,16(1):171-174,1991。
Hilber,Bodmer,Smith,Koller,“Biolistic转化Botryotiniafuckeliana的分生孢子”,当今遗传学,25(2):124-127,1994。
Hitzeman等,生物化学杂志,255:2073,1980。
Hoekema等,分子与细胞生物学,7:2914-2924,1987。
Hfte与Whiteley,微生物学综述,53:242-255,1989。
Holland等,生物化学,17:4900,1978。
Honee等,分子微生物学,5:2799-2806,1991。
Honee等,核酸研究,16(13),1988。
Hoover等(编),在:雷明顿药物科学,第15版,Mack出版公司,Easton,PA,1975。
Horsch等,科学,227:1229-1231,1985。
Horsch等,科学,227:1229,1985。
Horton等,基因,77:61-68,1989。
Humason,“动物组织技术”,W.H Freeman &公司,纽约,1967。
Iannacone,Pasquale,Grieco,Francesco,Cellini,“cry 3B内毒素基因的特异性序列修饰得到高水平表达和昆虫抗性”,植物分子生物学。34:485-496,1997。
Itakura等,科学,198:1056,1977。
Jaeger等,美国自然科学院院报,86:7706-7710,1989。
Jameson与Wolf,“抗原指标:一种预言抗原决定簇的新的算术”,计算机应用生物科学,4(1):181-6,1988。
Jarret等,体外,17:825,1981。
Jarret等,植物生理学,49:177,1980。
Johnston与Tang,“基因枪转染动物细胞与遗传免疫”。细胞生物学方法,43(A):353-365,1994。
Jones,遗传学,85:12,1977。
Jorgensen等,分子遗传遗传学,207:471,1987。
Kaiser等,“两亲性二级结构:肽激素的设计”,科学,223(4633):249-255,1984。
Kashani-Saber等,反义研究进展,2:3-15,1992。
Kay等,科学,236:1299-1302,1987。
Keller等,EMBO杂志,8:1309-14,1989。
Kessler等,在:RNA加工,冷泉港实验室,p.85,1988。
Kingsman等,基因,7:141,1979。
Klee等,生物/技术,3:637,1985。
Klee等,生物/技术,3:637-642,1985。
Klein等,自然,327:70,1987。
Klein等,美国自然科学院院报,85:8502-8505,1988。
Knight等,生物化学杂志,270:17765-17770,1995。
Kohler与Milstein,欧洲免疫学杂志,6:511-519,1976。
Kohler与Milstein,自然,256:495-497,1975。
Kozak,自然,308:241-246,1984。
Krebbers等,植物分子生物学,11:745-759,1988。
Kuby,免疫学,第2版,W.H.Freeman &公司,纽约,1994。
Kunkel,“不用表型筛选的快速而有效的定点诱变”,美国自然科学院院报,82(2):488-492,1985。
Kunkel等,“不用表型筛选的快速而有效的定点诱变”,酶学方法,154:367-382,1987。
Kyte与Doolittle,“用于显示蛋白亲水特征的简单方法”,分子生物学杂志,157(1):105-132,1982。
Langridge等,美国自然科学院院报,86:3219-3223,1989。
Lee等,生化·生物物理研究通讯,216:306-312,1995。
L′Huillier等,EMBO杂志,11:4411-8,1992。
Lieber等,酶学方法,217:47-66,1993。
Lisziewicz等,美国自然科学院院报,90:8000-4,1993。
Lim等,“带有无义密码子的人β-珠蛋白mRNA在鼠红细胞系组织中降解成缺乏外显子I或外显子I与II区域并在5′末端具有帽状结构的中间体”,EMBO杂志,11(9):3271-3278,1992。
Lindstrom等,发育遗传学,11:160,1990。
Lorz等,分子遗传遗传学,199:178,1985。
Lu,Xiao,Clapp,Li,Broxmeyer,“高效逆转录病毒介导的基因转导入单个人脐带血中分离的未成熟和可移植(replatable)CD 34(3+)成红干细胞/祖细胞中”,实验医学杂志,178(6):2089-2096,1993。
Luo等,植物分子生物学报告,6:165,1988。
Maddock等,第三届国际分子生物学大会,摘要,No.372,1991。
Maloy等,在:微生物遗传学,第2版,Jones & Bartlett出版社,Boston,MA,1994。
Maniatis等,在:分子克隆:实验指南,冷泉港实验室,冷泉港,纽约,1982。
Marcotte等,自然,335:454,1988。
Marrone等,经济昆虫学杂志,78-290-293,1985。
Marzluff与Pandey,在:RNA加工,冷泉港实验室,p.244,1988。
Masson等,生物化学杂志,270:20309-20315,1995。
McCabe等,生物技术,6:923,1988。
McCormick等,植物细胞报告,5:81-84,1986。
McDevitt等,细胞,37:993-999,1984。
McElory等,“水稻(Oryza sativa)肌动蛋白基因家族的特征分析”,植物分子生物学,15(2):257-268,1990。
Mettus与Macaluso,应用环境微生物学,56:1128-1134,1990。
Murashige与Skoog,植物生理学,15:473,1962。
Murray,Lotzer,Eberle,“植物基因中密码子的使用”,核酸研究,17:(2)477-498,1989。
Neuhaus等,理论、应用遗传学,75:30,1987。
Odell等,自然,313:810,1985。
Odell等,自然,313,810,1985。
Ojwang等,美国自然科学院院报,89:10802-6,1992。
Ohkawa等,Nucl.Acids Symp.Ser.,27:15-6,1992。
Omirulleh等,植物分子生物学,21:415-428,1993。
Pandey与Marzluff,在:RNA加工,冷泉港实验室,p.133,1987。
Pieken等,科学,253:314,1991。
Pena等,自然,325:274,1987。
Perrault等,自然,344:565,1990。
Poszkowski等,EMBO杂志,3:2719,1989。
Potrykus等,分子遗传遗传学,199:183,1985。
Poulsen等,分子遗传遗传学,205:193-200,1986。
Prokop与Bajpai,“重组DNA技术I”,纽约科学院年鉴,646卷,1991。
Proudfoot等,在:RNA加工,冷泉港实验室,p.17,1987。
Reines等,分子生物学杂志,196:299-312,1987。
Rogers等,在:植物分子生物学方法,A.Weissbach与H.Weissbach,编,学术出版公司,圣地亚哥,CA 1988。
Rogers等,酶学方法,153:253-277,1987。
Rossi等,Aids研究。人类逆转录病毒,8:183,1992。
Rouwendal,Odette Mendes,Wolbert Douwe de Boer,“通过改变其密码子使用而增强编码绿色荧光蛋白基因在烟草中的表达”,植物分子生物学,33:989-999,1997。
Ruud等,“在配体印迹(Blats)中苏云金芽孢杆菌δ-内毒素的不同区域可结合昆虫中肠膜蛋白”,应用环境微生物学,62(8):2753-2757,1996。
Ruud等,“苏云金芽孢杆菌δ-内毒素Cry IA(b)区域III的替代导致对Spodoptera exigua更强的毒性和不同的膜蛋白识别”,应用环境微生物学,62(5):1537-1543,1996。
Sadofsky与Alwine,分子与细胞生物学,4(8):1460-1468,1984。
Sambrook等,在:分子克隆:实验指南,冷泉港实验室,冷泉港,纽约,1989。
Sanders等,核酸研究,15(4):1543,1987。
Saville与Collins,细胞,61:685-696,1990。
Saville与Collins,美国自然科学院院报,88:8826-8830,1991。
Scanlon等,美国自然科学院院报,88:10591-5,1991。
Scaringe等,核酸研究,18:5433-5441,1990。
Schnepf等,生物化学杂志,265:20923-20930,1990。
Schuler等,核酸研究,10(24):8225-8244,1982。
Segal,在:生化计算,第2版,John Wiley & Sons,纽约,1976。
Shaw与Kamen,细胞,46:659-667,1986。
Shaw与Kamen,在:RNA加工,冷泉港实验室,p.220,1987。
Simpson,科学,233:34,1986。
Spielmann等,分子遗传遗传学,205:34,1986。
Spoerel,酶学方法,152:588-597,1987。
Stemmer,“通过随机分段与重新装配进行DNA重组:体外重组用于分子进化”,美国自然科学院院报,91(22):10747-10751,1994。
Stinchcomb等,自然,282:39,1979。
Taira等,核酸研究,19:5125-30,1991。
Thompson等,遗传工程,17:99-117,1995。
Toriyama等,理论、应用遗传学,73:16,1986。
Trolinder与Goodin,植物细胞报告,6:231-234,1987。
Tschemper等,基因,10:157,1980。
Tsurushita与Korn,在:RNA加工,冷泉港实验室,p.215,1987。
Tumer等,核酸研究,14:8,3325,1986。
Uchimiya等,分子遗传遗传学,204:204,1986。
Usman与Cedergren,化学科学展望,17:334,1992。
Vaeck等,自然,328:33,1987。
Van Tunen等,EMBO杂志,7:1257,1988。
Vasil等,“通过微粒轰击可再生的胚胎愈伤组织而获得的杀虫剂抗性可育转基因小麦植物”,生物技术,10:667-674,1992。
Vasil,生物技术,6:397,1988。
Velten与Schell,核酸研究,13:6981-6998,1985。
Velten等,EMBO杂志,3:2723-2730,1984。
Ventura等,核酸研究,21:3249-55,1993。
Visser等,分子遗传遗传学,212:219-224,1988。
Vodkin等,细胞,34:1023,1983。
Vogel等,细胞生化杂志(增刊)13D:312,1989。
Wagner,Zatloukal,Cotten,Kirlappos,Mechtler,Curiel,Birnstiel,“腺病毒与转铁蛋白-聚赖氨酸/DNA复合物的偶联大大增强了受体介导的基因转移与转染基因的表达”,美国自然科学院院报89(13):6099-6013,1992。
Webb等,植物科学通讯,30:1,1983。
Weerasinghe等,病毒学杂志,65:5531-4,1991。
Weissbach与Weissbash,植物分子生物学方法,(编),学术出版公司,圣地亚哥,CA,1988。
Wenzler等,植物分子生物学,12:41-50,1989。
Wickens与Stephenson,科学,226:1045,1984。
Wickens等,在:RNA加工,冷泉港实验室,p.9,1987。
Wiebauer等,分子与细胞生物学,8(5):2042-2051,1988。
Woolf等,美国自然科学院院报,89:7305-7309,1992。
Wolf等,“一组完整的氨基酸序列分析程序”,计算机应用生物科学,4(1):187-91,1988。
Wong与Neumann,“电场介导的基因转移”,生化与生物物理研究通讯,107(2):584-587,1982。
Yamada等,植物细胞复制,4:85,1986。
Yamamoto与Iizuka,生化与生物物理档案,227(1):233-241,1983。
Yang等,美国自然科学院院报,87:4144-48,1990。
Zhou等,酶学方法,101:433,1983。
Zhou等,分子细胞生物学,10:4529-37,1990。
在本发明的指导下可制备和执行在此公开并要求保护的所有组合物和方法而无需更多的实验过程。虽然就优选的实施方案而言已描述了本发明的组合物与方法,但是在不偏离本发明概念、精神和范围情况下多种变化可应用于在此所述的组合物和方法以及步骤或各步骤的序列中,这对于本领域中的技术人员将是显而易见的。更为具体地,很显然,一些同时被化学与物理改变的试剂可被这里所述的试剂所替代而仍然得到相同或类似的结果。认为对本领域中技术人员显而易见的所有此类类似的替代与修饰均在附属权利要求所限定的本发明精神、范围和概念之中。8.0序列表(1)一般信息:
(i)申请人:
    (A)名字:Ecogen公司
    (B)街道:2005 Cabot Boulevard West
    (C)城市:Langhorne
    (D)州:宾夕法尼亚
    (E)国家:美国
    (F)邮编(ZIP):19047-3023
(ii)发明题目:广谱δ-内毒素
(iii)序列数目:35
(iv)COMPUTER READABLE FORM:
    (A)计算机可读形式:软盘
    (B)计算机:IBM PC兼容机
    (C)操作系统:PC-DOS/MS-DOS
    (D)软件:专利发布#1.0,#1.3版(EPO)
(vi)优先申请数据
    (A)申请号:美国08/922,505
    (B)提交日期:1997年9月3日
(vi)优先申请数据
    (A)申请号:美国08/757,536
    (B)提交日期:1996年11月27日
(vi)优先申请数据
    (A)申请号:美国08/754,490
    (B)提交日期:1996年11月20日(2)SEQ ID NO:1信息:
(i)序列特征:
    (A)长度:23个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:1:GGATAGCACT CATCAAAGGT ACC                                  23(2)SEQ ID NO:2信息:
(i)序列特征:
    (A)长度:27个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:2:GAAGATATCC AATTCGAACA GTTTCCC                              27(2)SEQ ID NO:3信息:
(i)序列特征:
    (A)长度:28个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:3:CATATTCTGC CTCGAGTGTT GCAGTAAC                             28(2)SEQ ID NO:4信息:
(i)序列特征:
    (A)长度:17个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:4:CCCGATCGGC CGCATGC                                         17(2)SEQ ID NO:5信息:
(i)序列特征:
    (A)长度:17个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:5:CATTGGAGCT CTCCATG                                         17(2)SEQ ID NO:6信息:
(i)序列特征:
    (A)长度:16个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:6:GCACTACGAT GTATCC                                          16(2)SEQ ID NO:7信息:
(i)序列特征:
    (A)长度:20个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:7:CATCGTAGTG CAACTCTTAC                                      20(2)SEQ ID NO:8信息:
(i)序列特征:
    (A)长度:39个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:8:CCAAGAAAAT ACTAGAGCTC TTGTTAAAAA AGGTGTTCC                 39(2)SEQ ID NO:9信息:
(i)序列特征:
    (A)长度:3531个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑学:线性
(ix)特征:
    (A)名字/关键:CDS
    (B)位置:1..3531
(xi)序列描述:SEQ ID NO:9:ATG GAT AAC AAT CCG AAC ATC AAT GAA TGC ATT CCT TAT AAT TGT TTA          48Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu1               5                  10                  15AGT AAC CCT GAA GTA GAA GTA TTA GGT GGA GAA AGA ATA GAA ACT GGT          96Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly
         20                  25                  30TAC ACC CCA ATC GAT ATT TCC TTG TCG CTA ACG CAA TTT CTT TTG AGT         144Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser
     35                  40                  45GAA TTT GTT CCC GGT GCT GGA TTT GTG TTA GGA CTA GTT GAT ATA ATA         192Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile
 50                  55                  60TGG GGA ATT TTT GGT CCC TCT CAA TGG GAC GCA TTT CTT GTA CAA ATT         240Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile65                  70                  75                  80GAA CAG TTA ATT AAC CAA AGA ATA GAA GAA TTC GCT AGG AAC CAA GCC         288Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
             85                  90                  95ATT TCT AGA TTA GAA GGA CTA AGC AAT CTT TAT CAA ATT TAC GCA GAA         336Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu
        100                 105                 110TCT TTT AGA GAG TGG GAA GCA GAT CCT ACT AAT CCA GCA TTA AGA GAA         384Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu
    115                 120                 125GAG ATG CGT ATT CAA TTC AAT GAC ATG AAC AGT GCC CTT ACA ACC GCT         432Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala
130                 135                 140ATT CCT CTT TTT GCA GTT CAA AAT TAT CAA GTT CCT CTT TTA TCA GTA         480Ile Pro Leu Phe Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val145                 150                 155                 160TAT GTT CAA GCT GCA AAT TTA CAT TTA TCA GTT TTG AGA GAT GTT TCA         528Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
            165                 170                 175GTG TTT GGA CAA AGG TGG GGA TTT GAT GCC GCG ACT ATC AAT AGT CGT         576Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg
        180                 185                 190TAT AAT GAT TTA ACT AGG CTT ATT GGC AAC TAT ACA GAT TAT GCT GTA         624Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val
    195                 200                 205CGC TGG TAC AAT ACG GGA TTA GAA CGT GTA TGG GGA CCG GAT TCT AGA         672Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg
210                 215                 220GAT TGG GTA AGG TAT AAT CAA TTT AGA AGA GAA TTA ACA CTA ACT GTA         720Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val225                 230                 235                 240TTA GAT ATC GTT GCT CTG TTC CCG AAT TAT GAT AGT AGA AGA TAT CCA         768Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro
            245                 250                 255ATT CGA ACA GTT TCC CAA TTA ACA AGA GAA ATT TAT ACA AAC CCA GTA         816Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val
        260                 265                 270TTA GAA AAT TTT GAT GGT AGT TTT CGA GGC TCG GCT CAG GGC ATA GAA         864Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Ser Ala Gln Gly Ile Glu
    275                 280                 285AGA AGT ATT AGG AGT CCA CAT TTG ATG GAT ATA CTT AAC AGT ATA ACC         912Arg Ser Ile Arg Ser Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr
290                 295                 300ATC TAT ACG GAT GCT CAT AGG GGT TAT TAT TAT TGG TCA GGG CAT CAA         960Ile Tyr Thr Asp Ala His Arg Gly Tyr Tyr Tyr Trp Ser Gly His Gln305                 310                 315                 320ATA ATG GCT TCT CCT GTA GGG TTT TCG GGG CCA GAA TTC ACT TTT CCG        1008Ile Met Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Thr Phe Pro
            325                 330                 335CTA TAT GGA ACT ATG GGA AAT GCA GCT CCA CAA CAA CGT ATT GTT GCT        1056Leu Tyr Gly Thr Met Gly Asn Ala Ala Pro Gln Gln Arg Ile Val Ala
        340                 345                 350CAA CTA GGT CAG GGC GTG TAT AGA ACA TTA TCG TCC ACT TTA TAT AGA        1104Gln Leu Gly Gln Gly Val Tyr Arg Thr Leu Ser Ser Thr Leu Tyr Arg
    355                 360                 365AGA CCT TTT AAT ATA GGG ATA AAT AAT CAA CAA CTA TCT GTT CTT GAC        1152Arg Pro Phe Asn Ile Gly Ile Asn Asn Gln Gln Leu Ser Val Leu Asp
370                 375                 380GGG ACA GAA TTT GCT TAT GGA ACC TCC TCA AAT TTG CCA TCC GCT GTA        1200Gly Thr Glu Phe Ala Tyr Gly Thr Ser Ser Asn Leu Pro Ser Ala Val385                 390                 395                 400TAC AGA AAA AGC GGA ACG GTA GAT TCG CTG GAT GAA ATA CCG CCA CAG        1248Tyr Arg Lys Ser Gly Thr Val Asp Ser Leu Asp Glu Ile Pro Pro Gln
            405                 410                 415AAT AAC AAC GTG CCA CCT AGG CAA GGA TTT AGT CAT CGA TTA AGC CAT        1296Asn Asn Asn Val Pro Pro Arg Gln Gly Phe Ser His Arg Leu Ser His
        420                 425                 430GTT TCA ATG TTT CGT TCA GGC TTT AGT AAT AGT AGT GTA AGT ATA ATA        1344Val Ser Met Phe Arg Ser Gly Phe Ser Asn Ser Ser Val Ser Ile Ile
    435                 440                 445AGA GCT CCA ATG TTT TCT TGG ACG CAC CGT AGT GCA ACC CCT ACA AAT        1392Arg Ala Pro Met Phe Ser Trp Thr His Arg Ser Ala Thr Pro Thr Asn
450                 455                 460ACA ATT GAT CCG GAG AGG ATT ACT CAA ATA CCA TTG GTA AAA GCA CAT        1440Thr Ile Asp Pro Glu Arg Ile Thr Gln Ile Pro Leu Val Lys Ala His465                 470                 475                 480ACA CTT CAG TCA GGT ACT ACT GTT GTA AGA GGG CCC GGG TTT ACG GGA        1488Thr Leu Gln Ser Gly Thr Thr Val Val Arg Gly Pro Gly Phe Thr Gly
            485                 490                 495GGA GAT ATT CTT CGA CGA ACA AGT GGA GGA CCA TTT GCT TAT ACT ATT        1536Gly Asp Ile Leu Arg Arg Thr Ser Gly Gly Pro Phe Ala Tyr Thr Ile
        500                 505                 510GTT AAT ATA AAT GGG CAA TTA CCC CAA AGG TAT CGT GCA AGA ATA CGC        1584Val Asn Ile Asn Gly Gln Leu Pro Gln Arg Tyr Arg Ala Arg Ile Arg
    515                 520                 525TAT GCC TCT ACT ACA AAT CTA AGA ATT TAC GTA ACG GTT GCA GGT GAA        1632Tyr Ala Ser Thr Thr Asn Leu Arg Ile Tyr Val Thr Val Ala Gly Glu
530                 535                 540CGG ATT TTT GCT GGT CAA TTT AAC AAA ACA ATG GAT ACC GGT GAC CCA        1680Arg Ile Phe Ala Gly Gln Phe Asn Lys Thr Met Asp Thr Gly Asp Pro545                 550                 555                 560TTA ACA TTC CAA TCT TTT AGT TAC GCA ACT ATT AAT ACA GCT TTT ACA       1728Leu Thr Phe Gln Ser Phe Ser Tyr Ala Thr Ile Asn Thr Ala Phe Thr
            565                 570                 575TTC CCA ATG AGC CAG AGT AGT TTC ACA GTA GGT GCT GAT ACT TTT AGT       1776Phe Pro Met Ser Gln Ser Ser Phe Thr Val Gly Ala Asp Thr Phe Ser
        580                 585                 590TCA GGG AAT GAA GTT TAT ATA GAC AGA TTT GAA TTG ATT CCA GTT ACT       1824Ser Gly Asn Glu Val Tyr Ile Asp Arg Phe Glu Leu Ile Pro Val Thr
    595                 600                 605GCA ACA TTT GAA GCA GAA TAT GAT TTA GAA AGA GCA CAA AAG GCG GTG       1872Ala Thr Phe Glu Ala Glu Tyr Asp Leu Glu Arg Ala Gln Lys Ala Val
610                 615                 620AAT GCG CTG TTT ACT TCT ATA AAC CAA ATA GGG ATA AAA ACA GAT GTG       1920Asn Ala Leu Phe Thr Ser Ile Asn Gln Ile Gly Ile Lys Thr Asp Val625                 630                 635                 640ACG GAT TAT CAT ATT GAT CAA GTA TCC AAT TTA GTG GAT TGT TTA TCA       1968Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Asp Cys Leu Ser
            645                 650                 655GAT GAA TTT TGT CTG GAT GAA AAG CGA GAA TTG TCC GAG AAA GTC AAA       2016Asp Glu Phe Cys Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys
        660                 665                 670CAT GCG AAG CGA CTC AGT GAT GAG CGG AAT TTA CTT CAA GAT CCA AAC       2064His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn
    675                 680                 685TTC AAA GGC ATC AAT AGG CAA CTA GAC CGT GGT TGG AGA GGA AGT ACG       2112Phe Lys Gly Ile Asn Arg Gln Leu Asp Arg Gly Trp Arg Gly Ser Thr
690                 695                 700GAT ATT ACC ATC CAA AGA GGA GAT GAC GTA TTC AAA GAA AAT TAT GTC       2160Asp Ile Thr Ile Gln Arg Gly Asp Asp Val Phe Lys Glu Asn Tyr Val705                 710                 715                 720ACA CTA CCA GGT ACC TTT GAT GAG TGC TAT CCA ACA TAT TTG TAT CAA       2208Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln
            725                 730                 735AAA ATC GAT GAA TCA AAA TTA AAA GCC TTT ACC CGT TAT CAA TTA AGA       2256Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg
        740                 745                 750GGG TAT ATC GAA GAT AGT CAA GAC TTA GAA ATC TAT TTA ATT CGC TAC       2304Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr
    755                 760                 765AAT GCA AAA CAT GAA ACA GTA AAT GTG CCA GGT ACG GGT TCC TTA TGG       2352Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp
770                 775                 780CCG CTT TCA GCC CAA AGT CCA ATC GGA AAG TGT GGA GAG CCG AAT CGA       2400Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg785                 790                 795                 800TGC GCG CCA CAC CTT GAA TGG AAT CCT GAC TTA GAT TGT TCG TGT AGG       2448Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg
            805                 810                 815GAT GGA GAA AAG TGT GCC CAT CAT TCG CAT CAT TTC TCC TTA GAC ATT       2496Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile
        820                 825                 830GAT GTA GGA TGT ACA GAC TTA AAT GAG GAC CTA GGT GTA TGG GTG ATC       2544Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile
    835                 840                 845TTT AAG ATT AAG ACG CAA GAT GGG CAC GCA AGA CTA GGG AAT CTA GAG       2592Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu
850                 855                 860TTT CTC GAA GAG AAA CCA TTA GTA GGA GAA GCG CTA GCT CGT GTG AAA       2640Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys865                 870                 875                 880AGA GCG GAG AAA AAA TGG AGA GAC AAA CGT GAA AAA TTG GAA TGG GAA       2688Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu
            885                 890                 895ACA AAT ATC GTT TAT AAA GAG GCA AAA GAA TCT GTA GAT GCT TTA TTT       2736Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe
        900                 905                 910GTA AAC TCT CAA TAT GAT CAA TTA CAA GCG GAT ACG AAT ATT GCC ATG       2784Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met
    915                 920                 925ATT CAT GCG GCA GAT AAA CGT GTT CAT AGC ATT CGA GAA GCT TAT CTG       2832Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu
930                 935                 940CCT GAG CTG TCT GTG ATT CCG GGT GTC AAT GCG GCT ATT TTT GAA GAA       2880Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu945                 950                 955                 960TTA GAA GGG CGT ATT TTC ACT GCA TTC TCC CTA TAT GAT GCG AGA AAT       2928Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn
            965                 970                 975GTC ATT AAA AAT GGT GAT TTT AAT AAT GGC TTA TCC TGC TGG AAC GTG       2976Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val
        980                 985                 990AAA GGG CAT GTA GAT GTA GAA GAA CAA AAC AAC CAA CGT TCG GTC CTT       3024Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu
    995                 1000                1005GTT GTT CCG GAA TGG GAA GCA GAA GTG TCA CAA GAA GTT CGT GTC TGT       3072Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys
1010                1015                1020CCG GGT CGT GGC TAT ATC CTT CGT GTC ACA GCG TAC AAG GAG GGA TAT       3120Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr1025                1030                1035                1040GGA GAA GGT TGC GTA ACC ATT CAT GAG ATC GAG AAC AAT ACA GAC GAA       3168Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr Asp Glu
            1045                1050                1055CTG AAG TTT AGC AAC TGC GTA GAA GAG GAA ATC TAT CCA AAT AAC ACG       3216Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr Pro Asn Asn Thr
        1060                1065                1070GTA ACG TGT AAT GAT TAT ACT GTA AAT CAA GAA GAA TAC GGA GGT GCG       3264Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu Glu Tyr Gly Gly Ala
    1075                1080                1085TAC ACT TCT CGT AAT CGA GGA TAT AAC GAA GCT CCT TCC GTA CCA GCT       3312Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu Ala Pro Ser Val Pro Ala
1090                1095                1100GAT TAT GCG TCA GTC TAT GAA GAA AAA TCG TAT ACA GAT GGA CGA AGA       3360Asp Tyr Ala Ser Val Tyr Glu Glu Lys Ser Tyr Thr Asp Gly Arg Arg1105                1110                1115                1120GAG AAT CCT TGT GAA TTT AAC AGA GGG TAT AGG GAT TAC ACG CCA CTA       3408Glu Asn Pro Cys Glu Phe Asn Arg Gly Tyr Arg Asp Tyr Thr Pro Leu
            1125                1130                1135CCA GTT GGT TAT GTG ACA AAA GAA TTA GAA TAC TTC CCA GAA ACC GAT       3456Pro Val Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp
        1140                1145                1150AAG GTA TGG ATT GAG ATT GGA GAA ACG GAA GGA ACA TTT ATC GTG GAC       3504Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp
    1155                1160                1165AGC GTG GAA TTA CTC CTT ATG GAG GAA                                   3531Ser Val Glu Leu Leu Leu Met Glu Glu
1170                1175(2)SEQ ID NO:10信息:
(i)序列特征:
    (A)长度:1177个氨基酸
    (B)类型:氨基酸
    (D)拓扑学:线性
(ii)分子类型:蛋白
(xi)序列描述:SEQ ID NO:10:Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu1               5                  10                  15Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly
         20                  25                  30Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser
     35                  40                  45Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile
 50                  55                  60Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile65                  70                  75                  80Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
             85                  90                  95Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu
        100                 105                 110Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu
    115                 120                 125Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala
130                 135                 140Ile Pro Leu Phe Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val145                 150                 155                160Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
            165                 170                 175Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg
        180                 185                 190Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val
    195                 200                 205Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg
210                 215                 220Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val225                 230                 235                 240Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro
            245                 250                 255Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val
        260                 265                 270Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Ser Ala Gln Gly Ile Glu
    275                 280                 285Arg Ser Ile Arg Ser Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr
290                 295                 300Ile Tyr Thr Asp Ala His Arg Gly Tyr Tyr Tyr Trp Ser Gly His Gln305                 310                 315                 320Ile Met Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Thr Phe Pro
            325                 330                 335Leu Tyr Gly Thr Met Gly Asn Ala Ala Pro Gln Gln Arg Ile Val Ala
        340                 345                 350Gln Leu Gly Gln Gly Val Tyr Arg Thr Leu Ser Ser Thr Leu Tyr Arg
    355                 360                 365Arg Pro Phe Asn Ile Gly Ile Asn Asn Gln Gln Leu Ser Val Leu Asp
370                 375                 380Gly Thr Glu Phe Ala Tyr Gly Thr Ser Ser Asn Leu Pro Ser Ala Val385                 390                 395                 400Tyr Arg Lys Ser Gly Thr Val Asp Ser Leu Asp Glu Ile Pro Pro Gln
            405                 410                 415Asn Asn Asn Val Pro Pro Arg Gln Gly Phe Ser His Arg Leu Ser His
        420                 425                 430Val Ser Met Phe Arg Ser Gly Phe Ser Asn Ser Ser Val Ser Ile Ile
    435                 440                 445Arg Ala Pro Met Phe Ser Trp Thr His Arg Ser Ala Thr Pro Thr Asn
450                 455                 460Thr Ile Asp Pro Glu Arg Ile Thr Gln Ile Pro Leu Val Lys Ala His465                 470                 475                 480Thr Leu Gln Ser Gly Thr Thr Val Val Arg Gly Pro Gly Phe Thr Gly
            485                 490                 495Gly Asp Ile Leu Arg Arg Tnr Ser Gly Gly Pro Phe Ala Tyr Thr Ile
        500                 505                 510Val Asn Ile Asn Gly Gln Leu Pro Gln Arg Tyr Arg Ala Arg Ile Arg
    515                 520                 525Tyr Ala Ser Thr Thr Asn Leu Arg Ile Tyr Val Thr Val Ala Gly Glu
530                 535                 540Arg Ile Phe Ala Gly Gln Phe Asn Lys Thr Met Asp Thr Gly Asp Pro545                 550                 555                 560Leu Thr Phe Gln Ser Phe Ser Tyr Ala Thr Ile Asn Thr Ala Phe Thr
            565                  570                575Phe Pro Met Ser Gln Ser Ser Phe Thr Val Gly Ala Asp Thr Phe Ser
        580                 585                 590Ser Gly Asn Glu Val Tyr Ile Asp Arg Phe Glu Leu Ile Pro Val Thr
    595                 600                 605Ala Thr Phe Glu Ala Glu Tyr Asp Leu Glu Arg Ala Gln Lys Ala Val
610                 615                 620Asn Ala Leu Phe Thr Ser Ile Asn Gln Ile Gly Ile Lys Thr Asp Val625                 630                 635                 640Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Asp Cys Leu Ser
            645                 650                 655Asp Glu Phe Cys Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys
        660                 665                 670His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn
    675                 680                 685Phe Lys Gly Ile Asn Arg Gln Leu Asp Arg Gly Trp Arg Gly Ser Thr
690                 695                 700Asp Ile Thr Ile Gln Arg Gly Asp Asp Val Phe Lys Glu Asn Tyr Val705                 710                 715                 720Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln
            725                 730                 735Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg
        740                 745                 750Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr
    755                 760                 765Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp
770                 775                 780Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg785                 790                 795                 800Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg
            805                 810                 815Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile
        820                 825                 830Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile
    835                 840                 845Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu
850                 855                 860Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys865                 870                 875                 880Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu
            885                 890                 895Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe
        900                 905                 910Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met
    915                 920                 925Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu
930                 935                 940Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu945                 950                 955                 960Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn
            965                 970                 975Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val
        980                 985                 990Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu
    995                 1000                1005Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys
1010                1015                1020Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr1025                1030                1035                1040Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr Asp Glu
            1045                1050                1055Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr Pro Asn Asn Thr
        1060                1065                1070Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu Glu Tyr Gly Gly Ala
    1075                1080                1085Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu Ala Pro Ser Val Pro Ala
1090                1095                1100Asp Tyr Ala Ser Val Tyr Glu Glu Lys Ser Tyr Thr Asp Gly Arg Arg1105                1110                1115                1120Glu Asn Pro Cys Glu Phe Asn Arg Gly Tyr Arg Asp Tyr Thr Pro Leu
            1125                1130                1135Pro Val Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp
        1140                1145                1150Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp
    1155                1160                1165Ser Val Glu Leu Leu Leu Met Glu Glu
1170                1175(2)SEQ ID NO:11信息:
(i)序列特征:
    (A)长度:3531个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑学:线性
(ix)特征:
    (A)名字/关键:CDS
    (B)位置:1..3531
(xi)序列描述:SEQ ID NO:11:ATG GAT AAC AAT CCG AAC ATC AAT GAA TGC ATT CCT TAT AAT TGT TTA         48Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu1               5                  10                  15AGT AAC CCT GAA GTA GAA GTA TTA GGT GGA GAA AGA ATA GAA ACT GGT         96Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly
         20                  25                  30TAC ACC CCA ATC GAT ATT TCC TTG TCG CTA ACG CAA TTT CTT TTG AGT        144Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser
     35                  40                  45GAA TTT GTT CCC GGT GCT GGA TTT GTG TTA GGA CTA GTT GAT ATA ATA        192Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile
 50                  55                  60TGG GGA ATT TTT GGT CCC TCT CAA TGG GAC GCA TTT CTT GTA CAA ATT        240Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile65                  70                  75                  80GAA CAG TTA ATT AAC CAA AGA ATA GAA GAA TTC GCT AGG AAC CAA GCC        288Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
             85                  90                  95ATT TCT AGA TTA GAA GGA CTA AGC AAT CTT TAT CAA ATT TAC GCA GAA        336Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu
        100                 105                 110TCT TTT AGA GAG TGG GAA GCA GAT CCT ACT AAT CCA GCA TTA AGA GAA        384Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu
    115                 120                 125GAG ATG CGT ATT CAA TTC AAT GAC ATG AAC AGT GCC CTT ACA ACC GCT        432Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala
130                 135                 140ATT CCT CTT TTT GCA GTT CAA AAT TAT CAA GTT CCT CTT TTA TCA GTA        480Ile Pro Leu Phe Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val145                 150                 155                 160TAT GTT CAA GCT GCA AAT TTA CAT TTA TCA GTT TTG AGA GAT GTT TCA        528Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
            165                 170                 175GTG TTT GGA CAA AGG TGG GGA TTT GAT GCC GCG ACT ATC AAT AGT CGT         576Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg
        180                 185                 190TAT AAT GAT TTA ACT AGG CTT ATT GGC AAC TAT ACA GAT TAT GCT GTA         624Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val
    195                 200                 205CGC TGG TAC AAT ACG GGA TTA GAA CGT GTA TGG GGA CCG GAT TCT AGA         672Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg
210                 215                 220GAT TGG GTA AGG TAT AAT CAA TTT AGA AGA GAA TTA ACA CTA ACT GTA         720Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val225                 230                 235                 240TTA GAT ATC GTT GCT CTG TTC CCG AAT TAT GAT AGT AGA AGA TAT CCA         768Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro
            245                 250                 255ATT CGA ACA GTT TCC CAA TTA ACA AGA GAA ATT TAT ACA AAC CCA GTA         816Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val
        260                 265                 270TTA GAA AAT TTT GAT GGT AGT TTT CGA GGC TCG GCT CAG GGC ATA GAA         864Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Ser Ala Gln Gly Ile Glu
    275                 280                 285AGA AGT ATT AGG AGT CCA CAT TTG ATG GAT ATA CTT AAC AGT ATA ACC         912Arg Ser Ile Arg Ser Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr
290                 295                 300ATC TAT ACG GAT GCT CAT AGG GGT TAT TAT TAT TGG TCA GGG CAT CAA         960Ile Tyr Thr Asp Ala His Arg Gly Tyr Tyr Tyr Trp Ser Gly His Gln305                 310                 315                 320ATA ATG GCT TCT CCT GTA GGG TTT TCG GGG CCA GAA TTC ACT TTT CCG        1008Ile Met Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Thr Phe Pro
            325                 330                 335CTA TAT GGA ACT ATG GGA AAT GCA GCT CCA CAA CAA CGT ATT GTT GCT        1056Leu Tyr Gly Thr Met Gly Asn Ala Ala Pro Gln Gln Arg Ile Val Ala
        340                 345                 350CAA CTA GGT CAG GGC GTG TAT AGA ACA TTA TCG TCC ACT TTA TAT AGA        1104Gln Leu Gly Gln Gly Val Tyr Arg Thr Leu Ser Ser Thr Leu Tyr Arg
    355                 360                 365AGA CCT TTT AAT ATA GGG ATA AAT AAT CAA CAA CTA TCT GTT CTT GAC        1152Arg Pro Phe Asn Ile Gly Ile Asn Asn Gln Gln Leu Ser Val Leu Asp
370                 375                 380GGG ACA GAA TTT GCT TAT GGA ACC TCC TCA AAT TTG CCA TCC GCT GTA        1200Gly Thr Glu Phe Ala Tyr Gly Thr Ser Ser Asn Leu Pro Ser Ala Val385                 390                 395                 400TAC AGA AAA AGC GGA ACG GTA GAT TCG CTG GAT GAA ATA CCG CCA CAG        1248Tyr Arg Lys Ser Gly Thr Val Asp Ser Leu Asp Glu Ile Pro Pro Gln
            405                 410                 415AAT AAC AAC GTG CCA CCT AGG CAA GGA TTT AGT CAT CGA TTA AGC CAT        1298Asn Asn Asn Val Pro Pro Arg Gln Gly Phe Ser His Arg Leu Ser His
        420                 425                 430GTT TCA ATG TTT CGT TCA GGC TTT AGT AAT AGT AGT GTA AGT ATA ATA        1344Val Ser Met Phe Arg Ser Gly Phe Ser Asn Ser Ser Val Ser Ile Ile
    435                 440                 445AGA GCT CCA ATG TTT TCT TGG ACG CAC CGT AGT GCA ACC CCT ACA AAT        1392Arg Ala Pro Met Phe Ser Trp Thr His Arg Ser Ala Thr Pro Thr Asn
450                 455                 460ACA ATT GAT CCG GAG AGG ATT ACT CAA ATA CCA TTG GTA AAA GCA CAT        1440Thr Ile Asp Pro Glu Arg Ile Thr Gln Ile Pro Leu Val Lys Ala His465                 470                 475                 480ACA CTT CAG TCA GGT ACT ACT GTT GTA AGA GGG CCC GGG TTT ACG GGA        1488Thr Leu Gln Ser Gly Thr Thr Val Val Arg Gly Pro Gly Phe Thr Gly
            485                 490                 495GGA GAT ATT CTT CGA CGA ACA AGT GGA GGA CCA TTT GCT TAT ACT ATT        1536Gly Asp Ile Leu Arg Arg Thr Ser Gly Gly Pro Phe Ala Tyr Thr Ile
        500                 505                 510GTT AAT ATA AAT GGG CAA TTA CCC CAA AGG TAT CGT GCA AGA ATA CGC        1584Val Asn Ile Asn Gly Gln Leu Pro Gln Arg Tyr Arg Ala Arg Ile Arg
    515                 520                 525TAT GCC TCT ACT ACA AAT CTA AGA ATT TAC GTA ACG GTT GCA GGT GAA        1632Tyr Ala Ser Thr Thr Asn Leu Arg Ile Tyr Val Thr Val Ala Gly Glu
530                 535                 540CGG ATT TTT GCT GGT CAA TTT AAC AAA ACA ATG GAT ACC GGT GAC CCA        1680Arg Ile Phe Ala Gly Gln Phe Asn Lys Thr Met Asp Thr Gly Asp Pro545                 550                 555                 560TTA ACA TTC CAA TCT TTT AGT TAC GCA ACT ATT AAT ACA GCT TTT ACA        1728Leu Thr Phe Gln Ser Phe Ser Tyr Ala Thr Ile Asn Thr Ala Phe Thr
            565                 570                 575TTC CCA ATG AGC CAG AGT AGT TTC ACA GTA GGT GCT GAT ACT TTT AGT        1776Phe Pro Met Ser Gln Ser Ser Phe Thr Val Gly Ala Asp Thr Phe Ser
        580                 585                 590TCA GGG AAT GAA GTT TAT ATA GAC AGA TTT GAA TTG ATT CCA GTT ACT        1824Ser Gly Asn Glu Val Tyr Ile Asp Arg Phe Glu Leu Ile Pro Val Thr
    595                 600                 605GCA ACA CTC GAG GCT GAA TAT AAT CTG GAA AGA GCG CAG AAG GCG GTG        1872Ala Thr Leu Glu Ala Glu Tyr Asn Leu Glu Arg Ala Gln Lys Ala Val
610                 615                 620AAT GCG CTG TTT ACG TCT ACA AAC CAA CTA GGG CTA AAA ACA AAT GTA       1920Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Leu Lys Thr Asn Val625                 630                 635                 640ACG GAT TAT CAT ATT GAT CAA GTG TCC AAT TTA GTT ACG TAT TTA TCG       1968Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Thr Tyr Leu Ser
            645                 650                 655GAT GAA TTT TGT CTG GAT GAA AAG CGA GAA TTG TCC GAG AAA GTC AAA       2016Asp Glu Phe Cys Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys
        660                 665                 670CAT GCG AAG CGA CTC AGT GAT GAA CGC AAT TTA CTC CAA GAT TCA AAT       2064His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Ser Asn
    675                 680                 685TTC AAA GAC ATT AAT AGG CAA CCA GAA CGT GGG TGG GGC GGA AGT ACA       2112Phe Lys Asp Ile Asn Arg Gln Pro Glu Arg Gly Trp Gly Gly Ser Thr
690                 695                 700GGG ATT ACC ATC CAA GGA GGG GAT GAC GTA TTT AAA GAA AAT TAC GTC       2160Gly Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val705                 710                 715                 720ACA CTA TCA GGT ACC TTT GAT GAG TGC TAT CCA ACA TAT TTG TAT CAA       2208Thr Leu Ser Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln
            725                 730                 735AAA ATC GAT GAA TCA AAA TTA AAA GCC TTT ACC CGT TAT CAA TTA AGA       2256Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg
        740                 745                 750GGG TAT ATC GAA GAT AGT CAA GAC TTA GAA ATC TAT TTA ATT CGC TAC       2304Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr
    755                 760                 765AAT GCA AAA CAT GAA ACA GTA AAT GTG CCA GGT ACG GGT TCC TTA TGG       2352Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp
770                 775                 780CCG CTT TCA GCC CAA AGT CCA ATC GGA AAG TGT GGA GAG CCG AAT CGA       2400Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg785                 790                 795                 800TGC GCG CCA CAC CTT GAA TGG AAT CCT GAC TTA GAT TGT TCG TGT AGG       2448Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg
            805                 810                 815GAT GGA GAA AAG TGT GCC CAT CAT TCG CAT CAT TTC TCC TTA GAC ATT       2496Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile
        820                 825                 830GAT GTA GGA TGT ACA GAC TTA AAT GAG GAC CTA GGT GTA TGG GTG ATC       2544Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile
    835                 840                 845TTT AAG ATT AAG ACG CAA GAT GGG CAC GCA AGA CTA GGG AAT CTA GAG       2592Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu
850                 855                 860TTT CTC GAA GAG AAA CCA TTA GTA GGA GAA GCG CTA GCT CGT GTG AAA       2640Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys865                 870                 875                 880AGA GCG GAG AAA AAA TGG AGA GAC AAA CGT GAA AAA TTG GAA TGG GAA       2688Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu
            885                 890                 895ACA AAT ATC GTT TAT AAA GAG GCA AAA GAA TCT GTA GAT GCT TTA TTT       2736Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe
        900                 905                 910GTA AAC TCT CAA TAT GAT CAA TTA CAA GCG GAT ACG AAT ATT GCC ATG       2784Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met
    915                 920                 925ATT CAT GCG GCA GAT AAA CGT GTT CAT AGC ATT CGA GAA GCT TAT CTG       2832Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu
930                 935                 940CCT GAG CTG TCT GTG ATT CCG GGT GTC AAT GCG GCT ATT TTT GAA GAA       2880Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu945                 950                 955                 960TTA GAA GGG CGT ATT TTC ACT GCA TTC TCC CTA TAT GAT GCG AGA AAT       2928Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn
            965                 970                 975GTC ATT AAA AAT GGT GAT TTT AAT AAT GGC TTA TCC TGC TGG AAC GTG       2976Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val
        980                 985                 990AAA GGG CAT GTA GAT GTA GAA GAA CAA AAC AAC CAA CGT TCG GTC CTT       3024Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu
    995                 1000                1005GTT GTT CCG GAA TGG GAA GCA GAA GTG TCA CAA GAA GTT CGT GTC TGT       3072Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys
1010                1015                1020CCG GGT CGT GGC TAT ATC CTT CGT GTC ACA GCG TAC AAG GAG GGA TAT       3120Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr1025                1030                1035                1040GGA GAA GGT TGC GTA ACC ATT CAT GAG ATC GAG AAC AAT ACA GAC GAA       3168Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr Asp Glu
            1045                1050                1055CTG AAG TTT AGC AAC TGC GTA GAA GAG GAA ATC TAT CCA AAT AAC ACG       3216Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr Pro Asn Asn Thr
        1060                1065                1070GTA ACG TGT AAT GAT TAT ACT GTA AAT CAA GAA GAA TAC GGA GGT GCG       3264Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu Glu Tyr Gly Gly Ala
    1075                1080                1085TAC ACT TCT CGT AAT CGA GGA TAT AAC GAA GCT CCT TCC GTA CCA GCT       3312Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu Ala Pro Ser Val Pro Ala
1090                1095                1100GAT TAT GCG TCA GTC TAT GAA GAA AAA TCG TAT ACA GAT GGA CGA AGA       3360Asp Tyr Ala Ser Val Tyr Glu Glu Lys Ser Tyr Thr Asp Gly Arg Arg1105                1110                1115                1120GAG AAT CCT TGT GAA TTT AAC AGA GGG TAT AGG GAT TAC ACG CCA CTA       3408Glu Asn Pro Cys Glu Phe Asn Arg Gly Tyr Arg Asp Tyr Thr Pro Leu
            1125                1130                1135CCA GTT GGT TAT GTG ACA AAA GAA TTA GAA TAC TTC CCA GAA ACC GAT       3456Pro Val Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp
        1140                1145                1150AAG GTA TGG ATT GAG ATT GGA GAA ACG GAA GGA ACA TTT ATC GTG GAC       3504Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp
    1155                1160                1165AGC GTG GAA TTA CTC CTT ATG GAG GAA                                   3531Ser Val Glu Leu Leu Leu Met Glu Glu
1170                1175(2)SEQ ID NO:12信息:
(i)序列特征:
    (A)长度:1177个氨基酸
    (B)类型:氨基酸
    (D)拓扑学:线性
(ii)分子类型:蛋白
(xi)序列描述:SEQ ID NO:12:Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu1               5                  10                  15Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly
         20                  25                  30Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser
     35                  40                  45Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile
 50                  55                  60Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile65                  70                  75                  80Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
             85                  90                  95Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu
        100                 105                 110Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu
    115                 120                 125Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala
130                 135                 140Ile Pro Leu Phe Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val145                 150                 155                 160Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
            165                 170                 175Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg
        180                 185                 190Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val
    195                 200                 205Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg
210                 215                 220Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val225                 230                 235                 240Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro
            245                 250                 255Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val
        260                 265                 270Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Ser Ala Gln Gly Ile Glu
    275                 280                 285Arg Ser Ile Arg Ser Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr
290                 295                 300Ile Tyr Thr Asp Ala His Arg Gly Tyr Tyr Tyr Trp Ser Gly His Gln305                 310                 3l5                 320Ile Met Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Thr Phe Pro
            325                 330                 335Leu Tyr Gly Thr Met Gly Asn Ala Ala Pro Gln Gln Arg Ile Val Ala
        340                 345                 350Gln Leu Gly Gln Gly Val Tyr Arg Thr Leu Ser Ser Thr Leu Tyr Arg
    355                 360                 365Arg Pro Phe Asn Ile Gly Ile Asn Asn Gln Gln Leu Ser Val Leu Asp
370                 375                 380Gly Thr Glu Phe Ala Tyr Gly Thr Ser Ser Asn Leu Pro Ser Ala Val385                 390                 395                 400Tyr Arg Lys Ser Gly Thr Val Asp Ser Leu Asp Glu Ile Pro Pro Gln
            405                 410                 415Asn Asn Asn Val Pro Pro Arg Gln Gly Phe Ser His Arg Leu Ser His
        420                 425                 430Val Ser Met Phe Arg Ser Gly Phe Ser Asn Ser Ser Val Ser Ile Ile
    435                 440                 445Arg Ala Pro Met Phe Ser Trp Thr His Arg Ser Ala Thr Pro Thr Asn
450                 455                 460Thr Ile Asp Pro Glu Arg Ile Thr Gln Ile Pro Leu Val Lys Ala His465                 470                 475                 480Thr Leu Gln Ser Gly Thr Thr Val Val Arg Gly Pro Gly Phe Thr Gly
            485                 490                 495Gly Asp Ile Leu Arg Arg Thr Ser Gly Gly Pro Phe Ala Tyr Thr Ile
        500                 505                 5l0Val Asn Ile Asn Gly Gln Leu Pro Gln Arg Tyr Arg Ala Arg Ile Arg
    515                 520                 525Tyr Ala Ser Thr Thr Asn Leu Arg Ile Tyr Val Thr Val Ala Gly Glu
530                 535                 540Arg Ile Phe Ala Gly Gln Phe Asn Lys Thr Met Asp Thr Gly Asp Pro545                 550                 555                 560Leu Thr Phe Gln Ser Phe Ser Tyr Ala Thr Ile Asn Thr Ala Phe Thr
            565                 570                 575Phe Pro Met Ser Gln Ser Ser Phe Thr Val Gly Ala Asp Thr Phe Ser
        580                 585                 590Ser Gly Asn Glu Val Tyr Ile Asp Arg Phe Glu Leu Ile Pro Val Thr
    595                 600                 605Ala Thr Leu Glu Ala Glu Tyr Asn Leu Glu Arg Ala Gln Lys Ala Val
610                 615                 620Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Leu Lys Thr Asn Val625                 630                 635                 640Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Thr Tyr Leu Ser
            645                 650                 655Asp Glu Phe Cys Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys
        660                 665                 670His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Ser Asn
    675                 680                 685Phe Lys Asp Ile Asn Arg Gln Pro Glu Arg Gly Trp Gly Gly Ser Thr
690                 695                 700Gly Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val705                 710                 715                 720Thr Leu Ser Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln
            725                 730                 735Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg
        740                 745                 750Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr
    755                 760                 765Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp
770                 775                 780Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg785                 790                 795                 800Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg
            805                 810                 815Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile
        820                 825                 830Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile
    835                 840                 845Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu
850                 855                 860Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys865                 870                 875                 880Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu
            885                 890                 895Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe
        900                 905                 910Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met
    915                 920                 925Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu
930                 935                 940Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu945                 950                 955                 960Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn
            965                 970                 975Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val
        980                 985                 990Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu
    995                 1000                1005Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys
1010                1015                1020Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr1025                1030                1035                1040Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr Asp Glu
            1045                1050                1055Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr Pro Asn Asn Thr
        1060                1065                1070Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu Glu Tyr Gly Gly Ala
    1075                1080                1085Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu Ala Pro Ser Val Pro Ala
1090                1095                1100Asp Tyr Ala Ser Val Tyr Glu Glu Lys Ser Tyr Thr Asp Gly Arg Arg1105                1110                1115                1120Glu Asn Pro Cys Glu Phe Asn Arg Gly Tyr Arg Asp Tyr Thr Pro Leu
            1125                1130                1135Pro Val Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp
        1140                1145                1150Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp
    1155                1160                1165Ser Val Glu Leu Leu Leu Met Glu Glu
1170                1175(2)SEQ ID NO:13信息:
(i)序列特征:
    (A)长度:3531个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑学:线性
(ix)特征:
    (A)名字/关键:CDS
    (B)位置:1..3531
(xi)序列描述:SEQ ID NO:13:ATG GAT AAC AAT CCG AAC ATC AAT GAA TGC ATT CCT TAT AAT TGT TTA          48Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu1               5                  10                  15AGT AAC CCT GAA GTA GAA GTA TTA GGT GGA GAA AGA ATA GAA ACT GGT           96Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly
         20                  25                  30TAC ACC CCA ATC GAT ATT TCC TTG TCG CTA ACG CAA TTT CTT TTG AGT          144Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser
     35                  40                  45GAA TTT GTT CCC GGT GCT GGA TTT GTG TTA GGA CTA GTT GAT ATA ATA          192Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile
 50                  55                  60TGG GGA ATT TTT GGT CCC TCT CAA TGG GAC GCA TTT CTT GTA CAA ATT          240Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile65                  70                  75                  80GAA CAG TTA ATT AAC CAA AGA ATA GAA GAA TTC GCT AGG AAC CAA GCC          288Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
             85                  90                  95ATT TCT AGA TTA GAA GGA CTA AGC AAT CTT TAT CAA ATT TAC GCA GAA          336Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu
        100                 105                 110TCT TTT AGA GAG TGG GAA GCA GAT CCT ACT AAT CCA GCA TTA AGA GAA          384Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu
    115                 120                 125GAG ATG CGT ATT CAA TTC AAT GAC ATG AAC AGT GCC CTT ACA ACC GCT          432Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala
130                 135                 140ATT CCT CTT TTT GCA GTT CAA AAT TAT CAA GTT CCT CTT TTA TCA GTA          480Ile Pro Leu Phe Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val145                 150                 155                 160TAT GTT CAA GCT GCA AAT TTA CAT TTA TCA GTT TTG AGA GAT GTT TCA          528Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
            165                 170                 175GTG TTT GGA CAA AGG TGG GGA TTT GAT GCC GCG ACT ATC AAT AGT CGT          576Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg
        180                 185                 190TAT AAT GAT TTA ACT AGG CTT ATT GGC AAC TAT ACA GAT CAT GCT GTA          624Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp His Ala Val
    195                 200                 205CGC TGG TAC AAT ACG GGA TTA GAG CGT GTA TGG GGA CCG GAT TCT AGA          672Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg
210                 215                 220GAT TGG ATA AGA TAT AAT CAA TTT AGA AGA GAA TTA ACA CTA ACT GTA          720Asp Trp Ile Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val225                 230                 235                 240TTA GAT ATC GTT TCT CTA TTT CCG AAC TAT GAT AGT AGA ACG TAT CCA        768Leu Asp Ile Val Ser Leu Phe Pro Asn Tyr Asp Ser Arg Thr Tyr Pro
            245                 250                 255ATT CGA ACA GTT TCC CAA TTA ACA AGA GAA ATT TAT ACA AAC CCA GTA        816Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val
        260                 265                 270TTA GAA AAT TTT GAT GGT AGT TTT CGA GGC TCG GCT CAG GGC ATA GAA        864Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Ser Ala Gln Gly Ile Glu
    275                 280                 285GGA AGT ATT AGG AGT CCA CAT TTG ATG GAT ATA CTT AAC AGT ATA ACC        912Gly Ser Ile Arg Ser Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr
290                 295                 300ATC TAT ACG GAT GCT CAT AGA GGA GAA TAT TAT TGG TCA GGG CAT CAA        960Ile Tyr Thr Asp Ala His Arg Gly Glu Tyr Tyr Trp Ser Gly His Gln305                 310                 315                 320ATA ATG GCT TCT CCT GTA GGG TTT TCG GGG CCA GAA TTC ACT TTT CCG       1008Ile Met Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Thr Phe Pro
            325                 330                 335CTA TAT GGA ACT ATG GGA AAT GCA GCT CCA CAA CAA CGT ATT GTT GCT       1056Leu Tyr Gly Thr Met Gly Asn Ala Ala Pro Gln Gln Arg Ile Val Ala
        340                 345                 350CAA CTA GGT CAG GGC GTG TAT AGA ACA TTA TCG TCC ACT TTA TAT AGA       1104Gln Leu Gly Gln Gly Val Tyr Arg Thr Leu Ser Ser Thr Leu Tyr Arg
    355                 360                 365AGA CCT TTT AAT ATA GGG ATA AAT AAT CAA CAA CTA TCT GTT CTT GAC       1152Arg Pro Phe Asn Ile Gly Ile Asn Asn Gln Gln Leu Ser Val Leu Asp
370                 375                 380GGG ACA GAA TTT GCT TAT GGA ACC TCC TCA AAT TTG CCA TCC GCT GTA       1200Gly Thr Glu Phe Ala Tyr Gly Thr Ser Ser Asn Leu Pro Ser Ala Val385                 390                 395                 400TAC AGA AAA AGC GGA ACG GTA GAT TCG CTG GAT GAA ATA CCG CCA CAG       1248Tyr Arg Lys Ser Gly Thr Val Asp Ser Leu Asp Glu Ile Pro Pro Gln
            405                 410                 415AAT AAC AAC GTG CCA CCT AGG CAA GGA TTT AGT CAT CGA TTA AGC CAT       1296Asn Asn Asn Val Pro Pro Arg Gln Gly Phe Ser His Arg Leu Ser His
        420                 425                 430GTT TCA ATG TTT CGT TCA GGC TTT AGT AAT AGT AGT GTA AGT ATA ATA       1344Val Ser Met Phe Arg Ser Gly Phe Ser Asn Ser Ser Val Ser Ile Ile
    435                 440                 445AGA GCT CCA ATG TTT TCT TGG ACG CAC CGT AGT GCA ACC CCT ACA AAT       1392Arg Ala Pro Met Phe Ser Trp Thr His Arg Ser Ala Thr Pro Thr Asn
450                 455                 460ACA ATT GAT CCG GAG AGG ATT ACT CAA ATA CCA TTG GTA AAA GCA CAT      1440Thr Ile Asp Pro Glu Arg Ile Thr Gln Ile Pro Leu Val Lys Ala His465                 470                 475                 480ACA CTT CAG TCA GGT ACT ACT GTT GTA AGA GGG CCC GGG TTT ACG GGA      1488Thr Leu Gln Ser Gly Thr Thr Val Val Arg Gly Pro Gly Phe Thr Gly
            485                 490                 495GGA GAT ATT CTT CGA CGA ACA AGT GGA GGA CCA TTT GCT TAT ACT ATT      1536Gly Asp Ile Leu Arg Arg Thr Ser Gly Gly Pro Phe Ala Tyr Thr Ile
        500                 505                 510GTT AAT ATA AAT GGG CAA TTA CCC CAA AGG TAT CGT GCA AGA ATA CGC      1584Val Asn Ile Asn Gly Gln Leu Pro Gln Arg Tyr Arg Ala Arg Ile Arg
    515                 520                 525TAT GCC TCT ACT ACA AAT CTA AGA ATT TAC GTA ACG GTT GCA GGT GAA      1632Tyr Ala Ser Thr Thr Asn Leu Arg Ile Tyr Val Thr Val Ala Gly Glu
530                 535                 540CGG ATT TTT GCT GGT CAA TTT AAC AAA ACA ATG GAT ACC GGT GAC CCA      1680Arg Ile Phe Ala Gly Gln Phe Asn Lys Thr Met Asp Thr Gly Asp Pro545                 550                 555                 560TTA ACA TTC CAA TCT TTT AGT TAC GCA ACT ATT AAT ACA GCT TTT ACA      1728Leu Thr Phe Gln Ser Phe Ser Tyr Ala Thr Ile Asn Thr Ala Phe Thr
            565                 570                 575TTC CCA ATG AGC CAG AGT AGT TTC ACA GTA GGT GCT GAT ACT TTT AGT      1776Phe Pro Met Ser Gln Ser Ser Phe Thr Val Gly Ala Asp Thr Phe Ser
        580                 585                 590TCA GGG AAT GAA GTT TAT ATA GAC AGA TTT GAA TTG ATT CCA GTT ACT      1824Ser Gly Asn Glu Val Tyr Ile Asp Arg Phe Glu Leu Ile Pro Val Thr
    595                 600                 605GCA ACA TTT GAA GCA GAA TAT GAT TTA GAA AGA GCA CAA AAG GCG GTG      1872Ala Thr Phe Glu Ala Glu Tyr Asp Leu Glu Arg Ala Gln Lys Ala Val
610                 615                 620AAT GCG CTG TTT ACT TCT ATA AAC CAA ATA GGG ATA AAA ACA GAT GTG      1920Asn Ala Leu Phe Thr Ser Ile Asn Gln Ile Gly Ile Lys Thr Asp Val625                 630                 635                 640ACG GAT TAT CAT ATT GAT CAA GTA TCC AAT TTA GTG GAT TGT TTA TCA      1968Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Asp Cys Leu Ser
            645                 650                 655GAT GAA TTT TGT CTG GAT GAA AAG CGA GAA TTG TCC GAG AAA GTC AAA      2016Asp Glu Phe Cys Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys
        660                 665                 670CAT GCG AAG CGA CTC AGT GAT GAG CGG AAT TTA CTT CAA GAT CCA AAC      2064His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn
    675                 680                 685TTC AAA GGC ATC AAT AGG CAA CTA GAC CGT GGT TGG AGA GGA AGT ACG         2112Phe Lys Gly Ile Asn Arg Gln Leu Asp Arg Gly Trp Arg Gly Ser Thr
690                 695                 700GAT ATT ACC ATC CAA AGA GGA GAT GAC GTA TTC AAA GAA AAT TAT GTC         2160Asp Ile Thr Ile Gln Arg Gly Asp Asp Val Phe Lys Glu Asn Tyr Val705                 710                 715                 720ACA CTA CCA GGT ACC TTT GAT GAG TGC TAT CCA ACA TAT TTG TAT CAA         2208Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln
            725                 730                 735AAA ATC GAT GAA TCA AAA TTA AAA GCC TTT ACC CGT TAT CAA TTA AGA         2256Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg
        740                 745                 750GGG TAT ATC GAA GAT AGT CAA GAC TTA GAA ATC TAT TTA ATT CGC TAC         2304Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr
    755                 760                 765AAT GCA AAA CAT GAA ACA GTA AAT GTG CCA GGT ACG GGT TCC TTA TGG         2352Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp
770                 775                 780CCG CTT TCA GCC CAA AGT CCA ATC GGA AAG TGT GGA GAG CCG AAT CGA         2400Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg785                 790                 795                 800TGC GCG CCA CAC CTT GAA TGG AAT CCT GAC TTA GAT TGT TCG TGT AGG         2448Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg
            805                 810                 815GAT GGA GAA AAG TGT GCC CAT CAT TCG CAT CAT TTC TCC TTA GAC ATT         2496Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile
        820                 825                 830GAT GTA GGA TGT ACA GAC TTA AAT GAG GAC CTA GGT GTA TGG GTG ATC         2544Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile
    835                 840                 845TTT AAG ATT AAG ACG CAA GAT GGG CAC GCA AGA CTA GGG AAT CTA GAG         2592Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu
850                 855                 860TTT CTC GAA GAG AAA CCA TTA GTA GGA GAA GCG CTA GCT CGT GTG AAA         2640Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys865                 870                 875                 880AGA GCG GAG AAA AAA TGG AGA GAC AAA CGT GAA AAA TTG GAA TGG GAA         2688Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu
            885                 890                 895ACA AAT ATC GTT TAT AAA GAG GCA AAA GAA TCT GTA GAT GCT TTA TTT         2736Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe
        900                 905                 910GTA AAC TCT CAA TAT GAT CAA TTA CAA GCG GAT ACG AAT ATT GCC ATG       2784Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met
    915                 920                 925ATT CAT GCG GCA GAT AAA CGT GTT CAT AGC ATT CGA GAA GCT TAT CTG       2832Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu
930                 935                 940CCT GAG CTG TCT GTG ATT CCG GGT GTC AAT GCG GCT ATT TTT GAA GAA       2880Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu945                 950                 955                 960TTA GAA GGG CGT ATT TTC ACT GCA TTC TCC CTA TAT GAT GCG AGA AAT       2928Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn
            965                 970                 975GTC ATT AAA AAT GGT GAT TTT AAT AAT GGC TTA TCC TGC TGG AAC GTG       2976Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val
        980                 985                 990AAA GGG CAT GTA GAT GTA GAA GAA CAA AAC AAC CAA CGT TCG GTC CTT       3024Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu
    995                 1000                1005GTT GTT CCG GAA TGG GAA GCA GAA GTG TCA CAA GAA GTT CGT GTC TGT       3072Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys
1010                1015                1020CCG GGT CGT GGC TAT ATC CTT CGT GTC ACA GCG TAC AAG GAG GGA TAT       3120Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr1025                1030                1035                1040GGA GAA GGT TGC GTA ACC ATT CAT GAG ATC GAG AAC AAT ACA GAC GAA       3168Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr Asp Glu
            1045                1050                1055CTG AAG TTT AGC AAC TGC GTA GAA GAG GAA ATC TAT CCA AAT AAC ACG       3216Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr Pro Asn Asn Thr
        1060                1065                1070GTA ACG TGT AAT GAT TAT ACT GTA AAT CAA GAA GAA TAC GGA GGT GCG       3264Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu Glu Tyr Gly Gly Ala
    1075                1080                1085TAC ACT TCT CGT AAT CGA GGA TAT AAC GAA GCT CCT TCC GTA CCA GCT       3312Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu Ala Pro Ser Val Pro Ala
1090                1095                1100GAT TAT GCG TCA GTC TAT GAA GAA AAA TCG TAT ACA GAT GGA CGA AGA       3360Asp Tyr Ala Ser Val Tyr Glu Glu Lys Ser Tyr Thr Asp Gly Arg Arg1105                1110                1115                1120GAG AAT CCT TGT GAA TTT AAC AGA GGG TAT AGG GAT TAC ACG CCA CTA       3408Glu Asn Pro Cys Glu Phe Asn Arg Gly Tyr Arg Asp Tyr Thr Pro Leu
            1125                1130                1135CCA GTT GGT TAT GTG ACA AAA GAA TTA GAA TAC TTC CCA GAA ACC GAT       3456Pro Val Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp
        1140                1145                1150AAG GTA TGG ATT GAG ATT GGA GAA ACG GAA GGA ACA TTT ATC GTG GAC       3504Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp
    1155                1160                1165AGC GTG GAA TTA CTC CTT ATG GAG GAA                                   3531Ser Val Glu Leu Leu Leu Met Glu Glu
1170                1175(2)SEQ ID NO:14信息:
(i)序列特征:
    (A)长度:1177个氨基酸
    (B)类型:氨基酸
    (D)拓扑学:线性
(ii)分子类型:蛋白
(xi)序列描述:SEQ ID NO:14:Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu1               5                  10                  15Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly
         20                  25                  30Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser
     35                  40                  45Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile
 50                  55                  60Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile65                  70                  75                  80Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
             85                  90                  95Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu
        100                 105                 110Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu
    115                 120                 125Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala
130                 135                 140Ile Pro Leu Phe Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val145                 150                 155                 160Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
            165                 170                 175Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg
        180                 185                 190Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp His Ala Val
    195                 200                 205Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg
210                 215                 220Asp Trp Ile Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val225                 230                 235                 240Leu Asp Ile Val Ser Leu Phe Pro Asn Tyr Asp Ser Arg Thr Tyr Pro
            245                 250                 255Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val
        260                 265                 270Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Ser Ala Gln Gly Ile Glu
    275                 280                 285Gly Ser Ile Arg Ser Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr
290                 295                 300Ile Tyr Thr Asp Ala His Arg Gly Glu Tyr Tyr Trp Ser Gly His Gln305                 310                 315                 320Ile Met Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Thr Phe Pro
            325                 330                 335Leu Tyr Gly Thr Met Gly Asn Ala Ala Pro Gln Gln Arg Ile Val Ala
        340                 345                 350Gln Leu Gly Gln Gly Val Tyr Arg Thr Leu Ser Ser Thr Leu Tyr Arg
    355                 360                 365Arg Pro Phe Asn Ile Gly Ile Asn Asn Gln Gln Leu Ser Val Leu Asp
370                 375                 380Gly Thr Glu Phe Ala Tyr Gly Thr Ser Ser Asn Leu Pro Ser Ala Val385                 390                 395                 400Tyr Arg Lys Ser Gly Thr Val Asp Ser Leu Asp Glu Ile Pro Pro Gln
            405                 410                 415Asn Asn Asn Val Pro Pro Arg Gln Gly Phe Ser His Arg Leu Ser His
        420                 425                 430Val Ser Met Phe Arg Ser Gly Phe Ser Asn Ser Ser Val Ser Ile Ile
    435                 440                 445Arg Ala Pro Met Phe Ser Trp Thr His Arg Ser Ala Thr Pro Thr Asn
450                 455                 460Thr Ile Asp Pro Glu Arg Ile Thr Gln Ile Pro Leu Val Lys Ala His465                 470                 475                 480Thr Leu Gln Ser Gly Thr Thr Val Val Arg Gly Pro Gly Phe Thr Gly
            485                 490                 495Gly Asp Ile Leu Arg Arg Thr Ser Gly Gly Pro Phe Ala Tyr Thr Ile
        500                 505                 510Val Asn Ile Asn Gly Gln Leu Pro Gln Arg Tyr Arg Ala Arg Ile Arg
    515                 520                 525Tyr Ala Ser Thr Thr Asn Leu Arg Ile Tyr Val Thr Val Ala Gly Glu
530                 535                 540Arg Ile Phe Ala Gly Gln Phe Asn Lys Thr Met Asp Thr Gly Asp Pro545                 550                 555                 560Leu Thr Phe Gln Ser Phe Ser Tyr Ala Thr Ile Asn Thr Ala Phe Thr
            565                 570                 575Phe Pro Met Ser Gln Ser Ser Phe Thr Val Gly Ala Asp Thr Phe Ser
        580                 585                 590Ser Gly Asn Glu Val Tyr Ile Asp Arg Phe Glu Leu Ile Pro Val Thr
    595                 600                 605Ala Thr Phe Glu Ala Glu Tyr Asp Leu Glu Arg Ala Gln Lys Ala Val
610                 615                 620Asn Ala Leu Phe Thr Ser Ile Asn Gln Ile Gly Ile Lys Thr Asp Val625                 630                 635                 640Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Asp Cys Leu Ser
            645                 650                 655Asp Glu Phe Cys Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys
        660                 665                 670His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn
    675                 680                 685Phe Lys Gly Ile Asn Arg Gln Leu Asp Arg Gly Trp Arg Gly Ser Thr
690                 695                 700Asp Ile Thr Ile Gln Arg Gly Asp Asp Val Phe Lys Glu Asn Tyr Val705                 710                 715                 720Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln
            725                 730                 735Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg
        740                 745                 750Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr
    755                 760                 765Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp
770                 775                 780Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg785                 790                 795                 800Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg
            805                 810                 815Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile
        820                 825                 830Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile
    835                 840                 845Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu
850                 855                 860Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys865                 870                 875                 880Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu
            885                 890                 895Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe
        900                 905                 910Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met
    915                 920                 925Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu
930                 935                 940Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu945                 950                 955                 960Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn
            965                 970                 975Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val
        980                 985                 990Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu
    995                 1000                1005Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys
1010                1015                1020Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr1025                1030                1035                1040Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr Asp Glu
            1045                1050                1055Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr Pro Asn Asn Thr
        1060                1065                1070Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu Glu Tyr Gly Gly Ala
    1075                1080                1085Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu Ala Pro Ser Val Pro Ala
1090                1095                1100Asp Tyr Ala Ser Val Tyr Glu Glu Lys Ser Tyr Thr Asp Gly Arg Arg1105                1110                1115                1120Glu Asn Pro Cys Glu Phe Asn Arg Gly Tyr Arg Asp Tyr Thr Pro Leu
            1125                1130                1135Pro Val Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp
        1140                1145                1150Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp
    1155                1160                1165Ser Val Glu Leu Leu Leu Met Glu Glu
1170                1175(2)SEQ ID NO:15信息:
(i)序列特征:
    (A)长度:20个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:15:TATCCAATTC GAACGTCATC                                      20(2)SEQ ID NO:16信息:
(i)序列特征:
    (A)长度:20个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:16:TTTAGTCATC GATTAAATCA                                      20(2)SEQ ID NO:17信息:
(i)序列特征:
    (A)长度:20个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:17:ATAATAAGAG CTCCAATGTT                                      20(2)SEQ ID NO:18信息:
(i)序列特征:
    (A)长度:20个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:18:TACATCGTAG TGCAACTCTT                                      20(2)SEQ ID NO:19信息:
(i)序列特征:
    (A)长度:20个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:19:TCATGGAGAG  CTCCTATGTT                                     20(2)SEQ ID NO:20信息:
(i)序列特征:
    (A)长度:20个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:20:TTAACAAGAG CTCCTATGTT                                      20(2)SEQ ID NO:21信息:
(i)序列特征:
    (A)长度:20个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:21:ACTACCAGGT ACCTTTGATG                                      20(2)SEQ ID NO:22信息:
(i)序列特征:
    (A)长度:20个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:22:ACTACCGGGT ACCTTTGATA                                      20(2)SEQ ID NO:23信息:
(i)序列特征:
    (A)长度:18个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:23:ATTTGAGTAA TACTATCC                                        18(2)SEQ ID NO:24信息:
(i)序列特征:
    (A)长度:19个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:24:ATTACTCAAA TACCATTGG                                       19(2)SEQ ID NO:25信息:
(i)序列特征:
    (A)长度:3534个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑学:线性
(ix)特征:
    (A)名字/关键:CDS
    (B)位置:1..3531
(xi)序列描述:SEQ ID NO:25:ATG GAT AAC AAT CCG AAC ATC AAT GAA TGC ATT CCT TAT AAT TGT TTA          48Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu1              5                   10                  15AGT AAC CCT GAA GTA GAA GTA TTA GGT GGA GAA AGA ATA GAA ACT GGT          96Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly
         20                  25                  30TAC ACC CCA ATC GAT ATT TCC TTG TCG CTA ACG CAA TTT CTT TTG AGT         144Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser
     35                  40                  45GAA TTT GTT CCC GGT GCT GGA TTT GTG TTA GGA CTA GTT GAT ATA ATA         192Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile
 50                  55                  60TGG GGA ATT TTT GGT CCC TCT CAA TGG GAC GCA TTT CTT GTA CAA ATT         240Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile65                  70                  75                  80GAA CAG TTA ATT AAC CAA AGA ATA GAA GAA TTC GCT AGG AAC CAA GCC         288Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
             85                  90                  95ATT TCT AGA TTA GAA GGA CTA AGC AAT CTT TAT CAA ATT TAC GCA GAA        336Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu
        100                 105                 110TCT TTT AGA GAG TGG GAA GCA GAT CCT ACT AAT CCA GCA TTA AGA GAA        384Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu
    115                 120                 125GAG ATG CGT ATT CAA TTC AAT GAC ATG AAC AGT GCC CTT ACA ACC GCT        432Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala
130                 135                 140ATT CCT CTT TTT GCA GTT CAA AAT TAT CAA GTT CCT CTT TTA TCA GTA        480Ile Pro Leu Phe Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val145                 150                 155                 160TAT GTT CAA GCT GCA AAT TTA CAT TTA TCA GTT TTG AGA GAT GTT TCA        528Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
            165                 170                 175GTG TTT GGA CAA AGG TGG GGA TTT GAT GCC GCG ACT ATC AAT AGT CGT        576Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg
        180                 185                 190TAT AAT GAT TTA ACT AGG CTT ATT GGC AAC TAT ACA GAT CAT GCT GTA        624Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp His Ala Val
    195                 200                 205CGC TGG TAC AAT ACG GGA TTA GAG CGT GTA TGG GGA CCG GAT TCT AGA        672Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg
210                 215                 220GAT TGG ATA AGA TAT AAT CAA TTT AGA AGA GAA TTA ACA CTA ACT GTA        720Asp Trp Ile Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val225                 230                 235                 240TTA GAT ATC GTT TCT CTA TTT CCG AAC TAT GAT AGT AGA ACG TAT CCA        768Leu Asp Ile Val Ser Leu Phe Pro Asn Tyr Asp Ser Arg Thr Tyr Pro
            245                 250                 255ATT CGA ACA GTT TCC CAA TTA ACA AGA GAA ATT TAT ACA AAC CCA GTA        816Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val
        260                 265                 270TTA GAA AAT TTT GAT GGT AGT TTT CGA GGC TCG GCT CAG GGC ATA GAA        864Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Ser Ala Gln Gly Ile Glu
    275                 280                 285AGA AGT ATT AGG AGT CCA CAT TTG ATG GAT ATA CTT AAC AGT ATA ACC        912Arg Ser Ile Arg Ser Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr
290                 295                 300ATC TAT ACG GAT GCT CAT AGG GGT TAT TAT TAT TGG TCA GGG CAT CAA        960Ile Tyr Thr Asp Ala His Arg Gly Tyr Tyr Tyr Trp Ser Gly His Gln305                 310                 315                 320ATA ATG GCT TCT CCT GTA GGG TTT TCG GGG CCA GAA TTC ACT TTT CCG       1008Ile Met Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Thr Phe Pro
            325                 330                 335CTA TAT GGA ACT ATG GGA AAT GCA GCT CCA CAA CAA CGT ATT GTT GCT       1056Leu Tyr Gly Thr Met Gly Asn Ala Ala Pro Gln Gln Arg Ile Val Ala
        340                 345                 350CAA CTA GGT CAG GGC GTG TAT AGA ACA TTA TCG TCC ACT TTA TAT AGA       1104Gln Leu Gly Gln Gly Val Tyr Arg Thr Leu Ser Ser Thr Leu Tyr Arg
    355                 360                 365AGA CCT TTT AAT ATA GGG ATA AAT AAT CAA CAA CTA TCT GTT CTT GAC       1152Arg Pro Phe Asn Ile Gly Ile Asn Asn Gln Gln Leu Ser Val Leu Asp
370                 375                 380GGG ACA GAA TTT GCT TAT GGA ACC TCC TCA AAT TTG CCA TCC GCT GTA       1200Gly Thr Glu Phe Ala Tyr Gly Thr Ser Ser Asn Leu Pro Ser Ala Val385                 390                 395                 400TAC AGA AAA AGC GGA ACG GTA GAT TCG CTG GAT GAA ATA CCG CCA CAG       1248Tyr Arg Lys Ser Gly Thr Val Asp Ser Leu Asp Glu Ile Pro Pro Gln
            405                 410                 415AAT AAC AAC GTG CCA CCT AGG CAA GGA TTT AGT CAT CGA TTA AGC CAT       1296Asn Asn Asn Val Pro Pro Arg Gln Gly Phe Ser His Arg Leu Ser His
        420                 425                 430GTT TCA ATG TTT CGT TCA GGC TTT AGT AAT AGT AGT GTA AGT ATA ATA       1344Val Ser Met Phe Arg Ser Gly Phe Ser Asn Ser Ser Val Ser Ile Ile
    435                 440                 445AGA GCT CCA ATG TTT TCT TGG ACG CAC CGT AGT GCA ACC CCT ACA AAT       1392Arg Ala Pro Met Phe Ser Trp Thr His Arg Ser Ala Thr Pro Thr Asn
450                 455                 460ACA ATT GAT CCG GAG AGG ATT ACT CAA ATA CCA TTG GTA AAA GCA CAT       1440Thr Ile Asp Pro Glu Arg Ile Thr Gln Ile Pro Leu Val Lys Ala His465                 470                 475                 480ACA CTT CAG TCA GGT ACT ACT GTT GTA AGA GGG CCC GGG TTT ACG GGA       1488Thr Leu Gln Ser Gly Thr Thr Val Val Arg Gly Pro Gly Phe Thr Gly
            485                 490                 495GGA GAT ATT CTT CGA CGA ACA AGT GGA GGA CCA TTT GCT TAT ACT ATT       1536Gly Asp Ile Leu Arg Arg Thr Ser Gly Gly Pro Phe Ala Tyr Thr Ile
        500                 505                 510GTT AAT ATA AAT GGG CAA TTA CCC CAA AGG TAT CGT GCA AGA ATA CGC       1584Val Asn Ile Asn Gly Gln Leu Pro Gln Arg Tyr Arg Ala Arg Ile Arg
    515                 520                 525TAT GCC TCT ACT ACA AAT CTA AGA ATT TAC GTA ACG GTT GCA GGT GAA       1632Tyr Ala Ser Thr Thr Asn Leu Arg Ile Tyr Val Thr Val Ala Gly Glu
530                 535                 540CGG ATT TTT GCT GGT CAA TTT AAC AAA ACA ATG GAT ACC GGT GAC CCA        1680Arg Ile Phe Ala Gly Gln Phe Asn Lys Thr Met Asp Thr Gly Asp Pro545                 550                 555                 560TTA ACA TTC CAA TCT TTT AGT TAC GCA ACT ATT AAT ACA GCT TTT ACA        1728Leu Thr Phe Gln Ser Phe Ser Tyr Ala Thr Ile Asn Thr Ala Phe Thr
            565                 570                 575TTC CCA ATG AGC CAG AGT AGT TTC ACA GTA GGT GCT GAT ACT TTT AGT        1776Phe Pro Met Ser Gln Ser Ser Phe Thr Val Gly Ala Asp Thr Phe Ser
        580                 585                 590TCA GGG AAT GAA GTT TAT ATA GAC AGA TTT GAA TTG ATT CCA GTT ACT        1824Ser Gly Asn Glu Val Tyr Ile Asp Arg Phe Glu Leu Ile Pro Val Thr
    595                 600                 605GCA ACA TTT GAA GCA GAA TAT GAT TTA GAA AGA GCA CAA AAG GCG GTG        1872Ala Thr Phe Glu Ala Glu Tyr Asp Leu Glu Arg Ala Gln Lys Ala Val
610                 615                 620AAT GCG CTG TTT ACT TCT ATA AAC CAA ATA GGG ATA AAA ACA GAT GTG        1920Asn Ala Leu Phe Thr Ser Ile Asn Gln Ile Gly Ile Lys Thr Asp Val625                 630                 635                 640ACG GAT TAT CAT ATT GAT CAA GTA TCC AAT TTA GTG GAT TGT TTA TCA        1968Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Asp Cys Leu Ser
            645                 650                 655GAT GAA TTT TGT CTG GAT GAA AAG CGA GAA TTG TCC GAG AAA GTC AAA        2016Asp Glu Phe Cys Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys
        660                 665                 670CAT GCG AAG CGA CTC AGT GAT GAG CGG AAT TTA CTT CAA GAT CCA AAC        2064His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn
    675                 680                 685TTC AAA GGC ATC AAT AGG CAA CTA GAC CGT GGT TGG AGA GGA AGT ACG        2112Phe Lys Gly Ile Asn Arg Gln Leu Asp Arg Gly Trp Arg Gly Ser Thr
690                 695                 700GAT ATT ACC ATC CAA AGA GGA GAT GAC GTA TTC AAA GAA AAT TAT GTC        2160Asp Ile Thr Ile Gln Arg Gly Asp Asp Val Phe Lys Glu Asn Tyr Val705                 710                 715                 720ACA CTA CCA GGT ACC TTT GAT GAG TGC TAT CCA ACA TAT TTG TAT CAA        2208Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln
            725                 730                 735AAA ATC GAT GAA TCA AAA TTA AAA GCC TTT ACC CGT TAT CAA TTA AGA        2256Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg
        740                 745                 750GGG TAT ATC GAA GAT AGT CAA GAC TTA GAA ATC TAT TTA ATT CGC TAC        2304Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr
    755                 760                 765AAT GCA AAA CAT GAA ACA GTA AAT GTG CCA GGT ACG GGT TCC TTA TGG        2352Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp
770                 775                 780CCG CTT TCA GCC CAA AGT CCA ATC GGA AAG TGT GGA GAG CCG AAT CGA         2400Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg785                 790                 795                 800TGC GCG CCA CAC CTT GAA TGG AAT CCT GAC TTA GAT TGT TCG TGT AGG         2448Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg
            805                 810                 815GAT GGA GAA AAG TGT GCC CAT CAT TCG CAT CAT TTC TCC TTA GAC ATT         2496Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile
        820                 825                 830GAT GTA GGA TGT ACA GAC TTA AAT GAG GAC CTA GGT GTA TGG GTG ATC         2544Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile
    835                 840                 845TTT AAG ATT AAG ACG CAA GAT GGG CAC GCA AGA CTA GGG AAT CTA GAG         2592Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu
850                 855                 860TTT CTC GAA GAG AAA CCA TTA GTA GGA GAA GCG CTA GCT CGT GTG AAA         2640Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys865                 870                 875                 880AGA GCG GAG AAA AAA TGG AGA GAC AAA CGT GAA AAA TTG GAA TGG GAA         2688Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu
            885                 890                 895ACA AAT ATC GTT TAT AAA GAG GCA AAA GAA TCT GTA GAT GCT TTA TTT         2736Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe
        900                 905                 910GTA AAC TCT CAA TAT GAT CAA TTA CAA GCG GAT ACG AAT ATT GCC ATG         2784Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met
    915                 920                 925ATT CAT GCG GCA GAT AAA CGT GTT CAT AGC ATT CGA GAA GCT TAT CTG         2832Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu
930                 935                 940CCT GAG CTG TCT GTG ATT CCG GGT GTC AAT GCG GCT ATT TTT GAA GAA         2880Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu945                 950                 955                 960TTA GAA GGG CGT ATT TTC ACT GCA TTC TCC CTA TAT GAT GCG AGA AAT         2928Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn
            965                 970                 975GTC ATT AAA AAT GGT GAT TTT AAT AAT GGC TTA TCC TGC TGG AAC GTG         2976Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val
        980                 985                 990AAA GGG CAT GTA GAT GTA GAA GAA CAA AAC AAC CAA CGT TCG GTC CTT         3024Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu
    995                 1000                1005GTT GTT CCG GAA TGG GAA GCA GAA GTG TCA CAA GAA GTT CGT GTC TGT        3072Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys
1010                1015                1020CCG GGT CGT GGC TAT ATC CTT CGT GTC ACA GCG TAC AAG GAG GGA TAT        3120Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr1025                1030                1035                1040GGA GAA GGT TGC GTA ACC ATT CAT GAG ATC GAG AAC AAT ACA GAC GAA        3168Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr Asp Glu
            1045                1050                1055CTG AAG TTT AGC AAC TGC GTA GAA GAG GAA ATC TAT CCA AAT AAC ACG        3216Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr Pro Asn Asn Thr
        1060                1065                1070GTA ACG TGT AAT GAT TAT ACT GTA AAT CAA GAA GAA TAC GGA GGT GCG        3264Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu Glu Tyr Gly Gly Ala
    1075                1080                1085TAC ACT TCT CGT AAT CGA GGA TAT AAC GAA GCT CCT TCC GTA CCA GCT        3312Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu Ala Pro Ser Val Pro Ala
1090                1095                1100GAT TAT GCG TCA GTC TAT GAA GAA AAA TCG TAT ACA GAT GGA CGA AGA        3360Asp Tyr Ala Ser Val Tyr Glu Glu Lys Ser Tyr Thr Asp Gly Arg Arg1105                1110                1115                1120GAG AAT CCT TGT GAA TTT AAC AGA GGG TAT AGG GAT TAC ACG CCA CTA        3408Glu Asn Pro Cys Glu Phe Asn Arg Gly Tyr Arg Asp Tyr Thr Pro Leu
            1125                1130                1135CCA GTT GGT TAT GTG ACA AAA GAA TTA GAA TAC TTC CCA GAA ACC GAT        3456Pro Val Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp
        1140                1145                1150AAG GTA TGG ATT GAG ATT GGA GAA ACG GAA GGA ACA TTT ATC GTG GAC        3504Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp
    1155                1160                1165AGC GTG GAA TTA CTC CTT ATG GAG GAA TAG                                3534Ser Val Glu Leu Leu Leu Met Glu Glu
1170                1175(2)SEQ ID NO:26信息:
(i)序列特征:
    (A)长度:1177个氨基酸
    (B)类型:氨基酸
    (D)拓扑学:线性
(ii)分子类型:蛋白
(xi)序列描述:SEQ ID NO:26:Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu1               5                  10                  15Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly
         20                  25                  30Tyr Thr Pre Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser
     35                  40                  45Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile
 50                  55                  60Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile65                  70                  75                  80Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
             85                  90                  95Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu
        100                 105                 110Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu
    115                 120                 125Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala
130                 135                 140Ile Pro Leu Phe Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val145                 150                 155                 160Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
            165                 170                 175Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg
        180                 185                 190Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp His Ala Val
    195                 200                 205Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg
210                 215                 220Asp Trp Ile Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val225                 230                 235                 240Leu Asp Ile Val Ser Leu Phe Pro Asn Tyr Asp Ser Arg Thr Tyr Pro
            245                 250                     255Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val
        260                 265                 270Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Ser Ala Gln Gly Ile Glu
    275                 280                 285Arg Ser Ile Arg Ser Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr
290                 295                 300Ile Tyr Thr Asp Ala His Arg Gly Tyr Tyr Tyr Trp Ser Gly His Gln305                 310                 315                 320Ile Met Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Thr Phe Pro
            325                 330                 335Leu Tyr Gly Thr Met Gly Asn Ala Ala Pro Gln Gln Arg Ile Val Ala
        340                 345                 350Gln Leu Gly Gln Gly Val Tyr Arg Thr Leu Ser Ser Thr Leu Tyr Arg
    355                 360                 365Arg Pro Phe Asn Ile Gly Ile Asn Asn Gln Gln Leu Ser Val Leu Asp
370                 375                 380Gly Thr Glu Phe Ala Tyr Gly Thr Ser Ser Asn Leu Pro Ser Ala Val385                 390                 395                 400Tyr Arg Lys Ser Gly Thr Val Asp Ser Leu Asp Glu Ile Pro Pro Gln
            405                 410                 415Asn Asn Asn Val Pro Pro Arg Gln Gly Phe Ser His Arg Leu Ser His
        420                 425                 430Val Ser Met Phe Arg Ser Gly Phe Ser Asn Ser Ser Val Ser Ile Ile
    435                 440                 445Arg Ala Pro Met Phe Ser Trp Thr His Arg Ser Ala Thr Pro Thr Asn
450                 455                 460Thr Ile Asp Pro Glu Arg Ile Thr Gln Ile Pro Leu Val Lys Ala His465                 470                 475                 480Thr Leu Gln Ser Gly Thr Thr Val Val Arg Gly Pro Gly Phe Thr Gly
            485                 490                 495Gly Asp Ile Leu Arg Arg Thr Ser Gly Gly Pro Phe Ala Tyr Thr Ile
        500                 505                 510Val Asn Ile Asn Gly Gln Leu Pro Gln Arg Tyr Arg Ala Arg Ile Arg
    515                 520                 525Tyr Ala Ser Thr Thr Asn Leu Arg Ile Tyr Val Thr Val Ala Gly glu
530                 535                 540Arg Ile Phe Ala Gly Gln Phe Asn Lys Thr Met Asp Thr Gly Asp Pro545                 550                 555                 560Leu Thr Phe Gln Ser Phe Ser Tyr Ala Thr Ile Asn Thr Ala Phe Thr
            565                 570                 575Phe Pro Met Ser Gln Ser Ser Phe Thr Val Gly Ala Asp Thr Phe Ser
        580                 585                 590Ser Gly Asn Glu Val Tyr Ile Asp Arg Phe Glu Leu Ile Pro Val Thr
    595                 600                 605Ala Thr Phe Glu Ala Glu Tyr Asp Leu Glu Arg Ala Gln Lys Ala Val
610                 615                 620Asn Ala Leu Phe Thr Ser Ile Asn Gln Ile Gly Ile Lys Thr Asp Val625                 630                 635                 640Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Asp Cys Leu Ser
            645                 650                 655Asp Glu Phe Cys Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys
        660                 665                 670His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn
    675                 680                 685Phe Lys Gly Ile Asn Arg Gln Leu Asp Arg Gly Trp Arg Gly Ser Thr
690                 695                 700Asp Ile Thr Ile Gln Arg Gly Asp Asp Val Phe Lys Glu Asn Tyr Val705                 710                 715                 720Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln
            725                 730                 735Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg
        740                 745                 750Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr
    755                 760                 765Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp
770                 775                 780Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg785                 790                 795                 800Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg
            805                 810                 815Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile
        820                 825                 830Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile
    835                 840                 845Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu
850                 855                 860Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys865                 870                 875                 880Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu
            885                 890                 895Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe
        900                 905                 910Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met
    915                 920                 925Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu
930                 935                 940Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu945                 950                 955                 960Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn
            965                 970                 975Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val
        980                 985                 990Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu
    995                 1000                1005Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys
1010                1015                1020Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr1025                1030                1035                1040Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr Asp Glu
            1045                1050                1055Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr Pro Asn Asn Thr
        1060                1065                1070Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu Glu Tyr Gly Gly Ala
    1075                1080                1085Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu Ala Pro Ser Val Pro Ala
1090                1095                1100Asp Tyr Ala Ser Val Tyr Glu Glu Lys Ser Tyr Thr Asp Gly Arg Arg1105                1110                1115                1120Glu Asn Pro Cys Glu Phe Asn Arg Gly Tyr Arg Asp Tyr Thr Pro Leu
            1125                1130                1135Pro Val Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp
        1140                1145                1150Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp
    1155                1160                1165Ser Val Glu Leu Leu Leu Met Glu Glu
1170                1175(2)SEQ ID NO:27信息:
(i)序列特征:
    (A)长度:3534个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑学:线性
(ix)特征:
    (A)名字/关键:CDS
    (B)位置:1..3531
(xi)序列描述:SEQ ID NO:27:ATG GAT AAC AAT CCG AAC ATC AAT GAA TGC ATT CCT TAT AAT TGT TTA           48Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu1               5                  10                  15AGT AAC CCT GAA GTA GAA GTA TTA GGT GGA GAA AGA ATA GAA ACT GGT           96Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly
         20                  25                  30TAC ACC CCA ATC GAT ATT TCC TTG TCG CTA ACG CAA TTT CTT TTG AGT          144Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser
     35                  40                  45GAA TTT GTT CCC GGT GCT GGA TTT GTG TTA GGA CTA GTT GAT ATA ATA          192Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile
 50                  55                  60TGG GGA ATT TTT GGT CCC TCT CAA TGG GAC GCA TTT CTT GTA CAA ATT          240Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile65                  70                  75                  80GAA CAG TTA ATT AAC CAA AGA ATA GAA GAA TTC GCT AGG AAC CAA GCC          288Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
             85                  90                  95ATT TCT AGA TTA GAA GGA CTA AGC AAT CTT TAT CAA ATT TAC GCA GAA          336Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu
        100                 105                 110TCT TTT AGA GAG TGG GAA GCA GAT CCT ACT AAT CCA GCA TTA AGA GAA          384Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu
    115                 120                 125GAG ATG CGT ATT CAA TTC AAT GAC ATG AAC AGT GCC CTT ACA ACC GCT          432Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala
130                 135                 140ATT CCT CTT TTT GCA GTT CAA AAT TAT CAA GTT CCT CTT TTA TCA GTA          480Ile Pro Leu Phe Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val145                 150                 155                 160TAT GTT CAA GCT GCA AAT TTA CAT TTA TCA GTT TTG AGA GAT GTT TCA          528Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
            165                 170                 175GTG TTT GGA CAA AGG TGG GGA TTT GAT GCC GCG ACT ATC AAT AGT CGT          576Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg
        180                 185                 190TAT AAT GAT TTA ACT AGG CTT ATT GGC AAC TAT ACA GAT TAT GCT GTA        624Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val
    195                 200                 205CGC TGG TAC AAT ACG GGA TTA GAA CGT GTA TGG GGA CCG GAT TCT AGA        672Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg
210                 215                 220GAT TGG GTA AGG TAT AAT CAA TTT AGA AGA GAA TTA ACA CTA ACT GTA        720Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val225                 230                 235                 240TTA GAT ATC GTT GCT CTG TTC CCG AAT TAT GAT AGT AGA AGA TAT CCA        768Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro
            245                 250                 255ATT CGA ACA GTT TCC CAA TTA ACA AGA GAA ATT TAT ACA AAC CCA GTA        816Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val
        260                 265                 270TTA GAA AAT TTT GAT GGT AGT TTT CGA GGC TCG GCT CAG GGC ATA GAA        864Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Ser Ala Gln Gly Ile Glu
    275                 280                 285AGA AGT ATT AGG AGT CCA CAT TTG ATG GAT ATA CTT AAC AGT ATA ACC        912Arg Ser Ile Arg Ser Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr
290                 295                 300ATC TAT ACG GAT GCT CAT AGG GGT TAT TAT TAT TGG TCA GGG CAT CAA        960Ile Tyr Thr Asp Ala His Arg Gly Tyr Tyr Tyr Trp Ser Gly His Gln305                 310                 315                 320ATA ATG GCT TCT CCT GTA GGG TTT TCG GGG CCA GAA TTC ACT TTT CCG       1008Ile Met Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Thr Phe Pro
            325                 330                 335CTA TAT GGA ACT ATG GGA AAT GCA GCT CCA CAA CAA CGT ATT GTT GCT       1056Leu Tyr Gly Thr Met Gly Asn Ala Ala Pro Gln Gln Arg Ile Val Ala
        340                 345                 350CAA CTA GGT CAG GGC GTG TAT AGA ACA TTA TCG TCC ACT TTA TAT AGA       1104Gln Leu Gly Gln Gly Val Tyr Arg Thr Leu Ser Ser Thr Leu Tyr Arg
    355                 360                 365AGA CCT TTT AAT ATA GGG ATA AAT AAT CAA CAA CTA TCT GTT CTT GAC       1152Arg Pro Phe Asn Ile Gly Ile Asn Asn Gln Gln Leu Ser Val Leu Asp
370                 375                 380GGG ACA GAA TTT GCT TAT GGA ACC TCC TCA AAT TTG CCA TCC GCT GTA       1200Gly Thr Glu Phe Ala Tyr Gly Thr Ser Ser Asn Leu Pro Ser Ala Val385                 390                 395                 400TAC AGA AAA AGC GGA ACG GTA GAT TCG CTG GAT GAA ATA CCG CCA CAG       1248Tyr Arg Lys Ser Gly Thr Val Asp Ser Leu Asp Glu Ile Pro Pro Gln
            405                 410                 415AAT AAC AAC GTG CCA CCT AGG CAA GGA TTT AGT CAT CGA TTA AGC CAT       1296Asn Asn Asn Val Pro Pro Arg Gln Gly Phe Ser His Arg Leu Ser His
        420                 425                 430GTT TCA ATG TTT CGT TCA GGC TTT AGT AAT AGT AGT GTA AGT ATA ATA         1344Val Ser Met Phe Arg Ser Gly Phe Ser Asn Ser Ser Val Ser Ile Ile
    435                 440                 445AGA GCT CCT ATG TTC TCT TGG ATA CAT CGT AGT GCT GAA TTT AAT AAT         1392Arg Ala Pro Met Phe Ser Trp Ile His Arg Ser Ala Glu Phe Asn Asn
450                 455                 460ATA ATT GCA TCG GAT AGT ATT ACT CAA ATA CCA TTG GTA AAA GCA CAT         1440Ile Ile Ala Ser Asp Ser Ile Thr Gln Ile Pro Leu Val Lys Ala His465                 470                 475                 480ACA CTT CAG TCA GGT ACT ACT GTT GTA AGA GGG CCC GGG TTT ACG GGA         1488Thr Leu Gln Ser Gly Thr Thr Val Val Arg Gly Pro Gly Phe Thr Gly
            485                 490                 495GGA GAT ATT CTT CGA CGA ACA AGT GGA GGA CCA TTT GCT TAT ACT ATT         1536Gly Asp Ile Leu Arg Arg Thr Ser Gly Gly Pro Phe Ala Tyr Thr Ile
        500                 505                 510GTT AAT ATA AAT GGG CAA TTA CCC CAA AGG TAT CGT GCA AGA ATA CGC         1584Val Asn Ile Asn Gly Gln Leu Pro Gln Arg Tyr Arg Ala Arg Ile Arg
    515                 520                 525TAT GCC TCT ACT ACA AAT CTA AGA ATT TAC GTA ACG GTT GCA GGT GAA         1632Tyr Ala Ser Thr Thr Asn Leu Arg Ile Tyr Val Thr Val Ala Gly Glu
530                 535                 540CGG ATT TTT GCT GGT CAA TTT AAC AAA ACA ATG GAT ACC GGT GAC CCA         1680Arg Ile Phe Ala Gly Gln Phe Asn Lys Thr Met Asp Thr Gly Asp Pro545                 550                 555                 560TTA ACA TTC CAA TCT TTT AGT TAC GCA ACT ATT AAT ACA GCT TTT ACA         1728Leu Thr Phe Gln Ser Phe Ser Tyr Ala Thr Ile Asn Thr Ala Phe Thr
            565                 570                 575TTC CCA ATG AGC CAG AGT AGT TTC ACA GTA GGT GCT GAT ACT TTT AGT         1776Phe Pro Met Ser Gln Ser Ser Phe Thr Val Gly Ala Asp Thr Phe Ser
        580                 585                 590TCA GGG AAT GAA GTT TAT ATA GAC AGA TTT GAA TTG ATT CCA GTT ACT         1824Ser Gly Asn Glu Val Tyr Ile Asp Arg Phe Glu Leu Ile Pro Val Thr
    595                 600                 605GCA ACA TTT GAA GCA GAA TAT GAT TTA GAA AGA GCA CAA AAG GCG GTG         1872Ala Thr Phe Glu Ala Glu Tyr Asp Leu Glu Arg Ala Gln Lys Ala Val
610                 615                 620AAT GCG CTG TTT ACT TCT ATA AAC CAA ATA GGG ATA AAA ACA GAT GTG         1920Asn Ala Leu Phe Thr Ser Ile Asn Gln Ile Gly Ile Lys Thr Asp Val625                 630                 635                 640ACG GAT TAT CAT ATT GAT CAA GTA TCC AAT TTA GTG GAT TGT TTA TCA         1968Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Asp Cys Leu Ser
            645                 650                 655GAT GAA TTT TGT CTG GAT GAA AAG CGA GAA TTG TCC GAG AAA GTC AAA       2016Asp Glu Phe Cys Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys
        660                 665                 670CAT GCG AAG CGA CTC AGT GAT GAG CGG AAT TTA CTT CAA GAT CCA AAC       2064His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn
    675                 680                 685TTC AAA GGC ATC AAT AGG CAA CTA GAC CGT GGT TGG AGA GGA AGT ACG       2112Phe Lys Gly Ile Asn Arg Gln Leu Asp Arg Gly Trp Arg Gly Ser Thr
690                 695                 700GAT ATT ACC ATC CAA AGA GGA GAT GAC GTA TTC AAA GAA AAT TAT GTC       2160Asp Ile Thr Ile Gln Arg Gly Asp Asp Val Phe Lys Glu Asn Tyr Val705                 710                 715                 720ACA CTA CCA GGT ACC TTT GAT GAG TGC TAT CCA ACA TAT TTG TAT CAA       2208Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln
            725                 730                 735AAA ATC GAT GAA TCA AAA TTA AAA GCC TTT ACC CGT TAT CAA TTA AGA       2256Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg
        740                 745                 750GGG TAT ATC GAA GAT AGT CAA GAC TTA GAA ATC TAT TTA ATT CGC TAC       2304Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr
    755                 760                 765AAT GCA AAA CAT GAA ACA GTA AAT GTG CCA GGT ACG GGT TCC TTA TGG       2352Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp
770                 775                 780CCG CTT TCA GCC CAA AGT CCA ATC GGA AAG TGT GGA GAG CCG AAT CGA       2400Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg785                 790                 795                 800TGC GCG CCA CAC CTT GAA TGG AAT CCT GAC TTA GAT TGT TCG TGT AGG       2448Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg
            805                 810                 815GAT GGA GAA AAG TGT GCC CAT CAT TCG CAT CAT TTC TCC TTA GAC ATT       2496Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile
        820                 825                 830GAT GTA GGA TGT ACA GAC TTA AAT GAG GAC CTA GGT GTA TGG GTG ATC       2544Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile
    835                 840                 845TTT AAG ATT AAG ACG CAA GAT GGG CAC GCA AGA CTA GGG AAT CTA GAG       2592Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu
850                 855                 860TTT CTC GAA GAG AAA CCA TTA GTA GGA GAA GCG CTA GCT CGT GTG AAA       2640Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys865                 870                 875                 880AGA GCG GAG AAA AAA TGG AGA GAC AAA CGT GAA AAA TTG GAA TGG GAA        2688Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu
            885                 890                 895ACA AAT ATC GTT TAT AAA GAG GCA AAA GAA TCT GTA GAT GCT TTA TTT        2736Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe
        900                 905                 910GTA AAC TCT CAA TAT GAT CAA TTA CAA GCG GAT ACG AAT ATT GCC ATG        2784Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met
    915                 920                 925ATT CAT GCG GCA GAT AAA CGT GTT CAT AGC ATT CGA GAA GCT TAT CTG        2832Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu
930                 935                 940CCT GAG CTG TCT GTG ATT CCG GGT GTC AAT GCG GCT ATT TTT GAA GAA        2880Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu945                 950                 955                 960TTA GAA GGG CGT ATT TTC ACT GCA TTC TCC CTA TAT GAT GCG AGA AAT        2928Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn
            965                 970                 975GTC ATT AAA AAT GGT GAT TTT AAT AAT GGC TTA TCC TGC TGG AAC GTG        2976Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val
        980                 985                 990AAA GGG CAT GTA GAT GTA GAA GAA CAA AAC AAC CAA CGT TCG GTC CTT        3024Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu
    995                 1000                1005GTT GTT CCG GAA TGG GAA GCA GAA GTG TCA CAA GAA GTT CGT GTC TGT        3072Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys
1010               1015                 1020CCG GGT CGT GGC TAT ATC CTT CGT GTC ACA GCG TAC AAG GAG GGA TAT        3120Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr1025                1030                1035                1040GGA GAA GGT TGC GTA ACC ATT CAT GAG ATC GAG AAC AAT ACA GAC GAA        3168Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr Asp Glu
            1045                1050                1055CTG AAG TTT AGC AAC TGC GTA GAA GAG GAA ATC TAT CCA AAT AAC ACG        3216Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr Pro Asn Asn Thr
        1060                1065                1070GTA ACG TGT AAT GAT TAT ACT GTA AAT CAA GAA GAA TAC GGA GGT GCG        3264Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu Glu Tyr Gly Gly Ala
    1075                1080                1085TAC ACT TCT CGT AAT CGA GGA TAT AAC GAA GCT CCT TCC GTA CCA GCT        3312Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu Ala Pro Ser Val Pro Ala
1090                1095                1100GAT TAT GCG TCA GTC TAT GAA GAA AAA TCG TAT ACA GAT GGA CGA AGA       3360Asp Tyr Ala Ser Val Tyr Glu Glu Lys Ser Tyr Thr Asp Gly Arg Arg1105                1110                1115                1120GAG AAT CCT TGT GAA TTT AAC AGA GGG TAT AGG GAT TAC ACG CCA CTA       3408Glu Asn Pro Cys Glu Phe Asn Arg Gly Tyr Arg Asp Tyr Thr Pro Leu
            1125                1130                1135CCA GTT GGT TAT GTG ACA AAA GAA TTA GAA TAC TTC CCA GAA ACC GAT       3456Pro Val Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp
        1140                1145                1150AAG GTA TGG ATT GAG ATT GGA GAA ACG GAA GGA ACA TTT ATC GTG GAC       3504Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp
    1155                1160                1165AGC GTG GAA TTA CTC CTT ATG GAG GAA TAG                               3534Ser Val Glu Leu Leu Leu Met Glu Glu
1170               1175(2)SEQ ID NO:28信息:
(i)序列特征:
    (A)长度:1177个氨基酸
    (B)类型:氨基酸
    (D)拓扑学:线性
(ii)分子类型:蛋白
(xi)序列描述:SEQ ID NO:28:Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu1               5                  10                  15Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly
         20                  25                  30Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser
     35                  40                  45Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile
 50                  55                  60Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile65                  70                  75                  80Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
             85                  90                  95Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu
        100                 105                 110Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu
    115                 120                 125Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala
130                 135                 140Ile Pro Leu Phe Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val145                 150                 155                 160Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
            165                 170                 175Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg
        180                 185                 190Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val
    195                 200                 205Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg
210                 215                 220Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val225                 230                 235                 240Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro
            245                 250                 255Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val
        260                 265                 270Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Ser Ala Gln Gly Ile Glu
    275                 280                 285Arg Ser Ile Arg Ser Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr
290                 295                 300Ile Tyr Thr Asp Ala His Arg Gly Tyr Tyr Tyr Trp Ser Gly His Gln305                 310                 315                 320Ile Met Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Thr Phe Pro
            325                 330                 335Leu Tyr Gly Thr Met Gly Asn Ala Ala Pro Gln Gln Arg Ile Val Ala
        340                 345                 350Gln Leu Gly Gln Gly Val Tyr Arg Thr Leu Ser Ser Thr Leu Tyr Arg
    355                 360                 365Arg Pro Phe Asn Ile Gly Ile Asn Asn Gln Gln Leu Ser Val Leu Asp
370                 375                 380Gly Thr Glu Phe Ala Tyr Gly Thr Ser Ser Asn Leu Pro Ser Ala Val385                 390                 395                 400Tyr Arg Lys Ser Gly Thr Val Asp Ser Leu Asp Glu Ile Pro Pro Gln
            405                 410                 415Asn Asn Asn Val Pro Pro Arg Gln Gly Phe Ser His Arg Leu Ser His
        420                 425                 430Val Ser Met Phe Arg Ser Gly Phe Ser Asn Ser Ser Val Ser Ile Ile
    435                 440                 445Arg Ala Pro Met Phe Ser Trp Ile His Arg Ser Ala Glu Phe Asn Asn
450                 455                 460Ile Ile Ala Ser Asp Ser Ile Thr Gln Ile Pro Leu Val Lys Ala His465                 470                 475                 480Thr Leu Gln Ser Gly Thr Thr Val Val Arg Gly Pro Gly Phe Thr Gly
            485                 490                 495Gly Asp Ile Leu Arg Arg Thr Ser Gly Gly Pro Phe Ala Tyr Thr Ile
        500                 505                 510Val Asn Ile Asn Gly Gln Leu Pro Gln Arg Tyr Arg Ala Arg Ile Arg
    515                 520                 525Tyr Ala Ser Thr Thr Asn Leu Arg Ile Tyr Val Thr Val Ala Gly Glu
530                 535                 540Arg Ile Phe Ala Gly Gln Phe Asn Lys Thr Met Asp Thr Gly Asp Pro545                 550                 555                 560Leu Thr Phe Gln Ser Phe Ser Tyr Ala Thr Ile Asn Thr Ala Phe Thr
            565                 570                 575Phe Pro Met Ser Gln Ser Ser Phe Thr Val Gly Ala Asp Thr Phe Ser
        580                 585                 590Ser Gly Asn Glu Val Tyr Ile Asp Arg Phe Glu Leu Ile Pro Val Thr
    595                 600                 605Ala Thr Phe Glu Ala Glu Tyr Asp Leu Glu Arg Ala Gln Lys Ala Val
610                 615                 620Asn Ala Leu Phe Thr Ser Ile Asn Gln Ile Gly Ile Lys Thr Asp Val625                 630                 635                 640Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Asp Cys Leu Ser
            645                 650                 655Asp Glu Phe Cys Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys
        660                 665                 670His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn
    675                 680                 685Phe Lys Gly Ile Asn Arg Gln Leu Asp Arg Gly Trp Arg Gly Ser Thr
690                 695                 700Asp Ile Thr Ile Gln Arg Gly Asp Asp Val Phe Lys Glu Asn Tyr Val705                 710                 715                 720Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln
            725                 730                 735Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg
        740                 745                 750Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr
    755                 760                 765Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp
770                 775                 780Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg785                 790                 795                 800Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg
            805                 810                 815Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile
        820                 825                 830Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile
    835                 840                 845Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu
850                 855                 860Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys865                 870                 875                 880Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu
            885                 890                 895Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe
        900                 905                 910Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met
    915                 920                 925Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu A la Tyr Leu
930                 935                 940Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu945                 950                 955                 960Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn
            965                 970                 975Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val
        980                 985                 990Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu
    995                 1000                1005Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys
1010                1015                1020Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr1025                1030                1035                1040Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr Asp Glu
            1045                1050                1055Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr Pro Asn Asn Thr
        1060                1065                1070Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu Glu Tyr Gly Gly Ala
    1075                1080                1085Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu Ala Pro Ser Val Pro Ala
1090                1095                1100Asp Tyr Ala Ser Val Tyr Glu Glu Lys Ser Tyr Thr Asp Gly Arg Arg1105                1110                1115                1120Glu Asn Pro Cys Glu Phe Asn Arg Gly Tyr Arg Asp Tyr Thr Pro Leu
            1125                1130                1135Pro Val Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp
        1140                1145                1150Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp
    1155                1160                1165Ser Val Glu Leu Leu Leu Met Glu Glu
1170                1175(2)SEQ ID NO:29信息:
(i)序列特征:
    (A)长度:3579个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:29ATGGATAACA ATCCGAACAT CAATGAATGC ATTCCTTATA ATTGTTTAAG TAACCCTGAA         60GTAGAAGTAT TAGGTGGAGA AAGAATAGAA ACTGGTTACA CCCCAATCGA TATTTCCTTG        120TCGCTAACGC AATTTCTTTT GAGTGAATTT GTTCCCGGTG CTGGATTTGT GTTAGGACTA        180GTTGATATAA   TATGGGGAAT   TTTTGGTCCC   TCTCAATGGG   ACGCATTTCT   TGTACAAATT               240GAACAGTTAA   TTAACCAAAG   AATAGAAGAA   TTCGCTAGGA   ACCAAGCCAT   TTCTAGATTA               300GAAGGACTAA   GCAATCTTTA   TCAAATTTAC   GCAGAATCTT   TTAGAGAGTG   GGAAGCAGAT               360CCTACTAATC   CAGCATTAAG   AGAAGAGATG   CGTATTCAAT   TCAATGACAT   GAACAGTGCC               420CTTACAACCG   CTATTCCTCT   TTTTGCAGTT   CAAAATTATC   AAGTTCCTCT   TTTATCAGTA               480TATGTTCAAG   CTGCAAATTT   ACATTTATCA   GTTTTGAGAG   ATGTTTCAGT   GTTTGGACAA               540AGGTGGGGAT   TTGATGCCGC   GACTATCAAT   AGTCGTTATA   ATGATTTAAC   TAGGCTTATT               600GGCAACTATA   CAGATTATGC   TGTACGCTGG   TACAATACGG   GATTAGAACG   TGTATGGGGA               660CCGGATTCTA   GAGATTGGGT   AAGGTATAAT   CAATTTAGAA   GAGAATTAAC   ACTAACTGTA               720TTAGATATCG   TTGCTCTGTT   CCCGAATTAT   GATAGTAGAA   GATATCCAAT   TCGAACAGTT               780TCCCAATTAA   CAAGAGAAAT   TTATACAAAC   CCAGTATTAG   AAAATTTTGA   TGGTAGTTTT               840CGAGGCTCGG   CTCAGGGCAT   AGAAAGAAGT   ATTAGGAGTC   CACATTTGAT   GGATATACTT               900AACAGTATAA   CCATCTATAC   GGATGCTCAT   AGGGGTTATT   ATTATTGGTC   AGGGCATCAA               960ATAATGGCTT   CTCCTGTAGG   GTTTTCGGGG   CCAGAATTCA   CTTTTCCGCT   ATATGGAACT              1020ATGGGAAATG   CAGCTCCACA   ACAACGTATT   GTTGCTCAAC   TAGGTCAGGG   CGTGTATAGA              1080ACATTATCGT   CCACTTTATA   TAGAAGACCT   TTTAATATAG   GGATAAATAA   TCAACAACTA              1140TCTGTTCTTG   ACGGGACAGA   ATTTGCTTAT   GGAACCTCCT   CAAATTTGCC   ATCCGCTGTA              1200TACAGAAAAA   GCGGAACGGT   AGATTCGCTG   GATGAAATAC   CGCCACAGAA   TAACAACGTG              1260CCACCTAGGC   AAGGATTTAG   TCATCGATTA   AGCCATGTTT   CAATGTTTCG   TTCAGGCTTT              1320AGTAATAGTA   GTGTAAGTAT   AATAAGAGCT   CCTATGTTCT   CTTGGATACA   TCGTAGTGCA              1380ACTCTTACAA   ATACAATTGA   TCCAGAGAGA   ATTAATCAAA   TACCTTTAGT   GAAAGGATTT              1440AGAGTTTGGG   GGGGCACCTC   TGTCATTACA   GGACCAGGAT   TTACAGGAGG   GGATATCCTT              1500CGAAGAAATA   CCTTTGGTGA   TTTTGTATCT   CTACAAGTCA   ATATTAATTC   ACCAATTACC              1560CAAAGATACC   GTTTAAGATT   TCGTTACGCT   TCCAGTAGGG   ATGCACGAGT   TATAGTATTA              1620ACAGGAGCGG   CATCCACAGG   AGTGGGAGGC   CAAGTTAGTG   TAAATATGCC   TCTTCAGAAA              1680ACTATGGAAA   TAGGGGAGAA   CTTAACATCT   AGAACATTTA   GATATACCGA   TTTTAGTAAT              1740CCTTTTTCAT   TTAGAGCTAA   TCCAGATATA   ATTGGGATAA   GTGAACAACC   TCTATTTGGT              1800GCAGGTTCTA   TTAGTAGCGG   TGAACTTTAT   ATAGATAAAA   TTGAAATTAT   TCTAGCAGAT              1860GCAACATTTG   AAGCAGAATC   TGATTTAGAA   AGAGCACAAA   AGGCGGTGAA   TGCCCTGTTT             1920ACTTCTTCCA   ATCAAATCGG   GTTAAAAACC   GATGTGACGG   ATTATCATAT   TGATCAAGTA             1980TCCAATTTAG   TGGATTGTTT   ATCAGATGAA   TTTTGTCTGG   ATGAAAAGCG   AGAATTGTCC             2040GAGAAAGTCA   AACATGCGAA   GCGACTCAGT   GATGAGCGGA   ATTTACTTCA   AGATCCAAAC             2100TTCAGAGGGA   TCAATAGACA   ACCAGACCGT   GGCTGGAGAG   GAAGTACAGA   TATTACCATC             2160CAAGGAGGAG   ATGACGTATT   CAAAGAGAAT   TACGTCACAC   TACCGGGTAC   CGTTGATGAG             2220TGCTATCCAA   CGTATTTATA   TCAGAAAATA   GATGAGTCGA   AATTAAAAGC   TTATACCCGT             2280TATGAATTAA   GAGGGTATAT   CGAAGATAGT   CAAGACTTAG   AAATCTATTT   GATCCGTTAC             2340AATGCAAAAC   ACGAAATAGT   AAATGTGCCA   GGCACGGGTT   CCTTATGGCC   GCTTTCAGCC             2400CAAAGTCCAA   TCGGAAAGTG   TGGAGAACCG   AATCGATGCG   CGCCACACCT   TGAATGGAAT             2460CCTGATCTAG   ATTGTTCCTG   CAGAGACGGG   GAAAAATGTG   CACATCATTC   CCATCATTTC             2520ACCTTGGATA   TTGATGTTGG   ATGTACAGAC   TTAAATGAGG   ACTTAGGTGT   ATGGGTGATA             2580TTCAAGATTA   AGACGCAAGA   TGGCCATGCA   AGACTAGGGA   ATCTAGAGTT   TCTCGAAGAG             2640AAACCATTAT   TAGGGGAAGC   ACTAGCTCGT   GTGAAAAGAG   CGGAGAAGAA   GTGGAGAGAC             2700AAACGAGAGA   AACTGCAGTT   GGAAACAAAT   ATTGTTTATA   AAGAGGCAAA   AGAATCTGTA             2760GATGCTTTAT   TTGTAAACTC   TCAATATGAT   AGATTACAAG   TGGATACGAA   CATCGCAATG             2820ATTCATGCGG   CAGATAAACG   CGTTCATAGA   ATCCGGGAAG   CGTATCTGCC   AGAGTTGTCT             2880GTGATTCCAG   GTGTCAATGC   GGCCATTTTC   GAAGAATTAG   AGGGACGTAT   TTTTACAGCG             2940TATTCCTTAT   ATGATGCGAG   AAATGTCATT   AAAAATGGCG   ATTTCAATAA   TGGCTTATTA             3000TGCTGGAACG   TGAAAGGTCA   TGTAGATGTA   GAAGAGCAAA   ACAACCACCG   TTCGGTCCTT             3060GTTATCCCAG   AATGGGAGGC   AGAAGTGTCA   CAAGAGGTTC   GTGTCTGTCC   AGGTCGTGGC             3120TATATCCTTC   GTGTCACAGC   ATATAAAGAG   GGATATGGAG   AGGGCTGCGT   AACGATCCAT             3180GAGATCGAAG   ACAATACAGA   CGAACTGAAA   TTCAGCAACT   GTGTAGAAGA   GGAAGTATAT             3240CCAAACAACA   CAGTAACGTG   TAATAATTAT   ACTGGGACTC   AAGAAGAATA   TGAGGGTACG             3300TACACTTCTC   GTAATCAAGG   ATATGACGAA   GCCTATGGTA   ATAACCCTTC   CGTACCAGCT             3360GATTACGCTT   CAGTCTATGA   AGAAAAATCG   TATACAGATG   GACGAAGAGA   GAATCCTTGT             3420GAATCTAACA   GAGGCTATGG   GGATTACACA   CCACTACCGG   CTGGTTATGT   AACAAAGGAT             3480TTAGAGTACT   TCCCAGAGAC   CGATAAGGTA   TGGATTGAGA   TCGGAGAAAC   AGAAGGAACA             3540TTCATCGTGG   ATAGCGTGGA   ATTACTCCTT   ATGGAGGAA                                        3579(2)SEQ ID NO:30信息:
(i)序列特征:
    (A)长度:1193个氨基酸
    (B)类型:氨基酸
    (C)链型:
    (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:30:Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu1               5                   10                  15Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly
        20                  25                  30Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser
    35                  40                  45Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile
50                  55                  60Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile65                  70                  75                  80Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
            85                  90                  95Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu
        100                 105                 110Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu
    115                 120                 125Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala
130                 135                 140Ile Pro Leu Phe Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val145                 150                 155                 160Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
            165                 170                 175Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg
        180                 185                 190Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val
    195                 200                 205Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg
210                 215                 220Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val225                 230                 235                 240Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro
            245                 250                 255Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val
        260                 265                 270Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Ser Ala Gln Gly Ile Glu
    275                 280                 285Arg Ser Ile Arg Ser Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr
290                 295                 300Ile Tyr Thr Asp Ala His Arg Gly Tyr Tyr Tyr Trp Ser Gly His Gln305                 310                 315                 320Ile Met Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Thr Phe Pro
            325                 330                 335Leu Tyr Gly Thr Met Gly Asn Ala Ala Pro Gln Gln Arg Ile Val Ala
        340                 345                 350Gln Leu Gly Gln Gly Val Tyr Arg Thr Leu Ser Ser Thr Leu Tyr Arg
    355                 360                 365Arg Pro Phe Asn Ile Gly Ile Asn Asn Gln Gln Leu Ser Val Leu Asp
370                 375                 380Gly Thr Glu Phe Ala Tyr Gly Thr Ser Ser Asn Leu Pro Ser Ala Val385                 390                 395                 400Tyr Arg Lys Ser Gly Thr Val Asp Ser Leu Asp Glu Ile Pro Pro Gln
            405                 410                 415Asn Asn Asn Val Pro Pro Arg Gln Gly Phe Ser His Arg Leu Ser His
        420                 425                 430Val Ser Met Phe Arg Ser Gly Phe Ser Asn Ser Ser Val Ser Ile Ile
    435                 440                 445Arg Ala Pro Met Phe Ser Trp Ile His Arg Ser Ala Thr Leu Thr Asn
450                 455                 460Thr Ile Asp Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe465                 470                 475                 480Arg Val Trp Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly
            485                 490                 495Gly Asp Ile Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln
        500                 505                 510Val Asn Ile Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg
    515                 520                 525Tyr Ala Ser Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala
530                 535                 540Ser Thr Gly Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys545                 550                 555                 560Thr Met Glu Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr
            565                 570                 575Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly
        580                 585                 590Ile Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Sar Gly Glu
    595                 600                 605Leu Tyr Ile Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu
610                 615                 620Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe625                 630                 635                 640Thr Ser Ser Asn Gln Ile Gly Leu Lys Thr Asp Val Thr Asp Tyr His
            645                 650                 655Ile Asp Gln Val Ser Asn Leu Val Asp Cys Leu Ser Asp Glu Phe Cys
        660                 665                 670Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg
    675                 680                 685Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly Ile
690                 695                 700Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile705                 710                 715                 720Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Pro Gly
            725                 730                 735Thr Val Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile Asp Glu
        740                 745                 750Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Glu Leu Arg Gly Tyr Ile Glu
    755                 760                 765Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala Lys His
770                 775                 780Glu Ile Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Ala785                 790                 795                 800Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Cys Ala Pro His
            805                 810                 815Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg Asp Gly Glu Lys
        820                 825                 830Cys Ala His His Ser His His Phe Thr Leu Asp Ile Asp Val Gly Cys
    835                 840                 845Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe Lys Ile Lys
850                 855                 860Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu865                 870                 875                 880Lys Pro Leu Leu Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys
            885                 890                 895Lys Trp Arg Asp Lys Arg Glu Lys Leu Gln Leu Glu Thr Asn Ile Val
        900                 905                 910Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ser Gln
    915                 920                 925Tyr Asp Arg Leu Gln Val Asp Thr Asn Ile Ala Met Ile His Ala Ala
930                 935                 940Asp Lys Arg Val His Arg Ile Arg Glu Ala Tyr Leu Pro Glu Leu Ser945                 950                 955                 960Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu Leu Glu Gly Arg
            965                 970                 975Ile Phe Thr Ala Tyr Ser Leu Tyr Asp Ala Arg Asn Val Ile Lys Asn
        980                 985                 990Gly Asp Phe Asn Asn Gly Leu Leu Cys Trp Asn Val Lys Gly His Val
    995                 1000                1005Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val Ile Pro Glu
1010                1015                1020Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys Pro Gly Arg Gly1025                1030                1035                1040Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys
            1045                1050                1055Val Thr Ile His Glu Ile Glu Asp Asn Thr Asp Glu Leu Lys Phe Ser
        1060                1065                1070Asn Cys Val Glu Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn
    1075                1080                1085Asn Tyr Thr Gly Thr Gln Glu Glu Tyr Glu Gly Thr Tyr Thr Ser Arg
1090                1095                1100Asn Gln Gly Tyr Asp Glu Ala Tyr Gly Asn Asn Pro Ser Val Pro Ala1105                1110                1115                1120Asp Tyr Ala Ser Val Tyr Glu Glu Lys Ser Tyr Thr Asp Gly Arg Arg
            1125                1130                1135Glu Asn Pro Cys Glu Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu
        1140                1145                1150Pro Ala Gly Tyr Val Thr Lys Asp Leu Glu Tyr Phe Pro Glu Thr Asp
    1155                1160                1165Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp
1170                1175                1180Ser Val Glu Leu Leu Leu Met Glu Glu1185                1190(2)SEQ ID NO:31信息:
(i)序列特征:
    (A)长度:16个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:31:CGTTGCTCTG TTCCCG                                          16(2)SEQ ID NO:32信息:
(i)序列特征:
    (A)长度:20个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:32:TCAAATACCA TTGGTAAAAG                                      20(2)SEQ ID NO:33信息:
(i)序列特征:
    (A)长度:3534个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:33:ATGGATAACA   ATCCGAACAT   CAATGAATGC   ATTCCTTATA   ATTGTTTAAG   TAACCCTGAA         60GTAGAAGTAT   TAGGTGGAGA   AAGAATAGAA   ACTGGTTACA   CCCCAATCGA   TATTTCCTTG        120TCGCTAACGC   AATTTCTTTT   GAGTGAATTT   GTTCCCGGTG   CTGGATTTGT   GTTAGGACTA        180GTTGATATAA   TATGGGGAAT   TTTTGGTCCC   TCTCAATGGG   ACGCATTTCT   TGTACAAATT        240GAACAGTTAA   TTAACCAAAG   AATAGAAGAA   TTCGCTAGGA   ACCAAGCCAT   TTCTAGATTA        300GAAGGACTAA   GCAATCTTTA   TCAAATTTAC   GCAGAATCTT   TTAGAGAGTG   GGAAGCAGAT        360CCTACTAATC   CAGCATTAAG   AGAAGAGATG   CGTATTCAAT   TCAATGACAT   GAACAGTGCC        420CTTACAACCG   CTATTCCTCT   TTTTGCAGTT   CAAAATTATC   AAGTTCCTCT   TTTATCAGTA        480TATGTTCAAG   CTGCAAATTT   ACATTTATCA   GTTTTGAGAG   ATGTTTCAGT   GTTTGGACAA        540AGGTGGGGAT   TTGATGCCGC   GACTATCAAT   AGTCGTTATA   ATGATTTAAC   TAGGCTTATT        600GGCAACTATA   CAGATTATGC   TGTACGCTGG   TACAATACGG   GATTAGAACG   TGTATGGGGA        660CCGGATTCTA   GAGATTGGGT   AAGGTATAAT   CAATTTAGAA   GAGAATTAAC   ACTAACTGTA        720TTAGATATCG   TTGCTCTGTT   CCCGAATTAT   GATAGTAGAA   GATATCCAAT   TCGAACAGTT        780TCCCAATTAA   CAAGAGAAAT   TTATACAAAC   CCAGTATTAG   AAAATTTTGA   TGGTAGTTTT        840CGAGGCTCGG   CTCAGGGCAT   AGAAAGAAGT   ATTAGGAGTC   CACATTTGAT   GGATATACTT        900AACAGTATAA   CCATCTATAC   GGATGCTCAT   AGGGGTTATT   ATTATTGGTC   AGGGCATCAA        960ATAATGGCTT   CTCCTGTAGG   GTTTTCGGGG   CCAGAATTCA   CTTTTCCGCT   ATATGGAACT       1020ATGGGAAATG   CAGCTCCACA   ACAACGTATT   GTTGCTCAAC   TAGGTCAGGG   CGTGTATAGA       1080ACATTATCGT   CCACTTTATA   TAGAAGACCT   TTTAATATAG   GGATAAATAA   TCAACAACTA       1140TCTGTTCTTG   ACGGGACAGA   ATTTGCTTAT   GGAACCTCCT   CAAATTTGCC   ATCCGCTGTA       1200TACAGAAAAA   GCGGAACGGT   AGATTCGCTG   GATGAAATAC   CGCCACAGAA   TAACAACGTG       1260CCACCTAGGC   AAGGATTTAG   TCATCGATTA   AGCCATGTTT   CAATGTTTCG   TTCAGGCTTT       1320AGTAATAGTA   GTGTAAGTAT   AATAAGAGCT   CCTATGTTCT   CTTGGATACA   TCGTAGTGCT       1380GAATTTAATA   ATATAATTGC   ATCGGATAGT   ATTACTCAAA   TACCATTGGT   AAAAGCACAT             1440ACACTTCAGT   CAGGTACTAC   TGTTGTAAGA   GGGCCCGGGT   TTACGGGAGG   AGATATTCTT             1500CGACGAACAA   GTGGAGGACC   ATTTGCTTAT   ACTATTGTTA   ATATAAATGG   GCAATTACCC             1560CAAAGGTATC   GTGCAAGAAT   ACGCTATGCC   TCTACTACAA   ATCTAAGAAT   TTACGTAACG             1620GTTGCAGGTG   AACGGATTTT   TGCTGGTCAA   TTTAACAAAA   CAATGGATAC   CGGTGACCCA             1680TTAACATTCC   AATCTTTTAG   TTACGCAACT   ATTAATACAG   CTTTTACATT   CCCAATGAGC             1740CAGAGTAGTT   TCACAGTAGG   TGCTGATACT   TTTAGTTCAG   GGAATGAAGT   TTATATAGAC             1800AGATTTGAAT   TGATTCCAGT   TACTGCAACA   CTCGAGGCTG   AATATAATCT   GGAAAGAGCG             1860CAGAAGGCGG   TGAATGCGCT   GTTTACGTCT   ACAAACCAAC   TAGGGCTAAA   AACAAATGTA             1920ACGGATTATC   ATATTGATCA   AGTGTCCAAT   TTAGTTACGT   ATTTATCGGA   TGAATTTTGT             1980CTGGATGAAA   AGCGAGAATT   GTCCGAGAAA   GTCAAACATG   CGAAGCGACT   CAGTGATGAA             2040CGCAATTTAC   TCCAAGATTC   AAATTTCAAA   GACATTAATA   GGCAACCAGA   ACGTGGGTGG             2100GGCGGAAGTA   CAGGGATTAC   CATCCAAGGA   GGGGATGACG   TATTTAAAGA   AAATTACGTC             2160ACACTATCAG   GTACCTTTGA   TGAGTGCTAT   CCAACATATT   TGTATCAAAA   AATCGATGAA             2220TCAAAATTAA   AAGCCTTTAC   CCGTTATCAA   TTAAGAGGGT   ATATCGAAGA   TAGTCAAGAC             2280TTAGAAATCT   ATTTAATTCG   CTACAATGCA   AAACATGAAA   CAGTAAATGT   GCCAGGTACG             2340GGTTCCTTAT   GGCCGCTTTC   AGCCCAAAGT   CCAATCGGAA   AGTGTGGAGA   GCCGAATCGA             2400TGCGCGCCAC   ACCTTGAATG   GAATCCTGAC   TTAGATTGTT   CGTGTAGGGA   TGGAGAAAAG             2460TGTGCCCATC   ATTCGCATCA   TTTCTCCTTA   GACATTGATG   TAGGATGTAC   AGACTTAAAT             2520GAGGACCTAG   GTGTATGGGT   GATCTTTAAG   ATTAAGACGC   AAGATGGGCA   CGCAAGACTA             2580GGGAATCTAG   AGTTTCTCGA   AGAGAAACCA   TTAGTAGGAG   AAGCGCTAGC   TCGTGTGAAA             2640AGAGCGGAGA   AAAAATGGAG   AGACAAACGT   GAAAAATTGG   AATGGGAAAC   AAATATCGTT             2700TATAAAGAGG   CAAAAGAATC   TGTAGATGCT   TTATTTGTAA   ACTCTCAATA   TGATCAATTA             2760CAAGCGGATA   CGAATATTGC   CATGATTCAT   GCGGCAGATA   AACGTGTTCA   TAGCATTCGA             2820GAAGCTTATC   TGCCTGAGCT   GTCTGTGATT   CCGGGTGTCA   ATGCGGCTAT   TTTTGAAGAA             2880TTAGAAGGGC   GTATTTTCAC   TGCATTCTCC   CTATATGATG   CGAGAAATGT   CATTAAAAAT             2940GGTGATTTTA   ATAATGGCTT   ATCCTGCTGG   AACGTGAAAG   GGCATGTAGA   TGTAGAAGAA             3000CAAAACAACC   AACGTTCGGT   CCTTGTTGTT   CCGGAATGGG   AAGCAGAAGT   GTCACAAGAA             3060GTTCGTGTCT   GTCCGGGTCG   TGGCTATATC   CTTCGTGTCA   CAGCGTACAA   GGAGGGATAT             3120GGAGAAGGTT   GCGTAACCAT   TCATGAGATC   GAGAACAATA   CAGACGAACT   GAAGTTTAGC             3180AACTGCGTAG   AAGAGGAAAT   CTATCCAAAT   AACACGGTAA   CGTGTAATGA   TTATACTGTA             3240AATCAAGAAG   AATACGGAGG   TGCGTACACT   TCTCGTAATC   GAGGATATAA   CGAAGCTCCT             3300TCCGTACCAG   CTGATTATGC   GTCAGTCTAT   GAAGAAAAAT   CGTATACAGA   TGGACGAAGA             3360GAGAATCCTT   GTGAATTTAA   CAGAGGGTAT   AGGGATTACA   CGCCACTACC   AGTTGGTTAT             3420GTGACAAAAG   AATTAGAATA   CTTCCCAGAA   ACCGATAAGG   TATGGATTGA   GATTGGAGAA             3480ACGGAAGGAA   CATTTATCGT   GGACAGCGTG   GAATTACTCC   TTATGGAGGA   ATAG                   3534(2)SEQ ID NO:34信息:
(i)序列特征:
    (A)长度:1177个氨基酸
    (B)类型:核酸
    (C)链型:
    (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:34:Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu1               5                   10                  15Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly
        20                  25                  30Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser
    35                  40                  45Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile
50                  55                  60Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile65                  70                  75                  80Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
            85                  90                  95Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu
        100                 105                 110Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu
    115                 120                 125Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala
130                 135                 140Ile Pro Leu Phe Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val145                 150                 155                 160Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
            165                 170                 175Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg
        180                 185                 190Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val
    195                 200                 205Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg
210                 215                 220Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val225                 230                 235                 240Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro
            245                 250                 255Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val
        260                 265                 270Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Ser Ala Gln Gly Ile Glu
    275                 280                 285Arg Ser Ile Arg Ser Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr
290                 295                 300Ile Tyr Thr Asp Ala His Arg Gly Tyr Tyr Tyr Trp Ser Gly His Gln305                 310                 315                 320Ile Met Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Thr Phe Pro
            325                 330                 335Leu Tyr Gly Thr Met Gly Asn Ala Ala Pro Gln Gln Arg Ile Val Ala
        340                 345                 350Gln Leu Gly Gln Gly Val Tyr Arg Thr Leu Ser Ser Thr Leu Tyr Arg
    355                 360                 365Arg Pro Phe Asn Ile Gly Ile Asn Asn Gln Gln Leu Ser Val Leu Asp
370                 375                 380Gly Thr Glu Phe Ala Tyr Gly Thr Ser Ser Asn Leu Pro Ser Ala Val385                 390                 395                 400Tyr Arg Lys Ser Gly Thr Val Asp Ser Leu Asp Glu Ile Pro Pro Gln
            405                 410                 415Asn Asn Asn Val Pro Pro Arg Gln Gly Phe Ser His Arg Leu Ser His
        420                 425                 430Val Ser Met Phe Arg Ser Gly Phe Ser Asn Ser Ser Val Ser Ile Ile
    435                 440                 445Arg Ala Pro Met Phe Ser Trp Ile His Arg Ser Ala Glu Phe Asn Asn
450                 455                 460Ile Ile Ala Ser Asp Ser Ile Thr Gln Ile Pro Leu Val Lys Ala His465                 470                 475                 480Thr Leu Gln Ser Gly Thr Thr Val Val Arg Gly Pro Gly Phe Thr Gly
            485                 490                 495Gly Asp Ile Leu Arg Arg Thr Ser Gly Gly Pro Phe Ala Tyr Thr Ile
        500                 505                 510Val Asn Ile Asn Gly Gln Leu Pro Gln Arg Tyr Arg Ala Arg Ile Arg
    515                 520                 525Tyr Ala Ser Thr Thr Asn Leu Arg Ile Tyr Val Thr Val Ala Gly Glu
530                 535                 540Arg Ile Phe Ala Gly Gln Phe Asn Lys Thr Met Asp Thr Gly Asp Pro545                 550                 555                 560Leu Thr Phe Gln Ser Phe Ser Tyr Ala Thr Ile Asn Thr Ala Phe Thr
            565                 570                 575Phe Pro Met Ser Gln Ser Ser Phe Thr Val Gly Ala Asp Thr Phe Ser
        580                 585                 590Ser Gly Asn Glu Val Tyr Ile Asp Arg Phe Glu Leu Ile Pro Val Thr
    595                 600                 605Ala Thr Leu Glu Ala Glu Tyr Asn Leu Glu Arg Ala Gln Lys Ala Val
610                 615                 620Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Leu Lys Thr Asn Val625                 630                 635                 640Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Thr Tyr Leu Ser
            645                 650                 655Asp Glu Phe Cys Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys
        660                 665                 670His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Ser Asn
    675                 680                 685Phe Lys Asp Ile Asn Arg Gln Pro Glu Arg Gly Trp Gly Gly Ser Thr
690                 695                 700Gly Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val705                 710                 715                 720Thr Leu Ser Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln
            725                 730                 735Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg
        740                 745                 750Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr
    755                 760                 765Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp
770                 775                 780Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg785                 790                 795                 800Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg
            805                 810                 815Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile
        820                 825                 830Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile
    835                 840                  845Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu
850                 855                 860Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys865                 870                 875                 880Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu
            885                 890                 895Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe
        900                 905                 910Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met
    915                 920                 925Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu
930                 935                 940Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu945                 950                 955                 960Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn
            965                 970                 975Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val
        980                 985                 990Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu
    995                 1000                1005Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys
1010                1015                1020Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr1025                1030                1035                1040Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr Asp Glu
            1045                1050                1055Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr Pro Asn Asn Thr
        1060                1065                1070Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu Glu Tyr Gly Gly Ala
    1075                1080                1085Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu Ala Pro Ser Val Pro Ala
1090                1095                1100Asp Tyr Ala Ser Val Tyr Glu Glu Lys Ser Tyr Thr Asp Gly Arg Arg1105                1110                1115                1120Glu Asn Pro Cys Glu Phe Asn Arg Gly Tyr Arg Asp Tyr Thr Pro Leu
            1125                1130                1135Pro Val Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp
        1140                1145                1150Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp
    1155                1160                1165Ser Val Glu Leu Leu Leu Met Glu Glu
1170                1175(2)SEQ ID NO:35信息:
(i)序列特征:
    (A)长度:20个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:35:TGCAACACTC GAGGCTGAAT                                      20

Claims (53)

1.分离的核酸片段,包括编码具有SEQ ID NO:10、SEQ IDNO:12、SEQ ID NO:14、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30或SEQ ID NO:34氨基酸序列多肽的基因。
2.权利要求1的核酸片段,其中所述的基因编码具有抗草地贪夜蛾、甜菜夜蛾、烟草夜蛾、玉米穗夜蛾或欧洲玉米螟杀虫活性的多肽。
3.前面任一权利要求的核酸片段,其中所述的核酸片段可从苏云金芽孢杆菌NRRL B-21579、NRRL B-21580、NRRL B-21581、NRRL B-21635、NRRL B-21636、NRRL B-21780或NRRL B-21781中分离。
4.前面任一权利要求的核酸片段,其中所述的核酸片段特异性地与具有SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ IDNO:25、SEQ ID NO:27、SEQ ID NO:29、或SEQ ID NO:33序列或其互补序列的核酸片段杂交。
5.前面任一权利要求的核酸片段,其中所述的核酸片段包括SEQ IDNO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29或SEQ ID NO:33的核酸序列或其互补的核酸序列。
6.前面任一权利要求的进一步定义为DNA片段的核酸片段。
7.前面任一权利要求的核酸片段,其中所述的基因可操作地连接到在宿主细胞中表达所述基因的启动子上。
8.前面任一权利要求的核酸片段,其被包括在重组载体中。
9.前面任一权利要求的核酸片段,其被包括进质粒、粘粒、噬菌体、噬菌粒、病毒、杆状病毒、细菌人工染色体或酵母人工染色体重组载体中。
10.前面任一权利要求的核酸片段,其被包括进质粒载体pEG1068、pEG 1077、pEG 11092、pEG 1093、pEG 365、pEG 378或pEG 381中。
11.根据前面任一权利要求的核酸片段用于重组表达方法中以制备重组多肽。
12.根据前面任一权利要求的核酸片段用于制备昆虫抗性转基因植物。
13.使用根据前面任一权利要求核酸片段的方法,包括在宿主细胞中表达所述的基因并且收集表达的多肽。
14.根据权利要求1到12中任一权利要求的核酸片段在制备重组多肽组合物中的应用。
15.根据权利要求1到12中任一权利要求的核酸片段在构建用于制备昆虫抗性转基因植物中的应用。
16.根据权利要求1到12中任一权利要求的核酸片段在构建昆虫抗性转基因植物中的应用。
17.宿主细胞,包括根据权利要求1到12中任一权利要求的核酸片段。
18.权利要求17的宿主细胞,其中所述的宿主细胞为细菌细胞。
19.权利要求17或18的宿主细胞,其中所述的细胞为大肠杆菌、苏云金芽孢杆菌、枯草芽孢杆菌、巨大芽孢杆菌或假单胞菌的细胞。
20.权利要求17到19中任一权利要求的宿主细胞,其中所述的细胞为苏云金芽孢杆菌EG 11063、EG 11074、EG 11090、EG 11092、EG 11735、EG 11751、EG 11768、NRRL B-21579、NRRL B-21580、NRRL B-21581、NRRL B-21635、NRRL B-21636、NRRL B-21780或NRRL B-21781。
21.权利要求17的宿主细胞,其中所述的细胞为真核细胞。
22.权利要求21的宿主细胞,其中所述的宿主细胞为植物细胞。
23.权利要求21或22的宿主细胞,其中所述的细胞为谷物、树木、蔬菜、水果、浆果、坚果、草、仙人掌、肉质或观赏植物细胞。
24.权利要求21到23的任一权利要求的宿主细胞,其中所述的细胞为玉米、水稻、烟草、土豆、番茄、亚麻、canola、向日葵、棉花、小麦、燕麦、大麦或黑麦细胞。
25.权利要求21到24中任一权利要求的宿主细胞,其中所述的细胞被包括进转基因植物中。
26.权利要求21到25中任一权利要求的宿主细胞,其中所述的细胞产生具有抗草地贪夜蛾、甜菜叶蛾、烟芽夜蛾、玉米穗夜蛾或欧洲玉米螟杀虫活性的多肽。
27.根据权利要求17到26中任一权利要求的宿主细胞用于重组多肽的表达。
28.根据权利要求17到26中任一权利要求的宿主细胞用于制备转基因植物。
29.根据权利要求17到26中任一权利要求的宿主细胞在制备多能植物细胞中的应用。
30.根据权利要求17到26中任一权利要求的宿主细胞在制备杀虫多肽制品中的应用。
31.组合物,包括含有SEQ ID NO:10、SEQ ID NO:12、SEQID NO:14、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30或SEQ ID NO:34氨基酸序列的分离多肽。
32.权利要求31的组合物,其中所述的多肽对草地贪夜蛾、甜菜叶蛾、烟芽夜蛾、玉米穗夜蛾或欧洲玉米螟具有杀虫活性。
33.权利要求31或32的组合物,其中所述的多肽可从苏云金芽孢杆菌EG 11060、EG 11062、EG 11063、EG 11071、EG 11073、EG11074、EG 11090、EG 11091、EG 11092、EG 11735、EG 11751、EG 11768、NRRL  B-21579、NRRL  B-21580、NRRL B-21581、NRRL B-21635、NRRL B-21636、NRRL B-21780或NRRL B-21781中分离。
34.权利要求31到33中任一权利要求的组合物,其中所述的多肽包括约0.5%到约99%重量的所述组合物。
35.权利要求31到34中任何一个权利要求的组合物,其中所述的多肽包括约50%到约99%重量的所述组合物。
36.组合物,包括可通过下列方法制备的多肽,该方法包括以下步骤:
(a)在有效产生包括苏云金芽孢杆菌多肽组合物的条件下培养苏云金芽孢杆菌NRRL B-21579、NRRL B-21580、NRRL B-21581、NRRL B-21635、NRRL B-21636、NRRL B-21780、NRRL B-21781、EG 11768、EG 11090、EG 11063、EG 11074、EG 11092、EG 11735、或EG 11751细胞;和
(b)从所述细胞中获取所述的组合物。
37.根据权利要求31到36中任一权利要求的组合物用于杀死昆虫细胞。
38.根据权利要求31到37中任一权利要求的组合物在制备杀虫制剂中的应用。
39.根据权利要求31到37中任一权利要求的组合物在制备植物保护性喷洒制剂中的应用。
40.制备苏云金芽孢杆菌晶体蛋白的方法,包括:
(a)在有效产生苏云金芽孢杆菌晶体蛋白的条件下培养苏云金芽孢杆菌NRRL B-21579、NRRL B-21580、NRRL B-21581、NRRL B-21635、NRRL B-21636、NRRL B-21780、NRRL B-21781、EG 11768、EG 11090、EG 11063、EG 11074、EG 11092、EG 11735或EG 11751细胞;和
(b)从所述的细胞中获取所述的苏云金芽孢杆菌晶体蛋白。
41.杀死昆虫细胞的方法,包括提供给昆虫细胞杀虫有效量的根据权利要求31到37中任一权利要求的组合物。
42.权利要求41的方法,其中所述的昆虫细胞在昆虫体内。
43.权利要求42的方法,其中所述的昆虫通过摄食覆盖有所述组合物的植物而摄食所述的组合物。
44.权利要求42或43的方法,其中所述的昆虫通过摄食表达所述组合物的转基因植物而摄食所述的组合物。
45.特异性地与包括SEQ ID NO:10、SEQ ID NO:12、SEQID NO:14、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30或SEQ ID NO:34氨基酸序列的多肽结合的纯化抗体。
46.权利要求45的抗体,其被可操作地结合到可检测的标记上。
47.免疫检测试剂盒,包括位于适当容器中的根据权利要求45抗体和免疫检测试剂。
48.用于检测生物样品中杀虫多肽的方法,包括在有效形成免疫复合物的条件下将怀疑含有所述杀虫多肽的生物样品与根据权利要求45的抗体接触并且检测这样形成的免疫复合物。
49.在其基因组中具有掺入的转基因的转基因植物,其中的转基因编码包括SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30或SEQ IDNO:34氨基酸序列的多肽。
50.权利要求49的转基因植物,其中所述的转基因包括SEQ IDNO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29或SEQ ID NO:33的核酸序列。
51.权利要求49或50植物的后代。
52.来自权利要求49到51中任一权利要求的植物或后代的种子。
53.来自权利要求52种子的植物。
CNB971813957A 1996-11-20 1997-11-20 广谱δ-内毒素 Expired - Lifetime CN1210402C (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US08/754,490 US6017534A (en) 1996-11-20 1996-11-20 Hybrid Bacillus thuringiensis δ-endotoxins with novel broad-spectrum insecticidal activity
US08/754,490 1996-11-20
US08/922,505 1997-09-03
US08/922,505 US6110464A (en) 1996-11-20 1997-09-03 Broad-spectrum δ-endotoxins

Publications (2)

Publication Number Publication Date
CN1268180A true CN1268180A (zh) 2000-09-27
CN1210402C CN1210402C (zh) 2005-07-13

Family

ID=27115928

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB971813957A Expired - Lifetime CN1210402C (zh) 1996-11-20 1997-11-20 广谱δ-内毒素

Country Status (17)

Country Link
US (7) US6281016B1 (zh)
EP (1) EP0942985B1 (zh)
JP (1) JP4389075B2 (zh)
CN (1) CN1210402C (zh)
AP (1) AP9901541A0 (zh)
AT (1) ATE276367T1 (zh)
AU (1) AU742971B2 (zh)
BR (1) BR9713373A (zh)
CA (1) CA2272843C (zh)
DE (1) DE69730730T2 (zh)
ES (1) ES2229395T3 (zh)
ID (1) ID25530A (zh)
IL (1) IL129988A (zh)
OA (1) OA11257A (zh)
PT (1) PT942985E (zh)
TR (1) TR199901109T2 (zh)
WO (1) WO1998022595A1 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100403028C (zh) * 2002-05-31 2008-07-16 印度农业研究委员会 Bt-cry毒素的迅速检测
DE102009044015A1 (de) 2008-09-18 2010-04-01 Yang, Sheng-An, Dashu Hsiang Kombinierbares Flügelrad
CN101730712A (zh) * 2007-06-08 2010-06-09 墨西哥国立大学 使用不需要钙黏着蛋白受体的毒素遏制昆虫对苏云金芽孢杆菌cry毒素的抗性
CN104745603A (zh) * 2007-06-08 2015-07-01 墨西哥国立大学 使用不需要钙黏着蛋白受体的毒素遏制昆虫对苏云金芽孢杆菌cry毒素的抗性
CN107074974A (zh) * 2014-10-16 2017-08-18 孟山都技术有限公司 对鳞翅目害虫具有毒性或抑制性的新型嵌合杀昆虫蛋白质
CN110915827A (zh) * 2019-12-09 2020-03-27 北京绿昇原生物科技有限公司 一种靶向除虫、除臭生物制剂及其制备方法
CN111995690A (zh) * 2020-01-16 2020-11-27 黑龙江大鹏农业有限公司 一种人工合成的抗虫蛋白mCry1Ia2及其制备方法和应用

Families Citing this family (84)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6713063B1 (en) 1996-11-20 2004-03-30 Monsanto Technology, Llc Broad-spectrum δ-endotoxins
ATE276367T1 (de) * 1996-11-20 2004-10-15 Monsanto Technology Llc Delta-endotoxine mit breitem spektrum
US6017534A (en) 1996-11-20 2000-01-25 Ecogen, Inc. Hybrid Bacillus thuringiensis δ-endotoxins with novel broad-spectrum insecticidal activity
US6218188B1 (en) * 1997-11-12 2001-04-17 Mycogen Corporation Plant-optimized genes encoding pesticidal toxins
AUPP058797A0 (en) * 1997-11-28 1997-12-18 Commonwealth Scientific And Industrial Research Organisation Novel gene
AU2000269030A1 (en) * 2000-08-11 2002-02-25 Monsanto Technology Llc Broad-spectrum delta-endotoxins
ES2397549T3 (es) 2001-01-09 2013-03-07 Bayer Cropscience Nv Proteínas insecticidas de Bacillus thuringiensis
DE60332711D1 (de) 2002-03-22 2010-07-08 Bayer Bioscience Nv Neue insektizide proteine von bazillus thuringiensis
US7393922B2 (en) * 2003-08-29 2008-07-01 The Ohio State University Research Foundation Insecticidal Cry4Ba proteins with enhanced toxicity
WO2005069986A2 (en) 2004-01-20 2005-08-04 Monsanto Technology Llc Chimeric promoters for use in plants
CN101027396B (zh) 2004-03-26 2011-08-03 美国陶氏益农公司 Cry1F和Cry1Ac转基因棉花株系及其事件特异性鉴定
MX2007010727A (es) 2005-03-02 2007-11-13 Dow Agrosciences Llc Nuevas fuentes para, y tipos de, proteinas insecticidamente activas y polinucleotidos que codifican las proteinas.
CN101300268A (zh) 2005-07-08 2008-11-05 墨西哥国立自治大学 新的具有杀虫活性的细菌蛋白质
CN102766652B (zh) 2005-08-31 2015-07-29 孟山都技术有限公司 编码杀虫蛋白的核苷酸序列
CA2653338C (en) 2006-05-26 2018-04-24 Monsanto Technology, Llc Corn plant and seed corresponding to transgenic event mon89034 and methods for detection and use thereof
CL2007003582A1 (es) 2006-12-08 2008-06-20 Pioneer Hi Bred Int Acidos nucleicos codificantes de polipeptidos cry1 de bacillus thuringiensis; vector y celula huesped que lo comprenden; dichos polipeptidos; y metodo para producir una planta con resistencia a insectos mejorada.
JP2010514416A (ja) * 2006-12-21 2010-05-06 グラクソスミスクライン・リミテッド・ライアビリティ・カンパニー 新規な方法
US7838729B2 (en) 2007-02-26 2010-11-23 Monsanto Technology Llc Chloroplast transit peptides for efficient targeting of DMO and uses thereof
RU2497830C2 (ru) * 2007-03-28 2013-11-10 Зингента Партисипейшнс Аг Гибридный инсектицидный белок, молекула нуклеиновой кислоты, кодирующая такой белок, трансгенные растения и их семена, содержащие такой белок, способ получения белка и его применение
US9522937B2 (en) * 2007-03-28 2016-12-20 Syngenta Participations Ag Insecticidal proteins
US8214855B2 (en) * 2007-12-06 2012-07-03 Cisco Technology, Inc. Delivery of streams to repair errored media streams in periods of unrecoverable errors
SI2262896T1 (sl) 2008-04-07 2014-05-30 Monsanto Technology Llc Rastlinski regulatorni elementi in njihove uporabe
CN105002189A (zh) * 2008-06-25 2015-10-28 阿森尼克斯公司 毒素基因及其使用方法
CA2746953C (en) 2008-12-16 2021-10-26 Syngenta Participations Ag Corn event 5307
WO2010099431A2 (en) 2009-02-27 2010-09-02 Monsanto Technology Llc Hydroponic apparatus and methods of use
AU2010236944B2 (en) 2009-04-17 2016-07-21 Dow Agrosciences Llc DIG-3 insecticidal Cry toxins
JP2012529269A (ja) * 2009-06-05 2012-11-22 ジ オハイオ ステイト ユニヴァーシティ リサーチ ファウンデーション 生体材料、組成物及び方法
US8937214B2 (en) 2009-10-23 2015-01-20 Monsanto Technology Llc Methods and compositions for expression of transgenes in plants
UA111814C2 (uk) * 2009-12-16 2016-06-24 ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі ТРАНСГЕННА РОСЛИНА, ЯКА МІСТИТЬ Cry1Ab ТА Cry2Aa, ДЛЯ РЕГУЛЮВАННЯ ЄВРОПЕЙСЬКОГО КУКУРУДЗЯНОГО МЕТЕЛИКА І СПОСОБИ БОРОТЬБИ ЗІ СТІЙКІСТЮ КОМАХ
EP2516631B1 (en) 2009-12-23 2018-02-14 Bayer Intellectual Property GmbH Plants tolerant to hppd inhibitor herbicides
ES2659086T3 (es) 2009-12-23 2018-03-13 Bayer Intellectual Property Gmbh Plantas tolerantes a herbicidas inhibidores de HPPD
ES2659085T3 (es) 2009-12-23 2018-03-13 Bayer Intellectual Property Gmbh Plantas tolerantes a herbicidas inhibidores de HPPD
UY33139A (es) 2009-12-23 2011-07-29 Bayer Cropscience Ag Plantas tolerantes a herbicidas inhibidores de las hppd
AR079883A1 (es) 2009-12-23 2012-02-29 Bayer Cropscience Ag Plantas tolerantes a herbicidas inhibidores de las hppd
BR122021001281B1 (pt) 2010-01-14 2022-03-03 Monsanto Technology Llc Molécula de dna compreendendo elementos reguladores de plantas
US8735560B1 (en) * 2010-03-02 2014-05-27 Monsanto Technology Llc Multiple domain lepidopteran active toxin proteins
US9234208B1 (en) 2010-05-10 2016-01-12 Dow Agrosciences Llc DIG-13 insecticidal cry toxins
CA2809643C (en) 2010-08-30 2019-09-24 John P. Davies Sugarcane bacilliform viral (scbv) enhancer and its use in plant functional genomics
ES2588802T3 (es) 2010-11-10 2016-11-04 Bayer Cropscience Ag Variantes de HPPD y procedimientos de uso
MX2011000894A (es) * 2010-12-17 2012-06-18 Ct De Investigacion Cientifica Y De Educacion Superior De Ensenada B C Proteinas cry insecticidas de bacilus thuringiensis con actividad anticancerígena.
ES2666149T3 (es) 2011-03-25 2018-05-03 Monsanto Technology Llc Elementos reguladores de plantas y usos de los mismos
EP2688406B1 (en) 2011-03-25 2015-04-22 Bayer Intellectual Property GmbH Use of n-(tetrazol-4-yl)- or n-(triazol-3-yl)arylcarboxamides or their salts for controlling unwanted plants in areas of transgenic crop plants being tolerant to hppd inhibitor herbicides
WO2012130684A1 (en) 2011-03-25 2012-10-04 Bayer Cropscience Ag Use of n-(1,2,5-oxadiazol-3-yl)benzamides for controlling unwanted plants in areas of transgenic crop plants being tolerant to hppd inhibitor herbicides
KR102080055B1 (ko) 2011-05-13 2020-02-24 몬산토 테크놀로지 엘엘씨 식물 조절 요소 및 그의 용도
BR102012019434B1 (pt) 2011-07-26 2021-11-09 Dow Agrosciences Llc Métodos de controle de pestes, de insetos, molécula e sequência de dna diagnóstica para o evento de soja 9582.814.19.1
EP2809787B8 (en) 2012-02-02 2018-11-28 Consejo Nacional de Investigaciones Cientificas y Técnicas (CONICET) HaHB11 PROVIDES IMPROVED PLANT YIELD AND TOLERANCE TO ABIOTIC STRESS
US10077450B2 (en) 2012-02-29 2018-09-18 Dow Agrosciences Llc Sugarcane bacilliform viral (SCBV) enhancer and its use in plant functional genomics
US11692016B2 (en) 2012-03-09 2023-07-04 Vestaron Corporation High gene expression yeast strain
EP2822963A2 (en) 2012-03-09 2015-01-14 Vestaron Corporation Toxic peptide production, peptide expression in plants and combinations of cysteine rich peptides
WO2013136274A1 (en) 2012-03-13 2013-09-19 University Of Guelph Myb55 promoter and use thereof
US9663793B2 (en) 2012-04-20 2017-05-30 Monsanto Technology, Llc Plant regulatory elements and uses thereof
WO2014028426A1 (en) 2012-08-13 2014-02-20 University Of Georgia Research Foundation, Inc. Compositions and methods for increasing pest resistance in plants
WO2014043435A1 (en) 2012-09-14 2014-03-20 Bayer Cropscience Lp Hppd variants and methods of use
UA118661C2 (uk) 2012-12-19 2019-02-25 Монсанто Текнолоджи Ллс Рекомбінантна молекула днк, яка має промоторну активність
JP2016516397A (ja) 2013-03-07 2016-06-09 アテニックス・コーポレーションAthenix Corporaton 毒素遺伝子及びその使用方法
KR102270068B1 (ko) 2013-03-14 2021-06-28 몬산토 테크놀로지 엘엘씨 식물 조절 성분 및 이의 용도
EP3613280A1 (en) 2013-03-14 2020-02-26 Monsanto Technology LLC Plant regulatory elements and uses thereof
WO2014144147A2 (en) * 2013-03-15 2014-09-18 HOLLISTER, Lisa Genetically modified plants that are insect-resistant and/or rot-resistant
KR101555124B1 (ko) * 2013-03-26 2015-09-22 서울대학교산학협력단 나비목 해충에 대한 살충활성이 향상된 신규의 바실러스 투린지엔시스 내독소단백질을 코딩하는 유전자 및 그 제조방법
EP3117003B1 (en) 2014-03-11 2019-10-30 BASF Agricultural Solutions Seed US LLC Hppd variants and methods of use
CN104231107A (zh) * 2014-10-15 2014-12-24 哈尔滨艾克尔食品科技有限公司 一种海带粗多糖的提取方法
AU2015372474B2 (en) 2014-12-30 2019-02-14 Dow Agrosciences Llc Modified Cry1Ca toxins useful for control of insect pests
EP3274462A4 (en) 2015-03-26 2018-12-26 The Texas A&M University System Conversion of lignin into bioplastics and lipid fuels
US10597674B2 (en) 2015-09-11 2020-03-24 Basf Agricultural Solutions Seed, Us Llc HPPD variants and methods of use
CN114807170A (zh) 2016-03-11 2022-07-29 孟山都技术公司 植物调控元件及其用途
KR102374017B1 (ko) 2016-05-24 2022-03-14 몬산토 테크놀로지 엘엘씨 식물 조절 요소 및 이들의 용도
US20190359992A1 (en) 2016-06-28 2019-11-28 Cellectis Altering expression of gene products in plants through targeted insertion of nucleic acid sequences
WO2018075269A1 (en) 2016-10-21 2018-04-26 Vestaron Corporation Cleavable peptides and insecticidal and nematicidal proteins comprising same
US11091772B2 (en) 2016-11-23 2021-08-17 BASF Agricultural Solutions Seed US LLC AXMI669 and AXMI991 toxin genes and methods for their use
KR20190095411A (ko) 2016-12-22 2019-08-14 바스프 아그리컬쳐럴 솔루션즈 시드 유에스 엘엘씨 선충 해충의 방제를 위한 cry14의 용도
CR20190367A (es) 2017-01-12 2019-09-25 Monsanto Technology Llc Proteínas toxinas pesticidas activas contra insectos lepidópteros
UY37571A (es) 2017-01-18 2018-08-31 Bayer Cropscience Lp Gen de toxina bp005 y procedimientos para su uso
US11286498B2 (en) 2017-01-18 2022-03-29 BASF Agricultural Solutions Seed US LLC Use of BP005 for the control of plant pathogens
WO2018165091A1 (en) 2017-03-07 2018-09-13 Bayer Cropscience Lp Hppd variants and methods of use
WO2019083808A1 (en) 2017-10-24 2019-05-02 Basf Se IMPROVING HERBICIDE TOLERANCE AGAINST HPPD INHIBITORS BY REGULATION OF PUTATIVE REDUCED 4-HYDROXYPHENYLPYRUVATE REDUCES IN SOYBEANS
WO2019083810A1 (en) 2017-10-24 2019-05-02 Basf Se IMPROVING HERBICIDE TOLERANCE FOR 4-HYDROXYPHENYLPYRUVATE DIOXYGENASE (HPPD) INHIBITORS BY NEGATIVE REGULATION OF HPPD EXPRESSION IN SOYBEANS
US11714090B2 (en) 2017-12-15 2023-08-01 Syngenta Participations Ag Non-antibody ligands for detecting target proteins
WO2019139616A1 (en) 2018-01-12 2019-07-18 The Texas A&M University System Increasing plant bioproduct yield
WO2022204464A1 (en) 2021-03-26 2022-09-29 Flagship Pioneering Innovations Vii, Llc Production of circular polyribonucleotides in a eukaryotic system
TW202305130A (zh) 2021-03-26 2023-02-01 美商旗艦先鋒創新有限責任(Vii)公司 原核系統中環狀多核糖核苷酸之產生
AR125217A1 (es) 2021-03-26 2023-06-28 Flagship Pioneering Innovations Vii Llc Producción de polirribonucleótidos circulares en un sistema procariota
WO2023077118A1 (en) 2021-11-01 2023-05-04 Flagship Pioneering Innovations Vii, Llc Polynucleotides for modifying organisms
WO2023141540A2 (en) 2022-01-20 2023-07-27 Flagship Pioneering Innovations Vii, Llc Polynucleotides for modifying organisms
WO2024052856A1 (en) 2022-09-09 2024-03-14 Friedrich Alexander Universität Erlangen-Nürnberg Plant regulatory elements and uses thereof

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0131623B2 (en) 1983-01-17 1999-07-28 Monsanto Company Chimeric genes suitable for expression in plant cells
US5380831A (en) 1986-04-04 1995-01-10 Mycogen Plant Science, Inc. Synthetic insecticidal crystal protein gene
BR8600161A (pt) 1985-01-18 1986-09-23 Plant Genetic Systems Nv Gene quimerico,vetores de plasmidio hibrido,intermediario,processo para controlar insetos em agricultura ou horticultura,composicao inseticida,processo para transformar celulas de plantas para expressar uma toxina de polipeptideo produzida por bacillus thuringiensis,planta,semente de planta,cultura de celulas e plasmidio
US4771131A (en) 1985-08-16 1988-09-13 Mycogen Corporation Cloning and expression of Bacillus thuringiensis toxin gene encoding a protein toxic to beetles of the order Coleoptera
CA1341092C (en) * 1985-12-12 2000-09-05 David L. Edwards Process for altering the host range of bacillus thuringiensis toxins, and novel toxins produced thereby
TR27832A (tr) 1987-04-29 1995-08-31 Monsanto Co Zararli ucucu hasarata mukavim bitkiler.
IL86245A (en) 1987-05-05 1995-01-24 Sandoz Ag A method for the transformation of plant materials and plants obtained by the method
EP0292435B1 (en) 1987-05-20 1995-07-26 Ciba-Geigy Ag Zea mays plants and transgenic zea mays plants regenerated from protoplasts or protoplast-derived cells
US5128130A (en) 1988-01-22 1992-07-07 Mycogen Corporation Hybrid Bacillus thuringiensis gene, plasmid and transformed Pseudomonas fluorescens
US5055294A (en) 1988-03-03 1991-10-08 Mycogen Corporation Chimeric bacillus thuringiensis crystal protein gene comprising hd-73 and berliner 1715 toxin genes, transformed and expressed in pseudomonas fluorescens
ATE126005T1 (de) 1988-04-25 1995-08-15 Monsanto Co Insektenresistente salatpflanzen.
NZ230375A (en) 1988-09-09 1991-07-26 Lubrizol Genetics Inc Synthetic gene encoding b. thuringiensis insecticidal protein
JP3364616B2 (ja) 1989-02-24 2003-01-08 モンサント テクノロジー エルエルシー 合成植物遺伝子と調製方法
US5384253A (en) 1990-12-28 1995-01-24 Dekalb Genetics Corporation Genetic transformation of maize cells by electroporation of cells pretreated with pectin degrading enzymes
UA48104C2 (uk) 1991-10-04 2002-08-15 Новартіс Аг Фрагмент днк, який містить послідовність,що кодує інсектицидний протеїн, оптимізовану для кукурудзи,фрагмент днк, який забезпечує направлену бажану для серцевини стебла експресію зв'язаного з нею структурного гена в рослині, фрагмент днк, який забезпечує специфічну для пилку експресію зв`язаного з нею структурного гена в рослині, рекомбінантна молекула днк, спосіб одержання оптимізованої для кукурудзи кодуючої послідовності інсектицидного протеїну, спосіб захисту рослин кукурудзи щонайменше від однієї комахи-шкідника
US5449681A (en) 1992-12-30 1995-09-12 Eli Lilly And Company Use of disulfonyl methanes for the control of parasites
US5441884A (en) 1993-07-08 1995-08-15 Ecogen Inc. Bacillus thuringiensis transposon TN5401
US5843744A (en) 1993-07-08 1998-12-01 Ecogen Inc. Bacillus thuringiensis Tn5401 proteins
GB9318207D0 (en) * 1993-09-02 1993-10-20 Sandoz Ltd Improvements in or relating to organic compounds
US5527883A (en) * 1994-05-06 1996-06-18 Mycogen Corporation Delta-endotoxin expression in pseudomonas fluorescens
US5593881A (en) 1994-05-06 1997-01-14 Mycogen Corporation Bacillus thuringiensis delta-endotoxin
US5508264A (en) * 1994-12-06 1996-04-16 Mycogen Corporation Pesticidal compositions
US5869718A (en) 1996-07-15 1999-02-09 Julien; Jean-Pierre Homologous recombination for animal model exhibiting reduced levels or elimination of a neuronal intermediate filament protein
US5804180A (en) 1996-07-17 1998-09-08 Ecogen, Inc. Bacillus thuringiensis strains showing improved production of certain lepidopteran-toxic crystal proteins
US6017534A (en) * 1996-11-20 2000-01-25 Ecogen, Inc. Hybrid Bacillus thuringiensis δ-endotoxins with novel broad-spectrum insecticidal activity
ATE276367T1 (de) * 1996-11-20 2004-10-15 Monsanto Technology Llc Delta-endotoxine mit breitem spektrum

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100403028C (zh) * 2002-05-31 2008-07-16 印度农业研究委员会 Bt-cry毒素的迅速检测
CN104745603B (zh) * 2007-06-08 2018-08-21 墨西哥国立大学 使用不需要钙黏着蛋白受体的毒素遏制昆虫对苏云金芽孢杆菌cry毒素的抗性
CN101730712A (zh) * 2007-06-08 2010-06-09 墨西哥国立大学 使用不需要钙黏着蛋白受体的毒素遏制昆虫对苏云金芽孢杆菌cry毒素的抗性
CN101730712B (zh) * 2007-06-08 2015-04-08 墨西哥国立大学 使用不需要钙黏着蛋白受体的毒素遏制昆虫对苏云金芽孢杆菌cry毒素的抗性
CN104745603A (zh) * 2007-06-08 2015-07-01 墨西哥国立大学 使用不需要钙黏着蛋白受体的毒素遏制昆虫对苏云金芽孢杆菌cry毒素的抗性
DE102009044015A1 (de) 2008-09-18 2010-04-01 Yang, Sheng-An, Dashu Hsiang Kombinierbares Flügelrad
CN107074974A (zh) * 2014-10-16 2017-08-18 孟山都技术有限公司 对鳞翅目害虫具有毒性或抑制性的新型嵌合杀昆虫蛋白质
CN112142857A (zh) * 2014-10-16 2020-12-29 孟山都技术有限公司 对鳞翅目害虫具有毒性或抑制性的新型嵌合杀昆虫蛋白质
CN112142858A (zh) * 2014-10-16 2020-12-29 孟山都技术有限公司 对鳞翅目害虫具有毒性或抑制性的新型嵌合杀昆虫蛋白质
CN112175094A (zh) * 2014-10-16 2021-01-05 孟山都技术有限公司 对鳞翅目害虫具有毒性或抑制性的新型嵌合杀昆虫蛋白质
CN107074974B (zh) * 2014-10-16 2022-01-11 孟山都技术有限公司 对鳞翅目害虫具有毒性或抑制性的嵌合杀昆虫蛋白质
CN110915827A (zh) * 2019-12-09 2020-03-27 北京绿昇原生物科技有限公司 一种靶向除虫、除臭生物制剂及其制备方法
CN111995690A (zh) * 2020-01-16 2020-11-27 黑龙江大鹏农业有限公司 一种人工合成的抗虫蛋白mCry1Ia2及其制备方法和应用
CN111995690B (zh) * 2020-01-16 2022-10-11 黑龙江大鹏农业有限公司 一种人工合成的抗虫蛋白mCry1Ia2及其制备方法和应用

Also Published As

Publication number Publication date
US20030017571A1 (en) 2003-01-23
JP4389075B2 (ja) 2009-12-24
IL129988A0 (en) 2000-02-29
US20040171120A1 (en) 2004-09-02
WO1998022595A1 (en) 1998-05-28
US6951922B2 (en) 2005-10-04
US7250501B2 (en) 2007-07-31
JP2001502555A (ja) 2001-02-27
AP9901541A0 (en) 1999-06-30
CN1210402C (zh) 2005-07-13
US6281016B1 (en) 2001-08-28
PT942985E (pt) 2004-12-31
DE69730730D1 (de) 2004-10-21
EP0942985A1 (en) 1999-09-22
US20020064865A1 (en) 2002-05-30
AU742971B2 (en) 2002-01-17
US20030182682A1 (en) 2003-09-25
CA2272843A1 (en) 1998-05-28
CA2272843C (en) 2009-11-10
DE69730730T2 (de) 2005-09-22
BR9713373A (pt) 2001-06-19
IL129988A (en) 2009-09-01
ID25530A (id) 2000-10-12
TR199901109T2 (xx) 1999-10-21
US6538109B2 (en) 2003-03-25
US20060014936A1 (en) 2006-01-19
ES2229395T3 (es) 2005-04-16
US6242241B1 (en) 2001-06-05
ATE276367T1 (de) 2004-10-15
US6746871B2 (en) 2004-06-08
EP0942985B1 (en) 2004-09-15
OA11257A (en) 2003-07-23
AU5362898A (en) 1998-06-10
US6521442B2 (en) 2003-02-18

Similar Documents

Publication Publication Date Title
CN1210402C (zh) 广谱δ-内毒素
CN100340666C (zh) 抗昆虫的转基因植物以及用于改善δ-内毒素抵抗目标昆虫活性的方法
US6713063B1 (en) Broad-spectrum δ-endotoxins
CN1245513C (zh) 对鞘翅类昆虫和栉头蚤属种昆虫有毒的苏云金芽孢杆菌CryET29组合物
CN1245502A (zh) 编码鳞翅目活性的δ-内毒素的DNA和其用途
US7618942B2 (en) Method of using broad-spectrum delta-endotoxins
CN1360632A (zh) 鞘翅目毒性多肽组合物和抗虫转基因植物
US6593293B1 (en) Lepidopteran-active Bacillus thuringiensis δ-endotoxin compositions and methods of use
US6541448B2 (en) Polypeptide compositions toxic to anthonomus insects, and methods of use
CN1241213A (zh) 苏云金芽孢杆菌CryET33和CryET34组合物及其使用
CN1334874A (zh) Cry3B杀虫蛋白在植物中的提高表达
WO1998022595A9 (en) Broad-spectrum delta-endotoxins
WO2002014517A1 (en) BROAD-SPECTRUM δ-ENDOTOXINS
MXPA99004903A (en) Dna encoding lepidopteran-active delta-endotoxins and its use

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: MONSANTO CO.

Free format text: FORMER OWNER: ECOGEN, INC.

Effective date: 20020228

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20020228

Address after: American Missouri

Applicant after: Monsanto, Co.

Address before: American Pennsylvania

Applicant before: Ecogen, Inc.

ASS Succession or assignment of patent right

Owner name: MONSANTO TECHNOLOGY LLC

Free format text: FORMER OWNER: PHARMACIA CORP.

Effective date: 20020327

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20020327

Address after: American Missouri

Applicant after: Monsanto Technology Co., Ltd.

Address before: American Missouri

Applicant before: Pharmacia Corp.

C14 Grant of patent or utility model
GR01 Patent grant
CX01 Expiry of patent term

Granted publication date: 20050713