-
TECHNISCHES
GEBIET
-
Die
Erfindung liegt im technischen Gebiet der Bioinformatik und der
Proteintechnik.
-
HINTERGRUND
-
Zinkfingerproteine
(ZFPs) sind Proteine, die an DNA auf sequenzspezifische Weise binden
können. Zinkfinger
wurden zuerst im Transkriptionsfaktor TFIIIA aus den Oozyten des
Afrikanischen Krallenfrosches Xenopus laevis identifiziert. Ein
beispielhaftes Motiv, das eine Klasse von diesen Proteinen charakterisiert (C2H2-Klasse) ist -Cys-(X)2-4-Cys-(X)12-His
(X)3-5-His (wobei X eine beliebige Aminosäure ist).
Die Domäne
eines einzelnen Fingers ist ungefähr 30 Aminosäuren lang,
und mehrere Strukturstudien haben gezeigt, dass er eine Alphahelix
enthaltend zwei invariante Histidinreste und zwei invariante Cysteinreste
in einem Beta-Turn durch Zink koordiniert enthält. Bis heute wurden in mehreren
Tausend bekannten oder putativen Transkriptionsfaktoren über 10.000
Zinkfingersequenzen identifiziert. Zinkfingerdomänen sind nicht nur in die DNA-Erkennung
involviert, sondern auch in RNA-Bindung und in Protein-Protein-Bindung.
Laufende Schätzungen
besagen, dass diese Klasse von Molekülen etwa 2 % aller menschlichen
Gene bildet.
-
Die
Röntgenkristallstruktur
von Zif268, einer Domäne
mit drei Fingern aus einem murinen Transkriptionsfaktor wurde als
Komplex mit einer verwandten DNA-Sequenz
aufgeklärt
und zeigt, dass jeder Finger dem nächsten durch periodische Rotation überlagert
werden kann. Die Struktur deutet darauf hin, dass jeder Finger unabhängig über Intervalle
aus 3 Basenpaaren mit DNA interagiert, wobei sie mit Seitenketten
an den Positionen –1,
2, 3 und 6 auf jeder Erkennungshelix mit ihren jeweiligen DNA-Triplett-Teilorten
Kontakte bildet. Der Aminoterminus von Zif268 befindet sich am 3'-Ende des DNA-Strangs,
mit dem es am meisten Kontakte macht. Neuere Ergebnisse haben gezeigt,
dass einige Zinkfinger an eine vierte Base im Zielsegment binden können. Wenn
der Strang, mit dem das Zinkfingerprotein die meisten Kontakte macht,
als der Zielstrang bezeichnet wird, binden einige Zinkfingerproteine
an ein Dreibasentriplett im Zielstrang und eine vierte Base auf dem
Nichtzielstrang. Die vierte Base ist komplementär zu der Base direkt 3' des Teilortes aus
drei Basen.
-
Die
Struktur des Zif268-DNA-Komplexes legt ebenso nahe, dass die DNA-Sequenzspezifität eines Zinkfingerproteins
durch Substitutionen von Aminosäuren
an den vier Helixpositionen (–1,
2, 3 und 6) auf jeder der Erkennungshelices des Zinkfingers verändert werden
könnte.
Phage-Display-Experimente, die kombinatorische Bibliotheken von
Zinkfingern verwenden, um diese Beobachtung zu testen, wurden in
einer Serie von Veröffentlichungen
im Jahre 1994 publiziert (Rebar et al., Science 263, 671-673 (1994);
Jamieson et al., Biochemistry 33, 5689-5695 (1994); Choo et al.,
PNAS 91, 11163-11167 (1994)). Kombinatorische Bibliotheken wurden
mit randomisierten Seitenketten in entweder dem ersten oder mittleren
Finger von Zif268 konstruiert und anschließend zur Auswahl eines veränderten
Zif268-Bindungsortes verwendet, in dem der passende DNA-Teilort
durch ein geändertes
DNA-Triplett ersetzt war. Weiterhin führte die Korrelation zwischen
der Natur der eingeführten
Mutationen und den resultierenden Veränderungen der Bindungsspezifität zu einer
partiellen Reihe von Substitutionsregeln zur Konstruktion von ZFPs
mit geänderter
Bindungsspezifität.
-
Greisman & Pabo, Science
275, 657-661 (1997) diskutieren eine Weiterentwicklung der Phage-Display-Methode,
in der jeder Finger eines Zif268 sukzessive randomisiert und zur
Bindung einer neuen Triplettsequenz ausgewählt wurde. Diese Publikation
berichtete über
die Auswahl von ZFPs für
ein hormonresponsives Element des Kerns, für einen p53-Zielort und für eine Sequenz
für eine
TATA-Box.
-
Eine
Anzahl von Publikationen hat über
Versuche berichtet, ZFPs zur Modulation bestimmter Zielorte herzustellen.
Zum Beispiel berichten Choo et al., Nature 372, 645 (1994) über einen
Versuch, ein ZFP zu konstruieren, das die Expression eines brc-abl-Onkogens
reprimieren würde.
Das Zielsegment, an das das ZFP binden würde, war eine Sequenz aus neun
Basen 5'GCA GAA3' GCC, die zur Überlappung
der Verbindung gewählt
wurde, die durch eine spezifische onkogene Translokation geschaffen
wurde, welche die für
brc und abl kodierenden Gene fusioniert. Die Intention war, dass
ein ZFP, welches spezifisch für
diesen Zielort ist, an das Onkogen binden würde, ohne an abl- oder brc-Teilgene
zu binden. Die Autoren verwendeten Phage-Display, um eine Minibibliothek
von variierenden ZFPs auf die Bindung an dieses Zielsegment zu mustern.
Es wurde dann berichtet, dass ein dadurch isoliertes abweichendes
ZFP die Expression eines stabil transfizierten brc-fähigen Konstruktes
in einer Zelllinie reprimiert.
-
Pomerantz
et al., Science 267, 93-96 (1995) berichteten über einen Versuch, ein neues
DNA-bindendes Protein durch Fusion von zwei Fingern aus Zif268 mit
einer Homöodomäne aus Oct-1
zu konstruieren. Das Hybridprotein wurde dann mit einem transkriptionellen
Aktivator zur Expression als chimäres Protein fusioniert. Es
wurde berichtet, dass das chimäre
Protein an einen Zielort bindet, der ein Hybrid von Teilorten seiner
beiden Bestandteile darstellt. Die Autoren konstruierten dann einen
Reportervektor, der ein operativ mit einem Promotor verknüpftes Luciferasegen
und einen Hybridort für
das chimäre
DNA-Bindungsprotein in der Nähe
des Promotors enthielt. Die Autoren berichteten, dass ihr chimäres DNA-Bindungsprotein die
Expression des Luciferasegens aktivieren konnte.
-
Liu
et al., PNAS 94, 5525-5530 (1997) berichten über die Bildung eines zusammengesetzten
Zinkfingerproteins durch Verwenden eines Peptid-Distanzstückes, um zweifingerige Zinkfingerproteine
zu verbinden, die jeweils drei Finger aufweisen. Anschließend wurde
das zusammengesetzte Protein dann mit einer transkriptionellen Aktivierungsdomäne verbunden.
Es wurde berichtet, dass das erhaltene chimäre Protein an einen Zielort
band, der aus den Zielsegmenten gebildet wurde, welche durch die
beiden einzelnen Zinkfingerproteine gebunden wurden. Weiterhin wurde
berichtet, dass das chimäre
Zinkfingerprotein die Transkription eines Reportergens aktivieren
konnte, als ihr Zielort in ein Reporterplasmid in der Nähe eines
Promotors inseriert wurde, der operativ mit dem Reporter verbunden
war.
-
Choo
et al., WO 98/53058, WO98/53059 und WO 98/53060 (1998) diskutieren
eine Auswahl von Zinkfingerproteinen zur Bindung an einen Zielort
innerhalb des HIV-Tat-Gens. Choo et al. diskutieren ebenfalls die Auswahl
eines Zinkfingerproteins zur Bindung an einen Zielort, der einen
Ort einer üblichen
Mutation im Onkogen ras umfasst. Der Zielort innerhalb von ras wurde
daher durch die Position der Mutation eingeschränkt.
-
Keine
der obigen Studien stellte Kriterien für die systematische Beurteilung
der jeweiligen Vorzüge
der verschiedenen möglichen
Zielorte innerhalb eines Kandidatengens bereit. Die Phage-Display-Studien
von Rebar et al., supra, Jamieson et al., supra und Choo et al.,
PNAS (1994), supra, konzentrierten sich alle auf Veränderungen
der natürlichen
Zif268-Bindungsstelle 5'GCG
TGG GCGc3' und wurden
nicht in Bezug auf ein vorbestimmtes Zielgen durchgeführt. Die
Auswahl eines Zielortes von Choo et al., Nature (1994), supra, war
allein durch die Intention eingeschränkt, dass der Ort das Verbindungsstück zwischen
brc- und abl-Segmenten überlappt
und bezog keinen Vergleich zwischen verschiedenen potentiellen Zielorten
ein. Entsprechend wählten Greisman & Pabo bestimmte
Zielorte wegen ihrer bekannten regulatorischen Rollen und betrachteten
nicht die relativen Vorzüge
verschiedener möglicher
Zielsegmente innerhalb eines vorgewählten Zielgens. Ähnlich war die
Wahl des Zielortes von Choo et al. (1998), supra, innerhalb von
ras durch die Position der Mutation eingeschränkt. Durch die Auswahl eines
Zielortes in HIV-Tat von Choo et al. (1998) wird kein Kriterium
für die
Auswahl bereitgestellt. Schließlich
konstruierten sowohl Pomerantz et al., supra und Liu et al., supra,
künstliche hybride
Zielorte für
zusammengesetzte Zinkfinger und inserierten den Zielort in Reporterkonstrukte.
-
ZUSAMMENFASSUNG
DER ERFINDUNG
-
Die
Erfindung stellt Verfahren zur Konstruktion eines Zinkfingerproteins
oder einer DNA kodierend dieses Zinkfingerprotein bereit. Einige
solcher Verfahren umfassen das Bereitstellen einer Zielnukleinsäure zum Targeting
durch ein Zinkfingerprotein und Ausgeben eines Zielortes innerhalb
der Zielnukleinsäure
umfassend 5'NNx
aNy bNzc3'. Jedes
von (x,a), (y,b) und (z,c) ist (N,N) oder (G,K), vorausgesetzt,
wenigstens eines von (x,a), (y,b) und (z,c) ist (G,K). N und K sind
mehrdeutige Abkürzungen
entsprechend IUPAC-IUB. In einigen Verfahren werden mehrere Segmente
innerhalb der Zielnukleinsäure
ausgewählt,
und ein Teilsatz der mehreren Segmente umfassend 5'NNX aNy bNzc3' wird ausgegeben.
Typischerweise umfasst die Zielnukleinsäure ein Zielgen. In einigen
Verfahren sind wenigstens zwei (x,a), (y,b) und (z,c) (G,K). In
einigen Verfahren sind alle drei (x,a), (y,b) und (z,c) (G,K). Einige
Verfahren umfassen weiterhin Identifizieren eines zweiten Segmentes eines
Gens umfassend 5'NNx
aNy bNzc3', wobei
jedes von (x,a), (y,b) und (z,c) (N,N) oder (G,K) ist; wenigstens
eines von (x,a), (y,b) und (z,c) ist (G,K), und N und K sind mehrdeutige
Abkürzungen
entsprechend IUPAC-IUB.
In einigen Verfahren sind im zweiten Segment wenigstens zwei von
(x,a), (y,b) und (z,c) (G,K). In einigen Verfahren sind alle drei
von wenigstens einem von (x,a); (y,b) und (z,c) (G,K). In einigen
Verfahren sind das erste und das zweite Segment durch weniger als
5 Basen im Zielort voneinander getrennt.
-
In
einigen Verfahren umfasst des das erste Segment 5'NNN NNN NNG'3, das zweite Segment
umfasst 5'KNx aNY
bNZe3' und es liegen
keine Basen vor, welche das erste und zweite Zielsegment im Zielort
trennen.
-
Einige
Verfahren umfassen weiterhin Synthetisieren eines Zinkfingerproteins
umfassend einen ersten, zweiten und dritten Finger, die jeweils
an die bNz-, aNy- und
NNx-Tripletts binden. In einigen derartigen Verfahren umfasst der
Syntheseschritt Synthetisieren eines ersten Zinkfingerproteins umfassend
drei Zinkfinger, die an die NNx-, aNy- und bNz-Tripletts im Zielsegment
binden und weitere drei Finger, die jeweils an die NNx-, aNy- und
bNz-Tripletts im zweiten Zielsegment binden. In einigen Verfahren
wird jeder der ersten, zweiten und dritten Finger unabhängig voneinander
ausgewählt
oder konstruiert.
-
Einige
Verfahren umfassen weiterhin Inkontaktbringen einer Probe enthaltend
die Zielnukleinsäure
mit dem Zinkfingerprotein, wobei das Zinkfingerprotein an den Zielort
bindet, wobei das Vorhandensein der Zielnukleinsäure oder einer bestimmten allelischen
Form davon angezeigt wird. In einigen Verfahren wird eine Probe
enthaltend die Zielnukleinsäure
mit dem Zinkfingerprotein in Kontakt gebracht, wobei das Zinkfingerprotein an
den Zielort bindet und hierbei die Expression der Zielnukleinsäure moduliert.
-
In
einigen Verfahren tritt der Zielort in einer kodierenden Region
auf. In einigen Verfahren tritt der Zielort innerhalb oder benachbart
zu einem Promotor, Enhancer oder einem Transkriptionsstart auf.
In einigen Verfahren tritt der Zielort außerhalb eines Promotors, einer
regulatorischen Sequenz oder einer polymorphen Stelle innerhalb
der Zielnukleinsäure
auf.
-
Es
können
auch alternative Verfahren zur Auswahl eines Zielortes innerhalb
eines Polynukleotides zum Targeting durch ein Zinkfingerprotein
zur Durchführung
der vorliegenden Erfindung verwendet werden. Diese Verfahren umfassen
Bereitstellen einer Polynukleotidsequenz und Auswählen eines
möglichen
Zielortes innerhalb der Polynukleotidsequenz, wobei der mögliche Zielort
aufeinander folgende erste, zweite und dritte Basentripletts an
ersten, zweiten und dritten Positionen im möglichen Zielort umfasst. Mehrere
Teilscores werden dann durch die Anwendung von Korrespondenzregeln
zwischen Tripletts und Triplettposition in einer Sequenz von drei
aufeinander folgenden Tripletts bestimmt, wobei jedes Triplett erste,
zweite und dritte entsprechende Positionen hat, und jede Kombination
von Triplett und Triplettposition einen bestimmten Teilscore hat. Ein
Score wird dann für
den möglichen
Zielort durch die Kombination von Teilscores für das erste, zweite und dritte
Triplett berechnet. Die Schritte zur Auswahl, Bestimmung und Berechnung
werden dann wenigstens einmal für
einen weiteren möglichen
Zielort umfassend ein erstes, zweites und drittes Triplett an einer
ersten, zweiten und dritten Position des weiteren möglichen
Zielortes wiederholt, um einen weiteren Score zu bestimmen. Ausgegeben
wird dann wenigstens ein möglicher
Zielort mit seinem Score. In einigen Verfahren wird der mögliche Zielort
mit dem höchsten
Score ausgegeben. In einigen Verfahren werden die n möglichen
Zielorte mit den höchsten
Scores ausgegeben, und das Verfahren umfasst weiterhin die Eingabe
eines Wertes für
n durch den Benutzer. In einigen Verfahren werden die Teilscores
durch die Bildung des Produktes der Teilscores gebildet. In einigen
Verfahren umfassen die Korrespondenzregeln 64 Tripletts, von denen
jedes eine erste, zweite und dritte entsprechende Position hat,
und 192 Teilscores.
-
In
einigen Verfahren werden die Teilscores mit Korrespondenzregeln
durch Zuweisen eines ersten Wertes als der Teilscore eines Teilsatzes
von Tripletts und entsprechenden Positionen bestimmt, für die es
alle ein existierendes Zinkfingerprotein gibt, das einen Finger
umfasst, der spezifisch an das Triplett mit derselben Position im
existierenden Zinkfingerprotein im Vergleich zu der entsprechenden
Position des Tripletts der Korrespondenzregeln bindet; durch Zuweisen
eines zweiten Wertes als der Teilscore eines Teilsatzes von Tripletts und
entsprechenden Positionen, für
die es alle ein existierendes Zinkfingerprotein gibt, das einen
Finger umfasst, der spezifisch an das Triplett mit unterschiedlicher
Position im existierenden Zinkfingerprotein im Vergleich zu der
entsprechenden Position des Tripletts der Korrespondenzregeln bindet;
und durch Zuweisen eines dritten Wertes als der Teilscore eines
Teilsatzes von Tripletts und entsprechenden Positionen, für die es kein
existierendes Zinkfingerprotein gibt, das einen Finger umfasst,
der spezifisch an das Triplett bindet.
-
In
einigen Verfahren ist ein Kontextparameter für den Teilscore von wenigstens
einem des ersten, zweiten und dritten Tripletts vorhanden, um einen
skalierten Teilscore des wenigstens einen Tripletts zu ergeben.
In einigen Verfahren wird der Kontextparameter mit dem Teilscore
kombiniert, wenn der Zielort eine Basensequenz 5'NNGK3' umfasst, wobei NNG das wenigstens eine
Triplett ist.
-
Die
Erfindung stellt Verfahren zur Konstruktion eines Zinkfingerproteins
oder einer dieses Zinkfingerprotein kodierenden DNA bereit. Derartige
Verfahren verwenden eine Datenbank umfassend Bezeichnungen für mehrere
Zinkfingerproteine, jedes Protein umfassend wenigsten einen ersten,
zweiten und dritten Finger, und Unterbezeichnungen für jeden
der drei Finger von jedem der Zinkfingerproteine; eine entsprechende
Nukleinsäuresequenz
für jedes
Zinkfingerprotein, jede Sequenz umfassend wenigstens ein erstes,
zweites und drittes Triplett spezifisch gebunden durch den wenigstens
ersten, zweiten bzw. dritten Finger in jedem Zinkfingerprotein,
wobei das erste, zweite und dritte Triplett in der Nukleinsäuresequenz
(3'-5') in der entsprechenden Reihenfolge
angeordnet sind wie der erste, zweite und dritte Finger im Zinkfingerprotein
angeordnet sind (N-terminal bis C-terminal). Ein Zielort wird für die Konstruktion
eines Zinkfingerproteins bereitgestellt, wobei der Zielort aufeinander
folgende erste, zweite und dritte Tripletts in 3'-5'-Reihenfolge
umfasst. Für
das erste, zweite und dritte Triplett im Zielort werden erste, zweite
und dritte Sätze
von Zinkfingerprotein(en) in der Datenbank identifiziert, wobei
der erste Satz Zinkfingerprotein(e) umfasst, die einen Finger umfassen,
der spezifisch an das erste Triplett im Zielort bindet, der zweite
Satz Zinkfingerprotein(e) umfasst, die einen Finger umfassen, der
spezifisch an das zweite Triplett im Zielort bindet, der dritte
Satz Zinkfingerprotein(e) umfasst, die einen Finger umfassen, der
spezifisch an das dritte Triplett im Zielort bindet. Bezeichnungen
und Unterbezeichnungen der Zinkfingerproteine im ersten, zweiten
und dritten Satz, die in Schritt (c) identifiziert werden, werden
dann ausgegeben. Einige Verfahren umfassen weiterhin das Herstellen
eines Zinkfingerproteins, das an den Zielort bindet, der einen ersten
Finger eines Zinkfingerproteins des ersten Satzes, einen zweiten
Finger eines Zinkfingerproteins des zweiten Satzes und einen dritten
Finger eines Zinkfingerproteins des dritten Satzes umfasst.
-
Einige
Verfahren umfassen weiterhin Identifizieren von Teilsätzen des
ersten, zweiten und dritten Satzes. Der Teilsatz des ersten Satzes
umfasst Zinkfingerprotein(e), die einen Finger umfassen, der spezifisch
an das erste Triplett im Zielort der Position des ersten Fingers
eines Zinkfingerproteins in der Datenbank bindet. Der Teilsatz des
zweiten Satzes umfasst Zinkfingerprotein(e), die einen Finger umfassen,
der spezifisch an das zweite Triplett im Zielort der Position des
zweiten Fingers eines Zinkfingerproteins in der Datenbank bindet,
der Teilsatz des dritten Satzes umfasst Zinkfingerprotein(e); die
einen Finger umfassen, der spezifisch an das dritte Triplett im
Zielort der Position des dritten Fingers eines Zinkfingerproteins
in der Datenbank bindet. Bezeichnungen und Unterbezeichnungen des
Teilsatzes des ersten, zweiten und dritten Satzes werden ausgegeben. Dann
wird ein Zinkfingerprotein hergestellt, das einen ersten Finger
des ersten Teilsatzes, einen zweiten Finger des zweiten Teilsatzes
und einen dritten Finger des dritten Teilsatzes umfasst. In einigen
der obigen Konstruktionsverfahren wird der Zielort durch eine Eingabe über einen
Benutzers bereitgestellt. In einigen Verfahren wird der Zielort
durch eines der Auswahlverfahren für den Zielort wie oben beschrieben
bereitgestellt.
-
Die
Erfindung stellt weiterhin Computerprogrammprodukte zur Implementierung
von beliebigen der oben beschriebenen Verfahren bereit. Ein Computerprogrammprodukt
implementiert Verfahren zur Auswahl eines Zielortes innerhalb eines
Polynukleotides zum Targeting durch ein Zinkfingerprotein. Ein derartiges
Produkt umfasst (a) einen Code zum Bereitstellen einer Polynukleotidsequenz;
(b) einen Code zur Auswahl eines möglichen Zielortes innerhalb
der Polynukleotidsequenz; wobei der mögliche Zielort ein erstes,
zweites und drittes Basentriplett an erster, zweiter und dritter
Position in dem möglichen
Zielort umfasst; (c) einen Code zum Berechnen eines Scores für den möglichen
Zielort aus einer Kombination von Teilscores für das erste, zweite und dritte
Triplett; wobei die Teilscores aus Korrespondenzregeln zwischen
Tripletts und Triplettpositionen erhalten werden, wobei jedes Triplett
erste, zweite und dritte entsprechende Positionen hat und jeweils
entsprechende Tripletts und Positionen einen besonderen Teilscore
haben; (d) einen Code zum wenigstens einmaligen Wiederholen der
Schritte (b) und (c) für
einen weiteren möglichen
Zielort umfassend ein erstes, zweites und drittes Triplett an erster,
zweiter und dritter Position des weiteren möglichen Zielortes, um einen
weiteren Score zu bestimmen; e) einen Code um wenigstens einen der
möglichen
Zielorte mit seinem Score auszugeben; und (f) ein computerlesbares
Speichermedium, um die Codes zu speichern.
-
Die
Erfindung stellt weiterhin Computersysteme zur Implementierung von
beliebigen der oben beschriebenen Verfahren bereit. Ein derartiges
System zur Auswahl eines Zielortes innerhalb einer Polynukleotidsequenz
zum Targeting durch ein Zinkfingerprotein umfasst (a) einen Speicher;
(b) einen Systembus; und (c) einen Prozessor. Der Prozessor ist
operativ bestimmt: (1) zum Bereitstellen oder Empfangen einer Polynukleotidsequenz;
(2) zur Auswahl eines möglichen
Zielortes innerhalb der Polynukleotidsequenz; wobei der mögliche Zielort
ein erstes, zweites und drittes Basentriplett an erster, zweiter
und dritter Position in dem möglichen
Zielort umfasst; (3) zum Berechnen eines Scores für den möglichen
Zielort aus einer Kombination von Teilscores für das erste, zweite und dritte
Triplett; wobei die Teilscores aus Korrespondenzregeln zwischen
Tripletts und Triplettpositionen erhalten werden, wobei jedes Triplett
erste, zweite und dritte entsprechende Positionen hat und jeweils
entsprechende Tripletts und Positionen einen besonderen Teilscore
haben; (4) zum Wiederholen der Schritte (2) und (3) wenigstens einmal
für einen
weiteren möglichen
Zielort umfassend ein erstes, zweites und drittes Triplett an erster,
zweiter und dritter Position des weiteren möglichen Zielortes, um einen weiteren
Score zu bestimmen; (5) zum Ausgeben wenigstens eines der möglichen
Zielorte mit seinem Score.
-
Ein
weiteres Computerprogrammprodukt zum Herstellen eines Zinkfingerproteins
umfasst: (a) einen Code zum Bereitstellen einer Datenbank umfassend
Bezeichnungen für
mehrere Zinkfingerproteine, wobei jedes Protein wenigsten einen
ersten, zweiten und dritten Finger umfasst; Unterbezeichnungen für jeden
der drei Finger von jedem der Zinkfingerproteine; eine entsprechende
Nukleinsäuresequenz
für jedes
Zinkfingerprotein, wobei jede Sequenz wenigstens ein erstes, zweites
und drittes Triplett spezifisch gebunden durch den wenigstens ersten,
zweiten bzw. dritten Finger in jedem Zinkfingerprotein umfasst,
wobei das erste, zweite und dritte Triplett in der Nukleinsäuresequenz
(3'-5') in der entsprechenden
Reihenfolge angeordnet ist wie der erste, zweite und dritte Finger
im Zinkfingerprotein angeordnet ist (N-Terminus bis C-Terminus);
(b) einen Code zum Bereitstellen eines Zielortes zur Konstruktion
eines Zinkfingerproteins, wobei der Zielort erste, zweite und dritte
Tripletts umfasst; (c) einen Code zum Identifizieren erster, zweiter
und dritter Sätze
von Zinkfingerprotein(en) in der Datenbank für das erste, zweite und dritte
Triplett im Zielort, wobei der erste Satz Zinkfingerprotein(e) umfasst,
die einen Finger umfassen, der spezifisch an das erste Triplett
im Zielort bindet, der zweite Satz einen Finger umfasst, der spezifisch
an das zweite Triplett im Zielort bindet, der dritte Satz einen
Finger umfasst, der spezifisch an das dritte Triplett im Zielort
bindet; (d) einen Code zum Ausgeben von Bezeichnungen und Unterbezeichnungen
der Zinkfingerproteine im ersten, zweiten und dritten Satz identifiziert
in Schritt (c), und (e) ein computerlesbares Speichermedium, um
die Codes zu speichern.
-
Die
Erfindung stellt weiterhin ein System zum Herstellen eines Zinkfingerproteins
bereit. Das System umfasst: (a) einen Speicher; (b) einen Systembus
und (c) einen Prozessor. Der Prozessor ist operativ bestimmt: (1)
zum Bereitstellen einer Datenbank umfassend Bezeichnungen für mehrere
Zinkfingerproteine, wobei jedes Protein wenigsten einen ersten,
zweiten und dritten Finger umfasst; Unterbezeichnungen für jeden der
drei Finger von jedem der Zinkfingerproteine; eine entsprechende
Nukleinsäuresequenz
für jedes
Zinkfingerprotein, wobei jede Sequenz wenigstens ein erstes, zweites
und drittes Triplett spezifisch gebunden durch den wenigstens ersten,
zweiten bzw. dritten Finger in jedem Zinkfingerprotein umfasst,
wobei das erste, zweite und dritte Triplett in der Nukleinsäuresequenz
(3'-5') in der entsprechenden
Reihenfolge angeordnet ist wie der erste, zweite und dritte Finger
im Zinkfingerprotein angeordnet ist (N-Terminus bis C-Terminus);
(2) zum Bereitstellen eines Zielortes zur Konstruktion eines Zinkfingerproteins,
wobei der Zielort erste, zweite und dritte Tripletts umfasst; (3)
zum Identifizieren erster, zweiter und dritter Sätze von Zinkfingerprotein(en)
in der Datenbank für
das erste, zweite und dritte Triplett im Zielort, wobei der erste
Satz Zinkfingerprotein(e) umfasst, die einen Finger umfassen, der
spezifisch an das erste Triplett im Zielort bindet, der zweite Satz
einen Finger umfasst, der spezifisch an das zweite Triplett im Zielort
bindet, der dritte Satz einen Finger umfasst, der spezifisch an
das dritte Triplett im Zielort bindet; und (4) zum Ausgeben von
Bezeichnungen und Unterbezeichnungen der Zinkfingerproteine im ersten,
zweiten und dritten Satz, die in Schritt (3) identifiziert wurden.
-
KURZE BESCHREIBUNG
DER ABBILDUNGEN
-
1 zeigt
ein Diagramm mit Daten, die die Anwesenheit und die Zahl von Teilorten
eines Zielortes gebunden durch ein Zinkfingerprotein mit der Bindungsaffinität korrelieren.
-
2 zeigt
ein Zinkfingerprotein mit drei Fingern gebunden an einen Zielort,
der drei D-fähige
Teilorte enthält.
-
3 zeigt
den Prozess des Zusammenfügens
einer Nukleinsäure
kodierend ein konstruiertes ZFP.
-
Die 4 und 5 zeigen
Computersysteme zur Implementierung von Verfahren zur Auswahl eines
Zielortes und zur Konstruktion von Zinkfingerproteinen.
-
6 zeigt
ein Flussdiagramm eines Verfahrens zur Auswahl eines Zielortes enthaltend
einen D-fähigen
Teilort innerhalb der Zielsequenz.
-
7A zeigt
ein Flussdiagramm zur Auswahl eines Zielortes innerhalb einer Zielsequenz
unter Verwendung von Korrespondenzregeln.
-
7B zeigt
ein Flussdiagramm zur Konstruktion eines ZFPs unter Verwendung einer
Datenbank zum Binden an einen gewünschten Zielort.
-
8A ist
ein vollständiges
Repräsentationsdiagramm
einer ZFP-Datenbank.
-
8B ist
die Repräsentation
einer ZFP-Datenbank.
-
DEFINITIONEN
-
Ein
Zinkfinger-DNA-bindendes Protein ist ein Protein oder Segment innerhalb
eines größeren Proteins,
das DNA auf eine sequenzspezifische Weise als Ergebnis einer Stabilisierung
einer Proteinstruktur durch Koordination eines Zinkions bindet.
Der Begriff Zinkfinger-DNA-bindendes Protein wird oft als Zinkfingerprotein oder
ZFP abgekürzt.
-
Ein
konstruiertes Zinkfingerprotein ist ein Protein, das nicht in der
Natur auftritt, dessen Konstruktion/Zusammenstellen sich prinzipiell
aus rationalen Kriterien ergibt. Rationale Kriterien zur Konstruktion
schließen die Anwendung von Substitutionsregeln und computerisierten
Algorithmen zur Verarbeitung von Informationen in einer Datenbank
ein, die Informationen über
existierende ZFP-Konstrukte
und -Bindungsdaten speichert.
-
Ein
ausgewähltes
Zinkfingerprotein ist ein Protein, das nicht in der Natur gefunden
wird und dessen Herstellung in erster Linie aus einem empirischen
Prozess wie z. B. Phage display resultiert.
-
Der
Begriff "in der
Natur auftretend" wird
zur Unterscheidung von "künstlich
durch den Menschen hergestellt" verwendet,
um ein Objekt zu beschreiben, das in der Natur gefunden werden kann.
Zum Beispiel ist eine Polypeptid- oder Polynukleotidsequenz "in der Natur auftretend", wenn sie in einem
Organismus vorkommt (einschließlich
Viren), aus einer natürlichen
Quelle isoliert werden kann und nicht absichtlich durch den Menschen
im Labor verändert
wurde. Generell bezieht sich der Begriff "in der Natur auftretend" auf ein Objekt, das
in einem nichtpathologischen (nichtkranken) Individuum vorhanden
ist, wie es für
die Spezies typisch ist.
-
Eine
Nukleinsäure
ist operativ verknüpft,
wenn sie in eine funktionellen Beziehung mit einer anderen Nukleinsäuresequenz
gebracht wird. Zum Beispiel ist ein Promotor oder Enhancer operativ
mit einer kodierenden Sequenz verknüpft, wenn er die Transkription
der kodierenden Sequenz erhöht.
Operativ verknüpft
bedeutet, dass die DNA-Sequenzen, die miteinander verbunden sind, typischerweise
aufeinander folgen, und wo sie zum Verbinden von zwei für Proteine
kodierenden Regionen notwendig ist, folgen sie im selben Leseraster
aufeinander. Da jedoch Enhancer generell funktionieren, wenn sie
vom Promotor durch bis zu mehrere Kilobasen oder mehr getrennt sind,
und intronische Sequenzen eine variable Länge haben können, können einige Polynukleotidelemente
operativ verknüpft
sein, aber nicht aufeinander folgen.
-
Eine
spezifische Bindungsaffinität
zwischen z. B. einem ZFP und einem spezifischen Zielort bedeutet eine
Bindungsaffinität
von wenigstens 1 × 106 M–1.
-
Die
Begriffe "die Expression
eines Gens modulierend", "die Expression eines
Gens inhibierend" und "die Expression eines
Gens aktivierend" beziehen
sich auf die Fähigkeit
eines Zinkfingerproteins, die Transkription eines Gens zu aktivieren
oder zu inhibieren. Aktivierung schließt die Verhinderung nachfolgender
transkriptioneller Inhibition ein (z. B. Verhinderung der Repression
einer Genexpression), und Inhibition schließt die Verhinderung nachfolgender
transkriptioneller Aktivierung ein (z. B. Verhinderung von Genaktivierung).
Modulation kann durch Bestimmen beliebiger Parameter geprüft werden,
die indirekt oder direkt durch die Expression eines Zielgens betroffen
sind. Solche Parameter schließen
z. B. Veränderungen
der RNA- oder Proteinspiegel ein, Veränderungen der Proteinaktivität, Veränderungen
der Produktspiegel, Veränderungen
der stromabwärts
stattfindenden Genexpression, Veränderungen der Transkription
von Reportergenen (Luciferase, CAT, beta-Galactosidase, GFP (siehe
z. B. Mistili & Spector,
Nature Biotechnology, 15:961-964 (1997)); Veränderungen der Signaltransduktion,
Phosphorylierung und Dephosphorylierung, Rezeptor-Ligand-Interaktionen,
Konzentrationen sekundärer
Botenstoffe (z.B. cGMP, cAMP, IP3 und Ca2+), Zellwachstum, Neovaskularisation,
in vitro, in vivo und ex vivo. Derartige funktionale Effekte können durch
beliebige Mittel, die dem Fachmann bekannt sind, gemessen werden,
z. B. durch Messen von RNA- oder Proteinspiegeln, Messen von RNA-Stabilität, Identifizieren
von stromabwärts
stattfindender Expression oder Reportergenexpression, z. B. durch
Chemilumineszenz, Fluoreszenz, Kolorimetrische Reaktionen, Antikörperbindung,
induzierbare Marker, Ligandenbindungsversuche; Veränderungen
der intrazellulären
sekundären
Botenstoffe wie z. B. cGMP und Inositoltriphosphat (IP3); Veränderungen
der intrazellulären
Calciumspiegel; Freisetzung von Zytokinen und dergleichen.
-
Eine "regulatorische Domäne" bezieht sich auf
ein Protein oder eine Teilsequenz eines Proteins, das/die eine Aktivität zur transkriptionellen
Modulation aufweist. Typischerweise ist eine regulatorische Domäne kovalent
oder nichtkovalent an ein ZFP gebunden, um die Transkription zu
modulieren. Alternativ kann ein ZFP alleine ohne eine regulatorische
Domäne
oder mit mehreren regulatorischen Domänen wirken, um die Transkription
zu modulieren.
-
Ein
D-fähiger
Teilort innerhalb eines Zielortes weist das Motiv 5'NNGK3' auf. Ein Zielort,
der ein oder mehrere derartige Motive enthält, wird manchmal als ein D-fähiger Zielort beschrieben.
Ein Zinkfinger, der entsprechend konstruiert ist, um an einen D-fähigen Teilort
zu binden, wird manchmal als ein D-fähiger Finger bezeichnet. Ebenso
wird ein Zinkfingerprotein, das wenigstens einen Finger enthält, der
konstruiert oder ausgewählt
wird, um an einen Zielort zu binden, der wenigstens einen D-fähigen Teilort
einschließt,
manchmal als D-fähiges
Zinkfingerprotein bezeichnet.
-
AUSFÜHRLICHE BESCHREIBUNG
-
I. Allgemeines
-
Die
Erfindung ist auf Verfahren zur Konstruktion eines Zinkfingerproteins
oder einer dieses Zinkfingerprotein kodierenden DNA gerichtet, das/die
zur Verwendung bei der Modulation oder Detektion des Gens gedacht
ist. Die Größe eines
möglichen
Zielgens kann über
einen weiten Bereich von um 100 bis zu mehreren 100.000 bp variieren.
Ein Zinkfingerprotein kann an eine kurze Teilsequenz oder einen
Zielort innerhalb eines solchen Gens binden. Zum Beispiel binden
Zinkfingerproteine, die drei Finger enthalten, typischerweise an neun
oder zehn Basen eines Zielgens.
-
Einige
Verfahren zur Auswahl eines Zielortes versuchen, ein oder mehrere
Zielsegmente zu identifizieren, die ein DNA-Motiv haben, das einen
oder mehrere sogenannte D-fähige
Teilorte enthält.
Ein D-fähiger Teilort
ist durch eine charakteristische DNA-Sequenzformel definiert wie
weiter unten ausführlich
diskutiert. Ein Zinkfingerprotein kann an ein solches Motiv auf
eine Weise binden, dass wenigstens ein einzelner Finger des Zinkfingerproteins
eine zusätzliche
Base außerhalb
des Teilortes aus drei Basen, der normalerweise durch einen Finger
gebunden wird, kontaktiert. Wenn zwei D-fähige Orte im Zielsegment vorhanden
sind, dann können zwei
einzelne Finger eines Zinkfingerproteins jeweils an vier Basen des
Zielortes binden. Wenn drei D-fähige Teilorte
im Zielsegment vorhanden sind, dann können drei einzelne Finger eines
Zinkfingerproteins jeweils an vier Basen des Zielortes binden. Im
Allgemeinen zeigen Zinkfingerproteine, die an Zielorte enthaltend
wenigstens einen D-fähigen
Teilort binden, eine höhere
Bindungsaffinität
als Zinkfingerproteine, die an Zielsegmente binden, denen ein D-fähiger Teilort fehlt. Entsprechend
zeigen Zinkfingerproteine, die an einen Zielort mit zwei D-fähigen Teilorten
binden, generell eine höhere
Bindungsaffinität
als Zinkfingerproteine, die an einen Zielort mit einem D-fähigen Teilort
binden, und Zinkfingerproteine mit drei D-fähigen Teilorten zeigen generell
eine höhere
Bindungsaffinität
als Zinkfingerproteine, die an einen Zielort mit zwei D-fähigen Teilorten
binden. Obwohl ein Verständnis
des Mechanismus' nicht
notwendig ist, um die Erfindung auszuführen, wird angenommen, dass
die höhere
Bindungsaffinität
aus zusätzlichen
Interaktionen resultiert, die zwischen einem Zinkfinger und vier
Basen eines Zielsegmentes möglich
sind, im Vergleich zu den Interaktionen, die zwischen einem Zinkfinger
und drei Basen in einem Zielsegment möglich sind. Im allgemeinen
macht das Potential zu hochaffinen Bindungen von Zielsegmenten mit
D-fähigen
Teilorten diese zu Zielorten der Wahl aus Zielgenen zur Konstruktion
von Zinkfingerproteinen, weil eine höhere Bindungsaffinität oft stärker aus
der Modulation eines Zielgens resultiert und/oder zu höherer Spezifität bei der
Modulation eines Zielgens führt.
-
Andere
Verfahren sind auf die Auswahl von Zielsegmenten innerhalb eines
Zielgens nach zusätzlichen oder
alternativen Kriterien bezüglich
des D-fähigen
Teilortes gerichtet. Die prinzipiellen Kriterien zur Auswahl von
Zielsegmenten in derartigen Verfahren werden in Form einer Korrespondenzregel
zwischen verschiedenen Tripletts von drei Basen und den drei möglichen
Positionen eines Tripletts innerhalb eines Ortes aus neun Basen
(z. B. Basen 1-3, 4-6 und 7-9) bereitgestellt. Eine beispielhafte
Korrespondenzregel ist in Tabelle 1 gezeigt. Die Korrespondenzregel
stellt verschiedene Werte für
verschiedene Kombinationen von Tripletts und Triplettpositionen
innerhalb eines Zielortes bereit. Ein möglicher Zielort innerhalb eines
Zielgens wird durch Bestimmen eines Scores für den Ort durch Kombination
von Teilscores für
ihre einzelnen Tripletts bewertet, die aus der Korrespondenzregel
erhalten wurden. Die Scores von verschiedenen möglichen Zielorten werden verglichen,
wobei ein hoher Score anzeigt, dass ein bestimmtes Segment als ein
Zielort zur Konstruktion von einem zinkfingerbindenden Protein wünschenswert
ist.
-
Die
Erfindung stellt Verfahren zur Konstruktion von Zinkfingerproteinen
bereit, die an einen vorgewählten
Zielort binden. Diese Verfahren können natürlich nach der Vorauswahl von
Zielorten entsprechend den Prozeduren und Kriterien wie oben beschrieben
verwendet werden. Die Konstruktionsverfahren verwenden eine Datenbank,
die Informationen über
zuvor charakterisierte Zinkfingerproteine enthält. Diese Informationen schließen Namen
oder andere Bezeichnungen von zuvor charakterisierten Zinkfingerproteinen
ein, die Aminosäuresequenz
von ihren Einzelfingern und die Nukleotidtripletts, die durch jeden
Finger der Proteine gebunden werden. Auf die Informationen in der
Datenbank wird durch die Verwendung eines Algorithmus" zugegriffen, der
es erlaubt, Finger von verschiedenen früheren Konstrukten zur Kombination
in einem neuen Zinkfingerprotein auszuwählen, das für einen gewählten Zielort spezifisch ist.
-
II. ZINKFINGERPROTEINE
-
Zinkfingerproteine
werden aus Zinkfingerkomponenten gebildet. Zum Beispiel können Zinkfingerproteine
einen bis siebenunddreißig
Finger aufweisen, im Allgemeinen weisen sie 2, 3, 4, 5 oder 6 Finger
auf. Ein Zinkfingerprotein erkennt und bindet an einen Zielort (manchmal
als ein Zielsegment bezeichnet), der eine relativ kleine Teilsequenz
innerhalb eines Zielgens repräsentiert.
Jeder Einzelfinger eines Zinkfingerproteins kann an einen Teilort
innerhalb des Zielortes binden. Der Teilort schließt ein Triplett
von drei aufeinander folgenden Basen ein, die alle auf demselben
Strang liegen (manchmal als Zielstrang bezeichnet). Der Teilort
kann ebenso eine oder keine vierte Base auf dem entgegengesetzten
Strang einschließen,
die das Komplement der Base unmittelbar 3' der drei aufeinanderfolgenden Basen
auf dem Zielstrang ist. In vielen Zinkfingerproteinen bindet ein
Zinkfinger an seinen Triplett-Teilort weitgehend unabhängig von
anderen Fingern im selben Zinkfingerprotein. Entsprechend ist die
Bindungsspezifität
eines Zinkfingerproteins enthaltend mehrere Finger normalerweise
annähernd
die Summe der Spezifitäten
seiner Einzelfinger. Wenn zum Beispiel ein Zinkfingerprotein aus
einem ersten, zweiten und dritten Finger gebildet wird, die jeweils
für sich
genommen an die Tripletts XXX, YYY und ZZZ binden, ist die Bindungsspezifität des Zinkfingerproteins
3'XXX YYY ZZZ5'.
-
Die
relative Reihenfolge von Fingern in einem Zinkfingerprotein von
N-terminal nach C-terminal bestimmt die relative Reihenfolge von
Tripletts in der 3'-
nach 5'-Richtung im Ziel.
Wenn zum Beispiel ein Zinkfingerprotein von N-terminal bis C-terminal den oben
erwähnten
ersten, zweiten und dritten Finger umfasst, bindet das Zinkfingerprotein
an das Zielsegment 3'XXXYYYZZZ5'. Wenn das Zinkfingerprotein
die Finger in einer anderen Reihenfolge umfasst, z. B. zweiter Finger,
erster Finger dritter Finger, dann bindet das Zinkfingerprotein
an ein Zielsegment umfassend eine unterschiedliche Permutation der
Tripletts, in diesem Beispiel, 3'YYYXXXZZZ5' (siehe Berg & Shi, Science
271, 1081-1086 (1996)). Die Beurteilung von Bindungseigenschaften
eines Zinkfingerproteins als Summe seiner Einzelfinger ist jedoch
aufgrund von kontextabhängigen Wechselwirkungen
von mehreren bindenden Fingern desselben Proteins nur annähernd.
-
Zwei
oder mehr Zinkfingerproteine können
verbunden werden, um eine Zielspezifität zu aufzuweisen, welche die
Summe der Zielspezifitäten
der einzelnen Zinkfingerproteine entspricht (siehe z. B. Kim & Pabo, PNAS 95,
2812-2817 (1998)). Zum Beispiel kann ein erstes Zinkfingerprotein,
das erste, zweite und dritte Einzelfinger aufweist, die jeweils
an XXX, YYY und ZZZ binden, mit einem zweiten Zinkfingerprotein
verbunden werden, das erste, zweite und dritte Einzelfinger mit
Bindungsspezifitäten
AAA, BBB und CCC aufweist. Die Bindungsspezifität des kombinierten ersten und
zweiten Proteins ist daher 3'XXXYYYZZZ
AAABBBCCC5', wobei
der Unterstrich eine kurze dazwischen liegende Region anzeigt (typischerweise
0-5 Basen beliebigen Typs). In dieser Situation kann der Zielort
als zwei Zielsegmente umfassend betrachtet werden, die durch ein dazwischen
liegendes Segment getrennt sind.
-
Die
Verbindung kann durch Verwenden eines beliebigen der folgenden Peptid-Bindungsstücke hergestellt
werden. T G E K P: (Liu et al., 1997, supra); (G4S)n (Kim et al,
PNAS 93, 1156-1160 (1996); GGRRGGGS; LRQRDGERP; LRQKDGGGSERP; LRQKD(G3S)2
ERP. Alternativ können
flexible Bindungsstücke
rational unter Verwendung eines Computerprogramms konstruiert werden,
welches sowohl DNA-bindende Orte und die Peptide selbst modellieren
kann, oder unter Verwendung von Phage-Display-Methoden. In einer
weiteren Variante kann eine nichtkovalente Verbindung durch Fusionieren
von zwei Zinkfingerproteinen mit Domänen erzielt werden, die die
Bildung von Heterodimeren der beiden Zinkfingerproteine unterstützen. Zum
Beispiel kann ein Zinkfingerprotein mit fos und ein anderes mit
jun fusioniert werden (siehe Barbas et al., WO 95/119431).
-
Die
Verbindung von zwei Zinkfingerproteinen ist vorteilhaft; um eine
einzigartige Bindungsspezifität
innerhalb eines Säugergenoms
zu verleihen. Ein typisches diploides Säugergenom besteht aus of 3 × 109 bp. Unter der Annahme, dass die vier Nukleotide
A, C, G und T zufällig
verteilt sind, ist eine gegebene Sequenz aus 9 bp etwa 23.000-mal
vorhanden. Daher hätte
ein ZFP, das ein Ziel aus 9 bp mit absoluter Spezifität erkennt,
die Möglichkeit,
an etwa 23,000 Stellen innerhalb des Genoms zu binden. Eine Sequenz
aus 18 bp ist einmal in 3,4 × 1010 bp vorhanden, oder etwa einmal in einer
zufälligen
DNA-Sequenz, deren Komplexität
zehnmal so groß ist
wie ein Säugergenom.
-
Ein
Einzelfinger eines Zinkfingerproteins enthält typischerweise etwa 30 Aminosäuren und
hat das folgende Motiv (N-C)
-
Die
zwei Invarianten Histidinreste und zwei Invariante Cysteinreste
in einem einzigen beta-Turn sind durch Zink koordiniert (siehe z.
B. Berg & Shi,
Science 271, 1081-1085 (1996)). Das obige Motiv zeigt eine Konvention
zur Numerierung, welche auf dem Arbeitsgebiet für die Region eines Zinkfingers,
die die Bindungsspezifitäten
verleiht, Standard ist. Der Aminosäure links (auf der N-terminalen Seite)
des ersten invarianten His-Restes wird die Nummer +6 zugewiesen,
und anderen Aminosäuren
weiter links werden sukzessive abnehmende Nummern zugewiesen. Die
Alphahelix beginnt bei Rest 1 und ist bis zu dem Rest ausgedehnt,
der dem zweiten konservierten Histidin folgt. Die gesamte Helix
hat daher eine variable Länge
zwischen 11 und 13 Resten.
-
Das
Verfahren zur Konstruktion oder Auswahl eines nichtnatürlich auftretenden
oder davon abweichenden ZFPs beginnt typischerweise mit einem natürlichen
ZFP als einer Quelle von Resten für das Gerüst. Das Verfahren zur Konstruktion
oder Auswahl dient der Definition von nichtkonservierten Positionen
(z. B. Positionen –1
bis +6), um eine gewünschte
Bindungsspezifität
zu verleihen. Ein geeignetes ZFP ist die DNA-bindende Domäne des Transkriptionsfaktors
Zif268 der Maus. Die DNA-bindende Domäne dieses Proteins hat die
Aminosäuresequenz:
YACPVESCDRRFSRSDELTRHIRIHTGQKP
(F1)
FQCRICMRNFSRSDHLTTHIRTHTGEKP (F2)
FACDICGRKFARSDERKRHTKIHLRQK
(F3)
und bindet an das Ziel 5' GCG TGG GCG 3'.
-
Ein
anderes geeignetes natürliches
Zinkfingerprotein als Quelle von Resten für das Gerüst ist Sp-1. Die Sequenz von
Sp-1, die zur Konstruktion von Zinkfingerproteinen verwendet wird,
entspricht den Aminosäuren
531 bis 624 im Transkriptionsfaktor Sp-1. Diese Sequenz hat eine
Länge von
94 Aminosäuren.
Die Aminosäuresequenz
von Sp-1 ist wie folgt
PGKKKQHICHIQGCGKVYGKTSHLRAHLRWHTGERP
FMCTWSYCGKRFTRSDELQRHKRTHTGEKK
FACPECPKRFMRSDHLSKHIKTHQNKKG
Sp-1
bindet an den Zielort 5'GGG
GCG GGG3'.
-
Eine
alternative Form von Sp-1, die eine Konsensussequenz von Sp-1 ist,
hat die folgende Aminosäuresequenz:
meklrngsgd
PGKKKQHACPECGKSFSKSSHLRAHQRTHTGERP
YKCPECGKSFSRSDELQRHQRTHTGEKP
YKCPECGKSFSRSDHLSKHQRTHQNKKG
(Kleinbuchstaben stellen eine Leadersequenz dar aus Shi & Berg, Chemistry
and Biology 1, 83-89. (1995)). Die optimale Bindungssequenz für die Konsensussequenz
von Sp-1 ist 5'GGGGCGGGG3'. Andere geeignete
ZFPs sind weiter unten beschrieben.
-
Es
gibt eine Anzahl von Substitutionsregeln, die die rationale Konstruktion
einiger Zinkfingerproteine unterstützen (siehe Desjarlais & Berg, PNAS 90,
2256-2260 (1993);
Choo & Klug,
PNAS 91, 11163-11167 (1994); Desjarlais & Berg, PNAS 89, 7345-7349 (1992);
Jamieson et al., supra; Choo et al., WO 98/53057, WO 98/53058; WO
98/53059; WO 98/53060). Viele dieser Regeln werden durch ortsgerichtete
Mutagenese der Dreifingerdomäne
des ubiquitären
Transkriptionsfaktors Sp-1 gestützt
(Desjarlais und Berg, 1992; 1993). Eine dieser Regeln ist, dass
ein 5' G in einem
DNA-Triplett durch einen Zinkfinger gebunden werden kann, der Arginin
an Position 6 der Erkennungshelix inkorporiert. Eine andere Substitutionsregel
ist, dass ein G in der Mitte eines Teilortes durch Einschluss eines
Histidinrestes an Position 3 eines Zinkfingers erkannt werden kann. Eine
weitere Substitutionsregel ist, dass Asparagin inkorporiert werden
kann, um A in der Mitte eines Tripletts zu erkennen, Asparaginsäure, Glutaminsäure, Serin
oder Threonin können
inkorporiert werden, um C in der Mitte eines Tripletts zu erkennen,
und Aminosäuren
mit kleinen Seitenketten wie z. B. Alanin können inkorporiert werden, um
T in der Mitte eines Tripletts zu erkennen. Eine weitere Substitutionsregel
ist, dass die 3'-Base des
Triplett-Teilortes durch Inkorporieren der folgenden Aminosäuren bei
Position –1
der Erkennungshelix erkannt werden kann: Arginin um G zu erkennen,
Glutamin um A zu erkennen, Glutaminsäure (oder Asparaginsäure) um
C zu erkennen, und Threonin um T zu erkennen. Obwohl diese Substitutionsregeln
zur Konstruktion von Zinkfingerproteinen nützlich sind, berücksichtigen
sie nicht alle möglichen
Zielorte. Außerdem
ist die Annahme, die den Regeln zugrunde liegt, lediglich annähernd, nämlich dass
eine bestimmte Aminosäure
in einem Zinkfinger für
die Bindung einer bestimmten Base an einen Teilort verantwortlich
ist. Kontextabhängige Wechselwirkungen
zwischen nahe beieinander liegenden Aminosäuren in einem Finger oder Bindung
von mehreren Aminosäuren
an eine einzelne Base oder umgekehrt können/kann eine Veränderung
der Bindungsspezifitäten
verursachen, die durch die bestehenden Substitutionsregeln vorhergesagt
werden.
-
Die
Phage-Display-Technik stellt ein wichtiges empirisches Mittel zur
Erzeugung von Zinkfingerproteinen mit einer gewünschten Zielspezifität bereit
(siehe z. B. Rebar,
US 5,789,538 ;
Choo et al., WO 96/06166; Barbas et al., WO 95/19431 und WO 98/543111;
Jamieson et al., supra). Das Verfahren kann in Verbindung mit oder
als Alternative zur rationalen Konstruktion verwendet werden. Das
Verfahren involviert die Erzeugung verschiedener Bibliotheken mutagenisierter
Zinkfingerproteine, gefolgt von der Isolierung der Proteine mit
gewünschten
DNA-Bindungseigenschaften
durch Verwendung von Auswahlverfahren aufgrund von Affinität. Um dieses
Verfahren zu verwenden, verfährt
der Experimentator typischerweise wie folgt. Zuerst wird ein Gen
für ein
Zinkfingerprotein mutagenisiert, um eine Diversität in Regionen
einzuführen,
welche für
die Bindungsspezifität
und/oder die Affinität
wichtig sind. In einer typischen Anwendung wird dies durch Randomisierung
eines einzelnen Fingers an den Positionen –1, +2, +3, und +6 geleistet,
und manchmal an den zusätzlichen
Positionen wie z. B. +1, +5, +8 und +10. Als nächstes wird das mutagenisierte
Gen in einen Phagen oder einen Phagemidvektor als Fusion mit Gen
III eines filamentösen
Phagen kloniert, der für
das Hüllenprotein
pIII kodiert. Das Zinkfingergen wird zwischen Segmente von Gen III
inseriert, die das Signalpeptid für Membranexport und den Rest
von pIII kodieren, so dass das Zinkfingerprotein als eine aminoterminale
Fusion mit pIII oder im reifen prozessierten Protein exprimiert
wird. Bei Verwendung von Phagemidvektoren kann das mutagenisierte
Zinkfingergen ebenso mit der gekürzten
Version von Gen III fusioniert werden, die mindestens für die C-terminale Region
kodiert, die für
den Einbau von pIII in den Phagenpartikel benötigt wird. Die resultierende
Vektorbibliothek wird in E. coli transformiert und zur Produktion
von filamentösen
Phagen verwendet, die verschiedene Zinkfingerproteine auf ihrer
Oberfläche
als Fusionen mit dem Hüllenprotein
pIII exprimieren. Wenn ein Phagemidvektor verwendet wird, dann benötigt dieser
Schritt die Superinfektion mit einem Helferphagen. Die Phagenbibliothek
wird anschließend
mit der DNA des Zielortes inkubiert, und Methoden zur Auswahl aufgrund
von Affinität
werden verwendet, um Phagen zu isolieren, die das Ziel in der Masse
der Phagen mit hoher Affinität binden.
Typischerweise wird das DNA-Ziel auf einem festen Träger immobilisiert,
der dann unter Bedingungen gewaschen wird, die hinreichend sind,
um alle Phagen bis auf den am festesten bindenden Phagen zu entfernen.
Nach dem Waschen werden alle Phagen, die auf dem Träger verblieben
sind, durch Elution unter Bedingungen, die die Bindung zwischen
Zinkfinger und DNA stören,
gewonnen. Gewonnene Phagen werden zur Infektion frischer E. coli
verwendet, die dann amplifiziert und zur Produktion einer neuen
Charge Phagenpartikel verwendet werden. Auswahl und Amplifikation
werden dann so oft wie notwendig wiederholt, um einen Pool aus fest
bindenden Phagen anzureichern, so dass diese durch Sequenzierungs-
und Musterungsverfahren identifiziert werden können. Obwohl das Verfahren
für pIII-Fusionen dargestellt
wurde, können
analoge Prinzipien verwendet werden, um ZFP-Varianten in Form von
pVIII-Fusionen zu durchmustern.
-
Zinkfingerproteine
werden oft mit einer heterologen Domäne als Fusionsproteine exprimiert. Übliche Domänen zum
Hinzufügen
an das ZFP schließen
z. B. Domänen
von Transkriptionsfaktoren (Aktivatoren, Repressoren, Koaktivatoren,
Korepressoren), Silencer, Onkogene (z. B. myc, jun, fos, myb, max,
mad, rel, ets, bcl, myb, Mitglieder der mos-Familie, etc.); Enzyme
zur DNA-Reparatur und ihre assoziierten Faktoren und allosterischen
Effektoren; Enzyme zum DNA-Rearrangement
und ihre assoziierten Faktoren und allosterischen Effektoren; chromatinassoziierte
Proteine und ihre allosterischen Effektoren (z. B. Kinasen, Acetylasen
und Deacetylasen); und DNA-modifizierende Enzyme (z. B. Methyltransferasen,
Topoisomerasen, Helikasen, Ligasen, Kinasen, Phosphatasen, Polymerasen,
Endonukleasen) und ihre assoziierten Faktoren und allosterischen
Effektoren ein. Wenn das ZFP zur Repression der Expression eines
Zielgens verwendet werden soll, ist eine bevorzugte Domäne zur Fusion
mit einem ZFP die KRAB-Repressionsdomäne vom menschlichen KOX-1-Protein
(Thiesen et al., New Biologist 2, 363-374 (1990); Margolin et al.,
Proc. Natl. Acad Sci. USA 91, 4509-4513 (1994); Pengue et al., Nucl.
Acids Res. 22:2908-2914 (1994); Witzgall et al., Proc. Natl. Acad
Sci. USA 91, 4514-4518 (1994)). Um eine Aktivierung zur erzielen,
schließen
bevorzugte Domänen
die HSV-VP16-Aktivierungsdomäne (siehe
z. B. Hagmann et al., J. Virol. 71, 5952-5962 (1997)), Hormonrezeptoren
des Kerns (siehe z. B. Torchia et al., Curr. Opin. Cell Biol. 10:373-383
(1998)); die p65-Untereinheit des Kernfaktors Kappa B (Bitko & Barik, J. Virol.
72:5610-5618 (1998) und Doyle & Hunt,
Neuroreport 8:2937-2942 (1997)); Liu et al., Cancer Gene Ther. 5:3-28
(1998)), oder künstliche
chimäre
funktionelle Domänen
wie z. B. VP64 (Seifpal et al., EMBO J. 11, 4961-4968 (1992)) ein.
-
Ein
wichtiger Faktor beim Verabreichen von Polypeptidverbindungen, wie
z. B. ZFPs, ist die Gewähr, dass
das Polypeptid die Fähigkeit
hat, die Plasmamembran einer Zelle oder die Membran eines intrazellulären Kompartiments
wie z. B. des Kerns zu durchqueren. Zelluläre Membranen sind aus Doppelschichten
aus Lipiden und Proteinen zusammengesetzt, die frei permeabel für kleine
nichtionische lipophile Verbindungen und inhärent impermeabel für polare
Verbindungen, Makromoleküle
und therapeutische oder diagnostische Mittel sind. Jedoch wurden
Proteine und andere Verbindungen wie z. B. Liposomen beschrieben,
die die Fähigkeit zur
Translokation von Polypeptiden wie z. B. ZFPs über die Zellmembran hinweg
aufweisen.
-
Zum
Beispiel weisen „Membrantranslokationspolypeptide" amphiphile oder
hydrophobe Aminosäureteilsequenzen
auf, welche die Fähigkeit
haben, als membrantranslozierende Carrier zu wirken. In einer Ausführungsform
weisen Proteine mit Homöodomäne die Fähigkeit
auf, über
die Zellmembran hinweg zu translozieren. Es wurde gefunden, dass
das kürzeste
internalisierbare Peptid eines Proteins mit Homöodomäne, Antennapedia, die dritte
Helix des Proteins von Aminosäureposition
43 bis 58 ist (siehe z. B. Prochiantz, Current Opinion in Neurobiology
6:629-634 (1996)). Es wurde gefunden, dass eine andere Teilsequenz,
die h (hydrophobe) Domäne
von Signalpeptiden, ähnliche
Charakteristika für
die Translokation über
die Zellmembran hinweg aufweist (siehe z. B. Lin et al., J. Biol.
Chem. 270:14255-14258 (1995)).
-
Beispiele
von Peptidsequenzen, die zur Erleichterung der Aufnahme von ZFPs
in die Zelle an ein erfindungsgemäßes ZFP gebunden werden können, schließen ein,
aber sind nicht darauf beschränkt:
ein Peptid des tat-Proteins von HIV mit 11 Aminosäuren; eine
Peptidsequenz mit 20 Resten, die den Aminosäuren 84-103 des p16-Proteins
entspricht (siehe Fahraeus et al., Current Biology 6:84 (1996));
die dritte Helix der 60 Aminosäuren
langen Homöodomäne von Antennapedia
(Derossi et al., J. Biol. Chem. 269:10444 (1994)); die h-Region
eines Signalpeptids wie z. B. die h-Region des Kaposi-Fibroblasten-Wachstumsfaktors
(K-FGF) (Lin et al., supra); oder die VP22-Translokationsdomäne von HSV
(Elliot & O'Hare, Cell 88:223-233
(1997)). Andere geeignete chemische Gruppen, die eine erhöhte zelluläre Aufnahme
bewirken, können
ebenso chemisch mit ZFPs verbunden werden.
-
Toxinmoleküle weisen
ebenso die Fähigkeit
auf, Polypeptide über
Zellmembranen hinweg zu transportieren. Oft sind derartige Moleküle aus wenigstens
zwei Teilen zusammengesetzt (genannt "binäre
Toxine"), einer
Domäne
oder einem Polypeptid zur Translokation oder zur Bindung und einer
separaten Domäne
oder einem separaten Polypeptid als Toxin. Typischerweise bindet
die Domäne
oder das Polypeptid zur Translokation an einen zellulären Rezeptor,
und anschließend
wird das Toxin in die Zelle transportiert. Verschiedene bakterielle
Toxine, einschließend
lotatoxin aus Clostridium perfringens, Diphtherietoxin (DT), Exotoxin
A aus Pseudomonas (PE), Pertussistoxin (PT), Toxin aus Bacillus
anthracis und die Pertussis-Adenylatcyclase (CYA) wurden in Versuchen
verwendet, Peptide in das Zytosol der Zelle als interne oder aminoterminale
Fusionen zu verabreichen (Arora et al., J. Biol. Chem, 268:3334-3341 (1993); Perelle
et al., Infect. Immun., 61:5147-5156 (1993); Stenmark et al., J.
Cell Biol. 113:1025-1032 (1991); Donnelly et al., PNAS 90:3530-3534
(1993); Carbonetti et al., Abstr. Annu. Meet. Am. Soc. Microbiol.
95:295 (1995); Sebo et al., Infect. Immun. 63:3851-3857 (1995);
Klimpel et al., PNAS U.S.A. 89:10277-10281 (1992); und Novak et al., J. Biol.
Chem. 267:17186-17193 (1992)).
-
Derartige
Teilsequenzen können
zur Translokation von ZFPs über
eine Zellmembran hinweg verwendet werden. ZFPs können bequem mit solchen Sequenzen
fusioniert oder derivatisiert werden. Typischerweise wird die Translokationssequenz
als Teil eines Fusionsproteins bereitgestellt. Optional kann ein
Bindungsstück verwendet
werden, um das ZFP und die Translokationssequenz zu verbinden. Beliebige
geeignete Bindungsstücke
können
verwendet werden, z. B. ein Peptidbindungsstück.
-
III. Auswahl von Zielgenen
-
Zinkfingerproteine
können
verwendet werden, um die Expression einer beliebigen Zielpolynukleotidsequenz
zu modulieren. Die Sequenz kann z. B. genomisch, cDNA oder RNA oder
ein „Expressed
Sequence Tag (EST)" sein.
Typischerweise schließt
das Zielpolynukleotid ein Gen oder ein Fragment davon ein. Der Begriff
Gen wird breit verwendet, um z. B. Exonregionen, Intronregionen,
5'-UTRs, 3'-UTRs, 5'-flankierende Sequenzen,
3'-flankierende
Sequenzen, Promotoren, Enhances, Tsanskriptionsstarts, Ribosomenbindungsstellen,
regulatorische Stellen, Polyadenylierungsstellen einzuschließen. Zielgene
können
zellulär,
viral oder aus anderen Quellen sein, die rein theoretische Sequenzen
einschließen.
Sequenzen von Zielgenen können
aus Datenbanken erhalten werden, wie z. B. GenBank, der publizierten
Literatur, oder sie können
de novo erhalten werden. Zielgene schließen Gene von pathologischen
Viren und Mikroorganismen ein, für
die eine Repression der Expression verwendet werden kann, um eine
Infektion zu beenden. Beispiele von pathogenen Viren schließen Hepatitis
(A, B, oder C), Herpesvirus (z. B. VZV, HSV-1, HSV-6, HSV-II und
CMV, Epstein-Barr-Virus), HIV, Ebola, Adenovirus, Influenzavirus,
Flaviviren, ECHO-Virus,
Rhinovirus, Coxsackie-Virus, Cornovirus, RS-Virus (respiratory syncytial
virus), Mumpsvirus, Rotavirus, Masernvirus, Rötelnvirus, Parvovirus, Vakziniavirus,
HTLV-Virus, Denguevirus, Papillomavirus, Molluscum-Virus, Poliovirus,
Tollwutvirus, JC-Virus und Asbovirusenzephalitisvirus ein. Einige
Beispiele von pathogenen Bakterien schließen Chlamydien, Rickettsien,
Mycobakterien, Staphylokokken, Streptokokken, Pneumokokken, Meningokokken
und Gonokokken, Klebsiella, Proteus, Serratia, Pseudomonas, Legionella,
Diphtheria, Salmonella, Bazillen, Cholera, Tetanus, Botulismus,
Anthrax, Pest, Leptospirose, und Lyme-Borreliosebakterien ein.
-
Zielgene
schließen
ebenso Gene vom Menschen und anderen Säugern ein, die zu Krankheiten
beitragen. Einige solcher Gene sind Onkogene, Tumorsuppressoren
oder Wachstumsfaktoren, die zu Krebs beitragen. Beispiele von Onkogenen
schließen
hMSH2 (Fishel et al., Cell 75, 1027-1038 (1993)) und hMLH1 (Papadopoulos
et al., Science 263, 1625-1628 (1994)) ein. Einige Beispiele von
Wachstumsfaktoren schließen
Fibroblastenwachstumsfaktor, Plättchen-Wachstumsfaktor,
GM-SCF, VEGF, EPO, Erb-B2, und hGH ein. Andere menschliche Gene
tragen zu Krankheiten bei, indem sie einen Patienten für eine Infektion
durch einen Mikroorganismus oder Virus empfänglich machen. Zum Beispiel
machen bestimmte Allele des Gens kodierend für den CCR5-Rezeptor einen Patienten
für eine
Infektion durch HIV empfänglich.
Andere menschliche Gene, wie z. B. dasjenige, das für das Amyloidvorläuferprotein
oder ApoE kodiert, trägt
zu anderen Krankheiten wie z. B. der Alzheimerschen Krankheit bei.
-
Zielgene
schließen
ebenso Gene des Menschen oder anderer Säuger ein, die Verteidigungsmechanismen
gegen Krankheiten aufgrund anderer Ursachen bereitstellen. Zum Beispiel
bewirken Tumorrepressorgene Schutz gegenüber Krebs. Die Expression von
derartigen Genen ist wünschenswert,
und Zinkfingerproteine werden verwendet, um die Expression zu aktivieren.
-
Zielgene
schließen
ebenso Gene ein, die normalerweise ausgeschaltet oder auf niedrigen
Spiegeln exprimiert werden, die aber durch Aktivierung verwendet
werden können,
um ein anderes defektes Gen zu substituieren, das in manchen Individuen
vorhanden ist. Zum Beispiel können
die fötalen
Hämoglobingene,
die normalerweise in erwachsenen Menschen inaktiv sind, aktiviert
werden, um das defekte beta-Globingen in Individuen mit Sichelzellanämie zu substituieren.
-
Zielgene
schließen
ebenso Pflanzengene ein, für
die die Repression oder Aktivierung zu einer Verbesserung der Pflanzeneigenschaften
führt,
z. B. verbesserte Fruchtproduktion, Krankheits- oder Herbizidresistenz.
Zum Beispiel resultiert die Repression der Expression des FAD2-1-Gens
in einem vorteilhaften Anstieg der Ölsäure und einer Verminderung
der Linol- und Linolsäuren.
-
IV. KONSTRUKTION VON ZINKFINGERPROTEINEN,
DIE AN D-FÄHIGE
TEILORTE BINDEN
-
1. Verfahren
-
Anschließend kann
ein Zinkfingerprotein synthetisiert werden, das an einen vorausgewählten Ort
bindet. Verfahren der Auswahl eines Zielortes basieren teilweise
auf der Erkenntnis des jetzigen Erfinders, dass das Vorhandensein
von einem oder mehreren D-fähigen
Teilorten in einem Zielsegment die Möglichkeit für eine höhere Bindungsaffinität eines
Zinkfingerproteins verleiht, das ausgewählt oder konstruiert wird,
um an diesen Ort zu binden, im Vergleich zu Zinkfingerproteinen,
die an Zielsegmente binden, denen D-fähige Teilorte fehlen. Experimentelle
Belege, die diese Einsicht stützen,
sind in den Beispielen 2-9 gegeben.
-
Ein
D-fähiger
Teilort ist eine Region eines Zielortes, die einem entsprechend
konstruierten einzelnen Zinkfinger eher erlaubt, an bis zu vier
Basen zu binden, als an bis zu drei des Zielortes. Ein derartiger
Zinkfinger bindet an ein Basentriplett auf einem Strang eines doppelsträngigen Zielsegmentes
(Zielstranges) und an eine vierte Base auf dem anderen Strang (siehe 2).
Um an ein Zielsegment aus vier Basen zu binden, gibt es für einen
einzelnen Zinkfinger Beschränkungen
sowohl bei der Sequenz des Zielstranges und bei der Aminosäuresequenz
des Zinkfingers. Der Zielort innerhalb des Zielstranges sollte das
Motiv eines Teilortes für "D-fähig" 5'NNGK3' einschließen, in
dem N und K gewöhnliche
mehrdeutige Abkürzungen
entsprechend IUPAC-IUB sind. Ein Zinkfinger zur Bindung an einen
derartigen Ort sollte einen Argininrest an Position –1 und Asparaginsäure (oder
weniger bevorzugt Glutaminsäure)
an Position +2 einschließen.
Der Argininrest an Position –1
interagiert mit dem G-Rest im D-fähigen Teilort. Der Asparaginsäurerest
(oder Glutaminsäurerest)
an Position +2 des Zinkfingers intgragiert mit der Base auf dem
Gegenstrang, die komplementär
zu der K-Base im D-fähigen
Teilort ist. Die Interaktion zwischen Asparaginsäure (Symbol D) und der Base
auf dem Gegenstrang (vierte Base) verleiht den Namen „D-fähiger Teilort". Wie aus der Formel
für den
D-fähigen
Teilort ersichtlich, gibt es zwei Subtypen von D-fähigen Teilorten:
5'NNGG3' und 5'NNGT3'. Im ersteren Teilort
interagiert die Asparaginsäure
oder Glutaminsäure
an Position +2 eines Zinkfingers mit einem C auf dem Gegenstrang
zu dem D-fähigen
Teilort. Im letzteren Teilort interagiert die Asparaginsäure oder
Glutaminsäure
an Position +2 eines Zinkfingers mit einem A auf dem Gegenstrang
zu dem D-fähigen
Teilort. Im Allgemeinen ist NNGG bevorzugt gegenüber NNGT.
-
Bei
der Konstruktion eines Zinkfingerproteins mit drei Fingern sollte
ein Zielort ausgewählt
werden, in dem wenigstens ein Finger des Proteins, und vorzugsweise
zwei oder drei Finger die Möglichkeit
haben, an einen D-fähigen
Teilort in einem Zielort zu binden. Dies kann erreicht werden durch
Auswählen
eines Zielortes aus einem größeren Zielgen
mit der Formel
5'NNx
aNy bNzc3', wobei
jeder
der Sätze
(x, a), (y, b) und (z, c) entweder (N, N) oder (G, K) ist;
wenigstens
eines von (x, a), (y, b) und (z, c) (G, K) ist, und N und K mehrdeutige
Abkürzungen
entsprechend IUPAC-IUB sind.
-
Mit
anderen Worten ist wenigstens einer der drei Sätze (x, a), (y, b) und (z,
c) der Satz (G, K), was bedeutet, dass die erste Position des Satzes
G und die zweite Position G oder T ist. Diejenigen der drei Sätze (wenn überhaupt
vorhanden), die nicht (G, K) sind, sind (N, N), was bedeutet, dass
die erste Position des Satzes durch ein beliebiges Nukleotid besetzt
sein kann, und dass die zweite Position des Satzes durch ein beliebiges
Nukleotid besetzt sein kann. Zum Beispiel kann der Satz (x, a) (G,
K) sein, und die Sätze
(y, b) und (z, c) können
beide (N, N) sein.
-
In
der Formel 5'NNx
aNy bNzc3' repräsentieren
die Tripletts von NNx, aNy und bNz die Basentripletts auf dem Zielstrang,
der von den drei Fingern in einem Zinkfingerprotein gebunden wird.
Die entgegengesetzten der hervorgehobenen Basen sind die Orte für eine mögliche vierte
Base, die an den Nichtzielstrang bindet. Wenn nur eines von x, y
und z ein G ist und dieses G von einem K gefolgt wird, schließt der Zielort
einen einzelnen D-fähigen
Teilort ein. Wenn zum Beispiel nur x G ist und a K ist, dann ist
der Ort NNG KNy bNz w, wobei der D-fähige Teilort hervorgehoben
ist. Wenn beide x und y G sind, aber z nicht G ist, und a und b
K sind, dann hat der Zielort zwei überlappende D-fähige Teilorte
wie im Folgenden beschrieben: 5'NNG
KNG KNz c3', wobei ein
derartiger Ort fett dargestellt ist und der andere kursiv. Wenn
alle drei x, y und z G sind und a, b und c sind K, dann schließt das Zielsegment
drei D-fähige
Teilorte ein, wie folgt 5'NNG
KNG KNG K3', wobei die D-fähigen Teilorte fett, kursiv
und unterstrichen dargestellt sind.
-
Die
erfindungsgemäßen Verfahren
können
durch Auswählen
eines Zielgens und durch systematische Suche innerhalb der möglichen
Teilsequenzen des Gens nach Zielorten, welche der Formel 5'NNx aNy bNzc3' entsprechen, arbeiten
wobei
jedes (x, a), (y, b) und (z, c) (N, N) oder (G, K) ist;
wenigstens
eines von (x, a), (y, b) und (z, c) (G, K) ist, und
N und K
mehrdeutige Abkürzungen
entsprechend IUPAC-IUB sind.
-
In
einigen derartigen Verfahren wird jede mögliche Teilsequenz von 10 aufeinander
folgenden Basen auf jedem Strang eines möglichen Zielgens beurteilt,
um zu bestimmen, ob sie der obigen Formel entspricht; und, wenn
dies der Fall ist, wie viele D-fähige
Teilorte vorhanden sind. Typischerweise wird ein derartiger Vergleich
mit dem Computer durchgeführt,
und eine Liste von Zielorten, die der Formel entsprechen, wird ausgegeben.
Optional können
solche Zielorte in verschiedenen Teilsätzen ausgegeben werden, je
nach dem, wieviel D-fähige
Teilorte vorhanden sind.
-
In
einer Variante werden erste und zweite Zielsegmente identifiziert,
wobei jedes unabhängig
der obigen Formel entspricht. Die zwei Zielsegmente in derartigen
Verfahren sind so beschränkt,
dass sie im Zielgen benachbart oder nahe beieinander liegend sind
(z. B. innerhalb etwa 0-5 Basen). Die Strategie, die der Auswahl
von nahe beieinander liegenden Zielsegmenten zugrunde liegt, ist
es, die Konstruktion eines Zinkfingerproteins zu ermöglichen,
das durch Bindung von zwei einzelnen Zinkfingerproteinen gebildet
wird, die für
das erste bzw. zweite Zielsegment spezifisch sind. Diese Prinzipien
können
zur Auswahl von Zielorten, die an Zinkfingerproteine mit einer beliebigen
Anzahl von Einzelfingern binden, erweitert werden. Zum Beispiel
hätte ein geeigneter
Zielort für
ein neunfingeriges Protein drei Einzelsegmente, wobei jedes der
obigen Formel entspricht.
-
Die
Zielorte, die durch die obigen Verfahren identifiziert werden, können der
Gegenstand einer weiteren Beurteilung nach anderen Kriterien sein
oder können
direkt zur Konstruktion oder Auswahl (wenn benötigt) und zur Herstellung eines Zinkfingerproteins
verwendet werden, das spezifisch für einen derartigen Ort ist.
Ein weiteres Kriterium zur Beurteilung möglicher Zielorte ist die Nähe zu bestimmten
Regionen innerhalb eines Gens. Wenn ein Zinkfingerprotein selbst
zur Repression eines zellulären
Gens verwendet werden soll (z. B. ohne das Zinkfingerprotein mit
einer Repressionsgruppe zu verbinden), dann scheint die optimale
Lage der Ort der Transkriptionsinitiation oder innerhalb von etwa
50 bp stromaufwärts
oder stromabwärts
zu sein, oder alternativ innerhalb eines Enhancerelements, um mit
der Bildung des Transkriptionskomplexes zu interferieren (Kim & Pabo, J. Biol.
Chem. (1997)) oder um ein essentielles enhancerbindendes Protein
zu kompetetieren. Wenn jedoch ein ZFP mit einer funktionellen Domäne wie z.
B. der KRAB-Repressordomäne
oder der VP16-Aktivatordomäne fusioniert
wird, dann ist die Wahl der Lage des Bindungsortes wesentlich flexibler
und kann außerhalb
der bekannten regulatorischen Regionen sein. Zum Beispiel kann eine
KRAB-Domäne
die Transkription eines Promotors wenigstens 3 kb entfernt von dort
wo KRAB gebunden ist reprimieren. Daher können Zielorte ausgewählt werden,
die keine Segmente mit Bedeutung für die Zielgene einschließen oder
mit ihnen überlappen,
wie zum Beispiel regulatorische Sequenzen oder polymorphe Stellen.
Andere Kriterien für die
weitere Beurteilung von Zielsegmenten schließen die frühere Verfügbarkeit von Zinkfingerproteinen,
die an derartige Segmente oder verwandte Segmente binden und/oder
die Leichtigkeit der Konstruktion neuer Zinkfingerproteine, die
an ein gegebenes Zielsegment binden, ein. Die Implementierung von
derartigen Kriterien im Auswahlverfahren wird in weiteren Einzelheiten
unten diskutiert.
-
Ist
einmal ein Zielsegment ausgewählt,
dann kann ein Zinkfingerprotein, das an das Segment bindet, durch
eine Vielfalt von Vorgehensweisen bereitgestellt werden. Die einfachste
Vorgehensweise ist es, ein vorcharakterisiertes Zinkfingerprotein
aus einer bestehenden Sammlung bereitzustellen, von dem bekannt
ist, dass es an den Zielort bindet. In vielen Fällen jedoch existiert ein derartiges
Zinkfingerprotein nicht. Eine alternative Vorgehensweise verwendet
Informationen aus einer Datenbank von existierenden Zinkfingerproteinen und
Bindungsspezifitäten,
um neue Zinkfingerproteine zu konstruieren. Diese Vorgehensweise
ist unten ausführlicher
beschrieben.
-
Wurde
einmal ein Zinkfingerprotein für
ein gegebenes Zielsegment bereitgestellt, wird das Zinkfingerprotein
oder die kodierende DNA synthetisiert. Beispielhafte Verfahren zur
Synthese und Expression von DNA, die Zinkproteine kodiert, sind
unten beschrieben. Das Zinkfingerprotein oder ein Polynukleotid,
das es kodiert, kann dann zur Modulation der Expression oder zur
Analyse des Zielgens verwendet werden, das den Zielort enthält, an den
das Zinkfingerprotein bindet.
-
2. D-fähige Zinkfingerproteine
-
Ein
Zinkfingerprotein wird als D-fähig
beschrieben, wenn es einen Finger enthält, der an die vierte Base
von wenigstens einem D-fähigen
Teilort binden kann, der eine Polynukleotidsequenz 5'NNGK3' ist. Ein bevorzugtes
Gerüst
zur Konstruktion von D-fähigen
Zinkfingern ist die menschliche DNA-Bindungsdomäne Sp-1 vom Wildtyp. Das Ziel
für den
menschlichen Transkriptionsfaktor Sp-1 ist 5'GGG GCG GGG3', und die Finger 1 und 2 dieses Proteins
weisen ein Arrangement R-1 D+2 auf. Konstruierte ZFPs können mit
Sp-1 identisch sein, außer
in der Erkennungshelix von jedem der drei Finger, wo die Sequenzen
konstruiert sind, um jedes der Tripletts zu erkennen, mit denen
sie interagieren. Das ZFP der Maus, Zif268, welches an den Ort GCG
TGG GCG bindet, ist ebenso geeignet und weist das Arrangement R-1
D+2 in allen drei Fingern auf.
-
Andere
Zinkfingerproteine als Quelle von Resten für das Gerüst zur Konstruktion von Zinkfingerproteinen,
die fähig
zur Bindung an D-fähige
Teilorte sind, können
von ZFPs aus mehreren alternativen Quellen erhalten oder abgeleitet
werden. Zum Beispiel wurde das transkriptionell regulatorische Protein
TTK der Taufliege Drosophila melanogaster sowohl in Bezug auf die
Sequenzen seiner Erkennungshelices als auch seines DNA-Ortes gut
charakterisiert. Das Protein hat nur zwei Finger und bindet an ein
Ziel aus sechs Basen, also interagiert Finger 2 mit dem ersten DNA-Triplett
und Finger 1 erkennt das zweite Triplett des Ortes. Der Ort ist 5'AAG GAT3' mit einem D-fähigen Teilort
des Typs GG, der an der Verbindung des ersten und zweiten Tripletts gelegen
ist, und Finger 2 weist die Sequenz R-1 D+2 auf. Andere geeignete
ZFPs werden im einzelligen Eukaryoten Saccharomyces cerevisiae gefunden.
Es ist bekannt, dass das ADR-Genprodukt die Expression des ADH-Gens
durch Bindung innerhalb des ADH-Promotors reguliert. Wie oben für TTK beschrieben,
weist die ZFP-bindende Domäne
von ADR zwei Finger auf und bindet an ein Ziel aus sechs Basen,
TTGGAG. Die Erkennungshelix von Finger 2 weist die Sequenz R-1 D+2
auf, die zur Bindung eines ZFPs an einen Zielort mit einem D-fähigen Teilort
geeignet ist.
-
IV. AUSWAHL VON ZIELORTEN
DURCH EINE KORRESPONDENZREGEL
-
Die
Erfindung verwendet weiterhin zusätzliche oder alternative Verfahren
zum Auswählen
eines Zielortes aus einem Zielgen. Diese Verfahren basieren teilweise
auf der Erkenntnis, dass verschiedene dreibasige Teilorte (Tripletts),
die durch einzelne Finger gebunden sind, in unterschiedlichem Maße zur Konstruktion
von Zinkfingerproteinen erwünscht
sind, dass diese verschiedenen Erwünschtheiten als numerische
Werte ausgedrückt
werden können
und dass die numerischen Werte für
die drei einzelnen Tripletts umfassend einen Zielort zu einem gesamten
Score für
den Zielort kombiniert werden können.
Die relativen Vorzüge
verschiedener Zielorte können
durch ihre relativen Scores verglichen werden.
-
Die
Verfahren arbeiten durch Bereitstellung einer Polynukleotidsequenz,
typischerweise eines Gens oder einer cDNA, innerhalb derer die Auswahl
eines Zielortes zur Detektion oder Modulation durch ein ZFP gewünscht wird.
In der Praxis stellt man typischerweise zwei Sequenzen für zwei Stränge einer
Polynukleotidsequenz bereit, aber zur Vereinfachung wird das Verfahren
für eine
einzelne Polynukleotidsequenz dargestellt. Aus einer solchen Polynukleotidsequenz
wird ein möglicher
Zielort von wenigstens 9 Basen umfassend aufeinander folgende erste,
zweite und dritte Basentripletts ausgewählt. Die Tripletts folgen derartig
aufeinander, dass das erste Triplett Basen 7-9 besetzt, das zweite
Triplett die Basen 4-6 und das dritte Triplett Basen 1-3 eines Ortes,
wobei Base 1 in der 5'-3' Orientierung als
Base 1 bezeichnet wird. Diese Bezeichnung der Tripletts als erste,
zweite und dritte ist willkürlich
und könnte
umgekehrt werden. Durch die Bezeichnung des ersten Tripletts als
besetzend die Basen 7-9, des zweiten Tripletts als besetzend die
Basen 4-6 und des dritten Tripletts als besetzend die Basen 1-3
jedoch binden der erste, zweite und dritte Finger eines dreifingerigen
ZFPs in einer Orientierung von N- nach C-terminal an das erste, zweite und dritte
Triplett eines Zielortes. Andersherum gesehen ist der erste, zweite
und dritte Finger eines Zinkfingerproteins von N-terminal nach C-terminal geordnet und
ist jeweils für
das erste, zweite und dritte Triplett eines Zielortes in der 3'-5'-Orientierung geordnet
spezifisch.
-
Ein
Teilscore wird anschließend
für jedes
Triplett aus einer Korrespondenzregel zwischen Tripletts und entsprechenden
Positionen innerhalb eines Zielortes bestimmt. Eine beispielhafte
Korrespondenzregel wird in Tabelle 1 bereitgestellt. Die Korrespondenzregel
ist eine Matrix, die drei Werte für jedes Triplett an seinen
drei möglichen
Positionen innerhalb eines neunbasigen Zielortes bereitstellt. Die
Tabelle stellt drei Werte für
jedes der 64 möglichen
Tripletts bereit. Betrachte zum Beispiel einen möglichen Zielort 5'AAA AAG AAC3'. Das AAC-Triplett
tritt an der ersten Position (Basen 7-9) des Zielortes auf, und
ihm wird ein Teilscore von 1 aus Tabelle 1 zugewiesen. Das AAG-Triplett
tritt an der zweiten Position des Zielortes (Basen 4-6) auf, und
ihm wird ein Teilscore von 8 zugewiesen. Das AAA-Triplett tritt
an der dritten Position des Zielortes (Basen 1-3) auf, und ihm wird
ein Teilscore von 8 zugewiesen. Die Teilscores der drei Tripletts
am möglichen
Zielort werden dann kombiniert, z. B. durch Multiplikation oder
Addition oder einer anderen Funktion. Zum Beispiel ergibt die Multiplikation
der drei Teilscores der Tripletts einen kombinierten Score von 1 × 8 × 8 = 64.
-
Das
Verfahren wird anschließend
für einen
zweiten möglichen
Zielort wiederholt. Teilscores werden für jedes der drei Einzeltripletts
des zweiten möglichen
Zielortes bestimmt, und ein kombinierter Score wird für den zweiten
möglichen
Zielort berechnet. Das Verfahren kann anschließend für weitere mögliche Zielorte wiederholt
werden. Wahlweise kann das Verfahren für jede mögliche aufeinander folgende
Teilsequenz von wenigstens 9 Basen in jedem Strang eines Zielgens,
das von Interesse ist, wiederholt werden. Wenn die Scores aller möglichen
Zielorte, die von Interesse sind, bestimmt sind, werden die Scores
verglichen. Im Allgemeinen deutet ein hoher Score auf Erwünschtheit
eines Zielortes zur Konstruktion eines ZFPs. Ein oder mehrere der
identifizierten Zielorte mit hohen Scores können zusammen mit dem Score
ausgegeben werden.
-
Die
Bezeichnungen von Werten in der Korrespondenzregel können beliebige
Kriterien wiedergeben, durch die ein Teilort aus Tripletts stärker als
andere für
die Konstruktion oder Auswahl eines Zinkfingerproteins erwünscht ist.
Die Werte der beispielhaften Korrespondenzregel in Tabelle 1 geben
die Verfügbarkeit
von früher
charaktersierten ZFPs wieder, von denen bekannt ist, dass sie an
ein gegebenes Nukleotidtriplett binden. Wenn für ein gegebenes Triplett an
einer gegebenen Position eines Zielortes ein oder mehrere früher charakterisierte
ZFPs existieren, die spezifisch an ein Zielsegment einschließend das
Triplett an der gegebenen Position binden, dann wird der Kombination
des Tripletts und der gegebenen Position ein Score von 10 zugewiesen.
Wenn es für
ein gegebenes Triplett an einer gegebenen Position kein früher charakterisiertes
ZFPs gibt, das spezifisch an den Zielort einschließend das
Triplett an der gegebenen Position bindet, aber wenn es ein oder
mehrere früher
charakterisierte ZFPs gibt, die spezifisch an das Triplett an einer
anderen Position binden, dann wird dem Triplett ein Score von 8
zugewiesen. Wenn es für
ein gegebenes Triplett und eine gegebene Position keine früher charakterisierten
ZFPs gibt, die das Triplett entweder an der gegebenen Position oder einer
anderen Position binden, wird dem Triplett und der Position ein
Wert von 1 zugewiesen.
-
Die
Werte 10, 8 und 1 sind lediglich illustrativ, und andere Werte können verwendet
werden. Darüber hinaus
kann eine verfeinerte Zuweisung von Werten verwendet werden, die
neben anderen Faktoren ebenso verschiedene Bindungsaffinitäten, Spezifitäten und
die Anwesenheit von D-fähigen
Orten berücksichtigt.
In einem derartigen Schema werden Kombinationen von Tripletts und
Positionen, für
die ältere
ZFPs mit starken Bindungsaffinitäten
existieren, typischerweise höhere
Werte zugeordnet als Kombinationen von Triplett und Positionen,
für die
es ältere
ZFPs mit niedrigeren Bindungsaffinitäten gibt.
-
Die
Auswahl möglicher
Zielorte innerhalb einer größeren Sequenz
und Berechnung von Scores wird typischerweise mit einem geeignet
programmierten Computer durchgeführt,
der einen oder mehrere mögliche Zielorte)
mit ihren Scores) ausgibt. Optional kann eine Eingabe an einen derartigen
Computer durch den Benutzer bereitgestellt werden, wie viele mögliche Zielorte
ausgegeben werden sollen. Zum Beispiel kann der Benutzer eine Ausgabe
von n möglichen
Zielorten mit den höchsten
Scores wählen,
wobei n im Ermessen des Benutzers liegt. Der Benutzer kann auch
einen Schwellenscore spezifizieren, der für einen möglichen Zielort erreicht oder überschritten
werden muss, damit er ausgegeben wird.
-
In
einer Variante des obigen Verfahrens kann ein möglicher Zielort basierend sowohl
auf Werten in einer Korrespondenztabelle als auch auf der Anwesenheit
von einem oder mehreren D-fähigen
Teilorten beurteilt werden. Dies wird durch Benutzereingabe eines
Kontextparameters erreicht, um einen skalierten Score für eine oder
mehrere Kombinationen eines Tripletts und einer bestimmten Position
bereitzustellen, wenn der Kontext des Tripletts die Anwesenheit
eines D-fähigen
Teilortes anzeigt. Zum Beispiel stellt ein Triplett 5'NNG3' gefolgt von einem
A keinen D-fähigen
Teilort bereit. Jedoch stellt 5'NNG3' gefolgt von einem
K einen D-fähigen Ort
bereit. Der Benutzer kann wählen,
einen Kontextparameter einzugeben, der den Wert des Teilscores für das 5'NNG3'-Triplett erhöht, wenn
sich K an ein 5'NNG3' anschließt. Der
skalierte Teilscore für
dieses Triplett wird dann mit Teilscores oder skalierten Teilscores
für andere
Tripletts kombiniert, um Gesamtscores für einen möglichen Zielort zu erhalten.
-
In
einer weiteren Variante wird ein Computer, der die obige Analyse
durchführt,
programmiert, um bestimmte Zielsegmente, die hohe Scores in Paaren
erhalten und die durch ihre physikalische Nähe zueinander bestimmt sind,
auszugeben. Gepaarte Zielsegmente, von denen beide hohe Scores erhalten,
die innerhalb von ungefähr
fünf Basen
voneinander getrennt auftreten, sind geeignete Ziele für die Konstruktion
von sechsfingerigen Zinkproteinen, welche durch Verbindung von zwei
Einzelzinkfingerproteinen gebildet werden, wobei jedes drei Finger
aufweist.
-
Mögliche Zielorte,
die durch die obigen Verfahren identifiziert werden, können Gegenstand
einer weiteren Beurteilung sein oder können direkt zur Konstruktion
oder Auswahl (wenn notwendig) und Herstellung von Zinkfingerproteinen
gemäß der vorliegenden
Erfindung verwendet werden.
-
V. Konstruktion von ZFPs
mit Datenbanken
-
Die
Erfindung stellt Verfahren zur Konstruktion von ZFPs für einen
vorausgewählten
Zielort bereit. Diese Verfahren sind zur Verwendung in Verbindung
mit den Verfahren zur Auswahl eines Zielortes wie oben beschrieben
oder mit anderen Verfahren zur Auswahl eines Zielortes geeignet.
-
Beim
Konstruieren eines neuen ZFPs ist es generell vorteilhaft, Informationen
zu nutzen, die vorcharakterisierten ZFPs und ihren Zielorten inhärent sind
und dadurch den Bedarf an einer de novo-Konstruktion oder -Auswahl
zu minimieren. Wie bei der Auswahl eines Zielortes sind verschiedene
Faktoren in dieses Verfahren involviert. Eine Konstruktion wird
erleichtert, wenn für
jeden Triplett-Teilort
in einem Zielorte die Finger nicht nur in existierenden ZFPs verfügbar sind,
sondern derartige Finger ebenso ihre entsprechenden Triplett-Teilorte
an derselben Stelle in existierenden Proteinen wie im vorgeschlagenen
Konstrukt kontaktieren. Betrachte zum Beispiel drei existierende
Paare von ZFPs und Zielorten: 5'GCG
TGG GAC3', gebunden
durch ein ZFP mit Fingern F1-F2-F3 (wobei F3 mit GCG interagiert,
F2 mit TGG und F1 mit GAC), 5'AAG
GAG GTG3', gebunden
durch ein ZFP mit Fingern F4-F5-F6 und 5'CCG TGA GCA3', gebunden durch ein ZFP mit Fingern
F7-F8-F9 und einen Zielort 5'GCG
GAG GCA3', für den ein
ZFP konstruiert werden soll. In dieser Situation bindet das neue
Protein F7-F5-F3
an 5'GCG GAG GCA3', wobei jeder Finger
im neuen Protein an derselben relativen Position im neuen Protein
auftritt wie in den Datenbank-Proteinen, aus denen es abgeleitet wurde.
Diese Konstruktion ist vorteilhaft, weil die analoge Umgebung jedes
Fingers im neuen ZFP im Vergleich zu derjenigen seines Vorläufer-ZFPs
bedeutet, dass der Finger des neuen ZFPs wahrscheinlich mit ähnlicher Spezifität und Affinität bindet
wie der der Mutter. Daher gilt wahrscheinlich die generelle Regel,
dass die Bindungscharakteristik eines Zinkfingerproteins die Summe
seiner Einzelfinger ist.
-
Neue
Zinkfingerproteine können
ebenso aus Einzelfingern konstruiert werden, die in existierenden Proteinen
verfügbar
sind, aber nicht an denselben Positionen vorliegen wie in dem Protein,
das konstruiert werden soll. Zum Beispiel kann das Protein F3-F7-F5
unter Verwendung des Satzes existierender Paare von ZFP-Orten wie oben beschrieben
konstruiert werden, um an die Sequenz 5'GAG GCA GCG3' zu binden. Im neuen Protein besetzen
die Finger andere Position als in ihren entsprechenden Mutterproteinen.
Obwohl ein gegebener Finger näherungsweise
seine Triplettspezifität
und -affinität
ungeachtet der Position, die er in einem ZFP besetzt, behält, bewirken
in der Praxis kontextabhängige
Effekte mit größerer Wahrscheinlichkeit
Veränderungen
der Spezifität
und/oder der Affinität
eines Fingers für
seinen Triplett-Teilort, wenn der Finger unterschiedliche Positionen
in unterschiedlichen Zinkfingerproteinen besetzt. Daher ist die
Spezifität
oder Affinität manchmal
anders (typischerweise niedriger) als erwartet, obwohl ZFPs, welche
aus Einzelfingern gebildet werden und welche andere Positionen besetzen
als in früher
charakterisierten ZFPs, typischerweise noch an den Ort binden.
-
Schließlich können komplett
neue Finger unter Verwendung von regelbasierten Vorgehensweisen oder
Phage-Display für
vorausgewählte
Zielorte, welche ein Triplett einschließen und für das kein vorexistierender
Finger verfügbar
ist, konstruiert oder ausgewählt
werden.
-
Die
Erfindung stellt Verfahren bereit, die systematisch eine Datenbank
verwenden, die Information über
existierende ZFPs zur Konstruktion von neuen ZFPs für einen
vorausgewählten
Zielort entsprechend den oben beschriebenen Prinzipien enthält. Die
Organisation einer typischen Datenbank ist in Tabelle 9 gezeigt. Die
Datenbank schließt
typischerweise Bezeichnungen für
jedes einer Sammlung von vorcharakterisierten ZFPs ein. Die ZFPs
können
natürliche
ZFPs oder davon abweichende ZFPs sein. Die Bezeichnung kann zum Beispiel
der Name oder ein Symbol sein, das jedes ZFP repräsentiert.
Die Datenbank schließt
ebenso Unterbezeichnungen für
jeden der Finger in einem ZFP ein. Typischerweise sind die Unterbezeichnungen
in Form von Aminosäureresten,
die ausgewählte
Positionen in einem Finger oder Fingern besetzen. Zum Beispiel sind in
Tabelle 9 die Unterbezeichnungen die Aminosäuren, die die Positionen –1 bis +6
entsprechend der konventionellen Nummerierung besetzen. Die Datenbank
schließt
weiterhin ein Segment einer Zielnukleinsäure ein, das durch jedes Zinkfingerprotein
gebunden wird. Das Nukleinsäuresegment
schließt
normalerweise drei dreibasige Tripletts ein. Die drei Basentripletts
können
verbunden als eine Sequenz oder als separate Sequenzen eingeschlossen
sein. Wenn Basen in einem neunbasigen Zielort fortlaufend vom 5'-Ende nummeriert
werden, besetzt ein erstes Triplett die Basen 7-9, ein zweites Triplett
besetzt die Basen 4-6 und ein drittes Triplett besetzt die Basen
1-3. Entsprechend dieser Bezeichnung der Triplettposition innerhalb
eines Zielsegments bindet der erste Finger eines Zinkfingerproteins
(z. B. am dichtesten am N-Terminus) an das erste Triplett, der zweite
Finger an das zweite Triplett und der dritte Finger an das dritte
Triplett. Die Datenbank kann ebenso zusätzliche Informationen einschließen wie
zum Beispiel die Bindungsaffinität
oder die Dissoziationskonstante eines ZFPs für seinen Zielort, obwohl dies
nicht entscheidend ist.
-
Ein
Zielort wird für
die Konstruktion eines Zinkfingerproteins unter Verwendung einer
Datenbank bereitgestellt. In einigen Verfahren wird der Zielort
durch Benutzereingabe bereitgestellt. In anderen Verfahren wird
der Zielort als Ausgabe eines beliebigen der oben beschriebenen
Verfahren zur Auswahl eines Zielortes bereitgestellt. Der Zielort
umfasst typischerweise wenigstens 9 Basen, die wenigstens drei Tripletts
bilden. Die drei einzelnen Tripletts werden als erste, zweite bzw.
dritte Tripletts konstruiert, die die Basen 7-9, 4-6 und 1-3 des
Zielortes besetzen, wobei der 5'-Base
die Base 1 zugewiesen wird. Für
das erste Triplett im Zielort, durchsucht der Computer die Datenbank
nach Zinkfingerprotein(en) enthaltend Finger, die an das Triplett
binden. Der Computer speichert Datensätze, die sich auf dabei identifizierte
Zinkfingerprotein(e) beziehen, und ihre(n) Finger, die/der an das
erste Triplett binden/bindet. Optional unterscheidet der Computer
zwischen Zinkfingerproteinen enthaltend einen Finger, der an das
erste Triplett des Zielortes an der ersten Fingerposition und an anderen
Positionen bindet. In diesem Falle speichert der Computer die beiden
Teilsätze
von Zinkfingerprotein(en) als getrennte Datensätze. Das Verfahren wird dann
für das
zweite Triplett des Zielortes wiederholt. Der Computer identifiziert
Zinkfingerprotein(e) enthaltend einen Finger, der spezifisch an
das zweite Triplett bindet. Optional unterscheidet der Computer
zwischen Zinkfinger(n), die an das zweite Triplett an der zweiten
Position eines existierenden Zinkfingerproteins oder an einer anderen
Position binden. Schließlich
identifiziert der Computer Zinkfingerprotein(e) enthaltend einen
Finger der spezifisch an das dritte Triplett des Zielortes bindet.
Optional unterscheidet der Computer zwischen Zinkfinger(n), die
an das dritte Triplett an der dritten Position eines existierenden
Zinkfingerproteins oder an einer anderen Position binden. Der Computer
gibt Bezeichnungen für die
ZFPs aus, die identifiziert wurden und Unterbezeichnungen der Finger,
die an das erste, zweite und dritte Triplett binden, nachdem er
nach ZFPs gesucht hat, die an jedes der ersten, zweiten und dritten
Tripletts im Zielsegment binden. Optional gibt der Computer getrennt
einen Teilsatz von ZFPs aus, die an das erste Triplett der ersten
Fingerposition binden und einen Teilsatz von ZFPs, die an das erste
Triplett anderer Positionen binden und entsprechende Teilsätze von
ZFPs, die an das zweite Triplett der zweiten Fingerposition und
anderer Positionen binden und von ZFPs, die an das dritte Triplett
der dritten Fingerposition und anderer Positionen binden.
-
Die
Ausgabe der Informationen durch den Computer kann zur Konstruktion
und Synthese neuer Zinkfingerproteine verwendet werden, die an ein
vorbestimmtes Ziel binden. Wenn zum Beispiel die Ausgabe ein ZFP1
mit einem Finger X einschließt,
der das erste Triplett des Ziels bindet, ein ZFP2, das einen Finger
Y einschließt,
der an das zweite Triplett des Ziels bindet, und ein ZFP3, das einen
Finger Z einschließt,
der an das dritte Triplett des Ziels bindet, kann ein neues ZFP
synthetisiert werden umfassend die Finger XYZ in dieser Reihenfolge
(N-terminal bis C-terminal). Wenn der Computer mehrere verschiedene
Zinkfingerproteine ausgibt, die mehrere verschiedene Finger enthalten,
die an ein gegebenes Triplett binden, kann der Benutzer zwischen
den Fingern abhängig
davon auswählen,
ob ein Finger an eine bestimmte Triplettposition mit derselben Position
im Datenbankprotein wie im ZFP bindet, das konstruiert werden soll.
Zum Beispiel wird ein ZFP1, das Finger XYZ enthält, in dem X an ein erstes
Triplett eines Zielortes bindet, generell gegenüber einem ZFP2 bevorzugt, das
Finger ABC enthält,
in dem Finger C an das erste Triplett eines Zielortes bindet. Daher
würde man typischerweise
Finger X anstatt C verwenden, um die erste Fingerposition in einem
ZFP zu besetzen, das konstruiert werden soll, um ein Zielsegment
zu binden. Oft identifiziert das Computerprogramm zwei ZFPs, jedes enthaltend
einen Finger, der an ein bestimmtes Triplett bindet, und in jedem
ZFP besetzt der Finger dieselbe Position im Datenbankprotein, von
dem es abgeleitet ist wie im intendierten ZFP-Konstrukt. In derartigen
Fällen wählt man
oft zwischen den beiden Fingern auf Grundlage der Bindungsaffinität für ihre entsprechenden
Ziele, wobei eine höhere
Bindungsaffinität
bevorzugt wird. Gegebenenfalls stellt der Computer auch vorgeschlagene Aminosäuresubstitutionen
für einen
oder mehrere Finger für
die entsprechenden Triplett(s) bereit, welche von dem (den) Finger(n)
gebunden werden.
-
Obwohl
eine Datenbankanalyse zunächst
für vorcharakterisierte
Zinkfingerproteine mit drei Fingern dargestellt ist, können derartige
Datenbanken alternativ oder zusätzlich
Informationen speichern, die Zinkfingerproteine mit einer kleineren
oder größeren Zahl
von Fingern betreffen. Ebenso können
derartige Datenbanken zur Konstruktion von Zinkfingerproteinen mit
mehr oder weniger als drei Fingern verwendet werden. Einige erfindungsgemäße Datenbanken
speichern zum Beispiel Informationen, die ZFPs mit nur zwei Fingern
betreffen als auch oder anstatt von Informationen, die ZFPs mit
drei Fingern betreffen. ZFPs mit nur zwei Fingern weisen entsprechende
Zielorte mit nur zwei Tripletts auf. Die Informationen, die sich
auf zweifingerige ZFPs beziehen, können zur Konstruktion von dreifingerigen
ZFPs, die an neunbasige Zielorte binden, auf im wesentlichen dieselbe
Weise wie oben beschrieben verwendet werden. Jedoch gibt es keine
exakte Entsprechung der relativen Positionen von zwei Fingern in
einem zweifingerigen Protein zu den relativen Positionen von drei Fingern
in einem dreifingerigen Zinkfingerprotein. Dieser Punkt kann auf
zwei Weisen behandelt werden. Erstens können alle Finger in einem zweifingerigen
Protein tatsächlich
so behandelt werden, dass sie unterschiedliche Positionen als Finger
eines dreifingerigen Proteins besetzen. Wenn folglich ein zweifingeriges
Protein einen Finger enthält,
der an ein gegebenes Triplett bindet, gibt der Computer diese Information
aus und zeigt an, dass der Finger nicht an derselben Position des
zweifingerigen Proteins aus der Datenbank auftritt wie im dreifingerigen
Protein, das konstruiert werden soll. Alternativ kann der erste
(N-terminale) Finger eines zweifingerigen Proteins als das Äquivalent
von entweder dem ersten oder zweiten Finger eines dreifingerigen
Proteins betrachtet werden. Der zweite Finger eines zweifingerigen
Proteins kann als das Äquivalent
von entweder dem zweiten oder dritten Finger eines dreifingerigen
Proteins betrachtet werden. Wenn folglich der Computer ein zweifingeriges
Protein mit einem ersten (N-terminalen) Finger bindend an ein erstes
Triplett eines Zielortes identifiziert, für den ein Zinkfingerprotein
konstruiert werden soll, kann der Computer ausgeben, dass das zweifingerige
Protein einen geeigneten Finger und an derselben Position im Datenbankprotein
wie im dreifingerigen Protein, welches konstruiert werden soll,
bereitstellt.
-
VI. Herstellung von ZFPs
-
ZFP-Polypeptide
und Nukleinsäuren,
die diese kodieren, können
mit Routinetechniken aus dem Gebiet der rekombinanten Genetik erzeugt
werden. Basistexte, die die allgemeinen Verfahren offenbaren, welche in
dieser Erfindung verwendet werden, umfassen Sambrook et al., Molecular
Cloning, A Laboratory Manual (2. Aufl. 1989); Kriegler, Gene Transfer
and Expression: A Laboratory Manual (1990); und Current Protocols
in Molecular Biology (Ausubel et al., Hrsg., 1994) ein. Des Weiteren
können
Nukleinsäuren
mit weniger als etwa 100 Basen gewöhnlich bei vielen kommerziellen
Quellen bestellt werden, wie z. B. bei The Midland Certified Reagent
Company (mcrc@oligos.com), The Great American Gene Company (http://www.genco.com),
ExpressGen Inc. (www.expressgen.com), Operon Technologies Inc. (Alameda,
CA). Auf ähnliche
Weise können Peptide
gewöhnlich
bei vielen Quellen bestellt werden, wie z. B. bei PeptidoGenic (pkim@ccnet.com),
HTI Bio-products Inc. (http://www.htibio.com), BMA Biomedicals Ltd
(U.K.), Bio.Synthesis Inc.
-
Oligonukleotide
können
entsprechend dem Festphasen-Phosphoramidit-Triesterverfahren chemisch synthetisiert
werden, das zuerst von Beaucage & Caruthers,
Tetrahedron Letts. 22:1859-1862 (1981) beschrieben wurde und einen
automatischen Synthesizer verwendet, wie es in Van Devanter et al.,
Nucleic Acids Res. 12:6159-6168 (1984) beschrieben ist. Oligonukleotide
werden entweder durch denaturierende Polyacrylamidgelelektrophorese
oder Umkehrphasen-HPLC gereinigt. Die Sequenz der klonierten Gene
und synthetischer Oligonukleotide kann nach Klonieren unter Verwendung
von z. B. dem Kettenabbruchverfahren zum Sequenzieren von doppelsträngigen Templates
nach Wallace et al., Gene 16:21-26 (1981) verifiziert werden.
-
Es
werden typischerweise zwei alternative Verfahren verwendet, um die
kodierenden Sequenzen zu erzeugen, welche zur Expression neu konstruierter
DNA-bindender Peptide benötigt
werden. Ein Protokoll ist ein PCR-basiertes Verfahren zum Zusammenfügen, welches
sechs überlappende
Oligonukleotide verwendet (3). Drei
Oligonukleotide (Oligos 1, 3 und 5 in 3) entsprechen "universellen" Sequenzen, welche
Teile der DNA-bindenden Domäne
zwischen den Erkennungshelices kodieren. Diese Oligonukleotide bleiben typischerweise
für alle
Zinkfingerkonstrukte konstant. Die anderen drei "spezifischen" Oligonukleotide (Oligos 2, 4 und 6
in 3) sind zur Kodierung der Erkennungshelices konstruiert.
Diese Oligonukleotide enthalten Substitutionen in erster Linie an
den Positionen –1,
2, 3 und 6 auf den Erkennungshelices und machen sie für jede der
verschiedenen DNA-bindenden Domänen
spezifisch.
-
Die
PCR-Synthese wird in zwei Schritten durchgeführt. Zuerst wird ein doppelsträngiges DNA-Template
durch Kombinieren von sechs Oligonukleotiden (drei universell, drei
spezifisch) in einer vierzyklischen PCR-Reaktion mit einem Zusammenlagerungsschritt
bei niedriger Temperatur erzeugt, wobei sich die Oligonukleotide
zusammenlagern, um ein DNA-"Gerüst" zu bilden. Die Lücken im
Gerüst
werden durch eine thermostabile High-Fidelity-Polymerase gefüllt, die
Kombination von Taq- und Pfu-Polymerasen genügt ebenfalls. In der zweiten
Phase der Konstruktion wird das Zinkfinger-Template durch externe
Primer amplifiziert, die so konstruiert sind, dass sie an beiden
Enden Restriktionsstellen zur Klonierung in einen Shuttlevektor
oder direkt in einen Expressionsvektor aufweisen.
-
Ein
alternatives Verfahren zum Klonieren von neukonstruierten DNA-bindenden
Proteinen basiert auf der Zusammenlagerung komplementärer Oligonukleotide,
welche spezifische Regionen des gewünschten ZFPs kodieren. Diese
besondere Anwendung benötigt
Oligonukleotide, die vor dem letzten Ligationsschritt phosphoryliert
sind. Dies wird normalerweise vor dem Ansetzen der Zusammenlagerungsreaktionen
durchgeführt.
In Kürze,
die "universellen" Oligonukleotide,
die die konstanten Regionen des Proteins kodieren (Oligos 1, 2 und
3 von oben), werden mit ihren komplementären Oligonukleotiden zusammengelagert.
Zusätzlich
werden die "spezifischen" Oligonukleotide,
welche die Erkennungshelices der Finger kodieren, mit ihren entsprechenden
komplementären
Oligonukleotiden zusammengelagert. Diese komplementären Oligos
werden so konstruiert, dass sie die Region füllen, die vorher mit der Polymerase
im oben erwähnten
Protokoll gefüllt
wurde. Die komplementären
Oligos zu den herkömmlichen
Oligos 1 und Finger 3 sind so konstruiert, dass sie überhängende Sequenzen
belassen, die spezifisch für
die Restriktionsstellen sind, die beim Klonieren in den Vektor der
Wahl im folgenden Schritt verwendet werden.
-
Das
zweite Protokoll zum Zusammenfügen
unterscheidet sich vom ursprünglichen
Protokoll durch die folgenden Aspekte: Das "Gerüst", welches das neukonstruierte
ZFP kodiert, ist vollkommen aus synthetischer DNA zusammengesetzt
und eliminiert dabei den Auffüllungsschritt
mit Polymerase, zusätzlich
braucht das in den Vektor zu klonierende Fragment keine Amplifikation.
Schließlich
eliminiert die Konstruktion von verbleibenden sequenzspezifischen Überhängen die
Notwendigkeit eines Restriktionsenzymverdaus des inserierten Fragments.
Alternativ können
Veränderungen
der Erkennungshelices unter Verwendung konventioneller ortsgerichteter
Mutageneseverfahren erzeugt werden.
-
In
beiden Verfahren zum Zusammenfügen
muss das resultierende Fragment, welches das neu konstruierte ZFP
kodiert, in einen Vektor ligiert werden. Zuletzt wird die ZFP-kodierende
Sequenz in einen Expressionsvektor kloniert. Allgemein verwendete
Expressionsvektoren schließen
einen modifizierten bakteriellen pMALc2 Expressionsvektor (New England
BioLabs) oder einen eukaryotischen Expressionsvektor pcDNA (Promega)
ein, aber sind nicht darauf begrenzt. Die Endkonstrukte werden durch
Sequenzanalyse verifiziert.
-
Jedes
zur Proteinreinigung geeignete Verfahren, welches dem Fachmann bekannt
ist, kann zum Reinigen von erfindungsgemäßen ZFPs verwendet werden (siehe
Ausubel, supra, Sambrook, supra). Desweiteren kann jeder geeignete
Wirt zur Expression verwendet werden, z. B. Bakterienzellen, Insektenzellen,
Hefezellen, Säugerzellen
und dergleichen.
-
Die
Expression eines mit einem maltosebindenden Protein fusionierten
Zinkfingerproteins (MBP-ZFP) im Bakterienstamm JM109 ermöglicht die
direkte Reinigung mit einer Amylosesäule (NEB). Hohe Expressionsspiegel
des chimären
Zinkfingerproteins können
durch Induktion mit IPTG erhalten werden, da die MBP-ZFP-Fusion im pMal-c2
Expressionsplasmid unter der Kontrolle des tac-Promotors steht (NEB).
Ein 2xYT-Medium enthaltend 10 μM
ZnCl2, 0,02% Glukose plus 50 μg/ml Ampicillin
wird mit Bakterien angeimpft, welche MBP-ZFP-Fusionsplasmide enthalten,
und bei 37°C
geschüttelt.
Mitten im exponentiellen Wachstum werden 0,3 mM IPTG hinzugefügt, und
die Kulturen werden geschüttelt.
Nach 3 Stunden werden die Bakterien durch Zentrifugation geerntet,
durch Ultraschall oder durch Passage durch eine Frenchpress-Zelle
oder durch die Verwendung von Lysozym aufgebrochen, und unlösliches
Material wird durch Zentrifugation entfernt. Die MBP-ZFP-Proteine
werden auf einem amylosebindenden Harz festgehalten, ausgiebig mit
Puffer enthaltend 20 mM Tris-HCl (pH 7,5), 200 mM NaCl, 5 mM DTT
und 50 μM
ZnCl2 gewaschen, dann mit Maltose in im
wesentlichen gleichen Puffer eluiert (die Reinigung basiert auf
einem Standardprotokoll von NEB). Gereinigte Proteine werden quantifiziert
und für
die biochemische Analyse gelagert.
-
Die
Dissoziationskonstanten der gereinigten Proteine, z. B. Kds, werden
typischerweise durch elektrophoretische Mobilitätsverschiebungstests (electrophoretic
mobility shift assays, EMSA) charakterisiert (Buratowski & Chodosh, in Current
Protocols in Molecular Biology, Seiten 12.2.1-12.2.7 (Hrsg. Ausubel,
1996)). Die Affinität
wird durch Titration von gereinigtem Protein gegen eine feste Menge
von markiertem doppelsträngigen Oligonukleotidziel
gemessen. Das Ziel umfasst typischerweise die natürliche Sequenz
der Bindungsstelle flankiert von den 3 bp, die in der natürlichen
Sequenz gefunden werden und zusätzlichen
konstanten flankierenden Sequenzen. Die natürliche Bindungstelle besteht
typischerweise aus 9 bp für
ein dreifingeriges Protein und 2 × 9 bp + dazwischenliegende
Basen für
ein sechsfingeriges ZFP. Die zusammengelagerten Oligonukleotidziele besitzen
einen einbasigen 5'-Überhang,
welcher die effiziente Markierung des Ziels mit Polynukleotidkinase des
T4-Phagen erlaubt. Für
den Test wird das Ziel in einer Konzentration von 1 nM oder niedriger
hinzugegeben (die tatsächliche
Konzentration wird wenigstens zehnmal niedriger gehalten als die
erwartete Dissoziationskonstante), gereinigte ZFPs werden in verschiedenen
Konzentrationen hinzugegeben, und man lässt die Reaktion für wenigstens
45 min equilibrieren. Desweiteren enthält die Reaktionsmischung ebenso
10 mM Tris (pH 7,5), 100 mM KCl, 1 mM MgCl2,
0,1 mM ZnCl2, 5 mM DTT, 10% Glycerin, 0,02%
BSA. (NB: in früheren Tests
wurde ebenso 10-100 μg/μl poly d(IC)
hinzugegeben.)
-
Die
equilibrierten Reaktionen wurden auf ein 10%iges Polyacrylamidgel
gebracht, welches für
45 min in Tris/Glycinpuffer vorgelaufen war, dann wurde gebundenes
und ungebundenes markiertes Ziel durch Elektrophorese bei 150V analysiert.
(Alternatively können
10-20%ige Gradienten-Tris-HCl-Gele verwendet werden, die ein 4%iges
Polyacrylamidsammelgel enthalten). Die getrockneten Gele werden
durch Autoradiographie oder durch Phosphorimaging sichtbar gemacht,
und der scheinbare Kd wird bestimmt, indem die Proteinkonzentration
berechnet wird, die eine halbmaximale Bindung ergibt.
-
Die
Tests können
ebenso eine Bestimmung der aktiven Fraktionen in den Proteinpräparationen
einschließen.
Aktive Fraktionen werden durch stöchiometrische Gelverschiebungen
bestimmt, wobei Proteine gegen einen hohe Konzentration von Ziel-DNA
titriert werden. Titrationen werden bei 100, 50 und 25% des Ziels durchgeführt (normalerweise
bei mikromolaren Spiegeln).
-
VII. Anwendungen der konstruierten
ZFPs
-
ZFPs,
die an ein bestimmtes Zielgen binden, und die Nukleinsäuren kodierend
dieselben können
für eine
Anzahl von Anwendungen verwendet werden. Diese Anwendungen schließen therapeutische
Verfahren ein, in denen ein ZFP oder eine Nukleinsäure, die
es kodiert, einem Patienten verabreicht wird und verwendet wird,
um die Expression eines Zielgens in dem Patienten zu modulieren
(siehe parallele Anmeldung Townsend & Townsend & Crew, Aktenzeichen 019496-002200,
eingereicht am 12. Januar 1998). Die Modulation kann in Form einer
Repression stattfinden, wenn z. B. das Zielgen in einem pathologischen
infektiösen
Mikroorganismus sitzt, oder ein endogenes Gen des Patienten kann
moduliert werden, wie z. B. ein Onkogen oder ein viraler Rezeptor,
der zu einem Krankheitszustand beiträgt. Alternativ kann die Modulation
in Form einer Aktivierung stattfinden, wenn eine Aktivierung der
Expression oder erhöhte
Expression eines endogenen zellulären Gens einen Krankheitszustand
verbessern kann. Für
solche Anwendungen werden ZFPs, oder typischer Nukleinsäuren kodierend
dieselben, mit einem pharmazeutisch akzeptablen Träger als
eine pharmazeutische Zusammensetzung formuliert.
-
Pharmazeutisch
akzeptable Träger
werden sowohl teilweise durch die bestimmte Zusammensetzung, welche
verabreicht wird, bestimmt, als auch durch das bestimmte Verfahren
zum Verabreichen der Zusammensetzung. (Siehe z. B. Remington's Pharmaceutical
Sciences, siebzehnte Auflage 1985)). Die ZFPs, allein oder in Kombination
mit anderen geeigneten Bestandteilen, können in eine Aerosolzubereitung
(d.h. sie kann "vernebelt" werden) zum Verabreichen
durch Inhalation gebracht werden. Aerosolzubereitungen können unter Druck
in akzeptable Treibmittel gebracht werden, wie z. B. Dichlordifluormethan,
Propan, Stickstoff und dergleichen. Zubereitungen geeignet zum parenteralen
Verabreichen wie zum Beispiel über
intravenöse,
intramuskuläre,
intradermale und subkutane Wege, schließen wässerige und nichtwässerige
isotonische sterile Injektionslösungen
ein, die Antioxidantien, Puffer, Bakteriostatika und gelöste Stoffe
enthalten können,
welche die Zubereitung isotonisch mit dem Blut des gedachten Empfängers machen,
und wässerige
und nichtwässerige
sterile Suspensionen, die Suspendierungsmittel, Lösungsvermittler,
Verdickungsmittel, Stabilisatoren und Konservierungsmittel einschließen können. Zusammensetzungen
können
zum Beispiel durch intravenöse
Infusion, oral, topisch, intraperitoneal, intravesikal oder intrathekal
verabreicht werden. Die Zubereitungen von Verbindungen können in
versiegelten Einzeldosis- oder Mehrfachdosisbehältern dargereicht werden, wie
z. B. Ampullen oder Fläschchen.
Injektionslösungen
und -suspensionen können
aus sterilen Pulvern, Granulaten und Tabletten der Art wie oben
beschrieben hergestellt werden.
-
Die
an einen Patienten verabreichte Dosis sollte ausreichend sein um
eine nützliche
therapeutische Antwort des Patienten über die Zeit zu bewirken. Die
Dosis wird durch die Wirksamkeit und den Kd des
besonderen verwendeten ZFPs, die Zielzelle und den Zustand des Patienten,
wie auch das Körpergewicht
oder die Oberflächengröße des Patienten
bestimmt, der behandelt wird. Die Höhe der Dosis wird durch die
Existenz, die Art und das Ausmaß von
beliebigen negativen Nebenwirkungen bestimmt, die die Verabreichung
einer bestimmten Verbindung oder eines Vektors in einem bestimmten
Patienten begleiten.
-
In
anderen Anwendungen werden ZFPs in diagnostischen Verfahren zur
sequenzspezifischen Detektion von Zielnukleinsäuren in einer Probe verwendet.
Zum Beispiel können
ZFPs zur Detektion von abweichenden Allelen verwendet werden, welche
mit einer Krankheit oder einem Phänotyp in Patientenproben assoziiert sind.
Zum Beispiel können
ZFPs zur Detektion der Anwesenheit bestimmter mRNA-Spezies oder
cDNAs in komplexen Mischungen von mRNAs oder cDNAs verwendet werden.
Als weiteres Beispiel können
ZFPs verwendet werden, um die Kopienzahl eines Gens in einer Probe
zu quantifizieren. Zum Beispiel ist die Detektion des Verlustes
einer Kopie eines p53-Gens in einer klinischen Probe ein Indikator
der Empfänglichkeit
für Krebs. In
einem weiteren Beispiel werden ZFPs zur Detektion der Anwesenheit
von pathologischen Mikroorganismen in klinischen Proben verwendet.
Dies wird durch Verwendung von einem oder mehreren ZFPs erzielt,
welche für
Gene aus den Mikroorganismen, die detektiert werden sollen, spezifisch
sind. Ein geeignetes Format zum Durchführen diagnostischer Tests verwendet
ZFPs verbunden mit einer Domäne,
welche die Immobilisierung des ZFPs auf einer ELISA-Platte erlaubt.
Das immobilisierte ZFP wird mit der Probe, die eine Zielnukleinsäure enthalten
könnte,
unter Bedingungen in Kontakt gebracht, unter denen eine Bindung
stattfinden kann. Typischerweise werden Nukleinsäuren in der Probe markiert
(z. B. im Verlauf einer PCR-Amplifikation). Alternativ können unmarkierte
Sonden durch eine zweite markierte Sonde detektiert werden. Nach
dem Waschen werden die durch die Bindung markierten Nukleinsäuren detektiert.
-
ZFPs
können
auch für
Tests zum Bestimmen des Phänotyps
und der Funktion der Genexpression verwendet werden. Gegenwärtige Methoden
zum Bestimmen der Genfunktion basieren in erster Linie auf entweder
einer Überexpression
oder einer Entfernung (vollständiger
Knock-out) des Gens von Interesse aus seiner natürlichen biologischen Umgebung
und Beobachtung der Wirkungen. Die beobachteten phänotypischen
Wirkungen zeigen die Rolle des Gens im biologischen System an.
-
Ein
Vorteil der ZFP-vermittelten Regulation eines Gens relativ zur konventionellen
Knock-out-Analyse ist, dass die Expression des ZFPs unter die Kontrolle
kleiner Moleküle
gebracht werden kann. Durch die Kontrolle des Expressionsspiegels
des ZFPs kann man der Reihe nach die Expressionsspiegel eines Gens
kontrollieren, das durch das ZFP reguliert wird, um zu bestimmen,
welcher Grad an Repression oder Stimulation der Expression benötigt wird,
um eine gegebene phänotypische
oder biochemische Wirkung zu erzielen. Diese Vorgehensweise hat
einen besonderen Wert bei der Arzneimittelentwicklung. Wenn das
ZFP unter die Kontrolle eines kleinen Moleküls gebracht wird, können Probleme
der embryonalen Lethalität
und Entwicklungskompensation vermieden werden, wenn der ZFP-Repressor
in einem späteren
Stadium der Entwicklung der Maus angeschaltet wird und die Wirkungen
im erwachsenen Tier beobachtet werden. Transgene Mäuse mit
Zielgenen, welche durch ein ZFP reguliert werden, können durch
Integration der Nukleinsäure
kodierend das ZFP an einem beliebigen Ort trans zum Zielgen hergestellt
werden. Dementsprechend wird eine homologe Rekombination für die Integration
der Nukleinsäure
nicht benötigt.
Da weiterhin das ZFP transdominant ist, wird nur eine chromosomale
Kopie benötigt,
und funktionelle Knock-out-Tiere können daher ohne Rückkreuzen
hergestellt werden.
-
VIII. Computersysteme
und Programme
-
4 stellt
ein repräsentatives
Computersystem dar, das zum Implementieren der vorliegenden Erfindung
geeignet ist. 4 zeigt grundlegende Teilsysteme
eines Computersystems 10, das zur Verwendung in der vorliegenden
Erfindung geeignet ist. In 4 schließt das Computersystem 10 einen
Bus 12 ein, der bedeutende Teilsysteme miteinander verbindet,
z. B. einen zentralen Prozessor 14, einen Systemspeicher 16, einen
Eingabe/Ausgabe-Kontroller 18, eine externe Vorrichtung
wie z. B einen Drucker 20 über eine parallele Schnittstelle 22,
einen Bildschirm 24 über
einen Bildschirmadapter 26, eine serielle Schnittstelle 28,
eine Tastatur 30, ein Festplattenlaufwerk 32 und
ein Diskettenlaufwerk 33, das eine Diskette 33A aufnehmen
kann. Viele andere Vorrichtungen können verbunden werden, wie
z. B. ein Scanner 60 (nicht gezeigt) über einen I/O-Kontroller 18,
eine Maus 36, die mit der seriellen Schnittstelle 28 verbunden
ist, oder ein Netzwerkinterface 40. Viele andere Vorrichtungen
oder Teilsysteme (nicht gezeigt) können auf ähnliche Weise verbunden werden.
Ebenso ist es nicht notwendig, dass alle Vorrichtungen, die in 4 gezeigt
sind, vorhanden sind, um die vorliegende Erfindung auszuführen, wie
unten diskutiert. Die Vorrichtungen und Teilsysteme können auf andere
Weise als in 4 gezeigt miteinander verbunden
werden. Die Operationen eines Computersystems, wie z. B. in 4 gezeigt,
sind ohne weiteres dem Stand der Technik zu entnehmen und werden
in der vorliegenden Anmeldung nicht ausführlich diskutiert. Ein Quellcode
zum Implementieren der vorliegenden Erfindung kann operativ in Systemspeicher 16 eingerichtet
oder auf einem Speichermedium wie z. B. einer Festplatte 32 oder
einer Diskette 33A gespeichert werden.
-
5 ist
eine Darstellung eines repräsentativen
Computersystems 10 aus 4, welches
geeignet ist, die erfindungsgemäßen Verfahren
zu verkörpern. 5 stellt
nur ein Beispiel von vielen möglichen
Computertypen oder -konfigurationen dar, welche in der vorliegenden
Erfindung verwendet werden können. 5 zeigt
ein Computersystem 10, einschließend einen Bildschirm 24,
ein Gehäuse 20,
eine Tastatur 30, einen Scanner 60 und eine Maus 36.
Die Maus 36 und die Tastatur 30 stellen "Vorrichtungen zur
Benutzereingabe" dar.
Andere Beispiele von Vorrichtungen zur Benutzereingabe sind ein
Touchscreen, ein Lichtstift, ein Trackball, ein Datenhandschuh,
etc.
-
In
einer bevorzugten Ausführungsform
schließt
System 10 einen Computer der Pentiumklasse® ein, auf
dem das Betriebssystem Windows® Version 3.1,
WindoWs95® oder
Windows98® der
Microsoft Corporation läuft.
Jedoch können
die Verfahren leicht an andere Betriebssystem adaptiert werden,
ohne vom Umfang der vorliegenden Erfindung abzuweichen.
-
Die
Maus 36 kann eine oder mehrere Tasten wie zum Beispiel
die Tasten 37 aufweisen. Das Gehäuse 20 enthält geläufige Computerkomponenten
wie z. B. ein Diskettenlaufwerk 33, einen Prozessor, Speichermittel,
etc. In dieser Beschreibung schließt "Speichermittel" eine beliebige Speichervorrichtung
ein, die in Verbindung mit einem Computersystem verwendet wird,
z. B. Diskettenlaufwerke, Magnetband, Festkörperspeicherelemente, Blasenspeicher
etc. Das Gehäuse 20 kann
weitere Hardware einschließen
wie z. B. ein Eingabe/Ausgabe (I/O)-Interface 18, um das
Computersystem 10 mit externen Vorrichtungen zu verbinden,
z. B. mit einem Scanner 60, einem externen Speicher, anderen
Computern oder weiterer Peripherie. 5 ist nur
für einen
Systemtyp zur Verkörperung
der vorliegenden Erfindung repräsentativ.
Viele andere Systemtypen und Konfigurationen sind zur Verwendung
in Verbindung mit der vorliegenden Erfindung geeignet.
-
6 stellt
ein Flussdiagramm 301 von vereinfachten Schritten einer
repräsentativen
Ausführungsform
zum Auswählen
eines Zielortes enthaltend einen D-fähigen Teilort innerhalb einer
Zielsequenz zum Targeting durch ein Zinkfingerprotein dar. In Schritt 302 wird
eine Zielsequenz bereitgestellt, die durch ein Zinkfingerprotein
getargetet werden soll. Anschließend wird in Schritt 303 ein
möglicher
Zielort innerhalb der Zielsequenz zur Beurteilung ausgewählt. In
einem Entscheidungsschritt 304 wird der mögliche Zielort
beurteilt, um zu bestimmen, ob er einen D-fähigen Teilort enthält. Solch
ein Zielort entspricht der Formel
5'-NNx aNy bNzc-3', wobei
jedes von (x,a), (y,b)
und (z,c) (N,N) oder (G,K) ist;
wenigstens eines von (x,a),
(y,b) und (z,c) (G,K) ist; und N und K mehrdeutige Abkürzungen
entsprechend IUPAC-IUB sind.
-
Wenn
der mögliche
Zielort einen D-fähigen
Teilort enthält,
wird der mögliche
Zielort als Datensatz in 205 gespeichert. Das Verfahren
wird mit einem weiteren Enscheidungsschritt 306 fortgesetzt.
Wenn die Beurteilung eines weiteren möglichen Zielortes durch den
Benutzer notwendig ist, wird eine weitere Iteration des Verfahrens
durchgeführt,
welche bei 303 beginnt. Wenn genügend mögliche Zielorte beurteilt sind,
werden die Datensätze
der Zielorte, welche in Schritt 305 gespeichert wurden,
in Schritt 307 ausgegeben.
-
7A stellt
ein Flussdiagramm von vereinfachten Schritten einer anderen repräsentativen
Ausführungsform
zum Auswählen
eines Zielortes innerhalb eines Polynukleotides zum Targeting durch
ein Zinkfingerprotein dar. In Schritt 402 wird eine Polynukleotidzielsequenz
zur Analyse bereitgestellt. Anschließend wird in Schritt 404 ein
möglicher
Zielort innerhalb der Polynukleotidsequenz ausgewählt. Der
mögliche
Zielort umfasst erste, zweite und dritte Basentripletts an ersten,
zweiten und dritten Positionen des möglichen Zielortes. Anschließend werden
in Schritt 406 mehrere Teilscores durch Anwendung einer
Korrespondenzregel zwischen Tripletts und Triplettposition bestimmt,
wobei jedes Triplett erste, zweite und dritte entsprechende Positionen aufweist,
und jedem entsprechenden Triplett und jeder entsprechenden Position
wird ein bestimmter Teilscore zugewiesen. Der nächste Entscheidungsschritt 408 ist
optional, in dem der Benutzer wählen
kann, einen oder mehrere der Teilscores mit einem Skalierungsfaktor
in Schritt 410 zu skalieren. Danach wird in Schritt 412 ein Score
aus den (passend skalierten) Teilscores für die ersten, zweiten und dritten
Tripletts bestimmt. Anschließend
wird in einem Entscheidungsschritt 414 eine Kontrolle durchgeführt, ob
beliebige weitere mögliche
Zielorte untersucht werden müssen.
Falls ja, wird die Verarbeitung mit Schritt 404 fortgeführt. Anderenfalls
wird in Schritt 416 wenigstens einer der möglichen
Zielorte und sein Score ausgegeben.
-
7B stellt
ein Flussdiagramm von vereinfachten Schritten einer repräsentativen
Ausführungsform zum
Herstellen eines Zinkfingerproteins dar. In Schritt 450 wird
eine Datenbank umfassend Bezeichnungen für mehrere Zinkfingerproteine
bereitgestellt. Jedes Protein in der Datenbank umfasst wenigstens
erste, zweite und dritte Finger. Die Datenbank umfasst weiterhin
Unterbezeichnungen für
jeden der drei Finger für
jedes der Zinkfingerproteine und eine entsprechende Nukleinsäuresequenz
für jedes
Zinkfingerprotein. Jede Sequenz umfasst wenigstens erste, zweite
und dritte Tripletts, die spezifisch an den wenigstens ersten, zweiten
bzw. dritten Finger jedes Zinkfingerproteins gebunden sind. Das
erste, zweite und dritte Triplett hat eine Anordnung in der Nukleinsäuresequenz
in der selben jeweiligen Reihenfolge (3'-5'),
wie der erste, zweite und dritte Finger im Zinkfingerprotein angeordnet
ist (N-terminal bis C-terminal).
-
In
Schritt 452 wird ein Zielort zur Konstruktion von Zinkfingerproteinen
umfassend wenigstens erste, zweite und dritte Tripletts bereitgestellt.
Anschließend
wird in Schritt 454 ein erster Satz von Zinkfingerproteinen
mit einem Finger, der an das erste Triplett bindet, in der Zielsequenz
identifiziert. Dann folgt ein optionaler Schritt 456 zum
Identifizieren erster und zweiter Teilsätze des in 454 bestimmten
Satzes. Der erste Teilsatz umfasst Zinkfingerprotein(e) mit einem
Finger, der an das erste Triplett der ersten Fingerposition des
Zinkfingerproteins bindet. Der zweite Teilsatz umfasst Zinkfingerprotein(e)
mit einem Finger, der an das erste Triplett einer anderen als der
ersten Fingerposition des Zinkfingerproteins bindet. Das Verfahren
wird mit Schritt 458 fortgesetzt. In diesem Schritt wird
ein weiterer Satz von Zinkfingerproteinen identifiziert, wobei dieser
Satz einen Finger umfasst, der an das zweite Triplett des Zielortes
bindet. Diesem Schritt folgt ein optionaler Schritt 460 zum
Identifizieren erster und zweiter Teilsätze des in Schritt 458 identifizierten
Satzes. Der erste Teilsatz umfasst Zinkfingerprotein(e), die an
das zweite Triplett der zweiten Position innerhalb eines Zinkfingerproteins binden.
Der zweite Teilsatz umfasst Zinkfingerprotein(e), die an das zweite
Triplett einer anderen als der zweiten Position eines Zinkfingerproteins
binden. Das Verfahren wird mit Schritt 462 fortgesetzt.
In 462 wird ein Satz Zinkfingerproteine identifiziert umfassend
einen Finger, der an das dritte Triplett des Zielortes bindet. Mit einem
optionalen Schritt 464 werden erste und zweite Teilsätze des
in Schritt 462 identifizierten Satzes identifiziert. Der
erste Teilsatz umfasst Zinkfingerprotein(e) enthaltend einen Finger,
der an das dritte Triplett der dritten Fingerposition des Zinkfingerproteins
bindet. Der zweite Teilsatz umfasst Zinkfingerprotein(e) enthaltend
einen Finger, der an das dritte Triplett einer anderen als der dritten
Fingerposition des Zinkfingerproteins bindet. Das Verfahren wird
mit Schritt 466 fortgesetzt, in dem die Sätze der
Zinkfingerproteine, die in den Schritten 454, 458 und 462 identifiziert
wurden, separat ausgegeben werden. In einem weiteren optionalen Schritt 468 werden
die ersten und zweiten Teilsätze
der Zinkfingerproteine, die in den Schritten 460, 464 und 468 identifiziert
wurden, ausgegeben.
-
8A ist
ein Schlüssel
zum Diagramm zur Darstellung einer Dateneinheit (Entity Representation
Diagram, ERD), welches verwendet wird, um den Inhalt einer ZFP-Datenbank
zu beschreiben. Eine repräsentative
Tabelle 502 schließt
ein oder mehrere Schlüsselattribute 504 und
ein oder mehrere Nicht-Schlüsselattribute 506 ein.
Die repräsentative
Tabelle 502 schließt
einen oder mehrere Datensätze
ein, wobei jeder Datensatz Felder entsprechend den aufgelisteten
Attributen einschließt.
Die Inhalte der Schlüsselfelder
zusammengenommen identifizieren einen individuellen Datensatz. Im
ERD wird jede Tabelle durch ein Rechteck repräsentiert, das durch eine horizontale
Linie geteilt ist. Die Felder oder Attribute oberhalb der Linie
sind Schlüssel, während die
Felder oder Attribute unter der Linie Nicht-Schlüsselfelder sind. Eine Identifikationsbeziehung 508 bedeutet,
dass das Schlüsselattribut
einer Muttertabelle 510 auch ein Schlüsselattribut einer Tochtertabelle 512 ist.
Eine Nicht-Identifikationsbeziehung 514 bedeutet, dass
das Schlüsselattribut
einer Muttertabelle 516 ebenso ein Nicht-Schlüsselattribut
einer Tochtertabelle 518 ist. Wo (FK) in Klammern erscheint,
bedeutet dies, dass ein Attribut einer Tabelle ein Schlüsselattribut
einer anderen Tabelle ist. Sowohl für die Nicht-Identifikations-
als auch die Identifikationsbeziehungen entspricht ein Datensatz
in der Muttertabelle einem oder mehreren Datensätzen in der Tochtertabelle.
-
8B stellt
eine repräsentative
ZFP-Datenbank 550 entsprechend einer besonderen erfindungsgemäßen Ausführungsform
dar. Die Datenbank 550 kann typischerweise Bezeichnungen
für jedes
ZFP aus einer Sammlung von vorcharakterisierten ZFPs einschließen. Die
ZFPs können
natürliche
ZFPs oder davon abweichende ZFPs sein. Die Bezeichnung kann z. B.
der Name oder ein Symbol sein, das jedes ZFP repräsentiert. ZFP 552 der
Datenbank 550 in 8B wird
z. B. als "ZFP001" bezeichnet. Die
Datenbank 550 schließt
ebenso Unterbezeichnungen für
jeden der Finger eines ZFPs ein, wie z. B. die Unterbezeichnung 554,
Finger 1 von ZFP001 552. Typischerweise haben die Unterbezeichnungen
die Form von Aminosäureresten,
die ausgewählte
Positionen in einem Finger besetzen. Weiterhin weisen die ZFPs Unterbezeichnungen
auf, die die Aminosäuren
sind, welche die Positionen –1
bis +6 entsprechend der konventionellen Numerierung besetzen. Die Datenbank
kann weiterhin ein Zielnukleinsäuresegment
einschließen,
das durch jedes Zinkfingerprotein gebunden wird. Das Nukleinsäuresegment
schließt
normalerweise drei Tripletts von drei Basen ein. Die drei Basentripletts
können
als zu einer Sequenz verbunden oder als separate Sequenzen aufgenommen
werden. Wenn Basen eines neunbasigen Zielortes fortlaufend vom 5'-Ende numeriert werden,
besetzt ein erstes Triplett die Basen 7-9, ein zweites Triplett
besetzt die Basen 4-6 und ein drittes Triplett besetzt die Basen
1-3. Entsprechend dieser Bezeichnung der Triplettpositionen innerhalb
eines Zielsegmentes bindet der erste Finger eines Zinkfingerproteins
(d.h. dem N-Terminus am nächsten)
an das erste Triplett, der zweite Finger an das zweite Triplett
und der dritte Finger an das dritte Triplett. Die Datenbank kann
ebenso zusätzliche
Informationen einschließen,
wie z. B. die Bindungsaffinität
oder Dissoziationskonstante eines ZFPs für seinen Zielort, obwohl dies
nicht entscheidend ist. Weiterhin kann die Datenbank 550 andere
Anordnungen und Beziehungen zwischen den ZFPs, Fingern und Nukleinsäuren einschließen als
sie in 8B dargestellt sind, ohne vom
Umfang der vorliegenden Erfindung abzuweichen.
-
Beispiele
-
Beispiel 1 – SUCHPROTOKOLLE
FÜR DNA-MOTIVE
-
Dieses
Beispiel stellt dar, wie ein Zielsegment aus einem längeren Gen
ausgewählt
wird. Das Suchverfahren wird unter Verwendung eines Computerprogramms
implementiert, welches es ermöglicht,
eine oder mehrere DNA-Sequenzmotive in einem Suchprotokoll zu spezifizieren.
Das normale Verfahren ist die Eingabe der DNA-Sequenz eines Gens
oder cDNA und anschließend
mehrmalige Suche in der Sequenz nach verschiedenen Motiven, vom
am stärksten
wünschenswerten
Motiv hin zum am wenigsten wünschenswerten
Motiv. Daher würde
man typischerweise von den unten aufgeführten exemplarischen Protokollen
zuerst Protokoll 1 durchführen,
und wenn dieses keine angemessene Anzahl möglicher Zielsegmente ergibt,
versucht man anschließend
Protokoll 2, und so weiter.
-
Protokoll
1 sucht ein Zielgen für
einen Zielort, der aus zwei separaten Segmenten gebildet wird, jedes aus
9 oder 10 Basen. Die zwei. Segmente können durch null bis drei dazwischen
liegende Basen getrennt sein. Jedes Segment schließt einen
D-fähigen
Teilort der Form NNGG ein (fett dargestellt). Jeder dreibasige Teilort innerhalb
eines Segments beginnt mit einem G. Die Zielorte, die durch diese
Analyse identifiziert werden, können
direkt zur ZFP-Konstruktion verwendet werden oder können Gegenstand
einer weiteren Analyse sein, z.B. zur Identifizierung, welche Zielsegmente
zusätzliche
D-fähige
Teilorte besitzen. In einem Zielort, der aus zwei Segmenten gebildet
wird, jedes aus zehn Basen, können
insgesamt sechs D-fähige
Teilorte vorhanden sein. Alle Zielorte werden unten von 5' nach 3' gezeigt, und die
Nomenklatur "0,3" zeigt an, dass 0-3
Nukleotide jeden Typs vorhanden sein können.
GNGGNNGNN(N){0,3}GNGGNNGNNN
GNGGNNGNN(N){0,3}GNNGNGGNNN
GNGGNNGNN(N){0,3}GNGGNNGNGG
GNNGNGGNN(N){0,3}GNGGNNGNNN
GNNGNGGNN(N){0,3}GNNGNGGNNN
GNNGNGGNN(N){0,3}GNGGNNGNGG
GNNGNNGNGG(N){0,3}GNGGNNGNNN
GNNGNNGNGG(N){0,3}GNNGNGGNNN
GNNGNNGNGG(N){0,3}GNGGNNGNGG
GNNGNNGNGGNGGNNGNNN
GNNGNNGNGGNNGNGGNNN
GNNGNNGNGGNNGNNGNGG
-
Protokoll
2 ist ein zweites Verfahren zur Beurteilung von Zielorten innerhalb
eines Zielgens. Dieses Verfahren sucht wieder nach einem Zielort,
der aus zwei Segmenten gebildet wird, jedes aus 9 oder 10 Basen. Jedes
Segment enthält
wenigstens einen D-fähigen
Teilort der Form KNGG. Protokoll 2 unterscheidet sich von Protokoll
1 darin, dass es in Protokoll 2 nicht notwendig ist, dass dreibasige
Teilorte mit einem G beginnen. Stattdessen beginnen in Protokoll
2 dreibasige Teilorte entweder mit einem G oder T (mehrdeutige Abkürzung K
nach IUBPACIUB). Zielorte werden von 5' nach 3' gezeigt, und die Symbole "(0,3)" und "(0,2)" zeigen dazwischen
liegende Segmente von 0-3 bzw. 0-2 Basen an.
KNGGNNKNN(N){0,3}KNGGNNKNNN
KNGGNNKNN(N){0,3}KNNKNGGNNN
KNGGNNKNN(N){0,3}KNNKNNKNGG
KNNKNGGNN(N){0,3}KNGGNNKNNN
KNNKNGGNN(N){0,3}KNNKNGGNNN
KNNKNGGNN(N){0,3}KNNKNNKNGG
KNNKNNKNGG(N){0,2}KNGGNNKNNN
KNNKNNKNGG(N){0,2}KNNKNGGNNN
KNNKNNKNGG(N){0,2}KNNKNNKNGG
KNNKNNKNGGNGGNNKNNN
KNNKNNKNGGNNKNGGNNN
KNNKNNKNGGNNKNNKNGG
-
Protokoll
3 ist wie Protokoll 2, außer
dass Protokoll 3 Zielorte mit entweder einem KNGG- oder einem KNGT-D-fähigen Teilort
auswählt.
Zielorte werden von 5' nach
3' gezeigt.
KNGKNNKNN(N){0,3}KNGKNNKNNN
KNGKNNKNN(N){0,3}KNNKNGKNNN
KNGKNNKNN(N){0,3}KNNKNNKNGK
KNNKNGKNN(N){0,3}KNGKNNKNNN
KNNKNGKNN(N){0,3}KNNKNGKNNN
KNNKNGKNN(N){0,3}KNNKNNKNGK
KNNKNNKNGK(N){0,2}KNGKNNKNNN
KNNKNNKNGK(N){0,2}KNNKNGKNNN
KNNKNNKNGK(N){0,2}KNNKNNKNGK
KNNKNNKNGKNGKNNKNNN
KNNKNNKNGKNNKNGKNNN
KNNKNNKNGKNNKNNKNGK
-
Protokoll
4 ist allgemeiner als ein jedes der oben beschriebenen Protokolle,
und es ist nicht notwendig, dass Zielorte einen D-fähigen Teilort
enthalten. Auf ähnliche
Weise benötigt
Protokoll 4 zwei Segmente, jedes aus 9 Basen der Form GNN GNN GNN
im Abstand von 0-3 Basen.
-
Protokoll
5 ist wie Protokoll 4, außer
dass es nach Zielorten sucht, die aus zwei Zielsegmenten der Formel
5'KNN KNN KNN3' im Abstand von 0-3
Basen gebildet werden.
-
Beispiel 2
-
Dieses
Beispielt stellt dar, dass Zinkfingerproteine, die an Zielsegmente
binden, die wenigstens einen D-fähigen
Teilort einschließen,
allgemein mit höherer
Affinität
binden als Zinkfingerproteine, die an Zielsegmente binden, denen
D-fähige
Teilorte fehlen, vorausgesetzt, dass das ZFP einen D-Rest an Position
+2 hat. Dreiundfünfzig
ZFPs, jedes mit drei Fingern, wurden aus einer Sammlung ohne Betrachtung
der Bindungsaffinität
oder Bindung an einen D-fähigen
Teilort ausgewählt.
Die Dissoziationskonstanten der ausgewählten ZFPs wurden bestimmt,
indem die ZFPs an ein Zielsegment gebunden wurden, das drei aufeinander
folgende Nukleotidtripletts umfasste, die in dieser Reihenfolge
an die drei Finger des ZFPs plus wenigstens eine flankierende Base
der Zielsequenz auf jeder Seite banden. Alle ZFPs hatten das menschliche
Sp1-Gerüst.
Die Bindungsaffinitäten
dieser 53 ZFPs wurden willkürlich
in 4 Gruppen geteilt und als Kd-Werte in Tabelle 2 aufgelistet.
-
-
Entsprechend
dieser Klassifizierung wiesen nur ungefähr 25% (14/53) dieser Proteine
eine hohe Affinität
(Kd kleiner oder gleich 100 nM) für ihre entsprechenden Ziele
auf. Von diesen 14 Proteinen wiesen alle wenigstens einen D-fähigen Teilort
innerhalb des Ziels auf.
-
Beispiel 3
-
Wir
suchten unter Verwendung der Protokolle 2 und 3 die Sequenz der
FAD2-1-cDNA der
Sojabohne (Glycine max) nach gepaarten nahe beieinander liegenden
neunbasigen Zielsegmenten ab. Fünf
Zielsegmente wurden ausgewählt,
und entweder ein oder zwei ZFPs wurden konstruiert, um an jedes
der Ziele zu binden. Die ausgewählten
Ziele und die Kd-Werte für
die entsprechend konstruierten ZFPs sind in Tabelle 3 gezeigt. D-fähige Teilorte
sind fett dargestellt. Sequenzen sind von 5' nach 3' gezeigt.
-
-
-
Alle
8 hergestellten ZFPs banden mit hoher Affinität (Kd kleiner oder gleich 100
nM) an ihre Ziele, was zeigt, dass Auswählen eines Ziels mit einem
D-fähigen
Teilort innerhalb eines 9bp-Ziels eine effektive Konstruktion eines
hochaffinen ZFPs ermöglicht. Überdies
banden alle ZFPs, die an Zielorte mit zwei D-fähigen Teilorten binden, fester
als ZFPs, die an Zielorte mit nur einem D-fähigen Teilort binden.
-
Beispiel 4
-
Dieses
Beispiel stellt weitere Belege bereit, dass D-fähige Teilorte eine hohe Bindungsaffinität verleihen.
Dreiundfünfzig
Zielsegmente wurden durch das oben aufgeführte Protokoll 5 identifiziert,
welches keinen D-fähigen
Teilort im Zielort benötigt.
Dreiundfünfzig
ZFPs wurden konstruiert, um an diese entsprechenden Orte zu binden.
Dreiunddreißig
Zielsegmente wurden durch das obige Protokoll 3 identifiziert, welches
einen D-fähigen
Teilort benötigt,
und dreiunddreißig
ZFPs wurden konstruiert, um an diese entsprechenden Orte zu binden.
Tabelle 4 vergleicht die Kds von ZFPs, welche durch die verschiedenen
Verfahren konstruiert wurden.
-
-
Tabelle
4 zeigt, dass 31 von 33 ZFPs, die durch Protokoll 3 konstruiert
wurden, eine hohe Bindungsaffinität aufweisen (Kd kleiner als
100 nM). Im Gegensatz dazu haben nur 14 der 56 ZFPs, die durch Protokoll 5
konstruiert wurden, eine hohe Bindungsaffinität. Diese Daten zeigen, dass
hochaffine ZFPs (Kd < 100
nM) effektiver für
Ziele konstruiert werden können,
wenn das Suchprotokoll Kriterien für D-fähige Teilorte einschließt, als
wenn das Suchprotokoll keinen D-fähigen Teilort benötigt.
-
Beispiel 5
-
Die
Beziehung zwischen der Affinität
des ZFPs und der Anwesenheit eines oder mehrerer D-fähiger Teilorte
im Ziel wurde für
etwa 300 konstruierte ZFPs analysiert, die meistens für verschiedene
Zielorte spezifisch waren. In dieser und nachfolgenden Analysen
war nur ein ZFP pro Zielort eingeschlossen, und zwar das ZFP mit
der höchsten
Affinität.
-
Tabelle
5 und 1 zeigen die mittleren Kds von verschiedenen ZFP-Kategorien, welche
anhand Nummer und Typ der D-fähigen
Teilorte, die an einen neunbasigen Zielort binden, kategorisiert
wurden. In Tabelle 4 und weiter in den Tabellen 6, 7 und 8, ist
s.e.m. der mittlere Fehler des Mittelwertes (standard error of the
mean) und n ist die Zahl der untersuchten Proteine.
-
-
Die
22 ZFPs, die für
Ziele mit D-fähigen
Teilorten vom Typ "zwei
GG" konstruiert
wurden, haben die stärkste
Bindungsaffinität
mit einem mittleren Kd = 15 nM. Von den 50 ZFPs mit einem Kd < 100 nM weisen 49
wenigstens einen D-fähigen
Teilort auf. Die Tabelle zeigt die folgende Schlussfolgerung: (1)
Binden an einen Zielort mit einem D-fähigen Teilort bindet stärker als
ZFPs, die an einen Zielort binden, dem ein D-fähiger Teilort fehlt; (2) ZFPs,
die an einen Zielort mit zwei D-fähigen Teilorten binden, binden
stärker
als ZFPs, die an einen Zielort mit einem D-fähigen Teilort binden, und (3)
ZFPs mit einem Zielort mit einem GG-D-fähigen Teilort binden stärker als
ZFPs mit einem Zielort mit einem GT-D-fähigen Teilort.
-
Beispiel 6
-
Ein
anderer Faktor, der die Bindungsaffinität von konstruierten ZFPs beeinflusst,
ist, ob ein Zielort die Form GNN GNN GNN anstatt KNN KNN KNN aufweist.
Dieses Beispiel zeigt, dass D-fähige
Teilorte hohe Bindungsaffinität
auch im Kontext eines GNN GNN GNN-Motivs verleihen. Für diese
Analyse wählten
wir eine Population von 59 ZFPs aus, von denen jedes an einen unterschiedlichen
Zielort der Form GNN GNN GNN bindet. Tabelle 6 zeigt die Kd-Werte
konstruierter ZFPs als Funktion der Anwesenheit D-fähiger Teilorte
mit einem GNN GNN GNN-Ziel.
-
-
Die
Anwesenheit eines D-fähigen
Teilortes beeinflusst die Bindungsaffinität eines ZFPs stark, auch wenn
das Ziel auf das GNN GNN GNN-Motiv passt.
-
Beispiel 7
-
Dieses
Beispiel stellt weitere Belege bereit, dass die Wirkung von D-fähigen Teilorten
bei der Verleihung einer erhöhten
Bindungsaffinität
mit beliebigen Wirkungen von G-Resten bei der Verleihung einer hohen Bindungsaffinität relativ
zu anderen Resten additiv ist. Für
diese Analyse wählten
wir 101 Zinkfingerproteine aus, die an verschiedene Zielorte aus
unserer Sammlung binden und klassifizierten diese Zielorte anhand
der Zahl der vorhandenen G-Reste.
Die Zielorte enthielten von 2-8 G-Resten in einer neunbasigen Sequenz.
Tabelle 7 zeigt im Allgemeinen, dass je mehr G-Reste in einem Zielort
vorhanden sind, desto stärker
die Bindungsaffinität
des ZFPs für
diesen Ort ist.
-
-
Wir
analysierten diese Daten weiter, indem wir fragten, ob die Anwesenheit
oder Abwesenheit eines D-fähigen
Teilortes die mittleren Kd-Werte der konstruierten ZFPs beeinflusste.
Jede Kategorie von neunbasigen Zielen aus Tabelle 7 wurde in Ziele
unterteilt, enthaltend oder nicht-enthaltend D-fähige Teilorte. Das Ergebnis
dieser Analyse ist in Tabelle 8 gezeigt.
-
-
-
Die
Tabelle zeigt, dass die Orte, welche D-fähige Teilorte) einschließen, eine
höhere
Bindungsaffinität verleihen,
wenn Zielorte mit derselben Zahl von G-Resten, aber verschiedenen Zahlen D-fähiger Teilorte
verglichen werden. Für
neunbasige Zielorte mit 4 oder mehr Gs ist der mittlere Kd annähernd 100
nM oder weniger, wenn das Ziel wenigstens einen D-fähigen Teilort
aufweist. Besonders bemerkenswert ist der Vergleich zwischen Zielorten
mit 5 G-Resten. 5 derartige Zielorte, denen ein D-fähiger Teilort
fehlt, wiesen einen mittleren Kd von 640 nM auf. 23 derartige Zielorte
mit zwei D-fähigen
Teilorten wiesen einen mittleren Kd von 98 nM auf.
-
Beispiel 10: Das ZFP-Vorhersagemodul
-
Dieses
Beispiel stellt die Auswahl eines Zielsegmentes innerhalb eines
Zielgens unter Verwendung einer Korrespondenzregel und die Verwendung
einer Datenbank zur Konstruktion eines ZFPs dar, das an das ausgewählte Zielsegment
bindet. Das ZFP-Vorhersagemodul erleichtert sowohl die Ortsauswahl
als auch Verfahren zur ZFP-Konstruktion, indem als Eingabe (i) die
interessierende DNA-Sequenz,
(ii) verschiedene Datentabellen, (iii) Konstruktionsparameter und
(iv) Ausgabeparameter verwendet werden und eine Liste möglicher
ZFP-Zielorte in der interessierenden Sequenz und eine Zusammenfassung
der Finger ausgegeben wird, welche für Teilorte für jeden
Zielort konstruiert wurden. Dieser Abschnitt beschreibt Programmeingaben,
Ausgaben, und Scoringprotokolle für das Programm. Zur Klarheit
werden die Beschreibungen in Ortsauswahl und Konstruktionsfunktionen
geteilt.
-
1. Auswahl der Zielorte
innerhalb der DNA-Region von Interesse:
-
Eingaben:
-
- 1) Die Ziel-DNA-Sequenz
- 2) Eine Scoretabelle, welche jeden der möglichen Teilorte mit drei Basenpaaren
und Scores für
seine drei möglichen
Lagen in einem 9-bp-Zielort
auflistet, ist in Tabelle 1 gezeigt. Die Scoretabelle wird durch
den Benutzer während
des Programmablaufs bereitgestellt und kann individuell hergerichtet
und auf den neuesten Stand gebracht werden, um das neueste Wissen
des Benutzers über
die bevorzugten DNA-Sequenzen des Zinkfingermotivs wiederzugeben.
- 3) Eine 'ZFP-Datentabelle', die Zielorte, Aminosäuresequenzen
und Referenzdaten für
existierende hochaffine ZFPs enthält. Diese Tabelle wird für diesen
Teil des Programms nur benötigt,
wenn der Ausgabeparameter (ii) unten ausgewählt wird. Ein Beispiel einer
ZFP-Datentabelle wird in Tabelle 9 bereitgestellt.
- 4) Ein vom Benutzer während
des Programmablaufs eingegebener optionaler Kontextparamter – der "Erhöhungsfaktor
für 'D-fähige' Tripletts". Dieser Parameter
multipliziert -durch den Erhöhungsfaktor-
den Score für
jeden 'xxG'-Teilort, der durch
ein 3'- G oder -T
flankiert wird.
- 5) Ausgabeparameter -durch den Benutzer bereitgestellt- spezifizierend
i)
die Zahl von Zielorten, welche in die Ausgabe eingeschlossen werden
sollen,
ii) ob das Programm solche Zielorte spezifisch hervorheben
soll (wenn überhaupt),
für die
dreifingerige Proteine schon konstruiert worden sind,
iii)
ob das Programm die ausgegebenen Zielorte entsprechend ihrer relativen
Positionen in der Eingabezielsequenz neu ordnen soll,
iv) ob
das Programm targetierbare Paare von 9-bp-DNA-Orten hervorheben
soll (benachbart, nichtüberlappende
Ortspaare getrennt durch n oder weniger Basen, wobei n typischerweise
5, 4, 3, 2 oder 1 ist).
Ausgabe: Ein Satz möglicher Zielorte in der Ziel-DNA-Sequenz,
welche durch Scores eingeordnet sind.
Wenn angegeben, eine
Liste beliebiger Zielorte, für
die dreifingerige Protein schon konstruiert worden sind.
Wenn
angegeben, die Liste der ausgegebenen Zielorte entsprechend ihrer
Lage in der Eingabesequenz neu geordnet worden ist.
Wenn angegeben,
eine Liste aller targetierbaren Paare von 9-bp-DNA-Orten.
-
Der
Programmteil zur Ortsauswahl weist jeder möglichen 9-bp-Sequenz in einem
gegebenen Ziel-DNA-Fragment einen Score zu, wobei der Score die
Leichtigkeit der Targetierbarkeit wiedergibt, die auf der Verwendung
von Informationen von früher
konstruierten Zinkfingerproteinen basieren. Beim Beurteilen einer
gegebenen neunbasigen Sequenz spaltet das Programm zuerst das Ziel
in seine einzelnen Teilorte und zieht dann die Scoretabelle heran,
um einen Score für
jeden Teilort an seiner Lage im möglichen Zielort zu erhalten.
Schließlich
multipliziert es die Teilortscores, um einen Gesamtscore für den 9-bp-Zielort zu erhalten. Zum
Beispiel sind bei Verwendung der Testsequenz 5'AGTGCGCGGTGC3' und der Scoretabelle in Tabelle 1 die
Ausgabeorte (5'-3') und Scores
-
In
diesem Beispiel ist der beste Zielort 5'TGC GCG GTG3' mit einem Score von 1000. Das Programm weist
ebenso möglichen
Zielen auf dem gegenläufigen
(antisense) Strang Scores zu, aber um der Vereinfachung willen werden
in diesem Beispiel diese Orte ignoriert. Ein optionaler Faktor,
der "Erhöhungsfaktor
für 'D-fähige' Tripletts" kann bereitgestellt
werden, um das obige Scoringprotokoll zu verändern, um beim Beurteilen von
Zielorten den Kontextfaktor – den
D-fähigen
Kontakt – zu
berücksichtigen.
Wenn dieses Merkmal gewählt
ist, führt
das Programm die folgende Überprüfung beim
Zuweisen von Teilortscores durch:
Wenn ein Teilort die Form
xxG hat, wenn dann die benachbarte Base (auf der 3'-Seite) T oder G
ist, dann wird der Score des xxG-Teilortes mit dem Erhöhungsfaktor
multipliziert, anderenfalls bleibt der Teilortscore derselbe.
-
[Wenn
ein Teilort die Form xxA, xxC oder xxT hat, bleibt der Teilortscore
ebenso unverändert.]
-
Wenn
zum Beispiel der Benutzer einen Erhöhungsfaktor für 'D-fähige' Tripletts von 1,25
eingibt, werden die obigen Scores wie folgt angepasst:
-
[Bei
Verwendung dieser Option berücksichtigt
das Programm die Identität
der Base direkt an der 3'-Seite
des Zielortes (in Kleinbuchstaben). Für den letzten Ort ist diese
Base in diesem Beispiel nicht definiert, weshalb dies durch das
Zeichen '#' an dieser Position
gekennzeichnet ist.]
-
Nach
Zuweisen von Scores zu allen Sequenzen mit neun Basenpaaren in der
Ziel-DNA druckt das Programm dann die Spitzenscores mit den Nummern
der ausgegebenen Orte aus, welche durch den Benutzer bestimmt wurden.
-
Wie
durch den Benutzer angegeben, kann das Programm ebenso bereitstellen:
- i. eine Liste beliebiger Zielorte, für die dreifingerige
Proteine schon konstruiert worden sind,
- ii. die Liste der ausgegebenen Zielorte neu geordnet entsprechend
ihrer Lage in der Eingabesequenz,
- iii. eine Liste aller targetierbaren Paare von 9-bp-DNA-Orten
(benachbart, nichtüberlappende
Ortspaare getrennt durch fünf,
drei oder weniger Basen).
-
II. Konstruktion von Proteinen
für ausgewählte Zielorte
-
Eingaben: Orte des Programmanteils
zur Ortsauswahl (oder anderweitig bestimmt)
-
Die 'ZFP-Datentabelle', welche Zielorte,
Aminosäuresequenzen
und Referenzdaten für
existierende hochaffine ZFPs enthält.
-
Einen
Ausgabeparameter – durch
den Benutzer bereitgestellt –,
der spezifiziert, ob das Programm die Ausgabe beschränken soll
auf entweder:
- (i) nur solche Proteine (wenn überhaupt),
deren Zielorte vollständig
identisch zu den Orten der Ausgabe sind, oder
- (ii) nur solche Proteine (wenn überhaupt), deren Zielorte zu
den Ausgabeorten an zwei oder mehr der Teilorte mit drei bp passen.
-
Ausgabe: Ohne die Beschränkungen
(i) oder (ii):
-
Für jeden
möglichen
Zielort mit 9 Basenpaaren eine Liste mit drei Sätzen von ZFPs und ihrer Einzelfinger
aus der ZFP-Datentabelle, welche entsprechend an die drei Triplett-Teilorte
innerhalb des Zielortes binden. Für jeden Teilort kann der Satz
von ZFPs in zwei Teilsätze
unterteilt werden. Ein Teilsatz enthält ZFPs und ihre Finger, die
an ein Triplett an einer gegebenen Position der entsprechenden Fingerposition
in einem Mutter-ZFP binden. Der andere Teilsatz enthält ZFPs
und ihre Finger, die an ein Triplett an einer gegebenen Position
einer nichtentsprechenden Position innerhalb eines Mutter-ZFPs binden.
Eine erste Fingerposition (N-C) entspricht der ersten Triplettposition
3'-5'.
-
Der
Programmanteil zur ZFP-Konstruktion erleichtert das Konstruktionsverfahren,
indem er es dem Benutzer erlaubt, schnell alle Finger zu begutachten,
von denen bekannt ist, dass sie an Teilorte in einem gegebenen neunbasigen
Zielort binden. Ziel. Wenn das optimale Konstruktionsziel aus dem
obigen Beispiel (5'TGCGCGGTG3') und die kurze ZFP-Datentabelle,
die in Tabelle 9 bereitgestellt wird, gegeben sind, wäre die Ausgabe
(ohne die Beschränkungen
(i) oder (ii)) wie folgt:
ZFPs – frühere Konstrukte: GEORDNET:
UNGEORDNET:
-
Die 'geordnete' Ausgabe zeigt, dass
in der ZFP-Datentabelle ein Fall auftritt, wo der TGC-Teilort durch einen
Zinkfinger im dritten Triplett eines Zielortes kontaktiert wird.
In diesem Fall ist der Finger ERDHLRT, und der Ort ist 5'TGCGGGGCA3'. In jedem der beiden
anderen Teilorte tritt ebenfalls ein ähnlicher Fall auf – GCG und GTG.
In diesen Fällen
sind die Finger RSDELQR bzw. RKDSLVR. Diese Information wird verwendet,
um das Dreifingerprotein F1-RKDSLVR, F2-RSDELQR, F3-ERDHLRT als Konstrukt zur
Bindung des Ziels 5'TGCGCGGTG3' vorzuschlagen.
-
Die 'ungeordnete' Ausgabe zeigt, dass
es in der ZFP-Datentabelle zwei Fälle gibt, in denen Finger einen
GCG-Teilort kontaktieren, aber nicht im mittleren Teilort eines
Ziels. Stattdessen wird in einem Fall GCG am 5'-Ende kontaktiert, und im anderen am
3'-Ende, und in
diesen Fällen
sind die Fingersequenzen RSDELTR und RSDERKR. Dies sind alternative
Konstrukte zur Bindung von GCG im Zielort.
-
Tabelle
1: Die Scoretabelle
-
-
Tabelle
9: Exemplarische ZFP-Datentabelle
-
Andere
Beispiele von Zinkfingerproteinen, die Sequenzen ihrer Finger und
passend gebundene Zielorte zur Aufnahme in eine solche Datenbank
sind in den Referenzen diskutiert, die im Abschnitt über den
Hintergrund zitiert sind.
-
Obwohl
die vorliegende Erfindung zum Zwecke eines klaren Verständnisses
ausführlich
beschrieben worden ist, ist es offensichtlich, dass im Rahmen der
angefügten
Ansprüche
bestimmte Modifikationen ausgeführt
werden können.
Alle hierin zitierten Veröffentlichungen
und Patentdokumente sind durch Referenzangabe in ihrem vollen Umfang
für alle
Zwecke in dem gleichen Maße
umfasst, wie wenn sie einzeln benannt worden wären.
-
-
-
-