Vorlesung Modellierung & Simulation 3. Genregulation

6. Vorlesung
3. Genregulation (Phänomene und Datenquellen)
Eigenschaften metabolischer Prozesse
Genexpression
Genwirkketten
Modellierung des Promotors
Vorlesung
Modellierung & Simulation
Überblick
Ergebnis:
Die DNA zeigt auf der Ebene der analysierten
Strukturen komplexe Sprachkonstrukte.
Zusammenfassende Darstellung der Eigenschaften:
1. Genom ist modular
Anweisungen und Module können überlappen.
2. Metabolismus ist probabilistisch
Operationsstärke einer 'elementar anwendbaren Anweisung‘.
3. Genom ist dynamisch
Transposon, Genfähre, Rekombination und Mutation.
Vorlesung
Modellierung & Simulation
3. Genregulation
4. Simultane Aktivierung
Nebenläufige Genexpression und katalyse.
5. Granularität der genetischen Prozesse
Konzentration der Proteine etc. ist variabel.
6. Datenfluss
Daten und Kontrollanweisungen steuern den Programmfluß.
7. Der genetische Speicher ist kein adressierbarer Raum.
Genom repräsentiert auch evolutionärer Redundanz.
Vorlesung
Modellierung & Simulation
3. Genregulation
Modellierung der Genexpression
1944
Transformationsversuche
 DNA Träger der genetischen Information
1953
Watson und Crick
 Modell der DNA
1963
Jacob und Monod
 Modell der Genregulation
60er
 Genetischer Code
Vorlesung
Modellierung & Simulation
3. Genregulation
Gen = Cistron (moderner Genbegriff)
DNA-Abschnitt, der sich aus linear verknüpften Nukleotiden
zusammensetzt und eine biochemische Funktion
repräsentiert.
Strukturgen
DNA-Abschnitte, die in die primäre mRNA übersetzt
werden (Transkription).
Promotorgen
DNA-Abschnitt mit Affinität zur RNA-Polymerase.
Vorlesung
Modellierung & Simulation
3. Genregulation
Transkription:
1. Genetischer Code:
Triplets werden nichtüberlappend und
kommafrei übersetzt.
2. Genetischer Code:
Jedes tRNA Molekül trägt eine spezifische
Aminosäure.
Vorlesung
Modellierung & Simulation
3. Genregulation
Operatorgene
DNA-Abschnitt mit Affinität zu Regulatorproteinen.
Terminatorgene
DNA-Abschnitt zur Beendigung der Transkription.
Regulatorgen
DNA-Abschnitt codiert für ein Regulatorgen.
Vorlesung
Modellierung & Simulation
3. Genregulation
Induktives System
Substrat inaktiviert den spezifischen Repressor direkt oder indirekt.
Repressives System
Regulatorgen codiert einen inaktiven Repressor, der erst durch
Bindung eines Endproduktes einer Biosynthesekette aktiv wird.
Vorlesung
Modellierung & Simulation
3. Genregulation
Promotor
Operator
Docking / Repressor
Transkription Start
Strukturgen
Terminator
Regulator
Transkription Stop
siRNA
AntisenseRNA
microRNA
rRNA
tRNA
Enzym
Proteine
Genwirkkette
Promotor Operator Strukturgen S1
S2
S3
Terminator
Regulator
Transkription
mRNA (primär)
Splicen
mRNA (sekundär)
Translation
Enzyme
Substrat/Produktkette
E1
E2
E3
Biosynthese
Induktives System
Promotor Operator Strukturgen S1
E1
S
Substrat deaktiviert Repressor !
S2
E2
S3
Terminator
E3
P
Regulator
Repressives System
Promotor Operator Strukturgen S1
E1
S
S2
E2
S3
Terminator
Regulator
E3
P
Produkt aktiviert Repressor !
Klassisches Modell der Genregulation
Grundlegend:
Lac Operon (Jacob und Monod)
Auf der Ebene der Transkription wird die Genregulation
bruchstückhaft verstanden.
Offene Frage: Kinetik der Genregulation:
Wie häufig wird ein Strukturgen übersetzt ?
Wie häufig wird ein Protein synthetisiert ?
Vorlesung
Modellierung & Simulation
3. Genregulation
Zur Klärung dieser Fragen:
- Konzentration der RNA-Polymerase,
- DNA Sequenzen (Enhancer, Promotor etc.) legen die
Affinität zwischen RNA Polymerase und Promotor fest,
- Lebensdauer der mRNA,
- Rolle der RNA,
- Anzahl der Ribosomen,
- Affinität mRNA/Ribosom und
- Affinität DNA/Induktor/Repressor.
Phänomen der Genregulation !?
Vorlesung
Modellierung & Simulation
3. Genregulation
Verschiedene Ebenen der Genregulation:
Struktur der DNA (Topoisomerase)
DNA auf Histone und Nichthistone aufgewickelt, die in ihrer Struktur
veränderbar sind (Methylierung, Acetylierung und Phosphorylierung).
Topoisomerase – Modifikation des Verdrillungsgrades
Granularität (RNA-Polymerase etc.)
Genetische Information der RNA etc. unterliegt der Genregulation.
Vorlesung
Modellierung & Simulation
3. Genregulation
Verschiedene Ebenen der Genregulation:
Transkription
Fundamentale Ebene der Genregulation (Promotoraffinität).
RNA - Antisense RNA
Transkription auf Mutterstrang – Sense Strang (komplementär: Antisense).
Splicen
Lebensdauer
Die mRNA hat unterschiedliche Lebensdauern: Minuten bis Tage.
Vorlesung
Modellierung & Simulation
3. Genregulation
Translation
Affinität zu den Ribosomen.
Amplifikation
Zellstoffwechsel benötigt hohe Konzentration spezifischer Substanzen:
 Vervielfachung der Baupläne
Attenuation (Abschwächung)
Translation biochemisch bremsen.
Vorlesung
Modellierung & Simulation
3. Genregulation
Ebene der Transkription:
Mensch:
ca. 30.000 Strukturgene
Komplexe Promotorsequenzen:
Transkriptionsfaktoren
Promotoraffinität:
Enhancer
Komplexe Gensteuerung:
Homöogene (Bsp. Taufliege)
Fundamental:
Vorlesung
Lac-Operon bei E. coli
Modellierung & Simulation
3. Genregulation
Lactoseverwertung
Lactose-Permease (Y)
-Galactosidase +
Transacetylase (Z)
Glucose
Lactose
Lactose
(außerhalb der Zelle)
(innerhalb der Zelle)
Galactose
Lac-Operon und sein
Regulationsgen lacI
P O Strukturgene: lacZ lac Y lac A
lacZ
lacY
T
lacA
mRNA
LacI
P
lacZ
T P
lacY
lacA
T
Lac-Operon und seine Regulation
Promotor
LacI
P
lacZ
T
P
lacY
lacA
T
O
mRNA
Operator
lac-Repressor
P
T
RNA-Polymerase
Kann nicht binden
P
O
T
Lac-Operon und seine Regulation
P
LacI
T
lacZ
P
lacY
lacA
T
O
mRNA
lac-Repressor
Repressor
inaktiv
Allolactose
P
T
P
O
RNA-Polymerase
kann binden
T
Transkription
mRNA
viele Lactose-
alle Repressormoleküle haben
moleküle
Allolactose gebunden
mäßige Menge an
Lactosemoleküle
sehr wenig Lactosemoleküle
nur wenige Repressormoleküle
haben Allolactose gebunden
kein Repressor
hat Allolactose
gebunden
Ende von
lacI
Promotor
-35
CAP-Bindung
Beginn von
-10
lacZ
Operator
Glucose hemmt die cAMP-Synthese
Glucose hemmt
Adenin
ATP
Adenylcyclase
Adenin
zyklisches AMP
CAP-cAMP stimuliert die Transkription
CAP-Bindungsstelle
frei
P
O
lac-mRNA
Niedriger Glucosespiegel
CAP-cAMP
P
O
Aktivierung der
Transkription
lac-mRNA
Glucose
Lactose
Niedriger cAMP-Spiegel,
CAP-Stelle frei
P
lacZ
O
lac-mRNA
Glucose wird
zuerst verbraucht
CAP-cAMP
P
O
hoher cAMP-Spiegel,
CAP-Stelle besetzt
lacZ
Aktivierung der
Transkription
lac-mRNA
Sequenzanalyse und Genregulation
DNA-Sequenz = Wort über dem Alphabet {A,T(U),G,C}.
= Folge von Zeichen (characters), deren Länge
zwischen 1 und ca. 200.000 variieren kann.
Durchschnittliche Länge (Datenbank) ca. 1000 Basen.
Sind immer alle Basen einer Sequenz bekannt ?
Mehrdeutigkeiten erfassen: Erweiterung des Arbeitsalphabets.
Vorlesung
Modellierung & Simulation
3. Genregulation
Symbol
Bedeutung
Symbol
Bedeutung
Y
C oder T
M
A oder C
W
A oder T
H
A oder T oder C
S
G oder C
K
G oder T
B
G oder T oder C
R
G oder A
V
G oder A oder C
D
G oder A oder T
X
G oder A oder T
.
Lücke
oder C
Tabelle. Das Arbeitsalphabet IUPAC setzt sich aus den Basen und
den hier dargestellten Zeichen zusammen.
Symbol
Bedeutung
Symbol
Bedeutung
B
A oder AA
D
C oder CC
H
G oder GG
V
T oder TT
K
C oder CX
L
T oder TX
M
A oder AX
N
G oder GX
R
A oder G
Y
C oder T
X
A oder G oder T
-
A oder G oder T
oder C
oder C
1
Lücke oder C
2
Lücke oder T
3
Lücke oder A
4
Lücke oder G
5
A oder C
6
G oder T
7
A oder T
8
C oder G
Tabelle: Basenbezeichnung nach Roger Staden
Jeder Forscher ist bemüht, diese Mehrdeutigkeiten bei der Aufklärung
der Sequenzen zu beseitigen.
Der internationale Mehrdeutigkeitscode beansprucht 4 Bits:
Bitsequenz
Symbol
Bitsequenz
Symbol
0000
.
1000
A
0001
T/U
1001
W
0010
G
1010
R
0011
K
1011
D
0100
C
1100
M
0101
Y
1101
H
0110
S
1110
V
0111
B
1111
X/N
Sequenzanalyse und Probleme der EDV:
- Einsatz der unterschiedlichen Datenformate,
- Benutzung verschiedener Codes und
- Fehlerraten.
1. Schritt: Lesen des Gels – automatische Ermittlung der Sequenz
Konflikte (2 x lesen) markieren und vom Benutzer oder per
Nachsequenzierung klären.
Grundregel:
Man erlaubt eine ca. 1%ige Fehlerrate pro Fragment.
Sequenz ?
 DNA-Funktionseinheiten ermitteln.
Vorlesung
Modellierung & Simulation
3. Genregulation
2. Schritt: Automatische Identifizierung der Funktionseinheiten
Zentrale Frage: Identifizierung der Transkriptionseinheiten
Statistische Methoden
 charakteristische Sequenzen
 Konsensus-Sequenz.
Solche Sequenzen extrahieren aus:
- Literatur oder
- Datenbanken (z.B. TRANSFAC).
Heuristiken sind erforderlich !
Vorlesung
Modellierung & Simulation
3. Genregulation
Beispiel: Identifizierung von Transkriptionseinheit
Algorithmische Identifikation – naiver Ansatz:
- Identifikation der Start- und Stopptripletts;
- Identifikation der Intron/Exon-Grenzen;
- Identifikation der Promotoren;
- Identifikation der Terminatorsequenzen;
- Identifikation der Shine-Dalgarno-Sequenz.
Identifikation dieser Strukturen ausreichend ?
Vorlesung
Modellierung & Simulation
3. Genregulation
Prokaryonten:Hier ist die automatische Identifikation der Promotoren
leichter, weil die bereits sequenzierten Promotoren
statistisch eine recht einheitliche Sequenz aufweisen.
Eukaryonten: Hier kennt man eine Vielzahl von Signalen, die in
einer unüberschaubaren Kombination auftreten.
RNA-Polymerase von Prokaryonten unterteilt sich in:
- Sigmafaktor und
- Core-Enzym.
Sigmafaktor identifiziert den Promotor.
Vorlesung
Modellierung & Simulation
3. Genregulation
Sigmafaktoren, die verschiedene Promotorklassen erkennen:
1. RNA-Polymerase bindet locker an einen beliebigen Teil der DNA
und wandert von dort aus den Strang entlang, bis ein Promotor
gefunden wird, an dem dann eine feste Bindung stattfindet.
2. Sigmafaktor nur an der Initiation beteiligt. Für die Elongation
wird dieser von dem Core-Enzym abgelöst, damit eine lockere
Bindung an der folgenden DNA-Sequenz möglich ist.
3. RNA-Polymerase ohne Sigmafaktor - wandert die DNA entlang,
bis ein Stoptriplett auftritt. Dann löst sich auch das Core-Enzym
von der DNA und vereinigt sich erneut mit dem freiliegenden
Sigmafaktor zum Holoenzym.
Woran erkennt der Sigmafaktor nun den Promotor ?
Jeder Promotor hat spezifische Subsequenzen !
Vorlesung
Modellierung & Simulation
3. Genregulation
Mindestlänge der Subsequenzen ?
Solche Signale kommen in allen Promotoren vor; deshalb bezeichnet
man sie auch als konserviert.
Überlagerung aller bekannten Promotoren
 Konsensus-Sequenz ablesen.
Nur wenige Promotoren entsprechen der exakten Struktur der
Konsensus-Sequenzen, aber als Faustregel gilt:
Je ähnlicher die jeweiligen Promotorabschnitte den KonsensusSequenzen sind, desto stärker ist der Promotor und umgekehrt.
Vorlesung
Modellierung & Simulation
3. Genregulation
Sequenzvergleich bei Prokaryonten hat an zwei Stellen eine
Konsensus-Sequenz identifiziert:
- 10 Nukleotidepaare stromaufwärts vom Transkriptionsstart
(+1) liegt eine Sequenz von 6 Nukleotiden, die große
Ähnlichkeit mit der Folge 5-TATAAT-3 aufweist, die auch
als Pribnow-Box bezeichnet wird.
- An der Position -35, mitten in einem AT-reichen Abschnitt,
liegt meistens die Folge 5-TTGACA-3.
Muster-Promotor des E-coli Genoms aufstellen:
Position:
Sinnstrang
-35
-10
+1
5’ TCTTGACA--- TATAAT-- CAT--
Gegenstrang 3’ AGAACTGT-- ATATTA-- GTA--
3’
5’
Prominenteste Bindungsstelle: Pribnow Box
Stormo: Veranschaulichung der Problematik
Pribnow gibt die folgenden Bindungssequenzen an:
TACGAT
TATAAT
TGTAAT
GATACT
TATGAT
TATGTT
Konsensus-Sequenz:
Vorlesung
TATAAT
Modellierung & Simulation
3. Genregulation
Statistik – Auftreten dieser Sequenz im Genom:
Konsensus-Sequenz: TATAAT
1. Gleichverteilung der Basen:
2. 1x Mismatch zulassen:
3. 2x Mismatches zulassen:
4096 bp
170 bp
34 bp
Verwendung von TATRNT
Mismatch zulassen:
28 bp
Stormo (2000)
Vorlesung
Modellierung & Simulation
3. Genregulation