GENETIC LAB rivisto

GENETIC LAB
LABORATORIO DIDATTICO
DI GENETICA MOLECOLARE
TITOLO:
La Lattasi e il carattere “Persistenza della Lattasi”
in eta’ adulta associato al polimorfismo rs 4988235
QUADRO GENERALE DELL’ATTIVITA’
MODULO DI GENETICA MOLECOLARE:
- Laboratorio di bioinformatica
MATERIALE:
Copie del testo
- Laboratorio di Genetica molecolare
- Testi
TECNICHE UTILIZZATE IN LABORATORIO
- Estrazione di DNA dalle cellule
della mucosa boccale
- PCR
- Digestione enzimatica
- Elettroforesi
ADATTA PER :
Triennio della scuola superiore
TEMPO DI REALIZZAZIONE
- 2 ore Biolab
- 2 moduli di 4 ore hands-on Lab
PREREQUISITI
1. CHE COS’E’ IL DNA
2. LA STRUTTURA DEL DNA
3. DAL DNA AL CROMOSOMA
4. APLOIDIA E DIPLOIDIA
5. GENE/LOCUS/ALLELE
6. GENOTIPO/FENOTIPO
7. DUPLICAZIONE DEL DNA
8. TRASCRIZIONE IN mRNA
CONCETTI CHIAVE
-
STRUTTURA DEL DNA
GENE/LOCUS/ALLELI
ENZIMI DI RESTRIZIONE
POLIMORFISMO ALLELICO
APLOTIPO
LINKAGE DISEQUILIBRIUM
9. SPLICING
10. SINTESI PROTEICA
11. REGOLAZIONE DELL’ESPRESSIONE GENICA
12. PROMOTORE
13. ENZIMI DI RESTRIZIONE
14. POLIMORFISMI
15. POLIMORFISMO ALLELICO
16. POLIMORFISMI DI SEQUENZA
ATTIVITA’ WEBSITE
http://learn.genetics.utah.edu/
Virtual lab
INDICE
GUIDA PER IL DOCENTE
A. Obiettivi
B. Background di conoscenze da fornire allo studente
C. Argomenti correlati all’attività di Laboratorio:
1. Trascrizione e maturazione dell’RNA
2. Struttura ed espressione dei geni. Il promotore
3. Polimorfismi di sequenza del DNA
4. Enzimi di restrizione
5. SNPs
6. Aplotipi
7. Analisi di Linkage
D. Strategia d’insegnamento:
1. Attività di Bioinformatica
Abstract . Prerequisiti. Concetti chiave
2. Attività hands-on in laboratorio
Abstract. Prerequisiti
Tecniche utilizzate in laboratorio per
l’ Analisi molecolare del DNA:
PCR
Termociclatori
Taq polimerasi
Scelta dei primer
Digestione con gli enzimi di restrizione
Elettroforesi su gel di agarosio
Strumentazione e materiale a disposizione
Principali prefissi e unità di misura usate in biologia molecolare e cellulare
Pag. 3
Pag. 4
Pag.5
Pag. 8
Pag. 9
Pag. 10
Pag. 12
Pag. 14
Pag. 16
Testo:
Bioinformatica
Il Lattosio
Che cos’è l’intolleranza al Lattosio
Genetica
Laboratorio
Evoluzione
Pag.19
Pag. 25
Pag. 26
Pag. 27
Pag. 28
Pag. 29
Letteratura scientifica sulla Lattasi
Pag. 30
Glossario
Pag. 31
Pagine per lo studente
-
Background di conoscenze
Istruzioni per l’attività
Questionario:
PRE-Test
POST-Test
Pag.32
2
Guida per il docente
A. Obiettivi:
In questa attività si studia la condizione nota come “Intolleranza al Lattosio” correlata
con l’assenza dell’enzima Lattasi. In alcune popolazioni (es. nord-europee) si osserva il
carattere “Persistenza della Lattasi”, carattere mendeliano dominante che è stato
correlato con uno polimorfismo a singolo nucleotide (SNP) nel gene che codifica per la
Lattasi.
B. Background di conoscenze da fornire allo studente
1.Leggi di Mendel e terminologia della Genetica mendeliana
2.Struttura chimica del DNA e livelli di organizzazione molecolare.
3.Duplicazione, trascrizione, traduzione
4.Meccanismi di regolazione
C. Argomenti correlati all’attività di laboratorio
1.Meccanismi di regolazione
2.I polimorfismi di sequenza del DNA:
Enzimi di restrizione
I RFLP e gli SNP
Frequenza degli SNP e individuazione degli SNP
3.Aplotipi
4.Sudi di Linkage
D. Strategia d’insegnamento:
1. Attività di Bioinformatica:
Abstract:
Gli studenti navigano nel Modulo
”Percorso di Bioinformatica”
per compiere una ricerca web e per:
imparare l’approccio metodologico
di un lavoro di ricerca
Materiale:
Computers con accesso a
Internet
Durata: Due ore
Prerequisiti : Nessuno
Concetti chiave: Geni, alleli, SNP,
2. Laboratorio di Genetica Molecolare
Abstract:
Il DNA genomico viene estratto dalle cellule
della mucosa buccale. Il polimorfismo C/T-13910
è identificato mediante PCR. I prodotti della PCR
vengono quindi digeriti con l’enzima di restrizione
HinfI. La succesiva corsa elettroforetica evidenza
il genotipo relativo al polimorfismo: CC, TT, o CT.
Età: 16-18 anni
Prerequisiti:
DNA, cromosomi, proteine, ereditarietà mendeliana
Concetti chiave:
Il meccanismo e il significato evolutivo di questa variazione definita come
“Persistenza della Lattasi” introduce alla comprensione delle interazioni geneambiente.
3
Argomenti correlati all’attività di laboratorio
1. I meccanismi di regolazione della trascrizione
L’informazione genetica contenuta nelle sequenze del DNA viene trasferita all’RNA e dall’RNA al
polipeptide corrispondente.
Durante la trascrizione, un complesso proteico, comprendente l’enzima RNA polimerasi,
sintetizza le molecole di RNA sullo stampo delle sequenze di DNA che costituiscono le unità di
trascrizione.
La RNA polimerasi si lega al sito d’inizio della trascrizione insieme ad altre proteine, dette
fattori di trascrizione. Questi fattori, mediante l’interazione con brevi sequenze di DNA
presenti nella regione a monte dell’inizio della trascrizione (promotore), servono a posizionare
la RNA polimerasi nel sito giusto e a separare i due filamenti di DNA per formare la bolla di
trascrizione. L’enzima usa come stampo uno dei due filamenti di DNA in direzione 5’->3’,
catalizzando il legame fosfodiestere tra il gruppo ossidrilico legato al C3’ del ribonucleotide
precedente e il fosfato del nuovo ribonucleotide. Il processo continua fino a che la polimerasi
incontra una sequenza di arresto. A questo punto si stacca e libera la catena di RNA, mentre la
bolla di trascrizione si richiude e il DNA riassume la conformazione a doppia elica. L’RNA
neosintetizzato ha la sequenza di basi identica a quella di uno dei due filamenti di DNA (il
filamento senso), anche se la Timina è sostituita dall’Uracile.
Da uno stesso gene possono essere trascritte consecutivamente numerose copie di RNA e il
livello di trascrizione dipende da complessi meccanismi (vedi la regolazione della trascrizione).
E’ importante ricordare che le cellule eucariotiche possiedono tre tipi di RNA polimerasi:
- RNA polimerasi I trascrive i geni degli RNA ribosomiali
- RNA polimerasi II trascrive i geni che codificano proteine sintetizzando
i precursori degli RNA messaggeri e anche alcuni piccoli RNA
- RNA polimerasi III trascrive i geni di tutti gli RNA transfer, un RNA ribosomiale e altri
piccoli RNA.
I precursori degli mRNA neosintetizzati (trascritti primari) devono subire una serie di
modificazioni prima di essere trasferiti nel citoplasma per venire tradotti sui ribosomi. Questo
processo di maturazione degli mRNA include le seguenti modificazioni.
• Aggiunta all’estremità 5’ di un cappuccio (cap). Al primo nucleotide all’estremità 5’
della molecola di RNA nascente viene rimosso il fosfato terminale e viene aggiunta una
molecola di Guanosina monofosfato (GMP) metilata in posizione 7’. Il capping serve per
proteggere il trascritto dall’attacco delle esonucleasi che lo degraderebbero, e per
facilitare il trasporto dal nucleo al citoplasma.
• Rimozione di alcune sequenze che non vengono tradotte (processo di splicing). Quasi
tutti i geni eucariotici sono divisi in sequenze codificanti, chiamate esoni, e sequenze
non tradotte, dette introni. Questi ultimi vengono rimossi dai trascritti primari
mediante il processo di splicing. Gli introni sono quindi sequenze di DNA, situate tra due
esoni, le quali sono trascritte ma non tradotte. Salvo rare eccezioni, gli introni iniziano
sempre con i nucleotidi GT e terminano con i nucleotidi AG (regola GT-AG). Nel
processo di splicing si verifica prima la scissione all’inizio dell’introne (5’), poi l’estremità
libera dell’introne si ripiega su se stessa formando una struttura simile ad un laccio e
infine avviene il taglio a livello della giunzione 3’ dell’introne. Quindi i due esoni si
uniscono mentre l’introne va perso. Una struttura macromolecolare (costituita da varie
subunità di molecole di piccoli RNA nucleari, gli snRNP, e da una serie di proteine
specifiche) promuove e controlla le reazioni dello splicing.
•
Aggiunta all’estremità 3’ di una coda poli-A. La maggior parte delle unità di
trascrizione hanno una breve sequenza (AATAAA) che specifica il sito di termine della
trascrizione. Circa 15-30 nucleotidi a valle di questo sito, l’RNA neosintetizzato viene
scisso da un enzima, una endonucleasi, e alla molecola di RNA vengono aggiunti circa
200 residui di Adenosina monofosfato (AMP). Questa coda di poli-A ha lo scopo di
stabilizzare le molecole degli mRNA maturi e di facilitare il loro trasporto dal nucleo al
citoplasma.
4
2. STRUTTURA ED ESPRESSIONE DEI GENI
Dal punto di vista della genetica molecolare per gene s’intende una sequenza di DNA
potenzialmente trascrivibile in RNA funzionalmente attivo. Tale RNA può svolgere direttamente
una funzione strutturale e/o catalitica (rRNA, tRNA) oppure trasportare l’informazione per
la sintesi di una proteina (mRNA). Nel genoma umano si stima che siano presenti circa 23.000
geni codificanti proteine e 1000-2000 geni codificanti RNA strutturali. Da recenti studi
emergerebbe però l’esistenza di diverse migliaia (o decine di migliaia) di trascritti non
codificanti che potrebbero non avere alcuna funzione o, viceversa, svolgere un ruolo
fondamentale nella regolazione della conformazione della cromatina e della trascrizione di geni
codificanti proteine.
IL PROMOTORE
La regione a monte del sito d’inizio della trascrizione è detta promotore. La numerazione dei
nucleotidi inizia da -1, che corrisponde al nucleotide che precede il sito d’inizio della
trascrizione (indicato con +1). In questa regione, di lunghezza variabile, si trova una serie di
brevi sequenze che vengono riconosciute e legate da fattori di trascrizione. I fattori di
trascrizione favoriscono il legame dell’RNA polimerasi al sito giusto per iniziare la sintesi di
RNA. I geni che presentano elevati livelli di trascrizione, presentano nel promotore delle
sequenze specifiche ( i TATA box a circa -25 bp dal sito d’inizio della trascrizione; il CAAT box,
a -80 bp dal sito d’inizio della trascrizione, i GC box). Accanto a sequenze comuni a molti
promotori vi sono elementi che sono riconosciuti da fattori di trascrizione tessuto-specifici.
Anche i geni che mostrano un’espressione tessuto-specifica vengono spesso trascritti a livelli
molto bassi in tutte le cellule. Vi sono altre sequenze che vengono riconosciute da fattori di
trascrizione quali gli elementi di risposta, localizzati nel promotore o nella regione 5’ del gene,
e gli elementi indicati come enhancer (intensificatori), che servono per aumentare i livelli
basali della trascrizione e sono localizzati a distanza variabile dal gene, talvolta anche a valle
del sito d’inizio della trascrizione, vale a dire all’interno della regione trascritta.
Sito d’inizio
della trascrizione
+1
segnale
di poliA
promotore
CG
box
CG
Box
CAAT
box
ATG
sito poliA
codone di stop
TATA
box
GT
esone 1
AG
introne 1
GT
esone 2
AG
introne 2
esone 3
5’UTR
3’UTR
>>>>>>>>>>>>>
direzione di lettura del gene
TRASCRIZIONE
precursore dell’mRNA
GT
CAP
AG
GT
AG
AAA
SPLICING
mRNA MATURO
CAP
AAAAA
5
3. REGOLAZIONE DELLA TRASCRIZIONE
Due sono le condizioni perché si abbia una efficace trascrizione:
1. La presenza nella cellula di specifici fattori di trascrizione che interagiscono con
brevi sequenze nel promotore del gene e con sequenze enhancer e consentono
l’assemblaggio del complesso di trascrizione
2. Una conformazione della cromatina del gene “aperta”,ovvero i nucleosomi non
compattati e, possibilmente, il DNA non associato agli istoni nel promotore.
Il controllo dell’espressione genica mediante il legame di fattori proteici con le
sequenze di regolazione è estremamente complesso e coinvolge numerosi fattori che
possono essere grossolanamente distinti in fattori ubiquitari e tessuto-specifici.
L’interazione di fattori specifici con gli elementi enhancer è importante per
l’espressione genica tessuto-specifica.
Elementi regolatori della trascrizione
1.fattori di trascrizione
2.elementi cis-acting
3.elementi di regolazione distanti anche 1 Mb
4.Promotori alternativi/multipli
5.Modificazioni in DNA e istoni(acetilazioni o mutilazione)/accessibilità alla cromatina
6.piccoli RNAs di tanti tipi.
Enhancers
Gli enhancers sono sequenze nucleotidiche cis-agenti che esplicano la loro funzione
aumentando notevolmente (fino a 200 volte) la frequenza di trascrizione del gene che
controllano. Dal punto di vista strutturale, un enhancer non differisce molto da un
promotore.Gli enhancers non devono necessariamente essere vicini ai promotori: è
possibile infatti trovare degli enhancer a parecchie centinaia di migliaia di paia di basi
di distanza a valle o a monte del sito d'inizio della trascrizione.
Elementi cis-acting
“Cis-acting” generalmente significa “che agisce sulla stessa molecola”. Nel contesto
della regolazione della trascrizione, sono generalmente considerati “elementi cisacting” delle sequenze di DNA, che attraverso i fattori di trascrizione,regolano
l’espressione dei geni sullo stesso cromosoma.
Un esempio di sequenza regolatoria cis-acting è l’”operatore” dell’operone lac.
6
Questa sequenza di DNA è legata dal repressore lac che impedisce la trascrizione dei
geni adiacenti sulla stessa molecola di DNA. Possiamo dire quindi che l’operatore lac
“agisce in cis” nella regolazione dei geni vicini. L’operatore non codifica per alcuna
proteina o RNA.
Vi sono inoltre numerosi altri meccanismi da cui dipende il meccanismo
dell’espressione genica, come l’attivazione dei fattori di trascrizione in seguito al
legame di un ligando, per esempio un ormone, ad uno specifico recettore sulla
superficie cellulare. Infatti l’espressione di molti geni è controllata da un ormone, da
un fattore di crescita o da una molecola di segnale intracellulare (es. cAMP) i quali
legandosi a recettori specifici determinano l’attivazione o inattivazione di determinati
fattori di trascrizione (es. mediante la loro fosforilazione o defosforilazione). I fattori
attivati interagiscono quindi con gli elementi di risposta presenti nel promotore e
inducono l’espressione del gene corrispondente.
Notevoli progressi sono stati fatti recentemente nell’identificazione di modificazioni
della cromatina associate a una conformazione aperta (attiva) o compatta (inattiva).
Tali modificazioni sono dette epigenetiche, perché non modificano la sequenza
primaria del DNA. Generalmente la cromatina attiva è caratterizzata da un alto livello
di acetilazione degli istoni H3 e H4. Al contrario, gli istoni associati alla cromatina
inattiva, non trascritta, sono tutti deacetilati. Un’altra modifica degli istoni è la
metilazione. La metilazione epigenetica più studiata riguarda però lo stesso DNA e
consiste nella metilazione delle citosine, tipica delle regioni non trascritte e dei
promotori di geni trascrizionalmente inattivi. Le citosine metilate vengono riconosciute
da
proteine determinando il reclutamento di altre proteine che modificano la
cromatina e la compattano, facilitando l’inattivazione trascrizionale del gene stesso.
STRUTTURA ESONI-INTRONI
Il primo esone comincia al sito d’inizio della trascrizione, ma il primo tratto (fatto di
200-300 bp) non è codificante; questo segmento pertanto è trascritto, ma non
tradotto e viene indicato come regione 5’UTR ( UnTraslated Region). La regione
5’UTR è importante per l’efficienza della traduzione in quanto facilita il legame
dell’mRNA ai ribosomi.
La regione tradotta inizia generalmente con ATG, nel 1° esone. Il numero degli esoni
presenti nei geni umani è altamente variabile. Vi sono geni piccoli costituiti da un
singolo esone e altri che possiedono più di 100 esoni. Il numero medio è di 9-10 esoni
per gene. I singoli esoni sono generalmente piuttosto piccoli con dimensioni medie di
circa 200bp, ma esistono alcuni esoni eccezionalmente lunghi che possono superare
anche le 5 kb. Al contrario degli esoni, la dimensione degli introni è molto variabile.
Generalmente i geni piccoli hanno introni piccoli, mentre in quelli più grandi gli introni
possono avere anche una lunghezza di 10-20 kb. Quasi tutti gli introni cominciano
con GT (sito donatore di splicing) e terminano con AG (sito accettore di splicing).
Questi dinucleotidi sono circondati da sequenze consenso, altamente conservate nel
corso dell’evoluzione e molto simili tra loro. Il processo di splicing deve essere molto
preciso dato che lo spostamento anche di un singolo nucleotide determinerebbe lo
slittamento del modulo di lettura e quindi la sintesi di una proteina alterata. L’ultimo
esone, così come il primo, contiene una sequenza trascritta, ma non tradotta, detta
regione 3’UTR.
TRASCRITTI ALTERNATIVI E ISOFORME PROTEICHE
Un tempo si riteneva che ogni gene codificasse per un unico prodotto polipeptidico o
molecola di RNA, mentre oggi si sa che la maggioranza di geni umani specifica due o
più forme alternative di proteine (isoforme). I meccanismi con i quali vengono
generate queste diverse isoforme sono:
- l’uso di promotori alternativi
7
-
lo splicing alternativo
la poliadenilazione alternativa
Si conoscono diversi geni umani che hanno due o più promotori che sono attivi
specificamente in determinati tessuti e dirigono la sintesi di isoforme tessutospecifiche oppure vengono attivati durante un particolare stadio dello sviluppo. Il
meccanismo più frequente con il quale si generano delle isoforme diverse è lo
splicing alternativo, che consiste nell’assemblaggio diffrenziale di esoni durante la
maturazione dell’RNA. Si stima che oltre il 60% dei geni umani produca due o più
proteine mediante questo meccanismo. Molti esoni specificano domini proteici
strutturali distinti che possono essere combinati in modo diverso nelle cellule dei
diversi tessuti nei quali il gene è espresso. Pertanto a partire da un singolo gene
possono venire generate proteine simili, ma non identiche che possono avere funzioni
diverse nei vari tessuti.
4. POLIMORFISMI DI SEQUENZA DEL DNA
Il termine polimorfismo significa “esistenza di forme diverse”.
In genetica, il polimorfismo può essere analizzato sia a livello proteico che di materiale
genetico.
In questo secondo caso, le forme diverse, ossia le varianti genetiche possono riguardare un
gene, vale a dire un tratto di DNA codificante una proteina (polimorfismo allelico), oppure un
tratto di DNA non codificante (polimorfismo di sequenza).
Queste diversità di sequenza si definiscono polimorfismi e dato che più del 98% del DNA
umano è DNA non codificante, e che quindi la maggior parte di queste differenze è localizzata
in sequenze non codificanti, il fenotipo di un polimorfismo di sequenza del DNA non è
riconoscibile dall’esterno (ex. nei gruppi sanguigni). Dato l’elevato numero di loci polimorfici, i
polimorfismi di sequenza sono molto più frequenti dei polimorfismi allelici tradizionali (gruppi
sanguigni, albinismo, colore degli occhi, ecc..) e conseguentemente più utili nella ricerca
biologica e medica.
E’ stato osservato che il DNA di due individui differisce per circa un nucleotide ogni 500/1000.
Quando un polimorfismo interessa una sequenza riconosciuta da un Enzima di Restrizione,
la variazione, creando o distruggendo il sito di restrizione, darà luogo a differenze nei siti di
taglio di quel dato enzima all’interno della popolazione. Digerendo con quell’enzima il DNA di
individui diversi, si osserva quindi un polimorfismo di lunghezza dei frammenti di
restrizione – RFLP - e cioè dal DNA di individui diversi si generano frammenti di restrizione
diversi.
Come tutti i polimorfismi, i RFLP possono essere equiparati ad alleli codominanti di un locus
mendeliano: la presenza o assenza di uno o dell’altro allele può essere riconosciuta in ogni
individuo, consentendo la distinzione in omozigoti ed eterozigoti.
Il fenotipo di un RFLP è evidenziabile in termini di differenze di numero e/o dimensione dei
frammenti di DNA ottenuti con la digestione con un certo enzima di restrizione. I frammenti
sono visibili dopo migrazione elettroforetica su un gel.
L’avvento della genetica molecolare ha permesso di identificare i polimorfismi del DNA, che
sono diventati i marcatori genetici più comunemente usati. Attualmente si utilizzano tre tipi di
polimorfismi del DNA:
 i Polimorfismi di Lunghezza dei Frammenti di Restrizione, o RFLP
 i Polimorfismi del Singolo Nucleotide, o SNP
 i Polimorfismi di Lunghezza di Sequenze Semplici, o SSLP che vengono poi distinti in
VNTR (Variable Number of Tandem Repeats) o minisatelliti, e i STR (Simple Tandem
Repeats ) o microsatelliti.
8
5. GLI ENZIMI DI RESTRIZIONE
Un sito di restrizione o sequenza consenso viene definito come una particolare sequenza di
DNA riconosciuta da un enzima di restrizione o endonucleasi come il punto in cui tagliare la
molecola di DNA.
Questi siti sono generalmente palindromici (cioè possono essere letti in entrambe le
direzioni) la cui successione di basi è identica su entrambi i filamenti quando ciascuno di essi
venga letto in direzione 5’ -> 3’. La sequenza riconosciuta non è unica e varia da enzima ad
enzima, anche se con la stessa specificità di sequenza. Infatti, sebbene gli enzimi di restrizione
isolati siano oltre 3500, le sequenze bersaglio che possono essere tagliate sono molto meno
numerose (poco più di 200 ).
I siti di restrizione sono delle normali sequenze di basi, lunghi dai 4 fino a diverse decine di
paia di basi, per cui si possono trovare più o meno facilmente nel genoma.
Un enzima di restrizione può tagliare all’interno di una sequenza o nelle sue vicinanze, oppure
la sequenza consenso può anche essere distante diverse centinaia di basi.
Il taglio prodotto dagli enzimi può generare frammenti di DNA con estremità piatte (blunt), o
sporgenti ( 5’-protruding e 3’-protruding).
Le estremità prodotte sono “appiccicose”, cioè possono formare ponti Idrogeno tra le due code
a filamento singolo complementari. Le estremità coesive facilitano inoltre la reazione della DNA
ligasi.
L’enzima EcoRI produce un taglio sfalsato creando due estremità coesive a singolo filamento
al 5’ (5’-protruding):
5’...G/ AATTC.. 3’
3’...CTTAA /G...5’
L’enzima HhaI opera un taglio sfalsato creando due estremità coesive a singolo filamento al 3’
(3’-protruding ) :
5’… G C G /C… 3’
3’… C/G C G… 5’
Nome
enzima
Organismo di
provenienza
Sequenza d
riconoscimento e
posizione di taglio
Pronuncia
EcoRI
E.Coli RY13
G/A A T T C
C T T A A/G
Eco-ri-uno
HindIII
Haemophilus
influenzae Rd
A/A G C T T
T T C G A /A
Acca-ind-tre
BamHI
Bacillus
amyloliquefaciens
G/G A T C C
C C T A G/G
Bam-acca-uno
ENZIMI DI RESTRIZIONE. Sono prodotti dai batteri che li utilizzano per difendersi
da un DNA estraneo, esempio un virus Altri enzimi (le metilasi ) proteggono il DNA
batterico grazie all’azione delle proprie endonucleasi di restrizione.
Gli ER si indicano con un sistema di lettere e numeri che si riferisce al ceppo batterico da
cui sono stati isolati.
9
6. Polimorfismo a singolo nucleotide o SNPs
(Single nucleotide polymorphism / Polimorfismo di sequenza di un singolo nucleotide)
Un polimorfismo a singolo nucleotide (in inglese Single Nucleotide Polymorphism o SNP,
pronunciato snip) è un polimorfismo (cioè una variazione a livello di una sequenza di acidi
nucleici) che si presenta tra individui della stessa specie, caratterizzata da una differenza a
carico di un unico nucleotide
C T A A/G G T A
SNP
Gli SNPs sono sostituzioni di un singolo nucleotide di una base con un’altra.
Naturalmente, possiamo avere 4 versioni per ogni SNP, una per ogni nucleotide,A,C,G
e T e la distribuzione nella popolazione potrebbe risultare in una delle seguenti
combinazioni.
Gli SNP si verificano nella popolazione con una frequenza maggiore all’1%. Sono
stati individuati molti SNPs nella sequenza del DNA e la sfida per la ricerca è
identificare gli SNPs correlati con un particolare effetto nel fenotipo.
Nel genoma umano si verificano SNPs all’incirca uno ogni 300 paia di basi. Questo
significa che – su 3 miliardi di nucleotidi presenti nel genoma umano - avremo circa
10 milioni di SNPs. Gli SNPs costituiscono il 90% di tutte le variazioni genetiche umane.
Un polimorfismo noto è quello dei gruppi sanguigni, ~20 loci
Non bisogna confondere una mutazione puntiforme con uno SNP!
Anche se si assomigliano, non sono la stessa cosa.
- sono entrambe differenze di singoli nucleotidi, ma per parlare di SNP bisogna che
questo sia presente in almeno l’1% della popolazione.
- molte mutazioni correlate a malattie si trovano all’interno delle regioni codificanti
del gene o in quelle regolatorie e interessano la proteina corrispondente a quel
gene. Viceversa, gli SNPs non sono necessariamente localizzati nei geni, e non
sempre alterano la funzione di una proteina.
Gli SNPs sono divisi in due principali categorie:
Linked SNPs (detti anche indicative SNPs) non si trovano all’interno dei geni e non
alterano la funzione della proteina. Tuttavia sono correlati con una particolare risposta
ai farmaci o al rischio di ammalarsi di una certa malattia prodotta.
Causative SNPs alterano il funzionamento di una proteina, correlando con una
malattia o influenzando la risposta individuale ad una terapia (farmaco).Si distinguono
2 tipi di Causative SNPs:
- Coding SNPs,localizzati nella regione codificante del gene, cambiano la
sequenza di aminoacidi nella proteina
10
-
Non-coding SNPs, localizzati nelle sequenze regolatorie del gene, modificano
il livello di espressione del gene e quindi la quantitò di RNA e di proteina
prodotta.
I POLIMORFISMI DEL DNA sono utili come:
 IDENTIFICATORI INDIVIDUALITA’ :
o controllo relazioni parentali in famiglie con malattie mendeliane
o Genetica di popolazione
o Indagini di paternità
o Indagini di medicina legale
 MARCATORI GENETICI
o per identificare geni-malattia
o
ANALISI DI LINKAGE
(diagnosi portatore)
mappaggio sia genetico (ordinamento dei geni sui cromosomi) che fisico
(distanza fisica tra i geni)
Come si individuano i Polimorfismi?
Per analisi diretta della sequenza del DNA :
 􏰁 PCR + elettroforesi ( agarosio+ et.br./acrilamide+ et.br./acrilamide+fluoresc.)
 􏰁 microchip
Un metodo utile per individuare gli SNPs è la valutazione dei cosiddetti polimorfismi di
lunghezza dei frammenti di restrizione (Restriction fragment length polymorphisms) o RFLP.
Se un allele contiene un sito di riconoscimento per un enzima di restrizione ed un altro no, la
digestione dei due alleli genererà due frammenti di dimensione differente.
In realtà oggi gli SNPs sono studiati principalmente attraverso i microarrays, che permettono
l’analisi simultanea di centinaia di migliaia di diversi SNPs ed una veloce analisi elaborata da un
computer.
11
7. APLOTIPO
Al fine di trovare una associazione tra SNPs e la risposta a un farmaco, gli scienziati
hanno considerato una serie di SNPs su un segmento più lungo di DNA.
C T/C G A C T A A/G G A C C G/T A
SNP
SNP
SNP
Questi tre SNPs possono combinarsi in 23 ( ognuno dei tre SNPs con i due possibili
nucleotidi), cioè otto differenti combinazioni.
C
C
C
C
C
C
C
C
T
T
T
T
C
C
C
C
G
G
G
G
G
G
G
G
A
A
A
A
A
A
A
A
C
C
C
C
C
C
C
C
T
T
T
T
T
T
T
T
A
A
A
A
A
A
A
A
A
A
G
G
A
A
G
G
G
G
G
G
G
G
G
G
T
T
T
T
T
T
T
T
A
A
A
A
A
A
A
A
C
C
C
C
C
C
C
C
C G
C T
C G
C T
C G
CT
C G
C T
A
A
A
A
A
A
A
A
POSSIBILI
COMBINAZIONI
DI SNPs
Ogni combinazione di SNPs è chiamata APLOTIPO.
Quindi, possiamo dire che in questa regione di DNA ci sono 8 possibili aplotipi.
C
C
C
C
C
C
C
C
T
T
T
T
C
C
C
C
G
G
G
G
G
G
G
G
A
A
A
A
A
A
A
A
C
C
C
C
C
C
C
C
T
T
T
T
T
T
T
T
A
A
A
A
A
A
A
A
A
A
G
G
A
A
G
G
G
G
G
G
G
G
G
G
T
T
T
T
T
T
T
T
A
A
A
A
A
A
A
A
C
C
C
C
C
C
C
C
C G
C T
C G
C T
C G
CT
C G
C T
A
A
A
A
A
A
A
A
APLOTIPO
APLOTIPO
APLOTIPO
APLOTIPO
APLOTIPO
APLOTIPO
APLOTIPO
APLOTIPO
1
2
3
4
5
6
7
8
Quando studiamo i campioni di DNA di un vasto gruppo di popolazione,possiamo
notare che solo quattro di queste combinazioni sono presenti. Infatti, anche nella
realtà, spesso noi possiamo vedere solo alcuni dei possibili aplotipi
C
C
C
C
T
T
C
C
G
G
G
G
A
A
A
A
C
C
C
C
T
T
T
T
A
A
A
A
A
G
A
G
G
G
G
G
T A C C G
T A C C G
T A C CT
T A C C T
A
A
A
A
APLOTIPO
APLOTIPO
APLOTIPO
APLOTIPO
1
3
6
8
12
aplotipo 6
aplotipo 8
aplotipo 1
RICORDA !
Nel mondo della Genetica, ogni cosa è “in paia”:
noi riceviamo un aplotipo dalla madre e uno dal padre.
aplotipo 3
Questo significa che abbiamo due aplotipi ( o un paio di aplotipi).
CCGACTAAGTAC CT A
aplotipo della mamma
mamma
papa’
CTGACTAAGTACCGA
aplotipo del padre
I due aplotipi ereditati dal
figlio sono differenti
I due aplotipi ereditati dal
figlio sono identici
CTGACTAAGTACCGA
aplotipo della madre
f
figlio
CTGACTAAGTACCGA
aplotipo del padre
SNP PROFILE………….. che cos’è ?
LA COPPIA DI APLOTIPI è lo
“SNP PROFILE”
CCGACTAAGTAC CT A
aplotipo della mamma
CTGACTAAGTACCGA
aplotipo del padre
SNP PROFILE
CTGACTAAGTACCGA
aplotipo del padre
Quando i ricercatori studiano la
risposta di un individuo ad un
farmaco, essi devono considerare
quello SNP profile, unico della
persona
CTGACTAAGTACCGA
aplotipo della madre
CTGACTAAGTACCGA
aplotipo del padre
CTGACTAAGTACCGA
aplotipo del padre
8. ANALISI DI LINKAGE
(o di Associazione o di Concatenazione)
13
Permette di determinare la posizione cromosomica del locus responsabile di un carattere
genetico o di una determinata malattia rispetto a ”marcatori genetici” di cui è nota la
posizione.
Un marcatore genetico è un qualunque carattere che risponde alle seguenti caratteristiche:
- è polimorfico
- è facile da identificare e stabile nelle generazioni
- segrega in modo mendeliano
Quali sono ? RFLP,VNTR, STR, SNP.
Ogni individuo possiede due copie di ciascun allele, uno ereditato dal padre e uno dalla madre.
Durante la meiosi i cromosomi omologhi segregano separatamente. Quindi, se consideriamo
due loci polimorfici situati su cromosomi diversi, un particolare allele del primo locus
avrà il 50% di probabilità di segregare insieme ad un particolare allele del secondo locus.
Se consideriamo invece due loci situati sullo stesso cromosoma, ci aspettiamo che i loro
alleli vengano ereditati insieme ( cioè co-segregano) in base alla distanza che intercorre tra
loro sul cromosoma. Più grande è la loro distanza, più è facile che un evento di crossing over
separi i due alleli.
L’evento di crossing over dà luogo alla formazione di gameti ricombinanti
La probabilità che avvenga questa ricombinazione, espressa in percentuale, è nota come
frequenza di ricombinazione.
La frequenza di ricombinazione ci dice quindi la distanza genetica tra loci diversi.
L’analisi di concatenazione nell’uomo si basa sullo studio degli alberi genealogici e sulla ricerca
delle meiosi informative (cioè quelle in cui si può identificare se un gamete è o non è
ricombinante).
Allo stesso modo si può mappare anche un numero consistente di loci,considerandone sempre
due per volta.
Un altro approccio è quello di studiare gli aplotipi, ovvero l’ordine degli alleli sui rispettivi
cromosomi omologhi. E’ quindi necessaria una rielaborazione statistica dei dati riguardanti
l’associazione tra i marcatori e la comparsa della malattia.
Quali sono i problemi di uno studio di linkage ?
1.le famiglie da analizzare solitamente contano pochi individui
2. in famiglie poco numerose vi è un basso numero di ricombinanti
3. i risultati così ottenuti hanno una bassa significatività statistica
Quali sono le possibili soluzioni ?
1. Analizzare più famiglie insieme
Quali popolazioni studiare ?
1.Popolazioni geneticamente isolate
2.Popolazioni giovani, con poche generazioni dal momento del fondatore, con pochi
crossing over, con poche ricombinazioni
3.Popolazioni omogenee, cioè con poche famiglie fondatrici
Esempi di popolazioni che presentano queste caratteristiche sono:
- I Finlandesi: geneticamente e linguisticamente molto diversi dai loro vicini slavi.La
popolazione è giovane in quanto fondata circa 2000 anni fa da poche famiglie fondatrici
- I Sardi in Italia
LINKAGE EQUILIBRIUM: indica una combinazione casuale di alleli a loci associati.
Consideriamo per esempio il caso di due loci associati 1 e 2 con 2 possibili alleli ciascuno (A e a
per il locus 1 e B e b per il locus 2) Gli aplotipi possibili in una determinata popolazione (AB,
14
Ab, aB, ab) si verificheranno con una frequenza che è il prodotto delle frequenze dei singoli
alleli per ciascun aplotipo.
Esempio: A = 0,2 B = 0,6
a = 0,8 b = 0,4
- 4 aplotipi possibili: AB Ab aB ab
AB
Ab
aB
ab
0,2 x 0,6 = 0,12
0,2 x 0,4 = 0,08
0,8 x 0,6 = 0,48
0,8 x 0,4 = 0,32
equilibrio di linkage
LINKAGE DISEQUILIBRIUM: indica una combinazione non casuale di alleli a loci
associati. Il linkage disequilibrium è spesso la conseguenza di un effetto "founder" (fondatore),
cioè di una mutazione in un singolo individuo. Perchè l'effetto fondatore sia evidenziabile in
una popolazione è necessario che i due loci siano vicini, in maniera tale che gli eventi di
ricombinazione siano rari tra i due loci, e che non sia trascorso abbastanza tempo dalla
comparsa del fondatore poichè la ricombinazione puo' ristabilire nel tempo l'equilibrio.
Il linkage disequilibrium (LD) indica la presenza di associazione preferenziale tra specifici
alleli relativi a due o più loci, presenti sullo stesso cromosoma, che costituiscono di solito un
particolare aplotipo ancestrale, diffuso nella popolazione in cui è rilevato, perché trasmesso
lungo la discendenza da un comune progenitore.
Riprendiamo l’esempio dei 4 aplotipi AB, Ab, aB, ab.
Se si trovassero questi valori
AB
Ab
aB
ab
=
=
=
=
0,04 –
0,16 +
0,56 +
0,24 -
-
linkage disequilibrium
TECNICHE UTILIZZATE PER L’ANALISI MOLECOLARE DEL
DNA
15
1. ESTRAZIONE DEL DNA.
Il DNA può essere estratto da qualunque cellula nucleata. I tipi cellulari più utilizzati sono
rappresentati dai leucociti di sangue periferico, colture cellulari (fibroblasti, amniociti, villi
coriali). L’isolamento del DNA richiede l’utilizzo di enzimi capaci di distruggere le membrane
cellulari e nucleari e di solventi organici in grado di separare le proteine dagli acidi nucleici.
Nella procedura classica di estrazione del DNA genomico, le cellule vengono lisate e sottoposte
a trattamento proteolitico con Proteinasi K, eliminata successivamente con estrazioni fenoliche.
Il DNA purificato viene precipitato in Etanolo. La determinazione quantitativa della
concentrazione del DNA estratto, calcolata in ng/µl, viene effettuata mediante lettura
spettrofotometrica valutando l’assorbanza del campione a 260 nm.
2. LA TECNICA DELLA PCR PER L’ANALISI DEI RFLP
L’introduzione della PCR, la tecnica che consente di amplificare selettivamente un tratto di
DNA, ha rivoluzionato la genetica molecolare e le sue applicazioni sono praticamente
infinite. Uno degli ambiti di utilizzo è la diagnosi di malattie genetiche mediante analisi di RFLP.
L’utilizzo della PCR semplifica molte cose. Ad esempio, la PCR consente di analizzare uno
specifico tratto di DNA, invece di dover lavorare su tutto il DNA nucleare di una cellula,ossia sul
DNA genomico.
La PCR (Polymerase Chain Reaction) è una tecnica di amplificazione in vitro di un frammento di
DNA di cui si conosca la sequenza nucleotidica delle regioni terminali.
Il principio è molto semplice. Data una sequenza di DNA genomico a doppio filamento e due
corte sequenze oligonucleotidiche (primer), di cui una complementare ad un tratto di filamento
a una estremità del DNA da amplificare (forward primer) e l’altra complementare ad un altro
tratto posto all’altra estremità (reverse primer), in presenza di una DNA polimerasi
termostabile e di una miscela di desossinucleotiditrifosfati(dNTPs), in appropriate
condizioni di reazione, è possibile copiare numerosissime volte (30-40 volte) il tratto compreso
tra i due primer, semplicemente facendo variare ciclicamente la temperatura di reazione.
Infatti, raggiunta la temperatura di denaturazione (92-95°C), la doppia elica si apre (fase di
denaturazione), rendendo disponibile lo stampo per la sintesi delle catene complementari. Se
la temperatura si abbassa, in virtù delle loro minori dimensioni e della loro concentrazione, i
primer si legheranno (fase di appaiamento o annealing) al DNA stampo prima che si
rinaturi e in presenza di una DNA polimerasi con un optimum di temperatura elevato (circa
72°C), inizierà la sintesi di DNA a partire dai primer (fase di sintesi del DNA o extension),
procedendo lungo i filamenti singoli. Al termine del primo ciclo di PCR da una doppia elica di
DNA se ne ottengono due.
Ripetendo il ciclo denaturazione – annealing – extension numerose volte (in genere da 30 a 40
volte), si ottiene una massiccia amplificazione specifica di un dato tratto di DNA,
corrispondente a DNA in quantità tale da essere visualizzabile in un gel di agarosio mediante
colorazione specifica.
Il metodo di analisi del DNA mediante PCR presenta vantaggi molto evidenti:
1. è molto rapido (da 60 a 90 minuti),
2. la manualità è semplicissima,
3. è automatizzato,
16
4. i risultati sono visualizzabili con facilità.
Il limite più grosso è rappresentato dalla necessità di conoscere le sequenze fiancheggianti il
tratto di DNA che si vuole amplificare, per poter costruire i primer specifici.
La PCR ha rivoluzionato la genetica molecolare. Le applicazioni della PCR sono praticamente
infinite. I principali ambiti di utilizzo sono la diagnosi prenatale delle malattie genetiche e le
indagini di medicina legale.
I termociclatori
Il successo della PCR è dovuto in gran parte alla possibilità di far avvenire l’intero processo in
modo automatico all’interno di strumenti detti termociclatori (thermal cyclers) in grado di
variare ciclicamente la temperatura tra le varie fasi di ogni ciclo di PCR. Un esempio di profilo
di amplificazione standard impostato mediante un termociclatore è il seguente:
1. denaturazione del DNA: 30 sec. a 94°C
2. appaiamento(annealing)deiprimer: 30 sec. a 50°-60°C 35 cicli
3. sintesi (extension)di DNA: 30 sec-5 min. a 72°C
Il successo della PCR è stato possibile grazie anche all’uso di una DNA polimerasi termostabile
estratta da batteri termofili (che vivono ad elevate temperature).
Una DNA polimerasi utilizzata nelle reazioni della PCR è la Taq polimerasi, estratta dal batterio
Thermus aquaticus. L’isolamento di DNA polimerasi termostabili ha sollevato gli operatori
dall’ingrato compito di aggiungere enzima fresco ad ogni ciclo di reazione!
Scelta dei primer
Per ogni PCR, è necessario usare due primer (forward e reverse).
La scelta della coppia di primer è critica per una buona riuscita della PCR, ovvero per ottenere
l’amplificazione di un tratto di DNA in modo specifico.
I primer devono essere “disegnati” a monte e a valle dei siti di restrizione. Si tratta di
oligonucleotidi, con dimensioni comprese tra le 15 e le 30 basi che ibridano su filamenti
opposti in posizioni fiancheggianti la regione di interesse del DNA.
Per minimizzare la formazione di artefatti è importante che le loro sequenze non contengano
basi complementari (all’interno dello stesso primer o tra i due primer); inoltre la Temperatura
di fusione dei due oligonucleotidi deve essere identica o almeno molto vicina.
3. Digestione con enzimi di restrizione (ER)
Come abbiamo detto, gli ER sono endonucleasi che tagliano il legame fosfodiesterico nel DNA a
doppia elica a livello di sequenze specifiche (siti di restrizione). La digestione con ER va
condotta a 37°C in una soluzione tampone (fornita insieme all’enzima dal produttore) che
garantisce le condizioni ottimali (di salinità e pH) per la digestione. Il tempo di incubazione
varia a seconda se si digerisce DNA genomico o frammenti di DNA corti .Nel primo caso la
digestione richiede almeno 8 ore (o tutta la notte). Nel secondo caso sono sufficienti da 1-4
ore. Gli ER sono reagenti costosi e delicati. Temono le contaminazioni (usare precauzioni nel
prelevare l’enzima dalla soluzione stock) e l’inattivazione (si devono conservare a -20°C e, al
momento dell’uso, mantenere sempre in un bagno di ghiaccio).
4.Elettroforesi su gel di agarosio
E’ una tecnica che consente di separare in base alle loro dimensioni (peso molecolare)
molecole dotate di carica, facendole migrare su un gel in presenza di un campo elettrico. Il gel
può essere immaginato come una rete tridimensionale attraverso le cui maglie migrano le
molecole sotto l’azione di un campo elettrico. Il campo elettrico è generato da un apparecchio,
detto alimentatore.
Per separare molecole di DNA si usano gel di agarosio. Le molecole di DNA sono cariche
negativamente per la presenza di gruppi fosfato e migrano dal polo negativo (catodo) verso il
polo positivo (anodo). Per un certo intervallo di pesi molecolari, la velocità di migrazione è
funzione del loro peso molecolare: tanto più grande è la molecola di DNA, tanto minore è la
velocità di migrazione. E, viceversa, tanto più piccola è la molecola di DNA, tanto più
velocemente migra. Le molecole di DNA di diversa lunghezza vengono pertanto separate in
base alla diversa velocità di migrazione.
Per poter determinare la lunghezza delle molecole di DNA in esame separate mediante
elettroforesi, vengono “caricati” sul gel anche i cosiddetti marcatori di peso molecolare,ossia
17
una miscela di frammenti di DNA di cui è noto il peso molecolare. Confrontando la posizione
dei frammenti a peso molecolare noto con quella dei frammenti di DNA in esame, è possibile
calcolarne il peso molecolare, ossia la lunghezza. Dato che il peso molecolare di un frammento
di DNA è proporzionale al numero di coppie di nucleotidi (basi) che lo costituiscono, di solito
esso viene espresso in paia di basi (bp). La separazione elettroforetica dura circa 45 minuti
circa. Al termine, i vari frammenti di DNA, essendo incolori, possono essere visualizzati, con
particolari sistemi di colorazione. Il DNA delle diverse classi di peso molecolare è visibile sotto
forma di bande distinte: sono le cosiddette bande di DNA. Comunemente, per poter
visualizzare il DNA, durante la preparazione del gel si aggiunge all’agarosio il bromuro di etidio,
una sostanza che ha la proprietà di legarsi al DNA e di emettere fluorescenza se esposta a luce
UV. Alla fine della corsa, le bande si visualizzano esponendo il gel alla luce ultravioletta. Il
bromuro di etidio va maneggiato con estrema cautela in quanto è un agente intercalante del
DNA e, come tale, ha proprietà mutagene. Noi utilizzeremo il GEL RED, intercalante non
tossico che non richiede precauzioni particolari.
ATTIVITA’ DI BIOINFORMATICA
PREMESSA:
18
Principali siti di riferimento
www.ncbi.nlm.nih.gov
L’NCBI (National Centre for Biotecnology Information) sorto nel 1988, crea database pubblici,
conduce ricerche in bioinformatica, sviluppa software per analizzare dati genomici e divulga
informazioni biomediche. L’obiettivo è una migliore comprensione dei processi molecolari
riguardanti la salute umana e le malattie. Sul sito si trovano banche dati relative al genoma
umano e di altri organismi, a sequenze nucleotidiche e aminoacidiche, a strutture molecolari, a
pubblicazioni scientifiche (come PubMed, la principale banca dati bibliografica, pubblica e
gratuita, del settore biomedico). In particolare NCBI –Entrez comprende un database di
strutture biomolecolari 3D determinate sperimentalmente: MMDB ossia Molecular Modeling
DataBase. Tali strutture sono ottenute principalmente con cristallografia a raggi e
spettroscopia di risonanza magnaticanucleare (NMR); forniscono informazioni sulla funzione
biologica, la storia evolutiva e le relazioni tra le macromolecole. Il database è ovviamente più
piccolo rispetto ai data base proteici o nucleotidici (solo di una frazione delle proteine si è
determinata la struttura 3D), ma molte proteine possono considerarsi omologhe a quelle
presenti.
http://genome.ucsc.edu/
UCSC ( University of California Santa Cruz). Questo sito contiene le sequenze di riferimento e
le schermate che mostrano un’ampia collezione di genomi.
Fornisce inoltre un portale di accesso al Progetto Encode.
www.ensembl.org
ENSAMBL ( un gioco di parole tra ensamble -insieme- e EMBL, European Molecular Biology
Laboratory) è un progetto sviluppato in collaborazione tra il Sanger Center di Cambridge e
EMBL per sviluppare un software di annotazione automatica dei genomi animali.Con il termine
“annotazione” si intende l’inserimento di tutte le informazioni riguardanti la funzione di una
determinata sequenza. Ensambl aggiorna i dati almeno 10 volte l’anno.
OBIETTIVO DELL’ATTIVITA’ :
1.
2.
3.
4.
6.
7.
8.
Cos’è la Lattasi ?
Come si fa a localizzare il gene d’interesse ?
Una volta che l’ho localizzato, come trovo tutte le informazioni necessarie ?
Come si caratterizza il gene ?
Come riconoscere esoni ed introni ?
Come trovare il polimorfismo a singolo nucleotide rs 4988235 correlato con LP ?
Come interpretare i dati statistici sulle frequenze alleliche nelle popolazioni?
1°. OBIETTIVO: COS’E’ LA LATTASI ?
19
Andare su GOOGLE . digitare NCBI. Aprire la Home Page.
Search “ OMIM “ for “LCT”. Go
DESCRIPTION
In humans, the activities of lactase and most of the other digestive hydrolases are maximal at birth. The majority of
the world's human population experiences a decline in production of the digestive enzyme lactase-phlorizin hydrolase
during maturation, with the age of onset ranging from the toddler years to young adulthood. Due to the reduced
lactase level, lactose present in dairy products cannot be digested in the small intestine and instead is fermented by
bacteria in the distal ileum and colon. The fermentative products result in symptoms of diarrhea, gas bloat, flatulence,
and abdominal pain. However, in a minority of adults, high levels of lactase activity persist in adulthood. Lactase
persistence is a heritable autosomal dominant condition that results in a sustained ability to digest the milk sugar
lactose throughout adulthood
20
2° OBIETTIVO
Come si fa a localizzare il gene LCT?
Ritorna sulla pagina iniziale del sito NCBI. Search “nucleotide” for ”lep homo sapiens” . Clicca
su GO.
Cliccare su LCT (Homo Sapiens)
Si aprirà un tipico file di GenBank. Questa pagina non è facile da leggere, ma alcune informazioni
sono chiare.
3° OBIETTIVO: Come si trovano tutte le informazioni necessarie ?
In questa pagina leggiamo:
- le Reference. Cliccando qui troverai le citazioni alle pubblicazioni in letteratura scientifica
che riguardano la nostra sequenza.Per leggere un abstract dell’articolo che descrive il gene
clicca sul link PubMed .
- la posizione del gene Lct. Il gene si trova sul cromosoma 2.
- Il Sommario. Qui vengono descritte le principali funzioni della Proteina
Il gene 2q21 si trova sul cromosoma 2 in un enhancer noto come MCM6
4° OBIETTIVO: Come si caratterizza il gene LCT ?
Go to reference sequence details
Cliccare su GenBank. Compare una pagina con tutte le informazioni sul gene per la
Lattasi.
MA NON E’ QUESTO IL GENE CHE CONTIENE LO SNP !!
Torna indietro
Clicca su MCM6. Che cos’è? Leggi Summary
Clicca su NM 005915+4
Si apre la pagina con le informazioni sul gene MCM6, sugli esoni e introni di cui è fatto.
Lo SNP che ci interessa sta sull’introne 6.
5. Individuazione del Polimorfismo SNP rs 4988235
Ritorna in cima alla pagina dell’NCBI.
Su Search cerca SNP for MCM6
22
Clicca su rs 4988235
Scorrendo la pagina si ha la sequenza contenente lo SNP
Sotto ancora…
Cliccare su Open sequence viewer in a new window.Si apre una nuova finestra sullo SNP
VAI SU GO TO POSITION/RANGE
SE VADO SU SEQUENCE E SCRIVO L’INIZIO E LA FINE DELLA SEQUENZA AMPLIFICATA
26611-26811 OTTENGO………
23
6. Genetica delle popolazioni
Quali frequenze alleliche di riferimento si riscontrano nella popolazione caucasica?
24
Il Lattosio
Il lattosio è uno zucchero riducente destrogiro. E’ costituito da una molecola di ß D-(+)-galattosio
e da una di ß D-(+)-glucosio uniti da un legame β(1→4) glicosidico.
È l'unità del D-(+)-glucosio ad avere il gruppo aldeidico "libero" responsabile delle proprietà
riducenti del lattosio.
Il lattosio rappresenta il 98% degli zuccheri presenti nel latte (di mucca, di capra, di asina oltre
che nel latte di donna). E’ contenuto oltre che nel latte (circa il 40 % della massa secca, 3.5-4%
sul tal quale), anche nei suoi derivati (formaggi e yogurt) e in prodotti a base di siero di latte
Lattasi
La Lattasi,nota anche come Lattasi-Florizina Idrolasi è una ß-galattosidasi responsabile
dell’idrolisi del Lattosio in Glucosio e Galattosio. I due monosaccaridi vengono assorbiti dagli
enterociti intestinali e passano nel circolo sanguigno; il Glucosio viene utilizzato come fonte
energetica e il Galattosio diventa un componente dei Glicolipidi e delle Glicoproteine. La Lattasi ha
due attività: un’attività ß-glicosidica idrolizzante il Lattosio e un’attività ß-glicosidica per l’idrolisi
della Florizina,un disaccaride trovato nelle radici e nella corteccia di piante della famiglia delle
Raosacee e di alcune alghe marine.
La Lattasi è sintetizzata come Pro-Lattasi, un polipeptide di 220 Kda che subisce una
considerevole modificazione post-trascrizionale durante il trasporto alla superficie cellulare nella
forma matura di Lattasi di 150 Kda. Dimerizza sulla membrana dell’orletto a spazzola per formare
l’enzima attivo. Anche fattori presenti nel lume intestinale contribuiscono alla modifica della
proteina per produrre l’enzima attivo mediante separazione di due ulteriori aminoacidi da parte
della Tripsina pancreatica. Il polipeptide scisso non ha apparentemente una funzione
enzimatica,ma può funzionare come una molecola adiuvante (chaperone). La Lattasi ha un
dominio C-terminale sulla membrana che sporge verso il lume gastrointestinale. Il sito della
Florizina è utilizzato per diverse funzioni e questo spiega perché l’attività di alcuni enzimi che fa
seguito alla diminuzione dell’espressione enzimatica dopo lo svezzamento con il latte materno.
( Fig.1)
Fig.1
25
Che cos’è l’intolleranza al lattosio?
È l’incapacità dell’intestino a scindere il lattosio (si trova nel latte di mucca, di capra, di asina oltre
che nel latte di donna) nei due zuccheri semplici, il glucosio e il galattosio, che sono assorbibili
dall’intestino.
L’intolleranza al Lattosio è una condizione molto comune caratterizzata dalla mancanza di
Lattasi,un enzima che si trova nell’orletto a spazzola della mucosa intestinale e idrolizza il Lattosio
a galattosio e glucosio. Nei neonati sono presenti alte concentrazioni di questo enzima.
Dopo l’allattamento si verifica una riduzione della sua attività, irreversibile e geneticamente
programmata e che si manifesta come un malassorbimento primario di Lattosio,la più comune
carenza enzimatica.
Tale incapacità è data dalla mancanza totale o parziale dell’enzima lattasi che si trova a
livello della superficie delle cellule che rivestono l’intestino.
La permanenza del lattosio come tale nell'intestino ne determina l'utilizzo da parte della flora
batterica intestinale responsabile della fermentazione (da questo processo si ha una grande
produzione di gas e acidi organici) ed essendo il lattosio una sostanza osmoticamente attiva
richiama nel colon acqua e sodio impedendo la formazione delle feci solide.
I sintomi più comuni dell’intolleranza al lattosio sono:
* dolori addominali di tipo crampiforme
* meteorismo intestinale
* diarrea
* in rari casi è anche presente perdita di peso e malnutrizione
La gravità della sintomatologia dipende dalla quantità di lattosio che ogni individuo riesce a
tollerare. Molto spesso i sintomi, soprattutto i dolori addominali e la diarrea, compaiono poco
dopo l’assunzione di alimenti contenenti lattosio.
L'intolleranza al lattosio può essere congenita,primaria, secondaria e transitoria.
CARENZA CONGENITA DI LATTASI è estremamente rara è dovuta a mutazioni nella regione
codificante del gene per la lattasi (autosomal recessively inherited severe gastrointestinal
disorder of infants).
CARENZA PRIMARIA DI LATTASI è dovuta alla totale o parziale assenza di Lattosio che si
sviluppa nell’infanzia a varie età in differenti gruppi razziali. E’ la più comune causa di intolleranza
al Lattosio ed è anche conosciuta come IPOLATTASIA ADULT TYPE o NON PERSISTENZA
DELLA LATTASI o CARENZA EREDITARIA DI LATTASI. E’ la carenza enzimatica più diffusa
nel mondo.E’ una condizione autosomica recessiva derivante dalla diminuzione dell’attività
dell’enzima Lattasi-Forizina nelle cellule intestinali.
CARENZA SECONDARIA DI LATTASI è solitamente dovuta ad un deterioramento della mucosa
intestinale secondario ad un processo infiammatorio o infettivo. Il problema in questo caso è
temporaneo e dura fino a che non si sia risolta la causa primaria. Può comparire ad ogni età, ma
è più comune nell’infanzia.
CARENZA TRANSITORIA DI LATTASI è oggi definita come una carenza di lattosio relativa
osservata tra i neonati pretermine di meno di 34 settimane di gestazione. Sebbene la Lattasi sia
un enzima non inducibile, una alimentazione supplementare con Lattasi può favorire la
produzione e l’espressione dell’enzima.
26
GENETICA
La capacità di digerire il Lattosio diminuisce rapidamente con l’età nella popolazione umana in
seguito alla diminuzione dei livelli dell’enzima Lattasi-Florizina Idrolasi; questa condizione è nota
come “Non persistenza della Lattasi”(LNP).
Comunque, alcuni individui,in particolare quelli discendenti da alcune popolazioni che hanno
praticato la pastorizia, mantengono la capacità di digerire il latte e altri prodotti caseari anche
nell’età adulta. Questi individui presentano il carattere “Persistenza della Lattasi”(LP).
Il fenotipo LP/LNP è geneticamente determinato, con il carattere LP dominante sul LNP.
Si pensa che l’espressione nell’adulto del gene che codifica per la Lattasi (LCT), localizzato sul
cromosoma 2 (2q21) sia dovuto a un polimorfismo cis-acting della regolazione dell’espressione
del gene della Lattasi.
Uno studio di linkage disequilibrium (vedi pag.14)e l’analisi dell’aplotipo (ved.pag.12) nel
pedigree dei Finlandesi ha identificato due singoli SNPs associati con il carattere “Persistenza
della Lattasi”.
Due SNPs nel gene che codifica per la Lattasi (LCT) C/T-13910 e G/A-22018 sono associati
con la capacità di digerire il latte nell’età adulta (Persistenza della Lattasi) nella popolazione
europea.
C/T-13910 e G/A-22018, sono localizzati rispettivamente a ~14 kb e ~22 kb a monte del gene
LCT, rispettivamente all’interno degli introni 9 and 13 del gene adiacente MCM6
(MiniChromosome Maintenance 6), un enhancer del gene promoter LCT.
Gli alleli -13910*T e -22018*A sono associati rispettivamente al 100% e al 97% con il carattere
“Persistenza della Lattasi” nello studio della popolazione Finlandese, mentre il solo allele 13910*T è associato all’ ~86%-98% con la “Persistenza della lattasi” nelle altre popolazioni
Europee.
La variante europea -13910*T, correlata con la persistenza della lattasi (LP), è quasi inesistente
tra le popolazioni dell’Africa sub-Sahariana che mostrano tuttavia un’alta incidenza della LP. Uno
studio di associazione genotipo-fenotipo condotto nella popolazione africana (proveniente da
Tanzania, Kenia e Sudan) ha identificato altri 3 SNPs nel gene MCM6, associati con la persistenza
della lattasi, mentre la variante europea -13910 è quasi inesistente.
L’esatto meccanismo che sottosta alla ”Non persistenza della lattasi” non è ancora
completamente compreso.
In sintesi, il carattere “Persistenza della Lattasi” è collegato ad una trasmissione
autosomica dominante, essendo dominante il polimorfismo C/T*-13910 con l’allele C ( wild
type) legato alla diminuzione della espressione del mRNA della Lattasi.
Gli individui eterozigoti per lo SNP (genotipo CT) hanno un’attività lattasica intermedia e sono più
suscettibili all’intolleranza al Lattosio in caso di stress o di infezioni gastrointestinali.
Gli omozigoti adulti (genotipo CC) con una “Non persistenza della Lattasi” hanno livelli
impercettibili di Lattasi intestinale come risultato di down regulation dell’enzima sull’orletto a
spazzola dopo lo svezzamento.
27
LABORATORIO
1. ESTRAZIONE DI DNA DA MUCOSA BOCCALE
2. PCR LCT -13910
Primers:
5′-GCTGGCAATACAGATAAGATAATGGA-3′ (position 26611–26636)
5′-CTGCTTTGGTTGAAGCGAAGAT-3′
(position 26790–26811)
Reaction volume : 25 µL.:
Genomic DNA 1 µL, 1.5 mM MgCl2, Buffer, 0.2 mM di dNTP, 10 ρmol di ogni primer , 2.0
U di Taq DNA polymerase.
Amplification:
Iniziale denaturazione a 95 °C per 5 min
Denaturazione 35 cicli a 95 °C per 1 min
Annealing
a 59 °C per 1 min
Extension
a 72 °C per 1 min
Extension finale
a 72 °C per 5 min
3. DIGESTIONE
Il prodotto della PCR è digerito con l’enzima HinfI (0.25 U) a 37°C overnight
La sequenza genomica è …AAGATAATGGTAG C/T CCCTG….
HinfI taglia :
5'...G ANTC..3'
3'…CTNA G…..5'
La digestione del prodotto della PCR può dare:
- i prodotti dell’ allele T, 2 frammenti da 177 bp e 24 bp
- un unico prodotto dell’ allele C di 201 bp.
E’ previsto un controllo positivo ( PCR non digerita)
4. ELETTROFORESI SU GEL
soluzione 3% di gel Agaroso
CC GENOTYPE single band of 201 bp
 Ipolactasia
TT GENOTYPE
two bands of 177 and 24 bp
CT GENOTYPE three bands of 201 bp, 177 and 24 bp  normalactasia
Il frammento da 24 bp è molto piccolo e non si vede !
28
EVOLUZIONE
Significato adattativo in Europa e in Africa.
La tolleranza al Lattosio è un esempio di cambiamento evolutivo basato sulla selezione operata
nell’uomo appartenente ad una cultura pastorizia legata al consumo del latte. (Feldman and
Cavalli-Sforza, 1989). Evidenze archeologiche hanno (2003) dimostrato una correlazione tra la
frequenza della persistenza del gene della Lattasi e le regioni geografiche europee abitate fin dal
Neolitico ( 6400 A.C.) da allevatori di bestiame. Nel Nord Europa la persistenza della Lattasi è
comune e il consumo del latte non solo è molto diffuso, ma si è sempre considerato il latte come
un alimento importante dal punto di vista nutrizionale. Si sta comprendendo oggi come questo sia
accaduto. Una ipotesi spiega queste differenze genetiche nella popolazione in termini di un
vantaggio selettivo basato su una alimentazione arricchita di latticini.
Sebbene non ancora del tutto compresi, i vantaggi biologici della persistenza della Lattasi
probabilmente tengono conto della disponibilità giornaliera di una bevanda energetica e ricca di
Calcio che permette alla comunità di allevatori di far fronte anche ai raccolti modesti. Questa
capacità genetica di digerire il latte è stata vista come un classico esempio di coevoluzione genecultura.
L’ipotesi dell’assimilazione del Calcio è stata avanzata da Flatz and Rotthauwe secondo i quali la
persistenza della Lattasi è stata favorita nelle regioni a latitudine maggiore a causa dei livelli
ridotti di luce solare e quindi della insufficiente sintesi di vitamina D. La vitamina D è necessaria
per l’assorbimento del Calcio e il latte costituisce una buona sorgente alimentare di
entrambi.Inoltre, sono da considerare altri fattori positivi quali la possibiità di disporre con
regolarità di un cibo calorico e ricco di proteine e il fatto che il latte costituisce una sorgente di
liquidi incontaminata.
Studi epidemiologici mostrano che lo sviluppo della produzione dei latticini precede la selezione
del carattere “persistenza della Lattasi”. Siccome la produzione e l’uso dei latticini si fa risalire a
10.000 anni fa,la pressione selettiva si è manifestata solo per le ultime 400 generazioni. Malgrado
questo breve tempo,c’è una suggestiva evidenza della recente selezione positiva: la persistenza
della Lattasi è associata ad un aplotipo che è molto comune nei nordeuropei ed è distante
dall’aplotipo ancestrale.
La scoperta della base molecolare di questo SNP distante circa 14 kb dal gene, ha permesso
ulteriori analisi della variazione genetica associata con la persistenza/non persistenza della
Lattasi.
L’assenza dell’allele 13910*T nei campioni del Neolitico indica che i primi allevatori in Europa non
erano ancora adatti al consumo e alla digestione del latte. E’ improbabile che il consumo di latte
si sia diffuso in Europa prima della comparsa dell’allele 13910*T. Resta aperta una importante
questione riguardante la localizzazione geografica delle prime popolazioni che portavano l’allele
13910*T, il modo e la direzione della diffusione dell’allele, e la precisa natura dei vantaggi
selettivi conferiti dalla persistenza della Lattasi.
E’ probabile che i vantaggi conferiti da questi svariati fattori differiscano in Europa e in Africa.
Nelle popolazioni africane la capacità di digerire il latte nell’età adulta probabilmente è una
conseguenza non solo dell’adattamento al miglioramento dei benefici nutrizionali provenienti dal
latte (carboidrati,grassi,proteine e Calcio), ma anche dal fatto che il latte costituisce una
importante fonte di liquidi nelle regioni aride. Dal momento che tra i sintomi dell’intolleranza al
Lattosio c’è perdita di acqua in seguito a diarrea, gli individui che portavano gli alleli associati alla
persistenza della Lattasi e potevano tollerare il latte, manifestavano un maggior vantaggio
selettivo.
29
Diffusione
La frequenza della persistenza della Lattasi
 è alta nelle popolazioni nord-europee:
>90% negli Svedesi e nei Danesi
 diminuisce nell’Europa meridionale e nel Medio Oriente
~50% negli Spagnoli,, Francesi e popolazioni arabe dedite alla pastorizia
 è bassa negli Asiatici non allevatori di bestiame e negli Africani
~1% nei Cinesi, ~5%-20% negli Africani allevatori.
In Italia, la prevalenza dell’intolleranza al Lattosio varia ampiamente nelle regioni.
Nel Sud Italia e nelle isole, la frequenza è più del 70%. I Sardi, che sono una popolazione
geneticamnete isolata, manifestano la stessa associazione genetica dell’ipolattasia con la variante
C/T* -13910 simile ad altre popolazioni del NordEuropa.
Recenti studi mostrano che non esiste in Sardegna l’allele T/T, perciò la persistenza alla Lattasi è
sostenuta solo dagli allele C/T
BIBLIOGRAFIA
1.Single nucleotide polymorphism C/T-13910, located upstream of the lactase gene, associated
with adult-type hypolactasia: Validation for clinical practice
Rejane Mattar ⁎, Maria do Socorro Monteiro, Cibele Aparecida Villares,Aníbal Ferreira dos Santos, Flair José
Carrilho Department of Gastroenterology, University of São Paulo School of Medicine, São Paulo
2.Convergent adaptation of human lactase persistence in Africa and Europe.
Sarah A Tishkoff,1,9 Floyd A Reed,1,9 Alessia Ranciaro,1,2 Benjamin F Voight,3 Courtney C Babbitt,4 Jesse S Silverman,4 Kweli Powell,1 Holly M
Mortensen,1 Jibril B Hirbo,1 Maha Osman,5 Muntaser Ibrahim,5 Sabah A Omar,6 Godfrey Lema,7 Thomas
B Nyambo,7 Jilur Ghori,8 Suzannah Bumpstead,8 Jonathan K Pritchard,3 Gregory A Wray,4 and Panos Deloukas8
3.Frequency of LCT -13910C>T single nucleotide polymorphism associated with adult-type hypolactasia/lactase persistence among
Brazilians of different ethnic groups
Rejane Mattar, 1 Maria S Monteiro,1 Cibele A Villares,1 Aníbal F Santos,1 Joyce MK Silva,1 and Flair J Carrilho
4.The Origins of Lactase Persistence in Europe
Yuval Itan,1,4 Adam Powell,1,5 Mark A. Beaumont,2 Joachim Burger,3 and Mark G. Thomas1,5*
5.Tracing the distribution and evolution of lactase persistence in Southern Europe through the study of the
T(-13910) variant.
Anagnostou P, Battaggia C, Coia V, Capelli C, Fabbri C, Pettener D, Destro-Bisol G, Luiselli D. Dipartimento di Biologia Animale e dell'Uomo,
Università La Sapienza, Roma, Italy. A.Perino1,S.Cabras2,D.Obinu3,L.Cavalli Sforza4
6.Lactose intolerance:a non-allergic disorder often managed by allergologists
Margarida Coelho Æ Donata Luiselli Æ Giorgio Bertorelle Ana Isabel Lopes Æ Susana Seixas Giovanni Destro-Bisol Æ Jorge
Rocha
7. Microsatellite variation and evolution of human lactase persistence
Rejane Mattar,Maria do Socorro Monteiroa,Cibele Aparecida Villaresa,Aníbal Ferreira dos Santona and Flair José Carrilhoa
Lactose digestion and the evolutionary genetics of lactase
persistence
Catherine J. E. Ingram · Charlotte A. Mulcare ·
Yuval Itan · Mark G. Thomas · Dallas M. Swallow
30
GLOSSARIO
Allele: è una delle possibili forme o varianti in cui si puo' presentare un gene, con conseguenze
sulle caratteristiche espresse. Per ogni gene (ad un determinato locus sul cromosoma) esistono
due alleli, ereditati dal padre e della madre. Quando i due alleli sono uguali, l'individuo è definito
omozigote per quel specifico tratto; se gli alleli sono diversi, l'individuo è definito eterozigote.
Annealing (appaiamento)
complementarietà delle basi.
formazione di molecole ibride di acidi nucleici basata sulla
Elettroforesi tecnica che consente di separare molecole caricate elettricamente, mediante la
migrazione in un campo elettrico.
Enzima proteina che catalizza (accelera) una specifica reazione chimica di una via metabolica in
un sistema vivente. Ha azione specifica, in quanto riconosce il substrato su cui agire. Enzimi di
restrizione chiamati anche endonucleasi di restrizione o “forbici” molecolari : sono enzimi che
tagliano il DNA a doppia elica (e non quello a singolo filamento!) in corrispondenza di specifiche
sequenze nucleotidiche, dette siti di restrizione
Fenotipo insieme delle caratteristiche visibili di un organismo, che risultano dall’interazione tra
genotipo e ambiente.
Frammenti di restrizione frammenti provenienti da una molecola di DNA più lunga per
digestione con enzimi di restrizione
Gene unità ereditaria funzionale corrispondente generalmente al segmento di DNA che codifica
una proteina.
Genoma patrimonio genetico di una cellula o di un organismo.
Genotipo costituzione genetica di un organismo
Linkage Equilibrium indica una combinazione casuale di alleli a loci associati
Linkage disequilibrium indica una combinazione non casuale di alleli a loci associati
Isoforma Un tempo si riteneva che ogni gene codificasse per un unico prodotto polipeptidico o
molecola di RNA, mentre oggi si sa che la maggioranza di geni umani specifica 2 o più forme
alternative di proteine
Locus ( plurale loci) posizione fissa su un cromosoma occupata da un dato gene. Nel liguaggio
comune il termine viene spesso usato come sinonimo di gene
Marcatore genetico
nell’analisi genetica
qualsiasi differenza fenotipica, controllata geneticamente, utilizzata
Oligonucleotide corta molecola di DNA (o RNA) a singolo filamento, costituita da poche decine
di basi, ottenuta artificialmente e utilizzata in esperimenti di ibridazione molecolare e nella PCR
PCR (polymerase chain reaction) tecnica di biologia molecolare utilizzata per amplificare in breve
tempo segmenti specifici di DNA
Polimorfismo esistenza di forme diverse di: alleli (polimorfismo allelico), proteine (polimorfismo
proteico), DNA (polimorfismo del DNA). ciascuno dei quali con una frequenza di almeno 1%.
Polimorfismo della lunghezza dei frammenti di restrizione (RFLP)
Restriction Fragment Length Polymorphism (lunghezza variabile dei frammenti di restrizione).
31
Polimorfismo del DNA, che si evidenzia trattando cromosomi
Determinato da una differenza di una base tra due DNA
presenza o assenza di un sito di restrizione per uno specifico
quindi frammenti di diversa lunghezza dopo trattamento con
omologhi con enzimi di restrizione.
omologhi, differenza che causa la
enzima di restrizione, e
quell’enzima
Primer corta catena polinucleotidica, a DNA o RNA, alla quale vengono aggiunti nuovi
nucleotidi nel corso della sintesi di DNA. Noto anche con il termine di innesco. Nella PCR si
utilizza una coppia di primer
Promotore regione del DNA a cui si lega la RNA-polimerasi per avviare la trascrizione del
gene(cioè la sintesi dell'RNA-messaggero). Funziona come un "interruttore molecolare" che
"accende" o "spegne" il gene. regioni di controllo sequenze del DNA che attivano e regolano
l'espressione di un gene. La loro presenza è pertanto necessaria per la corretta e efficace
espressione del gene.
RNA-messaggero (mRNA) copia a singolo filamento della sequenza nucleotidica di un gene, che
trasporta ai ribosomi l'informazione per la sintesi (traduzione) della proteina corrispondente
Splicing del RNA processo in cui le sequenze introniche sono eliminate dai trascritti primari di
RNA nel nucleo durante la trascrizione, per dar luogo alla produzione di molecole di mRNAmaturo.
Splicing alternativo assemblaggio differenziale di esoni durante la maturazione dell’RNA.
Si stima che più del 60% dei geni umani produca 2 o più proteine mediante questo meccanismo.
Molti esoni specificano domini proteici strutturali distinti che possono essere
combinati in modo diverso nelle cellule dei diversi tessuti nei quali il gene è espresso..si
ottengono così isoforme tessuto-specifiche
Sequenze palindromiche sequenza nucleotidica che è identica al suo filamento complementare
quando entrambi vengono letti nella stessa direzione chimica (es 5'-->3'). Esempio GATC
Siti di restrizione
sequenza di basi ben determinata riconosciuta e tagliata dagli enzimi di
restrizione in modo da lasciare corte sequenze a singola elica, dette estremità coesive
poiché le loro basi sono complementari.
Guida per lo studente
Background
Conoscenze propedeutiche
Le malattie ereditarie monogeniche sono determinate da mutazioni in singoli geni che si
trasmettono nelle famiglie secondo leggi ben definite scoperte dall’abate Gregorio
Mendel nella seconda metà dell’Ottocento. Per questo motivo le malattie monogeniche
o monofattoriali vengono anche chiamate“mendeliane”. In particolare bisogna
ricordare che:
I geni possono avere alleli diversi (varianti alternative di uno stesso gene) ossia
essere polimorfici;
Gli organismi diploidi hanno due copie di ogni gene, cioè due alleli. Se i due alleli sono
uguali, l’individuo è omozigote (ad es, ha genotipo AA oppure aa). Se i due alleli sono
diversi, l’individuo è eterozigote (ad es, il genotipo è Aa)
32
La I legge di Mendel o legge dell’uniformità della prima generazione ibrida, afferma
che l’incrocio tra individui della generazione parentale ciascuno omozigote per due alleli
diversi di uno stesso gene (ad es, AA x aa) e che quindi differisce dall’altro genitore per
una caratteristica (ad es, pelo nero o marrone), dà una progenie costituita da individui
tutti identici tra loro (tutti eterozigoti; ad es, Aa);
Durante la meiosi i due alleli di un gene segregano e si distribuiscono ciascuno in un
gamete apolide (II legge di Mendel, legge della segregazione).
Un individuo omozigote produce un solo tipo di gamete (A oppure a) relativamente a un
dato locus (la posizione occupata da un gene in un cromosoma).
Un individuo eterozigote produce due tipi di gameti (A e a) in ugual quantità, cioè in
rapporto 50% ciascuno. Una buona rappresentazione grafica della segregazione si
ottiene costruendo il “quadrato di Punnett”.
Alleli appartenenti a geni diversi localizzati su cromosomi diversi segregano in modo
indipendente (III legge di Mendel, legge della segregazione indipendente).
Allele dominante: allele che si manifesta allo stato eterozigote;
Allele recessivo: allele mascherato dall’allele dominante, che si manifesta solo allo
stato omozigote;
Allele codominante: due alleli entrambi espressi allo stato eterozigote, che agiscono
sul fenotipo in modi indipendenti e distinguibili. Un esempio classico si ha nel caso degli
alleli IA e IB del gruppo sanguigno ABO.
L’1% circa dei neonati è affetto da una malattia genetica monogenica. La mutazione
genica è presente fin dal concepimento, quindi anche alla nascita, anche se non sempre
si manifesta fenotipicamente alla nascita. Alcune di queste malattie comportano
conseguenze già apprezzabili nel neonato. Altre malattie monogeniche si manifestano,
invece, durante le età successive della vita. La corea di Huntington, ad esempio, è una
malattia genetica a insorgenza tardiva che si manifesta solo in età adulta.
Si definisce malattia autosomica quella in cui l’allele malato è presente nelle coppie di
cromosomi non coinvolti nella determinazione del sesso, gli autosomi; si parla invece di
malattia legata all’X quella in cui l’allele si trova nel cromosoma sessuale X. In
questo caso la trasmissione segue modalità particolari in quanto la maggior parte dei
geni rappresentati sul cromosoma X non sono rappresentati sul cromosoma Y. Il
cromosoma Y, infatti, è molto più piccolo e contiene quasi esclusivamente i geni per la
determinazione del sesso.
Per schematizzare:
• malattie autosomiche: se l’allele normale è dominante, la malattia si rende
manifesta solo nella condizione omozigote recessiva, ossia negli individui in cui entrambi
gli alleli del gene sono alterati (malattia autosomica recessiva); se invece è l’allele
alterato a prevalere su quello sano, la malattia si rende sempre evidente, anche nella
condizione eterozigote, ossia è sufficiente che uno solo dei due alleli sia alterato per
avere la malattia (malattia autosomica dominante)
• malattie legate all’X: se l’allele è recessivo,come nella maggior parte dei casi, i
maschi ricevono l’X difettoso dalla madre, ma non possono bilanciarlo con un allele sano
nell’Y in quanto questo cromosoma non contiene l’allele corrispondente; le femmine
invece manifestano la malattia solo nelle condizione omozigote. Di conseguenza, la
frequenza delle malattie recessive legate al cromosoma X è maggiore nei maschi
che nelle femmine. Nel caso di malattie dominanti le femmine manifestano la malattia
anche nella condizione eterozigote.
33
34