Trasparenze - the Netgroup at Politecnico di Torino

GRUPPO TELECOM ITALIA
Seminario Politecnico di Torino
Evoluzione di meccanismi di protezione nelle reti
geografiche IP/MPLS
GRUPPO TELECOM ITALIA
Sommario
Caratteristiche di un backbone IP/MPLS
Funzionalità di protezione del traffico a livello di rete
Fast Convergence
MPLS-TE Fast Reroute
IP Fast Rerouting
Funzionalità di protezione del traffico a livello di apparato
CONFIDENZIALE – Tutti i dirirtti riservati
Graceful Restart
Non-stop Routing
Daniele Accetta –
Carlo Cavazzoni
2
GRUPPO TELECOM ITALIA
Topologia di un backbone IP
Milano
Torino
Bari
CONFIDENZIALE – Tutti i dirirtti riservati
Backbone
Roma
Daniele Accetta –
Carlo Cavazzoni
3
GRUPPO TELECOM ITALIA
Lo stato dell’arte dei router di backbone
Milano
Cisco CRS-1
Bari
Roma
Juniper T640
Front View
Craft Interface
8 Flexible PIC
Concentrator slots
Customer facing
PICs
Rear View
Air Filters
2 x RE 4
CONFIDENZIALE – Tutti i dirirtti riservati
Torino
4+1
Redundant
SIBs
Craft Interface
Connectors
Air Filters
Power Entry
Modules
Fans
Daniele Accetta –
Carlo Cavazzoni
4
GRUPPO TELECOM ITALIA
Architettura interna di un router di backbone
Routing Engine Routing Engine
FPC
FPC
PIC
PIC
PIC
FPC
PIC
CONFIDENZIALE – Tutti i dirirtti riservati
FPC
Switching
Fabric
Juniper T640
Separazionetra
trapiano
pianodidicontrollo
controllo
Separazione
pianodidiforwarding
forwarding
eepiano
Cisco CRS-1
Daniele Accetta –
Carlo Cavazzoni
5
GRUPPO TELECOM ITALIA
Interconnessioni geografiche: IP over DWDM
Milano
Torino
Bari
Roma
Daniele Accetta –
Carlo Cavazzoni
Presente
Futuro ?
Transponder +
Transponder +
Transponder integrato +
Multiplexer DWDM
Optical Digital Crossconnect +
Optical Crossconnect +
Multiplexer DWDM
Multiplexer DWDM
CONFIDENZIALE – Tutti i dirirtti riservati
Passato
6
GRUPPO TELECOM ITALIA
CONFIDENZIALE – Tutti i dirirtti riservati
Classificazione delle tipologie di guasto
Fonte: “Characterization of Failures in an IP Backbone”, 2004
Daniele Accetta –
Carlo Cavazzoni
7
GRUPPO TELECOM ITALIA
Strategie per proteggere il traffico in caso di guasto
livellodidi apparato,
apparato, ridondando
ridondando lele parti
parti comuni
comuni ed
ed implementando
implementando meccanismi
meccanismi
•• AAlivello
efficientididiswitchover
switchover
efficienti
livellodidirete,
rete,offrendo
offrendopercorsi
percorsialternativi
alternativied
edimpiegando
impiegandomeccanismi
meccanismiefficienti
efficienti
•• AAlivello
perre-instradare
re-instradarerapidamente
rapidamenteililtraffico
trafficoinincaso
casodidiguasto
guasto
per
Link Failure
CONFIDENZIALE – Tutti i dirirtti riservati
Node Failure
L’impatto
L’impattosul
sulPiano
PianodidiForwarding
Forwardingèèinevitabile
inevitabile
Protezione
Protezionetramite
tramitemeccanismi
meccanismiaalivello
livellodidirete
rete
Linecard Failure
RP Failure
SW Upgrade
Daniele Accetta –
Carlo Cavazzoni
Guasti
Guastieeupgrade
upgraderelativi
relativialalsolo
soloPiano
PianodidiControllo
Controllonon
non
devono necessariamente
necessariamente avere
avere ricadute
ricadute sul
sul Piano
Piano didi
devono
Forwarding
Forwarding
Protezione
Protezione tramite
tramite meccanismi
meccanismi aa livello
livello didi apparato
apparato
(conalcune
alcuneeccezioni)
eccezioni)
(con
8
GRUPPO TELECOM ITALIA
CONFIDENZIALE – Tutti i dirirtti riservati
Funzionalità a livello di rete
Daniele Accetta –
Carlo Cavazzoni
9
GRUPPO TELECOM ITALIA
Caratteristiche generali
Consiste nel progettare la rete in modo tale che esistano percorsi
alternativi utilizzabili per “aggirare” la risorsa (link o nodo) guasta
Occorre garantire che i percorsi di backup abbiano sufficiente capacità
disponibile per gestire il traffico da proteggere (in aggiunta a quello
nominale)
Il meccanismo di re-instradamento “base” è costituito dai protocolli di
routing IP
Daniele Accetta –
Carlo Cavazzoni
10
CONFIDENZIALE – Tutti i dirirtti riservati
È necessario un meccanismo rapido per re-instradare il traffico sul
percorso di backup
GRUPPO TELECOM ITALIA
Esempio di re-instradamento IP
Milano
Torino
Bari
M1
T2
M2
B1
CONFIDENZIALE – Tutti i dirirtti riservati
B2
T1
Roma
Daniele Accetta –
Carlo Cavazzoni
11
GRUPPO TELECOM ITALIA
Esempio di re-instradamento IP
Milano
Torino
Bari
M1
T2
M2
B1
CONFIDENZIALE – Tutti i dirirtti riservati
B2
T1
Roma
Daniele Accetta –
Carlo Cavazzoni
12
GRUPPO TELECOM ITALIA
Esempio di re-instradamento IP
Milano
Torino
Bari
M1
T2
•Rilevamento
•Notifica
•Ricalcolo SPF
T1
M2
B1
B2
CONFIDENZIALE – Tutti i dirirtti riservati
•Aggiornamento RT
Roma
Daniele Accetta –
Carlo Cavazzoni
13
GRUPPO TELECOM ITALIA
Esempio di re-instradamento IP
Milano
Torino
Bari
M1
T2
M2
B1
CONFIDENZIALE – Tutti i dirirtti riservati
B2
T1
Roma
Daniele Accetta –
Carlo Cavazzoni
14
GRUPPO TELECOM ITALIA
Esempio di re-instradamento IP
Milano
Torino
Bari
M1
T2
M2
B1
CONFIDENZIALE – Tutti i dirirtti riservati
B2
T1
Roma
Daniele Accetta –
Carlo Cavazzoni
15
GRUPPO TELECOM ITALIA
Architettura di routing di un backbone IP
Utilizzocongiunto
congiuntodidiun
unprotocollo
protocollodidirouting
routingIGP
IGP(OSPF
(OSPFooISIS)
ISIS)eedel
delprotocollo
protocollointernal
internalBGP
BGP
•• Utilizzo
protocolloIGP
IGPèèresponsabile
responsabiledella
dellamutua
mutuaraggiungibilità
raggiungibilitàtra
trai inodi
nodiinterni
internialla
allarete
rete
•• IlIlprotocollo
protocolloiBGP
iBGPtrasporta
trasportai iprefissi
prefissiassegnati
assegnatiaiaiclienti
clienti
•• IlIlprotocollo
Y via D
IBGP
OSPF/ISIS
C
D
B
CONFIDENZIALE – Tutti i dirirtti riservati
A
Y via D
C
Net X
A
Cliente
Daniele Accetta –
Carlo Cavazzoni
Int POS 1/1
B
Net Y
D
Cliente
16
GRUPPO TELECOM ITALIA
Evoluzione del re-instradamento a livello IP
Fast Convergence
1)
Ridurre i tempi di convergenza dei protocolli di routing per ridurre i tempi
di re-instradamento
MPLS Fast Reroute
Impiego del principio di “local repair” ed utilizzo di tunnel MPLS Traffic
Engineering
CONFIDENZIALE – Tutti i dirirtti riservati
2)
IP Fast Rerouting
3)
Impiego del principio di “local repair” ma mantenimento del routing hopby-hop (no tunnel)
Daniele Accetta –
Carlo Cavazzoni
17
GRUPPO TELECOM ITALIA
CONFIDENZIALE – Tutti i dirirtti riservati
Fast Convergence
Daniele Accetta –
Carlo Cavazzoni
18
GRUPPO TELECOM ITALIA
CONFIDENZIALE – Tutti i dirirtti riservati
Il processo di re-instradamento
Daniele Accetta –
Carlo Cavazzoni
19
GRUPPO TELECOM ITALIA
Riduzione dei tempi di convergenza
Per ridurre i tempi di convergenza occorre agire su tutti i contributi
Utilizzare hardware migliore (CPU più veloci)
Ottimizzare l’implementazione software
Tale obiettivo è stato perseguito dai costruttori inserendo alcuni timer
(talvolta dell’ordine di secondi) tra la ricezione delle informazioni
relative ad un nuovo evento e l’esecuzione della conseguente azione da
parte del processo di routing
Daniele Accetta –
Carlo Cavazzoni
20
CONFIDENZIALE – Tutti i dirirtti riservati
L’implementazione standard dei protocolli IGP ha, tra i principali
obiettivi, quello di filtrare eventuali condizioni di instabilità che possono
verificarsi in rete
GRUPPO TELECOM ITALIA
Fast Convergence
Tutti i principali costruttori
implementazioni software
stanno
migliorando
le
proprie
Alcuni offrono la possibilità di intervenire sui principali timer OSPF/ISIS
riducendone il valore
configurando un algoritmo di exponential backoff
Con il termine Fast Convergence si indica genericamente l’obiettivo di
contenere i tempi di re-instradamento del traffico al di sotto di 1 sec
La maggior parte delle ottimizzazioni riguarda i protocolli IGP, ma
occorre tenere presente che gran parte del traffico è destinata verso
prefissi BGP
Daniele Accetta –
Carlo Cavazzoni
21
CONFIDENZIALE – Tutti i dirirtti riservati
La riduzione dei timer può consentire di rendere più reattivo il protocollo
e ridurre di conseguenza i tempi di convergenza in caso di guasto
GRUPPO TELECOM ITALIA
Effetti sulla stabilità
La riduzione del valore dei timer che regolano il funzionamento del
protocollo IGP può comportare un aumento della instabilità all’interno
della rete.
In particolare:
la riduzione dei timer relativi alla SPF computation può causare un aumento del
numero di esecuzioni dell’algoritmo di calcolo degli instradamenti
Ciò può tradursi in un eccesso di traffico di routing e di eccessiva contesa
nell’uso della CPU da parte di più processi concorrenti
Daniele Accetta –
Carlo Cavazzoni
22
CONFIDENZIALE – Tutti i dirirtti riservati
la riduzione dei timer relativi alla LSA origination ed al flooding può causare un
aumento del numero di messaggi di routing che circolano all’interno della rete
GRUPPO TELECOM ITALIA
Contributi al processo di convergenza di un protocollo IGP
Aggiornamento della
tabella di forwarding sul
processore e sulle
linecard
Daniele Accetta –
Carlo Cavazzoni
23
CONFIDENZIALE – Tutti i dirirtti riservati
Alcuni contributi
contributi temporali
temporali alal processo
processo didi convergenza
convergenza sono
sono particolarmente
particolarmente
Alcuni
significativieenon
nonconsentono
consentonodidiottenere
otteneretempi
tempiinferiori
inferioriaa400-500
400-500ms
ms
significativi
GRUPPO TELECOM ITALIA
CONFIDENZIALE – Tutti i dirirtti riservati
MPLS-TE Fast Reroute
Daniele Accetta –
Carlo Cavazzoni
24
GRUPPO TELECOM ITALIA
Caratteristiche di base
Richiede la presenza di MPLS Traffic Engineering: magliatura di tunnel
“principali”
È una tecnica di protezione, in quanto il percorso di backup è
completamente calcolato e instaurato prima che si verifichi l’evento di
guasto
Consente di ottenere tempi di re-instradamento contenuti entro 50-100
ms
È un meccanismo temporaneo, utilizzato fintantochè non sono stati
ricalcolati i percorsi ottimali
Daniele Accetta –
Carlo Cavazzoni
25
CONFIDENZIALE – Tutti i dirirtti riservati
È una tecnica di recovery locale, a differenza della riconvergenza del
protocollo IGP che agisce invece globalmente
GRUPPO TELECOM ITALIA
Link e Node Protection
NHOP Backup tunnel
R1
R3
NNHOP Backup tunnel
R1
R2
R4
R6
R2
R5
R7
R3
R4
R5
• Node protection: il tunnel di
backup termina a due hop di
distanza dal nodo PLR
R8
R9
Daniele Accetta –
Carlo Cavazzoni
26
CONFIDENZIALE – Tutti i dirirtti riservati
• Link protection: il tunnel di
backup termina ad un hop di
distanza dal nodo PLR (Point
of Local Repair)
GRUPPO TELECOM ITALIA
Bypass tunnel
L’impiego della tecnica del BYPASS tunnel fa leva sulla possibilità di annidare
gerarchicamente più LSP (stack di label)
Protezione di tipo 1:N: consente di ridurre il numero di tunnel utilizzati
Backup tunnel
R3
R4
R5
Protected tunnels
PLR
R1
CONFIDENZIALE – Tutti i dirirtti riservati
Fast reroutable
LSPs
MP
R6
R7
R8
NON Fast
reroutable LSPs
R9
Daniele Accetta –
Carlo Cavazzoni
27
GRUPPO TELECOM ITALIA
Instradamento dei tunnel principali
Milano
Torino
Bari
CONFIDENZIALE – Tutti i dirirtti riservati
tunnel per
per nodo
nodo xx 22
66 tunnel
nodi per
per PoP
PoP xx 44 PoP
PoP
nodi
48 tunnel
tunnel
== 48
Roma
Daniele Accetta –
Carlo Cavazzoni
28
GRUPPO TELECOM ITALIA
Tunnel di backup: link protection
Milano
Torino
CONFIDENZIALE – Tutti i dirirtti riservati
Bari
NHOPbackup
backuptunnel
tunnel
NHOP
Roma
Daniele Accetta –
Carlo Cavazzoni
29
GRUPPO TELECOM ITALIA
Tunnel di backup: node protection
Milano
Torino
CONFIDENZIALE – Tutti i dirirtti riservati
Bari
NNHOPbackup
backuptunnel
tunnel
NNHOP
Roma
Daniele Accetta –
Carlo Cavazzoni
30
GRUPPO TELECOM ITALIA
FRR senza Traffic Engineering
Nel caso in cui non si utilizzino tecniche di Traffic Engineering, è possibile ridurre
il numero di tunnel, evitando il full-mesh end-to-end
R1
R4
R2
R6
R9
Daniele Accetta –
Carlo Cavazzoni
R7
CONFIDENZIALE – Tutti i dirirtti riservati
R3
One-hop
Protected LSP
R8
NHOP backup tunnel
31
GRUPPO TELECOM ITALIA
CONFIDENZIALE – Tutti i dirirtti riservati
IP Fast Rerouting
Daniele Accetta –
Carlo Cavazzoni
32
GRUPPO TELECOM ITALIA
Obiettivo
L’obiettivo consiste nell’ottenere tempi di re-instradamento di 50-100
ms senza ricorrere a MPLS-TE, al fine di evitare i problemi di
configurazione e gestione della magliatura di tunnel
Occorre rimuovere i contributi che impediscono ai protocolli di routing di
convergere rapidamente:
CONFIDENZIALE – Tutti i dirirtti riservati
Azione di recovery locale
Precalcolo di un percorso alternativo e FIB update
Daniele Accetta –
Carlo Cavazzoni
33
GRUPPO TELECOM ITALIA
IP Fast Rerouting: caratteristiche
L’azione di recovery è intrapresa dal nodo a monte del link o del nodo
guasto
Il traffico è re-instradato verso un next-hop alternativo, pre-calcolato e
pre-installato nel piano di forwarding
In tal modo si riduce notevolmente il tempo di re-instradamento: infatti
è subito disponibile nel piano di forwarding un next-hop alternativo
verso cui inoltrare il traffico
IPFRR applica lo stesso principio di MPLS-TE Fast Reroute ma, non
utilizzando tunnel, deve risolvere il problema dei routing loop
Daniele Accetta –
Carlo Cavazzoni
34
CONFIDENZIALE – Tutti i dirirtti riservati
Analogamente alla funzionalità Equal Cost MultiPath, permette di avere
più percorsi per ogni destinazione nella tabella di forwarding
GRUPPO TELECOM ITALIA
Loop Free Alternate: il principio di base
Loop-free alternate è la più semplice tecnica di IP Fast Rerouting ma
anche quella più promettente
Il next-hop alternativo è considerato valido se soddisfa la seguente
condizione:
Distance_opt(N,D) < Distance_opt(N,R) + Distance_opt(R,D)
Tale tecnica non è applicabile in alcune topologie di rete (o porzioni di
esse), dove la disuguaglianza non è mai verificata
Daniele Accetta –
Carlo Cavazzoni
35
CONFIDENZIALE – Tutti i dirirtti riservati
Dove R è il nodo che sta effettuando il calcolo, N è il candidato next-hop
alternativo e D è la destinazione del traffico
GRUPPO TELECOM ITALIA
Loop Free Alternate: un esempio
Re-instradamento basato
sulla tecnica LFA
Situazione in seguito alla
riconvergenza del protocollo
IGP
Daniele Accetta –
Carlo Cavazzoni
36
CONFIDENZIALE – Tutti i dirirtti riservati
Instradamento del traffico
in assenza di guasti
GRUPPO TELECOM ITALIA
Loop Free Alternate: analisi
I LFA sono semplici da calcolare
Versione “node based”
richiede meno risorse elaborative, ma ha copertura topologia minore
Versione “prefix based”
richiede più risorse elaborative, ma ha copertura maggiore
Applicabile su topologie “meshed”
non sempre applicabile in topologie reali degli ISP
studi hanno dimostrato che è applicabile al 70-85% delle topologie reali
degli ISP
Non richiede interoperabilità tra i nodi
Daniele Accetta –
Carlo Cavazzoni
37
CONFIDENZIALE – Tutti i dirirtti riservati
Supporta anche MPLS senza la necessità di estensioni ai protocolli
GRUPPO TELECOM ITALIA
CONFIDENZIALE – Tutti i dirirtti riservati
Funzionalità a livello di apparato
Daniele Accetta –
Carlo Cavazzoni
38
GRUPPO TELECOM ITALIA
Ridondanza del Piano di Controllo
I router di fascia alta sono caratterizzati da un’architettura distribuita:
Un disservizio al Piano di Controllo non necessariamente coinvolge il
Piano di Forwarding: il router potrebbe continuare ad inoltrare il traffico.
Il problema dello switchover tra processori
Occorre preservare le adiacenze e le sessioni stabilite dai
protocolli di routing, senza causare oscillazioni dei prefissi
annunciati
Daniele Accetta –
Carlo Cavazzoni
39
CONFIDENZIALE – Tutti i dirirtti riservati
Separazione tra Piano di Controllo (operazioni di segnalazione e gestione) e
Piano di Forwarding (inoltro del traffico).
GRUPPO TELECOM ITALIA
Ridondanza dei Route Processor
Attualmente l’affidabilità è ottenuta mediante ridondanza hardware (due
processori)
I meccanismi di High Availability permettono di gestire al meglio la
ridondanza del processore, al fine di garantire impatti nulli sul traffico e
sulla stabilità della rete in seguito ad uno Switchover.
Daniele Accetta –
Carlo Cavazzoni
40
CONFIDENZIALE – Tutti i dirirtti riservati
In presenza di una coppia di processori, un guasto al processore attivo
provoca il passaggio del controllo al processore in standby (procedura di
Switchover) causando disservizio al traffico.
GRUPPO TELECOM ITALIA
Le alternative disponibili attualmente
Non-stop Routing
Estensione dei protocolli di
routing
e
segnalazione
e
cooperazione con i router
adiacenti
Le informazioni di stato necessarie a
mantenere attivo il Piano di Controllo
durante lo switchover sono mantenute
sincronizzate anche sul processore di
backup
CONFIDENZIALE – Tutti i dirirtti riservati
Graceful Restart
Daniele Accetta –
Carlo Cavazzoni
41
GRUPPO TELECOM ITALIA
Strategie per la gestione della ridondanza del RP
Non-stopRouting
Routing(Avici,
(Avici,Chiaro)
Chiaro)
Non-stop
“Sonoancora
ancoraqui”
qui”
“Tornerò”
“Tornerò”
“Sono
I nodi
nodi vicini
vicini non
non sisi accorgono
accorgono
I nodi
nodi vicini
vicini sono
sono consapevoli
consapevoli I
I
dell’operazionedidiswitchover
switchover
dell’operazionedidiswitchover
switchover
dell’operazione
dell’operazione
Le adiacenze/sessioni
adiacenze/sessioni rimangono
rimangono
Leadiacenze/sessioni
adiacenze/sessionisono
sonomantenute
mantenute Le
Le
stabili
attive durante
durante lolo switchover
switchover (per
(per un
un
attive
stabili
tempoprestabilito)
prestabilito)
tempo
Ilforwarding
forwarding prosegue
prosegue senza
senza soluzione
soluzione
Il
continuità
Il nodo
nodo che
che effettua
effettua lolo switchover
switchover
Il
didicontinuità
continua aa inoltrare
inoltrare traffico
traffico (non-stop
(non-stop
continua
forwarding)
forwarding)
I nodi
nodi vicini
vicini aiutano
aiutano ilil nodo
nodo inin
I
switchover
ad
aggiornare
switchover
ad
aggiornare
lele
informazionididirouting
routing
informazioni
Daniele Accetta –
Carlo Cavazzoni
42
CONFIDENZIALE – Tutti i dirirtti riservati
GracefulRestart
Restart(Cisco,
(Cisco,Juniper)
Juniper)
Graceful
GRUPPO TELECOM ITALIA
CONFIDENZIALE – Tutti i dirirtti riservati
Esempio Graceful Restart: OSPF
Daniele Accetta –
Carlo Cavazzoni
43
GRUPPO TELECOM ITALIA
CONFIDENZIALE – Tutti i dirirtti riservati
Esempio Non-stop Routing: Chiaro Networks
Daniele Accetta –
Carlo Cavazzoni
44
GRUPPO TELECOM ITALIA
Daniele Accetta –
Carlo Cavazzoni
(1)
(2)
(3)
(4)
CONFIDENZIALE – Tutti i dirirtti riservati
Esempio Non-stop Routing: Avici
45
GRUPPO TELECOM ITALIA
Conclusioni
Vantaggi:
Vantaggi:
approccio seguito
seguito dai
dai principali
principali
approccio
costruttori(realizzazione
(realizzazionepiù
piùsemplice)
semplice)
costruttori
Svantaggi:
Svantaggi:
necessitàdidiapplicare
applicarei imeccanismi
meccanismididi
necessità
HAper
pertutti
tuttii iprotocolli
protocolliutilizzati
utilizzati
HA
esistono alcune
alcune implementazioni
implementazioni
esistono
proprietarie
proprietarie
Daniele Accetta –
Carlo Cavazzoni
Non-stopRouting
Routing
Non-stop
Vantaggi:
Vantaggi:
non
non richiede
richiede nè
nè estensioni
estensioni aiai
protocolliesistenti
esistentinè
nèinteroperabilità
interoperabilità
protocolli
tradiverse
diverseimplementazioni
implementazioni
tra
Svantaggi:
Svantaggi:
soluzione
soluzione poco
poco diffusa
diffusa ee ritenuta
ritenuta inin
generedidicomplessa
complessarealizzazione
realizzazione
genere
46
CONFIDENZIALE – Tutti i dirirtti riservati
GracefulRestart
Restart
Graceful