Download PDF: RFO Network Outage

INCIDENT REPORT
1. Situatie
Tijd van het incident
Tijd van herstel
Gerapporteerd door
Omschijving
1.1




14-05-2014 22:05 (GMT+2)
14-05-2014 23:00 (GMT+2)
Daniel van Wijnen
Netwerk verstoring
Incident id
20140514A
Verloop van het incident
22:05 Monitoring geeft storing aan van een deel van de servers en diensten in het Denit netwerk.
22:15 De storing wordt geïdentificeerd als een layer 2 loop. Er is een storing in één van de drie
spanning-tree domains.
22:37 Om de loop te doorbreken, worden redundante verbindingen op een switch ontkoppeld.
Het netwerk wordt op enkele specifieke maatwerkdiensten na bereikbaar.
23:00 Connectiviteit voor resterende diensten wordt hersteld.
1.2
Root Cause
Er is verkeerde spanning-tree informatie in het spanning-tree domain geadverteerd. Hierdoor is
een layer 2 loop ontstaan.
2. Maatregelen
2.1
Acties
Er is een tijdelijke workaround geïmplementeerd om herhaling te voorkomen. De
oorspronkelijk situatie zal worden hersteld in een maintenance window.
2.2
Preventie
Het gedeelte van het netwerk waarbij spanning-tree wordt gebruik, zal worden vervangen door
een stack van switches, deze techniek is ook bekend onder de naam Virtual Chassis en MCT.
Door deze techniek is geen spanning-tree meer benodigd om redundantie te bereiken.
2.3
-
Conclusie
Er is een layer 2 loop ontstaan;
Er werd onjuiste spanning-tree informatie geadverteerd;
Er is downtime of verminderde performance op een gedeelte van het Denit netwerk geweest;
INCIDENT REPORT
2
Versie 1.0