Generali GDPS MGM-Ernst Lennartz

GDPS/MGM Implementierung
Überblick
GDPS Kundentag 23.04.2015
Ralf Zantopp, Generali Infrastructure Service S.c.a.r.l, Aachen
Ernst Lennartz, IBM,TSS Client Software Services Mainframe
Agenda
1
Ausgangssituation
2
Projektauftrag
3
Umsetzung
4
Generali France
Agenda
1
2
3
4
Ausgangssituation
4
Generali Deutschland Group
GD-Informatik als zentraler IT-Dienstleister der GD Gruppe
Generali Deutschland Holding
Generali Versicherungen
Generali Deutschland Informatik Services
Generali Deutschland Services
Generali Deutschland Schadenmanagement
Corporate Communication
Allgemeines
GDPS/PPRC Anwender seit 2005
Policy
PrimaryFailure
PPRCFailure
= SWAP,GO
= GO
4 unplanned Hyperswaps
2 unplanned CPU Ausfälle
Typische DR - Test recovery Zeit < 1,5 h (kontrollierter STOP/START)
GDPS/MGM 3.11
GDPS/PPRC 3.11
GIS System z Hardwarelandschaft vor Projektbeginn
IVZ1
IVZ2
Virtual Tape System
2 x TS7740
28 TB
EC12 2827-715
15 CP
3 zIIP
16.994 MIPS
448 GB RAM
zBX
Mod 002
7 Power
1 DPXI50z
Storage System
DS8870
512 GB Cache
393 TB RAW
247 TB CKD
12 TB FBA
53 TB Flashcopy
1 x TS3500 System Storage Tape Library
(2532 Tape Slots)
34 x TS1130 System Storage Tape Drive
(1890 Tapes @ 1TB)
PPRC MM with GDPS
control
EC12 2827-705
Ext. CF
5 ICF
64 GB RAM
EC12 2827-715
15 CP
3 zIIP
16.994 MIPS
448 GB RAM
zBX
Mod 002
6 Power
2 DPXI50z
Virtual Tape System
2 x TS7740
28 TB
EC12 2827-705
Ext. CF
5 ICF
64 GB RAM
Storage System
DS8870
512 GB Cache
345 TB RAW
212 TB CKD
12 TB FBA
1 x TS3500 System Storage Tape Library
(2161 Tape Slots)
28 x TS1130 System Storage Tape Drive
(1876 Tapes @ 1TB)
GIS System
z Sysplex
Layout
GIS System
z Sysplex
Layout
Beschreibung
IVZ I
SYSPLEX
A
Deutschland
Mips
Mips
DASD
IVZ1
IVZ2
TB
14.730
12.040
130
15 LPARs
IVZ II
• Symetrische Hardware in beiden
IVZs.
• Abstand zwischen den beiden
unabhängigen Gebäuden ca. 200
Meter
• 6 Sysplexe (4 PS / 2 BS)
C Sandbox
200
200
5
2003000
2003000
59
380
3.950
43
300
100
3
2.700
100
14
4 LPARs
D
Deutschland
Vorprod
4 LPARs
E Spanien
4 LPARs
F Belgien
4 LPARs
G Österreich
7 LPARs
• Alle Sysplexe werden von
GDPS/PPRC kontrolliert
Agenda
1
2
3
4
Projektauftrag
Datacenter consolidation of data enters: from 12 to 2 sites
From...
Aachen
To...
Prague
Aachen
Budapest
Paris
Vienna
Padua
Mogliano
• 12 data centers/data rooms across 6 main
countries in Europe
• Different architectures and service levels
across countries (e.g. local/ metropolitan vs.
regional disaster recovery)
Mogliano
• 2 data centers only, specialized by platform
• Aachen: mainframe and test environment open
• Mogliano: x86, Unix, AS/400
• Mutual wide area disaster recovery capabilities for
the Group
• New technologies, standardization and
infrastructure sharing
Projektauftrag
Projektbeginn: 01.11.2013
Design einer Ziellandschaft für den zukünftigen Betrieb aller Plattformen in
den beiden verbliebenen IT - Standorten
Erstellen einer „3. Datenkopie“ für die deutschen Kunden
Alle Plattformen, alle Speichertechnologien
Zieltermin: 31.12.2014
Ende der Designphase: 31.03.2014
Zahlreiche Neuplanungen zwecks Kostenminimierung notwendig
Projektauftrag (System z)
GDPS/MGM als Zielarchitektur für alle „3rd datacopy“ Kunden
Aufteilen in 2 Teilprojekte
„3rd datacopy only“
31.12.2014
„Wide area desaster recovery“
Deutschland
31.12.2015
Rest der Gruppe
31.12.2016
Als „Bonbon“ zusätzlich
Migration Generali France (Mainframe) von Mogliano nach Aachen
Zieltermin: 05.04.2015
Herausforderung
Bisher kein GDPS, kein SA -> demnächst GDPS/MGM
Umstellung auf Alternate Subchannel Set
Beginn der Umsetzung: 01.12.2014
System z related Timelineuilt around several milestones
Oct 2013
Project
Milestones
Apr 2014
Oct 2014 Dec 2014 Mar 2015
Dec 2015
Wide-area DR ready
for all the countries
Team staffing
Blueprint ready
Technical migration strategy ready
Italy
Germany
Dec 2016
Padova DC
closed
3rd data copy
ready
France
Mainframe migrated
Czech
Republic
Mainframe migrated
Target setup
ready for migration
Wide-area
DR ready
Agenda
1
2
3
4
Umsetzung
MGM Überblick
Beschreibung
GDPS/PPRC
• GDPS/PPRC Funktionen sind
ohne Einschränkung möglich
• GDPS/MGM übernimmt Kontrolle
über die Replikation zur 3. Seite.
• Incremental Resynch Funktion
ermöglicht die Verbindung A-C bei
Ausfall der B Seite.
Kp System CNMAx
• R System kommuniziert mit Kg
Kp System CNMBx
System über Netview zu Netview
Kg System CNMGx
R System CNMCx
Aktionen gegen die 3. Seite
B
notwendig
C
A
Incremental Resynch
Kommunikation und ist nur für
D
GDPS/MGM
MGM POC Umgebung
Beschreibung
IVZ I
IVZ II
• Aufgrund der noch nicht vorhandenen
Netzleitung und Hardware am 3.
Standort wurde die MGM Hardware Umgebung in Aachen simuliert
• Jede Kopie wurde durch eine eigene
Lpars
Lpars
GDCAKg-sys
SYC3 prod-sys
in der gleichen Box wie die primäre
GDCB
Kopie lag
Kp-sys
GDCC
LCU representiert, wobei die “3. Kopie”
Kp-sys
• Das R-sys (GDCC) und die zugehörige
R-sys
DASD Umgebung wurde logisch isoliert
als Monoplex
SSID: 5E
PPRC MM
PPRC GM
SSID: 3C
SSID: 4C
FlashCopy
SSID: EE
Timeline POC
30.06.2014
Download MGM Code
01.07.
SMP/E Installation
02.07. – 07.07.
Konfiguration MGM
08.07.
Beginn der Tests
11.07.
Erster Test Procedure MGM_RESTORE_ABC
14.07.
Abschluss -> Start von der „3. Seite“
Aufgrund der bereits vorhandenen Erfahrung mit GDPS/PPRC keine größeren Probleme
PROCEDUREs teilweise sehr komplex im Ablauf, besonders wenn etwas schief läuft
Sysplex
CDS
Wide Area
DR –
GPSLayout
MGM MGM (Asym Devices)
Beschreibung
Metro Mirror
• Alle Sysplex DS ausser
LOGR auf Simplex DASD
Global Mirror
• Secondary Sysplex CDS in
GM Session B-C
• Primary Sysplex DS Global
Copy A-C
A
LOGR
Metro Mirror
C
D
CDS S
CDS P
Simplex
B
LOGR
Global Mirror
Asym devices
Simplex
Spare CDS
LSSSET TYPE=CKD,UTIL1=3000,UTIL2=C000,
CDSS=DSC1,CLSS=10,CSSID=1003,
ACLINKS=07320104,05040103,03320034,01040033,
06020332,04340331,02020202,00340201,
BCLINKS=07320504,05040503,03320434,01040433,
06020732,04340731,02020602,00340601
PPRCSET ADEVN=3010,BDEVN=C010,NUM=070,CCCA=10,DLSS=80,DCCA=10
PPRCSET ADEVN=30B0,BDEVN=C0B0,NUM=003,CCCA=B0,DLSS=80,DCCA=B0
PPRCSET ADEVN=30BB,BDEVN=C0BB,NUM=027,CCCA=BB,DLSS=80,DCCA=BB
PPRCSET ADEVN=30DE,NUM=2,CCCA=0E,DLSS=80,DCCA=0E
PPRCSET BDEVN=C0DE,NUM=2,CCCA=DE,DLSS=80,DCCA=DE
• Auf B ein extra Set XCF
Couple DS
Kg System
Asym Devices
Timeline GM Start Produktion Deutschland
01.11.2014
01.11. – 07.11.
08.11.2014
11.11.2014
WAN Link verfügbar
Konfiguration FCIP Router, Clone des R-Systems
10:00: Uhr Start Global Mirror
(130 TB nur 6 von 8 FC Links verfügbar)
06:30: erste Consistency Group
Produktions Umgebung
Beschreibung
IVZ I
IVZ II
DR site
• Ingesamt 3 Sysplexe werden mit MGM
ausgestattet. Auf der R-Seite existieren
2 R-sys Systeme. Ein System für den
Testplex and ein System für ALLE
Produktionsumgebungen. Pro MGM
Lpars
Lpars
Lpars
Sxxx Prod-sys
Sxxx Prod-sys
GDxC
GDxA
GDxB
Kp-sys
Kp-sys
Kg-sys
PPRC MM
PPRC GM
wird ein eigenes Netview auf dem RSystem gestartet.
R-sys
Global Mirror: Typische IO Last in MB/sec
Global Mirror: Typische RPO Zeiten
Agenda
1
2
3
4
Generali France
Timeline Migration Generali France
DASD PPRC Layout 03/2015
P TB
(Prim)
LCUs Pairs
A 130
16
1792
C 5
1
96
D 5
1
116
D 54 (FC)
6
E 43
6
1246
F 3
1
174
G 14
2
378
P 38
27
4679
PPRC Secondaries
In MSS1
MSS1 in action
5 stellige IPL
Adresse
MSS1 in action
5 stellige IPL
Adresse
GDPS/PPRC GEOPARM
5 stellige Adressen
GDPS/MGM GEOMPARM
5 stellige Adressen
French Dumping Solution
Anforderung:
verschiedene Sicherungen (täglich, wöchentlich, monatlich)
bestimmter Produktionsdaten
Lösung:
Täglicher Flash Copy der gesamten Produktionsumgebung (ca. 13 TB)
Start 20:00 Uhr
DFDSS Dump verschiedener FC DASD auf Tape
Lagerung der Tapes im DR Datacenter
French Dumping Solution
Processing flow
Overview
IVZ I
Description
IVZ II
•Constant replication AC –MV via Global Mirror
A
•Daily dump is taken in MV DS8K on additional
B
Flash Copy (FC) LCUs on the DS8K. Controlling
by a “DUMP-LPAR” MV
MM
•Written on native Tape into the library
TWS
a)
GDPS
b)
+
GM
data is already replicated to DR-site -> no
additional bandwith needed
+
no performance impact due to FC on
productive systems in Aachen
Mogliano
+
even if IVZ 2 is not available, dump can
be produced from IVZ1
C
D
Procedure
a)TWS submit a Job in IVZ1 to execute REXX
FC 1
MKDUMP. MKDUMP executes via RE on R-sys
REXX MKDMPVPC which performes the
TESTCOPY Cmd.
b)Depending on RC a MSG is send to IVZ1 to
start the DUMP JOB on the DUMP LPAR
DUMP
Native
Tape
Einfache Netview Rexx zur Steuerung
EQQW775I APPLICATION: TWSWTO00
0005 WITH INPUT 282
ARRIVAL: 1501120810 AND JOBNAME:
WORK
STATION: WTO1 HAS BEEN STARTED.
OPERATION TEXT: GDPS MKDMP
GDPS Netview on R - system
GDPS Netview on Application LPAR
/* REXX */
…
'VPCEXIT2 300 SCRIPT_DASD PPLEX FCWITHDRAW FC1'
'GLOBALV GETT VPC_BATCHRC'
if vpc_batchrc = 'NOK' then call error_cnm
'VPCEXIT2 600 SCRIPT_DASD PPLEX TESTCOPY CAPTURE
FC1 NOCOPY'
'GLOBALV GETT VPC_BATCHRC'
if vpc_batchrc = 'NOK' then call error_cnm
'CNMG0: MKDMP000 'ADID WSID OPNO STAT IA
exit 0
error_cnm:
'CNMG0: MKDMP001 'ADID WSID OPNO STAT IA
exit 1
/* REXX */
parse arg adid wsid opno stat ia
'CNMAC: MKDMPVPC 'adid wsid opno stat ia
EXIT
GDPS Batch Script Funktion
OP#:
ON
/* REXX */
…
stat = 'C'
'OPCAPOST
adname='adid',WSNAME='wsid',OPNUM='opno',TYPE='stat ,
',IDATE='substr(ia,1,6)',ITIME='substr(ia,7,4)
…
/* REXX */
…
STAT = 'E,ERRCODE=OJCV'
'OPCAPOST
ADNAME='ADID',WSNAME='WSID',OPNUM='OPNO',TYPE='STAT
,
',IDATE='SUBSTR(IA,1,6)',ITIME='SUBSTR(IA,7,4)
…
GIS System CPU / DASD Hardwarelandschaft aktuell
IVZ1
IVZ2
EC12 2827-716
16 CP
4 zIIP
17.904 MIPS
512 GB RAM
EC12 2827-716
16 CP
4 zIIP
17.904 MIPS
512 GB RAM
EC12 2827-705
Ext. CF
5 ICF
64 GB RAM
Storage System
DS8870
1024 GB Cache
Storage System
DS8870
1024 GB Cache
310 TB CKD
12 TB FBA
53 TB Flashcopy
268 TB CKD
12 TB FBA
z/196 2817-507
7 CP
4 zIIP
3.586 MIPS
512 GB RAM
GDPS/GM
GDPS/MM
EC12 2827-705
Ext. CF
5 ICF
64 GB RAM
Mogliano
Storage System
DS8870
512 GB Cache
488 TB CKD
40 TB FBA