White Paper Performance Report PRIMERGY TX1320 M2 White Paper FUJITSU Server PRIMERGY Performance Report PRIMERGY TX1320 M2 In diesem Dokument sind alle Benchmarks zusammengefasst, die für den FUJITSU Server PRIMERGY TX1320 M2 durchgeführt wurden. Ferner werden die Leistungsdaten der PRIMERGY TX1320 M2 mit denen anderer PRIMERGY Modelle verglichen und diskutiert. Neben den Benchmark-Ergebnissen als solchen wird jeder Benchmark und die Umgebung, in der der Benchmark durchgeführt wurde, kurz erläutert. Version 1.1 2016-02-29 http://www.fujitsu.com/de/primergy Seite 1 (31) White Paper Performance Report PRIMERGY TX1320 M2 Version: 1.1 2016-02-29 Inhalt Dokumenthistorie ................................................................................................................................................ 2 Technische Daten ............................................................................................................................................... 3 SPECcpu2006 .................................................................................................................................................... 6 SPECpower_ssj2008 .......................................................................................................................................... 9 Disk-I/O: Performance von Speichermedien .................................................................................................... 14 Disk-I/O: Performance von RAID-Controllern ................................................................................................... 20 STREAM ........................................................................................................................................................... 28 Literatur ............................................................................................................................................................. 30 Kontakt .............................................................................................................................................................. 31 Dokumenthistorie Version 1.0 (2016-01-14) Neu: Technische Daten SPECcpu2006 ® ® Messungen mit Celeron G3900, Pentium G4400, Core i3-6100 und Intel Xeon Processor E3-1200 v5 Product Family SPECpower_ssj2008 Messung mit Xeon E3-1260L v5 STREAM ® ® Messungen mit Celeron G3900, Pentium G4400, Core i3-6100 und Intel Xeon Processor E3-1200 v5 Product Family Version 1.1 (2016-02-29) Neu: Disk-I/O: Performance von Speichermedien Ergebnisse für 2.5"- und 3.5"-Speichermedien Disk-I/O: Performance von RAID-Controllern Messungen mit „LSI SW RAID on Intel C236 (Onboard SATA)“, „PRAID CP400i“, „PRAID EP400i“und „PRAID EP420i“ Controllern Aktualisiert: Technische Daten Xeon E3-1225 v5 hinzugefügt SPECcpu2006 Messungen mit Xeon E3-1225 v5 STREAM Messung mit Xeon E3-1225 v5 Seite 2 (31) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY TX1320 M2 Version: 1.1 2016-02-29 Technische Daten PRIMERGY TX1320 M2 In diesem White Paper werden bei Maßeinheiten Dezimalpräfixe nach SI-Standard verwendet (z.B. 1 GB = 9 10 Byte). Abweichend hiervon sind bei Kapazitäten von Caches und Speichermodulen diese Präfixe als 30 Binärpräfixe (z.B. 1 GB = 2 Byte) zu interpretieren. Im Falle weiterer Ausnahmen wird an entsprechender Stelle gesondert darauf hingewiesen. Modell PRIMERGY TX1320 M2 Modellvarianten PY TX1320M2/LFF PY TX1320M2/SFF Formfaktor Tower Server Chipsatz Intel C236 Anzahl Sockel 1 Prozessortyp Intel Celeron G3900 ® ® Intel Pentium G4400 ® ™ Intel Core i3-6100 ® ® Intel Xeon Processor E3-1200 v5 Product Family Anzahl Speichersteckplätze 4 Maximaler Speicherausbau 64 GB Onboard LAN-Controller 2 × 1 Gbit/s Onboard HDD-Controller Controller mit RAID 0, RAID 1 oder RAID 10 für bis zu 4 SATA HDDs PCI-Steckplätze 2 × PCI-Express 3.0 x8 1 × PCI-Express 3.0 x4 1 × PCI-Express 3.0 x1 (mech. x4) Max. Anzahl interner Festplatten PY TX1320M2/LFF: 2 PY TX1320M2/SFF: 6 ® ® http://www.fujitsu.com/de/primergy ® Seite 3 (31) White Paper Performance Report PRIMERGY TX1320 M2 Version: 1.1 2016-02-29 Cores Prozessor Threads Prozessoren (seit System-Release) Cache Nominalfrequenz Max. Turbofrequenz Max. Speicherfrequenz TDP [MB] [Ghz] [Ghz] [MHz] [Watt] Celeron G3900 2 2 2 2.80 entf. 2133 51 Pentium G4400 2 2 3 3.30 entf. 2133 54 Core i3-6100 2 4 3 3.70 entf. 2133 51 Xeon E3-1220 v5 4 4 8 3.00 3.50 2133 80 Xeon E3-1225 v5 4 4 8 3.30 3.70 2133 80 Xeon E3-1240L v5 4 8 8 2.10 3.20 2133 25 Xeon E3-1260L v5 4 8 8 2.90 3.90 2133 45 Xeon E3-1230 v5 4 8 8 3.40 3.80 2133 80 Xeon E3-1240 v5 4 8 8 3.50 3.90 2133 80 Xeon E3-1270 v5 4 8 8 3.60 4.00 2133 80 Xeon E3-1280 v5 4 8 8 3.70 4.00 2133 80 ® ® Alle mit der PRIMERGY TX1320 M2 bestellbaren Prozessoren der Intel Xeon Processor E3-1200 v5 ® Product Family unterstützen Intel Turbo Boost Technology 2.0. Diese Technologie ermöglicht den Betrieb des Prozessors mit höheren Frequenzen als der Nominalfrequenz. In der Prozessortabelle steht „Max. Turbofrequenz“ für das theoretische Frequenzmaximum bei nur einem aktiven Core pro Prozessor. Die tatsächlich erreichbare Maximalfrequenz ist abhängig von der Anzahl aktiver Cores, dem Stromverbrauch, der elektrischen Leistungsaufnahme und der Temperatur des Prozessors. Das Erreichen der maximalen Turbofrequenz wird von Intel grundsätzlich nicht garantiert. Dies hängt mit Fertigungstoleranzen zusammen, aus denen eine Varianz bezüglich der Performance verschiedener Exemplare eines Prozessormodells folgt. Das Spektrum der Varianz überdeckt den gesamten Bereich zwischen der Nominalfrequenz und der maximalen Turbofrequenz. Die Turbo-Funktionalität ist per BIOS-Option einstellbar. Grundsätzlich empfiehlt Fujitsu die „Turbo Mode“Option auf der Standardeinstellung „Enabled“ zu belassen, denn durch die höheren Frequenzen wird die Performance deutlich gesteigert. Da die höheren Frequenzen jedoch abhängig von Randbedingungen und nicht immer garantiert sind, kann es für Anwendungsszenarien mit intensiver Verwendung von AVXInstruktionen und hoher Anzahl Instruktionen pro Takteinheit, aber auch solchen, in denen eine konstante Performance oder eine niedrige elektrische Leistungsaufnahme gefordert ist, von Vorteil sein die „Turbo Mode“-Option auszuschalten. Seite 4 (31) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY TX1320 M2 Version: 1.1 2016-02-29 8GB (1x8GB) 2Rx8 DDR4-2133 U ECC 16GB (1x16GB) 2Rx8 DDR4-2133 U ECC Netzteile (seit System-Release) Standardnetzteil 250W 8 2 8 2133 16 2 8 2133 ECC 2133 Registered 8 Load reduced 1 Low voltage 4 Bitbreite der Speicherchips Ranks 4GB (1x4GB) 1Rx8 DDR4-2133 U ECC Kapazität [GB] Speichermodul Frequenz [MHz] Speichermodule (seit System-Release) max. Anzahl 1 Einige Komponenten sind möglicherweise nicht in allen Ländern/Vertriebsregionen verfügbar. Detaillierte technische Informationen finden Sie im Datenblatt PRIMERGY TX1320 M2. http://www.fujitsu.com/de/primergy Seite 5 (31) White Paper Performance Report PRIMERGY TX1320 M2 Version: 1.1 2016-02-29 SPECcpu2006 Benchmark-Beschreibung SPECcpu2006 ist ein Benchmark, der die Systemeffizienz bei Integer- und Fließkomma-Operationen misst. Er besteht aus einer Integer-Testsuite (SPECint2006), die 12 Applikationen enthält, und einer FließkommaTestsuite (SPECfp2006), die 17 Applikationen enthält. Beide Testsuiten sind extrem rechenintensiv und konzentrieren sich auf die CPU und den Speicher. Andere Komponenten, wie Disk-I/O und Netzwerk, werden von diesem Benchmark nicht vermessen. SPECcpu2006 ist nicht an ein spezielles Betriebssystem gebunden. Der Benchmark ist als Source-Code verfügbar und wird vor der eigentlichen Messung kompiliert. Daher beeinflussen auch die verwendete Compiler-Version und deren Optimierungseinstellungen das Messergebnis. SPECcpu2006 beinhaltet zwei verschiedene Methoden der Performance-Messung: Die erste Methode (SPECint2006 bzw. SPECfp2006) ermittelt die Zeit, die für die Bearbeitung einer einzelnen Aufgabe benötigt wird. Die zweite Methode (SPECint_rate2006 bzw. SPECfp_rate2006) ermittelt den Durchsatz, d.h. wie viele Aufgaben parallel erledigt werden können. Beide Methoden werden zusätzlich noch in zwei Messläufe unterteilt, „base“ und „peak“, die sich in der Verwendung der Compiler-Optimierung unterscheiden. Bei der Publikation von Ergebnissen werden immer „base“-Werte verwendet, „peak“-Werte sind optional. Benchmark Arithmetik Typ CompilerOptimierung SPECint2006 Integer peak aggressiv SPECint_base2006 Integer base konservativ SPECint_rate2006 Integer peak aggressiv SPECint_rate_base2006 Integer base konservativ SPECfp2006 Fließkomma peak aggressiv SPECfp_base2006 Fließkomma base konservativ SPECfp_rate2006 Fließkomma peak aggressiv SPECfp_rate_base2006 Fließkomma base konservativ Messergebnis Anwendung Geschwindigkeit Singlethreaded Durchsatz Multithreaded Geschwindigkeit Singlethreaded Durchsatz Multithreaded Bei den Messergebnissen handelt es sich um das geometrische Mittel aus normalisierten Verhältniswerten, die für die Einzel-Benchmarks ermittelt wurden. Das geometrische Mittel führt gegenüber dem arithmetischen Mittel dazu, dass bei unterschiedlich hohen Einzelergebnissen eine Gewichtung zugunsten der niedrigeren Einzelergebnisse erfolgt. Normalisiert heißt, dass gemessen wird, wie schnell das Testsystem verglichen mit einem Referenzsystem ist. Der Wert „1“ wurde für die SPECint_base2006-, SPECint_rate_base2006, SPECfp_base2006 und SPECfp_rate_base2006-Ergebnisse des Referenzsystems festgelegt. So bedeutet beispielsweise ein SPECint_base2006-Wert von 2, dass das Messsystem diesen Benchmark etwa doppelt so schnell wie das Referenzsystem bewältigt hat. Ein SPECfp_rate_base2006-Wert von 4 bedeutet, dass das Messsystem diesen Benchmark etwa 4/[# base copies] mal so schnell wie das Referenzsystem bewältigt hat. „# base copies“ gibt hierbei an, wie viele parallele Instanzen des Benchmarks ausgeführt worden sind. Nicht alle SPECcpu2006-Messungen werden von uns zur Veröffentlichung bei SPEC eingereicht. Daher erscheinen auch nicht alle Ergebnisse auf den Web-Seiten von SPEC. Da wir für alle Messungen die Protokolldateien archivieren, können wir jederzeit den Nachweis für die korrekte Durchführung der Messungen erbringen. Seite 6 (31) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY TX1320 M2 Version: 1.1 2016-02-29 Benchmark-Umgebung System Under Test (SUT) Hardware Modell PRIMERGY TX1320 M2 Prozessor Celeron G3900 Pentium G4400 Core i3-6100 ® ® Intel Xeon Processor E3-1200 v5 Product Family Speicher 4 × 16GB (1x16GB) 2Rx8 DDR4-2133 U ECC Software Betriebssystem SUSE Linux Enterprise Server 12 (x86_64) Betriebssystemeinstellungen echo always > /sys/kernel/mm/transparent_hugepage/enabled Compiler C/C++: Version 16.0.0.101 of Intel C++ Studio XE for Linux Fortran: Version 16.0.0.101 of Intel Fortran Studio XE for Linux Einige Komponenten sind möglicherweise nicht in allen Ländern / Vertriebsregionen verfügbar. Benchmark-Ergebnisse SPECint_rate2006 SPECint_rate_base2006 SPECint2006 Prozessor SPECint_base2006 Das Benchmark-Ergebnis hängt prozessorseitig in erster Linie von der Größe des Prozessor-Caches, der Unterstützung von Hyper-Threading, der Anzahl Prozessorkerne und der Prozessorfrequenz ab. Bei Prozessoren mit Turbomodus bestimmt die Anzahl Cores, die durch den Benchmark belastet werden, die maximal erreichbare Prozessorfrequenz. Bei den „singlethreaded“ Benchmarks, die überwiegend nur einen Core belasten, ist die maximal erreichbare Prozessorfrequenz höher als bei den „multithreaded“ Benchmarks. Celeron G3900 44.4 45.9 80.8 83.5 Pentium G4400 52.8 54.5 95.9 99.3 Core i3-6100 61.9 64.0 133 139 Xeon E3-1220 v5 65.0 67.2 196 202 Xeon E3-1225 v5 68.1 70.6 201 208 Xeon E3-1240L v5 59.7 61.6 198 206 Xeon E3-1260L v5 70.4 73.3 239 248 Xeon E3-1230 v5 69.5 71.8 244 254 Xeon E3-1240 v5 71.1 73.4 249 258 Xeon E3-1270 v5 72.7 75.3 253 262 Xeon E3-1280 v5 72.4 74.9 249 259 http://www.fujitsu.com/de/primergy Seite 7 (31) Version: 1.1 2016-02-29 Celeron G3900 61.0 61.6 Pentium G4400 70.4 71.1 105 106 Core i3-6100 85.4 86.8 131 134 Xeon E3-1220 v5 90.5 92.4 174 177 Xeon E3-1225 v5 92.5 94.9 176 179 Xeon E3-1240L v5 84.1 86.2 164 168 Xeon E3-1260L v5 95.4 97.6 182 187 Xeon E3-1230 v5 95.1 97.1 188 192 Xeon E3-1240 v5 96.5 98.5 189 194 Xeon E3-1270 v5 98.2 191 196 Xeon E3-1280 v5 97.5 189 194 Seite 8 (31) 100 99.8 90.9 SPECfp_rate2006 SPECfp_rate_base2006 SPECfp2006 Prozessor SPECfp_base2006 White Paper Performance Report PRIMERGY TX1320 M2 91.7 http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY TX1320 M2 Version: 1.1 2016-02-29 SPECpower_ssj2008 Benchmark-Beschreibung SPECpower_ssj2008 ist der erste Industriestandard-Benchmark von SPEC, der den Stromverbrauch eines Servers im Verhältnis zu dessen Durchsatz beurteilt. Mit SPECpower_ssj2008 hat SPEC in ähnlicher Weise wie auch für Durchsatzmessungen Standards auf dem Gebiet der elektrischen Leistungsmessung definiert. Der Workload des Benchmarks basiert auf typischen serverseitigen Java Business Applikationen. Er ist skalierbar, multi-threaded, auf eine große Anzahl von Plattformen portierbar und leicht auszuführen. Der Benchmark testet CPUs, Caches, die Speicherhierarchie und die Skalierbarkeit von symmetrischen Multiprozessorsystemen (SMPs), wie auch die Implementationen der Java Virtual Machine (JVM), Just In Time (JIT) Compiler, Garbage Collection, Threads und einige weitere Betriebssystemaspekte. SPECpower_ssj2008 zeichnet den Stromverbrauch von Servern bei unterschiedlichen Belastungsstufen — in 10%-Schritten von 100% bis „Active Idle“ — während einer festgesetzten Zeitspanne auf. Der abgestufte Workload ist der Tatsache geschuldet, dass Auslastung und Stromverbrauch von Servern im Verlauf von Tagen oder Wochen deutlich variieren. Zur Berechnung der Power-Performance-Metrik über alle Stufen werden die gemessenen Transaktionsdurchsätze jedes Messintervalls aufsummiert und dann durch die Summe der während jedes Messintervalls durchschnittlich aufgenommenen elektrischen Leistung geteilt. Das Ergebnis ist ein „overall ssj_ops/watt“ genannter Wert. Diese Kennzahl gibt Aufschluss über die Energie-Effizienz des gemessenen Servers. Der definierte Messstandard ermöglicht es einem Kunden Vergleiche anzustellen zwischen verschiedenen Konfigurationen und Servern, die mit SPECpower_ssj2008 vermessen wurden. Das nebenstehende Diagramm zeigt einen typischen Graphen eines SPECpower_ssj2008-Ergebnisses. Der Benchmark läuft auf den unterschiedlichsten Betriebssystemen und HardwareArchitekturen und stellt dabei keine besonderen Anforderungen an die Clientund Storage-Infrastruktur. Die Minimalausstattung für einen SPEC-konformen Test besteht aus zwei vernetzten Computern, sowie einem Strommessgerät und einem Temperatursensor. Der eine Computer ist das System Under Test (SUT), auf dem eines der unterstützten Betriebssysteme und die JVM installiert sind. Die JVM stellt die Umgebung bereit, die für den Ablauf des in Java implementierten SPECpower_ssj2008Workloads benötigt wird. Der zweite Computer ist das sogenannte „Control & Collection System“ (CCS), das die Ausführung des Benchmarks kontrolliert und die elektrische Leistungsaufnahme, sowie die Durchsatzund Temperaturwerte aufnimmt und protokolliert. Das nebenstehende Diagramm gibt Ihnen einen Überblick über die Grundstruktur der Benchmark-Konfiguration mit den dazugehörigen Komponenten. http://www.fujitsu.com/de/primergy Seite 9 (31) White Paper Performance Report PRIMERGY TX1320 M2 Version: 1.1 2016-02-29 Benchmark-Umgebung System Under Test (SUT) Hardware Modell PRIMERGY TX1320 M2 Modellvariante PY TX1320M2/LFF Prozessor Xeon E3-1260L v5 Speicher 2 × 8GB (1x8GB) 2Rx8 DDR4-2133 U ECC Netzwerk-Interface Onboard LAN-Controller (1 Port verwendet) Disk-Subsystem Onboard HDD-Controller 1 × SSD SATA 6G 64GB DOM N H-P Netzteil 1 × Standardnetzteil 250W Software BIOS R1.3.0 BIOS-Einstellungen Hardware Prefetcher = Disabled Adjacent Cache Line Prefetch = Disabled DCU Streamer Prefetcher = Disabled ASPM Support = Auto Turbo Mode = Disabled DMI Control = Gen1 Intel Virtualization Technology = Disabled LAN 2 Controller = Disabled Firmware 8.04A Betriebssystem Microsoft Windows Server 2012 R2 Standard Betriebssystemeinstellungen Using the local security settings console, “lock pages in memory” was enabled for the user running the benchmark. Power Management: Enabled (“Fujitsu Enhanced Power Settings” power plan) Set “Turn off hard disk after = 1 Minute” in OS. Benchmark was started via Windows Remote Desktop Connection. Each JVM instance was affinitized to two logical processors. JVM Oracle Java HotSpot(TM) 64-Bit Server VM (build 24.80-b11, mixed mode), version 1.7.0_80 JVM-Einstellungen start /AFFINITY [0x3,0xC,0x30,0xC0] -server -Xmn2300m -Xms2750m -Xmx2750m -XX:SurvivorRatio=60 -XX:TargetSurvivorRatio=90 -XX:AllocatePrefetchDistance=256 -XX:AllocatePrefetchLines=4 -XX:LoopUnrollLimit=45 -XX:InitialTenuringThreshold=12 -XX:MaxTenuringThreshold=15 -XX:ParallelGCThreads=2 -XX:InlineSmallCode=3900 -XX:MaxInlineSize=270 -XX:FreqInlineSize=2500 -XX:+AggressiveOpts -XX:+UseLargePages -XX:+UseParallelOldGC -XX:-UseAdaptiveSizePolicy Einige Komponenten sind möglicherweise nicht in allen Ländern / Vertriebsregionen verfügbar. Seite 10 (31) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY TX1320 M2 Version: 1.1 2016-02-29 Benchmark-Ergebnisse Die PRIMERGY TX1320 M2 erzielte folgendes Ergebnis: SPECpower_ssj2008 = 8,944 overall ssj_ops/watt Das nebenstehende Diagramm zeigt das Ergebnis der oben beschriebenen Konfiguration. Die roten waagerechten Balken zeigen für die einzelnen Laststufen (an der y-Achse des Diagramms abgebildet) das Verhältnis von Durchsatz zu Energieverbrauch (Performance to Power Ratio) in ssj_ops/watt (x-Achse oben). Die blaue Kurve stellt den durchschnittlichen Energieverbrauch dar (an der xAchse unten abgebildet); die Werte für die einzelnen Laststufen sind jeweils mit einer kleinen Raute gekennzeichnet. Die schwarze senkrechte Linie zeigt das Benchmark-Resultat von 8,944 overall ssj_ops/watt für die PRIMERGY TX1320 M2. Das ist der Quotient aus der Summe der Transaktionsdurchsätze der einzelnen Laststufen und der Summe der an diesen Stufen jeweils durchschnittlich aufgenommenen elektrischen Leistung. Die folgende Tabelle zeigt die Benchmark-Ergebnisse bezüglich des Durchsatzes in ssj_ops, der elektrischen Leistungsaufnahme in Watt und des daraus resultierenden Energieeffizienz-Werts für jede einzelne Laststufe. Performance Power Energy Efficiency Target Load ssj_ops Average Power (W) 100% 478,512 44.7 10,713 90% 429,767 40.2 10,692 80% 383,866 35.8 10,722 70% 333,825 31.4 10,622 60% 289,162 28.1 10,303 50% 238,762 25.0 9,536 40% 191,219 22.6 8,458 30% 143,580 20.4 7,032 20% 94,862 18.4 5,163 10% 48,106 16.0 3,002 0 11.6 0 Active Idle ssj_ops/watt ∑ssj_ops / ∑power = 8,944 Mit diesem Ergebnis erzielte die PRIMERGY TX1320 M2 einen neuen Klassenrekord und übertraf damit das beste Konkurrenz-Ergebnis um 16.4% (Stand: 25. November 2015). Damit beweist sich die PRIMERGY TX1320 M2 als energieeffizientester 1-Sockel Server weltweit. Die aktuellen SPECpower_ssj2008-Ergebnisse sind zu finden unter http://www.spec.org/power_ssj2008/results. http://www.fujitsu.com/de/primergy Seite 11 (31) White Paper Performance Report PRIMERGY TX1320 M2 SPECpower_ssj2008: PRIMERGY TX1320 M2 vs. Wettbewerb Version: 1.1 2016-02-29 Der Vergleich zur Konkurrenz macht den Vorsprung der PRIMERGY TX1320 M2 im Bereich Energieeffizienz deutlich. Mit 16.4% höherer Energieeffizienz gegenüber dem besten Konkurrenzergebnis in der Klasse der 1-Sockel Server, dem Supermicro Inc. SYS5019S-M(X11SSH-F) Server, setzt die PRIMERGY TX1320 M2 neue Maßstäbe. Folgendes Diagramm zeigt für jede Laststufe den Stromverbrauch (auf der rechten Y-Achse) und den Durchsatz (auf der linken Y-Achse) der PRIMERGY TX1320 M2 gegenüber dem Vorgängersystem, der PRIMERGY TX1320 M1. SPECpower_ssj2008: PRIMERGY TX1320 M2 vs. PRIMERGY TX1320 M1 Seite 12 (31) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY TX1320 M2 Die PRIMERGY TX1320 M2 wurde, anders als das Vorgängersystem PRIMERGY TX1320 M1, auf Grund der besseren Energieeffizienz, ohne Turbo Mode gemessen. Dies erklärt den etwas niedrigeren Durchsatz der PRIMERGY TX1320 M2 im Vergleich zur PRIMERGY TX1320 M1. Die dadurch deutlich niedrigere Leistungsaufnahme führt jedoch im Gesamtergebnis zu einer Steigerung der Energieeffizienz der PRIMERGY TX1320 M2 um 18.7%. http://www.fujitsu.com/de/primergy Version: 1.1 2016-02-29 SPECpower_ssj2008 overall ssj_ops/watt: PRIMERGY TX1320 M2 vs. PRIMERGY TX1320 M1 Seite 13 (31) White Paper Performance Report PRIMERGY TX1320 M2 Version: 1.1 2016-02-29 Disk-I/O: Performance von Speichermedien Benchmark-Beschreibung Performance-Messungen von Disk-Subsystemen bei PRIMERGY Servern dienen dazu, deren Leistungsfähigkeit zu beurteilen und einen Vergleich der verschiedenen Storage-Anbindungen bei PRIMERGY Servern zu ermöglichen. Standardmäßig werden diese Performance-Messungen mit einem definierten Messverfahren durchgeführt, das die Zugriffe realer Anwendungsszenarien anhand von Kenndaten modelliert. Die wesentlichen Kenndaten sind: Anteil von wahlfreien Zugriffen / sequentiellen Zugriffen Anteil der Zugriffsarten Lesen / Schreiben Blockgröße (kB) Anzahl paralleler Zugriffe (# of Outstanding I/Os) Eine gegebene Wertekombination dieser Kenndaten heißt „Lastprofil“. Die folgenden fünf Standardlastprofile lassen sich typischen Anwendungsszenarien zuordnen: Standardlastprofil Zugriff Zugriffsart read write Blockgröße [kB] Anwendung File copy wahlfrei 50% 50% 64 Kopieren von Dateien File server wahlfrei 67% 33% 64 File-Server Database wahlfrei 67% 33% 8 Datenbank (Datentransfer) Mail Server Streaming sequentiell 100% 0% 64 Datenbank (Log-File), Datensicherung; Video Streaming (teilweise) Restore sequentiell 0% 100% 64 Wiederherstellen von Dateien Zur Modellierung parallel zugreifender Anwendungen mit unterschiedlicher Belastungsintensität wird die „# of Outstanding I/Os“ von 1 bis 512 gesteigert (in Zweierpotenzschritten). Die Messungen des vorliegenden Dokumentes beruhen auf diesen Standardlastprofilen. Die wichtigsten Ergebnisse einer Messung sind: Throughput [MB/s] Transactions [IO/s] Latency [ms] Datendurchsatz in Megabytes pro Sekunde Transaktionsrate in I/O-Operationen pro Sekunde mittlere Antwortzeit in ms Für sequentielle Lastprofile hat sich der Datendurchsatz als übliche Messgröße durchgesetzt, während bei den wahlfreien Lastprofilen mit ihren kleinen Blockgrößen meist die Messgröße „Transaktionsrate“ verwendet wird. Datendurchsatz und Transaktionsrate sind direkt proportional zueinander und lassen sich nach der Formel Datendurchsatz [MB/s] = Transaktionsrate [IO/s] × Blockgröße [MB] Transaktionsrate [IO/s] = Datendurchsatz [MB/s] / Blockgröße [MB] ineinander überführen. 12 In diesem Kapitel sind Kapazitäten von Speichermedien durchgängig zur Basis 10 angegeben (1 TB = 10 Bytes), während alle anderen Kapazitäten, Dateigrößen, Blockgrößen und Durchsätze zur Basis 2 20 angegeben sind (1 MB/s = 2 Bytes/s). Alle Details des Messverfahrens und Grundlagen zur Disk-I/O-Performance sind im White Paper „Grundlagen Disk-I/O-Performance“ beschrieben. Seite 14 (31) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY TX1320 M2 Version: 1.1 2016-02-29 Benchmark-Umgebung Alle in diesem Kapitel diskutierten Messergebnisse gelten für die im Folgenden aufgelisteten Hardware- und Software-Komponenten: System Under Test (SUT) Hardware Modell PRIMERGY TX1320 M2 Controller 1 × PRAID CP400i Speichermedien Für Modellvariante PY TX1320M2/LFF: HDDs Seagate ST1000NM0033 Seagate ST2000NM0024 Seagate ST2000NM0033 Seagate ST4000NM0033 Seagate ST500DM002 Western Digital WD1003FBYX Western Digital WD2000FYYZ Western Digital WD3000FYYZ Western Digital WD4000FYYZ Western Digital WD5003ABYX Für Modellvariante PY TX1320M2/SFF: SSDs HDDs Intel SSDSC2BB120G4C Intel SSDSC2BB240G4C Intel SSDSC2BB480G4C Intel SSDSC2BB800G4C HGST HUC101812CS4204 HGST HUC101812CSS204 HGST HUC101818CS4204 HGST HUC101890CS4204 HGST HUC101890CSS204 HGST HUC101830CSS204 HGST HUC101860CS4204 HGST HUC101860CSS204 HGST HUC156030CSS204 HGST HUC156045CSS204 HGST HUC156060CSS204 Seagate ST1000NX0313 Seagate ST2000NX0253 Seagate ST91000640NS Seagate ST9250610NS Seagate ST9500620NS Software Betriebssystem Microsoft Windows Server 2012 Standard R2 Verwaltungssoftware ServerView RAID Manager 6.2.1 Benchmark-Version 3.0 RAID-Typ Logisches Laufwerk vom Typ RAID 0 aus 1 Festplatte Stripe size Controller-Default (hier 64 kB) Messwerkzeug Iometer 1.1.0 Messbereich Für sequentielle Zugriffe werden die ersten 10% des nutzbaren LBA-Bereichs verwendet; für wahlfreie Zugriffe die nächsten 25%. Dateisystem raw http://www.fujitsu.com/de/primergy Seite 15 (31) White Paper Performance Report PRIMERGY TX1320 M2 Gesamtzahl IometerWorker Version: 1.1 2016-02-29 1 Ausrichtung der Iometer- Ausgerichtet an ganzzahligen Vielfachen von 4096 bytes Zugriffe Einige Komponenten sind möglicherweise nicht in allen Ländern / Vertriebsregionen verfügbar. Benchmark-Ergebnisse Die hier vorgestellten Ergebnisse sollen dabei helfen, für die Modellvarianten der PRIMERGY TX1320 M2 passende Speichermedien unter dem Gesichtspunkt der Disk-I/O-Performance auszuwählen. Hierzu wurde in der im Unterkapitel Benchmark-Umgebung angegebenen Konfiguration jeweils ein einzelnes Speichmedium gemessen. Bei den Messungen wurde der RAID-Controller PRAID CP400i verwendet. Die folgende Tabelle fasst dessen wichtigste Eigenschaften zusammen. Speichermedium Controller-Name SSD/HDD PRAID CP400i Cache - Unterstützte Interfaces SATA 6G SAS 12G PCIe 3.0 x8 RAID Levels 0, 1, 1E, 10, 5, 50 Speichermedien Durch die Auswahl des Speichermedientyps und deren Anzahl lässt sich eine Gewichtung in Richtung Speicherkapazität, Performance, Sicherheit oder Preis vornehmen. In der PRIMERGY TX1320 M2 können folgende Typen von HDD- und SSD-Speichermedien verwendet werden: Speichermedientyp Schnittstelle Formfaktor HDD SATA 6G 2.5" HDD SATA 6G 3.5" HDD SAS 12G 2.5" SSD SATA 6G 2.5" HDDs und SSDs werden über Host-Bus-Adapter, meist RAID-Controller, mit SATA- oder SAS-Schnittstelle betrieben. Die Schnittstelle des RAID-Controllers zum Chipsatz des Systemboards ist typischerweise PCIe oder, im Falle der integrierten Onboard-Controller, eine interne Busschnittstelle des Systemboards. Von allen Speichermedientypen bieten SSDs die bei weitem die höchsten Transaktionsraten für wahlfreie Lastprofile wie auch die kürzesten Zugriffszeiten. Dafür ist allerdings der Preis pro Gigabyte Speicherkapazität erheblich höher. Cache-Einstellungen Der Cache von HDDs hat in den meisten Fällen einen großen Einfluss auf die Disk-I/O-Performance. Er wird häufig als Sicherheitsproblem bei Stromausfall angesehen und daher abgeschaltet. Dennoch wurde er von den Festplattenherstellern aus gutem Grund zur Steigerung der Schreib-Performance integriert. Aus Performance-Gründen ist es daher empfehlenswert den Festplatten-Cache einzuschalten. Um Datenverlusten bei Stromausfall vorzubeugen, empfiehlt es sich das System mit einer USV auszustatten. Zwecks einfacher und sicherer Handhabung der Einstellungen von RAID-Controller und Festplatten empfiehlt sich die für PRIMERGY Server mitgelieferte RAID-Manager-Software „ServerView RAID“. Üblicherweise wird man – spezifisch für den Anwendungsfall – mittels der vordefinierten Modi „Performance“ oder „Data Protection“ die kompletten Cache-Einstellungen für Controller und Festplatten en bloc vornehmen. Der Modus „Performance“ gewährleistet für die Mehrzahl der Anwendungsszenarien Performance-optimale Einstellungen. Performance-Werte Die Performance-Werte der PRIMERGY TX1320 M2 werden im Folgenden tabellarisch zusammengestellt, jeweils spezifisch für ein einzelnes Speichermedium bei verschiedenen Zugriffsarten und Blockgrößen. Hierbei werden die etablierten Messgrößen, wie sie schon im Unterkapitel Benchmark-Beschreibung erwähnt wurden, verwendet. Bei den wahlfreien Zugriffen wird also die Transaktionsrate angegeben, und bei Seite 16 (31) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY TX1320 M2 Version: 1.1 2016-02-29 den sequentiellen Zugriffen der Datendurchsatz. Um Verwechslungen der Maßeinheiten zu vermeiden, sind die Tabellen für die beiden Arten von Zugriffen getrennt. In den Tabellenzellen sind die maximal erreichbaren Werte eingetragen. Das bedeutet: jeder Wert ist das Maximum über den gesamten Bereich von Belastungsintensitäten (# of Outstanding I/Os). Zwecks zusätzlicher Visualisierung der Zahlenwerte ist jede Tabellenzelle mit einem waagerechten Balken hinterlegt, dessen Länge proportional zum Zahlenwert in der Tabellenzelle ist. Alle Balken, die im gleichen Längenmaßstab dargestellt sind, haben die gleiche Farbe. Es können also nur die Tabellenzellen mit gleichfarbigen Balken sinnvoll visuell miteinander verglichen werden. Da die waagerechten Balken in den Tabellenzellen die maximal erreichbaren Performance-Werte veranschaulichen, sind sie als von links nach rechts heller werdende Farbverläufe dargestellt. Der helle Farbton am rechten Balkenende drückt aus, dass der Wert das Maximum ist und nur bei optimalen Voraussetzungen erreicht werden kann. Je dunkler dann der Farbton nach links hin wird, umso häufiger wird der entsprechende Wert in der Praxis erreichbar sein. SSDs im Vergleich zur leistungsstärksten HDD Wahlfreie Zugriffe (maximale Performance-Werte in IO/s): PRIMERGY TX1320 M2 Modellvariante PY TX1320M2/SFF Kapazität [GB] 800 600 480 240 120 Speichermedium Intel SSDSC2BB800G4C HGST HUC156060CSS204 (HDD) Intel SSDSC2BB480G4C Intel SSDSC2BB240G4C Intel SSDSC2BB120G4C Schnittstelle SATA 6G SAS 12G SATA 6G SATA 6G SATA 6G Transaktionen [IO/s] Database Fileserver 30495 3117 768 653 29575 4067 23354 2870 15950 2026 Filecopy 3960 670 3521 2432 1554 Sequentielle Zugriffe (maximale Performance-Werte in MB/s): PRIMERGY TX1320 M2 Modellvariante PY TX1320M2/SFF Kapazität [GB] 800 600 480 240 120 Speichermedium Intel SSDSC2BB800G4C HGST HUC156060CSS204 (HDD) Intel SSDSC2BB480G4C Intel SSDSC2BB240G4C Intel SSDSC2BB120G4C http://www.fujitsu.com/de/primergy Schnittstelle SATA 6G SAS 12G SATA 6G SATA 6G SATA 6G Durchsatz [MB/s] Streaming Restore 478 237 478 478 443 437 237 434 267 140 Seite 17 (31) White Paper Performance Report PRIMERGY TX1320 M2 Version: 1.1 2016-02-29 HDDs Wahlfreie Zugriffe (maximale Performance-Werte in IO/s): PRIMERGY TX1320 M2 Modellvariante PY TX1320M2/LFF Kapazität Speichermedium [GB] 4000 Seagate ST4000NM0033 4000 Western Digital WD4000FYYZ Schnittstelle SATA 6G SATA 6G Transaktionen [IO/s] Database Fileserver 265 245 187 176 Filecopy 242 187 3000 Western Digital WD3000FYYZ SATA 6G 189 178 185 2000 2000 2000 Seagate ST2000NM0024 Seagate ST2000NM0033 Western Digital WD2000FYYZ SATA 6G SATA 6G SATA 6G 311 264 191 286 240 177 295 243 185 1000 1000 Seagate ST1000NM0033 Western Digital WD1003FBYX SATA 6G SATA 6G 274 163 249 151 248 158 500 500 Seagate ST500DM002 Western Digital WD5003ABYX SATA 6G SATA 6G 214 199 196 182 195 191 PRIMERGY TX1320 M2 Modellvariante PY TX1320M2/SFF Kapazität Speichermedium [GB] 2000 Seagate ST2000NX0253 SATA 6G Transaktionen [IO/s] Fileserver 329 285 Schnittstelle Database Filecopy 290 1800 HGST HUC101818CS4204 SAS 12G 605 517 534 1200 1200 HGST HUC101812CS4204 HGST HUC101812CSS204 SAS 12G SAS 12G 651 596 533 495 543 510 1000 1000 Seagate ST1000NX0313 Seagate ST91000640NS SATA 6G SATA 6G 328 302 281 258 290 243 900 900 HGST HUC101890CS4204 HGST HUC101890CSS204 SAS 12G SAS 12G 651 639 533 539 545 552 600 600 600 HGST HUC156060CSS204 HGST HUC101860CS4204 HGST HUC101860CSS204 SAS 12G SAS 12G SAS 12G 768 678 632 653 558 535 670 567 545 500 Seagate ST9500620NS SATA 6G 300 257 249 450 HGST HUC156045CSS204 SAS 12G 744 608 631 300 300 HGST HUC156030CSS204 HGST HUC101830CSS204 SAS 12G SAS 12G 758 670 625 567 636 577 250 Seagate ST9250610NS SATA 6G 310 262 259 Seite 18 (31) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY TX1320 M2 Version: 1.1 2016-02-29 Sequentielle Zugriffe (maximale Performance-Werte in MB/s): PRIMERGY TX1320 M2 Modellvariante PY TX1320M2/LFF Kapazität Speichermedium [GB] 4000 Seagate ST4000NM0033 4000 Western Digital WD4000FYYZ Schnittstelle SATA 6G SATA 6G Durchsatz [MB/s] Streaming Restore 183 183 162 161 3000 Western Digital WD3000FYYZ SATA 6G 168 167 2000 2000 2000 Seagate ST2000NM0024 Seagate ST2000NM0033 Western Digital WD2000FYYZ SATA 6G SATA 6G SATA 6G 204 179 157 204 179 157 1000 1000 Seagate ST1000NM0033 Western Digital WD1003FBYX SATA 6G SATA 6G 184 130 184 129 500 500 Seagate ST500DM002 Western Digital WD5003ABYX SATA 6G SATA 6G 138 130 138 127 PRIMERGY TX1320 M2 Modellvariante PY TX1320M2/SFF Kapazität Speichermedium [GB] 2000 Seagate ST2000NX0253 Schnittstelle SATA 6G Durchsatz [MB/s] Streaming Restore 133 134 1800 HGST HUC101818CS4204 SAS 12G 242 242 1200 1200 HGST HUC101812CS4204 HGST HUC101812CSS204 SAS 12G SAS 12G 238 211 238 211 1000 1000 Seagate ST1000NX0313 Seagate ST91000640NS SATA 6G SATA 6G 131 108 131 108 900 900 HGST HUC101890CS4204 HGST HUC101890CSS204 SAS 12G SAS 12G 233 212 233 211 600 600 600 HGST HUC156060CSS204 HGST HUC101860CS4204 HGST HUC101860CSS204 SAS 12G SAS 12G SAS 12G 237 230 210 237 230 210 500 Seagate ST9500620NS SATA 6G 111 111 450 HGST HUC156045CSS204 SAS 12G 237 237 300 300 HGST HUC156030CSS204 HGST HUC101830CSS204 SAS 12G SAS 12G 236 210 236 210 250 Seagate ST9250610NS SATA 6G 113 112 http://www.fujitsu.com/de/primergy Seite 19 (31) White Paper Performance Report PRIMERGY TX1320 M2 Version: 1.1 2016-02-29 Disk-I/O: Performance von RAID-Controllern Benchmark-Beschreibung Performance-Messungen von Disk-Subsystemen bei PRIMERGY Servern dienen dazu, deren Leistungsfähigkeit zu beurteilen und einen Vergleich der verschiedenen Storage-Anbindungen bei PRIMERGY Servern zu ermöglichen. Standardmäßig werden diese Performance-Messungen mit einem definierten Messverfahren durchgeführt, das die Zugriffe realer Anwendungsszenarien anhand von Kenndaten modelliert. Die wesentlichen Kenndaten sind: Anteil von wahlfreien Zugriffen / sequentiellen Zugriffen Anteil der Zugriffsarten Lesen / Schreiben Blockgröße (kB) Anzahl paralleler Zugriffe (# of Outstanding I/Os) Eine gegebene Wertekombination dieser Kenndaten heißt „Lastprofil“. Die folgenden fünf Standardlastprofile lassen sich typischen Anwendungsszenarien zuordnen: Standardlastprofil Zugriff Zugriffsart read write Blockgröße [kB] Anwendung File copy wahlfrei 50% 50% 64 Kopieren von Dateien File server wahlfrei 67% 33% 64 File-Server Database wahlfrei 67% 33% 8 Datenbank (Datentransfer) Mail Server Streaming sequentiell 100% 0% 64 Datenbank (Log-File), Datensicherung; Video Streaming (teilweise) Restore sequentiell 0% 100% 64 Wiederherstellen von Dateien Zur Modellierung parallel zugreifender Anwendungen mit unterschiedlicher Belastungsintensität wird die „# of Outstanding I/Os“ von 1 bis 512 gesteigert (in Zweierpotenzschritten). Die Messungen des vorliegenden Dokumentes beruhen auf diesen Standardlastprofilen. Die wichtigsten Ergebnisse einer Messung sind: Throughput [MB/s] Transactions [IO/s] Latency [ms] Datendurchsatz in Megabytes pro Sekunde Transaktionsrate in I/O-Operationen pro Sekunde mittlere Antwortzeit in ms Für sequentielle Lastprofile hat sich der Datendurchsatz als übliche Messgröße durchgesetzt, während bei den wahlfreien Lastprofilen mit ihren kleinen Blockgrößen meist die Messgröße „Transaktionsrate“ verwendet wird. Datendurchsatz und Transaktionsrate sind direkt proportional zueinander und lassen sich nach der Formel Datendurchsatz [MB/s] = Transaktionsrate [IO/s] × Blockgröße [MB] Transaktionsrate [IO/s] = Datendurchsatz [MB/s] / Blockgröße [MB] ineinander überführen. 12 In diesem Kapitel sind Kapazitäten von Speichermedien durchgängig zur Basis 10 angegeben (1 TB = 10 Bytes), während alle anderen Kapazitäten, Dateigrößen, Blockgrößen und Durchsätze zur Basis 2 20 angegeben sind (1 MB/s = 2 Bytes/s). Alle Details des Messverfahrens und Grundlagen zur Disk-I/O-Performance sind im White Paper „Grundlagen Disk-I/O-Performance“ beschrieben. Seite 20 (31) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY TX1320 M2 Version: 1.1 2016-02-29 Benchmark-Umgebung Alle in diesem Kapitel diskutierten Messergebnisse wurden mit den im Folgenden aufgelisteten Hardwareund Software-Komponenten ermittelt: System Under Test (SUT) Hardware Controller 1 × „LSI SW RAID on Intel C236 (Onboard SATA)“ Intel C236 PCH, Code name Sunrise Point Driver-Name: megasr1.sys, Driver-Version: 17.01.2015.0716 BIOS-Version: A.15.08211538R 1 × „PRAID CP400i“ 1 × „PRAID EP400i“ 1 × „PRAID EP420i“ Driver-Name: megasas2.sys, Driver-Version: 6.706.06 Firmware-Paket: 24.7.0-0061 Festplatte 2 × 3.5" SATA HDD Seagate ST3000NM0033 6 × 2.5" SATA SSD Intel SSDSC2BB480G4C 4 × 2.5" SATA HDD Seagate ST91000640NS 6 × 2.5" SAS HDD HGST HUC156045CSS204 Software Betriebssystem Microsoft Windows Server 2012 Standard R2 Verwaltungssoftware ServerView RAID Manager 6.2.1 Benchmark-Version 3.0 Stripe size Controller-Default Messwerkzeug Iometer 1.1.0 Messbereich Für sequentielle Zugriffe werden die ersten 10% des nutzbaren LBA-Bereichs verwendet; für wahlfreie Zugriffe die nächsten 25%. Dateisystem raw Gesamtzahl IometerWorker 1 Ausrichtung der Iometer-Zugriffe Ausgerichtet an ganzzahligen Vielfachen von 4096 Bytes Einige Komponenten sind möglicherweise nicht in allen Ländern / Vertriebsregionen verfügbar. http://www.fujitsu.com/de/primergy Seite 21 (31) White Paper Performance Report PRIMERGY TX1320 M2 Version: 1.1 2016-02-29 Benchmark-Ergebnisse Die hier vorgestellten Ergebnisse sollen dabei helfen, aus den verschiedenen Konfigurationsmöglichkeiten der PRIMERGY TX1320 M2 die passende Lösung unter dem Gesichtspunkt der Disk-I/O-Performance auszuwählen. Im Folgenden sollen verschiedene Kombinationen von RAID-Controllern und Datenträgern untersucht werden. Informationen zur Auswahl der Datenträger selbst finden sich im Kapitel „Disk-I/O: Performance von Speichermedien“. Festplatten Die erste wesentliche Komponente sind die Festplatten. Wenn im Folgenden von „Festplatten“ die Rede ist, so ist dies als Oberbegriff gemeint für HDDs („hard disk drives“, also konventionelle Festplatten) und SSDs („solid state drives“, also nichtflüchtige elektronische Speichermedien). Mischkonfigurationen von SAS- und SATA-Festplatten in einem System sind zulässig, sofern sie nicht für spezielle Festplattentypen im Konfigurator ausgeschlossen sind. Durch die Verwendung von 2.5"-Festplatten anstelle von 3.5"-Festplatten sind mehr Festplatten pro System möglich. Dadurch sinkt die Belastung, die jede einzelne Festplatte zu bewältigen hat, und die maximale Gesamt-Performance des Systems steigt. Detailliertere Performance-Aussagen zu den Festplattentypen sind im Kapitel „Disk-I/O: Performance von Speichermedien“ im vorliegenden Performance Report zu finden. Modellvarianten Die maximale Anzahl von Festplatten im System hängt von der Systemkonfiguration ab. Die folgende Tabelle stellt die wesentlichen Fälle zusammen. Formfaktor Schnittstelle Anschlusstyp Anzahl PCIeController Maximalzahl Festplatten 3.5" SATA 6G direkt 0 2 2.5" SATA 6G direkt 0 4 3.5" SATA 6G, SAS 12G direkt 1 2 2.5" SATA 6G, SAS 12G direkt 1 6 RAID-Controller Neben den Festplatten ist der RAID-Controller die zweite Performance-bestimmende Schlüsselkomponente. Bei diesen Controllern bietet das „Modular RAID“ Konzept der PRIMERGY Server eine Fülle von Möglichkeiten, um den verschiedenen Anforderungen unterschiedlichster Anwendungsszenarien gerecht zu werden. Die folgende Tabelle fasst die wichtigsten Eigenschaften der verfügbaren RAID-Controller der PRIMERGY TX1320 M2 zusammen. Pro Controller ist hierin ein kurzer Alias angegeben, der bei der anschließenden Zusammenstellung der Performance-Werte verwendet wird. Controller-Name Alias Cache Unterstützte Interfaces Im System Max. # Disks pro Controller FBU RAID Levels LSI SW RAID on Intel C236 (Onboard SATA) Sunrise Point - SATA 6G - 4 × 2.5" 2 × 3.5" 0, 1, 10 - PRAID CP400i PRAID CP400i - SATA 6G SAS 12G PCIe 3.0 x8 6 × 2.5" 2 × 3.5" 0, 1, 1E, 5, 10, 50 - PRAID EP400i PRAID EP400i 1 GB SATA 6G SAS 12G PCIe 3.0 x8 6 × 2.5" 2 × 3.5" 0, 1, 1E, 5, 6, 10, 50, 60 PRAID EP420i PRAID EP420i 2 GB SATA 6G SAS 12G PCIe 3.0 x8 6 × 2.5" 2 × 3.5" 0, 1, 1E, 5, 6, 10, 50, 60 Seite 22 (31) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY TX1320 M2 Version: 1.1 2016-02-29 Der Onboard RAID Controller ist im Chip-Set Intel C236 auf dem Systemboard des Servers realisiert und benutzt die CPU des Servers für die RAID-Funktionalität. Dieser Controller ist eine einfache Lösung, die keinen PCIe-Steckplatz benötigt. Systemspezifische Schnittstellen Die Schnittstellen eines Controllers zum Systemboard und zu den Festplatten haben jeweils spezifische Grenzen für den Datendurchsatz. Diese Grenzen sind in der folgenden Tabelle zusammengestellt. Das Minimum dieser beiden Werte ist eine prinzipielle Grenze, die nicht überschritten werden kann. Dieser Wert ist in der folgenden Tabelle mit Fettdruck hervorgehoben. ControllerAlias Effektiv in der Konfiguration Sunrise Point 4 × SATA 6G 2060 MB/s 4 × DMI 3.0 3433 MB/s - PRAID CP400i 8 × SAS 12G 8240 MB/s 8 × PCIe 3.0 6761 MB/s - PRAID EP400i 8 × SAS 12G 8240 MB/s 8 × PCIe 3.0 6761 MB/s - PRAID EP420i 8 × SAS 12G 8240 MB/s 8 × PCIe 3.0 6761 MB/s - # Disk-seitige Datenkanäle Grenze für Durchsatz Disk-Interface # CPU-seitige Datenkanäle Grenze für Durchsatz CPU-seitiges Interface Anschluss über Expander Weitere Details zu den RAID-Controllern der PRIMERGY Systeme finden sich im White Paper „RAIDController-Performance“. http://www.fujitsu.com/de/primergy Seite 23 (31) White Paper Performance Report PRIMERGY TX1320 M2 Version: 1.1 2016-02-29 Einstellungen Der Cache von HDDs hat in den meisten Fällen einen großen Einfluss auf die Disk-I/O-Performance. Er wird häufig als Sicherheitsproblem bei Stromausfall angesehen und daher abgeschaltet. Dennoch wurde er von den Festplattenherstellern aus gutem Grund zur Steigerung der Schreib-Performance integriert. Aus Performance-Gründen ist es daher empfehlenswert den Festplatten-Cache einzuschalten. Um Datenverlusten bei Stromausfall vorzubeugen, empfiehlt es sich das System mit einer USV auszustatten. Bei Controllern mit Cache gibt es mehrere einstellbare Parameter. Die jeweils optimalen Einstellungen können vom RAID-Level, vom Anwendungsszenario und vom Datenträgertyp abhängen. Besonders bei den RAID-Levels 5 und 6 (und den davon abgeleiteten komplexeren RAID-Levels 50 und 60) ist bei Anwendungsszenarien mit Schreibanteil das Einschalten des Controller-Caches Pflicht. Bei aktiviertem Controller-Cache sollten die darin temporär gespeicherten Daten gegen Verlust bei Stromausfall gesichert werden. Hierfür ist geeignetes Zubehör verfügbar (beispielsweise eine FBU). Zwecks einfacher und sicherer Handhabung der Einstellungen von RAID-Controller und Festplatten empfiehlt sich die für PRIMERGY Server mitgelieferte Software „ServerView RAID Manager“. Üblicherweise wird man – spezifisch für den Anwendungsfall – mittels der vordefinierten Modi „Performance“ oder „Data Protection“ die kompletten Cache-Einstellungen für Controller und Festplatten en bloc vornehmen. Der Modus „Performance“ gewährleistet für die Mehrzahl der Anwendungsszenarien Performance-optimale Einstellungen. Im Zusammenhang mit der RAID-Controller-Option „FastPath“ sollte der Modus „Fast Path optimum“ gewählt werden, wenn bei wahlfreien Zugriffen mit kleinen Blöcken (≤ 8 kB, z. B. OLTP-Betrieb von Datenbanken) höchste Transaktionsraten mit SSDs erreicht werden sollen. Nähere Informationen zu den Einstellungsmöglichkeiten beim Controller-Cache sind im White Paper „RAIDController-Performance“ zu finden. Performance-Werte Generell hängt die Disk-I/O-Performance eines RAID-Verbandes von Festplattentyp und –anzahl, vom RAID-Level und vom RAID-Controller ab. Sofern die Limitierungen der systemspezifischen Schnittstellen nicht überschritten werden, gelten also Aussagen zur Disk-I/O-Performance für alle PRIMERGY Systeme. Daher gelten auch alle Performance-Aussagen des Dokumentes „RAID-Controller-Performance“ für die PRIMERGY TX1320 M2, soweit die dort vermessenen Konfigurationen auch von diesem System unterstützt werden. Die Performance-Werte der PRIMERGY TX1320 M2 werden im Folgenden tabellarisch zusammengestellt, jeweils spezifisch für verschiedene RAID-Level, Zugriffsarten und Blockgrößen. Wesentlich verschiedene Konfigurationsvarianten werden getrennt behandelt. Hierbei werden die etablierten Messgrößen, wie sie schon im Unterkapitel Benchmark-Beschreibung erwähnt wurden, verwendet. Bei den wahlfreien Zugriffen wird also die Transaktionsrate angegeben, und bei den sequentiellen Zugriffen der Datendurchsatz. Um Verwechslungen der Maßeinheiten zu vermeiden, sind die Tabellen für die beiden Arten von Zugriffen getrennt. In den Tabellenzellen sind die maximal erreichbaren Werte eingetragen. Das bedeutet dreierlei: Zum einen wurden Festplatten mit optimaler Performance verwendet (die Komponenten sind im Unterkapitel Benchmark-Umgebung näher beschrieben). Des Weiteren sind Cache-Einstellungen von Controllern und Festplatten zugrunde gelegt, die für das jeweilige Zugriffsszenario und den RAID-Level optimal sind. Und schließlich ist jeder Wert das Maximum über den gesamten Bereich von Belastungsintensitäten (# of Outstanding I/Os). Zwecks zusätzlicher Visualisierung der Zahlenwerte ist jede Tabellenzelle mit einem waagerechten Balken hinterlegt, dessen Länge proportional zum Zahlenwert in der Tabellenzelle ist. Alle Balken, die im gleichen Längenmaßstab dargestellt sind, haben die gleiche Farbe. Es können also nur die Tabellenzellen mit gleichfarbigen Balken sinnvoll visuell miteinander verglichen werden. Da die waagerechten Balken in den Tabellenzellen die maximal erreichbaren Performance-Werte veranschaulichen, sind sie als von links nach rechts heller werdende Farbverläufe dargestellt. Der helle Farbton am rechten Balkenende drückt aus, dass der Wert das Maximum ist und nur bei optimalen Voraussetzungen erreicht werden kann. Je dunkler dann der Farbton nach links hin wird, umso häufiger wird der entsprechende Wert in der Praxis erreichbar sein. Seite 24 (31) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY TX1320 M2 Version: 1.1 2016-02-29 2.5" - Wahlfreie Zugriffe (maximale Performance-Werte in IO/s): C236 PRAID CP400i PRAID EP400i PRAID EP420i ST91000640NS SATA HDD SSDSC2BB480G4C SATA SSD SSDs wahlfrei 64 kB Blöcke 67% read [IO/s] SSDs wahlfrei 8 kB Blöcke 67% read [IO/s] HDDs wahlfrei 64 kB Blöcke 67% read [IO/s] HDDs wahlfrei 8 kB Blöcke 67% read [IO/s] # Disks Festplattentyp RAIDController Konfigurationsvariante RAID-Level PRIMERGY TX1320 M2 Modellvariante PY TX1320M2/SFF 2 1 380 332 27821 4667 4 4 0 10 683 562 390 323 43486 37799 9602 7645 2 1 1153 971 37739 4685 HUC156045CSS204 SAS HDD 6 10 3162 1641 103415 15269 SSDSC2BB480G4C SATA SSD 6 6 0 5 3728 1863 1953 939 124627 29313 20451 6667 2 1 1590 888 38230 4953 HUC156045CSS204 SAS HDD 6 10 3557 2468 119902 15053 SSDSC2BB480G4C SATA SSD 6 6 0 5 4091 2640 2888 1410 151055 47436 20607 7192 2 1 1544 994 38253 4813 HUC156045CSS204 SAS HDD 6 10 3611 2475 119959 11329 SSDSC2BB480G4C SATA SSD 6 6 0 5 4163 2801 2938 1583 156514 51218 19848 8531 (kursiv: berechnet) http://www.fujitsu.com/de/primergy Seite 25 (31) White Paper Performance Report PRIMERGY TX1320 M2 Version: 1.1 2016-02-29 2.5" - Sequentielle Zugriffe (maximale Performance-Werte in MB/s): C236 PRAID CP400i PRAID EP400i PRAID EP420i ST91000640NS SATA HDD SSDSC2BB480G4C SATA SSD SSDs sequentiell 64 kB Blöcke 100% write [MB/s] SSDs sequentiell 64 kB Blöcke 100% read [MB/s] HDDs sequentiell 64 kB Blöcke 100% write [MB/s] HDDs sequentiell 64 kB Blöcke 100% read [MB/s] # Disks Festplattentyp RAIDController Konfigurationsvariante RAID-Level PRIMERGY TX1320 M2 Modellvariante PY TX1320M2/SFF 2 1 113 108 711 417 4 4 0 10 427 224 423 212 1274 1003 1528 776 327 230 914 397 2 1 HUC156045CSS204 SAS HDD 6 10 828 689 2681 1177 SSDSC2BB480G4C SATA SSD 6 6 0 5 1383 1158 1379 1148 2685 2680 2368 1745 2 1 350 232 914 403 HUC156045CSS204 SAS HDD 6 10 898 710 2718 1042 SSDSC2BB480G4C SATA SSD 6 6 0 5 1418 1193 1421 1184 2715 2733 2087 1816 375 232 910 389 2 1 HUC156045CSS204 SAS HDD 6 10 920 693 2766 1168 SSDSC2BB480G4C SATA SSD 6 6 0 5 1425 1161 1418 1169 2763 2773 2323 1960 (kursiv: berechnet) Seite 26 (31) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY TX1320 M2 Version: 1.1 2016-02-29 3.5" - Wahlfreie Zugriffe (maximale Performance-Werte in IO/s): SSDs wahlfrei 64 kB Blöcke 67% read [IO/s] SSDs wahlfrei 8 kB Blöcke 67% read [IO/s] HDDs wahlfrei 64 kB Blöcke 67% read [IO/s] HDDs wahlfrei 8 kB Blöcke 67% read [IO/s] Festplattentyp C236 PRAID CP400i ST1000NM0033 SATA HDD ST1000NM0033 SATA HDD 2 2 1 1 351 414 321 N/A 378 N/A N/A N/A PRAID EP400i PRAID EP420i ST1000NM0033 SATA HDD ST1000NM0033 SATA HDD 2 2 1 1 598 588 434 N/A 539 N/A N/A N/A # Disks RAIDController Konfigurationsvariante RAID-Level PRIMERGY TX1320 M2 Modellvariante PY TX1320M2/LFF (kursiv: berechnet) 3.5" - Sequentielle Zugriffe (maximale Performance-Werte in MB/s): SSDs sequentiell 64 kB Blöcke 100% write [MB/s] SSDs sequentiell 64 kB Blöcke 100% read [MB/s] HDDs sequentiell 64 kB Blöcke 100% write [MB/s] HDDs sequentiell 64 kB Blöcke 100% read [MB/s] Festplattentyp C236 PRAID CP400i ST1000NM0033 SATA HDD ST1000NM0033 SATA HDD 2 2 1 1 187 187 176 N/A 176 N/A N/A N/A PRAID EP400i PRAID EP420i ST1000NM0033 SATA HDD ST1000NM0033 SATA HDD 2 2 1 1 211 237 182 N/A 176 N/A N/A N/A # Disks RAIDController Konfigurationsvariante RAID-Level PRIMERGY TX1320 M2 Modellvariante PY TX1320M2/LFF (kursiv: berechnet) Fazit Die PRIMERGY TX1320 M2 erreicht im Vollausbau mit leistungsfähigen Festplatten einen Durchsatz von bis zu 2773 MB/s bei sequentiellen Lastprofilen und eine Transaktionsrate von bis zu 156514 IO/s bei typischen wahlfreien Anwendungsszenarien. Für bestmögliche Performance empfiehlt sich einer der steckbaren PRAID-Controller. Zum Betrieb von SSDs im höchstmöglichen Performance-Bereich ist bei den einfacheren RAID-Levels 0, 1 und 10 bereits der PRAID CP400i geeignet, bei RAID 5 ist ein PRAID-Controller mit Cache vorzuziehen. Im Falle von HDDs bringt der Controller-Cache für wahlfreie Lastprofile mit signifikantem Schreibanteil bei allen RAID-Levels Performance-Vorteile. http://www.fujitsu.com/de/primergy Seite 27 (31) White Paper Performance Report PRIMERGY TX1320 M2 Version: 1.1 2016-02-29 STREAM Benchmark-Beschreibung STREAM ist ein seit vielen Jahren eingesetzter synthetischer Benchmark zur Ermittlung des Speicherdurchsatzes, der von John McCalpin während seiner Professur an der Universität in Delaware entwickelt wurde. Heute wird STREAM an der Universität von Virginia betreut. Dort kann der Quellcode wahlweise in Fortran oder C heruntergeladen werden. Besonders im HPC-Umfeld spielt STREAM nach wie vor eine wichtige Rolle. So ist er z.B. Bestandteil der HPC Challenge Benchmark-Suite. Der Benchmark ist so konzipiert, dass er sowohl auf PCs als auch auf Serversystemen eingesetzt werden kann. Die Maßeinheit des Benchmarks ist GB/s, also die Anzahl Gigabytes, die pro Sekunde gelesen und geschrieben werden kann. STREAM misst den Speicherdurchsatz bei sequentiellen Zugriffen. Diese können generell effizienter durchgeführt werden als Zugriffe, die zufällig auf den Speicher verteilt sind, da bei sequentiellem Zugriff die Prozessor-Caches genutzt werden. Vor der Ausführung wird der Quellcode der zu vermessenden Umgebung angepasst. So muss die Größe des Datenbereiches mindestens 12mal höher sein als die Summe aller „last-level“ Prozessor-Caches, damit diese einen möglichst geringen Einfluss auf das Ergebnis nehmen. Mit Hilfe der OpenMPProgrammbibliothek können ausgewählte Programmteile während der Laufzeit des Benchmarks parallel ausgeführt werden, wodurch eine optimale Lastverteilung auf die verfügbaren Prozessorkerne erreicht wird. Bei der Ausführung wird der definierte Datenbereich, bestehend aus 8-Byte-Elementen, nacheinander auf vier Arten kopiert, wobei teilweise zusätzlich arithmetische Berechnungen durchgeführt werden. Art Ausführung Bytes je Schritt Gleitkommarechnung je Schritt COPY a(i) = b(i) 16 0 SCALE a(i) = q × b(i) 16 1 SUM a(i) = b(i) + c(i) 24 1 TRIAD a(i) = b(i) + q × c(i) 24 2 Bei jeder Berechnungs-Art wird der Durchsatz in GB/s ausgegeben. Die Unterschiede der verschiedenen Werte sind auf modernen Systemen in der Regel nur gering. Zum Vergleich wird im Allgemeinen nur noch der ermittelte TRIAD-Wert verwendet. Die Messergebnisse hängen in erster Linie von der Taktfrequenz der Speichermodule ab, die Prozessoren beeinflussen die arithmetischen Berechnungen. 9 In diesem Kapitel sind Durchsätze durchgängig zur Basis 10 angegeben (1 GB/s = 10 Byte/s). Benchmark-Umgebung System Under Test (SUT) Hardware Modell PRIMERGY TX1320 M2 Prozessor Celeron G3900 Pentium G4400 Core i3-6100 ® ® Intel Xeon Processor E3-1200 v5 Product Family Speicher 4 × 16GB (1x16GB) 2Rx8 DDR4-2133 U ECC Software Betriebssystem SUSE Linux Enterprise Server 12 (x86_64) Betriebssystemeinstellungen Transparent Huge Pages inactivated Compiler Intel C++ Composer XE 2015 for Linux Benchmark Stream.c Version 5.10 Einige Komponenten sind möglicherweise nicht in allen Ländern / Vertriebsregionen verfügbar. Seite 28 (31) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY TX1320 M2 Version: 1.1 2016-02-29 Benchmark-Ergebnisse Prozessor Speicherfrequenz [MHz] Max. Speicher- Cores bandbreite [GB/s] Prozessor frequenz [GHz] TRIAD [GB/s] Celeron G3900 2133 34.1 2 2.80 30.2 Pentium G4400 2133 34.1 2 3.30 30.2 Core i3-6100 2133 34.1 2 3.70 30.5 Xeon E3-1240L v3 2133 34.1 4 2.10 29.5 Xeon E3-1260L v3 2133 34.1 4 2.90 29.8 Xeon E3-1220 v3 2133 34.1 4 3.00 29.7 Xeon E3-1225 v3 2133 34.1 4 3.30 29.8 Xeon E3-1230 v3 2133 34.1 4 3.40 30.1 Xeon E3-1240 v3 2133 34.1 4 3.50 30.1 Xeon E3-1270 v5 2133 34.1 4 3.60 30.1 Xeon E3-1280 v5 2133 34.1 4 3.70 30.1 Die folgende Grafik verdeutlicht den Durchsatz der PRIMERGY TX1320 M2 im Vergleich zu ihrem Vorgänger, der PRIMERGY TX1320 M1. PRIMERGY TX1320 M2 Xeon E3-1280 v5 Xeon E3-1270 v5 Xeon E3-1240 v5 Xeon E3-1230 v5 Xeon E3-1225 v5 Xeon E3-1220 v5 Xeon E3-1260L v5 Xeon E3-1240L v5 Core i3-6100 Pentium G4400 Celeron G3900 PRIMERGY TX1320 M1 STREAM TRIAD: PRIMERGY TX1320 M2 vs. PRIMERGY TX1320 M1 Xeon E3-1281 v3 Xeon E3-1271 v3 Xeon E3-1241 v3 Xeon E3-1231 v3 Xeon E3-1220 v3 Xeon E3-1275L v3 Xeon E3-1240L v3 Core i3-4330 Pentium G3420 Celeron G1820 0 http://www.fujitsu.com/de/primergy 5 10 15 20 25 30 GB/s Seite 29 (31) White Paper Performance Report PRIMERGY TX1320 M2 Version: 1.1 2016-02-29 Literatur PRIMERGY Server http://primergy.de/ PRIMERGY TX1320 M2 Dieses White Paper: http://docs.ts.fujitsu.com/dl.aspx?id=517aad33-78c4-4e1c-9a59-c30aa4a765af http://docs.ts.fujitsu.com/dl.aspx?id=d21c75e6-f493-4e16-9583-8ee02a585dc7 http://docs.ts.fujitsu.com/dl.aspx?id=bdca5c63-c7cf-4ea8-a7da-5d64ba7d20de Datenblatt http://docs.ts.fujitsu.com/dl.aspx?id=b1765416-3b43-4f32-9985-2643d95202cf PRIMERGY Performance http://www.fujitsu.com/de/x86-server-benchmarks Performance von Server-Komponenten http://www.fujitsu.com/de/products/computing/servers/mission-critical/benchmarks/x86components.html RAID-Controller-Performance 2013 http://docs.ts.fujitsu.com/dl.aspx?id=71fac54b-7ec3-4b3f-b13d-f80fbb42d583 RAID-Controller-Performance 2016 http://docs.ts.fujitsu.com/dl.aspx?id=7826d783-bc71-4cd7-8486-d74f4dc2509c Disk-I/O: Performance von Speichermedien und RAID-Controllern Grundlagen Disk-I/O-Performance http://docs.ts.fujitsu.com/dl.aspx?id=3d4fbad8-2a7e-465f-b9ee-d43b711f636d Informationen über Iometer http://www.iometer.org SPECcpu2006 http://www.spec.org/osg/cpu2006 Benchmark Überblick SPECcpu2006 http://docs.ts.fujitsu.com/dl.aspx?id=04351fd2-8a69-42a3-ba1c-4342dcc89b89 SPECpower_ssj2008 http://www.spec.org/power_ssj2008 Benchmark-Überblick SPECpower_ssj2008 http://docs.ts.fujitsu.com/dl.aspx?id=66467935-98dc-4374-80b2-3ddae4c73491 STREAM http://www.cs.virginia.edu/stream/ Seite 30 (31) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY TX1320 M2 Version: 1.1 2016-02-29 Kontakt FUJITSU Website: http://www.fujitsu.com/de/ PRIMERGY Product Marketing mailto:[email protected] PRIMERGY Performance und Benchmarks mailto:[email protected] © Copyright 2016 Fujitsu Technology Solutions. Fujitsu und das Fujitsu Logo sind Handelsnamen und/oder eingetragene Warenzeichen von Fujitsu Ltd. in Japan und anderen Ländern. Andere Firmen-, Produkt- und Servicebezeichnungen können Marken oder eingetragene Marken der jeweiligen Eigentümer sein. Änderung von technischen Daten sowie Lieferbarkeit vorbehalten. Haftung oder Garantie für Vollständigkeit, Aktualität und Richtigkeit der angegebenen Daten und Abbildungen ausgeschlossen. Wiedergegebene Bezeichnungen können Marken und/oder Urheberrechte sein, deren Benutzung durch Dritte für eigene Zwecke die Rechte der Inhaber verletzen kann. Weitere Einzelheiten unter http://www.fujitsu.com/de/resources/navigation/terms-of-use.html 2016-02-29 WW DE http://www.fujitsu.com/de/primergy Seite 31 (31)
© Copyright 2024 ExpyDoc