Benchmarkonderzoek: Geoptimaliseerde valtest met Dell

Benchmarkonderzoek:
Geoptimaliseerde valtest met Dell, Intel en Altair
Fredrik Nordgren, MSc M.E. (Master of Science in Mechanical Engineering), Application Engineer, Altair
Eric Lequiniou, Directeur, High Performance Computing, Altair
Martin Hilgeman, HPC Consultant, Dell
© Dell | Sectie 1
Benchmarkonderzoek: Geoptimaliseerde valtest met Dell, Intel en Altair
1
Inleiding
De valtest is een van de belangrijkste onderdelen van het ontwerpen en ontwikkelen van nieuwe producten, en
software die deze test nauwkeurig kan simuleren kan fabrikanten aanzienlijke kostenbesparingen opleveren en de
introductie van het product op de markt versnellen. Dell, Intel en Altair hebben samen een geïntegreerde simulatie en
optimalisatie analyse toegepast op een virtuele valtest-oplossing, voor een bewezen toename in snelheid en
nauwkeurigheid. Met deze oplossing kunnen engineers meer verschillende ontwerpen onderzoeken wat leidt tot een
extra robuust en betrouwbaar product. Hierdoor kunnen fabrikanten de ontwikkelingstijd van hun ontwerpen
aanzienlijk inkorten, waardoor de productkwaliteit toeneemt en de levertijd afneemt.
Uitdaging:
De snelheid en nauwkeurigheid van de valtest
verbeteren
Veel producten, van smartphones tot auto-onderdelen, moeten de valtest doorstaan voordat ze in productie gaan.
Het is de taak van de fabrikant om producten te ontwerpen en ontwikkelen die zo goed mogelijk presteren als ze
vallen, geplet worden of op een andere manier beschadigd worden.
De valtest-simulatiesoftware helpt fabrikanten door de tijd die het kost om een product te testen te beperken, een
betere productkwaliteit mogelijk te maken en fysieke tests overbodig te maken. De software bootst de complexiteit
van de fysieke omgeving en de materialen na, simuleert de impact of val, en biedt gedetailleerde technische
informatie over hoe het product presteert.
In het algemeen is de software voor dergelijke situaties al volwassen, omdat de vereisten en oplossingen van valtests
gebaseerd zijn op ongevalsimulaties met auto's. In het geval van telefoons zijn er echter unieke uitdagingen aan de
valtest verbonden, waaronder het feit dat bij een telefoon veel verschillende onderdelen, materialen en
bevestigingsmethodes gebruikt worden, die allemaal zorgvuldig gemodelleerd moeten worden om de potentiële
valschade te kunnen beoordelen. Daarnaast moeten engineers het model handmatig instellen en de gegevens
verwerken, wat een tijdrovende bezigheid is.
Het uiteindelijke doel is een robuust product dat alle valhoeken en andere soorten druk kan weerstaan (druk op het
glas, buigen, draaien etc.). Hiervoor zijn vele simulaties nodig, waarvoor naast een snelle en schaalbare oplosser ook
een software-omgeving nodig is waarin engineers verschillende ontwerpen kunnen onderzoeken om het fysieke
resultaat van de valtest beter te kunnen doorgronden. Daarnaast hebben engineers geïntegreerde, geautomatiseerde
oplossingen nodig met belangrijke onderdelen zoals geïntegreerde optimalisatie, om processen te stroomlijnen en de
kans op fouten te beperken.
© Dell | Section 1
Benchmarkonderzoek: Geoptimaliseerde valtest met Dell, Intel en Altair
2
Oplossing: Versnel de uitvoering van de
valtestsimulatie met Dell, Intel en Altair
Dell, Intel en Altair hebben in dit onderzoek samengewerkt om Altairs
valtest-simulatiesoftware te testen op een Dell cluster gebaseerd op
Intel processors. De door Dell en Intel geboden infrastructuur helpt de
simulatie te versnellen door de prestaties van de valtest-analyse
oplosser RADIOSS te verbeteren, die opereert op een Dell high-end
cluster uitgerust met de nieuwste Intel E5 v2 processors. Deze oplosser,
die de belangrijkste rekenintensieve component van de Altair valtestoplossing is, wordt gebruikt voor het soort complexe simulaties dat baat
heeft bij efficiënte hardware en snelle processors...
Altair valtest-oplossing
Altairs geautomatiseerde valtest-oplossing bestaat uit een pakket van
geïntegreerde software tools die ontworpen zijn om de prestaties,
doorvoer en gebruiksvriendelijkheid te optimaliseren:


HyperWorks softwarepakket voor modellering, analyse en optimalisatie integreert de volgende componenten in
een volledige valtest-oplossing:
o High-performance eindige elementen voorverwerkingsproduct (HyperMesh) om zelfs de grootste
modellen voor te bereiden, met een complete set van geometrische bewerkingstools om modellen
efficiënt voor te bereiden voor meshing
o Structurele analyse-oplosser (RADIOSS) al 20 jaar lang bewezen als marktleider in ongevalsimulatie van
auto's, met kwaliteit, robuustheid en schaalbaarheid van het hoogste niveau. Met RADIOSS’ Advanced
Mass Scaling (AMS) technologie kunnen RADIOSS gebruikers zelfs nog betere prestaties verwachten.
o Hypermodern ontwerp-onderzoek, benadering en optimalisatie geïntegreerde software (HyperStudy)
inclusief vorm-optimalisatie, directe parametrisatie, dataverzameling en directe RADIOSS
resultatenlezers
PBS Professional werkbelasting-beheersoftware voor het plannen van high-performance computing (HPC)
taken, met sterke schaalbaarheid en gebruiksvriendelijkheid, al 20 jaar lang bewezen op duizenden
consumentenwebsites.
Voorgaande tests van Altair toonden aan dat deze oplossing, met RADIOSS’ AMS ingeschakeld, de doorlooptijd van de
valtest kan inkorten van 65 tot 36 minuten (45% verbetering), vergeleken met de 64 minuten doorlooptijd van een
toonaangevende alternatieve oplosser.
Dell HPC oplossingen gebaseerd op Intel technologie
Dell biedt de HPC bouwstenen en kant-en-klare oplossingen waarmee bedrijven over de kracht van HPC technologie
kunnen beschikken en de innovatie en ontwikkeling van hun product kunnen optimaliseren. Door voor Intel en Altair
te kiezen kunnen bewezen oplossingen voor productontwikkeling op de markt worden gebracht die de productiviteit
verbeteren, kosten beperken en het beheer van complexe clusteromgevingen vereenvoudigen.
In het geval van deze valtest-analyse werd gekozen voor Dell PowerEdge M620 blade servers die gebaseerd zijn op
de Intel® Xeon® processor E5-2600v2 productfamilie. Deze krachtige en energiezuinige processors beschikken over
50% meer kernen en cache dan de vorige generatie; samen met een sneller geheugen en een aantal hardware
verbeteringen ten opzichte van servers gebaseerd op de vorige generatie Intel Xeon processor.
Nog hogere prestaties voor HPC toepassingen kunnen worden bereikt door Intel® Advanced Vector Extensions
(Intel® AVX). Intel® AVX versnelt de vector en floating point berekeningen met ondersteuning voor 256-bit vectors
en versnelde 32/64 bit gegevensconversie. De Intel® Xeon® processor E5 v2 familie bestaat uit een uitgebreid
aanbod van processorspecificaties dat varieert van aantal kernen tot modellen met een geoptimaliseerde frequentie
voor gebruikersspecifieke toepassingen.
© Dell | Section 1
Benchmarkonderzoek: Geoptimaliseerde valtest met Dell, Intel en Altair
3
Benchmarking projectoverzicht
Het toevoegen van een demper tussen het pc-bord en de LCD
module om vervorming tegen te gaan bij een val op de
achterzijde – rechts worden twee verschillende dempers
getoond.
Om de prestaties van de Dell-Intel-Altair oplossing te testen hebben engineers zich gericht op een specifieke
toepassing, namelijk of door het gebruik van een dempende pakking de druk op het ontwerp van een telefoon zou
afnemen.
In dit scenario zorgt de ruimte tussen de backcover en de bescherming voor buigingen en veel spanning op de LCD
module in een valtest op de achterkant. Het doel was om een optimale demper te ontwerpen met ideale
eigenschappen (dikte, formaat, flexibiliteit etc.) die de druk op de LCD module zoveel mogelijk kon minimaliseren.
1.
Ontwerp: In de eerste fase van het project werd het concept gemodelleerd in HyperMesh en werden
ontwerpvariabelen gegenereerd met morphing technologie en input file parametrisatie.
2.
Optimalisatie: Een design-of-experiment (DOE) werd uitgevoerd om een response surface te creëren.
Vervolgens werd een optimalisatie uitgevoerd op de response surface in plaats van het eindige elementen
model.
3.
Verificatie: Het geoptimaliseerde ontwerp werd beoordeeld en gesimuleerd met finite element analysis (FEA)
en de prestatieresultaten werden geverifieerd.
Deze simulaties werden uitgevoerd op systemen met de volgende componenten:
 16x Dell PowerEdge M620 blade servers met Intel Xeon E5-2680v2, E5-2667v2, en E5-2697v2 processors, 128 GB
geheugen per node, leveraging Mellanox FDR Inifiniband interconnects.
Grafische weergave van de druk op de LCD als functie van
oppervlakte en dikte van de demper.
© Dell | Section 1
Benchmarkonderzoek: Geoptimaliseerde valtest met Dell, Intel en Altair
4
Prestatieresultaten
Met Altair’ RADIOSS software op een Dell PowerEdge M620 blade systeem waren engineers in staat om de 21 valtestsimulaties uit te voeren die vereist waren in dit optimalisatie-onderzoek en 3 verschillende Intel processors (Intel
Xeon E5-2690v2, E5-2667v2 en E5-2697v2 processors respectievelijk) in 2-node configuraties te vergelijken, met de
volgende kern- en ruwe prestatiegegevens:
CPU
Totale kernen
voor 2 nodes
Ruwe FP prestaties
GFLOP/s
Enkele simulatie
Gemiddelde tijd (s)
Totale tijd
Voor 21 simulaties (s)
E5-2680v2
40
896
719
15110
E5-2667v2
32
845
742
15598
E5-2697v2
48
1037
660
13868
Figuur 1. Samenvatting van prestaties
Het is duidelijk dat, gemeten in verstreken tijd, de best presterende processor de E5-2697v2 is; het product met de
lagere frequentie maar met meer kernen. Deze prestatie wordt verklaard door de uitstekende schaalbaarheid van
RADIOSS, omdat de lagere frequentie of intrinsieke prestaties van elke kern de prestaties van het grote aantal kernen
niet negatief beïnvloedt.
900
800
Verstreken tijd (s)
700
600
500
E5-2680v2
400
E5-2667v2
300
E5-2697v2
200
100
0
1
2
3
4
5
6
7
8
9 10 11 12 13 14 15 16 17 18 19 20 21
Simulatie nummer
Figuur 2. Details van prestaties
© Dell | Section 1
Benchmarkonderzoek: Geoptimaliseerde valtest met Dell, Intel en Altair
5
Vergeleken met de referentietijd van 65 minuten (3900 seconden) die werd bereikt op een enkele node van Intel
Xeon [email protected] GHz (met 8 kernen), zijn 2 nodes met E5-2697 v2 ongeveer 6 keer sneller (660 seconden voor een
enkele simulatie). Hierdoor kon het gehele optimalisatie-onderzoek (21 simulaties) in minder dan 4 uur (13,868
seconden) worden voltooid.
Daarnaast kunnen gebruikers met RADIOSS’ Advanced Mass Scaling (AMS) nog sneller resultaten bereiken met
dezelfde nauwkeurigheid. AMS biedt een geavanceerde oplossing voor quasi-statische problemen en een alternatieve
oplossing voor impliciete non-lineaire simulatie waar convergentie soms moeilijk te bereiken is, bijvoorbeeld door
non-lineariteit in de contacten, complex materiaalgedrag en modellering van scheuren.
De verwachte prestaties met AMS ingeschakeld zijn 1,7 keer sneller, met een totale doorlooptijd van minder dan 2,5
uur (minder dan 400 seconden voor een enkele simulatie) op basis van de snelste configuratie met Intel E5-2697v2.
Een ander aspect om rekening mee te houden bij het optimaliseren van configuraties is dat schaalbaarheid niet alleen
een functie is van de Intel Xeon processor en het aantal kernen, maar ook van het aantal gebruikte nodes. Vanwege
het parallelle karakter van deze simulaties mag men verwachten dat door ongeveer de helft van de 21 simulaties op
de eerste 2 nodes te draaien en de rest op een tweede groep van 2 nodes, een versnelling van factor 2 kan worden
bereikt. Deze logica kan worden toegepast om bereikte resultaten te extrapoleren naar situaties met meer nodes om
de gewenste simulatietijd te bereiken – bijvoorbeeld een simulatiecluster met 8 nodes Een dergelijke aanpak kan
worden vereenvoudigd door een tool als PBS Professional te gebruiken, die de simulatietaken automatisch verdeelt
over de beschikbare bronnen om de efficiëntie van berekeningen en het gebruik van bronnen te optimaliseren.
Energiezuinigheid en prestaties
In moderne bedrijfsstrategieën en planningsprocessen zijn energie en koeling belangrijke aspecten in het maken van
een aankoopbeslissing. De energiezuinigheid van een simulatie-configuratie is dus van groot belang voor bedrijven
die op zoek zijn naar zowel optimaal energieverbruik als optimale prestaties.
Tijdens het uitvoeren van de simulaties op het Dell PowerEdge blade systeem werd het energieverbruik gemeten in
aantal Watt voor elke simulatie (bekijk de grafiek hieronder). Hoewel het gemiddelde energieverbruik van de Intel
Xeon E5-2667v2 en E5-2697v2 gelijkwaardig zijn, gebruikt de Xeon E5-2680v2 duidelijk minder stroom tijdens het
uitvoeren van de 21 simulaties van deze testcase.
Anders bekeken: Voor een 24x7 always-on werkbelasting in een productieomgeving, gebruikt de Xeon E5-2680v2
21.3% minder stroom per node dan de Xeon E5-2697v2, wat meer is dan het TDP verschil van 115W versus 135W
(17%).
© Dell | Section 1
Benchmarkonderzoek: Geoptimaliseerde valtest met Dell, Intel en Altair
6
Aanbevolen configuraties
De volgende aanbevelingen kunnen worden gedaan voor de nodes die noodzakelijk zijn voor een simulatieomgeving gebaseerd op het valtest-scenario, waarbij gekeken wordt naar algemene prestaties,
prijs/prestatieverhouding en energiezuinigheid. Het daadwerkelijk aantal nodes hangt af van de algemene vereisten
van de werkbelasting.
Maximale prestaties:
Dell PowerEdge compute node met Intel Xeon E5-2697v2 processors (in totaal 24 cores per node),

64GB geheugen en een Mellanox ConnectIB card

Minimale configuratie: 2 nodes
Hoge prestaties, maximale energiezuinigheid:
Dell PowerEdge R720 compute node met Intel Xeon E5-2680v2 processors (in totaal 20 cores per node),

64GB geheugen en Mellanox ConnectIB card

Minimale configuratie: 2 nodes
Basissysteem:
Dell PowerEdge R620 compute node met Intel Xeon E5-2667v2 processors (in totaal 16 cores per node),

32GB geheugen, Intel NetEffect X520 iWARP card

Minimale configuratie: 2 nodes
© Dell | Section 1
Benchmarkonderzoek: Geoptimaliseerde valtest met Dell, Intel en Altair
7
Samenvatting van resultaten
Samenvattend zijn de belangrijkste resultaten van dit onderzoek:

Het Dell-Intel cluster levert 6x snellere prestaties voor de RADIOSS valtest-simulatie vergeleken met de
referentiecase
o Intel Xeon E5-2697v2 produceerde de beste resultaten van de 3 geteste processors:
o Minder dan 4 uur doorlooptijd voor 21 simulaties

RADIOSS’ Advanced Mass Scaling (AMS) kan de resultaten nog eens 1,7x versnellen
o Geschatte 1,7x sneller met AMS ingeschakeld
o Doorlooptijd van minder dan 2,5 uur (minder dan 400 seconden voor een enkele simulatie)

Intel Xeon E5-2680v2 biedt optimale energiezuinigheid
o Xeon E5-2680v2 verbruikt minder stroom tijdens het uitvoeren van de 21 simulaties van deze testcase
o In een 24x7 always-on productieomgeving verbruikt de Xeon E5-2680v2 21.3% minder stroom dan de
Xeon E5-2697v2, wat meer is dan het TDP verschil van 115W versus 135W (17%).
Door de Altair valtest-oplossing op Dell/Intel systemen te gebruiken, kunnen engineers de valschade van telefoons
beperken en aan alle eisen op het gebied van garantie en klanttevredenheid voldoen. Daarnaast kunnen ze de
kwaliteit van het ontwerp verbeteren door de invloed van veranderingen te onderzoeken, en inzicht te verkrijgen in
het dynamische gedrag van fysieke valtests, met gedetailleerde informatie over hoe de componenten van het product
presteren. Dankzij de afname van kosten en tijd van productontwikkeling hebben fabrikanten meer tijd om zich te
richten op verbeterde ontwerpen -- wat leidt tot een eindproduct met betere kwaliteit.
Naast valtesten zijn er nog een aantal technische berekeningstoepassingen in het Altair HyperWorks simulatiepakket
die baat hebben bij hoogwaardige Dell clusters voorzien van de nieuwste Intel processors, in toepassingsgebieden als
stamping, noise, vibration and harshness (NVH) simulatie, computational fluid dynamics (CFD) simulatie, etc.
Voor meer informatie

Meer weten over Altair software:
o HyperWorks suite: www.altairhyperworks.com
o PBS Works suite: www.pbsworks.com

Vraag een demo aan: www.altair.com/dell-intel-drop-test

Meer weten over Dell: www.dell.com en www.dell.co.uk/hpc

Meer weten over Intel:
o newsroom.intel.com
o blogs.intel.com.
o www.intel.com/products/server/processor/xeonE5/index.htm

Contact opnemen:
o Altair: www.altair.com/PageAllLocations.aspx
o Dell: www.dell.com en www.dell.com/hpc
o Intel: www.intel.com
© Dell | Section 1
Benchmarkonderzoek: Geoptimaliseerde valtest met Dell, Intel en Altair
8