PowerPoint プレゼンテーション

対角マトリックスを用いた3次元剛塑性有限要素法の並列計算
塑性加工研究室 大友勇司
3次元大規模シミュレーション
・計算時間
・メモリ容量
O
対角マトリックスを用いた剛塑性有限要素法
節点ごとの釣合い式を解く
O
3次元大規模問題に適している
計算時間
従来法
対角マトリックス法
節点数
収束性,並列化効率の向上
対角マトリックスを用いた3次元剛塑性有限要素法
釣合い式
非線形連立方程式
従来法
O
[A(v)] {v} = {F}
v = F
1節点あたりの不釣合い節点力
[A(v)]i{v} - {F}i = {DP}i
速度場の修正ベクトル
{v} = {v0}+{Dv}i
O
対角マトリックス法
O
Dv = - DP0
[A(v0)]ii{Dv}i = -{DP0}i
3×3
計算時間は節点数にほぼ比例
O
共有メモリ型ワークステーションによる並列計算
メモリ
CPU 1
・[B]の計算
サブルーチン 1
・{DP0}iの計算
・釣合い式[A]ii{Dv}i={DP}i
の計算
CPU 1
CPU 2
65.7%
サブルーチン 1
並列
計算
CPU 2
全節点?
サブルーチン 2
・加速係数a の計算
・[D]の計算
・不釣合い応力の計算
不釣合い応力?
Alpha Server
CPU : 731MHz×16
全ステップ?
全節点?
サブルーチン 2
並列
計算
34.1%
並列計算におけるCPUの振分け
CPU 1
CPU 2
(a) 領域
負荷バランス ; 困難
(b) 節点
容易
対角マトリックス
非線形性の間欠更新による収束性の向上
・[B] の計算
非線形連立方程式
[A(v)]ii {Dv}i = {DP}i
T
[A]=∫[B] [D][B]dV
V
サブルーチン1
線形
・{DP0}i の計算
・釣合い式[A]ii{Dv}i={DP}iの計算
全節点?
解
初期値 v0
間欠数ni?
サブルーチン2
・加速係数 a の計算
非線形
・[D]の計算
・不釣合い節点応力の計算
不釣合い応力?
全ステップ?
繰返し1
繰返し2
繰返し3
繰返し4
間欠数の影響
1CPU
15
3
繰返し数 /k
z
10
30 °
2
繰返し数
5
計算時間
1
y
x
0 5 10
1/8 対称モデル
20
30
間欠数 ni
40
0
50
計算時間 /ksec
傾斜工具によるすえ込み加工
並列計算におけるスピードアップ率
スピードアップ率
=
t1
tn
スピードアップ率
4
3
ni=5
理想
1
2
1
0
1
2
CPU数
3
4
総計算時間と要素数の関係
従来法は約2乗に比例
総計算時間 T /sec
107
10
6
105
1CPU: a=0.045
2CPU: a=0.028
4CPU: a=0.019
104
103
10
1.46
T=aN
2
101
100 2
10
1.25×105
103
104
要素数 N
105
106
メモリサイズと要素数の関係
従来法は約2乗に比例
メモリサイズ M /Mbytes
400
300
1.00
M=0.0028N
200
100
0
50
100
要素数 N /k
125
150
クランクシャフト3次元鍛造加工の並列計算
4
スピードアップ率
理想
3
2
1
0
1
2
CPU数
3
4
分散メモリ型PCクラスタによる並列計算
メモリ 1
メモリ 2
CPU 1
・[B]の計算
CPU 2
データ転送
サブルーチン 1
CPU 1
CPU 2
・{DP0}iの計算
・釣合い式[A]ii{Dv}i={DP}i
の計算
サブルーチン 1
並列
計算
全節点?
サブルーチン 2
・加速係数a の計算
・[D]の計算
・不釣合い応力の計算
PCクラスタ
CPU : 2.4GHz×4
ネットワーク:100Mbps
不釣合い応力?
全ステップ?
全節点?
サブルーチン 2
並列
計算
領域分割による並列計算
4
CPU 2
総繰返し数
/k
スピードアップ率
1.5
3
理想
1.0
2
0.5
1
CPU 1
0
1
2
CPU数
3
4
まとめ
対角マトリックスを用いた3次元剛塑性有限要素法に
おいて並列計算を行い,計算時間の低減を図った
共有メモリ型ワークステーション
非線形性の間欠更新により解の収束性,並列化効率
を向上させた
並列計算により更に大規模な問題も計算可能となった
分散メモリ型PCクラスタ
領域分割による並列計算では収束性が低下した