対角マトリックスを用いた3次元剛塑性有限要素法の並列計算 塑性加工研究室 大友勇司 3次元大規模シミュレーション ・計算時間 ・メモリ容量 O 対角マトリックスを用いた剛塑性有限要素法 節点ごとの釣合い式を解く O 3次元大規模問題に適している 計算時間 従来法 対角マトリックス法 節点数 収束性,並列化効率の向上 対角マトリックスを用いた3次元剛塑性有限要素法 釣合い式 非線形連立方程式 従来法 O [A(v)] {v} = {F} v = F 1節点あたりの不釣合い節点力 [A(v)]i{v} - {F}i = {DP}i 速度場の修正ベクトル {v} = {v0}+{Dv}i O 対角マトリックス法 O Dv = - DP0 [A(v0)]ii{Dv}i = -{DP0}i 3×3 計算時間は節点数にほぼ比例 O 共有メモリ型ワークステーションによる並列計算 メモリ CPU 1 ・[B]の計算 サブルーチン 1 ・{DP0}iの計算 ・釣合い式[A]ii{Dv}i={DP}i の計算 CPU 1 CPU 2 65.7% サブルーチン 1 並列 計算 CPU 2 全節点? サブルーチン 2 ・加速係数a の計算 ・[D]の計算 ・不釣合い応力の計算 不釣合い応力? Alpha Server CPU : 731MHz×16 全ステップ? 全節点? サブルーチン 2 並列 計算 34.1% 並列計算におけるCPUの振分け CPU 1 CPU 2 (a) 領域 負荷バランス ; 困難 (b) 節点 容易 対角マトリックス 非線形性の間欠更新による収束性の向上 ・[B] の計算 非線形連立方程式 [A(v)]ii {Dv}i = {DP}i T [A]=∫[B] [D][B]dV V サブルーチン1 線形 ・{DP0}i の計算 ・釣合い式[A]ii{Dv}i={DP}iの計算 全節点? 解 初期値 v0 間欠数ni? サブルーチン2 ・加速係数 a の計算 非線形 ・[D]の計算 ・不釣合い節点応力の計算 不釣合い応力? 全ステップ? 繰返し1 繰返し2 繰返し3 繰返し4 間欠数の影響 1CPU 15 3 繰返し数 /k z 10 30 ° 2 繰返し数 5 計算時間 1 y x 0 5 10 1/8 対称モデル 20 30 間欠数 ni 40 0 50 計算時間 /ksec 傾斜工具によるすえ込み加工 並列計算におけるスピードアップ率 スピードアップ率 = t1 tn スピードアップ率 4 3 ni=5 理想 1 2 1 0 1 2 CPU数 3 4 総計算時間と要素数の関係 従来法は約2乗に比例 総計算時間 T /sec 107 10 6 105 1CPU: a=0.045 2CPU: a=0.028 4CPU: a=0.019 104 103 10 1.46 T=aN 2 101 100 2 10 1.25×105 103 104 要素数 N 105 106 メモリサイズと要素数の関係 従来法は約2乗に比例 メモリサイズ M /Mbytes 400 300 1.00 M=0.0028N 200 100 0 50 100 要素数 N /k 125 150 クランクシャフト3次元鍛造加工の並列計算 4 スピードアップ率 理想 3 2 1 0 1 2 CPU数 3 4 分散メモリ型PCクラスタによる並列計算 メモリ 1 メモリ 2 CPU 1 ・[B]の計算 CPU 2 データ転送 サブルーチン 1 CPU 1 CPU 2 ・{DP0}iの計算 ・釣合い式[A]ii{Dv}i={DP}i の計算 サブルーチン 1 並列 計算 全節点? サブルーチン 2 ・加速係数a の計算 ・[D]の計算 ・不釣合い応力の計算 PCクラスタ CPU : 2.4GHz×4 ネットワーク:100Mbps 不釣合い応力? 全ステップ? 全節点? サブルーチン 2 並列 計算 領域分割による並列計算 4 CPU 2 総繰返し数 /k スピードアップ率 1.5 3 理想 1.0 2 0.5 1 CPU 1 0 1 2 CPU数 3 4 まとめ 対角マトリックスを用いた3次元剛塑性有限要素法に おいて並列計算を行い,計算時間の低減を図った 共有メモリ型ワークステーション 非線形性の間欠更新により解の収束性,並列化効率 を向上させた 並列計算により更に大規模な問題も計算可能となった 分散メモリ型PCクラスタ 領域分割による並列計算では収束性が低下した
© Copyright 2025 ExpyDoc