PowerPoint プレゼンテーション

BSP上での整列法
情報論理工学研究室
01―1-26-007
北村勇樹
あらまし
背景
BSPモデル
並列クイックソート
結果
まとめ
並列計算機モデル
・PRAM(Parallel Random
Access Machine)
・BSP(Bulk Synchronous
Parallel)
・Mesh
・Hypercube
PRAM
共有メモリ
P1
P2
Pn
BSP
ネットワーク
プロセッサ
メモリ
プロセッサ
メモリ
プロセッサ
メモリ
BSPとPRAMの違い
PRAM
BSP
1命令ごと
スーパース
テップごと
通信遅延
1
L
帯域幅
1
1/g
同期
PRAM上での並列クイックソート1
n
プロセッサ:P1
P2
P3
P4
PRAM上での並列クイックソート2
n
プロセッサ:P1
P2
P3
P4
BSP上での並列クイックソート1
通信
プロセッサ:P1
P2
P3
P4
BSP上での並列クイックソート2
通信
プロセッサ:P1
P2
P3
P4
基準値の選択
PRAM
基準値=中央値
BSP
通信を考慮して選ぶ
シミュレートプログラム
BSP上での整列の実行をシミュレートする。
入力:データ数N プロセッサ数:P 通信帯
域幅:g 通信遅延時間:L
出力:整列アルゴリズムの実行時間
最適な基準位置
実行時間 t
帯域幅と実行時間
70000
60000
基準値=
中央値
基準値=
最適値
50000
40000
30000
20000
10000
0
1/
1/
1/
1/
1/
1/
1
64
32
16
8
4
2
帯域幅 g
実行時間 t
通信遅延と実行時間
30000
25000
20000
15000
10000
5000
0
基準値
=中央
値
基準値
=最適
値
1
4
16
通信遅延 l
64
結論
BSP上での並列アルゴリズムを提案
・帯域幅が狭くなると実行時間は長くなる。
・通信遅延は実行時間にあまり影響を及ぼさない。
・ソーティングの基準値は通信を考慮し、最適な値
を選ぶ必要がある。