GPUによる高速化

作業報告
[DFTB の GPU による高速化]
GPUによる高速化
2015 年 3 月 27 日
吾妻広夫
DFTB ソルバを、GPU(Graphics Processing Unit)によって高速化する作業が完了したので報告
する。
GPU 高速化は、NVIDIA 社が提唱する CUDA と呼ばれる規格に則ったものである。従って、
計算に使用可能なパソコンは、NVIDIA 社製の GPU を搭載した 64bit の Windows マシンに
限られる。
また、搭載される GPU にも以下に示す制限がある。
2014 年以降に発売が開始された GeForce GTX 960, 970, 980 等の最新の GPU には未対応
2013 年以前に発売された GeForce GTX 760, 770 等の一世代前のバージョンに対応して
いる
また、今回、GPU 対応 DFTB ソルバとは別に、64bit Windows マシン用の DFTB ソルバも作
成した。
従って、現時点では、以下の三種類の DFTB ソルバが用意されていることになる。
ソルバ名
ソルバ名
32bit DFTB ソルバ
64bit DFTB ソルバ
64bit GPU DFTB ソルバ
特徴
従来のソルバ。Intel 社製 Fortran でコンパイルされている。
Windows XP 等の一世代前の 32bit パソコンでの使用を想定し
ている。計算に使用できるメモリが約 3Gb に制限されており、
多数の原子を含むシミュレーションは実行できない。例えば、
stm_das7 は計算不可能である。(stm_das7 の計算は、約 11Gb の
メモリを消費するので)OpenMP による並列化が可能である。
今回、新たに作成されたソルバ。PGI 社製 Fortran でコンパイ
ルされている。Windows 8 等の現在主流の 64bit パソコンでの
使用を想定している。計算に使用できるメモリは約 128Gb であ
り、事実上、無制限にメモリが使用できると考えて良い。
stm_das7 も計算可能である。OpenMP による並列化が可能であ
る。
今回、
新たに作成されたソルバ。PGI 社製 Fortran および NVIDIA
社の規格 CUDA でコンパイルされている。Windows 8 等の現在
主流の 64bit パソコンで、かつ、NVIDIA 社製の GPU を備えた
パソコンでの使用を想定している。計算に使用できるメモリは
数 Gb 程度で、あまり多くない。これは、本来、画像描画装置
である GPU に供えられているメモリの容量が比較的小さいか
らである。例えば、stm_das7 は計算不可能である。GPU によ
る並列化がなされている。
上記の三種類のソルバの、計算速度比較を以下に示す。
[例題 1]sts_hsi4_si001_Si_u_4
32bit DFTB ソルバ
2412[sec]
64bit DFTB ソルバ
2638[sec]
64bit GPU DFTB ソルバ
823[sec]
64bit DFTB ソルバ
1682[sec]
64bit GPU DFTB ソルバ
675[sec]
[例題 2]stm_hsi
32bit DFTB ソルバ
1873[sec]
なお、AFM, KPFM の計算時間測定結果は、まだ得られていない。
以上
SPM シミュレータ作業報告
SPM シミュレータ作業報告
2015 年 4 月 15 日
吾妻広夫
GPUによる高速化
[DFTB の GPU による高速化(前回からの続き)]
GPU(Graphics Processing Unit)によって高速化された DFTB で、AFM シミュレーション計算
を行い、計算速度を計測したので報告する。
現時点では、以下の三種類の DFTB ソルバが用意されている。
ソルバ名
ソルバ名
32bit DFTB ソルバ
64bit DFTB ソルバ
64bit GPU DFTB ソルバ
特徴
従来のソルバ。Intel 社製 Fortran でコンパイルされている。
Windows XP 等の一世代前の 32bit パソコンでの使用を想定し
ている。
今回、新たに作成されたソルバ。PGI 社製 Fortran でコンパイ
ルされている。Windows 8 等の現在主流の 64bit パソコンでの
使用を想定している。
今回、新たに作成されたソルバ。PGI 社製 Fortran および NVIDIA
社の規格 CUDA でコンパイルされている。Windows 8 等の現在
主流の 64bit パソコンで、かつ、NVIDIA 社製の GPU を備えた
パソコンでの使用を想定している。
[例題]afm_hsi
32bit DFTB ソルバ
48.95[hour]
以上
2015 年 5 月 16 日
吾妻広夫
[DFTB の GPU による高速化(前回からの続き)]
GPU(Graphics Processing Unit)によって高速化された DFTB で、AFM シミュレーション計算
を行い、計算速度を計測したので報告する。
現時点では、以下の三種類の DFTB ソルバが用意されている。
ソルバ名
ソルバ名
32bit DFTB ソルバ
64bit DFTB ソルバ
64bit GPU DFTB ソルバ
特徴
従来のソルバ。Intel 社製 Fortran でコンパイルされている。
Windows XP 等の一世代前の 32bit パソコンでの使用を想定し
ている。
今回、新たに作成されたソルバ。PGI 社製 Fortran でコンパイ
ルされている。Windows 8 等の現在主流の 64bit パソコンでの
使用を想定している。
今回、新たに作成されたソルバ。PGI 社製 Fortran および NVIDIA
社の規格 CUDA でコンパイルされている。Windows 8 等の現在
主流の 64bit パソコンで、かつ、NVIDIA 社製の GPU を備えた
パソコンでの使用を想定している。
[例題]kpfm_c4
64bit DFTB ソルバ
58.58[hour]
64bit GPU DFTB ソルバ
18.96[hour]
32bit DFTB ソルバ
215[hour]
以上
64bit DFTB ソルバ
75[hour]
64bit GPU DFTB ソルバ
35[hour]