作業報告 [DFTB の GPU による高速化] GPUによる高速化 2015 年 3 月 27 日 吾妻広夫 DFTB ソルバを、GPU(Graphics Processing Unit)によって高速化する作業が完了したので報告 する。 GPU 高速化は、NVIDIA 社が提唱する CUDA と呼ばれる規格に則ったものである。従って、 計算に使用可能なパソコンは、NVIDIA 社製の GPU を搭載した 64bit の Windows マシンに 限られる。 また、搭載される GPU にも以下に示す制限がある。 2014 年以降に発売が開始された GeForce GTX 960, 970, 980 等の最新の GPU には未対応 2013 年以前に発売された GeForce GTX 760, 770 等の一世代前のバージョンに対応して いる また、今回、GPU 対応 DFTB ソルバとは別に、64bit Windows マシン用の DFTB ソルバも作 成した。 従って、現時点では、以下の三種類の DFTB ソルバが用意されていることになる。 ソルバ名 ソルバ名 32bit DFTB ソルバ 64bit DFTB ソルバ 64bit GPU DFTB ソルバ 特徴 従来のソルバ。Intel 社製 Fortran でコンパイルされている。 Windows XP 等の一世代前の 32bit パソコンでの使用を想定し ている。計算に使用できるメモリが約 3Gb に制限されており、 多数の原子を含むシミュレーションは実行できない。例えば、 stm_das7 は計算不可能である。(stm_das7 の計算は、約 11Gb の メモリを消費するので)OpenMP による並列化が可能である。 今回、新たに作成されたソルバ。PGI 社製 Fortran でコンパイ ルされている。Windows 8 等の現在主流の 64bit パソコンでの 使用を想定している。計算に使用できるメモリは約 128Gb であ り、事実上、無制限にメモリが使用できると考えて良い。 stm_das7 も計算可能である。OpenMP による並列化が可能であ る。 今回、 新たに作成されたソルバ。PGI 社製 Fortran および NVIDIA 社の規格 CUDA でコンパイルされている。Windows 8 等の現在 主流の 64bit パソコンで、かつ、NVIDIA 社製の GPU を備えた パソコンでの使用を想定している。計算に使用できるメモリは 数 Gb 程度で、あまり多くない。これは、本来、画像描画装置 である GPU に供えられているメモリの容量が比較的小さいか らである。例えば、stm_das7 は計算不可能である。GPU によ る並列化がなされている。 上記の三種類のソルバの、計算速度比較を以下に示す。 [例題 1]sts_hsi4_si001_Si_u_4 32bit DFTB ソルバ 2412[sec] 64bit DFTB ソルバ 2638[sec] 64bit GPU DFTB ソルバ 823[sec] 64bit DFTB ソルバ 1682[sec] 64bit GPU DFTB ソルバ 675[sec] [例題 2]stm_hsi 32bit DFTB ソルバ 1873[sec] なお、AFM, KPFM の計算時間測定結果は、まだ得られていない。 以上 SPM シミュレータ作業報告 SPM シミュレータ作業報告 2015 年 4 月 15 日 吾妻広夫 GPUによる高速化 [DFTB の GPU による高速化(前回からの続き)] GPU(Graphics Processing Unit)によって高速化された DFTB で、AFM シミュレーション計算 を行い、計算速度を計測したので報告する。 現時点では、以下の三種類の DFTB ソルバが用意されている。 ソルバ名 ソルバ名 32bit DFTB ソルバ 64bit DFTB ソルバ 64bit GPU DFTB ソルバ 特徴 従来のソルバ。Intel 社製 Fortran でコンパイルされている。 Windows XP 等の一世代前の 32bit パソコンでの使用を想定し ている。 今回、新たに作成されたソルバ。PGI 社製 Fortran でコンパイ ルされている。Windows 8 等の現在主流の 64bit パソコンでの 使用を想定している。 今回、新たに作成されたソルバ。PGI 社製 Fortran および NVIDIA 社の規格 CUDA でコンパイルされている。Windows 8 等の現在 主流の 64bit パソコンで、かつ、NVIDIA 社製の GPU を備えた パソコンでの使用を想定している。 [例題]afm_hsi 32bit DFTB ソルバ 48.95[hour] 以上 2015 年 5 月 16 日 吾妻広夫 [DFTB の GPU による高速化(前回からの続き)] GPU(Graphics Processing Unit)によって高速化された DFTB で、AFM シミュレーション計算 を行い、計算速度を計測したので報告する。 現時点では、以下の三種類の DFTB ソルバが用意されている。 ソルバ名 ソルバ名 32bit DFTB ソルバ 64bit DFTB ソルバ 64bit GPU DFTB ソルバ 特徴 従来のソルバ。Intel 社製 Fortran でコンパイルされている。 Windows XP 等の一世代前の 32bit パソコンでの使用を想定し ている。 今回、新たに作成されたソルバ。PGI 社製 Fortran でコンパイ ルされている。Windows 8 等の現在主流の 64bit パソコンでの 使用を想定している。 今回、新たに作成されたソルバ。PGI 社製 Fortran および NVIDIA 社の規格 CUDA でコンパイルされている。Windows 8 等の現在 主流の 64bit パソコンで、かつ、NVIDIA 社製の GPU を備えた パソコンでの使用を想定している。 [例題]kpfm_c4 64bit DFTB ソルバ 58.58[hour] 64bit GPU DFTB ソルバ 18.96[hour] 32bit DFTB ソルバ 215[hour] 以上 64bit DFTB ソルバ 75[hour] 64bit GPU DFTB ソルバ 35[hour]
© Copyright 2024 ExpyDoc