Xeon Phi

インテル株式会社
データセンター・プロダクト・マーケティング
Xeon プラットフォーム・マーケティング・マネージャー 横川 弘
Legal Disclaimers
Intel technologies features and benefits depend on system configuration and may require enabled hardware, software or service activation. Performance varies depending on
system configuration. No computer system can be absolutely secure. Check with your system manufacturer or retailer or learn more at [intel.com].
Software and workloads used in performance tests may have been optimized for performance only on Intel microprocessors. Performance tests, such as SYSmark and MobileMark,
are measured using specific computer systems, components, software, operations and functions. Any change to any of those factors may cause the results to vary. You should
consult other information and performance tests to assist you in fully evaluating your contemplated purchases, including the performance of that product when combined with
other products.
All information provided here is subject to change without notice. Contact your Intel representative to obtain the latest Intel product specifications and roadmaps.
Results have been estimated or simulated using internal Intel analysis or architecture simulation or modeling, and provided to you for informational purposes. Any differences in
your system hardware, software or configuration may affect your actual performance.
Intel technologies’ features and benefits depend on system configuration and may require enabled hardware, software or service activation. Performance varies depending on
system configuration. No computer system can be absolutely secure. Check with your system manufacturer or retailer or learn more at https://wwwssl.intel.com/content/www/us/en/high-performance-computing/path-to-aurora.html.
Tests document performance of components on a particular test, in specific systems. Differences in hardware, software, or configuration will affect actual performance. Consult
other sources of information to evaluate performance as you consider your purchase. For more complete information about performance and benchmark results, visit
http://www.intel.com/performance.
3D XPoint, Intel, the Intel logo, Intel. Experience What’s Inside, the Intel. Experience What’s Inside logo, Intel Xeon Phi, Optane, and Xeon are trademarks or registered trademarks of
Intel Corporation or its subsidiaries in the United States or other countries.
*Other names and brands may be claimed as the property of others.
© 2016 Intel Corporation. All rights reserved.
2
インテル®スケーラブル・システム・フレームワークで
新たなインサイトの探索へ
小規模クラスターからスーパーコンピューター
まで柔軟に対応
演算
ファブリック
メモリー・ストレージ
ソフトウェア
Intel Silicon
Photonics
Intel® Xeon® Processors
Intel® Xeon Phi™ Processors
Intel® Xeon Phi™ Coprocessors
Intel® Server Boards and Platforms
データ処理中心のコンピューティング
標準的な汎用プログラミングを支援
オンプレミスとクラウド環境それぞれに対応
Intel® Solutions for Lustre*
Intel® Optane™ Technology
3D XPoint™ Technology
Intel® SSDs
Intel® Omni-Path Architecture
Intel® True Scale Fabric
Intel® Ethernet
Intel® Silicon Photonics
Intel® HPC Orchestrator
Intel® Software Tools
Intel® Cluster Ready Program
Intel Supported SDVis
3
インテル®スケーラブル・システム・フレームワークの基本要素
インテル® Xeon Phi™ プロセッサー
•
プログラマビリティー
•
•
インテル® スケーラ
ブル・システム・フレ
ームワーク
インテル® Xeon® プロセッサーとのバイナリー互換
並列処理性能
•
最大 72 コア、コアあたり2 つの VPUを搭載
•
ソケットあたり>3 Teraflop/s1 を実現
• 統合型メモリー & ファブリック
•
高並列処理
性能
1 Source: Intel internal information.
2 Projected result based on internal
only with all channels populated.
最大 16GB のオンパッケージ・メモリーを搭載
(DDR メモリーと比較して)最大 5 倍の帯域幅2を実現
•
(構成オプションとして) 2 本のインテル® Omni-Path ファブリック・ポートを
サポート
•
DDR4 メモリーチャネルを6本搭載し、最大 384 GB のメモリー搭載容量を
実現
Intel analysis of STREAM benchmark using a Knights Landing processor with 16GB of ultra high-bandwidth versus DDR4 memory
インテル® Xeon Phi™ プロセッサー
GPUアクセラレーターより卓越した高並列CPU
PCIe によるボトルネックを解消
ブータブルCPU
メモリーによるボトルネックを解消
最大16GBの統合型メモリー
x86 CPUとして動作
インテル® Xeon® プロセッサーとのバイナリー互換
ブータブルCPU
2
VPU
HUB
2
VPU
コア
1
MB
L2
コア
統合型 ファブリック
プロセッサー・パッケージ
シームレスな拡張性を実現
コスト削減
インテル® Xeon® プロセッサーと同様、効率的な
スケーリングを実現
インテル® Omni-Path ファブリックを2ポート搭
載
1Reduced
メモリー搭載容量
プラットフォームあたり最大384 GB の(DDR4)メ
モリーを搭載
cost based on Intel internal estimate comparing cost of discrete networking components with the integrated fabric solution
5
インテル® Xeon Phi™ x200 製品ファミリー
インテル® Xeon Phi™ プロセッサー
インテル® Xeon Phi™ コプロセッサー
x200
インテル® Omni-Path Fabric
を統合
Host Processor in Groveport Platform
Self-boot Intel® Xeon Phi™ processor
Ingredient of Grantley Platforms
Requires Intel® Xeon® processor host
6
インテル® Xeon Phi™ プロセッサー
製品構成
統合型
コア数 周波数
Yes
384GB 245W
2400 MHz
$6,254
Yes
384GB
215W
$4,876
Yes
384GB
215W
$3,710
Yes
384GB
215W
$2,438
72
1.5
16GB
7250
68
1.4
16GB
7230
64
1.3
16GB
7210
64
1.3
16GB
ノードあたりの最高性能を実現
ワットあたりの最高性能を実現
コアあたりの最高メモリー帯域幅を実現
ベストバリューを実現
*Available beginning in September
**Add 15 watts for integrated fabric
†
ファブ
リック*
7290
*
消費電力**
メモリー
7.2 GT/s
7.2 GT/s
7.2 GT/s
6.4 GT/s
Ddr4
2400 MHz
2400 MHz
2133 MHz
価格帯
†Recommended Customer Pricing (RCP); add $287 for integrated fabric option
7
インテル®スケーラブル・システム・フレームワークの基本要素
インテル® Xeon Phi™ プロセッサー: 新たなインサイト探索を実現
さまざまな課題を
素早く解決
高並列処理
ボトルネックの解消
拡張性
有利な価格性能比
電力効率
汎用プログラムで実行可能
高い利用効率
潜在能力を最大限に
引き出す
将来を見据えたコードを提供
幅広いエコシステム
確固たるロードマップ
サイエンス、見える化、アナリティクスの分野で創造と技術革新を実現
8
さまざまな課題を素早く解決
高並列処理
>100倍
*
インテル® Xeon® プロセッサーで並
列処理とコードの最適化の需要が
高まる中で
CPU世代
(2011-2016)
インテル® Xeon Phi™ プロセッサー
で汎用プログラミングを使用した超
並列処理を実現
ベクトル・並列化
スカラー ・並列化
ベクトル ・ シングルスレッド
スカラー ・ シングルスレッド
最大72コア (288 スレッド)
V[512]
インテル® アドバンスト・ベクトル・エクステンション 512
(インテル® AVX-512)
*Binomial
Options DP simulation performed on Intel® Xeon® processor X5570 (formerly codenamed Nehalem), Intel® Xeon® processor x5680 (formerly codenamed Westmere), and Intel®
Xeon® processor E5 2600 families v1 through v4 for 4 sets of code with varying levels of vectorization and threading optimization
9
さまざまな課題を素早く解決
ボトルネックの軽減
ブータブルCPU:
メモリー:
ファブリック:
PCIe* によるボトルネックを解消
統合型メモリー (MCDRAM)
とプラットフォーム (DDR4)
インテル® Omni-Path ファブリックを統合
コスト1
電力1
高密度化1
メモリー容量
メモリー帯域幅
*Other names and brands may be claimed as the property of others.
1Reduced cost, power and increased density based on Intel internal estimate comparing discrete networking components with the integrated fabric solution
2Sustained memory bandwidth (STREAM) up to 490GB/s using MCDRAM compared with only 90GB/s with DDR4 platform memory
2
10
さまざまな課題を素早く解決
性能実績
モデリング & シミュレーション
ライフサイエンス
見える化
最大
最大
最大
5.0倍
2.7倍
5.2倍
性能向上*
LAMMPS
とさらに多くの
分野で…
Monte Carlo DP
スコアリング
トレーニング
ファイナンス
性能向上*
人工知能
性能向上*
Embree
製造業、工学、気象、
石油・ガス、
応用科学、防衛等々
科学と産業の進歩を加速
高速化と拡張性
1
最も広範囲に展開
2
高度な分析を統一アーキテクチャーで共有
*See speaker notes for performance disclaimers
**No published GPU result for 128 instances running the AlexNet topology
† Internal development version
*Performance versus GPU Accelerator , see speaker notes for configuration details
1See next slide for performance results to substantiate this claim
2Source: Internal Intel estimate
11
有利な価格性能比
電力効率とコスト削減を同時に実現
2x
+
1x
最大
最大
最大
683W*
$13,750*
378W*
$
5倍
8倍
電力あたり性
能の向上*
9倍
価格あたり性
能の向上*
性能向上*
GPUアクセラレーター
と比較して
$7,300*
*Intel measured results as of April 2016; see speakers notes for full configuration and performance disclaimers
12
潜在能力を最大限に引き出す
将来を見据えコードを開発
ソフトウェアはハードウェアより長く利用
 OpenMP*
SCRYU/Tetra* - CFD
scSTREAM* - CFD
Dalton* Quantum Chemistry
WRF* - Weather
NWCHEM* - Chemistry
LAPACK* - Solvers
 MPI*
 Fortran*, C*, C++*…
 Open Source Libraries
 Community Codes
 General-purpose approach
PETSc* - Solvers
IJKMO Unified Model* - Weather
Pam-Crash*
Spice*
NASTRAN*
1970
1980
1990
2000
(汎用CPU向けに)オープン・スタンダードに
最適化されたコードが、今後同じよう
なアーキテクチャーに移行可能
2010
*Other names and brands may be claimed as the property of others
13
潜在能力を最大限に引き出す
幅広いエコシステム
30以上の
1
システム・プロバイダー
15以上の
1
ISVアプリケーション・パートナー
Intel® Xeon Phi™ Processor: Broad Ecosystem Support
www.intel.com/xeonphi/partners
60以上の
インテル® Parallel Computing Centers
1
Intel® Parallel Computing Centers (IPCC)
software.intel.com/en-us/ipcc
*Other names, brands and logos may be claimed as the property of others
1
As of June 2016
14
潜在能力を最大限に引き出す
確固たるロードマップ
インテル®スケーラブル・
システム・フレームワーク
演算
メモリー/
ストレージ
KNH*
ファブリック
KNL*
KNF*
KNC*
ソフトウェア
*KNF (Knights Ferry), KNC (Knights Corner), KNL (Knights Landing) are abbreviations for former codenames for Intel® Xeon Phi™ product family products. KNH is the abbreviation for the
Knights Hill codename of a future Intel® Xeon Phi™ product
15
システム・アーキテクチャーが直面する課題
システムのボトルネック
“壁”
多様化する負荷に
対応するインフラ
使用方法の多様化で
生じる障壁
見える化
メモリー | I/O | ストレージ
エネルギー効率の高い性能
スペース | 機能性 |
最適化されていないソフトウェア
ビッグ
データ
マシンラーニング
使用方法の
最適化
モデリングとシミュレーションでリソー
スを分割 | ビッグデータ分析 | マシン
ラーニング |見える化
利便性の向上|
クラウドの活用| 並列処理を活用した
新たな挑戦
HPC
17
アークテクチャー設計に、より総合的な考察の必要性
システム
革新的技術
アプリケーション
機能の統合化
演算能力
コードの最適化
コア
コミュニティー
性能
メモリー
ファブリック
メモリー
ファブリック
ISV
ストレージ
システム・
ソフトウェア
FPGA
グラフィック
独自仕様
I/O
時間
18
インテル® Xeon Phi™ プロセッサーの紹介
1
st
統合型
ファブリック
1
st
高並列アプリケーション
向けCPU
GPUアクセラレーター
と比較して
性能面でのリーダーシップを実現
最大
5倍
性能向上*
最大
8倍
電力あたり
性能*
最大
9倍
価格あた
り性能*
1
st
統合型
メモリー
CPUであることによる価値
 あらゆるワークロード  PCIeのボトルネックを解消
で実行
 大容量メモリー搭載に対応
 汎用プログラムで実行  拡張性、将来を見据えた
可能
コードを提供
 より良い電力効率
*Intel measured results as of April 2016; see speakers notes for full configuration and performance disclaimers
19
サイエンス、見える化、アナリティクスの分野で
真理探査とビジネスの革新を支援
ゲノミクス/
シークエンシングなど
のライフサイエンス
リスク
ファイナンス
エネルギー
気象
科学的アプローチ
からの見える化 /
レンダリング
シミュレーション
CAE & CFD
ビックデータ分析 /
マシーン・ラーニン
グ
防衛 /セキュリティ
さらに新たな使い道を…
*See the Intel® Xeon Phi™ application showcase for examples of workloads that are most suitable
20
ディープラーニング
トレーニング
さまざまな課題を素早く解決
(継続性ある)
X
性能実績
4
X
*
50倍
38%
*
性能効率%
拡張性の
向上
高速化
63%
No published
GPU Result**
GPU
4
GPU
4
Xeon Phi
1
16
32
インスタンス数
1
Xeon Phi
Topology: GoogLeNet
Topology: AlexNet
128
トレーニングを
Xeon Phi
*
高速化
X
87%
トレーニングを
2.3倍
32
128
Xeon Phi
Topology: AlexNet
ディープラーニングに優れた拡張性を実証
*See speaker notes for performance disclaimers
**No published GPU result for 128 instances running the AlexNet topology
† Internal development version
21