インテル株式会社 データセンター・プロダクト・マーケティング Xeon プラットフォーム・マーケティング・マネージャー 横川 弘 Contact your Intel representative to obtain the latest Intel product specifications and roadmaps. Results have been estimated or simulated using internal Intel analysis or architecture simulation or modeling, and provided to you for informational purposes. Any differences in your system hardware, software or configuration may affect your actual performance. Intel technologies’ features and benefits depend on system configuration and may require enabled hardware, software or service activation. Performance varies depending on system configuration. No computer system can be absolutely secure. Check with your system manufacturer or retailer or learn more at https://wwwssl.intel.com/content/www/us/en/high-performance-computing/path-to-aurora.html. Tests document performance of components on a particular test, in specific systems. Differences in hardware, software, or configuration will affect actual performance. Consult other sources of information to evaluate performance as you consider your purchase. For more complete information about performance and benchmark results, visit http://www.intel.com/performance. 3D XPoint, Intel, the Intel logo, Intel. Experience What’s Inside, the Intel. Experience What’s Inside logo, Intel Xeon Phi, Optane, and Xeon are trademarks or registered trademarks of Intel Corporation or its subsidiaries in the United States or other countries. *Other names and brands may be claimed as the property of others. © 2016 Intel Corporation. All rights reserved. 2 インテル®スケーラブル・システム・フレームワークで 新たなインサイトの探索へ 小規模クラスターからスーパーコンピューター まで柔軟に対応 演算 ファブリック メモリー・ストレージ ソフトウェア Intel Silicon Photonics Intel® Xeon® Processors Intel® Xeon Phi™ Processors Intel® Xeon Phi™ Coprocessors Intel® Server Boards and Platforms データ処理中心のコンピューティング 標準的な汎用プログラミングを支援 オンプレミスとクラウド環境それぞれに対応 Intel® Solutions for Lustre* Intel® Optane™ Technology 3D XPoint™ Technology Intel® SSDs Intel® Omni-Path Architecture Intel® True Scale Fabric Intel® Ethernet Intel® Silicon Photonics Intel® HPC Orchestrator Intel® Software Tools Intel® Cluster Ready Program Intel Supported SDVis 3 インテル®スケーラブル・システム・フレームワークの基本要素 インテル® Xeon Phi™ プロセッサー • プログラマビリティー • • インテル® スケーラ ブル・システム・フレ ームワーク インテル® Xeon® プロセッサーとのバイナリー互換 並列処理性能 • 最大 72 コア、コアあたり2 つの VPUを搭載 • ソケットあたり>3 Teraflop/s1 を実現 • 統合型メモリー & ファブリック • 高並列処理 性能 1 Source: Intel internal information. 2 Projected result based on internal only with all channels populated. 最大 16GB のオンパッケージ・メモリーを搭載 (DDR メモリーと比較して)最大 5 倍の帯域幅2を実現 • (構成オプションとして) 2 本のインテル® Omni-Path ファブリック・ポートを サポート • DDR4 メモリーチャネルを6本搭載し、最大 384 GB のメモリー搭載容量を 実現 Intel analysis of STREAM benchmark using a Knights Landing processor with 16GB of ultra high-bandwidth versus DDR4 memory インテル® Xeon Phi™ プロセッサー GPUアクセラレーターより卓越した高並列CPU PCIe によるボトルネックを解消 ブータブルCPU メモリーによるボトルネックを解消 最大16GBの統合型メモリー x86 CPUとして動作 インテル® Xeon® プロセッサーとのバイナリー互換 ブータブルCPU 2 VPU HUB 2 VPU コア 1 MB L2 コア 統合型 ファブリック プロセッサー・パッケージ シームレスな拡張性を実現 コスト削減 インテル® Xeon® プロセッサーと同様、効率的な スケーリングを実現 インテル® Omni-Path ファブリックを2ポート搭 載 1Reduced メモリー搭載容量 プラットフォームあたり最大384 GB の(DDR4)メ モリーを搭載 cost based on Intel internal estimate comparing cost of discrete networking components with the integrated fabric solution 5 インテル® Xeon Phi™ x200 製品ファミリー インテル® Xeon Phi™ プロセッサー インテル® Xeon Phi™ コプロセッサー x200 インテル® Omni-Path Fabric を統合 Host Processor in Groveport Platform Self-boot Intel® Xeon Phi™ processor Ingredient of Grantley Platforms Requires Intel® Xeon® processor host 6 インテル® Xeon Phi™ プロセッサー 製品構成 統合型 コア数 周波数 Yes 384GB 245W 2400 MHz $6,254 Yes 384GB 215W $4,876 Yes 384GB 215W $3,710 Yes 384GB 215W $2,438 72 1.5 16GB 7250 68 1.4 16GB 7230 64 1.3 16GB 7210 64 1.3 16GB ノードあたりの最高性能を実現 ワットあたりの最高性能を実現 コアあたりの最高メモリー帯域幅を実現 ベストバリューを実現 *Available beginning in September **Add 15 watts for integrated fabric † ファブ リック* 7290 * 消費電力** メモリー 7.2 GT/s 7.2 GT/s 7.2 GT/s 6.4 GT/s Ddr4 2400 MHz 2400 MHz 2133 MHz 価格帯 †Recommended Customer Pricing (RCP); add $287 for integrated fabric option 7 インテル®スケーラブル・システム・フレームワークの基本要素 インテル® Xeon Phi™ プロセッサー: 新たなインサイト探索を実現 さまざまな課題を 素早く解決 高並列処理 ボトルネックの解消 拡張性 有利な価格性能比 電力効率 汎用プログラムで実行可能 高い利用効率 潜在能力を最大限に 引き出す 将来を見据えたコードを提供 幅広いエコシステム 確固たるロードマップ サイエンス、見える化、アナリティクスの分野で創造と技術革新を実現 8 さまざまな課題を素早く解決 高並列処理 >100倍 * インテル® Xeon® プロセッサーで並 列処理とコードの最適化の需要が 高まる中で CPU世代 (2011-2016) インテル® Xeon Phi™ プロセッサー で汎用プログラミングを使用した超 並列処理を実現 ベクトル・並列化 スカラー ・並列化 ベクトル ・ シングルスレッド スカラー ・ シングルスレッド 最大72コア (288 スレッド) V[512] インテル® アドバンスト・ベクトル・エクステンション 512 (インテル® AVX-512) *Binomial Options DP simulation performed on Intel® Xeon® processor X5570 (formerly codenamed Nehalem), Intel® Xeon® processor x5680 (formerly codenamed Westmere), and Intel® Xeon® processor E5 2600 families v1 through v4 for 4 sets of code with varying levels of vectorization and threading optimization 9 さまざまな課題を素早く解決 ボトルネックの軽減 ブータブルCPU: メモリー: ファブリック: PCIe* によるボトルネックを解消 統合型メモリー (MCDRAM) とプラットフォーム (DDR4) インテル® Omni-Path ファブリックを統合 コスト1 電力1 高密度化1 メモリー容量 メモリー帯域幅 *Other names and brands may be claimed as the property of others. 1Reduced cost, power and increased density based on Intel internal estimate comparing discrete networking components with the integrated fabric solution 2Sustained memory bandwidth (STREAM) up to 490GB/s using MCDRAM compared with only 90GB/s with DDR4 platform memory 2 10 さまざまな課題を素早く解決 性能実績 モデリング & シミュレーション ライフサイエンス 見える化 最大 最大 最大 5.0倍 2.7倍 5.2倍 性能向上* LAMMPS とさらに多くの 分野で… Monte Carlo DP スコアリング トレーニング ファイナンス 性能向上* 人工知能 性能向上* Embree 製造業、工学、気象、 石油・ガス、 応用科学、防衛等々 科学と産業の進歩を加速 高速化と拡張性 1 最も広範囲に展開 2 高度な分析を統一アーキテクチャーで共有 *See speaker notes for performance disclaimers **No published GPU result for 128 instances running the AlexNet topology † Internal development version *Performance versus GPU Accelerator , see speaker notes for configuration details 1See next slide for performance results to substantiate this claim 2Source: Internal Intel estimate 11 有利な価格性能比 電力効率とコスト削減を同時に実現 2x + 1x 最大 最大 最大 683W* $13,750* 378W* $ 5倍 8倍 電力あたり性 能の向上* 9倍 価格あたり性 能の向上* 性能向上* GPUアクセラレーター と比較して $7,300* *Intel measured results as of April 2016; see speakers notes for full configuration and performance disclaimers 12 潜在能力を最大限に引き出す 将来を見据えコードを開発 ソフトウェアはハードウェアより長く利用 OpenMP* SCRYU/Tetra* - CFD scSTREAM* - CFD Dalton* Quantum Chemistry WRF* - Weather NWCHEM* - Chemistry LAPACK* - Solvers MPI* Fortran*, C*, C++*… Open Source Libraries Community Codes General-purpose approach PETSc* - Solvers IJKMO Unified Model* - Weather Pam-Crash* Spice* NASTRAN* 1970 1980 1990 2000 (汎用CPU向けに)オープン・スタンダードに 最適化されたコードが、今後同じよう なアーキテクチャーに移行可能 2010 *Other names and brands may be claimed as the property of others 13 潜在能力を最大限に引き出す 幅広いエコシステム 30以上の 1 システム・プロバイダー 15以上の 1 ISVアプリケーション・パートナー Intel® Xeon Phi™ Processor: Broad Ecosystem Support www.intel.com/xeonphi/partners 60以上の インテル® Parallel Computing Centers 1 Intel® Parallel Computing Centers (IPCC) software.intel.com/en-us/ipcc *Other names, brands and logos may be claimed as the property of others 1 As of June 2016 14 潜在能力を最大限に引き出す 確固たるロードマップ インテル®スケーラブル・ システム・フレームワーク 演算 メモリー/ ストレージ KNH* ファブリック KNL* KNF* KNC* ソフトウェア *KNF (Knights Ferry), KNC (Knights Corner), KNL (Knights Landing) are abbreviations for former codenames for Intel® Xeon Phi™ product family products. KNH is the abbreviation for the Knights Hill codename of a future Intel® Xeon Phi™ product 15 システム・アーキテクチャーが直面する課題 システムのボトルネック “壁” 多様化する負荷に 対応するインフラ 使用方法の多様化で 生じる障壁 見える化 メモリー | I/O | ストレージ エネルギー効率の高い性能 スペース | 機能性 | 最適化されていないソフトウェア ビッグ データ マシンラーニング 使用方法の 最適化 モデリングとシミュレーションでリソー スを分割 | ビッグデータ分析 | マシン ラーニング |見える化 利便性の向上| クラウドの活用| 並列処理を活用した 新たな挑戦 HPC 17 アークテクチャー設計に、より総合的な考察の必要性 システム 革新的技術 アプリケーション 機能の統合化 演算能力 コードの最適化 コア コミュニティー 性能 メモリー ファブリック メモリー ファブリック ISV ストレージ システム・ ソフトウェア FPGA グラフィック 独自仕様 I/O 時間 18 インテル® Xeon Phi™ プロセッサーの紹介 1 st 統合型 ファブリック 1 st 高並列アプリケーション 向けCPU GPUアクセラレーター と比較して 性能面でのリーダーシップを実現 最大 5倍 性能向上* 最大 8倍 電力あたり 性能* 最大 9倍 価格あた り性能* 1 st 統合型 メモリー CPUであることによる価値 あらゆるワークロード PCIeのボトルネックを解消 で実行 大容量メモリー搭載に対応 汎用プログラムで実行 拡張性、将来を見据えた 可能 コードを提供 より良い電力効率 *Intel measured results as of April 2016; see speakers notes for full configuration and performance disclaimers 19 サイエンス、見える化、アナリティクスの分野で 真理探査とビジネスの革新を支援 ゲノミクス/ シークエンシングなど のライフサイエンス リスク ファイナンス エネルギー 気象 科学的アプローチ からの見える化 / レンダリング シミュレーション CAE & CFD ビックデータ分析 / マシーン・ラーニン グ 防衛 /セキュリティ さらに新たな使い道を… *See the Intel® Xeon Phi™ application showcase for examples of workloads that are most suitable 20 ディープラーニング トレーニング さまざまな課題を素早く解決 (継続性ある) X 性能実績 4 X * 50倍 38% * 性能効率% 拡張性の 向上 高速化 63% No published GPU Result** GPU 4 GPU 4 Xeon Phi 1 16 32 インスタンス数 1 Xeon Phi Topology: GoogLeNet Topology: AlexNet 128 トレーニングを Xeon Phi * 高速化 X 87% トレーニングを 2.3倍 32 128 Xeon Phi Topology: AlexNet ディープラーニングに優れた拡張性を実証 *See speaker notes for performance disclaimers **No published GPU result for 128 instances running the AlexNet topology † Internal development version 21
