NVIDIA と Citrix が実現する GPU accelerated VDI

NVIDIAと Citrixが実現する
GPUacceleratedVDIの未来
​シトリックス・システムズ・ジャパン株式会社
​営業推進部 ⽩川 晃
​[email protected]
2016年10⽉5⽇
1
©2016CitrixSystemsJapan
NVIDIAと Citrixによる
GPU仮想化の7年間
プロトコル,GPU,そして
ハイパーバイザーの進化
2
©2016CitrixSystemsJapan
旅はボーイング B787ドリームライナーから始まった
2006年、多国籍での CATIAデータ共有・同期の課題を解決するためにNVIDIA社とカスタム OpenGL実装を提供
3
©2016CitrixSystemsJapan
物理ワークステーション GPU のリモート利⽤
2009年に Citrixは HDX3DProプロトコルを発表、リモートに⾼度なグラフィックスを配信可能になった
HDX3DPro VDA
Windows OS
GPUドライバー
x86Hardware
• ワークステーションOSは物理のまま
• 性能はローカルワークステーションに近い
• ひとり1台、個別にブレード
ワークステーションが必要となる
• オフィススペースや製造エリアからDCへ集約
• 現有の作業マシンで事前検証するのに最適
4
©2016CitrixSystemsJapan
GPU パススルーの誕⽣
2011年に XenServer6.0で登場 – サーバーに搭載した GPUを、ハイパーバイザーから各仮想マシンに割当可能に
XenDesktop
XenApp
WindowsVM
WindowsVM
GPUドライバー
GPUドライバー
XenServer
x86Hardware
•
•
•
•
5
©2016CitrixSystemsJapan
Quadro,GRID,TeslaM
ワークステーション OSを仮想化して利⽤可能に
GPUドライバーに物理OSと同じものが利⽤可能
各 VMが GPUチップを専有利⽤する
ハイエンドユーザにはパススルーを推奨
NVIDIAGRID の誕⽣
2013年 XenServer6.2と XenDesktop7で NVIDIAGRID1.0に対応。 GPUを仮想化リソースとして分割可能に
XenDesktop
XenApp
WindowsVM
WindowsVM
GPUドライバー
GPUドライバー
XenServer
NVIDIAGRIDSoftware
x86Hardware
NVIDIAGRIDK1/K2世代〜
•
•
•
•
6
©2016CitrixSystemsJapan
GPU
vGPU
M10
64
⼀般ユーザー
M60
32
ハイエンド・グラフィックス
M6
16
ブレードワークステーション
物理 GPUを分割して個別の仮想マシンに
それぞれの分離は GRIDソフトウェアが担当
各 VMが分割された仮想 GPUチップを専有
GPUを詰め込みすぎると CPUリソースが不⾜してアンバランスになる場合があるので注意
XenServer7.0
XenDesktop7.11
最新アップデート情報
7
©2016CitrixSystemsJapan
最新の HDXグラフィックス モード
XenDesktop7.11標準 VDA と HDX3DProVDAの最新情報
標準 VDAモード
デフォルト設定
ソフトウェアによる
Thinwire AdaptiveDisplay
(SelectiveH.264)
Receiver が⾮対応の場合は
Thinwire Plus(CompatibleMode)
8
Receiver
ver. 4.5(Windows)ver.13.4(Linux)
ディスプレイ
ドライバー
CitrixWDDMドライバー
DirectX,OpenGL,8画⾯まで
利⽤想定
リッチコンテンツ閲覧と
オフィス⽤途やトレーダー端末
メリット
H.264⽅式のネットワーク効率と
JPEG/Bitmap⽅式の CPU効率を
バランス良く統合
©2016CitrixSystemsJapan
HDX3DProVDAモード
デフォルト設定
ソフトウェアまたは NVENCによる
フルスクリーン H.264
Receiverが作動する環境により
CPUデコード, GPUデコードを決定
Receiver
Ver.4.4 (Windows)ver.13.2(Linux)
ディスプレイ
ドライバー
GPUネイティブドライバー
Direct X,OpenCL,OpenGL,CUDAなど
GPUのサポートするもの,4画⾯まで
利⽤想定
CAD/CAEなど
ハイエンド グラフィックス
メリット
ハードウェアエンコードやハード
ウェアデコードによる CPU,メモリ
のオフロード
XenDesktop7.11の
SelectiveH.264
動画を表⽰しているエリアを検出
して、その部分は⾼画質の得られ
る H.264エンコードを適⽤
CPU負荷を抑えるため画⾯全体で
はなく⼀部のみ H.264に割当
動きのない静⽌画やデザインは
CPU負荷の低い JPEG⽅式で
エンコード
⽂字情報は画像変換すると輪郭が滲
むのでlosslesstext⽅式で
オーバーレイ表⽰
9
©2016CitrixSystemsJapan
新しいビデオコーデック設定
ポリシー設定:圧縮ビデオコーデックを使⽤する
可能な場合はビデオコーデックを使⽤する
• 標準 VDAでは “Selective H.264”を利⽤
• HDX3DProVDAでは “フルスクリーン H.264”を利⽤
アクティブに変化している領域で使⽤する
• 低帯域ネットワークでのビデオパフォーマンス改善
とスケーラビリティを両⽴したいときの設定
フルスクリーンで使⽤する
• ビデオおよび HDX3DProアプリケーションに最適化する
ビデオコーデックを使⽤しない
• エンドポイントに H.264デコード機能がない場合
およびスケーラビリティ優先時の設定
10
©2016CitrixSystemsJapan
version7.6
version7.11
画⾯圧縮オプションの選択
画像の表⽰精度と操作への追従性能の優先度を考えて、⾊空間や操作中の精度を選択可能です
ü H.2644:2:0(HDX 3D Pro VDA デフォルト設定)
ü H.2644:2:0+ losslesstextのオーバーレイ
ü H.2644:4:4(visuallylossless)
ü H.2644:4:4(build-to-visually-lossless)
ü Non-H.264(JPEG+losslesstext)
ü Non-H.264(truelossless)
ü Non-H.264(build-to-true-lossless)
11
©2016CitrixSystemsJapan
XenServer7.0+XenDesktop7.11で
NVIDIA NVENCをサポート
HardwareVideoEncodingwithNVIDIANVENC
CPU に負荷がかかるエンコード処理を HDX3DProで GPUにオフロード
NVENCを利⽤せずに H.264をソフトウェア
エンコードした場合、ctxgfx.exeの CPU消費
は 26% におよぶ
12
©2016CitrixSystemsJapan
NVENCを有効にして、同じアプリケーションを
実⾏した場合 ctxgfx.exeによる CPU消費は⼤幅
に削減されて、わずか 2%
NIVIDANVENC による CPU,メモリのオフロード効果
4基の GPUを M60-2Qプロファイルで 16VMに割り当てたときの場合 – CPU,RAMとも 20%近いオフロード
RAM
VRAM
CPUEncode
NVENC
VRAM
※ マルチディスプレイ環境でも 1VMあたり4画⾯まで NVENC対応
NVEncode
13
©2016CitrixSystemsJapan
Framehawk による⾼遅延・⾼損失ネットワーク対応
⼈間の⽬の特性を利⽤して、動きのある画像を推定補完することでパケット再送のない応答性を実現
• パケット損失で失われたデータを
補完し、動きが⽌まったところで
ロスレス表⽰
• ユーザ操作に対する追従性を改善
• CPUの負荷およびメモリの消費量
は Thinwire と⽐較してサーバー、
クライアントともに⼤きめ
• ネットワーク帯域の消費量も
H.264を使⽤した場合と⽐較して
⼤きめになります
• リモート拠点で利⽤する場合は
DatagramTLSをサポートした
NetScaler11.0ビルド 62.10以降
が必要になります
14
©2016CitrixSystemsJapan
XenDesktop7.11で HDX3DProに対応するゲスト環境
Windows2016Serverに DAY1サポート、Linuxゲストでも HDX3DProが利⽤可能になりました
15
• リソースの専有アサインを保証
• アプリケーションはキャッシュされ、迅速
• ユーザーデスクトップライセンス
• CCUライセンス(同時接続数)あり
• 専業 CAD/CAEオペレータ向き
• 製造、建築、保守の現場の作業者向き
WindowsOperating Systems(VDAGuestsw/3DPro)
LinuxOperatingSystems(VDAGuestsx86-64w/3DPro)
WindowsServer2016Standard, DataCentereditions
SuSE LinuxEnterpriseServer12SP1
WindowsServer2012, 2012R2Standard,DC
SuSE LinuxEnterpriseDesktop12SP1
WindowsServer2008R2Standard,Enterprise,DC
RedHat EnterpriseLinux Server6.8,7.2
Windows10Pro,Enterprise,Education,Mobile
RedHat EnterpriseLinux Workstation6.8,7.2
Windows8.1Professional,Enterprise
CentOS Linux6.8,7.2
Windows7SP1Professional, Enterprise,Ultimate
*Debian 8.x,Ubuntu12.xは XenServer7.0対応、VDAは開発中
©2016CitrixSystemsJapan
設計業務に必要なペリフェラルもサポート
設計に必要な 3Dマウス、特殊キーボード、ペンタブレットを USBで接続可能
3Dマウスやタブレットに最適化された USBリダイレクトを提供
XenDesktopだけではなくサーバー OS利⽤の XenAppでも利⽤可能
3DSPACEMOUSE
WACOMINTUOSPRO
16
©2016CitrixSystemsJapan
CAD /CAEから⼀般 OAに広がる GPU の利⽤
Windows10では基本的に DirectX…
AEROも Disableできません
17
©2016CitrixSystemsJapan
いちばん GPU を使う
オフィス ユーザー
アプリケーションは…
Internetブラウザー !!
GPU仮想化はあらゆる
ユーザーに有効
18
©2016CitrixSystemsJapan
オフィスユーザの GPU VDIに… TeslaM10
1枚のカードに 4GPUを搭載,GRID4.0で 64vGPU に分割可能.2Uサーバーに 2枚搭載すれば、1台で 128vGPU
19
©2016CitrixSystemsJapan
XenServer+
XenDesktop
withCAD/CAE
ユーザー導⼊事例
20
©2016CitrixSystemsJapan
“⽇産⾃動⾞株式会社では、IT による価値創造(Value Innovation)の
取り組みとして、XenDesktop と XenServer による
3D CADアプリケーションの仮想デスクトップシステムを構築。
北⽶と英国から、⽇本にある⼀元化されたCAD/PDMデータに
⾼速にアクセスできるインフラを構築しました。”
⽇産⾃動⾞株式会社 グローバル情報システム本部 エンジニアリングシステム部 主管 松⽊ 幹雄 様
https://www.citrix.co.jp/customers/nissan-motor-jp.html
21
©2016CitrixSystemsJapan
“私達の⽬標は 2018年までに 5,000同時コネクションまでCAD環境を
拡張することです。最新のグラフィックスカード メーカーの技術⾰
新とCitrixソリューションのリソースプール利⽤効率の改善によって
実現が可能になると考えています。”
Frédéric Trujillo, infrastructure technical architect at PSA
22
©2016CitrixSystemsJapan
CAD ユーザー 400名以上を稼働
“私たちは XenServer の⼤ファンです。
どんなに過酷に使い倒しても、
きっちり動くから。”
Neil Bailey, Head of IT Infrastructure, Red Bull Technology
23
©2016CitrixSystemsJapan
イタリアの設計チーム
と⽶国インディアナポリス
のテストチームが共同開発
“ 今⽇の市場競争では、成功は競合の動きにあわせて速やかに対応できるか否かにかかっています。
Citrix の技術は、そのようなビジネスの俊敏性を可能にする基盤を提供してくれます。”
Fabrizio Arbucci - CIO, Dallara
24
©2016CitrixSystemsJapan
25
©2016CitrixSystemsJapan
26
©2016CitrixSystemsJapan