スライド 1 - SDN Japan

Yahoo! JAPANのSDN/OpenStackへの取り組み
∼爆速を支えるネットワークインフラのこれまでとこれから∼
2014/10/31
<コンタクト先>
ヤフー株式会社 高木 塁 [email protected]
YJ America, Inc. 市川 博隆 [email protected]
自己紹介
高木 塁
•
ヤフー株式会社(2010/04 - )
•
•
•
•
システム統括本部インフラ技術1部プライベートクラウド 所属
入社後、2∼3年サービス開発に従事
その後、1年ほどデータセンターネットワークの運用
現在は社内クラウド環境まわりの開発・検証
市川 博隆
•
YJ America, Inc. (2014/10 - )
•
•
Cloud infrastructure engineering division 所属
ヤフー株式会社 (2010/04 ‒ 2014/09)
•
•
ネットワークインフラ運用
社内クラウド環境のネットワークコンポーネント開発
P2
アジェンダ
•
•
•
•
•
クラウドへの取り組みの流れ
OpenStack利用環境のネットワークインフラ
SDNへの取り組み
最新Yahoo! JAPAN OpenStack事例
まとめ
P3
アジェンダ
• クラウドへの取り組みの流れ
– 自社開発クラウドの提供
– OpenStackの導入とその効果
•
•
•
•
OpenStack利用環境のネットワークインフラ
SDNへの取り組み
最新Yahoo! JAPAN OpenStack事例
まとめ
P4
自社開発クラウドの提供
• 2011年から2013年前半にかけて全社提供
• 全てをフルスクラッチで開発
– 既存のインフラと同様の構成で実現
– 独自の構成管理システムとの連携
• 利用者がWEB上で全てを操作
– リソースオンデマンド
– VM、ストレージ、DNS、ACL、LB、GSLBの機能を提供
• 数万VMが稼働
P5
自社開発クラウドにおける課題
• 独自インタフェースのAPI、原則非公開
– 操作性に欠けるUI
– OSSと連携させたいという社内からの要望
• 増強・運用で手一杯
– 新しい機能が増えない
• ライフサイクルが回らない
– ハードウェアの性能向上に載れない
– 新しい機器への対応も0から自分達で開発
P6
新たなクラウド基盤への方針転換
OpenStack
•
•
•
•
急速な勢いで成長
AWS互換API等、外部ツールとの連携性
拡張開発の容易性
ネットワーク周りの機能はひとまずデグレード
• 依頼ベースのネットワーク設定
• Quantum/Neutronの進化に伴いデグレを解消
P7
OpenStackの導入による効果
• 2013年中期からOpenStackの導入を開始
• 導入により課題の解決を実現
– 公開された標準のAPIを備える
• UIなしでも操作可能、OSSと連携可能
• 社内システムと連携させているが、APIフォーマットは変えない
– 運用に人、手間を掛けない構成を実現
– 抽象化を実現し、その時最適な物をユーザに意識させることなく導入
• ハードウェアの性能向上を即座に享受可能
• データセンタライフサイクルマネジメントの実現
– コストの大幅な削減
– 機能をベンダーに開発してもらえる
– サービス開発者はより早く開発サイクルを回す事が可能になった
P8
アジェンダ
• クラウドへの取り組みの流れ
• OpenStack利用環境のネットワークインフラ
• ネットワーク構成
• ネットワークまわりで出てきた課題
• SDNへの取り組み
• 最新YJ OpenStack事例
• まとめ
P9
ネットワークの構成
VM
VM
P10
VM
VM
Linux Bridge
VM
VM
Linux Bridge
VLAN
L2スイッチ
L2スイッチ
Load Balancer
Neutron
GW
GW
L3スイッチ
・パフォーマンス重視の構成
・ひとつのVLANに様々なサービスのサーバが混在
ネットワークまわりで出てきた課題
• 構成次第で大きく変わる課題
P11
ネットワークまわりで出てきた課題
• 構成次第で大きく変わる課題
– Linuxbridgeではネットワークの柔軟性が課題
P12
ネットワークまわりで出てきた課題
• 構成次第で大きく変わる課題
– Linuxbridgeではネットワークの柔軟性が課題
– OpenStackリファレンスのNWはパフォーマンスが課題
P13
ネットワークまわりで出てきた課題
P14
• 構成次第で大きく変わる課題
– Linuxbridgeではネットワークの柔軟性が課題
– OpenStackリファレンスのNWはパフォーマンスが課題
20.0Gbps
通信速度
15.0Gbps
10.0Gbps
5.0Gbps
0.0Gbps
gre tunnel
linuxbridge
転送速度
3000Kpps
3.00ms
2000Kpps
応答速度
2.00ms
1000Kpps
1.00ms
0Kpps
gre tunnel
linuxbridge
0.00ms
gre tunnel
linuxbridge
ネットワークまわりで出てきた課題
• 構成次第で大きく変わる課題
– Linuxbridgeではネットワークの柔軟性が課題
– OpenStackリファレンスのNWはパフォーマンスが課題
• ACLの適用、VIPの設定が依頼ベース
– 利用者からの依頼を受けてから、ネットワーク運用者が設定
– 設定変更に時間を要する
P15
アジェンダ
• クラウドへの取り組みの流れ
• OpenStack利用環境のネットワークインフラ
• SDNへの取り組み
– ベンダーとの共創
• プラグインの機能
• パフォーマンス
• 最新Yahoo! JAPAN OpenStack事例
• まとめ
P16
ベンダーとの共創
• 構成次第で大きく変わる課題
– Linuxbridgeではネットワークの柔軟性が課題
– OpenStackリファレンスのNWはパフォーマンスが課題
• ACLの適用、VIPの設定が依頼ベース
– 利用者からの依頼を受けてから、ネットワーク運用者が設定
– 設定変更に時間を要する
• これらの課題を解決できるベンダーを探し、
BrocadeとNeutronに以下のプラグインを実装
– VDXプラグイン(ML2、SVI、FWaaS)
– ADXプラグイン(LBaaS)
P17
ネットワークの構成
VM
VM
P18
VM
VM
Open vSwitch
VM
Open vSwitch
VLAN
VDX6740T
Neutron
VDX6740T
ADX1016
GW
VDX8770
GW
VM
ML2プラグインの機能
VM
VM
P19
VM
VM
Open vSwitch
VM
Open vSwitch
VLAN
VDX6740T
Neutron
VDX6740T
ADX1016
GW
GW
VDX8770
• ML2の機能
– VLANの作成(ネットワーク作成時)
– trunkの設定追加(インスタンス作成時)
VM
SVIプラグインの機能
VM
VM
P20
VM
VM
Open vSwitch
VM
Open vSwitch
VLAN
VDX6740T
Neutron
VDX6740T
ADX1016
GW
GW
VDX8770
• SVIの機能
– SVIの作成
– VRRP
– VRFにも対応(利用有無はコンフィグで指定)
VM
FWaaSプラグインの機能
VM
VM
P21
VM
VM
Open vSwitch
VM
Open vSwitch
VLAN
VDX6740T
Neutron
VDX6740T
ADX1016
GW
GW
VDX8770
• FWaaSの機能
– ルールの作成
– ポリシーの作成
– ACLの適用(テナント毎に存在するSVIで)
VM
LBaaSプラグインの機能
VM
VM
P22
VM
VM
Open vSwitch
VM
Open vSwitch
VLAN
VDX6740T
Neutron
VDX6740T
ADX1016
GW
VDX8770
• LBaaSの機能
– メンバーの登録
– ヘルスモニターの設定
– VIPの作成
GW
VM
ネットワークのパフォーマンス検証
Linux Bridge
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
Open
vSwitch
Open
vSwitch
VLAN
VDX
6740T
Open vSwitch
+ VDX
Open vSwitch
+ gre tunnel
Linux
Bridge
Linux
Bridge
P23
VM
VM
VDX
6740T
VM
VM
VM
Open
vSwitch
Open
vSwitch
gre tunnel
VDX
6740T
VM
VLAN
VDX
6740T
VDX
6740T
VDX
6740T
Neutron
Neutron
GW
GW
VDX
8770
Open
vSwitch
GW
VDX
8770
Avalanche
VDX
8770
Neutron
ネットワークのパフォーマンス検証
P24
• 今回の検証の構成
構成
Kernel
Open vSwitch
ML2 mechanism
driver
Open vSwitch
+ VDX + K3
3.14.17
2.3
openvswitch,
brocade
Open vSwitch
+ VDX
2.6.32
2.3
openvswitch,
brocade
Open vSwitch
+ gre tunnel
2.6.32
2.3
openvswitch
Linuxbridge
2.6.32
-
linuxbridge
これらの環境の50VMに対してAvalancheから負荷を掛けて計測
応答速度はサーバからのレスポンスで最初の1バイトが返ってきた時の経過時間
ネットワークのパフォーマンス検証
P25
• 50VMに対して実施。
20.0Gbps
通信速度
15.0Gbps
10.0Gbps
5.0Gbps
0.0Gbps
gre tunnel
3000Kpps
転送速度
linuxbridge
VDX
3.00ms
応答速度
2000Kpps
2.00ms
1000Kpps
1.00ms
0Kpps
gre tunnel
linuxbridge
VDX
0.00ms
gre tunnel
linuxbridge
VDX
ネットワークのパフォーマンス検証結果
P26
• 1VMに対して実施。Kernel 3.14も検証
7.0Gbps
通信速度
6.0Gbps
15.0Kcps
新規接続
5.0Gbps
4.0Gbps
10.0Kcps
3.0Gbps
2.0Gbps
5.0Kcps
1.0Gbps
0.0Kcps
0.0Gbps
gre tunnel
linuxbridge
VDX
VDX+K3
gre tunnel
linuxbridge
VDX
VDX+K3
VDX
VDX+K3
900Kpps
750Kpps
転送速度
3.00ms
600Kpps
応答速度
2.00ms
450Kpps
300Kpps
1.00ms
150Kpps
0Kpps
gre tunnel
linuxbridge
VDX
VDX+K3
0.00ms
gre tunnel
50VMではワイヤレートになり比較不能なため、1VMでの比較になります
linuxbridge
ネットワークのパフォーマンス検証結果
P27
• ネットワークの課題を解決
– パフォーマンスは解決
– ネットワークの柔軟性も解決
– 構成がシンプルで、耐障害性向上
20.0Gbps
通信速度
15.0Gbps
10.0Gbps
5.0Gbps
0.0Gbps
gre tunnel
3000Kpps
転送速度
linuxbridge
VDX
3.00ms
応答速度
2000Kpps
2.00ms
1000Kpps
1.00ms
0Kpps
gre tunnel
linuxbridge
VDX
0.00ms
gre tunnel
linuxbridge
VDX
Brocadeとの共創
• ネットワーク抽象化に利用が可能
– スループット、安定性を重視した構成が構築可能
– GREの利用なしにネットワークの柔軟性を確保
– VLAN、ACLおよびLBの即時設定が可能な環境に
• Brocade VDX2台から始められる構成
(LBaaSも利用の場合はADX1台追加)
– 安価にスタート
– 40HV程度の構成が可能
• 多くの企業には十分なサイズ
P28
アジェンダ
•
•
•
•
•
クラウドへの取り組みの流れ
OpenStack利用環境のネットワークインフラ
SDNへの取り組み
最新Yahoo! JAPAN Openstack事例
まとめ
P29
YJ Americaについて
• Yahoo! JAPANの米国子会社
– 米国内のスタートアップ発掘・支援
– Yahoo! JAPAN向け米国データセンターの運営
– Yahoo! JAPANからのクラウド開発業務委託
• アメリカデータセンター立ち上げ
– ワシントン州郊外
– Yahoo! JAPANのインフラメンバーが現地へ赴任して運用
• 日本国内と比べ、以下のメリット
– データセンター維持費用低減 (電気料金 etc.)
– 機器メーカー等との連携、情報収集の容易さ
– (遅延を考慮し、サービスに直結しないものを稼働予定)
P30
USDC OpenStackクラスタ
• 各種Brocade製Neutronプラグインで構築中
• Yahoo! JAPAN内で最新のOpenStackクラスタ
• 128HV、約3840VMを提供予定
• VLAN、ACL、LB設定は全てNeutronで実施
– SDNコントローラとしてのNeutron
• 抽象化ネットワークを実現するコントローラAPI
– H/Wオフロードでパフォーマンスを維持
• 運用者の負荷軽減
• サービス担当者の待ち時間短縮
– 開発・検証・リリースのサイクルを爆速に
P31
アジェンダ
•
•
•
•
•
クラウドへの取り組みの流れ
OpenStack利用環境のネットワークインフラ
SDNへの取り組み
最新Yahoo! JAPAN OpenStack事例
まとめ
P32
まとめ
• Yahoo! JAPANはOpenStackを採用し、インフラの抽象化を
実現している
• Brocadeと共創し、ネットワークの抽象化を進めている
• H/Wオフロードすることでパフォーマンスを維持しつつ、
柔軟性のあるネットワークを実現
• VLAN、ACL、LBについてOpenStack/Neutronから
即時設定できるようになったことで運用者の負荷と
サービス開発者の待ち時間軽減につながった
P33
ありがとうございました
.
.