ブロケード FC ファブリックスイッチ オペレーション講座(後編)

ブロケード FC ファブリックスイッチ
オペレーション講座(後編)
Agenda
• SANスイッチの監視設定
‒ SNMP
‒ Syslog
• トラブルシュートのための操作
‒ 接続トラブル
‒ ファブリックトラブル
‒ パフォーマンストラブル
‒ その他
Brocade FC Switch Operation 2/2
2
SANスイッチの監視設定
Brocade FC Switch Operation 2/2
3
SNMP
汎用的な機器監視プロトコル
• SNMP v1/v3に対応
• SNMPエージェント (スイッチ)の設定
‒ SNMPマネージャやメッセージレベル、コミュニティの設定
‒ 特定のMIBの有効 (On)/無効 (Off)を設定
‒ 6つのSNMPコミュニティ (SNMPマネージャ)を登録可能
• SNMPマネージャの設定
SNMP設定画面 (Web Tools)
‒ コミュニティ名の設定
Web Toolsログイン→Switch Adminメニュー
‒ MIBのインストール
• SNMPv1のセキュリティ
‒ コミュニティー名の認証
• SNMPv3のセキュリティ
‒ ユーザー名の照合
‒ MD5 or SHAアルゴリズムの認証
‒ DES暗号化
[SNMPリクエストに対するセキュリティレベル]
0 No security.
1 Authentication only.
2 Authentication and Privacy.
3 OFF
トラップ
ポーリング
FCスイッチ
(エージェント
)
SNMPマネージャ
Brocade FC Switch Operation 2/2
4
SNMPの設定
SANスイッチ側の設定概要
• SNMP V1/V3 プロトコルの有効化
• SNMP V1/V3 設定
‒ Trap Recipient(SNMPマネージャ)設定
‒ Community/Access Control設定
• Mib capability の設定
• System Groupパラメータの設定
Brocade FC Switch Operation 2/2
5
SNMP V1/V3 プロトコルの有効化
SNMP v1の設定例
switch:admin> snmpconfig --enable snmpv1
switch:admin> snmpconfig –-set snmpv1
SNMP community and trap recipient configuration:
Community (rw): [Secret C0de]
Trap Recipient's IP address : [0.0.0.0] 172.24.197.15
Trap recipient Severity level : (0..5) [4]
Trap recipient Port : (0..65535) [162]
Community (rw): [OrigEquipMfr]
Trap Recipient's IP address : [0.0.0.0]
Community (rw): [private]
Trap Recipient's IP address : [0.0.0.0]
Community (ro): [public]
Trap Recipient's IP address : [0.0.0.0] 172.24.197.15
Severity Level
0:None
1:Critical
2:Error
3:Warning
4:Informational
5:Debug
イベント発生したとき、イベントのレ
ベルに応じて通知するイベントを選択
可能
(swEventTrap,connUnitEventTrap,s
wFabricWatchTrap)
SNMPv1は6つのコミュニティが設定可能
Brocade FC Switch Operation 2/2
6
SNMP V1/V3 プロトコルの有効化
SNMP v3の設定例
Switch:admin> snmpconfig --enable snmpv3
Switch:admin> snmpconfig --set snmpv3
Informsを使うときのみ設定
(Recipientへ受領確認要求)
SNMP Informs Enabled (true, t, false, f): [false]
SNMPv3 user configuration(snmp user not configured in FOS user database will have physical
AD and admin role as the default):
User (rw): [snmpadmin1]
Auth Protocol [MD5(1)/SHA(2)/noAuth(3)]: (1..3) [3] 1
New Auth Passwd:
Priv Protocol [DES(1)/noPriv(2)/AES128(3)/AES256(4)]): (1..4) [2] 4
New Priv Passwd:
User (rw): [snmpadmin2]
Auth Protocol [MD5(1)/SHA(2)/noAuth(3)]: (1..3) [3]
Priv Protocol [DES(1)/noPriv(2)/AES128(3)/AES256(4)]): (2..2) [2]
途中省略
SNMPv3 trap recipient configuration:
Trap Recipient's IP address : [172.24.197.184]
UserIndex: (1..6) [1]
Trap recipient Severity level : (0..5) [4]
Trap recipient Port : (0..65535) [162]
以下省略
SNMPv3用のユーザーと認証プロトコル、
暗号方法を設定
ユーザー名は最大32文字以内で変更可能
プロトコルパスワードは1~20文字以内
Recipientは6つ設定可能
UserIndexは上記SNMPユーザーを番号で指定
Brocade FC Switch Operation 2/2
7
SNMP V1/V3 設定(ACL)
アクセスを許可する端末の設定
switch:admin> snmpconfig --set accessControl
SNMP access list configuration:
Access host subnet area in dot notation: [0.0.0.0] 192.168.0.0
Read/Write? (true, t, false, f): [true]
Access host subnet area in dot notation: [0.0.0.0] 2001:0db8:1234:1::1/128
Read/Write? (true, t, false, f): [true] f
以下省略
Committing configuration...done.
switch:admin> snmpconfig --show accessControl
SNMP access list configuration:
Entry 0: Access host subnet area 192.168.0.0 (rw)
Entry 1: Access host subnet area 2001:0db8:1234:1::1/128 (ro)
以下省略
Brocade FC Switch Operation 2/2
8
Mib capability の設定
使用するMIB(通知するトラップ)の選択
switch:admin> snmpconfig --set mibCapability
The SNMP Mib/Trap Capability has been set to support
SW-TRAP (yes, y, no, n): [yes]
swFCPortScn (yes, y, no, n): [yes]
swEventTrap (yes, y, no, n): [yes]
Desired Serverity Level (1- critical 2- error 3 ¥
-warning 4- informational 0 -None): 4
以下省略
switch:admin> snmpconfig --show mibCapability
FE-MIB: YES
途中省略
SW-TRAP: NO
swFault: NO
swEventTrap: YES
DesiredSeverity:4
Brocade FC Switch Operation 2/2
9
System Groupの設定
機器の設置場所、連絡先などの情報を設定
Switch:admin> snmpconfig --set systemgroup
Customizing MIB-II system variables ...
At each prompt, do one of the following:
o <Return> to accept current value,
o enter the appropriate new value,
o <Control-D> to skip the rest of configuration, or
o <Control-C> to cancel any change.
To correct any input mistake:
<Backspace> erases the previous character,
<Control-U> erases the whole line,
sysDescr: [Fibre Channel Switch.]
sysLocation: [End User Premise.]
sysContact: [Field Support.]
authTrapsEnabled (true, t, false, f): [false]
Brocade FC Switch Operation 2/2
10
Brocadeが提供するMIBファイル
MyBrocade Webサイトから取得可能
必須
MIBファイル
MIBモジュール名
MIBオブジェクトの機能
bcCustomOperation.mib
BCCUSTOM-OPR-MIB
Huawei内蔵スイッチ固有のMIB
bd.mib
BD-MIB
Bottleneck Detection
BRCD_REG.mib
Brocade-REG-MIB
Brocade固有のMIB
BRCD_TC.mib
Brocade-TC
Brocade固有のMIB
BROCADE-MAPS-MIB.mib
BROCADE-MAPS-MIB
Brocade固有のMIB
brcdfcip.mib
Brocade-FCIP-EXT-MIB
FCIPデバイス管理固有のMIB
CPQ_HOST.mib
CPQHOST-MIB
Compaq固有のMIB
CPQ_RACK.mib
CPQRACK-MIB
Compaq固有のMIB
FA.mib
FCMGMT-MIB
Brocadeから提供しているFibre Alliance MIB
faext.mib
FA-EXT-MIB
FA-MIBの拡張セット
FICON.mib
LINK-INCIDENT-MIB
FICONデバイスの管理
fod.mib
IBM-FEATURE-ACTIVATION-MIB
IBMが提供するFeatures On Demandのライセンスキー管理
HA.mib
HA-MIB
FRUの状態を示すMIB
IBMBladeCenter.mib
SW-MIBの一部
IBM BladeCenter内蔵スイッチ固有のMIB
SW.mib
SW-MIB
Brocade固有のMIB
Brocade FC Switch Operation 2/2
11
MIBの相互依存性
Brocade FC Switch Operation 2/2
12
Syslog
スイッチ本体のRASログを外部サーバで保存
• Syslogサーバ (syslogd)が必要
‒ UNIX/Windows用Syslogd
• スイッチのRASログをSyslogサーバへ出力することによ
り、ログを永続的に記録することが可能
‒ RAS Log:スイッチ内部で記録されるメッセージログのこと
‒ スイッチ本体で保存可能なメッセージ数は1024エントリ
‒ スイッチ本体の古いメッセージから順次上書きされる
• Syslogクライアント (スイッチ)の設定
error,warning etc.
‒ CLI/WebToolsから設定
‒ 6つのsyslogサーバまで設定可能
• ダイレクタ製品の場合、AuditメッセージはActive CPか
らのみ送信
FCスイッチ
(クライアント)
Brocade FC Switch Operation 2/2
Syslogサーバ
13
Syslog の設定
SANスイッチ側の設定概要
• Syslog サーバの IP アドレス設定
• Syslog ファシリティの設定
Brocade FC Switch Operation 2/2
14
Syslog サーバの IP アドレス設定
設定例
switch:admin> syslogdipshow
syslog.1 172.24.182.54
syslog.2 172.24.197.184
switch:admin> syslogdipadd 192.168.0.1
Syslog IP address 192.168.0.1 added
switch:admin> syslogdipshow
syslog.1 172.24.182.54
syslog.2 172.24.197.184
syslog.3 192.168.0.1
switch:admin> syslogdipremove 172.24.197.184
Syslog IP address 172.24.197.184 removed
switch:admin> syslogdipshow
syslog.1 172.24.182.54
syslog.2 192.168.0.1
switch:admin>
Brocade FC Switch Operation 2/2
15
Syslog ファシリティの設定
設定例
switch:admin> syslogdfacility -l 1
Syslog facility changed to LOG_LOCAL1
switch:admin> syslogdfacility
LOG_LOCAL1
Brocade FC Switch Operation 2/2
16
Brocade SANスイッチ監視のヒント
SNMP,Syslogで何を監視すべきか
• 機器障害の監視がしたい
‒ 重要障害はスイッチ本体のRAS Logに記載される
•
一番シンプルな監視はRAS Logのエントリーの監視
•
SNMPではRAS Logの内容はswEventで通知される
‒ 各種メッセージ専用のTrapは無い
‒ swEventで通知されたメッセージの詳細内容はMessage Referenceを参照
• FCポートのリンクアップ/ダウンの監視
‒ FCポートのリンクアップ/ダウンはRAS Logに記載されないので直接監視することは出来ない
•
リンクアップ/ダウンは結果であって障害原因ではない
•
原因側(サーバ・ストレージの障害やSFPの障害)を監視すべき
‒ SNMPの場合、swFCPortScn (SW-Trap) でFCポートの状態遷移を監視する
‒ Syslogの場合、Port State変更のメッセージを強制的に発生させなければならない
•
Fabric Watch/Fabric Visionが必要
•
Port State Changeカウンターが増加したときにRAS Logへ記載するルールを設定する
Brocade FC Switch Operation 2/2
17
トラブルシュートのための操作
© 2015 BROCADE COMMUNICATIONS SYSTEMS, INC. INTERNAL USE
18 ONLY
トラブルシューティングの基礎
SANスイッチ、サーバ、ストレージ、アプリ全体でアプローチ
Filesystem/Apps
• 時刻同期はトラブル早期解決の第一歩
‒ トラブルの被疑箇所は多岐にわたるため、各種ログの比較検
討が重要
‒ 障害発生当時のログを付き合わせはタイムスタンプが基準
•
サーバ・ストレージ・SANスイッチそれぞれで時間差があるとログ比較が難しい
•
NTP等で機器間の時差をなくしておくべき
MPIO/devmapper
Driver
App ログ、
Kernelメッセージ
HBA
• 適切な情報収集と事象の明確化
‒ 何も知らない第三者(ベンダー等)へ的確に問題を伝え、情
報を提供すること
•
事象は何か?(いつ、何が、どうした、再現性、etc)
•
運用環境の情報
•
障害時のログ
SAN スイッチ
RAS ログ
ストレージ
各種 ログ
Brocade FC Switch Operation 2/2
19
情報の収集
SANで起こり得る問題とSANスイッチにおける調査内容
問題の種類
調査事項
ツール
エンドデバイス接続
(デバイス認識不可)
•Link, login
•Fabric (ゾーニング、セキュリティ)
•End-to-End デバイス接続
•Switch LED
•Switch コマンド
•エンドデバイスのパラメータ
スイッチ接続
(ファブリック構成)
•可用性がないLink
•不正なゾーニング、ACL、VF設定
•不正なスイッチパラメータ
•Switch LED
•製品情報
•Switch コマンド
•Web、GUIモニタリング機能、管理ソフトツール
パフォーマンス
(I/Oが遅い)
•BBクレジットの状況
•トラフィック量
•Switch コマンド
•管理ソフトツール
ファームウェア保守
•ネットワーク接続
•FTPパラメータ
•スイッチパラメータ
•ホスト側のツール、FTPパラメータの調査
•スイッチのFTPパラメータの確認
セキュリティ
(スイッチアクセス)
•ネットワーク接続
•Switch認証、設定パラメータ
•ホスト側のツール
•Switchのネットワークパラメータ、ユーザー認証
Brocade FC Switch Operation 2/2
20
supportSave の取得
可能な限りトラブル発生直後に取得
• supportSave
‒ ベンダーサポートが解析に必要な情報を取得
FFDC : First Failure Data Capture
• RASlog, TRACE, supportShow, Core file, FFDC data等を一つのコマンドで取得
• supportSaveはadmin権限のあるアカウントで実施
• supportFtpコマンドで事前にFTP/SCPサーバ・アカウントを設定しておくと便利
‒ supportSave実行時にサーバ情報の入力を省略可能 “supportsave –c –n” で一発取得
‒ trace dumpの自動保存
• 各種テキスト・バイナリファイルが大量に生成される(50ファイル以上)
‒ 一つのファイルにまとめてベンダーへ提出
取得結果の一部
‒ コマンド実行結果も出力される(*.txt.gzで保存)
Brocade FC Switch Operation 2/2
21
supportFtp コマンド
supportSave,traceDumpの出力先を事前設定
switch:admin> supportftp –s
(FTPサーバパラメータの設定)
Host IP Addr[]:172.24.197.10
User Name[]:ftpuser
Password[]:*******
Remote Dir[]:/autosupport
Auto upload protocol[]:ftp
supportftp: parameters changed
switch:admin> supportftp –e
(Trace dumpの自動保存機能ON)
Support auto file transfer enabled.
switch:admin> supportftp -t 2
(ftpサーバの接続確認間隔設定)
supportftp: ftp check period changed
B6510-01:FID128:admin> supportftp –S (設定表示)
Host IP Addr: 172.24.197.10
User name:
ftp
Remote Dir:
/autosupport
Auto Upload protocol: ftp
FTP Auto check: 2 Hours
Auto-FTP:
On
switch:admin>
Brocade FC Switch Operation 2/2
22
errShow / errDump コマンド
RAS Logを表示するコマンド
• スイッチに保存されているエラーやイベントを表示
‒ ErrShow : 一画面ごとのPauseあり
‒ ErrDump : 一画面ごとのPauseなし
• ログは1024エントリ分を保持し、古いものから上書きされる
‒ ログのクリアは errClear コマンド
• Message ID の詳細はFabric OS Message Reference を参照する
Message ID
Severity
B6510-01:FID128:admin> errdump
Fabric OS: v7.2.1d
2015/05/12-18:24:07, [FW-1424], 4, FID 128, WARNING, B6510-01, Switch status changed from HEALTHY to MARGINAL.
2015/05/12-18:24:07, [FW-1439], 5, FID 128, WARNING, B6510-01, Switch status change contributing factor Switch offline.
2015/05/12-18:25:08, [FW-1425], 6, FID 128, INFO, B6510-01, Switch status changed from MARGINAL to HEALTHY.
2015/05/12-18:25:20, [ZONE-1004], 7, FID 128, INFO, B6510-01, Base PID: 0x070c00, Port Index: 1, Port: 1: enforcement changed to Session-based ARD
Zoning.
2015/05/12-19:10:47, [SNMP-1005], 8, FID 128, INFO, B6510-01, SNMP configuration attribute, SNMPv3 User Name 6, has changed from [snmpuser3] to
[admin].
Brocade FC Switch Operation 2/2
23
• 接続系トラブル
• ファブリック系トラブル
• パフォーマンス系トラブル
• その他
Brocade FC Switch Operation 2/2
24
ポート初期化
U - Port
• 機器が接続されている正常なポートはF_PortかE_Portになる
no
yes
‒ G_Portでかつオンライン状態を維持する場合は問題がある
•
E_PortやF_Portに遷移することに失敗している?
ポートに何か接続されている?
y/n
ループデバイス接続?
FL - Port
‒ FLOGI失敗
y/n
yes
•
サーバHBAドライバ不具合?
•
SFP+トランシーバ・ケーブル不具合?
no
G - Port
デバイスorスイッチ接続?
• ポートLEDの状態確認
F - Port
• switchShowコマンドでポート状態を確認
Fabric
pt-to-pt
switch:admin> switchshow
途中省略
y/n
switch
E - Port
Index Port Address Media Speed
State Proto
==================================================
0 0 070000 id N8
Online
FC E-Port 10:00:00:05:1e:08:ce:99 "B5300"
1 1 070c00 id N8
Online
FC F-Port 50:0a:09:81:89:fb:8f:f9
2 2 070200 id N8
Online
FC F-Port 50:0a:09:81:99:fb:8f:f9
3 3 070300 -- N16
No_Module FC
以下省略
Brocade FC Switch Operation 2/2
25
リンク失敗
• リンク失敗はサーバ、ストレージ、スイッチとスイッチの間で発生する。
‒ switchShow コマンドでリンク失敗の理由を確認
• 発生しやすい原因
‒ ポートスピードのオートネゴシエーション
• 通常はオートネゴシエーションで問題ないが、ネゴシエーションに失敗するときは速度の固定設定
‒ ループ(FC-AL)初期化の失敗
• Gen5 FCではFC-ALはサポートしない
関連コマンド
• 8Gbps FC以前の場合、スイッチポートをFL_Portに固定
switchShow
当該スイッチのポートステータスを表示
portCfgShow
スイッチポートの設定状態を一覧表示
portCfgSpeed
スイッチポートの速度設定
portCfgLport
スイッチポートをFLに固定
portCfgGPort
ポート初期化でLoop判別しない
‒ Point to Point初期化の失敗
•
ループ初期化時に判定が失敗する
•
ポートをG_Portに固定し、ループ初期化手順を省略する
Brocade FC Switch Operation 2/2
26
ポートログによるリンク初期化確認
• 通常、switchShowでポートの状態を確認することでリンク初期化の
成否を判断するが、ポートログでも確認できる。
B6510-01:FID128:admin> portlogdumpport 1
time
task
event port cmd args
------------------------------------------------Thu May 28 16:55:58 2015
16:55:58.892 SPEE
sn
1 WS 00000009,00000000,00000000
16:55:58.901 SPEE
sn
1 NM 00000009,00000000,00000000
16:55:58.921 SPEE
sn
1 NF 00000009,00000000,00000000
16:55:59.143 SPEE
sn
1 NC 00000008,00000000,00000000
16:55:59.144 INTR
pstate 1 OL1
16:55:59.454 INTR
pstate 1 LF2
16:55:59.636 INTR
pstate 1 AC
sn : speed negotiation
NC : Negotiation has Completed
0x08 : 8Gbps でLink Up
(16Gbpsは0x10)
pstate : Port State Machine Values
AC : Active state
CmdにACが表示されているとPoint to Pointで初
期化完了を意味する
Brocade FC Switch Operation 2/2
27
Marginal Links(リンク不安定)
• Marginal Linkは、スイッチとデバイスの間の接続が要求されるスペック
を満たしていないに発生する
• Marginal Linkの原因を調べるには、リンクを形成する多くのコンポーネ
ントのテスト、分析が必要となる
• Marginal Linkのトラブルシュートには、ケーブル、SFPの交換、エラー
カウンターの調査、リンク、ポート、end-to-endの経路の診断が含まれ
る
‒ PortErrShowコマンドを実行する
‒ CRCエラーやENC_OUTエラーが高いポートが無いか、あるいはエラーの数が
常に上昇傾向にあるポートが無いかを調べる
• カウンターが上昇するまで、5分ごとにサンプルをとる
Brocade FC Switch Operation 2/2
28
Marginal Links(続き)
• 疑わしいリンクについて、
‒ ケーブルを別のポートに接続してみる
‒ SFPを挿し直す
‒ 問題が解消した場合、スイッチのポートかSFPに問題がある
‒ 問題が解消しない場合、ケーブルに問題がある(ケーブルを交換)
Brocade FC Switch Operation 2/2
29
PortErrShowコマンド
• 各ポートのエラーの積算総数を表示
‒ エラーの増加傾向を調べる
• エラー発生時間を特定できないので、数値の有無だけで障害かどうか判断できない
• 障害調査時にstatsClearコマンドで一度値をクリアし、増分を調査する
‒ 主な項目の概要
•
•
frames tx/rx:転送/受信したフレームの数
crc_err:CRCエラーのフレーム数
‒
•
‒
•
このカウンターが上昇する場合、物理層が疑われる(ケーブル、パッチパネル、SFP)
enc_out:フレーム外で発生したエラーで、通常はプリミティブの問題を示す
8Gbpsブレードの場合、portcfgfillwordコマンドを検討する
disc_c3:(discarded class 3)保持時間を過ぎ、破棄したフレームの数
porterrshow:
frames enc crc too too bad enc disc link loss loss frjt fbsy
tx rx in err shrt long eof out c3 fail sync sig
=====================================================================
0: 464k 968k 0 0 0 0 0 83 0 21 14 0 0 0
1: 626k 488k 0 0 0 0 0 101 1 27 13 0 0 0
2: 392k 75k 0 0 0 0 0 358 0 12 1 0 0 0
3: 909k 547k 0 0 0 0 0 5.0m 0 9 20 0 0 0
4: 83k 276k 0 0 0 0 0 19k 1 15 7.3k 1 0 0
5: 165k 324k 0 0 0 0 0 66 2 9 0 0 0 0
6: 0 0 0 0 0 0 0 0 0 6 0 1 0 0
Brocade FC Switch Operation 2/2
30
サーバからストレージが認識されない
サーバ、ストレージとスイッチ間のリンクは正常なのに・・・
• スイッチのネームサーバに対象デバイスが登録されていることを確認
‒ nsShow等ネームサーバ関連コマンド
‒ セキュリティーポリシー(SCC (Switch Connection Control) )の確認
• Zoning 設定を確認
‒ 当該サーバとストレージポート間でZoneが設定されているか?
‒ Zone設定が正しいか?
• fcping、portCamShow、nsZoneMemberコマンド等で確認
• サーバ及びストレージの設定を確認
‒ LUNマッピング/マスキングやアクセス制御など各サーバ・ストレージの設定
にて対象デバイスのアクセス可能であることを確認
Brocade FC Switch Operation 2/2
31
ネームサーバの確認
• デバイスは必ずネームサーバに登録される
• デバイス認識問題の確認
‒ 設定不備の確認の前にデバイスがファブリッ
クにログインしていることを確認しておく
WebTools上からも確認可能
Name Server関連コマンド
nsShow
当該スイッチのName server に登録されたノードの表示
nsAllShow
ファブリック上の全ノードのFCアドレスを表示
nsCamShow
Name Server Cache Managerの情報を表示
→当該スイッチ以外に接続しているノードの表示
Brocade FC Switch Operation 2/2
32
• 接続系トラブル
• ファブリック系トラブル
• パフォーマンス系トラブル
• その他
Brocade FC Switch Operation 2/2
33
スイッチのカスケード接続ができない
• スイッチ同士を接続したポートLEDが1秒間隔で点滅
• switchShowの出力結果で”segmented”の状態になる
• ライセンスが両スイッチに入っているか?
• セキュリティ設定のミスマッチ
‒ 双方のスイッチでセキュリティ設定
(SCC:Switch Connection Control)の差異が
ある場合
‒ Full Fabric Licenseが必要(B300では要確認)
‒ licenseShowコマンドで確認
• ドメインIDの重複
‒ configureコマンドで修正/一方のスイッチを停止・起動
• ファブリックパラメータの不一致
‒ configShowコマンドで確認・比較
‒ configureコマンドで修正/configdefaultで初期設定に復元
• ゾーン情報の不一致
‒ 一方のスイッチの情報をクリアで解消
B6510-01:FID128:admin> switchshow
switchName:
B6510-01
switchType:
109.1
switchState: Online
switchMode:
Native
switchRole:
Principal
switchDomain: 7
switchId:
fffc07
switchWwn:
10:00:00:05:33:7a:0d:38
zoning:
ON (smpl_cfg)
途中省略
Segmented状態と
その理由が表示さ
れる
Index Port Address Media Speed
State Proto
==================================================
0 0 070000 id N8
Online
FC E-Port segmented,
10:00:00:05:1e:08:ce:99(domain overlap)(Trunk master)
※セキュリティ設定(SCC Policy)の記述に不備がある場合、下記の様なメッセージで接続に失敗す
る
0 0 010000 id N8
No_Sync
FC Disabled (SW Security Violation - SCC Policy
Violation, Peer WWN not in ACL list)
‒ Network Advisorでゾーン情報の合成
Brocade FC Switch Operation 2/2
34
ファブリックパラメータの比較
• ファブリックパラメータの不一致
を確認するには、それぞれのス
イッチでconfigshow –pattern
“fabric.ops” で得られる値を比較
する
• 値に差異があるときは
switchDisable実施後にconfigure
で該当パラメータの値を設定し、
switchEnableでスイッチを動作さ
せる
B6510-01:FID128:admin> configshow -pattern "fabric.ops"
fabric.ops.BBCredit:16
fabric.ops.E_D_TOV:2000
fabric.ops.R_A_TOV:10000
fabric.ops.bladeFault_on_hwErrlevel:0
fabric.ops.dataFieldSize:2112
fabric.ops.max_hops:7
fabric.ops.mode.fcpProbeDisable:0
fabric.ops.mode.isolate:0
fabric.ops.mode.longDistance:0
fabric.ops.mode.noClassF:0
fabric.ops.mode.pidFormat:1
fabric.ops.mode.tachyonCompat:0
fabric.ops.mode.unicastOnly:0
fabric.ops.mode.useCsCtl:0
fabric.ops.vc.class.2:2
fabric.ops.vc.class.3:3
fabric.ops.vc.config:0xc0
fabric.ops.vc.linkCtrl:0
fabric.ops.vc.multicast:7
fabric.ops.wan_tov:0
Brocade FC Switch Operation 2/2
35
• 接続系トラブル
• ファブリック系トラブル
• パフォーマンス系トラブル
• その他
Brocade FC Switch Operation 2/2
36
パフォーマンス低下の要因
• ストレージ内の特定のディスク・コントローラーにI/Oが集中
‒ ストレージのディスク構成、LUN配置の見直し
‒ コントローラーの増強
• ファブリック内のバッファ枯渇によるフロー制御(停止)の発生
‒ ISLがあるファブリック(複数スイッチで構成されるファブリック)
‒ 高速デバイスと低速デバイス(高遅延)の混在環境
• Slow Drain Device
STOP
STOP
STOP
STOP
STOP
低速デバイスのフロー制御が
ISLポートのバッファ枯渇を
引き起こし、ファブリック全
体に波及することがある
→Slow Drain
Brocade FC Switch Operation 2/2
37
パフォーマンス低下の検知
Bottleneck detection
• Slow Drain
‒ 世代混在のFCファブリック(スピードが異なる)場
合、顕在化することがある
• バッファクレジット型のフロー制御をするすべてのリンクレイ
ヤが持つ課題
‒ FOSv7.4以降のGen5FC製品では、slow drainデバ
イスを 1 Virtual Channel に隔離して、他のデバイ
スの通信を確保
• Bottleneck Monitor
‒ Bottleneckmonコマンドを使うと、F_Portや
E_Portの遅延や輻輳のボトルネックを検出できる
‒ Slow drain deviceはポートのegressで検出
‒ ライセンス不要
Brocade FC Switch Operation 2/2
38
Bottleneckmon コマンド
パフォーマンス低下発生を検知する
switch:admin> bottleneckmon --enable –alert
switch:admin> bottleneckmon --config –alert -cthresh .8 -time 240 1-15
switch:admin> bottleneckmon --show -interval 5 -span 30 2/4
=============================================
Wed Jan 13 18:54:35 UTC 2010
=============================================
Percentage of
From
To
affected secs
==============================================
Jan 13 18:54:05
Jan 13 18:54:10
20.00%
Jan 13 18:54:10
Jan 13 18:54:15
60.00%
Jan 13 18:54:15
Jan 13 18:54:20
0.00%
Jan 13 18:54:20
Jan 13 18:54:25
0.00%
Jan 13 18:54:25
Jan 13 18:54:30
40.00%
Jan 13 18:54:30
Jan 13 18:54:35
80.00%
Cthresh
Lthreash
congestion threshold
Latency threshold
FabricWatchで
通知可能
Brocade FC Switch Operation 2/2
39
パフォーマンス低下から自動復旧
Credit Recovery
• Credit Loss
‒ バッファクレジットの交換の ordered set (VC_RDY) が何らかの理由
で失われると発生
• 長距離接続環境等
• 発生すると、実質的なバッファ個数が減ってしまい、性能がダウン(最悪、通信途絶)
‒ Link Reset を発生させないと復旧しない
‒ Gen5 FC 製品では、Credit Recovery が自動的に行われる
• C2-1014メッセージが生成
Brocade FC Switch Operation 2/2
40
portStatsShowコマンド
ポート毎の統計情報を表示
B6510-01:FID128:admin> portstatsshow 2
stat_wtx
119853225 4-byte words transmitted
stat_wrx
3831446267 4-byte words received
stat_ftx
11022853 Frames transmitted
途中省略
tim_txcrd_z
0
Time TX Credit Zero (2.5Us ticks)
tim_txcrd_z_vc 0- 3: 0
0
0
0
tim_txcrd_z_vc 4- 7: 0
0
0
0
tim_txcrd_z_vc 8-11: 0
0
0
0
tim_txcrd_z_vc 12-15: 0
0
0
0
er_enc_in
0
Encoding errors inside of frames
途中省略
er_rx_c3_timeout
0
Class 3 receive frames discarded due to timeout
er_tx_c3_timeout
0
Class 3 transmit frames discarded due to timeout
以下省略
バッファクレジット0の状態を
2.5μ秒維持したときにカウント
スイッチのバッファに保持されている
Class3フレームがタイムアウトで破棄さ
れた場合にカウント
Brocade FC Switch Operation 2/2
41
• 接続系トラブル
• ファブリック系トラブル
• パフォーマンス系トラブル
• その他
Brocade FC Switch Operation 2/2
42
ClearLink D_Port によるファブリックの確認
• Gen5 FC で Brocade ブランドの 16,10Gbps SFP+, 8Gbps LW SFP+でサポート
‒ このポートはISLのリンクレベルの障害を診断できる
‒ 対応HBAとのリンク診断をサポート(要Fabric Visionライセンス)
‒ 診断用トラフィックを使用
‒ リンクの両端をD_Portに設定
‒ D_Portを設定する前にportdisableが必要
B6510-01:FID128:admin> portdporttest --show 3
D-Port Information:
===================
Port:
3
Remote WWNN:
10:00:00:05:33:d4:42:da
Remote port:
0
Mode:
Manual
No. of test frames:
1 Million
Test frame size:
1024 Bytes
FEC (enabled/option/active): Yes/No/No
CR (enabled/option/active): Yes/No/No
Start time:
Tue Jun 2 19:02:33 2015
End time:
Tue Jun 2 19:02:52 2015
Status:
PASSED
================================================================================
Test
Start time
Result
EST(HH:MM:SS) Comments
================================================================================
Electrical loopback 19:02:35
PASSED
----------------Optical loopback
19:02:40
SKIPPED
----------------Link traffic test
19:02:47
PASSED
----------------================================================================================
Roundtrip link latency:
308 nano-seconds
Estimated cable distance:
5 meters
Buffers required:
1 (for 2112 byte frames at 16Gbps speed)
Brocade FC Switch Operation 2/2
43
D_Port のテスト内容
• D_Portの使用ケース
‒
‒
‒
‒
新しいISLを、実際に使う前にテスト
新しいTrunk memberをtrunkに追加する前にテスト
長距離接続のケーブルとSFPのテスト
ループバックポートのテスト
• D_Portの設定は、E_Portか、Fabric Vision ライセンスが追加されかつ
D_Portに対応したデバイスの接続される F_Port で設定可能
Brocade FC Switch Operation 2/2
44
ハードウエアの状態確認
• psShowコマンド
‒ スイッチのPower Supplyの状態を表示
• tempShowコマンド
‒ スイッチ内のセンサーの温度情報を表示
• fanShowコマンド
‒ スイッチ内のファンの回転数を表示
• sfpShowコマンド
‒ SFPトランシーバの情報を表示
• sensorShowコマンド
‒ 温度、ファン、電源の状態を簡易表示
• chassisShowコマンド
‒ FRU の情報を表示
B6510-01:FID128:admin> sensorshow
sensor 1: (Temperature) is Ok, value is 45 C
sensor 2: (Fan
) is Ok,speed is 7670 RPM
sensor 3: (Fan
) is Ok,speed is 7500 RPM
sensor 4: (Power Supply) is Ok
sensor 5: (Power Supply) is Ok
B6510-01:FID128:admin> sfpshow 2
Identifier: 3 SFP
Connector: 7 LC
Transceiver: 7004404000000000 4,8,16_Gbps M5 sw Short_dist
Encoding: 6 64B66B
Baud Rate: 140 (units 100 megabaud)
Length 9u: 0 (units km)
途中省略
Vendor Name: BROCADE
Vendor OUI: 00:05:1e
途中省略
low
high
low
high
Temperature: 46
Centigrade
-5
85
0
75
Current:
7.944 mAmps
2.500
12.000 2.000
11.500
Voltage:
3335.4 mVolts
3000.0
3600.0 3100.0
3500.0
RX Power: -4.0 dBm (394.9uW) 31.6 uW 1258.9 uW 31.6 uW 794.3 uW
TX Power: -2.6 dBm (555.8 uW) 125.9 uW 1258.9 uW 251.2 uW 794.3 uW
Brocade FC Switch Operation 2/2
45
ハードウエアコンポーネントの状態確認 - Web Tools
Brocade FC Switch Operation 2/2
46
ありがとうございました
本件に関するお問い合わせ
ブロケード コミュニケーションズ システムズ株式会社
https://www.brocadejapan.com/form/contact