監視ソフト-PRTG紹介資料 - PRTG導入・設定のすみれ情報システム

サーバー・ネットワーク監視ソフト
PRTG Network Monitor Ver15のご紹介
4/1から100センサー無料!
東京ビックサイト 6/17~6/19 出展予定
H27年6月3日
㈱すみれ情報システム
PRTG Network Monitor
Paessler AG
PRTGは全世界15万本の実績
Fortune 100※の70%以上の企業が採用
※米国の「働きがいのある企業100社」
Paessler AG 所在地 ドイツ、バイエルン州、ニュルンベルク市
CEO
Dirk Paessler
設立
1995年
2003年 PRTG ver1 発表
弊社から上場企業、通信キャリア様、NI、SI企業様へ導入実績。
2
監視システムの必要性 =
システム管理の強化!
インターネット
メールや、ネットが使えない時、
ユーザが手を上げて管理者へ連絡します。
24x365で動くサーバや通信機器は止まっ
ても誰も手を上げません。監視システムを
導入する事で障害時に通知が可能です。
重大な障害にいち早く対応可能です。
FW
Lan
仕事でき
ない!
いつ・どこで障害が発生したのか?
システム全体を見渡し、障害デバイス
のステータスを時間軸、ログから確認
サーバ
デスクトップ
3
障害対応は調査から
「どこで」「何が」「どのように」動かないのかを調べる必要があります。
ユーザーから問い合わせを受けた時、初回に出来るだけ情報を吸い上げます。
真剣に聞く事で、次回から聞かなくても整理して説明してくれるかもしれません。
どの画面から「不具合」と判断したのか?起動時から?お昼休み後?特定アプリ
のみ?初めて?何度も?一度も成功しない?別の操作(ローカル側指定)では?タイ
ムアウト?エラーメッセージ?操作要求のポップアップを確認せずに「OK」で
流していないか?ユーザーPC内の問題か外か?同じLan内の別PCでは?単
なるアプリの不具合や操作ミス、設定ミス、自動アップデート後の再起動待ち?
リカバリ操作中に何度も試した?
問題発生の前後、同じものとの比較、間違い探しが問題解決のヒントです。
エラーメッセージがあれば、ベンダ名、型番が検索キーワードになります。
問題がPCの外の場合、接続先のサーバ・ネットワークの確認が必要です。
しかし障害時だけインフラを見ても、通常時の状態を知らないとどこがいつもと
違うのかが分かりません。
4
インフラの監視ポイント
500人程度のITシステムは、L3スイッチと部門スイッチ、サーバセグメント、拠点
間のPING、SNMP、ポート監視・シスログ・イベントログ確認、セキュリティログ
、オペ処理の確認でほぼ十分です。負荷分散が動いていたり、10以上のシステム運
用、商用サービス、24/365の場合は、システム毎に導入ベンダと保守体制を組
み上げるケースがほとんどです。一番利用するサーバ、ボトルネック、切り分けポイ
ントの勘所を監視する事で、ベンダーに迅速な情報提供が可能です。
障害調査では、初めての問題かどうか、物理的機器故障、電源、電波状況、回線品質
、タイムアウト、負荷状況、動的更新、セキュリティ、危険日等を検討します。
影響範囲確認/説明にフロア図、サーバ一覧リスト、ネットワーク図、ポートマップ
、ネーミングリスト、体制図、各部署担当者の連絡先一覧、ベンダー連絡一覧表、各
種マニュアル類、メッセージ一覧、過去の障害対応の情報がすぐに出せると障害対応
、原因調査の助けになります。
インフラを監視する事で問題発生時刻、通常時の負荷が分かり、障害発生前の状況を
確認可能です。運用レベル・体制に応じた監視ポイント、監視間隔、通知処理、障害
対応の流れを検討します。
5
ネットワーク・サーバ管理は見る事、知る事から。
• いつ、どこが?アップダウンを繰り返す?
• 過負荷?一時的リソース不足
• 構成変更、設定パラメータ変更、オペ後?
• アカウント権限?アプリ追加?
• ケーブル不良、コンデンサ、機器障害
• デバイスのLEDステータス
• セキュリティ設定ではじかれた?
• 保守ベンダ、切り分け
• 見える化、ボトルネックのポイント。
• サーバサービス、リソース、レスポンス
• 定常時/異常時のトラフィック 増加、変化
• エラーパケット、ブロードキャスト、将来予測
• 運転/利用状況の比較検討
• 危険日、エラーメッセージ
障害を
直したい
ネットワー
ク・サーバ
を使いたい
ネットワー
ク・サーバ
を見たい
ネットワー
ク・サーバ
を構築
• 自席、リモート、様々なデバイスを接続
• 動画、音声、24 x 365系サービス
• クラウド利用、セキュリティの確保
• ユーザ、アプリ、ポート追加
•
無線Lan、携帯デバイス利用
•
高速な拠点間接続。
•
ファイルサーバ、メールサーバ、グループ
ウェア、仮想化、拠点フロア増設
• ルータ、スイッチ、ケーブル敷設
• 2重化、BCP対策。VPN、暗号化通信
• ブラウザ簡単設定、一般的なよくある構成
• トラフィック、セキュリティ要件
6
PRTGのここがお薦め!
資金
時間
安全
2015/4/1からフリー版で100センサーまで利用可能。
SQLデータベース不要、機能制限がなくNetflow等の追加ライセンスが不要。
センサー数とインストール台数に応じてライセンス価格が決定。
インストールはWindowsマシンへ「次へボタン」6回で完了。
設定は「次へボタン」2回でグループ・デバイス・センサーを設定。
センサー設定の一括変更、ドラッグ&ドロップでセンサー設定のコピー可能。
物理サーバー上で最大20,000監視、VMware上で5,000監視まで。
監視項目毎に4種類のグラフと表を表示しログ、レポート、閾値通知設定、
グラフのカスタマイズ可能。Ping、SNMPによる大規模監視がお勧め。
7
ネットワーク監視
24x365で動かすインフラの切り分け
ポイントを検討。IT資産管理ソフト
とはステータスを拾うところが異なり
ます。コアスイッチ・部門スイッチの
全利用ポート。サーバセグメント・名
前解決。業務上主要なサーバサービ
ス・プロトコル、クラウド、VPN等の
外部接続状態を拾います。
NetFlow、sFlowが利用可能なら、セ
グメント毎、プロトコル毎のトラ
フィックを監視可能です。
Ping ,SNMPで全体を、
SNMP Trap、Syslogか
ら特定問題を即時に検知し
警報を発報。
8
パラメータシート作成
拠点
デバイ
ス種別
用途
名前解
決
IPアドレ
ス
グルー
プ名
セン
サー名
タイプ
監視間
隔
閾値
東京
L3スイッチ
コア
L3SW001
172.16.10.x
コントロー
ル室
snmp
traffic
traffic
60s
20 Mbit/S
SNMP設定
Ver
Port
コミュニティ名
通知1
通知2
v2c
161
public
メール
警報ラ
ンプ
備考
EXCELへ監視設定の一覧を洗い出しましょう。Ping監視だけの場合も、設置場所、
名前解決名、IPアドレスの漏れの無い一覧表が必要です。後で確認する時、情報共有にも便利。
作成したパラメータシートに従って設定する事でチェックリストとしても使えます。
デバイスの種類毎に監視パターンを作成しテンプレート化して再利用、パターンを知る事で
センサー設定のドラッグ&ドロップ、一括変更によるコンフィグ展開をイメージできます。
ネットワーク機器のプライベートMIB監視を検討する時に個別設定箇所がチェックできます。
建屋、フロア、システム名、ベンダ名、型番等のグループ名を作成しパターンを掘り下げ、
タグやセンサータイプでセンサー全体を眺めるとシステム更新時の検討、運用・運転のヒント
やシステム管理のイメージが湧きます。
9
デバイスツリー画面から監視設定スタート。
通知設定
一番上
二番は監視サービス
一番下がセンサー
三番目は
グループ
デバイス
①監視サービス下にグルー
プ、デバイスの階層を作成。
建屋、フロアの場所別グ
ルーピングが基本。
②デバイス(IP)の下にPing
等の各種センサーを作成。
管理タグからドラッグアン
ドドロップが可能。
10
全体調整はセンサー画面から、一括編集
①デバイス画面ではツリーを作成
②管理からデラッグ&ドロップでセンサーをコピー作成
③センサー画面から全体設定を一括編集
該当センサーを右の
チェックで一括選択
11
トラフィック監視
Inbound、Outboundの合計
トラフィックグラフ
トラフィック増大時、一番を確認。
何のプロトコル?どのIP?
12
トラフィック監視(IN/OUT) カスタマイズ可能
センサー毎にログ情報
受信が上、送信が下
13
サーバ監視(Windows、Linux、仮想マシン)
CPU
グラフが跳ねてないか?
Coreは負荷分散してる?
メモリ
Disk
基本はCPU、メモリ、DISK、
トラフィックのリソース監視
詳細は、死活監視、サーバーサービ
スの監視(ポートオープン、イベン
トログ、Syslog、スクリプトRC、
ファイル、ini設定、SSH等)を定期
的に監視する事が可能。
14
Webサービスの監視
SSL証明書の
有効期限が残り、
1245日
Webサービスの監視は、httpリクエストの応答時間・コンテンツ内容のチェック。
忘れがちなSSLサーバの証明書有効期限の監視が可能。例えばSSL暗号化処理装置のS
SLサーバ証明書の有効期限を監視する事で有効期限切れメッセージを防げます。
名前解決はDNSセンサーで名前解決の結果を監視可能。
15
メールサービス監視
死活監視(Ping)メールサーバのリソース監視(SNMP)
POP、SMTPサービス監視(レスポンス監視)
実際のメールアカウントを設定しテスト送受信によるレスポンス監視。
TCP25、110、以外にアウトバンドポート指定、各種認証設定可能。
16
サービスの監視 – サーバプロセスのメモリリーク監視 -
メモリ利用
キレイな右肩上が
りはメモリリーク
に注意!!
OSの起動後のメモリ
リソースの空き状況。
サービスの新規導入時、バージョンアップ後のサービス稼働状況の監視が可能です。
CPU、メモリ、インスタンス数、スレッド数、バンドル数、ワーキングセットなど。
開発中のサービスにメモリリークが発生していないか?サーバーのリソースを使い切
る事がないか?イベントログにエラーメッセージを出さないかなど。1週間、1ヶ月、
1年の時間軸でモニタリングが可能です。テスト環境・開発環境で監視を行い、本番
運用へもって行く前の確認が可能です。
17
Windowsイベントログの監視
イベントログをソース、IDで
キャッチしエラー・警告等に該
当したイベントを通知できます。
メール送信
警報ランプ点灯!
シスログサーバへ
メッセージ送信
18
安定性「自己監視」
• 監視サービスの処理状況をHealthセンサーで自己監視します。PRTGサーバのC
PU・メモリリソース、監視リクエスト遅延(WMI、SNMP、フローデータ
別)に処理状況を監視。
• Healthセンサーは削除不可。
• 監視サーバ1台の時は、警報ランプの監視機能(Ping)を利用し相互に監視する事
をお薦めします。(フリー版PRTGも利用可能)
19
Probe Health(監視リクエストのレスポンスチェック)
PRTGサーバ内で、監視処理の遅延やパケットロスが発生していないか?
遅延発生時は監視サーバのリソース追加、監視リクエストの監視間隔を長くする事を検討
20
警報ランプのお薦め(問題発生が1秒で分かる)
サーバルーム
ルータ
警報ランプ設置で
重大なエラーを
見逃がしません!
サーバ
F/W
L3SW
L2SW
①障害を検知
②警報ランプを点灯
③警報音発信!!
監視サーバ
運用端末
警報ランプ
21
通知設定 - 3段階のアクション設定 -
①ステータスがダウン(障害)
②ダウンステータスが
指定時間継続
繰り
返し
③ステータスがアップ(回復)
障害検知から回復まで3段階の通知アクションが設定可能。
①システム管理者へ最初の通知メール、ランプ点灯、警報音の複数通知選択。
②一定時間経過後、上位の管理者を含め選択した通知を繰り返し実行。
③復旧通知の送信、回復処理(ランプ消灯)
※大量通知は集約可能。通知スケジュール設定可能。
22
センサーステータス
ステー
タス
色
意味
レッド
センサーがダウン、または監視エラーが発生(2回目の監視データ
エラー)
淡いレッ
ド
センサーがダウン、システム管理者の確認済み
オレンジ
センサーの取得データが1日の平均、1週間の平均と比較して5倍以
上異なるとき。
イエロー
センサーがダウン、または監視エラーが発生(1回目の監視データエ
ラー)
グリーン
センサーがアップ。監視データが正常。
ブルー
センサーが監視処理を休止中。
グレー
センサーの状態が不明。監視データがProbeからCore側に届いてい
ない。
23
ログの確認
ダウン状態のセンサーをクリック
ダウンした時刻を確認します。
センサーメニューから、センサー
個別のログ情報を確認できます。
24
メール通知
センサーダウン時に通知メールを
送信可能です。件名に監視サーバ
名、監視対象グループ、デバイス、
センサー名、ステータス、メッ
セージを表示可能。
ヘッダー、フッター、本文
のカスタマイズ、html or
Textの選択が可能
大量のアラートメールを送
信せず集約が可能です。
電話通知はご相談下さい。
25
レポート機能(自動・手動実行)
設定期間のレポートをpdf
で管理者へ自動メール送信
ダウンタイム、閾値越え
定常リソースの状況確認
始業、休み明け、お昼、夜
間の利用状況を確認
レポート対象にグループ、
デバイス、センサーの単位
で選択可。
期間指定は1年、1か月、
1週間等の指定が可能。
HTML、CSV、PDFで出力
グラフは今現在。
レポートは過去。
26
TOP10機能(監視結果のベスト10リスト)
上から1番、
2番、3番。
リソース不足・余剰
の改善検討
例:ディスク空容量不足は
不要ファイル削除
常連センサーの確認
成績が良いセンサー
稼働率・レスポンス
が悪いセンサー
マーク(いつもと違う)
のセンサーは5倍となった
理由や運転状況を確認。
27
マップ作成機能(URLを社内に公開)
完成マップ
編集画面
左
中
右
①マップ作成から、サイズ、下絵を選択しマップを作成します。
②編集画面、左からツリー、グループ、デバイス、センサーを選択。
③編集画面、右からマップオブジェクトを選択し、中へドラッグ&ドロップ。
④View MAPから完成画面を確認し再度、編集画面で微調整を行います。
完成したマップはWEBページとして公開可能です。
28
サイトマップにマップをリンクしてまとめよう!
サイトマップ
リンク1
建屋・フロア・RACK
リンク2
部署別
リンク3
システム別
リンク4
ダウン・ワーニング一覧
29
TOP画面案(公開 or ログイン認証)
ホーム
SITE
MAP
1.
2.
3.
4.
5.
6.
建屋A
リンク
建屋Aアラート一覧
建屋B
リンク
建屋Bアラート一覧
30
サイトマップ構成案
TOP
画面
建屋A
建屋-フロア-ラック
3F
2F
RACK1
RACK2
RACK3
RACK4
RACK5
RACK6
RACK1
RACK2
RACK3
RACK4
RACK5
RACK6
RACK1
RACK2
RACK3
RACK4
RACK5
RACK6
RACK1
RACK2
RACK3
RACK4
RACK5
RACK6
1F
建屋B
2F
RACK1
1F
RACK1
1FXX室
RACK2
RACK2
31
マップ作成例とマップアイコン(複数デザイン有)
32
マップ下絵デザイン作成
マップとセンサーの紐づけ
写真画像等の素材提供が必要
トップ画面表示、センサーの紐づけに最適。
33
フロアマップ作成案
フロアとデバイスのマッピング
34
ポイント
• 入門レベルの価格帯。100センサー版が2015/4/1から無料、500センサー版が
USD1600ドルから。
• Webサーバ、SQLサーバー不要、独自ファイル形式で保存。
• Windows端末に次へボタン6回でインストールしてその日から使えます。
• 基本はデバイス画面から2ステップでグループ、デバイス、センサーを設定
• フリー版を含め全ライセンスでフル機能が利用可能。NetFlow、sFlow、jFlow、約2
00種類以上の監視項目。クラスタ用フェイルオーバーノードを1ライセンス利用可能。
リモートプローブ、組み込みブラウザ付き。
• 様々な角度からセンサーを仕掛ける事が可能。SSHログイン、 EXE/スクリプトのリ
ターンコード監視と通知連携。
• 豊富な通知機能(メール、バッチ実行、警報ランプ連携、Syslog、SNMP Trap)
• 開発から12年。完成レベルで監視サービスが安定。
• 大規模監視はPingとSNMPのパターン化展開がお勧め。
1分監視で最大2万センサ、仮想環境は5千センサまで。
35
最後に
システムの構築・導入・保守は、お客様との共同作業です。より良い形に持っ
て行く為に、お客様の様々な要望(使い方・機能・連携・視点)を率直にお伝
え頂く必要があります。何かございましたらお気軽にご相談下さい。
営業担当
TEL 050-3736-1414
勉強会
体験版
価格表
PRTG概要と基本設定についてご説明致します。(無料)
最大100日間 センサー数無制限
評価期間中は使い方・基本設定について無料サポート
www.sumire-joho.co.jp/doc/PRTG_Network_Monitor_price.pdf
インフラ構築、不具合の調査、各種システム連携・見える化の提案を行います。
36