データセンターにおける IT オペレーションの 業務品質向上を達成した改善

データセンターにおける IT オペレーションの
業務品質向上を達成した改善事例
鈴木 貴広
ねらい 弊社のデータセンターにおける IT オペレーション業務の改善事例を、聴講者および査読者に
過去の経緯から将来的な課題までを一連の流れとして、わかりやすく説明するための資料。
キーワード オペレーション,標準化,計測,予測,可視化,改善,PDCA
Target: Improvements in our data center IT operations, in the audience and reviewers
The article for historical reasons up to future challenges as a sequence, easy to understand, to explain.
Keywrds:
Operations, standardized, measure, predict, visualization, improvement, PDCA
1.想定する読者・聴衆
データセンターにおけるオペレーションに従事され
ている方、及びそのシステムライフサイクルに関わる
方全般を想定している。これは、システムライフサイ
クル上のあらゆる問題点は最下流に位置するオペレー
ションで吸収すればよいという暗黙の了解により、オ
ペレーションはシステムライフサイクルにおいて一番
高い割合を占めるにもかかわらず、システムの企画・
設計・構築時にオペレーションを円滑に回すというこ
とについてあまり考慮されていないケースがほとんど
な為である。これには、上流側に携わる方々のオペレ
ーションに関する知識や認識の不足が下流側に大きく
影響している。現状では限られたリソースとシステム
やコスト制限の中で、下流側の努力により何とか維持
している面があり、こうしたオペレーションの現場の
内情を知っていただくことで企画・設計・構築時にオ
ペレーション現場からのフィードバックを働かせ、よ
り高品質なオペレーションの実現につなげていきたい
との思いからである。
2.背景
データセンター事業はある種の社会インフラとして
機能しており、入居顧客の重要な情報資産をあらゆる
災害から守り健全な状態を維持すべく、無停電/免震
構造/高度なセキュリティ対策が施された堅牢な施設
に収容する。また、このような施設へのニーズからも
分かるように、お預かりするシステムは重要なものが
多く、一つの単純なミスが企業活動に大きな影響を与
えることもある、非常にクリティカルな業務である。
弊社におけるオペレーション業務は、複数存在するデ
ータセンターごとに培われた独自の文化により、サイ
ロ化が進んだ状態で遂行されてきた。この結果、最新
の旗艦データセンターが開業するときも、形式知化さ
れた作業標準が存在しないため、常に一から手探りで
業務を構築し、現場を回していかなければならない状
態に陥っていった。また、オペレーション業務は複数
の顧客作業を一手に請け負う形となるが、将来の顧客
数規模の予測もままならない状態で、適正なリソース
数の検討もできずリソース不足が常態化する中、日々
の業務を回さざるを得ず、顧客数の増加から来る業務
負荷の増大によってヒヤリハットの発生が頻発した。
加えて、作業時間に空きがなく、依頼作業への対応に
遅れが出るなど、品質の低下著しく顧客からの信頼失
墜につながりかねない事態から、対策が急務となった。
3.課題
現状ではサイロ化が進んでおり、他データセンター
で先行実施した施策、改善事例を横展開するための仕
組みがないため、足元で起きている障害に対する根本
原因の追究および再発防止策の立案・実行において他
データセンターのノウハウを利用することが困難であ
る。全データセンターを対象としたサイロ化の解消は
関係者が多くの成果を達成するには長期間を要するこ
とが想定されるため、小さな成功体験を積み重ねてい
くことを活動方針として当データセンター内の業務改
善を優先して取り掛かることとした。業務改善を推進
する上で、最初に課題となったのは、高すぎる業務負
荷を緩和し、限りある人的リソースの中で、業務改善
に充てる時間を念出することである。この際取った手
法は、前任者からの引継のタイミングで業務内容の分
析を行いつつ、空き時間を利用して負荷削減効果の一
番大きなものからツール化を推進していくというもの
である。こうして高負荷の状態に風穴を開けることで
波及的に業務改善を進める事が出来た。
また、業務標準が無い中での業務遂行は、ノウハウ
の蓄積が無いに等しい。まずは標準を定め、組織とし
てノウハウを落とし込み蓄積していく土台を作る必要
がある。そして、PDCA の循環を実現するため、計測
できていない要素を見える化することで計測し、改善
Copyright © 2016 NSSLC Service All Rights Reserved
1
につなげていく必要がある。
に出ている。
4.提案・実験
6.まとめ(今後の課題・謝辞等)
・負荷の削減
これまでの対策は現業現場での標準の確立と作業品
業務内容を分類すると、オペレーションを管理するた
質の向上であったが、今後の課題はサイロ化している
めの維持管理業務と、オペレーションそのものに分け
各現場の業務を共通化し品質を上げていくことである。
ることができる。分析の結果、維持管理業務は非効率
今回の活動から得られた標準化活動の成果は、これま
的な運用方法を取っているものが多くあり、効率化が
で弊社内で培われてきた現場ごとの独自運用よりも業
可能であることが分かった。プロセス化が容易な作業
務標準について入念な作り込みが行われており、業務
を抽出し、ツールを検討開発することで負荷の削減を
形態を問わず共通化を意識したものになっている。共
実現した。
通化によって経験の母数を増加させ、そこから得られ
・業務標準の確立
るノウハウを全ての現場に適用していくことでより一
業務標準という柱が無い中でオペレーションを遂行し
層の品質向上や効率化を実現したい。
ていくと、何か問題が起こった際に拠り所となる基準
が無く、対策を打つ際に同じ事象でも違う結論に至る
7. 用語・文献
ことがある。また、対策も個別業務への適用となって
しまい、類似する業務をその都度抽出して対応してい
「IT オペレーション業務におけるヒヤリハットの可視
かないと全体に伝搬させていくことが難しい。これを
化と削減」株式会社野村総合研究所
解決するため、オペレーションの土台となる業務標準
「データセンター運用における業務の自動化と品質改
を確立することで、問題点の把握やそれに伴う改善ポ
善事例」SCSK 株式会社
イントの明確化を容易にすることを検討した。
(itSMF Japan 第 12 回コンファレンス発表資料)
・見える化
作業品質/業務負荷/将来予測といった要素は計測の
「プロセス改善ナビゲーションガイド~なぜなに編~」
仕組みを作り可視化していかないと改善を検討するこ
「プロセス改善ナビゲーションガイド~虎の巻編~」
とすら難しい。業務標準として定めたドキュメントの
(編集:独立行政法人情報処理推進機構ソフトウェア・
中に計測の仕組みを埋め込むことで可視化を実現、リ
エンジニアリング・センター、株式会社オーム社発行
アルタイムでの業務改質を可能とし、PDCA の循環に
書籍)
付録
つなげた。
5.効果
業務標準の確立とツールの整備、見える化による将
主な改善ポイント
対象
改善点
効果
業務標準
作業手順書に記載されるレベル未満の詳細
なオペレーション動作等を標準化したドキュメ
ント群。
品質向上
ドキュメント
標準
手順書、作業チェックシート等の様式を統一。
閲覧性の向上、情報漏れの防止、解釈間違
いの防止。
品質向上
作業スケジ
ューリング
ツール化により日々の翌営業日スケジューリ
ング作業を自動化。あらかじめ登録した情報
を二重チェックすることが可能になった。
品質向上
負荷削減
ローテーショ
ン情報管理
ツール化により日々の翌営業日ローテーショ
ン情報抽出作業を自動化。
品質向上
負荷削減
来予測と適正なリソースの配置により、それまでは1
00日程度で途絶えることの多かった連続無事故記録
は700日超を達成した。業務標準を軸として業務改
善を理路整然とした形で進めるベースができ、業務標
準に従い通常業務を遂行するのみで自然と PDCA の循
環が機能する環境を構築した。これらの標準化、効率
化、可視化により様々な効果が出ており、2カ月に1
件のペースで発生していた作業ミスによる顧客からの
苦情や謝罪要求は、上述の通りゼロ件を継続している。
また、突発的に発生する顧客からの依頼作業について
チェックシー
ト印刷
は、着手までに平均2時間の待ち時間が発生していた
が、現在では平均30分程度まで改善した。他に、新
規案件受入時の作業スケジュール調整については過去、
感覚による判断に頼らざるを得なかったが、現在では
見える化した時間帯別稼働グラフを用いて空き時間を
情報共有
特定顧客向
け作業支援
ツール
作業スケジューリングのツール化により、作業
チェックシートの印刷機能を組み込むことで自
動化。手作業による印刷から負荷を削減し、
印刷間違いを排除した。
大量に依頼を受領する、一過性の暫定的な運
用変更管理をツール化。他にチーム内での共
通的な情報共有やコミュニケーションを行うた
めのツールを開発
特定顧客向けの特殊作業(大量のメール確
認、書式変換等)をツールかすることで、負荷
の削減と品質を向上。
品質向上
負荷削減
品質向上
品質向上
負荷削減
即座に把握できるようになった。以上のような結果を
もって、顧客満足度という観点でも改善の効果が明確
Copyright © 2016 NSSLC Service All Rights Reserved
2
査読コメントへの回答
①データセンターの現場で実施する、新規で発生する
顧客案件作業の受入れや、既存作業の変更対応、現場
での顧客機器に対するオペレーション業務全般、現場
内での改善活動プロセス、オペレータへの教育を含む。
②今回の改善活動は現場主導で実施しており、トップ
及びミドル層については、この改善活動のサポートに
徹する形で関わっている。
③オペレータの教育に関する部分での改善は、根本的
な部分から手を加え、教育のやり方にまで言及する標
準文書を作成した。教育者のスキル(教育者自身の教
育が外部で行われている場合、当現場とは考え方が大
きく異なる場合がある)に左右されにくい環境下で教
育が行われるよう、基本的な進め方を定めている。こ
うすることで、教育による良し悪しを発生させないと
いうのが基本方針となっている。
④SLAについては明確に締結されているものが無い。
SLMに関する部分では、元々社内の品質管理指標と
して存在する目標値があるが、現場側の目標がそれを
超えるものだったので、今回の活動に対しては大きな
影響を与えていない。今回の活動によってPDCAが
活発に機能するようになり、改善の結果が業務品質に
如実に影響を与え始めた時点で、現場内での目標(連
続無事故1000日等)を掲げるに至っている。
Copyright © 2016 NSSLC Service All Rights Reserved
2