ホワイトペーパー Vol.1

お役立ち資料/ホワイトペーパー >

ホワイトペーパー Vol.1

7,000台・複数拠点のデータセンター運用を
POLESTAR Automationにより自動化するまで

~業務標準化タスクフォース活動を通じて見出されたベストプラクティスを
POLESTAR Automationに反映し、安定した運用の自動化を成功させた事例~

導入背景 導入による効果
  • 複数拠点の大規模データセンター保有に伴うITインフラ運用の複雑化により、自動化ソリューションによる運用の効率化は必至の課題
  • デバイス単位での管理に伴う効率低下、千差万別の運用担当者のスキル、システムの修正・変更に伴う障害の追跡と対応の煩雑さなど
  • 定期的なシステム点検による安定性の維持
  • スピーディな変更検知とパッチの未適用による障害発生の予防
  • 繰り返し業務に対する業務の効率化
  • サーバー構築所要時間を80%削減
  • 遵守診断の所要時間を70%削減

はじめに

【データセンター運営企業・A社の概要】

  • 大規模データセンターを現在4拠点で展開中
  • 運用するサーバー台数は3,000台(POLESTAR Automation導入時点)
    現在は7,000 台まで拡大
  • 顧客の事業拡大・IT依存度の上昇に伴い、激増するサーバーの管理が追い付かず、2000年代中期より運用自動化導入を検討

A社では、インターネットの黎明期から大規模なデータセンターを運用し、多くの顧客に多彩かつ高品質のITサービスを提供してきました。2000年代前半には既に3,000台もの規模となり、グローバル展開やBCP(事業継続計画)対策の点からも、複数箇所への拠点分散を図っています。
データセンター事業の急速な拡大に伴うサーバー稼働台数の増加、システムの膨張に、運用人員の新規確保や教育が追い付かず、日常の運用業務に従事しながら新人教育にも携わる立場にある、いわゆる上級エンジニアの数も限られ、業務のパンクを懸念する声すらあったとのことです。

そこで2000年代中期、A社では当時米国で普及の初期段階にあったRBA(Runbook Automation=手順書に基づく自動化)と呼ばれる運用自動化ツールの導入を検討し始め、米国2社のRBA製品をテスト的に導入してPoC(概念実証)を開始しました。しかし、草創期の運用自動化ツールには実用的なユーザーインターフェースがなく、ドキュメントも未整備である上、RBAツールにおけるRunbook、すなわち手順書にあたる「テンプレート」の種類は、当初の見積もりでも100種類以上が必要と判断されました。
限定的な運用自動化をスタートしてはみたものの、完全な自動化を実現するには数年もの時間と、テンプレート作成のための多大な手間を要するであろうとの結論が導き出され、結局、自動化製品の導入は一旦保留となってしまいました。

POLESTAR Automationの開発元であるNKIA社では、A社にサーバー/ネットワークのモニタリング(監視)ツールを提供していましたが、A社の自動化運用保留の報を耳にし、運用管理ツールのノウハウを活かした自動化ツールの開発をA社に提案しました。ここにPOLESTAR Automationの開発プロジェクトがスタートすることになります。
約2年間を掛けてPOLESTAR Automationの最初のバージョンが完成し、自動化運用開始に漕ぎ着けるまで、A社ではNKIA社の全面協力の下、まず事前準備として運用業務の分析と、その標準化・自動化の対象を絞り込むためのタスクフォースを編成し、分野別にリーダーを決め、定期的にミーティングを重ねながら、業務の標準化と自動化対象業務の絞り込みを推進することになりました。

POLESTAR Automation 適用のための事前準備

~A社標準化/自動化専任組織(タスクフォース)の構成~

図1 A社標準化/自動化専任組織(タスクフォース)の構成

IT運用業務は多岐にわたっており、自動化の推進においては、マネージャーやリーダークラスによる進行管理と、現場の積極的な協力が欠かせませんでした。また、経営者は運用業務の自動化に向けての強い意志のもと、全体の舵取りを行いました。
こうして、サーバー命名規則のような基礎的部分の標準化に始まり、システム構成の指針策定、そして運用業務の分析を通じた運用管理のベストプラクティス(BP)が導き出されて行きました。

POLESTAR Automationの開発と並行して展開された、このA社における標準化タスクフォースの活動により、POLESTAR Automationならではの特徴も定義付けられて行くことになります。
すなわち、運用のベストプラクティスが反映されたレディメイドのテンプレート、A社の運用内容を反映した複数OS・マルチプラットフォームへの対応、そして、経験の浅い運用担当者にとっても扱いやすいユーザーインターフェースです。
また、効率的で安全なサーバー運用自動化をポートを1個開放するだけのシンプルな設定で実現すべく、サーバーにエージェントプログラムを組み込む方式が採用されることになりました。

インフラ運用環境の標準化に向け、対象と範囲を定義し、運用手順を標準化。
その内容をベースに、業務標準化のためのライブラリ(DLIB: Distribution Library)を構築

図2

A社の運用標準化タスクフォースによって標準化が図られた運用プロセスに基づき、OSごとに最適化された構成を最初の構築時から適用するための標準スクリプトやプログラムのライブラリである、DLIB(Distribution Library)の開発・蓄積も行われました。また、POLESTAR Automationにはこのようなプログラム、スクリプトを配布するためのライブラリ管理機能も搭載されることになりました。

A社で推進されたような業務の標準化は、今後POLESTAR Automationを新規に導入し、運用業務の自動化を図ろうとするあらゆる運用現場において最良の方法であり、IT運用自動化をスピーディに実現するための近道として、非常に有効であるといえます。
NKIA社では、A社の運用業務標準化・自動化タスクフォースがまとめ上げた標準化ポリシー、ベストプラクティスをもとに、POLESTAR Automationの管理サーバーとジョブ作成機能、そして百数種ものジョブテンプレートを開発しました。
これらのテンプレートはもともとA社からの要望で開発されたものでしたが、当初から運用のベストプラクティスとして汎用的に利用できるように設計されました。このテンプレートは、現在もPOLESTAR Automationの導入と実務への適用を迅速に実現する、最大のセールスポイントとなっています。
しかも、既存のテンプレートは、A社をはじめ、運用の最前線でその有用性を検証されたものばかりです。
本稿執筆時点でPOLESTAR Automationのテンプレートは200種類を超えており、今後も引き続き、増え続けることでしょう。

では、A社ではPOLESTAR Automationを、いったいどのように運用業務の自動化に適用し、どのような成果を上げることができたのでしょうか?

システム初期構成の標準化による運用品質の向上

図3

まず、システム構築とそのプロセスの標準化により、新規のサーバー構築に要する時間を、手作業に要していた6時間から1時間に短縮することができました。
新規のサーバーに導入するOSの設定値やアプリケーション・ソフトウェアなど、サーバー構成の標準化を図った上、さらにPOLESTAR Automationのバッチジョブ実行機能により、ソフトウェアの導入作業を連続、または同時並行的に行えるようにしたことで、短時間でのサーバー構築が可能となりました。

図4

従来の標準化されていない、手作業によるサーバー構築では、各現場や担当者ごとにサーバーの命名規則がバラバラで、設定値も構築担当者の経験に頼っており、結果的にシステム構成もまちまち、運用手順も属人化してしまっていました。
業務プロセスの標準化とPOLESTAR Automationならではの構成データベース、ファイルライブラリ、そしてファイル/ソフトウェアの自動配布機能により、サーバーの構築からインストール、構築完了後の動作検証まで自動的に、かつ短時間で行うことができるようになりました。また、サーバー命名規則を標準化することで、管理も容易になりました。効率的な運用自動化を行うには、事前に必ず取り組んでおくべき標準化のステップといえます。

図5

また、OSごとに42項目の初期構成・設定や必要ソフトウェアのインストール内容の構成を標準化しました。
こうして、最終的にサーバー構築所要時間の80%削減という高速化を達成したのです。

図6

業務の標準化はシステム点検の標準化、自動化をももたらしました。自動点検テンプレートとジョブスケジューリング機能を活用すれば、標準化された点検を自動的、定期的に実行することで、個別サーバーやシステム全体の障害を予防することにつながります。さらに、標準で搭載されている報告書機能により、定期的な点検結果は自動的にレポートとしてまとめられ、それを確認することは正に運用の「見える化」といえます。

図7

業務標準化以前は、システムの監査を行うにもポリシーは現場や担当者によってバラバラで、しかも監査のタイミングにも基準がなく、時差や監査項目漏れも発生し、コンプライアンス上も問題があるものでした。
標準化とPOLESTAR Automationの導入により、一定のポリシーに基づき、複数の対象システムに監査を一括実行することが可能となりました。脆弱性の点検・確認や対策・修正も、従来より短時間で行うことができるようになっています。

図8

プラットフォームごとに標準化された52種類のコンプライアンス監査を実行し、未遵守項目が容易に検出可能となりました。監査結果はPOLESTAR Automationの管理画面上で一目瞭然です。

Windows Update Managementによる運用生産性の向上

図9

Windowsサーバーに対しては、Windows Updateの適用管理も課題でした。特に近年はWindowsのさまざまな脆弱性が以前よりも頻繁に発見されるようになり、定期Windows Updateはもちろん、緊急アップデートの頻度も高まっています。Windows Update管理機能を活用すれば、毎月のアップデート適用/未適用状況を一目で把握できるようになります。また、迅速かつタイムリーなアップデートの適用や、特別な理由でアップデートパッチの適用範囲から除外したり、遅らせたいサーバーの管理も容易です。

図10

報告書機能によるシステム運用状況報告書の生成

POLESTAR Automationには報告書機能が搭載されており、インベントリやパッチ適用作業の概要、点検結果、システム全体や個別サーバーの構成情報といった、運用業務の状況や結果を自動集計し、メールなどの手段を通じて必要な管理者や担当者宛に送付することができます。
この機能は運用業務を見える化し、システム障害を未然に防ぐ上で、有用な機能です。

図11

図12

POLESTAR Automation を用い、効率的かつ確実な運用業務の自動化を実現するには…

A社の事例から、POLESTAR Automationによる運用自動化に欠かせない3点をまとめておきます。

■ すべてのサーバーにPOLESTAR AutomationのAgent をインストールすること

POLESTAR Automationでは、点検や構成情報の収集・監査、データファイルやソフトウェアの自動インストール、コマンド投入といった自動化機能を実行するために、個別のサーバーごとにエージェントプログラムをインストールしていただく必要があります。
エージェントをインストールしていないサーバーがある場合、全体状況の管理は難しくなります。

■ 標準化/自動化のための専任組織の構成

運用業務の自動化を効率的かつ確実に実現するには、ここまで見てきたように、業務の標準化が欠かせません。サーバーの命名規則ひとつとっても、好き勝手な名前をバラバラに付けるより、一定のルールに従った命名とすることで、どの部門で何を実行しているサーバーなのかを把握しやすくなります。
また、POLESTAR Automationを業務に適用するにあたり、A社のように事前にタスクフォースチームを構成しておくことで、業務の標準化や自動化をよりスムーズに行うことができるでしょう。A社のように数千台ではなく、数百台規模の運用基盤でも、運用チームの組織化を通じた標準化は効果的です。

■ 専任組織による、運用標準化文書(手順書)作成と標準ライブラリの構築

業務標準化・自動化のためのチームを構成したら、ベストプラクティス事例をどんどん収集し、共有して行きましょう。
これらの事例を文書で記載することで、POLESTAR Automationのテンプレート化も容易になり、運用自動化というゴールにより早く到達することが可能となります。

まとめ

ここまでA社におけるPOLESTAR Automationの導入事例を中心に見てきましたが、規模の大小にかかわらず、事前の準備と全社的な取り組みが大切です。
A社では、業務の標準化、そしてPOLESTAR Automationの活用を通じ、

• 定期的なシステム点検による安定性の維持

• スピーディな変更検知とパッチの未適用検出による障害発生の予防

• 繰り返し業務に対する業務効率化

を、実現するに至っています。
本ホワイトペーパーでは、POLESTAR Automationの歴史そのものであるともいえるA社における運用業務標準化・自動化の取り組み事例をご紹介しました。このような事例を通じて、貴社のシステム運用効率化の一助になれば幸いです。そして何よりもPOLESTAR Automationが、貴社における運用業務効率化の実現にお役に立てることを願ってやみません。