『なぜ今、自動化なのか?』プロローグ~運用の現場から~

2016年9月30日

はじめまして。ワイドテックプロダクト企画担当のYです。

POLESTAR Automation公式Webサイトの片隅で、運用自動化にまつわるコラムを連載して行くことになりました。更新は不定期になりますが、どうかよろしくお願いします。

初回は自動化の本題に入る前に、弊社がIT運用自動化製品を取り扱うに至った経緯を、簡単にご紹介します。

弊社の原点「NMSスーパーバイザーシステム」

弊社、ワイドテックという会社は、とある大規模なお客様のために開発した「NMS(Network Monitoring System、またはNetwork Management System)スーパーバイザーシステム」からスタートしています。NMSというのはネットワークの運用状況を監視・管理するためのシステムですが、巨大なデータセンターにおいては、ネットワークの規模が莫大なのはもちろん、NMS監視端末の数も非常に多くなり、1か所で管理するのは難しい状況でした。

そうしたお客様の課題を解決すべく、遠隔操作技術を応用し、複数のNMSを束ねて統合・集中的に管理するとともに、障害アラート機能などを連携させることで、ネットワーク障害の早期発見と迅速な復旧を目指したのが、弊社の開発したシステムです。統合監視がメインのシステムですが、自動化のコンセプトも含まれています。

しかし、NMSにせよ、弊社のシステムにせよ、操作するのは結局「人」です。障害の発見から通報までは自動で可能ですが、通報に気付いて障害からの復旧に至るまでの作業は、人がすべてやらなければなりません。自社システムの運用のため、そのお客様のもとに社員を常駐させたことが、結果的に技術人材派遣事業への進出となり、今では同事業が、弊社の売上のかなりの部分を占めるに至りました。

IT運用の現場体験で知った「属人化」の実態

このコラムを執筆しているのは、今回のPOLESTAR Automationの製品化にあたり、技術以外の実務全般を担当した、末端の一社員です。縁あってこの会社に入る前から、ずっとIT系の商品企画(主にBtoC、いわゆるコンシューマー畑)に携わってきたのですが、実はバリバリの文系(社会学部)出身で、各種の技術は上っ面でしか理解していません。しかし、現場が忙しくて人手不足の時にはそんな文系の自分ですら、ITサービスの運用現場に駆り出されるのが、この会社なのです。

とある現場で、文系でもできる手順書などの資料整理のお手伝いを担当しつつ、日常業務として従事していたのが「目視点検」です。毎日2回、朝と夕方にマシンルームにあるサーバー、ルーター、ネットワークスイッチ、ファイアウォールなどが正常に動作しているかどうかを、目で見て確認する業務です。

他に、毎日決まった時間に作業部屋のPCからスクリプトを走らせ、ネットワーク経由で各機器の稼働をチェックする業務もありました。点検用のスクリプトは自動で走るのですが、集計は手作業です。

連日、こうした作業の繰り返しです。決して難しい作業ではないのですが、来る日も来る日も同じ作業。正直、単調、退屈です。しかし、障害はいつ起きるかわかりませんから、決して疎かにはできません。

幸い、自分がその現場に出ていた間、大規模障害は発生しませんでしたが、ITサービスの運用現場においては、トラブルと100%無縁ということはありえません。何かあれば休日や、深夜の就寝中であるにもかかわらず、電話で現場に呼び出されて復旧対応に当たったというインフラエンジニアの経験談は、何度も耳にしました。しかも、そういう緊急対応に従事するのは、システム全体を理解し、1人で問題解決に当たれるレベルの、上級スキルを持つエンジニアであることが多いようです。

運用の現場においては、こうした上級エンジニアへの負担が非常に大きくなりがちです。知識と経験、そしてスキルを後進の人たちに伝え、個人への負荷を分散するためにも、行うべき業務をきちんと手順書にまとめておくことが重要でしょう。しかし、現実には業務に時間を割かれ、そうした手順書を書いたり、後進を教育したりする時間は取りづらいようです。結果、ハイレベルな業務ほど特定の人に依存しがちになってしまう、いわゆる「属人化」に至るわけです。

その人が病気になったり、何らかの理由で職を離れることになってしまったり…と考えると、なんだかゾッとしてきませんか?

エンタープライズRBA「POLESTAR Automation」が、運用業務を属人化から救う

「RBA(RunBook Automation=手順書による自動化)」という用語と出会ったのは、現場から本社に復帰してきて間もない頃です。手順書とか属人化とか日常点検とか、まさに自分がつい先日まで経験してきた数々のキーワードにピンと来たものです。

いろいろ調べて行くうちに、RBAこそが属人化を解決し、単調な日常作業の多くを自動化できる画期的な解決策、文字通りの「ソリューション」であると確信し、運用現場経験者の多い弊社の経験も活かせるプロダクトとして、商品化を目指して行くことになったのです。

日常点検のような、シンプルながら日頃の運用管理に欠かせない業務から、高度なスキルの求められる障害復旧手順まで、運用業務におけるさまざまな作業を手順書として記述しておけば、その通りに実行してくれる運用自動化システムがRBAです。しかし、前述のように多忙で責任も重い上級エンジニアには、手順書を書く時間がありません。そこで、想定される業務手順を可能な限りテンプレート化された手順書として提供し、そのまま、あるいは多少の手直しだけで適用できるのが、エンタープライズRBAソリューション・POLESTAR Automationです。

実は、このPOLESTAR Automationも、冒頭で触れた弊社のNMSスーパーバイザーシステムと同様、ある大規模顧客の運用自動化への要望に応じるために開発に着手したのが原点となっています。もちろん、性能や機能が優秀で使いやすいことが最優先なのですが、現場の声に耳を傾けてニーズを確実に汲み取り、ソリューションとして作り上げて行く開発元の姿勢に、同様な原体験を持つ弊社としても大いに共感し、共に事業を進めて行くことになったものです。

次回からは、運用自動化製品全般やPOLESTAR Automationについてのご紹介、そして、ひとつひとつのケースを掘り下げながらの自動化が必要な理由と、そのメリットについて書いていきます。