AIでITインフラ運用は可能か?/Webhookについて

2021年11月16日

ワイドテック プロダクト企画のYです。

「アイの歌声を聴かせて」。10月29日から上映中のアニメ映画で、自分も先日見てきたのですが、見た人の評価は非常に高いにもかかわらず(各レビューサイトでも5点中4点前後)、観客動員は今ひとつ、どころか…という、残念な状況になっている作品です。
いわゆる「スマートシティ」の実証実験が行われている「景部市」(新潟県の佐渡ヶ島がモデルらしい)。何でも自動でやってくれるスマートホームで暮らす女子高生・サトミ(声・福原遥)が自動運転バスで通う高校に、転校生としてやってきた性格の明るく、頭脳明晰で歌が得意、スポーツも万能な美少女・シオン(声・土屋太鳳)は、実は最終テスト中のAI(人工知能)搭載アンドロイドで…という設定です。
シンギュラリティ(AIが自律性や創造性を持つこと)一歩手前のAIが主人公ですが、話自体は高校が舞台のドタバタもある青春もので、タイトルの通り、歌がキーになっています。土屋太鳳が猛練習を経て自ら歌ったという楽曲も良いですし、ストーリーも映画全体としてもよくできていて、後味も良い作品なのですが、なぜ客足が伸びないのか…
マーケティング戦略や広告宣伝などの側面も含め、いろいろと示唆されるところの多い映画です。

■「運用自動化って、AIですか?」

先日、毎年恒例の「Japan IT Week秋」が開催され、弊社も2017年の初出展から5年連続、5回目となるブースを出展しました。
新型コロナウイルスの感染者数は大幅に減少したものの、例年大型のブースを出展している大手企業さんの多くがまだ戻ってきていないこともあってか、規模は小さめ、来場者数も昨年よりはマシという程度でしたが、弊社ブースには予想を上回る多くの方々にご来場いただき、この場をお借りして感謝を申し上げます。
ところで、ブースを出すたびにご来場の方から、毎回1~2回は「運用自動化ってAIで実現しているのですか?」とか「インフラ運用をAIで完全自動化することは可能なのですか?」といった、AI絡みのご質問をいただきます。
POLESTAR Automationは発売以来、「ITインフラ運用自動化ソリューション」としてご案内していますし、AI全般も近年、実用化に勢いが付いてきていることもあって、「自動化=AI」と結びついてしまうのもやむなしでしょう。

結論からいえば、POLESTAR AutomationにはAIは搭載されていません。
他社も含め、同じジャンルにカテゴライズされる運用自動化・構成管理ツールで、AIを搭載しているものはないでしょう。
運用ツールの中でも、監視(モニタリング)系ですと、機械学習による障害予測機能を搭載しているものがあります。CPU負荷やネットワークのトラフィック、ストレージ残量などのモニタリングデータを長期的に収集して機械学習し、その学習データを基盤とする推論エンジンにより、日頃の監視の中で障害発生の予兆を見つけ出そう、というコンセプトです。
POLESTAR Automationの開発元・Nkia社でも、そうした機械学習搭載の監視ツールを開発していて、以前数回、展示会に参考出品させていただきました。
セキュリティの分野でも、ログの解析などにAIを導入し、ログの内容からの振る舞い検知により、セキュリティ上の脅威を発見しようとするものがあります。「SIEM」とか「SOAR」「UEBA」と呼ばれるものがそれです。
システム運用全般において、運用自動化・構成管理以外のジャンルでは、AIの活用が着々と広がってきているようです。

■運用自動化にAIが介在しない理由

では、なぜ運用自動化には、AIが使われないのでしょうか?
まず、運用自動化の基盤は、構成情報の収集、コマンドやスクリプトの定期的な投入といった、人(運用現場の担当者)の行う、単純ながらも手間のかかる作業(ジョブ)の実行プロセスを自動化することで成立しているからです。頻繁に繰り返される単純作業を自動的に行うのに、AIなどによる学習や推論はオーバースペックです。
次に、対象が常に新しく、予測不能なものもあるからです。システム運用上で起こる障害の原因は、過去の監視データの分析により、ある程度の類型化が可能ですが、運用自動化ツールの活躍の場でもある障害からの復旧作業は、そうではありません。
OSやミドルウェア、アプリケーション、それらに対するパッチなどは、常に新しいものが出てきますし、障害の対処方法も毎回異なります。AI搭載監視ツールが発見できるのは過去の事例に基づく障害であり、新しい環境で起こりうる障害の根本原因を事前に発見したり、事後に自動的に対処するのはシステムの自己修復と同じであり、それこそシンギュラリティの話になると思います。
最後に、判断能力です。システム障害からの復旧に対して、誰かが判断しなければなりません。ひと口に復旧といっても、障害発生直後に100%の復旧は困難な場合も多く、まずは最低限動くレベルで妥協し、取り急ぎの復旧を図り、後で原因をしっかり追及した上で100%を目指す、という段階的な対応が行われるケースが多いかと思います。
運用自動化ツールは復旧支援のフェーズで使われるでしょうが、作業内容や手順を誤ると、期待通りの結果にはならないかもしれません。
どう対処するかは、対策期間や結果など、多角的・多面的な視点からの判断が求められます。AIにはまだ難しいでしょう。

以上、現状のインフラ運用は人の手や経験値に頼るところが大きいです。
運用自動化・構成管理ツールとは、人力運用を補助する支援ツール(道具)であり、ソリューション(解決策)であるといえます。このツールを動かすのは、あくまで人間なのです。

■「Webhook」ってご存知ですか? – 外部ツールからのPOLESTAR活用

さて、AIについてはここまでにして、話題を変えます。
皆様は「Webhook(ウェブフック)」という用語を耳や目にされたことはあるでしょうか?
POLESTAR Automation V3以降にはAPI(REST API)が搭載されるようになり、ZabbixやRedmineをはじめとして、多数の連携事例が出てきています。
このAPIというのは、連携元から連携相手にリクエスト(要求)を送り、返ってくる結果に応じてアクションを起こすというのが基本です。
POLESTAR Automationにおけるジョブの実行を例に取ると、何かアクションを起こそうとすると、POLESTAR AutomationのAPIから連携相手のツールなどにリクエストを送り、その結果を受けて目的のジョブを実行することになります。
対してWebhookというのは、連携相手側で条件を設定しておき、その条件に合致(フック)するイベントが発生すると、連携元に通知が行われるというものです。
連携元ツール、ここではPOLESTAR Automationから見た場合、能動的なのがAPI、受動的なのがWebhookといえます。連携先のツール側から見れば、関係は逆になります。

実は、最近お客様より、とある他社製監視ツールからの障害通知をPOLESTAR Automationで受け取って、ジョブを実行させるようにできないか、とのご要望をいただきました。
このツールにもAPIがあるのですが、同ツールからのリクエスト発行によって外部のデバイスを登録したり、イベントやユーザーを追加したり、といった目的で使用されるもので、監視のアラートをリクエストとして送信する機能はありませんでした。
POLESTAR Automationに何か送信する機能はないか、もう少し調べてみると、Webhookによる通知機能があることに気付いたので、POLESTARチームの若く有能なエンジニアに伝えたところ、すぐに同ツールの評価版をダウンロードして環境構築し、その日のうちに連携を実現させてしまいました。

連携の流れは、以下の通りとなります。

1.【POLESTAR側】クレデンシャル管理でREST APIを作成

2.【POLESTAR側】連携相手のツールが通知してくる作業に応じたジョブ(障害回復など)を作成

3.【連携相手側】連携相手のツールで、Webhookによるアラート通知の条件を新規作成し 1. で作成したPOLESTARのAPI情報を記述、対象サービスなどを設定(詳細は多少端折っています)

4.【連携相手側】実際に障害が発生するとPOLESTAR側にWebhookで通知

5.【POLESTAR側】 2. で作成ジョブが自動的に起動

6.【連携相手側】アラートの解決を確認

と、いうわけで、REST APIの仕様が合わないツールでも、そのツールがWebhookの機能(Webhookではなく「API」など他の名称で提供されている場合もあるようです)を持っているならば、POLESTAR Automationと連携可能です。
自社でお使いの既存ツールをPOLESTARと組み合わせ、そのツールの発生させるイベントをトリガーとして、ジョブによる自動化を実現させたい方。ぜひとも弊社POLESTARチームにご相談ください。

ちなみに冒頭でご紹介した「アイの歌声を聴かせて」、全国の主要なシネマコンプレックスでも、もう1日1回程度の上映になっているところが大半のようです。以前ご紹介したメタバースがテーマの「竜とそばかすの姫」(こちらは興行収入65億円突破)同様、ITのお仕事に従事されている方にとっては身近な内容も多く、楽しめると思います。本稿を読んで興味を持たれた方、ぜひとも上映が続いているうちに、映画館に足を運んでみませんか。