キーワード
- 監視
- 統合監視
- ジョブ管理
作成日 | 2023/09/01 |
---|---|
更新日 | 2023/09/01 |
ITシステムの監視とは
ITシステムの監視では、サーバなどのプラットフォームからアプリケーション、サービスまでの様々な稼働状況を継続的に把握し、視覚化し、そして、異常を検知したら関係者へ素早く連絡(通知)することが必要です。
代表的な監視の種類
ITシステムの監視として、代表的な監視の種類と目的を説明します。
-
死活監視(PING)
サーバやネットワーク機器に対する最も基本的な監視の1つです。ICMPプロトコルを用いたネットワークの疎通により、機器の死活を監視します。
-
リソース監視
CPUやディスクなどのハードウェアなどのリソースの使用状況を監視します。CPU使用率やメモリ利用率、ディスク使用率といったものがあります。
-
外形監視
Webシステムをユーザ視点で監視を行う方法です。ログインから始まり既定の画面遷移を行えるかなどを監視します。
-
syslog/Windowsイベントの監視
いわゆるOSのシステムログを監視する方法です。syslogやWindowsイベントにて異常が無いかを監視します。
-
ログファイル監視
アプリケーションやミドルウェアなどが出力するログファイルを監視します監視すべきキーワードが出力されていないかをパターンマッチします。
-
トラップ監視
監視対象から送信されてくるSNMPトラップを受信して監視する方法です。ネットワーク機器の監視では主流でMIB定義に従った監視が必要です。
ITシステムの監視に必要な仕組み
ITシステムの監視の仕組みとしては、「対象のデータの取得」、「正常か異常かの判定」、「判定後の通知」という3つの機能の他に、これらの「定期実行やカレンダ制御」も重要になります。
-
対象のデータの取得
ITシステムの監視には、監視の判定をするための情報を取得する仕組みが必要です。情報には様々な種類があり、判定のための情報取得の他に、そもそものリクエスト(要求)を投げてレスポンス(応答)があるかないか自体や、機器などから送信されてくるトラップも重要な情報となります。
-
正常か異常かの判定
次に、取得した情報が正常か否かを判定します。取得した情報が数値だった場合、閾値(しきいち)による判定があります。これは、閾値(指定の範囲)にあるか否かで正常か否かを判定します。取得した情報が文字列だった場合、パターンマッチによる判定があります。正規表現などによるパターンマッチを順序を付けた「パターンマッチ条件」を用意し、対象もログなどの文字列を上から順に判定にかけます。その他にも、サービスが起動しているか停止しているかの真偽だけで判定するようなケースもあります。
-
判定後の通知
正常か異常かの判定した後、結果により運用者等に通知にします。常時、運用端末の画面を見るオペレータがいる場合は、ステータス(最新状態)やイベント(発生した時系列の出来事)を画面に表示します。他にも音や光、メールやSNSなどで直接的に人に通知する方法や、人ではなくシステムやサービスに通知(連携)することで、運用自動化を行います。
-
定期実行とカレンダ制御
ITシステムの運用現場では、サービス提供時、メンテナンス時などの状況に応じて、これまで説明したデータ取得、判定、通知を、定期的/定常的に実行したり、業務カレンダによって実行制御したりすることが重要になります。
Hinemosのポイント
統合運用管理ソフトウェアHinemosの監視機能におけるポイントをピックアップしてご紹介します。
-
様々な要件に対応できる監視の種類
Hinemosでは予め多種多様な監視の種類を用意しています。これによりプラットフォームからアプリケーション・サービスの様々なレイヤの監視を簡単に開始できます。
エージェントレス監視(20種類) エージェントが必要な監視(8種類) PING監視 JMX監視 Hinemosエージェント監視 プロセス監視 システムログ監視 Windowsイベント監視 リソース監視 ログ件数監視 ログファイル監視 サービス / ポート監視 相関係数監視 バイナリファイル監視 Windowsサービス監視 収集値統合監視 パケットキャプチャ監視 HTTP監視 カスタムトラップ監視 カスタム監視 HTTPシナリオ監視 クラウド課金監視 クラウドログ監視 SNMP監視 クラウド課金詳細監視 RPAログファイル監視 SNMPTRAP監視 クラウドサービス監視 - SQL監視 RPA管理ツール監視 - -
オペレーターでも簡単設定
海外製品やOSSには、エンジニアが使う想定の製品が多くあります。その場合、開発工程ではエンジニアがいるため問題に気づけませんが、運用工程でオペレータには使えず運用が立ち行かなくなる事が多々あります。Hinemosは、監視の設定がGUI操作で簡潔するオペレータ向けの製品であるため、運用中にエンジニアの高度なスキルは不要です。
-
パブリッククラウドに対応
Hinemosは、Amazon Web Services(AWS)やMicrosoft Azureといったパブリッククラウドと連携してクラウド運用に必要な監視を統合します。AWSの例では、CloudWatchと連携したリソース監視、CloudWatch Logsのログ監視、クラウドサービス監視(AWS Health Dashboard)の他に、様々なサービス監視の機能を利用して、AWS上に構築されたITシステムの監視を実現します。
-
小規模システムから大規模システムまで
Hinemosは小規模システムから大規模システムまで、様々な規模のITシステムに対応した監視が実現可能です。例えば、1台のHinemosマネージャで複数の小規模システムを束ねて監視したり、複数台のHinemosマネージャを1台の画面で統合監視したり、大規模システムでは多段構成を組んだ監視システムの構築も可能です。
-
ジョブ機能①:追加費用なしでジョブ機能が利用可能
運用当初は監視の単機能ツールだけ導入するけれども、運用コスト削減のため運用自動化・効率化が求められるケースは多くありますが、後から追加で購入したり新たにシステムに追加製品を導入する事は非常に難しいです。
Hinemosはワンパッケージで監視とジョブ管理の両方を備えているので、後から追加費用も追加の構築もなしでジョブ管理が利用可能です。 -
ジョブ機能②:監視結果からジョブネットをシームレスに起動
ITシステムに障害が発生したら自動復旧の処理をキックしたり、ジョブの実行前に異常をチェックするといった監視とジョブ管理・自動化ツールの連携は当たり前に求められます。しかし、監視ツールとジョブ管理ツールを個別に導入してしまうと、製品連携を作り込む必要があり、復旧処理の実行結果は別製品の画面で確認が必要になります。
Hinemosは障害発生から障害対処のジョブネットをキックするといった監視とジョブの機能間連携を作り込み不要でシームレスに行う事が出来ます。
-
ジョブ機能③:ジョブ機能と共有できる高度なカレンダ
Hinemosはジョブ機能が持つ強力なカレンダ機能をそのまま監視機能にも適用することができます。これは、業務カレンダを監視機能とジョブ機能で集約し、日本で求められる複雑なカレンダ処理に対応できるという強力なメリットです。
-
監視対象数に依存しないライセンス体系
一般的な監視ツールは監視対象台数でライセンス費用がスケールしますが、Hinemosサブスクリプションでは監視対象台数による費用変動はありません。これにより、提案や設計フェーズにおいて十分なシステムのサイジングが難しい場合、クラウドなどのマシンリソースの増減が激しい環境などでも、運用管理製品のライセンスコストを心配する事無く運用を継続する事ができます。
お問い合わせ
HinemosによるITシステムの統合監視のメリットをご理解頂けたと思います。ITシステムの統合監視にお困りの方、Hinemosにご興味のある方は、ぜひお問い合わせください。
- - ITシステムを俯瞰した統合監視を実現したい方
- - 監視機能とジョブ機能の両方をお求めの方
- - オペレータが簡単に扱える運用機能をお探しの方
お問い合わせ内容の記載例
-
お問い合わせ対象
特集:監視
-
お問い合わせ内容
現状のシステム監視についてお困りのこと、または、Hinemosが実現するシステムの監視について詳しくお知りになりたい内容をご記入ください。
関連情報
紹介資料
-
- Hinemos機能紹介
Hinemosの機能について詳しくご紹介しております。
記事・技術情報
Coming Soon..
事例
-
- NTTデータ:データセンタ&クラウドサービス事業部
大規模データセンタでHinemosを全面採用。3,000台を超える物理機器・仮想マシンをHinemosで管理。大規模環境で多段構成を取り、影響を局所化。大規模環境でも低コストを実現。
サービス・ソリューション
オンプレ・仮想化・クラウド環境などに初めてHinemosを導入されるお客様に、体制・フェーズに合わせてご支援します。