サーバー監視
2017年12月15日
こんにちは。営業統括事業部 大室です。
弊社では、情報システム事業として、国土災害情報に対処するためのシステム、
新聞社、物流企業、タクシー会社向けの情報処理システム、
大手企業のデータ管理システムの設計・開発・保守を行っております。
その中で私は主に新聞社の「サーバー監視」を行っております。
一口にサーバー監視といっても色々な項目がありますので、
今回はサーバー監視について簡単に説明させて頂きます。
【サーバー監視とは】
サーバー監視とは、サーバーが正常に動作しているか、
サーバーから異常が出ていないか等をチェックする仕事です。
【サーバー監視の目的】
サービスが停止する事態にならないよう、または停止する事態になった際に早急に復旧させるため、
サーバー管理者に知らせ、対処をすることです。
【サーバー監視の種類】
●目視監視
サーバーの実機を確認し、ランプが正常に点灯しているかを確認します。
例外はありますが、基本的に緑以外のランプはエラーの可能性が高いです。
●死活監視
サーバーが動いているかどうかを監視します。
PINGというコマンドを定期的に送り、相手側のサーバーから応答があるかどうかを確認し、
応答がない場合にエラーを出力します。
●ハードウェア監視
サーバーが物理的に故障していないか監視します。
主にHDD、メモリ、システムボード、電源などのパーツが故障した際にエラーを出力します。
経験上、一番壊れやすいのはHDDでしょうか。
●パフォーマンス監視
CPU、メモリ使用率、HDD使用率や、ネットワーク使用量等を監視します。
主に設定した閾値を超えた際に出力します。
CPUやメモリ等の使用率があがると、サーバーのパフォーマンスが低下し、
Webサイト等であれば動作がものすごく遅くなります。
●ネットワーク監視
サーバー、ネットワーク機器のネットワークに異常がないか監視します。
物理的にLANケーブルが切れる、抜ける、ネットワーク通信が切断される等の際にエラーを出力します。
●アプリケーション監視
サーバーにインストールされているアプリケーションに異常がないか監視します
主にアプリケーションから出力しているログを監視し、エラーを出力します。
【サーバー監視の方法】
基本的に監視用のソフトウェアを使用します。
死活監視で手動でpingコマンドを打ったり、パフォーマンス監視でTOPコマンドを実行し、
ディスプレイ画面を凝視してパフォーマンスを確認するということではないです。
異常があった際に監視ソフトウェアからエラーを出力されるので、監視している人が対応、連絡を行います。
【最後に】
この記事では監視について簡単に説明させて頂きました。
サーバー障害は極力減らすことはできても0になる可能性は低いです。
ですので、サーバー監視で異常を早急に発見し、
その時に迅速に対応できるように対策をするのが大事だと思います。
私自身、今後も障害が発生した際に迅速に対応できるよう努力していきたいと思います。
最後まで読んで頂き、ありがとうございました。