私はシステムエンジニアとして仕事をしている。
入社してしばらくは運用監視業務をしていた。ルーティン業務は結構好きである。
その時に得た知識を書きたいと思う。
[そもそも運用とは?]
ITシステムをうまく働かせて使うこと。
毎日当たり前のように使っているサービス。
使えて当たり前のサービスが使えなくなった。そんな状態ではすぐに利用者から愛想を尽かされる。安定してサービスを提供する縁の下の力持ち。それが運用担当者。
[運用担当者]
・システムの利用者からの問い合わせの対応を行う「サービスデスク」
・手順書を元に日次や週次で行う「定例作業」
・依頼を元にアカウント作成、パッチ適用、ログ取得といった「非定例作業」
上記を中心とした作業に加え、障害などのインシデント対応を行いシステムの稼働状況やインシデント発生件数などを纏めて定期的に顧客へ報告。保守担当が作業を実施する際に立ち合いをすることもある。運用全体を把握し本番稼働に向けた運用テストも担当する。
[監視オペレーター]
システムに不具合が発生していないか監視し、不具合発生時(警報機鳴動)には一時切り分けを行う。その後、運用担当者へエスカレーションを行う。発生した不具合は軽微な場合は手順書を用いて一時対応を行う場合もある。インシデントを起票してメールで他部署へ連携。不正アクセスや情報流出などのセキュリティ監視も行う。24時間365日頑張っている。
[保守担当者]
障害発生時の部品交換や定期メンテナンスや遠隔地からの機器チェックを行う。機器販売ベンダー、ミドル・ソフト販売ベンダー(FやNやHなど)が保守担当になっている場合が多い。運用担当者や監視オペレーターから障害発生や機器の故障の連絡を受けて対応や交換を行う。
これら3者が連携しながら、システムを正常に稼働させていくことになる。
3者が1つの部署で行われていることもあれば、3者とも別々の会社が行っていることもある。
運用担当者がプロパ、監視オペレーターが協力会社かな?そして・・・運用担当者の上には当然運用責任者が存在する。
[余談]
監視オペレーターは警報機が鳴ってからが勝負。現場がテンヤワンヤしている中でどれだけ冷静でいられるか。異常発生時の現場は戦場と化す。時には怒号が飛び交う中でテンパることもある。だがしかし、結局は運用チーム皆で取り決めている手順、フローに沿って対応すれば間違いない。なにか言われても「え?ここにあるフローに従ってルール通り対応しました。」って答えられちゃうのである。運用フローを頭にいれてインシデントを読み返すことで準備は万全。自分の身は自分で守ろう・・・。
運用チームは本番をなんとしても死守しなければいけない。
今、監視をされている方のスキルアップの一例。
監視オペレータで評価を得る→手順書作成してみない?→打ち合わせの議事録書いてよ→○○を管理してみない?→本番に向けてテストの準備手伝ってよ→交代制から日勤メインでやってみない?(監視から運用担当へ)→ミドル・ソフトの構築やってみる?→構築の経験を活かして設計の作成やってみない?→運用のルール作り一緒に考えてよ→インフラやってみない?
↑これで監視・保守からインフラ業務へステップアップ!
こんな感じじゃないでしょうか?あくまで一例ですが。
結局はやる気を見せて評価・信頼されることが第一。人柄が重要。