No one sees the real me

仮想化PF基盤SE

(1) vMotionの仕組み

vMotionの仕組み

今更感あるけど、具体的なロジック知ってる?言われたらわからん言う

f:id:naoki_1123:20180612232126p:plain

f:id:naoki_1123:20180612232139p:plain

↓ わたしのまとめた資料

クラウドまとめ - Google スプレッドシート

上記の元画像
tech.nikkeibp.co.jp

  1. メモリ情報をコピー、メモリ情報の差分が小さくなるまで何度もコピー
  2. 切り替え
  3. RARPを投げる

そんだけ。

  • vMotion 途中でタスクをキャンセルしようとvMotion失敗するだけで移行元VMに影響なし
  • vMotionタスクをキャンセルできないときは、ESXi 上から プロセスを kill することで強制終了することができる

今更だけど。。。

vSS ポート グループのセキュリティ

Promiscuous Mode

  • [拒否]: ゲスト アダプターをプロミスキャス モードに設定しても、アダプターでどのフレームが受信されるかは影響を受けません。
  • [承諾]: ゲスト アダプターをプロミスキャス モードにすると、アダプターの接続先のポート グループの VLAN ポリシーで許可された、vSphere Standard switch を通過するすべてのフレームが検出されます。

MAC Address Changes

  • [拒否]: [MAC Address Changes] を [Reject] に設定し、ゲスト OS でアダプタの MAC アドレスを .vmx 構成ファイルに記載のないものに変更した場合、すべての受信フレームがドロップされます。ゲスト OS で MAC アドレスを元に戻し、.vmx 構成ファイルの MAC アドレスに一致させると、受信フレームが再び通過するようになります。

  • [承諾]: MAC アドレスをゲスト OS から変更すると、意図した効果が得られます。つまり、変更後の MAC アドレスに送信されたフレームは、仮想マシンによって受信されます。

Forged Transmits

  • [拒否]: アダプターでの現在の設定とは異なる送信元 MAC アドレスを持つ送信フレームはすべてドロップされます。

  • [承諾]: フィルタは実行されず、すべての送信フレームが通過します。

f:id:naoki_1123:20180612000340p:plain

・・・vSS は使われないか

打診

◆絶対に必要な技術内容

VMware基盤プラットフォームの構築とテスト】
インフラ基盤エンジニアの構築経験、可能であれば設計

◆より具体的なイメージ

(プラットフォーム=インフラ基盤)
□プラットフォーム構築
 設計書に基づき、サーバやストレージの設置を行い、OS、ドライバソフトウェア、ミドルウェア等の
 インストールを行う。部品やソフトウェアおよびそのバージョン等について指定されたものがインスト
 ールされ、正常に起動することを確認する。
コンポーネントのコンフィグレーションパラメータの設定
 コンポーネント単体の動作テストを実施し、コンポーネント単体で正常動作を確認する。
□プラットフォームシステムテスト
 コンポーネントテスト終了後、コンポーネントを結合しシステムテストを行う。システムテストでは、
 結合されたコンポーネントおよびシステムの結合が正しく行われ、システム設計要件を満たしているこ
 とを確認する。システム性能についてもテストを行い必要に応じてチューニングを行う。
□システム化要件テスト
 システム化要求事項を満たしているかの確認テストを行う。
□関連文書の更新
 これまでに作成したシステム開発に関する文書類の更新を行う。
□プラットフォームの引渡し準備
 プラットフォームの納入準備を行う。(ドキュメント整備、引渡し環境整備)

可能であれば(ゆくゆくはでも可)

□プラットフォーム設計
プラットフォーム要件定義を踏まえ、プラットフォーム設計を行う。
・プラットフォームアーキテクチャの設計
・可用性、性能、キャパシティ、拡張性、管理性、セキュリティ要件の実現方式の設計
・バックアップ/リストア方式の設計
・物理構成決定、製品選定
□ハードウェア、オペレーティングシステムミドルウェアなどのコンポーネントごとのコンフィグレー
ションパラメータの設計を行う。

全部IPA育成カリキュラムのとこからコピったZE

https://www.ipa.go.jp/files/000010274.pdf?_fsi=2kZruQF1

docker-io と、epel を入れる

[root@naoki_doc1 ~]# yum install docker-io
Loaded plugins: fastestmirror, refresh-packagekit, security
Determining fastest mirrors
 * base: ftp.iij.ad.jp
 * extras: ftp.iij.ad.jp
 * updates: ftp.iij.ad.jp
Setting up Install Process
No package docker-io available.
Error: Nothing to do
[root@naoki_doc1 ~]#
[root@naoki_doc1 ~]# uname -a
Linux naoki_doc1 2.6.32-431.el6.x86_64 #1 SMP Fri Nov 22 03:15:09 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux
[root@naoki_doc1 ~]#
[root@naoki_doc1 ~]# cat /etc/redhat-release
CentOS release 6.9 (Final)
[root@naoki_doc1 ~]#
[root@naoki_doc1 ~]#
[root@naoki_doc1 ~]# yum repolist
Loaded plugins: fastestmirror, refresh-packagekit, security
Loading mirror speeds from cached hostfile
 * base: ftp.iij.ad.jp
 * extras: ftp.iij.ad.jp
 * updates: ftp.iij.ad.jp
repo id                        repo name                                  status
base                           CentOS-6 - Base                            6,706
extras                         CentOS-6 - Extras                             53
updates                        CentOS-6 - Updates                         1,255
repolist: 8,014
[root@naoki_doc1 ~]#
[root@naoki_doc1 ~]# cd /etc/yum.repos.d/
[root@naoki_doc1 yum.repos.d]# ll
total 20
-rw-r--r--. 1 root root 1926 Nov 27  2013 CentOS-Base.repo
-rw-r--r--. 1 root root  638 Nov 27  2013 CentOS-Debuginfo.repo
-rw-r--r--. 1 root root  630 Nov 27  2013 CentOS-Media.repo
-rw-r--r--. 1 root root 3664 Nov 27  2013 CentOS-Vault.repo
[root@naoki_doc1 yum.repos.d]#
[root@naoki_doc1 yum.repos.d]#
[root@naoki_doc1 yum.repos.d]# yum -y install epel-release
Loaded plugins: fastestmirror, refresh-packagekit, security
Setting up Install Process
Loading mirror speeds from cached hostfile
 * base: ftp.iij.ad.jp
 * extras: ftp.iij.ad.jp
 * updates: ftp.iij.ad.jp
Resolving Dependencies
--> Running transaction check
---> Package epel-release.noarch 0:6-8 will be installed
--> Finished Dependency Resolution

Dependencies Resolved

================================================================================
 Package                Arch             Version         Repository        Size
================================================================================
Installing:
 epel-release           noarch           6-8             extras            14 k

Transaction Summary
================================================================================
Install       1 Package(s)

Total download size: 14 k
Installed size: 22 k
Downloading Packages:
epel-release-6-8.noarch.rpm                              |  14 kB     00:00
Running rpm_check_debug
Running Transaction Test
Transaction Test Succeeded
Running Transaction
  Installing : epel-release-6-8.noarch                                      1/1
  Verifying  : epel-release-6-8.noarch                                      1/1

Installed:
  epel-release.noarch 0:6-8

Complete!
[root@naoki_doc1 yum.repos.d]# yum -y install docker-io
Loaded plugins: fastestmirror, refresh-packagekit, security
Setting up Install Process
Loading mirror speeds from cached hostfile
epel/metalink                                            | 4.5 kB     00:00
 * base: ftp.iij.ad.jp
 * epel: mirror.dmmlabs.jp
 * extras: ftp.iij.ad.jp
 * updates: ftp.iij.ad.jp
epel                                                     | 4.7 kB     00:00
epel/primary_db                                          | 6.0 MB     00:00
Resolving Dependencies
--> Running transaction check
---> Package docker-io.x86_64 0:1.7.1-2.el6 will be installed
--> Processing Dependency: libcgroup for package: docker-io-1.7.1-2.el6.x86_64
--> Processing Dependency: lxc for package: docker-io-1.7.1-2.el6.x86_64
--> Running transaction check
---> Package libcgroup.x86_64 0:0.40.rc1-24.el6_9 will be installed
---> Package lxc.x86_64 0:1.0.11-1.el6 will be installed
--> Processing Dependency: lua-lxc(x86-64) = 1.0.11-1.el6 for package: lxc-1.0.11-1.el6.x86_64
--> Processing Dependency: lua-alt-getopt for package: lxc-1.0.11-1.el6.x86_64
--> Processing Dependency: liblxc.so.1()(64bit) for package: lxc-1.0.11-1.el6.x86_64
--> Running transaction check
---> Package lua-alt-getopt.noarch 0:0.7.0-1.el6 will be installed
---> Package lua-lxc.x86_64 0:1.0.11-1.el6 will be installed
--> Processing Dependency: lua-filesystem for package: lua-lxc-1.0.11-1.el6.x86_64
---> Package lxc-libs.x86_64 0:1.0.11-1.el6 will be installed
--> Running transaction check
---> Package lua-filesystem.x86_64 0:1.4.2-1.el6 will be installed
--> Finished Dependency Resolution

Dependencies Resolved

================================================================================
 Package              Arch         Version                  Repository     Size
================================================================================
Installing:
 docker-io            x86_64       1.7.1-2.el6              epel          4.6 M
Installing for dependencies:
 libcgroup            x86_64       0.40.rc1-24.el6_9        updates       131 k
 lua-alt-getopt       noarch       0.7.0-1.el6              epel          6.9 k
 lua-filesystem       x86_64       1.4.2-1.el6              epel           24 k
 lua-lxc              x86_64       1.0.11-1.el6             epel           16 k
 lxc                  x86_64       1.0.11-1.el6             epel          124 k
 lxc-libs             x86_64       1.0.11-1.el6             epel          257 k

Transaction Summary
================================================================================
Install       7 Package(s)

Total download size: 5.1 M
Installed size: 20 M
Downloading Packages:
(1/7): docker-io-1.7.1-2.el6.x86_64.rpm                  | 4.6 MB     00:00
(2/7): libcgroup-0.40.rc1-24.el6_9.x86_64.rpm            | 131 kB     00:00
(3/7): lua-alt-getopt-0.7.0-1.el6.noarch.rpm             | 6.9 kB     00:00
(4/7): lua-filesystem-1.4.2-1.el6.x86_64.rpm             |  24 kB     00:00
(5/7): lua-lxc-1.0.11-1.el6.x86_64.rpm                   |  16 kB     00:00
(6/7): lxc-1.0.11-1.el6.x86_64.rpm                       | 124 kB     00:00
(7/7): lxc-libs-1.0.11-1.el6.x86_64.rpm                  | 257 kB     00:00
--------------------------------------------------------------------------------
Total                                           2.7 MB/s | 5.1 MB     00:01
warning: rpmts_HdrFromFdno: Header V3 RSA/SHA256 Signature, key ID 0608b895: NOKEY
Retrieving key from file:///etc/pki/rpm-gpg/RPM-GPG-KEY-EPEL-6
Importing GPG key 0x0608B895:
 Userid : EPEL (6) <epel@fedoraproject.org>
 Package: epel-release-6-8.noarch (@extras)
 From   : /etc/pki/rpm-gpg/RPM-GPG-KEY-EPEL-6
Running rpm_check_debug
Running Transaction Test
Transaction Test Succeeded
Running Transaction
  Installing : lxc-libs-1.0.11-1.el6.x86_64                                 1/7
  Installing : lua-filesystem-1.4.2-1.el6.x86_64                            2/7
  Installing : lua-lxc-1.0.11-1.el6.x86_64                                  3/7
  Installing : lua-alt-getopt-0.7.0-1.el6.noarch                            4/7
  Installing : lxc-1.0.11-1.el6.x86_64                                      5/7
  Installing : libcgroup-0.40.rc1-24.el6_9.x86_64                           6/7
  Installing : docker-io-1.7.1-2.el6.x86_64                                 7/7
  Verifying  : lxc-1.0.11-1.el6.x86_64                                      1/7
  Verifying  : lua-lxc-1.0.11-1.el6.x86_64                                  2/7
  Verifying  : lxc-libs-1.0.11-1.el6.x86_64                                 3/7
  Verifying  : libcgroup-0.40.rc1-24.el6_9.x86_64                           4/7
  Verifying  : docker-io-1.7.1-2.el6.x86_64                                 5/7
  Verifying  : lua-alt-getopt-0.7.0-1.el6.noarch                            6/7
  Verifying  : lua-filesystem-1.4.2-1.el6.x86_64                            7/7

Installed:
  docker-io.x86_64 0:1.7.1-2.el6

Dependency Installed:
  libcgroup.x86_64 0:0.40.rc1-24.el6_9    lua-alt-getopt.noarch 0:0.7.0-1.el6
  lua-filesystem.x86_64 0:1.4.2-1.el6     lua-lxc.x86_64 0:1.0.11-1.el6
  lxc.x86_64 0:1.0.11-1.el6               lxc-libs.x86_64 0:1.0.11-1.el6

Complete!
[root@naoki_doc1 yum.repos.d]#

★経歴をざっくり★

経歴

  • 大学時代:引っ込み思案で大学内では孤立まっしぐら、唯一仲の良い下宿先の友達と夜な夜な遊ぶ日々
         深夜に2人で原チャリで飛ばすのは楽しかった思い出、だが "とある理由" で 不登校気味となりで1単位の余裕もなくぎっりぎりで卒業

  • 2012~:情報系の大学卒だったのもあり、IT系の企業に入社、東京に行きたい!一心だったが愛知と東京を行き来するのは困難、
        就活は難を極めたが特定派遣会社が拾ってくれた、
        念願の上京を果たすも、運用監視業務のルーチンに飽き、構築やりたい!と約1年半で早々に退職

  • 2013~:設計構築onlyの企業へ転職、がんばるぞと思った矢先に客先・自社から戦力外通告
        ここで完全に自信喪失し泣き崩れた。全く別の職種・帰郷を覚悟するも、上京して何か得られたのかという葛藤の末、
        派遣社員から出直すことを決意(いきなり正社員は無理だと思いこんだ)

  • 2014~:一般派遣で働き始める
        楽で気ままに働ける派遣という雇用形態にはまる、余裕、この頃から仕事で悩むことが一切なくなる

  • 2015~:特定派遣(正社員)に入社
        楽で気ままな生活に変化なし、特にストレスもなし、ずっぽり派遣の罠にはまり続ける
        派遣の中ではできる方なのか職場優遇されており、ときに怒ってみたり、やりたい放題の性格が身につく

  • 2018年:3年が経過し、上流フェーズに行きたくなった。自社からわたしの引き抜きを打診したところ、顧客より”やめられたら困る、社員にならないか”
        と誘われる、少しその場で考えたがやはり自己のスキルアップのため辞めたい旨を伝える、が再度引き止められ考え直した結果、社員化を希望することになった。
        そして、直雇用の希望を管理職に申し出、面談を重ね、中途採用に応募、採用面接へと続くものの、結果不採用 (人事部の結論)
        派遣のヌルさは痛いほど理解できた、ぬるすぎる、

  • 本日より:新現場に参画

生かせる経験

  • 幅広い視座がある、職場の全体像を捉えるのにそう時間がかからない
  • ケースバイケースだが、障害対応についてもある程度可能(SV、NW、Storage)
  • 丸6年のインフラ運用経験がある(実務経験)
  • ほっといても勝手に学んで育っていつの間にか仕事してる(まだ吸収率は高い年齢)

人物像

  • 人見知り、コミュニケーション能力不足による弊害がある
  • 自信がない、人と比較する癖が治らない、相手の顔色を伺ってしまう
  • 趣味が無いことから、"やりたいこと" = "仕事の内容" と結び付けている

目標

  • 結果を出して、自信を取り戻す
  • 失敗を恐れずコミュニケーションを無理の無い範囲で取るよう心がける
  • 技術力はあとからでもつくため、ロジシンをつける
  • 自分軸を作る★2018年度最重要

test

[root@naoki105 sagyo2]# for i in {1..10} ; do uptime ; sleep 2; done | while read LINE ; do echo $LINE | awk '{ print $1,"----",$10"(1m)",$11"(5m)",$12"(15m)" }' ; done
09:15:49 ---- 0.06,(1m) 0.03,(5m) 0.00(15m)
09:15:51 ---- 0.05,(1m) 0.02,(5m) 0.00(15m)
09:15:53 ---- 0.05,(1m) 0.02,(5m) 0.00(15m)
09:15:55 ---- 0.05,(1m) 0.02,(5m) 0.00(15m)
09:15:57 ---- 0.05,(1m) 0.02,(5m) 0.00(15m)
09:15:59 ---- 0.05,(1m) 0.02,(5m) 0.00(15m)
09:16:01 ---- 0.05,(1m) 0.02,(5m) 0.00(15m)
09:16:03 ---- 0.05,(1m) 0.02,(5m) 0.00(15m)
09:16:05 ---- 0.04,(1m) 0.02,(5m) 0.00(15m)
09:16:07 ---- 0.04,(1m) 0.02,(5m) 0.00(15m)
[root@naoki105 sagyo2]#
[root@naoki105 sagyo2]# for i in {1..1000000} ; do uptime  ;sleep 2  ; done | while read LINE ; do echo $LINE | awk '{ print $1,$10,$11,$12 }' ; done
09:22:36 1.16, 0.38, 0.13
09:22:39 1.16, 0.38, 0.13
09:22:41 1.31, 0.42, 0.14
09:22:43 1.31, 0.42, 0.14
09:22:45 1.31, 0.42, 0.14
09:22:47 1.52, 0.48, 0.16
09:22:49 1.52, 0.48, 0.16
09:22:51 1.64, 0.52, 0.18
09:22:53 1.64, 0.52, 0.18
09:22:55 1.75, 0.56, 0.19
09:22:57 1.75, 0.56, 0.19
09:22:59 1.75, 0.56, 0.19
09:23:01 1.85, 0.60, 0.21
09:23:03 1.85, 0.60, 0.21
^C
[root@naoki105 sagyo2]#

2017.上期振り返り

■前進したこと/学んだこと

[思考面]

 ・やれること(特に時間的制約、スキル・能力、立場)に限りがある
  -すべての依頼に対応できるわけではない

 ・その中でうまくやる
  -他派遣会社メンバーが適切な動きをしてくれない
   -自分が言ってもやってくれない = 自分の業務負荷があがってしまった
    -同課の社員に一言掛け、社員から指示を出してもらったところ動いてくれた
    -別部署との(案件にもよるが)フロントに立った以上、表現は悪いがうまく社員を使って派遣を動かす

 ・自社研修
  コーピング研修の内容が役に立った
   メンタルリハーサル(MR)≒イメージトレーニング
   事前に、やっておくのとやっておかないのでは雲泥の差があった
   感情を自分のコントロール下に置く、というのは課題継続中

[技術面]

 ・監視実装の理解が深まった
  -統合管理ツール(Zabbix)見よう見まねだが狙った監視は実装できる
   (別課が監視専門だが仲の良い方がいるのでわからなかったら聞きにいける)

 ・仮想化技術
  -NSX 技術、バージョン毎に機能の差が大きい、とはいえこれまでのvCNSより遥かに優秀
   機能一覧や、連携、NSX Manager 上で管理できたり、xml で情報を保管している点など技術的な面が理解できた
  -vRealize Operations Manager
   -全機器の負荷状況や、障害予兆を検知できる万能ツール、大元のvCenterやストレージ機器を接続
    させるだけで配下の全VMやLUN情報を一括で拾ってくれる&監視実装が非常にしやすかった
   (下期)vRealize LogInsight を導入するということで、vRopsと組み合わせてさらなる自動化が期待できる

 ・スクリプトスキル
  -肝となるsyslogサーバ内の実装
   複数の機器ログを集約しているためセキュリティ的に甘くできないと考えている
   →イベントログの監視の際の工夫に手こずった、結果的にハードリンクとcronで対処
  -Windowsだがタスクマネージャーの実装とか(これは大した話しではない)
  -まだまだスクリプトスキルが足りない=狙った実装が即席で出来ない

 ・ITサービスマネジメント(ITSM)の大枠
  -ITILv3は若い頃、暗記で受かってしまったが、今読み返すと実務とリンクしてくる
  -継続中

■足りない部分

[対組織、対人]

 自分のことしか考えてこなかった人が、他人に教えるだの他人のために何かすることが出来るだろうか?
 →技術は自分で学べば身につき成長をすぐ感じられる、対人は一朝一夕で成長を感じることが出来ない

 現仕事において、
 組織、チームで動く、必要性はあるが直接的ではない=全く不要とはいかないが優先度は下がる
 ex. 他社メンバー育成、監視チーム依頼の切り分け手順書修正、ナレッジ化=要は他人のためになること

 自分のやりたいこととは異なる、ただし自身の成長のためにも必要であることは頭ではわかっている
 現在は積極的にはやっていない(やらない)
 ↓↓↓
 自分のことしか考えていない、自分自身の能力向上のみ考えている、
 これまではその結果が就業先業務と合致していたため業務が進められてきた
 別課からの信用?からか同課の人材不足からか個人的にお願いされるケースが増えた

 それは駄目なこと?

 環境の要因も一理在る
  -上司・部下の概念が無いことで注意や助言がない=自分のやりたいようにやってきた

■下期に向けた課題

[技術]
 #今やらなければ困ることを最優先
 -Comptia Cloud+ を利用して全体概要を再認識 (10/09 受験予定)
 -最低限のNW知識(CCNAを再取得しようと思う)
 -ストレージ基礎(スーパーブロックだの何だのイメージが沸き辛い)
 -これまでの知識と、実務を頭の中でリンクさせる

 #上記が進んだ上で+αとしてやりたいこと
 ・シェルスクリプト応用+シェル芸
 ・FP学習

 #仮想化技術
 -実務のみで十分、補足があれば書籍で補う

[その他]
 ・運動を続ける(継続中)
 ・ストレス対処方

オペミス・ヒヤリハットについて

エンジニアなら知っておきたい障害報告&再発防止策の考え方

オペミスに関して個人的な考え

・気持ちに訴えかけるだけでは同じミスは再発する
 →ミスを恥じず、堂々と共有し合える文化を作る、出来ないなら自分のミスをさらけ出す
・規律を厳しくすればするほど、変に恐怖心を煽り逆にオペミスは増える
・些細なヒヤリハットに対しても、なぜなぜ分析を行うクセをつける
 →共有し合うのが望ましい、ナレッジが企業の財産になる
・作業内容の理解、誤った際の影響度合いを考えながら手を動かす
 →正直これに尽きる
・顧客影響の無い、内々でリカバリがきくオペミスなんてミスじゃない、反省して終わり、引きずらない
・オペミスした本人を責めるような職場ならお察し企業だと思う

下請け企業がオペミスした場合

・下請け管理職の仕事、報告書提出とあとは元請けとのネゴ
 →元請けの事業がでかければでかいほど、大きく取り上げらてしまうが、
  個人的には異動にさせてもらってちゃら
リスクヘッジ
・大事なのは本人のメンタル

総合として

・オペミスが怖くて運用なんてやってられるか(^ω^ )
・慎重になる局面と、そこまで切り詰める必要が無い局面とを見極めないと、余計な時間を食って作業が進まない
 →判断できないうちは聞いて良いと思うが、自分で決断・判断することが大事

社内の方の発言コピペ(↓他人の言葉であり今後自分版を書く)

運用は何のためにするのか意識は合っているか

  • サービスを継続するための取り組み
    – 機能の修正・改善
    – バグの修正
    – 性能の改善
    – OS/ミドルウェアやアプリケーションのバージョンアップ

開発から運用の流れ

  • 要求の取りまとめ
    – サービス側から (新機能、外部サービスとの連携)
    – 開発側から (保守性の向上、新しいミドルウェアへの対応)
    – 運用側から (障害頻度の軽減、性能向上、可視化)
  • 開発項目の確定と優先度付け
  • リリース時期を確定
  • 開発、テスト
  • リリース

システムの運用は何から始めるか (開発から引き渡された後)

  • サービスの把握
  • 構成の把握 (ハードウェア(仮想)、OS、ミドルウェア、サービス、アプリケーション)
  • 通信の把握 (ネットワークセグメント、IPアドレスプロトコル、データ)
  • リソースの把握 (CPU、メモリ、ディスク、プロセス、ネットワーク)
  • 冗長性の把握 (想定する障害や高負荷、対策)
  • アクセス制御や権限の把握 (ユーザ、グループ、秘密鍵/公開鍵証明書、ドメイン名、期限)
  • ユーザ管理 (追加、削除)
  • 外部接続 (他サービス、アクセスキー、期限)
  • ログ (アクセスログ、エラーログ、アプリケーションログ、ローテーション、保持期間)
  • ベンダー情報 (サポートサイト、連絡窓口、ライセンス)
  • 構成管理 (上記全て)

環境

  • 商用環境
  • ステージング環境
  • 開発環境
  • 環境差分の把握
  • リリース手順
    – リリース対象を確定
    – ステージング環境への配置、テスト
    – 不具合の修正、再配置、テスト
    – 商用環境への反映

監視

  • 何の情報を取得するために監視するか
  • 障害が発生したときに何をするか
  • 監視設定は何を契機として見直すか

ログ

  • ログの種類
    – OSのログ
    – サービスのログ
    ミドルウェアのログ
  • ログレベル (緊急度、詳細度)
  • 分析
    – 入力、出力
    – 処理の前後関係
    – 頻度
    – エラーコード
    – キーワードでの絞り込み – 統計的解析

DB

  • バックアップ、リストア/リカバリ
  • パフォーマンスチューニング
  • リソース監視
  • 権限管理 (ユーザ、パスワード、権限付与、権限剥奪)
  • アクセス制御 (DB、スキーマ、表)
  • 初期化パラメータ
  • ログ

ベンダー情報の追跡

  • バージョンアップ情報 (新機能、削除された機能、互換性)
  • 製品のロードマップ (チケットシステム、公開されたバグ情報、ソースコードの履歴管理情報)
  • 組織としての安定性 (買収、解散、放置)

システムの更新

  • サービスへの影響を把握 (停止、縮退、想定時間)
  • 更新対象を把握 (サーバ、ネットワーク、設定、データ)
  • 作業に影響する監視の抑止
  • 更新作業を実施
  • 監視の再開
  • 構成管理への反映

インシデント管理 (障害からの回復、サービス要求への対応)

  • 既知の障害かどうかの判断
  • 脆弱性の分析と対策
  • ベンダーへの問い合わせ
  • 対応履歴の管理
  • データの受け渡しと消去

レポート

  • サービスからの要求
    – バッチで作成して提供
    – 要求を受けて随時作成して提供
  • 運用レポート
    – サービスの利用状況
    – リソースの利用状況
    – インシデントの発生状況
    稼働率
    – ログ解析
    – 状況の把握から
    — 運用コストの見直し
    — 設備投資の見直し
    — 開発項目の優先度の変更

以上を踏まえて、普段何をするか (運用メンバーの1日)

  • 日次
  • 週次
  • 月次

他にいい方法ないかな?

[root@naoki105 20170807]# cat a
-----mon1-----

192.168.0.1
192.168.11.1

-----mon2-----

192.168.0.2
192.168.11.2

-----mon3-----

192.168.0.3
192.168.11.3
[root@naoki105 20170807]#
[root@naoki105 20170807]# csplit a /^-----.*/ {*} | for i in `ls -ltr xx* | awk '{ print $9}' | sort -n` ; do paste -d, -s $i ; done

-----mon1-----,,192.168.0.1,192.168.11.1,
-----mon2-----,,192.168.0.2,192.168.11.2,
-----mon3-----,,192.168.0.3,192.168.11.3
[root@naoki105 20170807]#
[root@naoki105 20170807]#

体調不良の数々(仮病含む)

2015年1月~2017年8月31日

日時 種別 日数 理由
2015/2/13 欠勤 1日 体調不良
2015/4/9 欠勤 1日 体調不良
2015/4/21 欠勤 1日 体調不良
2015/5/28 欠勤 1日 体調不良
2015/6/12 欠勤 1日 体調不良
2015/7/24 午前半休 0.5日 体調不良
2015/7/31 有給休暇 1日 体調不良
2015/10/15 午前半休 0.5日 体調不良(すいません)
2015/10/21 有給休暇 1日 体調不良
2015/10/23 午前半休 0.5日 体調不良
2015/12/3 欠勤 1日 体調不良
2015/12/11 欠勤 1日 体調不良
2016/1/21 欠勤 1日 体調不良
2016/6/22 有給休暇 1日 体調不良
2016/6/24 有給休暇 1日 体調不良(メモ:偏頭痛)
2016/8/4 午前半休 0.5日 腹痛のため午前半休
2016/9/28 有給休暇 1日 体調不良
2016/11/15 有給休暇 1日 体調不良
2017/2/22 午前半休 0.5日 体調不良のため
2017/2/28 午前半休 0.5日 体調不良のため
2017/3/29 有給休暇 1日 通院のため
2017/4/13 午前半休 0.5日 体調不良
2017/4/21 有給休暇 1日 体調不良
2017/5/9 有給休暇 1日 体調不良
2017/6/30 有給休暇 1日 体調不良
2017/8/25 有給休暇 1日 病院

[2017/08/24]初てんかん発作 [27歳9ヵ月]

<事象>
2017/08/24 23:30頃
自宅アパート一室で
てんかん発作を起こし意識を失い、救急搬送された
08/25 1日入院し退院

<同居している彼女の証言>
・白眼を剥き、口から泡を出していた
・頭部がガクガクと痙攣していた
・呼びかけると眼を開き、その後すぐ眼を閉じた

<自身の記憶>
・救急隊員の声が聞こえたが何の話しかは記憶にない
・異常なほどの吐き気があった
・熱がいきなり出始めた

<検査>
・CT
・脳波検査
・血液検査
→すべて異常なし

<処置>
・点滴(水分補給)
(・看護)

<原因>
複数の要因が重なったことで発症したと考える
・第一は、睡眠不足
 3~4時間程度の睡眠が1~2週続いていた
・第二は、過労
 脳が活動状態で休まらなかった(≒ストレス負荷)
・第三は、自己要因
 栄養不足/運動不足
 数年間運動は皆無、基礎体力がない
 食事も不規則で適当

<対策>
・睡眠時間を意識して確保する
・てんかん発作防止で薬を飲む
 →副作用があるので続くか不明
・意識して残業を抑止する(20:00、遅くても21:00を目途にする)
・食べるものを意識する
 →糖質、甘いものを避ける、缶コーヒーの量を減らす、食べ方
・上記が担保できてから運動不足を解消する活動

<所感>
・生まれて初めてのことでびびった
・目撃して119してくれた彼女はもっとびびったと思う
・ストレス負荷は自覚無し、睡眠不足のみ自覚有り
 →睡眠不足が続く≒脳が休まっていない、脳細胞?

<精神科医の話し>
・患者の中にも少なからず事例有り、検査では異常なくても起きる
・リラックスの重要性、脳の興奮を抑える
・一に睡眠、二に栄養、三に運動