まっしろけっけ

めもてきなやーつ

mackerel

mackerel-agent を使って異常を検知した際に自動で復旧させる

はじめに 普段会社では監視ツールとして mackerel などを使ったりしているのですが、mackerel を使っている場合 nginx が動いている server のメモリ使用量が一定割合を超えたらエスカレが来るみたいなことをしていると思います。こういう場合の対応は基本的…

EKS の pod で mackerel-container-agent を動かして監視する

はじめに EKS is これで最近 EKS を触ってアレコレしてるんだけどそのアレコレの一つで mackerel-container-agent 導入してメトリクスを収集するというのがあった。僕が所属している GMO ペパボでは mackerel をかなり使っていて mackerel 上で一括して見ら…

Treasure Data の job の状態を監視する mackerel plugin 作った

経緯 ペパボのデータアナリストの @zaimy が 何らかの原因で job が詰まって割当リソースを使い果たすと、該当のクエリ以外の job も巻き込まれて error になることがあり困った と言っていて mackerel とかで見れると嬉しいなと言ってたのでじゃなんかやっ…