SRE スクラム開発

「システム運用アンチパターン」の読書会を実施しました

SRE スクラム開発

こんにちは!技術部プラットフォームグループの @r_nakamine, @h0mirun_deux, @ryuichi_1208 です。 今回は、社内で取り組んだ システム運用アンチパターン の読書会について紹介したいと思います。

本の選定理由

私たちが所属している技術部プラットフォームグループでは普段の業務ではサービス運用を行っています。その中でサービス運用に関しての知見を体系立てて学ぶ機会は少なくメンバー間で差があるという状態になっていました。そこで我々のチーム全体でサービス運用における知見を経験の長いメンバーと短いメンバーで差を埋めるべく「システム運用アンチパターン」の読書会を実施しました。

読書会の進め方

読書会は次のように進めました。

  • 週1回・1時間オンラインで実施
  • 1回に1~2章分を取りあげる
  • 週替わりで1名がその日に取りあげる章の要約をNotionに作成する
  • 回の初めに要約を元にその章の内容を参加者全員で確認する
  • 読んでいて生じた疑問や自分が文章を書く際の悩みなどを元にディスカッションする
  • 会で出たコメントなどはNotionにまとめる

notion

読書会のNotionページ

よかった点

今回は運用に関する本ということで、現状自分たちが置かれている状態と本の内容を照らし合わせつつ読み進めることができました。ここは自分たちでもしっかり出来ているという点やもう少し頑張りたい点についてを洗い出すことができ、これからどのようにチーム全体で進んでいくのが良いのかを考え直すきっかけになりました。

参加者の感想

gurasan

運用自体を本を読んで学んだことはなく経験だけでやってきていたが体系立てて学ぶことができてよかった。これまで感で避けてきたアンチパターンなどを学べたことで自分の中で言語化することができるようになり今後の業務でも活かしていけると思いました。

akichan

運用に課題を感じていることからやり始めた読書会だが、人それぞれで着目するポイントが違って読書会を通して、現状の課題が言語化されたのと、課題に対してどう行動していけばよいかの参考になりました。経験の少ない初学者から経験が長いベテランまで広くおすすめできる書籍と感じました。繰り返し読むことで新しい発見のある本だと思います。

ressy

耳が痛いことがたくさん書かれていて、今の運用に対して改善の余地がたくさんあることを考えさせられる、とてもよいきっかけになりました。今回の読書会でおわらず「いまアンチパターンをやってしまっていないか?」振り返る習慣をつけて運用を改善していきたいです。

naryo

なぜこれがアンチパターンになるのかというところまで、筆者の経験を元に細かく言語化されており、読んでいてとてもイメージがつきやすく、すぐに実務に活かせそうな内容ばかりでした。特に「6章 アラート疲れ」の章では、実際のアンチパターンから、どのようにオンコールローテーションを運用したり、アラートに対応していくか等、具体的な数字を用いながら書かれており、Webサービスの運用経験があまり無い私にとって、かなり参考になりました。

denchan

システム運用とは何かを再度考える良い機会でした。長年システム運用をやっていると、なんとなくやってる、なんとなく続けているといったことが多くあったので、「これをやる本質とは?」を見直す良い機会でした。システム化と仕組みの両立で攻めの運用をして行きたいと改めて感じました。

yuchi

配属されて数ヶ月というタイミングで読書会に参加しました。システム運用の手法について「なぜだめなのか」を含め、グラフや図なども含めた解説があり非常に理解しやすかったです。これから本格的にシステム運用を行う立場になるタイミングでこの本を読むことができてとても良かったです。システム運用のアンチパターンを思い出しながら、業務に生かせるようにしていきたいです。

pochy

アプリケーションを運用するにあたってよく遭遇する課題について書かれていたため共感しながら読み進めました。自分が担当しているサービスでもやってしまいがちなアンチパターンがあれば反省し、自分のサービスで克服できている部分があれば誇りに思う、という読み方ができました。気を緩めると陥ってしまいそうなアンチパターンが数多く紹介されていたので、適切な運用方法を続けていくための仕組みづくりを考える良いきっかけになりました。

harukin

システムの運用経験が数ヶ月ほどしかない状態でこの読書会に参加しました。これから、長年にわたってシステムを運用していくことになると思うので、システム運用時のアンチパターンを知ることができてとても良かったです。自動化によってシステム運用のプロセスを最適化することはもちろん大切ですが、それと同じぐらい人の承認プロセスを最適化することも大切ということが印象に残りました。この本を定期的に読み返すことでシステム運用時にアンチパターンをやってしまっていないか振り返ろうと思います。

shibatch

割と最初のほうの章は「できてる!」と思ったこともあったのですが章が進むにつれて刺さるところもありました。大切なのは習慣だと思っていて、気をつける、というレベルだと風化するのでアンチパターンに陥っていないかを行動の前に考える習慣をよりつけたいです。あと、コード書いて終わり、にしてしまっている思い当たる箇所があるのでちゃんと他人がメンテナンスしやすいようにします。

homirun

DevOpsの定義があやふやな状態で読み始めましたが、冒頭でDevOpsの定義についてしっかりとまとめられており理解することが出来ました。また後半の章では、具体的かつ実践的な内容が書かれており、特にインシデントに関する章では自分たちの取り組みとの比較が出来てとても有意義な話し合いができ、とても良かったです。

PFGメンバー

まとめ

今回の読書会を通じ、運用における様々なアンチパターンについて、参加者の実務における経験を交えながらディスカッションすることができました。技術部は特定サービスによらない全社横断の技術施策を行う事業部です。参加者の大半のメンバーは技術部プラットフォームグループに所属していることから、さまざまなサービスの運用に関わる知見や悩み等を交えてディスカッションすることができるのも、この読書会の醍醐味の一つとなっています。SREにおける技術力向上のために今後も継続して読書会や様々な勉強会を開催していく予定です。