SRE イベントレポート

CloudNative Days Tokyo 2022に参加しました

SRE イベントレポート

はじめに

こんにちは!!!今年の8月にペパボの技術部プラットフォームグループにjoinしたpochyです。先日、ペパボの技術部から数名でCloudNative Days Tokyo 2022に参加しました。この記事ではそのイベントレポートをお届けします。

CloudNative Days Tokyoとは

CloudNative Daysは、クラウドネイティブコミュニティの有志によって主催されている技術カンファレンスです。今年は初めての、オンラインとオフラインのハイブリッド開催が行われました。会場と配信動画のどちらでもセッションの視聴ができ、またオフラインでもオンラインでも参加者同士の交流の場が提供されていました。

現地会場は東京有明の有明セントラルタワーホール&カンファレンスで実施されました。 会場のノベルティグッズが集合している写真 会場で流れていたGMOインターネットグループのCM

登壇した内容

ペパボからは4人が合計5セッションの登壇をしました。それぞれの登壇者から発表したセッションの紹介をしていきます。 ペパボ登壇者集合写真

『Dynamic VM Scheduling in OpenStack』 @pyama86

こんにちは。いよいよキャンプもハイシーズンですね。この時期の焚火や、薪ストーブで暖を取りながら、のんびり過ごす時間は30代で知った最高の時間の一つです、どうも、pyama86です。

今回のCNDT2022では僕はGMOインターネットグループのスポンサーセッションとして、自社で発生したCPU Stealを起因とした、ノイジーネイバー問題を扱いました。ポイントは、いかにサービスのダウンタイム発生させずに、自動でリソースの再配分をやるのかということです。内容の詳細は資料をご確認ください。

CNDTはCOVID-19以前は、個人的にはYAPC、buildersconと並んで、自身が技術的なインプットや交流を行う場として、とても好きに感じているカンファレンスでした。理由は、いろいろな世代がいることにくわえて、クラウドネイティブ技術を中心としたコミュニティなので、現在の仕事との親和性が非常に高いからです。

しかし、COVID-19以降は他のカンファレンスと同じようにオンラインでの開催が主となり、話し手としても、聞き手としても、参加のモチベーションが上がらない状態となってしまいました。これは僕自身の話し手としてのスタイルや、自宅での視聴だとどうしてもながら聞きになってしまって、効果的なインプットができなくなってしまったためです。

その中で、今回は待ちに待ったオフライン開催ということで、たくさんの方々と交流したり、知らない技術の話を聞くことができました。このような素晴らしいコミュニティを支えている運営の皆様には本当に感謝の気持ちしかありません。僕自身もコミュニティにとっていい参加者、登壇者であるべく、引き続き研鑽していきたいと思いました。

『k8s Operatorで運用負担減&ハイブリッドクラウドのコスト最適化をした話』 @akichan

CNDT2022をご覧になられた方もそうでない方もこんにちは、akichanです。 今回初めての自社主催以外のイベント登壇で、張り切っていいマイクを購入して臨みました。

今回発表した内容は、プライベートクラウドとパブリッククラウドのハイブリッドクラウド上で運用されるサービスにおける運用上の課題の事例において、k8s Operatorを用いた課題解決について紹介しました。 詳細については下記のスライドや書き起こし記事を御覧ください。

当日はオフラインでも参加し、自分の発表を見てくださる方の反応を見ることができ、嬉しい気持ちになりました。 また、たくさんの興味深いセッションを聴講することができ、刺激を受け、現在、Wasmを学んでいます。このような偶発的な出会いがあるのはオフラインイベントならではであると感じています。

このような素晴らしいコミュニティに還元できるよう、次回以降も登壇あるいは運営のお手伝いなどで貢献していければと思います。

『実例から学ぶ Kubernetes Custom Controller のステータス管理』 @takutaka

こんにちは。 takutaka です。最近自宅サーバとして DeskMeet を購入しました。とてもいいのでみんな買うといいと思います。

今回、業務で開発しているコントローラの実装から得た知見を外部のソースコードを交えながら解説するセッションを実施しました。
akichan のセッションと連続での発表であったため、「カスタムコントローラを実装してみたい!!」と思ってくださった方がいらっしゃったらとても嬉しいです。
なお SpeakerDeck にアップロードしてある発表資料には、セッションでは収まらなかった自作コントローラの反省ポイントも記載してあります。合わせてご覧ください。

僕個人としては、3~4年ぶりくらいのオフラインイベントでの発表となりました。オンラインでの発表は何度か実施していたのですが、聴講者との距離が近く、反応を間近に捉えることができるオフラインイベントは貴重な場であるなあと改めて感じました。(動画での登壇だったので実際にリアルタイムに発表していたわけではありません)
また、動画での登壇とオフライン登壇ではまた違った体験を得られそうだなと感じたため、次回どこかで機会があり登壇できることとなった場合は、ぜひ完全オフラインでの登壇を選択したいなあと感じました。

『ペパボのSREが生産性の向上を目指しCloud Nativeなチーム作り実践した話』 @gurasan

こんにちは、gurasanです。CNDT2019に参加したときに「いつかは登壇する側で参加したい!」と思って3年が経ちついに登壇する機会が訪れました。「Cloud Nativeなチーム作り」というアイディアが浮かんだのは2022年の1月頃でそこから実現するために取り組んできたことをまとめ上げた内容となっております。当日は発表へのコメントも多くありとても嬉しかったです。

次回以降も積極的に参加してクラウドネイティブ界隈を盛り上げる一員になっていきたいと思います。

『しきい値監視からの卒業! Prometheus による機械学習を用いた異常検知アラートの実装』 @takutaka

こんにちは。 takutaka です。実は今回2つ登壇をさせていただいておりました。納期に間に合って本当に良かったです。

このセッションでは、機械学習のアプローチを用いた異常検知アラートを実装してみた手順と感想を述べるという内容をお送りしました。以下発表資料をご覧ください。

このセッションの裏テーマとして、「機械学習をまったく知らないエンジニアが応用プロダクトを実装するまでの過程を全部公開する」というテーマを掲げておりました。Twitter の反応を見ると、そのテーマを読み取ってくださった方がいらっしゃって非常に嬉しく思いました。監視という題材に囚われない、普遍的なアプローチを取っていると思っているので、機械学習をやってみたい!と思っている方は一読していただけると良さそうです。
また、 CNDT の参加者にとって馴染みの深い「監視」という題材と、関心の高い「機械学習」という題材を合わせた内容であったためか、ご覧いただいた人数も比較的多かったみたいです。ありがとうございます。
また、コントローラの発表の方は業務で得た知見を応用した内容なのですが、この発表ではゼロから登壇駆動開発を行い、得た知見を共有しました。
作成したプロダクトは、現段階では本番投入できていませんが、近いうちに実践でのアラートに使用できる完成度に近づけていく予定です。
ぜひプロダクトの方もウォッチしていただけると嬉しいです。

https://github.com/takutakahashi/promad

参加した感想

ペパボからは登壇者以外も三人が現地でイベントに参加しました。それぞれのメンバーから、会場でイベントに参加しセッションを聞いた感想を紹介します。

naryo

こんにちは、CNDT2022に今回初めて参加させて頂いた naryo です。 普段は沖縄に住んでいて、当日も飛行機に乗って会場に向かいました!

どれも気になるセッションが多かったのですが、その中でも、個人的には気になるセッションが2つあって、一つは Akihiro Ikezoe さんによる Kubernetes Admission Webhook Deep Dive です。 Addmisison Webhookの仕組みなど基本的な話から、実装方法だったり、実例を用いたハマりどころなどとても興味深い内容となっており、非常に参考になりました。 こちらの リンク に詳しい情報が記載されているので、気になった方はぜひ見てみてください!

もう一つの気になったセッションは Keisuke Sakasai さんによる 実践!OpenTelemetry と OSS を使った Observability 基盤の構築 です。 最近、個人的にもオブザーバビリティの領域に興味を持っていたことから、まさに関心があるセッションとなっていました。ログ・トレース・メトリクスなどのテレメトリー情報が相互に紐づき、システムを運用する上ですぐに内部状態を取得できる状態にあるということは個人的にも重要なアプローチの一つだと考えており、その実装方法の一例をデモストレーションを交えながら紹介なさっていて、非常に参考になりました。

また、実際に現地に行ってカンファレンスに参加することが初めての経験だったこともあり、オンラインとは違った雰囲気でかなりモチベーションの向上に繋がりました! なぜか2日連続でカンファレンス終了後にインシデント対応が発生するという謎のジンクスに見舞われてしまい、個人的にはもう少し参加者と交流できたら良かったなと心残りな部分があったのですが、来年以降は積極的にオフラインのイベントに参加・登壇していき、たくさんの方々と交流していきたいなという気持ちが強くなりました。

最後に、運営に携わって頂いたスタッフの皆様にはとても感謝しています。私自身も今後このようなすばらしいコミュニティがさらに盛り上がるように、何かしらの形で貢献出来ればと思っています。

pochy

改めましてpochyです。私からは興味を惹かれたセッションと、イベントに参加した感想をお届けします。

セッションの紹介

私からはSatoshi Yamamuraさんによる『フロントエンド・オブザーバビリティ』と題されたセッションの紹介をします。

このセッションでは、SRE・アプリケーションエンジニア・マネージャーのそれぞれの立場からフロントエンドモニタリングとオブザーバビリティの重要性を確認した上で、マイクロサービスにおけるフロントエンドモニタリングの手法が紹介されました。

まずセッションは「フロントエンドモニタリングは誰のため?」という問いかけから始まり、障害検出や開発効率の向上、コンバージョンの向上などシステム開発に関わる人にとってモニタリングが有用であると述べられました。

それから、マイクロサービス化したシステムの複雑さが説かれ、マイクロサービスにおける障害時のボトルネックを特定するのにフロントエンドモニタリングが役立つという話がされました。 このセクションで印象的だったのはモニタリングとオブザーバビリティの違いの話でした。上手くいかないことが既知である事象に目を配るのがモニタリングで、予想外のことを発見してその事象を説明するのがオブザーバビリティであるとのことです。いわゆるunknown-unknownを検出するという考え方は私にとっては新鮮なアイデアでした。

セッションでは続いてオブザーバビリティに必要な三要素の説明がされました。

  • Metrics(問題が起きているか)
  • Traces(どこで問題が起きているか)
  • Logs(なぜ問題が起きているか)

私はSREとして配属されてからこれらの要素が収集されるのを「そういうもの」としてなんとなく眺めていましたが、システムの可観測性のためにはこの三要素が必要であることを改めて認識できました。

その後はデモを交えて具体的な測定対象や監視手法の説明がされました。 測定対象としてはGoldenSignals(サービスの健全性)やWebVitals(UX)などが紹介されました。 監視手法としては外形監視とリアルユーザーモニタリングが紹介され、それぞれのメリット・デメリットが説明されました。

ここまでがセッションの紹介です。私の感想としては、システムの観測についてその必要性と重要な要素、また具体的な観測手法が幅広くかつ詳細にまとめられていて非常に感銘を受けました。

参加した感想

現地でイベントに参加して良かったと心から感じています。 私にとってクラウドネイティブに特化したイベントに参加するのは今回が初めてでした。各所からクラウド技術のディープな話が聞こえながらその一員としてイベントを楽しむという経験はなかなか味わえないものだと思いました。このカンファレンスに参加することでクラウド技術に対するモチベーションが高まったので、今後は自身の知見を高めてそれを発信することでもっとコミュニティに還元していきたいです。

yuchi

こんにちは、yuchiです。聞いた中で印象に残っているセッションを紹介していきます。

セッション紹介

Akito Fujiharaさんの「Self-Hosted Runners & Actions Runner Controller (ARC)を運用すること」です。

今まではCI/CD環境に強い権限のcredentialを渡しており、万が一、credentialの漏洩などが発生した場合に、いくつかの課題があったという話から、それらを解決するために行ったことについての話がなされていました。 Actions Runner Controller(ARC)のコンセプトやアーキテクチャ、導入方法、どのようなことができるのかなどの解説がされており。興味のある領域だったのでとても参考になりました。また、自分と同じ22卒の新卒入社の方が大きなイベントに登壇していることも刺激になりました。

入社した段階で既に使われている技術について「どういった背景で導入され、どのような問題を解決できたのかを理解できた」というワードがとても印象的でした。

配属されてから普段の業務で何気なく使っているツールも「導入前の問題が何だったのか、なぜこれが導入されたのか、それによって開発体験がどのように変わったのか」というのを意識するきっかけとなりました。

イベント全体の感想

初めてインフラ中心のイベントに参加しました。様々なセッションや、ホワイエに設置されたホワイトボードに書かれていた課題などを見ていると「各社、同じようなことで悩んでいるんだな」ということに気がつくことができました。

登壇者は会場登壇と映像登壇があり、視聴をする方も物理会場と配信があるとても大変そうなオペレーションを有志のスタッフの方が行っていたのも印象的でした。

(スタンプラリーの景品のラバーキーホルダーが当たりました。到着が楽しみです。)

おわりに

引き続きyuchiです。

今回CNDT2022は約3年ぶりのオフライン開催とのことでペパボのプラットフォームグループ中心に現地で参加しました。 ホワイエでの立ち話やホワイトボード、セッション中の他の参加者の方の反応など、オフラインのイベントでしか体感できない良さがありました。今回のイベントに携わって下さったすべてのスタッフの方々に感謝申し上げます。

GMOペパボではレンタルサーバーやECサービスをプライベートクラウド/ハイブリッドクラウドで支えるクラウドネイティブな方、40000人募集しています。 GMOペパボ40000人採用したい!!1