SRE・運用
パフォーマンス・可観測性・インシデント対応
6 articles
- Post
すぐにポストモーテムを準備したい!Claude Codeスキルの設計指針
ポストモーテムの準備は辛い。情報源が散在し、テキスト量が膨大で、インシデント直後の疲弊した状態でやらなければならない。Claude Codeのカスタムスキル機能を使って、この準備作業を大幅に軽くする設計指針を紹介します。
- Post
品質要求が相反するシステムをどう分割するか — サービスベースアーキテクチャの実践
マイクロサービスでもモノリスでもない選択肢として、サービスベースアーキテクチャを医療SaaSの共通基盤で採用した経緯と実装、運用の教訓を紹介します。
- Talk
@ SRE Kaigi 2026
開発チームが信頼性向上のためにできること
Embedded SRE不在でも開発チームが信頼性に責任を持ち、改善を続けるための具体的な方法論と、運用を通じて学んだ教訓を紹介します。
- Post
Node.jsパフォーマンスチューニングをDatadog APMとClaude Codeでサクッとやる
Datadog APMでNode.jsのプロファイルを取得し、Claude Codeと組み合わせてパフォーマンスのボトルネックを特定・改善する方法を紹介します。
- External
@ DeNA Engineering Blog
AWS ECS on Fargate + FireLens で大きなログが扱いやすくなった話
ECS on Fargate環境でFireLensを使用した際に、16KB以上のログが分割されてJSONパースが失敗する問題の原因と、FluentBitのMultilineフィルタによるログ結合の解決策を解説。