David Yanacek
David Yanacek、シニアプリンシパルエンジニア
David Yanacek は、AWS の Amazon モニタリングと可観測性の組織で CloudWatch のようなサービスに取り組むシニアプリンシパルエンジニアです。2006 年から Amazon のソフトウェアデべロッパーとして、Amazon DynamoDB、AWS Lambda、AWS IoT に携わってきました。また、彼は社内のウェブサービスフレームワークやフリート運行自動化システムにも携わってきました。David の職場でのお気に入りの活動の 1 つは、ログ分析を実行し、運用メトリクスをふるいにかけて、システムを徐々にスムーズに実行する方法を見つけることです。
David 著
生産サービスモニタリングに対する Amazon のアプローチ
このセッションでは、チームがシステムの状態を大まかに評価する方法から、単一のリクエストの詳細を理解するためにズームインする方法まで、Amazon のモニタリングの全範囲について説明します。また、パーセンタイル、メトリクスの次元、ダッシュボード、ログ分析、ディストリビューティッド(分散)トレーシングについて Amazon がどのように考えているかについても学んでください。
Amazon でのオペレーショナルエクセレンス
このセッションでは、Amazon の運用上のプラクティスについて学びます。レトロスペクティブの処理、知識の共有、運用メトリクスの定期的な見直しなど、チームが採用してきた習慣が、どのようにチームをより優れたツールを構築してアーキテクチャの変更を行うために革新するように導いたか。
レジリエントなサーバーレスシステムの大規模な設計と運用
この動画では、モードやオーバーロードの回避、制限された作業の実行、複数レイヤーでのスロットリング、同時実行の防止、等価リクエストの送信、キューイングにおけるバックプレッシャーと公平性の適用、シャッフルシャーディングの実行など、信頼性が高く回復力のあるサービスを構築するために AWS が行っていることを説明します。
ヘルスチェックの実装
フリート全体でフォールスポジティブの意図しない結果は例外として、サーバー障害を自動的に検出して最小限に抑えます。
運用の可視性を高めるために分散システムを装備する
本番システムに対する可視性を実現して、ソフトウェア計測を使い障害をトラブルシューティングします。
負荷制限を使用して過負荷を回避する
過負荷が発生しても予測可能で安定したパフォーマンスを維持するための戦略。
依存関係の分離を使用して、同時実行のオーバーロードを抑制する
依存関係の障害による影響を抑制して、アプリケーション内の関連機能のみに影響するようにします。
マルチテナントシステムにおける公平性
マルチテナントシステムに公平性を組み込み、予測可能なパフォーマンスと可用性を実現します。
乗り越えられないキューバックログの回避
キューバックログから重要なワークロードを迅速にドレインすることを優先し、バックログを回避する。