メインコンテンツに移動

Amazon Builders' Library

David Yanacek

David Yanacek、シニアプリンシパルエンジニア

David Yanacek は、AWS の Amazon モニタリングと可観測性の組織で CloudWatch のようなサービスに取り組むシニアプリンシパルエンジニアです。2006 年から Amazon のソフトウェアデべロッパーとして、Amazon DynamoDB、AWS Lambda、AWS IoT に携わってきました。また、彼は社内のウェブサービスフレームワークやフリート運行自動化システムにも携わってきました。David の職場でのお気に入りの活動の 1 つは、ログ分析を実行し、運用メトリクスをふるいにかけて、システムを徐々にスムーズに実行する方法を見つけることです。

ツイッター LinkedIn GitHub

A portrait photo of a smiling person wearing glasses and a collared shirt, outdoors with a blurred background.

David 著

生産サービスモニタリングに対する Amazon のアプローチ
このセッションでは、チームがシステムの状態を大まかに評価する方法から、単一のリクエストの詳細を理解するためにズームインする方法まで、Amazon のモニタリングの全範囲について説明します。また、パーセンタイル、メトリクスの次元、ダッシュボード、ログ分析、ディストリビューティッド(分散)トレーシングについて Amazon がどのように考えているかについても学んでください。

Amazon でのオペレーショナルエクセレンス
このセッションでは、Amazon の運用上のプラクティスについて学びます。レトロスペクティブの処理、知識の共有、運用メトリクスの定期的な見直しなど、チームが採用してきた習慣が、どのようにチームをより優れたツールを構築してアーキテクチャの変更を行うために革新するように導いたか。

レジリエントなサーバーレスシステムの大規模な設計と運用
この動画では、モードやオーバーロードの回避、制限された作業の実行、複数レイヤーでのスロットリング、同時実行の防止、等価リクエストの送信、キューイングにおけるバックプレッシャーと公平性の適用、シャッフルシャーディングの実行など、信頼性が高く回復力のあるサービスを構築するために AWS が行っていることを説明します。

ヘルスチェックの実装
フリート全体でフォールスポジティブの意図しない結果は例外として、サーバー障害を自動的に検出して最小限に抑えます。

運用の可視性を高めるために分散システムを装備する
本番システムに対する可視性を実現して、ソフトウェア計測を使い障害をトラブルシューティングします。

負荷制限を使用して過負荷を回避する
過負荷が発生しても予測可能で安定したパフォーマンスを維持するための戦略。

依存関係の分離を使用して、同時実行のオーバーロードを抑制する
依存関係の障害による影響を抑制して、アプリケーション内の関連機能のみに影響するようにします。 

マルチテナントシステムにおける公平性
マルチテナントシステムに公平性を組み込み、予測可能なパフォーマンスと可用性を実現します。

乗り越えられないキューバックログの回避
キューバックログから重要なワークロードを迅速にドレインすることを優先し、バックログを回避する。