David Yanacek
David Yanacek, Senior Principal Engineer
David Yanacek adalah Senior Principal Engineer yang mengerjakan layanan seperti CloudWatch di organisasi Pemantauan & Pengamatan Amazon di AWS. David telah menjadi developer perangkat lunak di Amazon sejak 2006 dan pernah mengerjakan Amazon DynamoDB, AWS Lambda, dan AWS IoT. Dia juga mengerjakan kerangka kerja layanan web internal dan sistem otomatisasi operasi armada. Salah satu kegiatan favorit David di kantor adalah melakukan analisis log dan menelusuri metrik operasional guna menemukan cara untuk membuat sistem berjalan makin lancar dari waktu ke waktu.
Ditulis oleh David
Pendekatan Amazon terhadap pemantauan layanan produksi
Sesi ini membahas keseluruhan spektrum pemantauan di Amazon, mulai dari cara tim menilai kondisi sistem secara menyeluruh hingga cara mereka menganalisis lebih mendalam untuk memahami detail dari satu permintaan. Sesi ini juga mempelajari cara Amazon mempertimbangkan tentang persentil, dimensi metrik, dasbor, analisis log, dan pelacakan terdistribusi.
Keunggulan Operasional di Amazon
Dalam sesi ini, pelajari praktik operasional Amazon. Dampak kebiasaan yang telah diterapkan oleh tim, seperti menyelenggarakan sesi retrospektif, berbagi pengetahuan, dan secara rutin mengevaluasi metrik operasional, mendorong tim untuk berinovasi guna mengembangkan alat yang lebih baik dan melakukan perubahan arsitektur.
Merancang dan mengoperasikan sistem nirserver yang tangguh dalam skala besar
Dalam video ini, kami membahas hal yang dilakukan AWS untuk membangun layanan yang andal dan tangguh, termasuk menghindari mode berbahaya dan kelebihan beban, melakukan pekerjaan terbatas, throttling di beberapa lapisan, menjaga konkurensi, mengirim permintaan indempoten, menerapkan tekanan balik dan keadilan dalam antrean, dan melakukan shuffle sharding.
Menerapkan pemeriksaan kondisi
Mendeteksi dan mengatasi kegagalan server secara otomatis tanpa menimbulkan dampak yang tidak diinginkan akibat hasil positif palsu yang terjadi di seluruh armada.
Menginstrumentasi sistem terdistribusi untuk visibilitas pengoperasian
Memperoleh visibilitas operasional terhadap sistem produksi, serta mengatasi kegagalan menggunakan instrumen perangkat lunak.
Menggunakan pengurangan beban untuk mencegah kelebihan muatan
Strategi untuk menjaga performa yang konsisten dan terprediksi saat terjadi kelebihan muatan.
Menggunakan isolasi dependensi untuk menahan kelebihan beban konkurensi
Membatasi dampak yang disebabkan oleh dependensi yang gagal agar hanya memengaruhi fungsi yang relevan dalam suatu aplikasi.
Keadilan dalam sistem multipenyewa
Membangun keadilan dalam sistem multipenyewa untuk memberikan performa dan ketersediaan yang dapat diprediksi.
Menghindari backlog antrean yang tidak dapat diatasi
Memprioritaskan penyaluran beban kerja penting dari backlog antrean dengan cepat, dan menghindari backlog sejak awal.