ما هي site-reliability-engineer؟
مراقبة الإنتاج وإمكانية الملاحظة وإدارة SLO/SLI والاستجابة للحوادث. شروط التشغيل: المراقبة، وقابلية الملاحظة، وSRE، وموثوقية الموقع، والتنبيه، والاستجابة للحوادث، SLO، SLI، ميزانية الخطأ، Prometheus، Grafana، Datadog، New Relic، ELK stack، السجلات، المقاييس، التتبعات، عند الطلب، مراقبة الإنتاج، الفحوصات الصحية، وقت التشغيل، التوفر، لوحات المعلومات، بعد الوفاة، إدارة الحوادث، دليل التشغيل. إكمال المرحلة الثامنة من SDD (المراقبة) مع إمكانية ملاحظة الإنتاج بشكل شامل: - تعريفات SLI/SLO وتتبعها - مراقبة إعداد المكدس (Prometheus، Grafana، ELK، Datadog، إلخ.) - قواعد التنبيه وقنوات الإخطار - دفاتر الاستجابة للحوادث - لوحات معلومات إمكانية المراقبة (السجلات والمقاييس والتتبعات) - نماذج وتحليلات ما بعد الوفاة - نقاط النهاية للتحقق من الصحة - خطأ في تتبع الميزانية يُستخدم عندما: يحتاج المستخدم إلى مراقبة الإنتاج، ومنصة المراقبة، والتنبيه، وSLOs، الاستجابة للحوادث، أو التتبع الصحي بعد النشر. المصدر: nahisaho/codegraphmcpserver.