基于阿里巴巴多年業務的真實線上故障庫的積累,AHAS故障演練模塊為您預定義了豐富的測試任務,檢驗應用的高可用能力。故障演練支持對部署在阿里云ECS實例、容器服務Kubernetes集群、K8s架構類應用、Java類應用進行故障演練。
完整的故障演練包括以下四個階段:
安裝故障演練探針
對指定機器進行演練,需要在機器上面安裝故障演練探針,探針的作用是下發故障演練執行命令。
創建演練
配置演練基本信息、演練對象和演練全局參數。可同時選擇多個故障類型。
執行演練
將故障注入機器,可通過演練時需曲線、演練參數、演練日志等檢查故障注入的效果是否符合預期。
停止演練
清除故障。當故障演練自動結束、您主動終止或者演練中的任何環節出現異常后,系統都會進入恢復階段,自動清除相應的故障,使故障演練對象恢復演練前的狀態。