混沌工程

是什麼

混沌工程或 CE,是在正式環境中對分散式系統進行實驗的專業,以建立對系統在承受混亂和意外情況下時能力的信心。

解決的問題

SREDevOps 實踐注重提高產品的彈性和可靠性技術。 系統在故障容錯時確保有足夠服務品質的能力通常是軟體開發的要求。有幾個方面可能導致應用程式發生故障,例如基礎設施、平台或(基於微服務的)應用程式的其他部分。 在正式環境中高頻率部署新功能會增加導致停機和嚴重事件發生的可能性,這對業務會產生重大影響。

如何幫助我們

混沌工程是一種滿足彈性需求的技術。它用於達成對基礎設施、平台和應用程序故障容錯。 混沌工程師使用混沌實驗來主動注入隨機故障,以驗證應用程序、基礎設施或平台是否能夠自我修復,並且故障不會明顯影響客戶。 混沌實驗旨在發現盲點(例如監控或自動擴展技術),並在嚴重事件期間提升團隊之間的溝通。 這種方法有助於提高系統的彈性和團隊對複雜系統的信心,尤其是正式環境。