為了提升集群的穩定性,建議您將ACK NPD(ack-node-problem-detector)組件升級到1.2.8版本以上。
背景信息
低于v1.2.8版本的ack-node-problem-detector組件會默認開啟文件系統句柄巡檢項(check_fd),check_fd的進程在讀取大內核數據時,會觸發部分操作系統內核版本缺陷,可能會造成僵尸進程堆積、甚至宕機的風險。
升級組件
為避免低版本組件可能導致的問題,滿足內核版本條件的集群,請升級ack-node-problem-detector組件至1.2.8版本以上,即可默認停止文件系統句柄巡檢項(check_fd),避免讀取大內核數據。ack-node-problem-detector組件升級信息,請參見ack-node-problem-detector。
修復內核缺陷。更多信息,請參見Alibaba Cloud Linux 2系統的ECS實例中Page Fault異常導致系統宕機 。
登錄容器服務管理控制臺,在左側導航欄選擇集群。
在集群列表頁面,單擊目標集群名稱,然后在左側導航欄,選擇 。
在組件管理頁面的日志與監控頁簽下,單擊ack-node-problem-detector右下方的升級。
說明若ack-node-problem-detector面板上無升級按鈕,說明當前組件已是最新版本,無需升級。
在彈出提示框中,單擊確定。
文檔內容是否對您有幫助?