可能原因
應用監控被暫停。
應用所在pod的探針沒有被正確加載。
解決方案
步驟一:檢查應用監控是否被暫停
登錄ARMS控制臺,在左側導航欄選擇 。
在應用列表頁面頂部選擇目標地域,然后單擊目標應用名稱。
如果未找到目標應用,請參考步驟二繼續排查。
新版控制臺請在上方導航欄選擇
,在探針開關設置區域確認是否暫停應用監控。如果暫停應用監控開關被開啟,請關閉開關,然后單擊保存。
如果暫停應用監控開關保持關閉,請參考步驟二繼續排查。
舊版控制臺請在左側導航欄中單擊應用設置,然后在右側頁面單擊自定義配置頁簽。在Agent開關配置區域確認Agent總開關是否開啟。
如果Agent總開關未開啟,請打開Agent總開關,然后單擊頁面底部的保存。
如果Agent總開關已開啟,請參考步驟二繼續排查。
步驟二:檢查探針是否被正確加載
登錄容器服務管理控制臺,在集群列表頁面,單擊目標集群名稱進入集群詳情頁。
在左側導航欄選擇 。
在容器組頁面頂部選擇您的應用所在的命名空間,然后單擊目標應用右側單擊編輯。
在編輯YAML對話框中查看YAML文件中是否存在initContainers。
在命名空間為ack-onepilot。查看Pod列表中是否存在名稱前綴為ack-onepilot的Pod。 頁面頂部選擇
如果存在,則執行步驟6。
如果不存在,則在應用市場中安裝ack-onepilot。具體操作,請參見如何安裝ack-onepilot和卸載arms-pilot。
在工作負載下的無狀態或有狀態頁面目標應用右側操作列中選擇spec.template.metadata層級下是否存在以下Labels注解。 ,在編輯YAML對話框查看YAML文件中的
labels: armsPilotAutoEnable: "on" armsPilotCreateAppName: "<your-deployment-name>" #請將<your-deployment-name>替換為您的應用名稱。 armsSecAutoEnable: "on" #如果需要接入應用安全,則需要配置此參數。
如果存在,則執行步驟7。
如果不存在,則在編輯YAML對話框中的spec.template.metadata層級下添加以上Labels注解,然后單擊更新。
在
"Message":"STS錯誤"
。 頁面目標應用右側單擊日志,查看ack-onepilot的Pod日志是否報STS錯誤,即提示如果報STS錯誤,則需為應用所在集群授權,并重啟應用所在Pod。具體操作,請參見為容器服務Kubernetes版授權。
如果未報STS錯誤,請提交工單。
在javaagent參數。 頁面目標應用右側單擊編輯,在編輯YAML對話框中查看YAML文件中是否存在以下
-javaagent:/home/admin/.opt/ArmsAgent/aliyun-java-agent.jar
說明如果您使用的探針版本在2.7.3.5以下,請將本文中的aliyun-java-agent.jar替換為arms-bootstrap-1.7.0-SNAPSHOT.jar。建議您盡快將探針升級至最新版本。