集群導(dǎo)入預(yù)檢FAQ
本文介紹在EDAS控制臺(tái)導(dǎo)入Kubernetes集群時(shí)可能遇到的常見(jiàn)問(wèn)題,并提供對(duì)應(yīng)的解決方案。
索引
預(yù)檢項(xiàng)目失敗一定會(huì)導(dǎo)入失敗嗎?
預(yù)檢項(xiàng)目失敗時(shí),可能會(huì)導(dǎo)致集群導(dǎo)入失敗,或?qū)氤晒鬅o(wú)法正常使用。建議查明檢查項(xiàng)目失敗的原因后再進(jìn)行下一步操作。
預(yù)檢項(xiàng)目結(jié)果為告警,需要關(guān)注嗎?
預(yù)檢結(jié)果為告警的項(xiàng)目,只影響特定部分功能。若無(wú)需使用該部分功能,可忽略影響,繼續(xù)導(dǎo)入。
預(yù)檢項(xiàng)目結(jié)果為檢測(cè)中斷,該怎么辦?
表示遇到一些非預(yù)期情況,請(qǐng)加入釘群(釘群號(hào):23197114)咨詢產(chǎn)品技術(shù)專家或新建集群導(dǎo)入。
集群版本檢查不通過(guò),該怎么辦?
如果您使用的是最新版本的K8s集群,EDAS可能還未完成集群適配,此時(shí)會(huì)提示集群版本檢查不通過(guò)。當(dāng)集群版本檢查不通過(guò)時(shí),目前無(wú)法導(dǎo)入集群。建議先使用較低版本的集群,待EDAS完成版本適配后,再將集群更新至較新版本。
集群可用資源檢查異常,該怎么辦?
集群可用資源檢查通過(guò),但提示以下信息
提示信息 | 解決方案 |
Some nodes not ready | 表示當(dāng)前集群存在未就緒的節(jié)點(diǎn)。該情況不影響導(dǎo)入集群操作,但建議在容器服務(wù)管理控制臺(tái)對(duì)該節(jié)點(diǎn)進(jìn)行異常情況排查。 |
集群可用資源檢查不通過(guò),提示以下信息
提示信息 | 解決方案 |
資源Pod余量不足 | 請(qǐng)擴(kuò)容集群節(jié)點(diǎn)。
|
資源Memory Max | 請(qǐng)擴(kuò)容集群節(jié)點(diǎn)。當(dāng)前集群中,至少需要一個(gè)節(jié)點(diǎn)預(yù)留約1.5 GB可用內(nèi)存,用于安裝Prometheus組件。 |
No node available或No node ready | 請(qǐng)擴(kuò)容集群節(jié)點(diǎn)。當(dāng)前集群無(wú)可用Worker節(jié)點(diǎn),請(qǐng)?jiān)?span data-tag="ph" id="ph-1uz-uj4-nik" class="ph">容器服務(wù)管理控制臺(tái)檢查節(jié)點(diǎn)情況并擴(kuò)容有效節(jié)點(diǎn)。 |
資源Memory total余量不足 | 請(qǐng)擴(kuò)容集群節(jié)點(diǎn)。當(dāng)前集群中,所有節(jié)點(diǎn)共需預(yù)留約3 GB可用內(nèi)存,用于安裝EDAS管控組件。 |
資源CPU Max | 請(qǐng)擴(kuò)容集群節(jié)點(diǎn)。當(dāng)前集群中,至少需要一個(gè)節(jié)點(diǎn)預(yù)留約1.5核可用CPU,用于安裝Prometheus組件。 |
資源CPU Total余量不足 | 請(qǐng)擴(kuò)容集群節(jié)點(diǎn)。當(dāng)前集群中,所有節(jié)點(diǎn)一共需要預(yù)留約2核可用CPU,用于安裝EDAS管控組件。 |
集群安全組檢查不通過(guò),該怎么辦?
提示信息 | 解決方案 |
Worker not in Cluster SecurityGroup | 檢查這些ECS實(shí)例是否位于K8s集群安全組中。若不存在,需手動(dòng)添加。 |
安全組規(guī)則禁止Port:6443 | 該配置會(huì)影響彈性組件訪問(wèn)集群API-Server。若需限制6443端口的訪問(wèn),請(qǐng)將集群中edas-oam-system空間下Pod調(diào)度到特定Worker節(jié)點(diǎn)中,并將該節(jié)點(diǎn)加入白名單,以便EDAS組件通過(guò)6443端口訪問(wèn)API-Server。 |
安全組規(guī)則未找到,規(guī)則:XXX | 確認(rèn)是否已手動(dòng)修改集群安全組配置,需評(píng)估該情況下是否影響集群中網(wǎng)絡(luò)的正常訪問(wèn)。若確認(rèn)無(wú)影響,可忽略該檢查項(xiàng)目。 |
集群API-Server SLB檢查不通過(guò),該怎么辦?
提示信息 | 解決方案 |
ApiServerSLB modified | 需檢查當(dāng)前集群API-Server SLB配置是否被修改或刪除。 |
ApiServerSLB inactive | 需檢查當(dāng)前集群API-Server SLB配置是否被修改。 |
集群RAM角色檢查不通過(guò),該怎么辦?
提示信息 | 解決方案 |
RAM檢查失敗,原因是:node: xxx not attached to cluster RamRole: yyy | 需檢查xxx節(jié)點(diǎn)是否關(guān)聯(lián)至集群RamRole中。
|
集群鏡像免密插件檢查告警,該怎么辦?
提示信息 | 解決方案 |
當(dāng)前集群未安裝鏡像免密組件 | 該組件影響使用鏡像倉(cāng)庫(kù)企業(yè)版相關(guān)功能。
|
集群網(wǎng)絡(luò)資源檢查不通過(guò),該怎么辦?
提示信息 | 解決方案 |
Pod CIDR可用IP數(shù)量 | 當(dāng)前集群中的Pod CIDR地址需至少預(yù)留兩個(gè)可用IP,用于接入EDAS管控組件。若無(wú)可用IP,請(qǐng)重新規(guī)劃VPC網(wǎng)絡(luò)。 |
集群CRD資源檢查告警,該怎么辦?
提示信息 | 解決方案 |
Found CRD |
|