查看監(jiān)控信息
云數(shù)據(jù)庫 SelectDB 版提供了豐富的性能監(jiān)控?cái)?shù)據(jù),方便您查看和掌握集群的運(yùn)行狀態(tài)。監(jiān)控指標(biāo)通過Grafana儀表盤展示,并使用預(yù)設(shè)的PromQL查詢語句。本文介紹如何在控制臺查看集群監(jiān)控信息。
前提條件
已開通應(yīng)用實(shí)時(shí)監(jiān)控服務(wù)ARMS(Application Real-Time Monitoring Service)服務(wù)。具體操作,請參見開通ARMS。
操作步驟
在頁面左上角,選擇實(shí)例所在地域。
在實(shí)例列表頁面,單擊目標(biāo)實(shí)例ID,進(jìn)入到實(shí)例詳情頁面。
在左側(cè)導(dǎo)航欄,單擊監(jiān)控告警。
在監(jiān)控告警頁面,選擇監(jiān)控頁簽。
如果存在多個集群,您可以在監(jiān)控頁簽內(nèi)的左上角單擊cluster選擇不同集群,以查看不同集群的監(jiān)控信息。
說明監(jiān)控指標(biāo)通過Grafana儀表盤展示,并使用預(yù)設(shè)的PromQL查詢語句。在編輯頁面中,您可以修改PromQL以查看不同的監(jiān)控指標(biāo),但是修改后的內(nèi)容不支持保存。
監(jiān)控指標(biāo)看板默認(rèn)展示最近1小時(shí)內(nèi)的集群監(jiān)控信息,您可在頁面右上角選擇時(shí)間自行調(diào)整。
監(jiān)控項(xiàng)
云數(shù)據(jù)庫 SelectDB 版監(jiān)控項(xiàng)分為節(jié)點(diǎn)基礎(chǔ)指標(biāo)和集群請求指標(biāo)兩個維度。
節(jié)點(diǎn)基礎(chǔ)指標(biāo)
集群內(nèi)節(jié)點(diǎn)的基礎(chǔ)指標(biāo),集群以32核為一個節(jié)點(diǎn)步長。例如您的集群配置為64核則會將其分為兩個節(jié)點(diǎn)。
監(jiān)控項(xiàng) | 說明 | 單位 |
CPU使用率 | 所選中集群的所有節(jié)點(diǎn)CPU使用率。如果擴(kuò)容集群或其他資源消耗性操作前,您可以從這個圖表中找到集群使用率最低的時(shí)間。 | % |
內(nèi)存使用率 | 所選中集群的所有節(jié)點(diǎn)內(nèi)存利用率。 | % |
內(nèi)存使用量 | 所選中集群的所有節(jié)點(diǎn)內(nèi)存使用量。如果內(nèi)存使用量持續(xù)較高,您可以考慮對目標(biāo)集群進(jìn)行擴(kuò)容,具體操作請參見集群伸縮。 | MB |
磁盤讀寫次數(shù)(IOPS) | 所選中集群的所有節(jié)點(diǎn)硬盤 I/O 利用情況。每100 GB硬盤緩存可提供約5000 IOPS,如果您需要更的高硬盤讀寫能力,可以考慮拓展更多的硬盤緩存或者集群。 | 次/s |
網(wǎng)絡(luò)流入吞吐量 | 所選中集群的所有節(jié)點(diǎn)每秒通過網(wǎng)絡(luò)寫入的平均速度。 | Byte/s |
網(wǎng)絡(luò)流出吞吐量 | 所選中集群的所有節(jié)點(diǎn)每秒通過網(wǎng)絡(luò)讀取的平均速度。如果網(wǎng)絡(luò)讀的查詢速度較慢,您需要修改緩存設(shè)置,盡量的減少查詢時(shí)的網(wǎng)絡(luò)讀取。 | Byte/s |
集群請求指標(biāo)
云數(shù)據(jù)庫 SelectDB 版集群的請求指標(biāo)以及實(shí)例維度的指標(biāo)。
監(jiān)控項(xiàng) | 說明 | 單位 |
每秒查詢次數(shù)(QPS) | 每秒連接到集群的查詢請求總數(shù)。 | 個 |
查詢成功率 | 所選中集群每分鐘內(nèi)查詢成功的查詢語句占全部查詢的比例。當(dāng)查詢成功率發(fā)生異常下降時(shí),考慮是否出現(xiàn)了集群、節(jié)點(diǎn)的故障。 | % |
查詢平均耗時(shí) | 所選中集群每分鐘內(nèi)所有查詢的平均耗時(shí)。 | ms |
99th 查詢耗時(shí) | 所選中集群給定時(shí)間內(nèi)升序排列排在第99%位置的請求的響應(yīng)時(shí)間;用于反映集群慢查詢的速度。 | ms |
導(dǎo)入數(shù)據(jù)速度 | 所選中集群每秒導(dǎo)入的數(shù)據(jù)記錄條數(shù)。 | Row/s |
數(shù)據(jù)合并 Compaction Score | 所選中集群數(shù)據(jù)文件的合并壓力,Score越大,進(jìn)行合并計(jì)算的壓力越大。大于 2000 后會觸發(fā)寫入反壓,數(shù)據(jù)合并壓力大的表會出現(xiàn)數(shù)據(jù)寫入失敗。 | 無 |
失效節(jié)點(diǎn)數(shù) | 當(dāng)前集群失效節(jié)點(diǎn)的個數(shù)。 | 個 |
緩存命中率 | 緩存讀寫操作占所有讀寫操作的百分比。 | % |
緩存讀寫吞吐量 | 集群各節(jié)點(diǎn)硬盤每秒的讀取/寫入吞吐速率。 | Byte/s |
遠(yuǎn)端存儲讀吞吐量 | 單位時(shí)間內(nèi)讀取遠(yuǎn)端存儲的數(shù)據(jù)量。 | Byte/s |
連接數(shù) | 當(dāng)前實(shí)例的會話數(shù)。 | 個 |
對象存儲容量 | 當(dāng)前實(shí)例數(shù)據(jù)所占用的對象存儲容量。 | Byte |