為了讓您可以實時掌握云數據庫ClickHouse集群的狀態,幫助您早期問題發現,快速定位故障,性能優化決策,云數據庫ClickHouse提供了豐富的監控項。本文介紹云數據庫ClickHouse集群的監控項以及其具體含義。
ClickHouse集群監控項說明
以下監控項是2021年12月01日之后購買的集群監控項詳情。
2021年12月01日之前購買的集群,監控項詳情,請參見舊版集群監控項說明。
社區版
監控項 | 單位 | 說明 |
磁盤吞吐 | 字節(Byte) | 磁盤讀寫的吞吐量(帶寬)。 |
磁盤IOPS | 次/秒 | 磁盤每秒進行讀寫操作的次數。 |
磁盤使用量 | 字節(Byte) | 磁盤空間的使用量。 |
磁盤使用量-單節點統計 | 字節(Byte) | 磁盤使用量(單節點上所有磁盤使用量總和)。 |
磁盤使用率 | 百分比(%) | 磁盤空間的使用量與最多可使用的磁盤空間容量的比值。 |
磁盤使用率-單節點統計 | 百分比(%) | 磁盤使用率(以節點為單位統計磁盤使用率)。 |
CPU使用率 | 百分比(%) | 集群各節點的平均CPU使用率。 |
inode使用率 | 百分比(%) | inode的使用個數占最多可使用的總個數的比值。 說明 inode是Linux系統中用來標識文件或目錄的。 |
內存使用量 | 字節(Byte) | 集群各節點的內存使用量。 |
內存使用率 | 百分比(%) | 集群各節點的平均內存使用率。 |
Data Part個數 | 個 | 數據分片的總數。 |
Inactive Data Part個數 | 個 | 不活躍的數據分片個數。 |
ZooKeeper CPU使用率 | 百分比(%) | 集群ZooKeeper節點的平均CPU使用率。 |
ZooKeeper 內存使用率 | 百分比(%) | 集群ZooKeeper節點的平均內存使用率。 |
每秒寫入大小 | 字節(Byte) | 集群各節點每秒寫入的數據量。 |
每秒寫入行數 | 行/秒 | 集群各節點每秒寫入的行數。 |
QPS | 個 | 每秒處理的查詢數目。 |
TPS | 個 | 每秒處理的事務數目。 |
網絡吞吐 | 字節(Byte) | 網絡帶寬。 |
TCP連接數 | 個 | 集群的TCP連接個數。 |
HTTP連接數 | 個 | 集群的HTTP連接個數。 |
運行Init Query個數 | 個 | 正在運行的非轉發查詢語句個數。 |
運行Query個數 | 個 | 正在運行的查詢語句個數。 |
失敗Query個數 | 個 | 查詢失敗的語句個數。 |
失敗Insert Query個數 | 個 | 插入失敗的語句個數。 |
延遲Insert個數 | 個 | 延遲的插入語句個數。 |
失敗Select Query個數 | 個 | 查詢失敗的語句個數。 |
運行Merge個數 | 個 | 正在運行的合并任務個數。 |
運行Mutation個數 | 個 | 正在運行的數據訂正任務個數。 |
分布式表臨時文件個數 | 個 | 分布式表臨時文件的個數。 |
MaterializeMySQL個數 | 個 | 使用MaterializeMySQL引擎創建的同步數據庫個數。 |
冷存使用量 | 字節(Byte) | 冷數據的存儲量。 |
MaterializeMySQL同步失敗個數 | 個 | 使用MaterializeMySQL引擎創建的同步數據庫同步失敗個數。 |
Kafka外表消費發生錯誤個數 | 個 | 同步失敗的Kafka外表消費個數。 |
Zookeeper Leader | - | Zookeeper集群的Leader(取值為1的為leader節點)。 |
Kafka外表個數 | 個 | 已創建的Kafka外表個數。 |
節點隊列堆積量 | 個 | 云數據庫ClickHouse節點在Zookeeper上發送隊列的數據包數量。 |
Zookeeper平均時延 | 毫秒 | Zookeeper節點的平均時延。 |
Zookeeper Node數 | 個 | Zookeeper的ZNode數量。 |
Zookeeper TPS | 次/秒 | Zookeeper的TPS。 |
Zxid使用率 | 百分比(%) | Zookeeper的Zxid使用率(Zxid使用率達到100%時會發生重新選主)。 |
企業版
監控項 | 單位 | 監控說明 |
CPU使用率 | 百分比(%) | 集群各節點的平均CPU使用率。 |
CCU | 個 | 集群計算資源的使用量。 |
內存使用量 | 字節(Byte) | 集群各節點的內存使用量。 |
內存使用率 | 百分比(%) | 集群各節點的平均內存使用率。 |
OSS使用量 | 字節(Byte) | 集群存儲資源的使用量。 |
Data Part個數 | 個 | 數據分片的總數。 |
Inactive Data Part個數 | 個 | 不活躍的數據分片個數。 |
Keeper CPU使用率 | 百分比(%) | ClickHouse-Keeper的CPU使用率。 |
Keeper內存使用量 | 字節(Byte) | ClickHouse-Keeper的內存使用量。 |
Keeper內存使用率 | 百分比(%) | ClickHouse-Keeper的內存使用率。 |
每秒寫入大小 | 字節(Byte) | 集群各節點每秒寫入的數據量。 |
每秒寫入行數 | 行/秒 | 集群各節點每秒寫入的行數。 |
網絡吞吐 | 字節(Byte) | 磁盤讀寫的吞吐量(帶寬)。 |
OSS網絡吞吐 | 字節(Byte) | OSS讀寫的吞吐量(帶寬)。 |
OSS IOPS | 次/秒 | OSS每秒進行讀寫操作的次數。 |
TPS | 次/秒 | 每秒處理的事務數目。 |
QPS | 次/秒 | 每秒處理的查詢數目。 |
運行Init Query個數 | 個 | 正在運行的非轉發查詢語句個數。 |
運行Query個數 | 個 | 正在運行的查詢語句個數。 |
失敗Query個數 | 個 | 節點中失敗的Query數量。 |
失敗Insert Query個數 | 個 | 插入失敗的語句個數。 |
延遲Insert個數 | 個 | 延遲的插入語句個數。 |
失敗Select Query個數 | 個 | 節點中失敗的Select Query數量。 |
運行Mutation個數 | 個 | 正在運行的數據訂正任務的數。 |
運行Merge個數 | 個 | 正在運行的合并任務個數。 |
TCP連接數 | 個 | 集群的TCP連接個數。 |
HTTP連接數 | 個 | 集群的HTTP連接個數。 |
舊版集群監控項說明
舊版集群指的是2021年12月01日之前購買的社區版集群。
監控項 | 單位 | 說明 |
CPU使用率 | 百分比(%) | 集群各節點的CPU使用率。 |
內存使用率 | 百分比(%) | 集群各節點的內存使用率。 |
內存使用量 | 字節(Byte) | 集群各節點的內存使用量。 |
磁盤使用比率 | 百分比(%) | 磁盤空間的使用量與最多可使用的磁盤空間容量的比值。 |
磁盤使用量 | 字節(Byte) | 使用中的磁盤空間大小。 |
磁盤IOPS | 次/秒 | 磁盤每秒進行讀寫操作的次數。 |
磁盤IOPS大小 | 字節(Byte) | 磁盤每秒讀寫數據的大小。 |
數據庫連接使用比率 | 百分比(%) | 數據庫使用連接數與規格最大可使用連接數的比值。 |
數據庫使用連接數 | 個 | 數據庫使用中的連接數。 |
TPS | 次/秒 | 每秒處理的事務數目。 |
每秒寫入行數 | 行/秒 | 各節點每秒寫入的行數。 |
每秒寫入大小 | 字節(Byte) | 各節點每秒寫入的大小。 |
QPS | 次/秒 | 每秒處理的查詢數目。 |
ZK的平均等待時長 | 毫秒 | 反映當前ZooKeeper的響應性能。 |
平均IO等待時長 | 毫秒 | 反映當前IO的響應性能。 |
平均CPU等待時長 | 毫秒 | 反映當前CPU的響應性能。 |