本文將向您介紹云數據庫ClickHouse產品中涉及的一些基本名詞概念,以便于您更好地理解云數據庫ClickHouse產品。
地域(Region)
購買云數據庫ClickHouse的服務器所處地理位置。您需要在購買云數據庫ClickHouse服務時指定Region,Region一旦指定后就不允許更改。
可用區(Zone)
同一地域下,電力、網絡隔離的物理區域,可用區之間內網互通,可用區內網絡延時更小。
ClickHouse集群(Cluster)
在物理構成上,ClickHouse集群是由多個ClickHouse Server實例組成的分布式數據庫。這些ClickHouse Server根據購買規格的不同而可能包含1個或多個副本(Replica)、1個或多個分片(Shard)。在邏輯構成上,一個ClickHouse集群可以包含多個數據庫(Database)對象。
副本配置(Edition)
ClickHouse集群包含如下副本。
雙副本版:每個節點包含兩個副本,某個副本服務不可用的時候,同一分片的另一個副本還可以繼續服務。
單副本版:每個節點只有1個副本,該副本服務不可用時,會導致整個集群不可用,需要等待此副本完全恢復服務狀態,集群才能繼續提供穩定服務。
雙副本版的資源以及對應的購買成本都是單副本版的2倍。
由于底層云盤提供高可靠保證,即便是單副本版也能確保數據不會丟失。
分片(Shard)
在超大規模海量數據處理場景下,單臺服務器的存儲、計算資源會成為瓶頸。為了進一步提高效率,云數據庫ClickHouse將海量數據分散存儲到多臺服務器上,每臺服務器只存儲和處理海量數據的一部分,在這種架構下,每臺服務器被稱為一個分片(Shard)。
副本(Replica)
為了在異常情況下保證數據的安全性和服務的高可用性,云數據庫ClickHouse提供了副本機制,將單臺服務器的數據冗余存儲在2臺或多臺服務器上。
數據庫(Database)
數據庫是云數據庫ClickHouse集群中的最高級別對象,內部包含表(Table)、列(Column)、視圖(View)、函數、數據類型等。
表(Table)
表是數據的組織形式,由多行、多列構成。
云數據庫ClickHouse的表從數據分布上,可以分為本地表和分布式表兩種類型。
類型 | 說明 | 區別 |
本地表(Local Table) | 數據只會存儲在當前寫入的節點上,不會被分散到多臺服務器上。 |
|
分布式表(Distributed Table) | 本地表的集合,它將多個本地表抽象為一張統一的表,對外提供寫入、查詢功能。當寫入分布式表時,數據會被自動分發到集合中的各個本地表中;當查詢分布式表時,集合中的各個本地表都會被分別查詢,并且把最終結果匯總后返回。 |
云數據庫ClickHouse的表從存儲引擎上,可以分為單機表、復制表兩種類型。
類型 | 說明 | 區別 |
單機表(Non-Replicated Table) | 數據只會存儲在當前服務器上,不會被復制到其他服務器,即只有一個副本。 |
|
復制表(Replicated Table) | 數據會被自動復制到多臺服務器上,形成多個副本。 |
ClickHouse集群
ClickHouse集群包含若干單位計算資源和存儲資源,能夠提供ClickHouse引擎數據存儲和分析服務的PAAS服務。
Worker節點
Worker節點是ClickHouse集群內部的副本節點,參與引擎計算的實際資源。
CCU
CCU(ClickHouse Compute Unit)是ClickHouse集群計算資源的計量和計費單位,1 CCU對應資源為1 Vcpu 4 GiB。標準計費單位:CCU/分鐘。
計算資源自動彈性
計算資源自動彈性(Autoscaling)是計算資源按照CCU粒度進行資源彈性擴展,根據Mem的使用情況進行自動的CCU擴展。
彈性資源設置區間
彈性資源設置區間是用戶設置CCU使用區間,彈性擴縮必須保持在用戶設置的資源區間內,不能小于最小值且不能大于最大值。
存儲資源
存儲資源是企業版本采用的共享存儲方案,按需付費。