開(kāi)源大數(shù)據(jù)平臺(tái)E-MapReduce(簡(jiǎn)稱EMR)的ClickHouse提供了開(kāi)源OLAP分析引擎ClickHouse的云上托管服務(wù)。EMR ClickHouse完全兼容開(kāi)源版本的產(chǎn)品特性,同時(shí)提供集群快速部署、集群管理、擴(kuò)容、縮容和監(jiān)控告警等云上產(chǎn)品功能,并且在開(kāi)源的基礎(chǔ)上優(yōu)化了ClickHouse的讀寫(xiě)性能,提升了ClickHouse與EMR其他組件快速集成的能力。

特性

特性 描述
列式存儲(chǔ) 相較于行式存儲(chǔ),列式存儲(chǔ)在查詢性能上更優(yōu)。同時(shí)列式存儲(chǔ)的數(shù)據(jù)壓縮比更高,更加節(jié)省存儲(chǔ)空間。
MPP架構(gòu)

每個(gè)節(jié)點(diǎn)只訪問(wèn)本地內(nèi)存和存儲(chǔ),節(jié)點(diǎn)信息交互和節(jié)點(diǎn)本身是并行處理的。查詢性能好,易于擴(kuò)展。

向量化引擎:為了高效的使用CPU,數(shù)據(jù)不僅僅按列存儲(chǔ),同時(shí)還按向量(列的一部分)進(jìn)行處理,這樣可以更加高效地使用CPU。

支持SQL ClickHouse支持一種基于SQL的聲明式查詢語(yǔ)言,它在許多情況下與ANSI SQL標(biāo)準(zhǔn)相同。支持GROUP BY、ORDER BY、FROM、JOIN和IN查詢以及非相關(guān)子查詢。
實(shí)時(shí)的數(shù)據(jù)更新 ClickHouse支持在表中定義主鍵。為了使查詢能夠快速在主鍵中進(jìn)行范圍查找,數(shù)據(jù)總是以增量的方式有序的存儲(chǔ)在MergeTree中。

近實(shí)時(shí)數(shù)據(jù)更新, Clickhouse支持近實(shí)時(shí)的數(shù)據(jù)插入、指標(biāo)聚合以及索引創(chuàng)建。

支持索引 按照主鍵對(duì)數(shù)據(jù)進(jìn)行排序,ClickHouse可以在幾十毫秒以內(nèi)完成對(duì)數(shù)據(jù)特定值或范圍的查找。

典型應(yīng)用場(chǎng)景

場(chǎng)景 描述
用戶行為分析 行為分析系統(tǒng)的表可以制作成一張大的寬表,每個(gè)表包含大量的列,可以超過(guò)一千列。JOIN的形式相對(duì)少一點(diǎn),可以實(shí)現(xiàn)路徑分析、漏斗分析和路徑轉(zhuǎn)化等功能。
流量和監(jiān)控 可以將系統(tǒng)和應(yīng)用監(jiān)控指標(biāo)通過(guò)流式計(jì)算引擎Flink或Spark streaming將監(jiān)控?cái)?shù)據(jù)清洗處理以后,實(shí)時(shí)寫(xiě)入ClickHouse,然后結(jié)合Grafana進(jìn)行可視化展示。
用戶畫(huà)像 可以將各種用戶特征進(jìn)行數(shù)據(jù)加工,制作成包含全部用戶的一張或多張用戶特征表,提供靈活的用戶畫(huà)像分析、支撐廣告和圈人等業(yè)務(wù)需求。
實(shí)時(shí)BI報(bào)表 根據(jù)業(yè)務(wù)需求,可以實(shí)時(shí)制作一些及時(shí)產(chǎn)出的查詢靈活的BI報(bào)表,實(shí)現(xiàn)秒級(jí)查詢,絕大多數(shù)查詢能夠?qū)崟r(shí)反饋。BI報(bào)表包括訂單分析、營(yíng)銷效果分析和大促活動(dòng)分析。
說(shuō)明 不合適的場(chǎng)景:
  • 沒(méi)有完整的事務(wù)支持。
  • 缺少高頻率、低延遲的修改或刪除已存在數(shù)據(jù)的能力。
  • 僅能用于批量刪除或修改數(shù)據(jù)。