AnalyticDB PostgreSQL版采用計(jì)算節(jié)點(diǎn)本地存儲(chǔ)的模式,支持行式存儲(chǔ)和列式存儲(chǔ),支持非易失存儲(chǔ)、固態(tài)硬盤、機(jī)械硬盤等多種存儲(chǔ)介質(zhì),支持單節(jié)點(diǎn)最大10TB存儲(chǔ)空間。在此基礎(chǔ)之上,AnalyticDB PostgreSQL版進(jìn)一步提供了存儲(chǔ)壓縮能力、OSS外表存儲(chǔ)能力和共享存儲(chǔ)格式、存儲(chǔ)分層等能力,滿足用戶在不同場(chǎng)景的需求。

成本

存儲(chǔ)壓縮

AnalyticDB PostgreSQL版列式存儲(chǔ)形態(tài)支持存儲(chǔ)空間壓縮能力。用戶在建表時(shí),針對(duì)AO表和AOCO表可以選擇是否對(duì)數(shù)據(jù)進(jìn)行壓縮。AnalyticDB PostgreSQL的壓縮算法默認(rèn)采用ZSTD壓縮算法,同時(shí)支持LZ4,ZLIB壓縮算法。

AnalyticDB PostgreSQL版的存儲(chǔ)壓縮具備如下特點(diǎn):

  • 存儲(chǔ)空間。壓縮表可以有效節(jié)約存儲(chǔ)空間,如果采用ZSTD壓縮算法,可節(jié)約大約75%存儲(chǔ)空間,即1GB的原始數(shù)據(jù)僅僅需要250MB左右的物理存儲(chǔ)空間。如采用LZ4壓縮算法,可節(jié)約大約60%的存儲(chǔ)空間,即1GB的原始數(shù)據(jù)僅僅需要400MB的物理存儲(chǔ)空間。通過(guò)存儲(chǔ)壓縮可為用戶節(jié)約75% ~ 60%的存儲(chǔ)空間。
  • 查詢性能。存儲(chǔ)壓縮表的數(shù)據(jù)在查詢時(shí)需要進(jìn)行解壓縮,同時(shí)由于所需存儲(chǔ)空間較小、能夠節(jié)約一定的IO帶寬。因此在IO速度較慢時(shí)能夠提高查詢性能(如機(jī)械硬盤場(chǎng)景),反之則對(duì)查詢性能有一定影響。LZ4算法的解壓縮速度約為ZSTD解壓縮速度的三倍,因此對(duì)查詢性能要求高的場(chǎng)景,優(yōu)先采用LZ4算法。

外表存儲(chǔ)

除內(nèi)部存儲(chǔ)外,AnalyticDB PostgreSQL版支持通過(guò)外表方式訪問(wèn)OSS和Hadoop的存儲(chǔ)數(shù)據(jù)。對(duì)象存儲(chǔ)(OSS)是阿里云推出的存儲(chǔ)服務(wù),具備數(shù)據(jù)量大、成本低、安全性高、可靠性高的特點(diǎn),能夠滿足多種場(chǎng)景的存儲(chǔ)需求,存儲(chǔ)成本低至0.12元/GB/月。

AnalyticDB PostgreSQL版支持通過(guò)外表方式對(duì)OSS存儲(chǔ)服務(wù)進(jìn)行訪問(wèn),支持對(duì)OSS的數(shù)據(jù)進(jìn)行分析操作,同時(shí)也支持將數(shù)據(jù)導(dǎo)出到OSS。目前支持的數(shù)據(jù)格式包括ORC、Parquet、CSV、JSON等,支持分區(qū),同時(shí)支持部分過(guò)濾下推操作。此外,支持通過(guò)外表方式訪問(wèn)MaxCompute數(shù)據(jù)。

存儲(chǔ)分層能力

很多分析場(chǎng)景的數(shù)據(jù)具有一定的時(shí)效性,時(shí)間越近的數(shù)據(jù)訪問(wèn)頻率越高、越遠(yuǎn)的數(shù)據(jù)訪問(wèn)頻率越低。AnalyticDB PostgreSQL版能夠根據(jù)需求,自動(dòng)地將部分時(shí)效性較低的數(shù)據(jù)進(jìn)行歸檔、使用OSS等成本更低、訪問(wèn)速度較慢的存儲(chǔ)介質(zhì)替換高成本的本地存儲(chǔ)。例如,用戶可以指定超過(guò)三個(gè)月的數(shù)據(jù)自動(dòng)歸檔至OSS,降低存儲(chǔ)成本。通過(guò)分層存儲(chǔ),AnalyticDB PostgreSQL版能夠在保證查詢性能的同時(shí),降低存儲(chǔ)成本。

共享存儲(chǔ)形態(tài)

數(shù)據(jù)庫(kù)文件存儲(chǔ)(DBFS)是阿里云的一款針對(duì)數(shù)據(jù)庫(kù)場(chǎng)景的云原生共享文件存儲(chǔ)服務(wù),目前AnalyticDB PostgreSQL版已經(jīng)和DBFS深度融合、提供了基于DBFS存儲(chǔ)介質(zhì)的產(chǎn)品形態(tài)。相對(duì)于基于本地存儲(chǔ)的產(chǎn)品形態(tài),基于DBFS的版本通過(guò)存儲(chǔ)本身的高可用性和極致IO性能,實(shí)現(xiàn)了IO加速、多點(diǎn)讀寫、數(shù)據(jù)備份等能力,從而進(jìn)一步降低存儲(chǔ)成本、提升存儲(chǔ)性能和可靠性。