国产成人牲交视频在线观着,超碰在线伊人无码可观看,思思热视频精品在线

本文為您介紹EMR Serverless StarRocks的架構(gòu)。

EMR Serverless StarRocks架構(gòu)

EMR Serverless StarRocks的產(chǎn)品架構(gòu)主要由以下三個層次構(gòu)成：

存儲層：
- 存算一體版：StarRocks內(nèi)表使用云盤或本地盤作為數(shù)據(jù)存儲的介質(zhì)，使用StarRocks Table Format存儲格式。
- 存算分離版：StarRocks內(nèi)表使用對象存儲或HDFS等數(shù)據(jù)湖存儲，使用StarRocks Table Format存儲格式。
- 數(shù)據(jù)湖分析版：通過StarRocks外部表，直接讀取數(shù)據(jù)湖（例如對象存儲或HDFS）中的Hive格式或湖格式的數(shù)據(jù)，采用DataLake Table Format。
StarRocks實例：
- 全部實例（包括前端FE，后端BE或CN）都在云端托管，實現(xiàn)免運維。
- 通過計算組（Warehouse）可以進行資源靈活配置及隔離。
- 通過彈性能力可以確保低成本的資源使用，降低資源成本。
- 通過緩存機制能顯著提升存算分離或數(shù)據(jù)湖分析的查詢速度，同時，產(chǎn)品自帶的StarRocks緩存管理功能進一步助力您高效地進行緩存調(diào)優(yōu)。
產(chǎn)品能力：
- 實例運維：提供無需運維的實例管理功能，包括資源與配置管理、告警、健康報告和自動升級等，提升運維效率與系統(tǒng)穩(wěn)定性。
- 數(shù)據(jù)運維：提供即開即用的數(shù)據(jù)管理能力，例如可視化SQL編輯器、導(dǎo)入任務(wù)、慢查詢、數(shù)據(jù)審計、元數(shù)據(jù)管理以及權(quán)限配置等能力。
  基于以上產(chǎn)品能力，您可以更加高效地聚焦于自己的業(yè)務(wù)應(yīng)用，例如運營分析、用戶畫像、自助報表、訂單分析以及用戶報表生成等方面。

StarRocks系統(tǒng)架構(gòu)

StarRocks架構(gòu)的核心只有FE（Frontend）、BE（Backend）或CN（Compute Node）節(jié)點，方便部署與維護。節(jié)點可以在線水平擴展，元數(shù)據(jù)和業(yè)務(wù)數(shù)據(jù)都有副本機制，確保整個系統(tǒng)無單點。StarRocks提供MySQL協(xié)議接口，支持標準的SQL語法，您可以通過MySQL客戶端方便地查詢和分析StarRocks中的數(shù)據(jù)。

隨著StarRocks產(chǎn)品的發(fā)展，系統(tǒng)架構(gòu)從存算一體（shared-nothing）進化到存算分離（shared-data）。

在3.0版本更新前，StarRocks采用存算一體架構(gòu)，其中BE節(jié)點負擔(dān)著數(shù)據(jù)的存儲和計算任務(wù)，所有數(shù)據(jù)訪問和分析操作都直接在本地節(jié)點完成，以確保快速響應(yīng)的查詢性能。

自3.0版本起，StarRocks開始采納存算分離架構(gòu)，轉(zhuǎn)變了數(shù)據(jù)存儲的方式。原有的BE節(jié)點得到升級改造成為無狀態(tài)的計算節(jié)點（CN），并將數(shù)據(jù)持久化存儲遷移至遠端對象存儲服務(wù)或HDFS。在這一新架構(gòu)下，CN節(jié)點的本地磁盤主要用于緩存經(jīng)常訪問的熱數(shù)據(jù)，進而提高查詢處理的速度。存算分離架構(gòu)的優(yōu)勢在于支持計算節(jié)點的動態(tài)添加或刪除，實現(xiàn)了更靈活高效的擴縮容功能。

如下圖所示，是從存算一體向存算分離架構(gòu)演進的形象展示。

說明

本文部分內(nèi)容和圖片來源于社區(qū)StarRocks的系統(tǒng)架構(gòu)。

存算一體

StarRocks 3.0版之前采用的是存算一體（shared-nothing）架構(gòu)，這是其作為MPP數(shù)據(jù)庫的顯著特點。在這種架構(gòu)中，BE節(jié)點負責(zé)數(shù)據(jù)的存儲與計算。在查詢時可以直接讀取本地數(shù)據(jù)進行計算，極大地提升了查詢的速度，有效避免了數(shù)據(jù)傳輸和拷貝的延遲。此外，存算一體支持多副本數(shù)據(jù)存儲，提高了并發(fā)查詢能力和數(shù)據(jù)的可靠性，非常適合對查詢性能要求極高的場景。

在StarRocks的存算一體架構(gòu)中，系統(tǒng)主要由前端節(jié)點（FE）和后端節(jié)點（BE）兩種類型的節(jié)點構(gòu)成。

FE

FE負責(zé)管理元數(shù)據(jù)、管理客戶端連接、查詢規(guī)劃和調(diào)度等工作，并在每個節(jié)點的內(nèi)存中保存一份完整的元數(shù)據(jù)副本，以確保服務(wù)的一致性。

角色	元數(shù)據(jù)讀寫	Leader選舉	說明
Leader	讀寫	自動選舉	Leader FE在對元數(shù)據(jù)進行讀寫操作后，通過BDB JE (Berkeley DB Java Edition) 同步變更至Follower和Observer。Leader由Follower節(jié)點中選舉產(chǎn)生，如果Leader失敗，其他Follower將進行新一輪選舉。
Follower	只讀	參與	Follower只有元數(shù)據(jù)的讀取權(quán)限，并通過Leader的元數(shù)據(jù)日志來異步同步數(shù)據(jù)。Follower節(jié)點也參與Leader的選舉，選舉過程基于BDB JE協(xié)議，并要求超過半數(shù)的Follower節(jié)點正常運行。
Observer	只讀	不參與	Observer節(jié)點與Follower具有相同的讀取權(quán)限，并進行異步數(shù)據(jù)同步，但不參與Leader選舉。Observer的主要目的是增強集群的查詢并發(fā)能力，并不給集群選舉帶來額外負擔(dān)。

BE

BE負責(zé)SQL計算和數(shù)據(jù)存儲的任務(wù)，采用本地存儲和多副本機制以提高系統(tǒng)的可用性。

數(shù)據(jù)存儲： BE節(jié)點在存儲方面完全均等，沒有主次之分。數(shù)據(jù)由前端節(jié)點（FE）根據(jù)特定政策分配到各個BE節(jié)點，其中BE節(jié)點負責(zé)將接收的數(shù)據(jù)轉(zhuǎn)換成可存儲的格式并創(chuàng)建相應(yīng)的索引。
SQL計算：對于SQL查詢的處理，BE節(jié)點首先將SQL語句按照語義規(guī)劃成邏輯執(zhí)行單元，然后再根據(jù)數(shù)據(jù)的分布情況拆分成具體的物理執(zhí)行單元。這些物理執(zhí)行單元直接在指定的BE節(jié)點上執(zhí)行，實現(xiàn)了數(shù)據(jù)計算的本地化，避免了不必要的數(shù)據(jù)傳輸和復(fù)制，從而極大的提升了查詢性能。

盡管存算一體架構(gòu)在查詢性能上具有顯著優(yōu)勢，但也存在一些局限性：

成本高：為了確保數(shù)據(jù)的可靠性，BE節(jié)點必須使用多副本，特別是三副本機制，這隨著數(shù)據(jù)量的增加會導(dǎo)致存儲資源的持續(xù)擴充，可能會造成計算資源的浪費。
架構(gòu)復(fù)雜：多副本的維護要求高一致性，這使得存算一體架構(gòu)變得更加復(fù)雜，提高了管理和維護的難度。
彈性不足：在存算一體模式下，擴縮容往往伴隨著數(shù)據(jù)重新平衡的過程，可能會影響彈性使用體驗。

存算分離

StarRocks存算分離架構(gòu)是在存算一體的基礎(chǔ)上將計算和存儲進行解耦。在這種模式中，數(shù)據(jù)持久化存儲轉(zhuǎn)移到了成本更優(yōu)化且可靠性更高的遠程對象存儲（例如OSS）或HDFS上。計算節(jié)點（CN）所在的本地磁盤主要用作緩存，以加速對高頻訪問數(shù)據(jù)的查詢。當本地緩存得到命中時，存算分離模式能夠提供與存算一體相當?shù)牟樵兯俣取?/p>

存算分離模式下，您可以動態(tài)地添加或移除計算節(jié)點，實現(xiàn)秒級別的擴縮容，有效降低了數(shù)據(jù)存儲與資源擴展的成本，并促進資源隔離及計算資源的彈性伸縮。此模式類似于存算一體，整個系統(tǒng)依舊由前端（FE）和計算節(jié)點（CN）兩種服務(wù)進程構(gòu)成，需要您額外配置的僅是后端的對象存儲。

在StarRocks存算分離架構(gòu)中，F(xiàn)E節(jié)點的角功能保持不變，而BE節(jié)點轉(zhuǎn)變?yōu)闊o狀態(tài)的CN節(jié)點，其僅緩存熱數(shù)據(jù)，負責(zé)數(shù)據(jù)導(dǎo)入、查詢計算和緩存數(shù)據(jù)管理等任務(wù)。

存儲

StarRocks的存算分離技術(shù)目前支持以下后端存儲解決方案，您可以根據(jù)需求靈活選擇：

阿里云OSS對象存儲。
HDFS，包括自建Hadoop或阿里云EMR DataLake集群。

在數(shù)據(jù)格式方面，StarRocks存算分離的數(shù)據(jù)文件與存算一體保持一致，并支持各種索引技術(shù)，其中元數(shù)據(jù)（例如TabletMeta）經(jīng)過重新設(shè)計以更好地適應(yīng)對象存儲環(huán)境。

緩存

為了優(yōu)化查詢性能，StarRocks構(gòu)建了層級分明的數(shù)據(jù)緩存體系。熱數(shù)據(jù)存放在內(nèi)存，確保快速可達；次熱數(shù)據(jù)則存放在本地磁盤；而冷數(shù)據(jù)則位于遠端的對象存儲中。數(shù)據(jù)會根據(jù)訪問頻率在這三個層次中流轉(zhuǎn)。

在查詢操作中，通常來說熱數(shù)據(jù)會直接從緩存中獲取，冷數(shù)據(jù)需要從后端對象存儲中讀取并緩存至本地，以便加快后序訪問速度。通過內(nèi)存、本地磁盤及遠程存儲的聯(lián)合，StarRocks構(gòu)建了多層數(shù)據(jù)訪問體系，您可以自定義數(shù)據(jù)冷熱規(guī)則以優(yōu)化業(yè)務(wù)需求，實現(xiàn)了高效計算與成本可控的存儲。

您在建立表時可以選擇是否開啟緩存。開啟緩存后，數(shù)據(jù)將在寫入過程中同時存放到本地磁盤以及后端對象存儲中。在查詢時，CN節(jié)點會優(yōu)先讀取本地磁盤中的數(shù)據(jù)，若本地緩存未命中，則從后端對象存儲獲取原始數(shù)據(jù)，并將其緩存至本地磁盤，以優(yōu)化后續(xù)的訪問速度。對于未緩存的冷數(shù)據(jù)，StarRocks還針對性地進行了優(yōu)化，結(jié)合應(yīng)用的訪問模式，通過預(yù)讀技術(shù)和并行掃描等策略，降低了對遠端對象存儲訪問的頻率，進一步提升了查詢效率。

日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

EMR Serverless StarRocks架構(gòu)

StarRocks系統(tǒng)架構(gòu)

存算一體

FE

BE

存算分離

存儲

緩存