日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

增量查詢

Delta Table支持增量寫入和存儲,最重要的一個考慮就是支持增量查詢以及增量計算優化,為此,專門設計開發了新的SQL增量查詢語法來支持近實時增量處理鏈路。

增量查詢的處理過程

增量查詢Delta Table 的處理過程如下圖所示。

image.png

  • 當輸入一個SQL語句后,引擎側會解析用戶指定的版本范圍查詢出來所有符合時間范圍內的DeltaFile,進行合并輸出。

  • Clustering和Compaction操作都會產生新的數據文件,但并沒有增加新的邏輯數據行,只是把原有的記錄進行了組織編排優化,因此新產生的數據文件中的記錄不應該作為新增數據重復輸出,為此,增量查詢做了專門設計優化,會剔除掉這些記錄,也比較貼合用戶使用場景。所以增量查詢不會讀取任何BaseFile,只會讀取指定時間區間內的所有DeltaFile,按照指定的策略進行Merge輸出。

上圖以創建一張事務表(src)為例:

  • schema包含一個pk列和一個val列。

  • 左邊圖展示了數據變化過程,t1-t5代表了事務的時間版本,分別執行了5次數據寫入的事務,生成了5個DeltaFile。

  • 在t2和t4時刻分別執行了COMPACTION操作,生成了兩個BaseFile: b1和b2。

  • 在具體的查詢示例中,例如,begin是t1-1,end是t1,只需讀取t1時間段對應的DeltaFile:d1進行輸出; 如果end是t2,會讀取兩個DeltaFiles:d1和d2;如果begin是t1,end是t2-1,即查詢的時間范圍為(t1, t2),這個時間段是沒有任何增量數據插入的,會返回空行。