Alluxio是一個面向基于云的數據分析和人工智能的開源的數據編排技術。Alluxio為數據驅動型應用和存儲系統構建了橋梁,將數據從存儲層移動到距離數據驅動型應用更近的位置,從而能夠更容易被訪問, 同時使得應用程序能夠通過一個公共接口連接到許多存儲系統。

背景信息

在大數據生態系統中,Alluxio位于數據驅動框架或應用(例如Apache Spark、Presto、TensorFlow、Apache Flink和Apache Hive等)和各種持久化存儲系統(例如HDFS和阿里云OSS)之間,使得上層的計算應用可以通過統一的客戶端API和全局命名空間訪問包括HDFS和OSS在內的持久化存儲系統。

優勢

  • 提供內存級I/O吞吐率,同時降低具有彈性擴張特性的數據驅動型應用的成本開銷。
  • 簡化云存儲和對象存儲接入。
  • 簡化數據管理,提供對多數據源的單點訪問。
  • 應用程序部署簡易。

Alluxio的詳細信息,請參見Alluxio