本文介紹如何針對(duì)資訊聚合類業(yè)務(wù)場(chǎng)景搭建基于云消息隊(duì)列 Kafka 版和實(shí)時(shí)計(jì)算Flink的實(shí)時(shí)數(shù)倉(cāng)。

場(chǎng)景描述

本文首先介紹什么是實(shí)時(shí)數(shù)倉(cāng)以及相關(guān)技術(shù)架構(gòu),接著介紹資訊聚合類業(yè)務(wù)的典型場(chǎng)景及其業(yè)務(wù)目標(biāo),并據(jù)此設(shè)計(jì)了相應(yīng)的技術(shù)架構(gòu)。然后介紹如何部署基礎(chǔ)環(huán)境和搭建實(shí)時(shí)數(shù)倉(cāng),并介紹業(yè)務(wù)系統(tǒng)如何使用實(shí)時(shí)數(shù)倉(cāng)。

解決的問題

  • 通過云消息隊(duì)列 Kafka 版和實(shí)時(shí)計(jì)算Flink實(shí)現(xiàn)實(shí)時(shí)數(shù)據(jù)處理和數(shù)據(jù)流。
  • 通過云消息隊(duì)列 Kafka 版和實(shí)時(shí)計(jì)算Flink實(shí)現(xiàn)實(shí)時(shí)數(shù)據(jù)分析。
  • 通過云消息隊(duì)列 Kafka 版和實(shí)時(shí)計(jì)算Flink實(shí)現(xiàn)事件觸發(fā)。

部署架構(gòu)圖

pg_flink_best_practice

選用的產(chǎn)品

  • 云消息隊(duì)列 Kafka 版

    云消息隊(duì)列 Kafka 版是阿里云基于Apache Kafka構(gòu)建的高吞吐量、高可擴(kuò)展性的分布式消息隊(duì)列服務(wù),廣泛用于日志收集、監(jiān)控?cái)?shù)據(jù)聚合、流式數(shù)據(jù)處理、在線和離線分析等,是大數(shù)據(jù)生態(tài)中不可或缺的產(chǎn)品之一,阿里云提供全托管服務(wù),免部署、免運(yùn)維,更專業(yè)、更可靠、更安全。

    更多關(guān)于云消息隊(duì)列 Kafka 版的介紹,參見云消息隊(duì)列 Kafka 版產(chǎn)品詳情頁(yè)

  • 實(shí)時(shí)計(jì)算

    實(shí)時(shí)計(jì)算(Alibaba Cloud Realtime Compute)是阿里云提供的基于Apache Flink構(gòu)建的企業(yè)級(jí)大數(shù)據(jù)計(jì)算平臺(tái)。在PB級(jí)別的數(shù)據(jù)集上可以支持亞秒級(jí)別的處理延時(shí),賦能用戶標(biāo)準(zhǔn)實(shí)時(shí)數(shù)據(jù)處理流程和行業(yè)解決方案;支持Datastream API作業(yè)開發(fā),提供了批流統(tǒng)一的Flink SQL,簡(jiǎn)化BI場(chǎng)景下的開發(fā);可與用戶已使用的大數(shù)據(jù)組件無(wú)縫對(duì)接,更多增值特性助力企業(yè)實(shí)時(shí)化轉(zhuǎn)型。

    更多關(guān)于實(shí)時(shí)計(jì)算的介紹,參見實(shí)時(shí)計(jì)算產(chǎn)品詳情頁(yè)

  • DataV數(shù)據(jù)可視化

    DataV旨在讓更多的人看到數(shù)據(jù)可視化的魅力,幫助非專業(yè)的工程師通過圖形化的界面輕松搭建專業(yè)水準(zhǔn)的可視化應(yīng)用,滿足您會(huì)議展覽、業(yè)務(wù)監(jiān)控、風(fēng)險(xiǎn)預(yù)警、地理信息分析等多種業(yè)務(wù)的展示需求。

    更多關(guān)于阿里云DataV數(shù)據(jù)可視化的介紹,參見DataV數(shù)據(jù)可視化產(chǎn)品詳情頁(yè)

  • 專有網(wǎng)絡(luò)VPC

    專有網(wǎng)絡(luò)VPC幫助您基于阿里云構(gòu)建出一個(gè)隔離的網(wǎng)絡(luò)環(huán)境,并可以自定義IP地址范圍、網(wǎng)段、路由表和網(wǎng)關(guān)等;此外,也可以通過專線、VPN、GRE等連接方式實(shí)現(xiàn)云上VPC與傳統(tǒng)IDC的互聯(lián),構(gòu)建混合云業(yè)務(wù)。

    更多關(guān)于專有網(wǎng)絡(luò)VPC的介紹,參見專有網(wǎng)絡(luò)VPC產(chǎn)品詳情頁(yè)

  • 云數(shù)據(jù)庫(kù)RDS

    阿里云關(guān)系型數(shù)據(jù)庫(kù)RDS(Relational Database Service)是一種穩(wěn)定可靠、可彈性伸縮的在線數(shù)據(jù)庫(kù)服務(wù)。基于阿里云分布式文件系統(tǒng)和SSD盤高性能存儲(chǔ),RDS支持MySQL、SQL Server、PostgreSQL和MariaDB引擎,并且提供了容災(zāi)、備份、恢復(fù)、監(jiān)控、遷移等方面的全套解決方案,徹底解決數(shù)據(jù)庫(kù)運(yùn)維的煩惱。

    更多關(guān)于云數(shù)據(jù)庫(kù)RDS的介紹,參見云數(shù)據(jù)庫(kù)RDS產(chǎn)品文檔

  • 分析型數(shù)據(jù)庫(kù)MySQL版

    分析型數(shù)據(jù)庫(kù)MySQL版(AnalyticDB for MySQL)是一種高并發(fā)低延時(shí)的PB級(jí)實(shí)時(shí)數(shù)據(jù)倉(cāng)庫(kù),兼容MySQL協(xié)議以及SQL:2003語(yǔ)法標(biāo)準(zhǔn),可以毫秒級(jí)針對(duì)萬(wàn)億級(jí)數(shù)據(jù)進(jìn)行即時(shí)的多維分析透視和業(yè)務(wù)探索。

    更多關(guān)于分析型數(shù)據(jù)庫(kù)MySQL版的介紹,參見分析型數(shù)據(jù)庫(kù)MySQL版產(chǎn)品詳情頁(yè)

  • 對(duì)象存儲(chǔ)OSS

    阿里云對(duì)象存儲(chǔ)OSS(Object Storage Service),是阿里云提供的海量、安全、低成本、高可靠的云存儲(chǔ)服務(wù)。

    更多關(guān)于對(duì)象存儲(chǔ)OSS的介紹,參見對(duì)象存儲(chǔ)OSS產(chǎn)品詳情頁(yè)

詳細(xì)信息

查看最佳實(shí)踐詳情

更多最佳實(shí)踐

查看更多阿里云最佳實(shí)踐