ECS選型最佳實(shí)踐
購買ECS實(shí)例之前,您需要結(jié)合性能、價(jià)格、工作負(fù)載等因素,做出性價(jià)比與穩(wěn)定性最優(yōu)的決策。本文主要介紹如何結(jié)合實(shí)際業(yè)務(wù)場景選購阿里云云服務(wù)器ECS。
了解實(shí)例規(guī)格族
實(shí)例規(guī)格清單:實(shí)例規(guī)格族。
實(shí)例規(guī)格族分類說明:
企業(yè)級?共享型?彈性裸金屬服務(wù)器?高性能計(jì)算?異構(gòu)計(jì)算?
企業(yè)級實(shí)例是阿里云2016年9月開始推出的一系列實(shí)例規(guī)格族的總稱,具有高性能、穩(wěn)定計(jì)算能力和平衡網(wǎng)絡(luò)性能的特點(diǎn)。因?yàn)榫哂歇?dú)享且穩(wěn)定的計(jì)算、存儲、網(wǎng)絡(luò)資源,這些實(shí)例規(guī)格族非常適合對業(yè)務(wù)穩(wěn)定性具有高要求的企業(yè)場景。
共享型實(shí)例是一系列面向一般中小網(wǎng)站或個(gè)人開發(fā)者的實(shí)例規(guī)格(族)總稱。與企業(yè)級實(shí)例相比,共享型實(shí)例在資源利用上更多強(qiáng)調(diào)資源性能的共享,所以無法保證實(shí)例計(jì)算性能的穩(wěn)定,但成本相對來說也更低。
彈性裸金屬服務(wù)器融合了物理機(jī)與云服務(wù)器的優(yōu)勢,實(shí)現(xiàn)超強(qiáng)、超穩(wěn)的計(jì)算能力。通過阿里云自主研發(fā)的虛擬化2.0技術(shù),您的業(yè)務(wù)應(yīng)用可以直接訪問彈性裸金屬服務(wù)器的處理器和內(nèi)存,無任何虛擬化開銷。彈性裸金屬服務(wù)器具備物理機(jī)級別的完整處理器特性(例如Intel VT-x),以及物理機(jī)級別的資源隔離優(yōu)勢,特別適合上云部署傳統(tǒng)非虛擬化場景的應(yīng)用。
高性能計(jì)算將計(jì)算能力積聚,用并行計(jì)算方式解決更大規(guī)模的科學(xué)、工程和商業(yè)問題。
異構(gòu)計(jì)算(Heterogeneous Computing)是指使用不同類型指令集和體系架構(gòu)的計(jì)算單元組成系統(tǒng)的計(jì)算方式,能夠讓最適合的專用硬件去服務(wù)最適合的業(yè)務(wù)場景,在特定場景下,異構(gòu)計(jì)算產(chǎn)品比普通的云服務(wù)器高出一個(gè)甚至更多數(shù)量級的性價(jià)比和效率。
實(shí)例規(guī)格命名規(guī)則
實(shí)例規(guī)格族名稱格式為ecs.<規(guī)格族>,實(shí)例規(guī)格名稱為ecs.<規(guī)格族>.<nx>large。具體命名規(guī)則說明如下所示:
ecs:云服務(wù)器ECS的產(chǎn)品代號。
<規(guī)格族>:由規(guī)格族主體+規(guī)格族后綴組成。
說明以下示例僅展示實(shí)例規(guī)格族的部分常見規(guī)格的名稱含義。
x86計(jì)算規(guī)格族和ARM計(jì)算規(guī)格族
命名組成
說明
命名示例含義
規(guī)格族主體
由小寫字母+數(shù)字組成。
小寫字母:為某個(gè)單詞的縮寫,標(biāo)志著實(shí)例規(guī)格族的性能領(lǐng)域。
數(shù)字:一般用于區(qū)分同類型規(guī)格族間的發(fā)布時(shí)間。
更大的數(shù)字代表新一代規(guī)格族,擁有更高的性價(jià)比,價(jià)格低、性能好。
c:表示計(jì)算型(computational)
處理器與內(nèi)存配比為1:2,適用于數(shù)據(jù)庫、Web服務(wù)器、高性能科學(xué)和工程應(yīng)用、游戲服務(wù)器、數(shù)據(jù)分析、批量計(jì)算、視頻編碼、機(jī)器學(xué)習(xí)等場景。
g:表示通用型(general)
處理器與內(nèi)存配比為1:4,適用于通用互聯(lián)網(wǎng)應(yīng)用、數(shù)據(jù)庫、Web網(wǎng)站、Java應(yīng)用服務(wù)、游戲服務(wù)、搜索推廣、安全可信計(jì)算等場景。
u:表示通用算力型(universal)
處理器與內(nèi)存配比為1:1、1:2、1:4、1:8,適用于對價(jià)格敏感的企業(yè)級客戶,主要應(yīng)用于中小型和大型企業(yè)級應(yīng)用、網(wǎng)站和應(yīng)用服務(wù)器,中小型數(shù)據(jù)庫系統(tǒng)、緩存、搜索集群等場景。
r:表示內(nèi)存型(ram)
處理器與內(nèi)存配比為1:8(部分規(guī)格不為1:8),適用于內(nèi)存數(shù)據(jù)庫、數(shù)據(jù)分析與挖掘、分布式內(nèi)存緩存(Redis)、大數(shù)據(jù)類應(yīng)用(Kafka、ElasticSearch等),以及對內(nèi)存容量要求較高的通用企業(yè)級應(yīng)用(Java)等場景。
re:表示內(nèi)存增強(qiáng)型(ram enhanced)
hf(c/g/r):表示高主頻型(high frequency)
處理器與內(nèi)存配比為1:2、1:4、1:8,適用于大型多人在線游戲、HPC等高性能科學(xué)計(jì)算場景,以及中大型數(shù)據(jù)庫系統(tǒng)等。
i:表示本地SSD型(instance family with local SSDs)
處理器與內(nèi)存配比為1:4、1:8,適用于OLTP、高性能關(guān)系型數(shù)據(jù)庫、NoSQL數(shù)據(jù)庫(例如Cassandra、MongoDB等)、Elasticsearch等搜索場景以及EMR大數(shù)據(jù)存算分離場景。
d:表示大數(shù)據(jù)型(big data)
處理器與內(nèi)存配比為1:4,適用于Hadoop MapReduce、HDFS、Hive、HBase等大數(shù)據(jù)計(jì)算和存儲業(yè)務(wù)場景,以及Elasticsearch、Kafka等搜索和日志數(shù)據(jù)處理場景。
s:表示共享型(share)
t:表示突發(fā)型(burst)
e:表示經(jīng)濟(jì)型(economy)
例如,ecs.g6.2xlarge表示通用型g6規(guī)格族中的一個(gè)實(shí)例規(guī)格,擁有8個(gè)vCPU核。相比于g5規(guī)格族,g6為新一代通用型實(shí)例規(guī)格族。
規(guī)格族后綴
由小寫字母組成。
y:表示采用阿里云自研倚天710 ARM架構(gòu)CPU(Yitian)
a:表示采用AMD CPU
ae:表示AMD增強(qiáng)型(AMD enhanced)
i:表示采用intel CPU
h:表示采用海光處理器
re:表示RDMA增強(qiáng)型(RDMA enhanced)
se:表示存儲增強(qiáng)型(storage enhanced)
ne:表示網(wǎng)絡(luò)增強(qiáng)型(network enhanced)
t:表示安全增強(qiáng)型(tpm)
p:表示持久內(nèi)存型(persistent ram)
異構(gòu)計(jì)算規(guī)格族、彈性裸金屬服務(wù)器、超級計(jì)算集群(SCC)實(shí)例規(guī)格族
異構(gòu)計(jì)算規(guī)格族、彈性裸金屬服務(wù)器和超級計(jì)算集群(SCC)實(shí)例規(guī)格族一般采用自主命名方式,由小寫字母和數(shù)字混合組成。
命名組成
說明
命名示例含義
規(guī)格族主體
由小寫字母組成。
gn:表示搭載NVIDIA GPU的計(jì)算型實(shí)例
vgn:表示采用NVIDIA GRID vGPU加速的獨(dú)享型實(shí)例
sgn:表示采用NVIDIA GRID vGPU加速的共享型實(shí)例
gi:表示搭載Intel GPU的計(jì)算型實(shí)例
f:表示FPGA計(jì)算型實(shí)例
ebm(c/g/r/gn/hf):表示彈性裸金屬服務(wù)器(elastic bare metal)
scc(c/g/h/gn/hf):表示超級計(jì)算集群(super computing cluster)
規(guī)格族后綴
由數(shù)字或小寫字母+數(shù)字組成。
6v:6表示采用Volta/Turing架構(gòu);v表示GPU類型為V100且GPU顯存為16 GB。
例如,gn6v表示采用Volta/Turing架構(gòu),顯存為16 GB,且搭載NVIDIA V100 GPU的計(jì)算型實(shí)例。
6e:6表示采用Volta/Turing架構(gòu);e(extend)表示第2代GPU類型為V100且顯存為32 GB。
例如,gn6e表示采用Volta/Turing架構(gòu),顯存為32 GB,且搭載NVIDIA V100 GPU的計(jì)算型實(shí)例。
6i:6表示采用Volta/Turing架構(gòu);i(inference)表示GPU類型為T4。
例如,gn6i表示采用Volta/Turing架構(gòu)且搭載NVIDIA的T4 GPU計(jì)算型實(shí)例。
6s:6表示采用Volta/Turing架構(gòu);s表示第6代SG-1。
例如,ebmgi6s表示采用Intel?Server GPU卡和第6代SG-1芯片的視覺計(jì)算型實(shí)例。
7:表示采用Ampere架構(gòu)。
7i:7表示采用Ampere架構(gòu);i(inference)表示GPU類型為A10且顯存為24 GB。
7e:7表示采用Ampere架構(gòu)。
7s:7表示采用Ampere架構(gòu);s表示用于第7代A30 GPU。
<nx>large:large表示vCPU核數(shù),<nx>中的n越大,表示vCPU核數(shù)越多。其中,xlarge代表4核,2xlarge代表8核,3xlarge代表12核等等,以此類推。
支持變配的實(shí)例規(guī)格:請參見支持變配的實(shí)例規(guī)格。
查看實(shí)例可購買地域:各個(gè)地域下可供售賣的實(shí)例規(guī)格可能存在差異,實(shí)例的可購情況,您可以前往ECS實(shí)例可購買地域查看。
實(shí)例適用場景
企業(yè)級實(shí)例
異構(gòu)計(jì)算實(shí)例
根據(jù)預(yù)裝軟件選型
根據(jù)您使用的應(yīng)用,并參考選型原則,選擇對應(yīng)的實(shí)例規(guī)格族。
應(yīng)用類型 | 常用應(yīng)用 | 選型原則 | 推薦實(shí)例規(guī)格族 |
負(fù)載均衡 | Nginx | 應(yīng)用特點(diǎn):需要支持高頻率的新建連接操作。
| c8i、c7、c7nex、g5ne |
RPC產(chǎn)品 |
| 應(yīng)用特點(diǎn):網(wǎng)絡(luò)鏈接密集型;進(jìn)程運(yùn)行時(shí)需要消耗較高的內(nèi)存。 | g8a、g7nex、g8i、g7 |
緩存 |
|
| r8i、r8a、r7、r7a |
配置中心 | ZooKeeper | 在應(yīng)用啟動協(xié)商時(shí)會有大量I/O讀寫操作。
| c8a、c7、c8i、u1 |
消息隊(duì)列 |
| 從消息完整性方面考慮,存儲優(yōu)先選用云盤。
| c8a、c7、c8i、u1 |
容器編排 | Kubernetes | 通過彈性裸金屬服務(wù)器和容器的組合,可以最大限度地挖掘計(jì)算潛能。 | ebmc6e、ebmg6e、ebmc6、ebmg6、ebmc6a、ebmc7a、ebmg6a、ebmg7a系列 |
大表存儲 | HBase |
| d3c、d3s、i4 |
數(shù)據(jù)庫 |
|
| g8a、g7、g8i、i4, |
SQLServer |
| g8a、g7、r7、r8i、g8i | |
文本搜索 | Elasticsearch |
| i4、i4r、i3、i2 |
實(shí)時(shí)計(jì)算 |
| 基于存儲量可以選擇ECS通用規(guī)格和云盤,也可以選擇d系列。 | i4g、i4、d3c |
離線計(jì)算 |
| 優(yōu)先選擇d系列。 | d3s、d3c |
視頻轉(zhuǎn)碼 |
|
| c8y、hfc8i |
大數(shù)據(jù) |
|
| g8y、r8y |
根據(jù)細(xì)分業(yè)務(wù)場景選型
通用應(yīng)用、游戲服務(wù)、視頻直播場景推薦
在該類場景中,性能需求表現(xiàn)為CPU計(jì)算密集型,您需要相對均衡的處理器與內(nèi)存資源配比,通常選用CPU與內(nèi)存配比1:2、系統(tǒng)盤選用高效云盤、數(shù)據(jù)盤選用SSD云盤或者ESSD云盤。如果業(yè)務(wù)需要更強(qiáng)的網(wǎng)絡(luò)性能,如視頻彈幕等,您可以選用同系列中更高規(guī)格的實(shí)例規(guī)格,提高網(wǎng)絡(luò)收發(fā)包能力(PPS)。
場景分類 | 場景細(xì)分 | 推薦規(guī)格族 | 性能需求 | 處理器與內(nèi)存比 |
通用應(yīng)用 | 均衡性能應(yīng)用,后臺應(yīng)用 | g系列,如g7 | 中主頻,計(jì)算密集型 | 1:4 |
高網(wǎng)絡(luò)收發(fā)包應(yīng)用 | g系列,如g7 | 高網(wǎng)絡(luò)PPS,計(jì)算密集型 | 1:4 | |
高性能計(jì)算 | hfc系列,如hfc7 | 高主頻,計(jì)算密集型 | 1:2 | |
游戲應(yīng)用 | 高性能端游 | hfc系列,如hfc7 | 高主頻 | 1:2 |
手游、頁游 | g系列,如g6e | 中主頻 | 1:4 | |
視頻直播 | 視頻轉(zhuǎn)發(fā) | g系列,如g7 | 中主頻,計(jì)算密集型 | 1:4 |
直播彈幕 | g系列,如g7 | 高網(wǎng)絡(luò)PPS,計(jì)算密集型 | 1:4 |
Hadoop、Spark、Kafka大數(shù)據(jù)場景推薦
在該類場景中,由于涉及不同的節(jié)點(diǎn),性能需求表現(xiàn)較為復(fù)雜,您需要均衡各個(gè)節(jié)點(diǎn)的性能表現(xiàn),包括計(jì)算、存儲吞吐量、網(wǎng)絡(luò)性能等。
管理節(jié)點(diǎn):當(dāng)作通用場景處理,請參見根據(jù)細(xì)分業(yè)務(wù)場景選型。
計(jì)算節(jié)點(diǎn):當(dāng)作通用場景處理,請參見根據(jù)細(xì)分業(yè)務(wù)場景選型。根據(jù)集群規(guī)模的不同,需要選擇的實(shí)例規(guī)格不同。例如100個(gè)節(jié)點(diǎn)以下可以選用ecs.g7.4xlage,100個(gè)節(jié)點(diǎn)以上可以選用ecs.g7.8xlage。
緩存節(jié)點(diǎn):用于存儲熱數(shù)據(jù)或部署RSS,側(cè)重磁盤和網(wǎng)絡(luò)IO性能,推薦使用i4g、i2g。
計(jì)算緩存節(jié)點(diǎn):用于計(jì)算和緩存,兼?zhèn)溆?jì)算性能和IO性能、磁盤容量,推薦使用i4、i4r、d3c。
說明計(jì)算節(jié)點(diǎn)在計(jì)費(fèi)模式上可以采用搶占式實(shí)例,實(shí)現(xiàn)性價(jià)比最優(yōu)化。更多信息,請參見什么是搶占式實(shí)例。
數(shù)據(jù)節(jié)點(diǎn):需要高存儲吞吐、高網(wǎng)絡(luò)吞吐、均衡的處理器與內(nèi)存配比,推薦您使用大數(shù)據(jù)型(d系列)規(guī)格族。例如MapReduce/Hive可選擇ecs.d2s.5xlarge、ecs.d3s.4xlarge等,Spark/Mlib可選擇ecs.d2s.10xlarge。
數(shù)據(jù)庫、緩存、搜索場景推薦
在該類場景中,實(shí)例規(guī)格的處理器與內(nèi)存配比一般要求高于1:4,部分軟件對存儲I/O讀寫能力及時(shí)延性能較為敏感,建議您選用單位內(nèi)存性價(jià)比較高的規(guī)格族。
場景分類 | 場景細(xì)分 | 推薦規(guī)格族 | 處理器與內(nèi)存比 | 數(shù)據(jù)盤 |
關(guān)系型數(shù)據(jù)庫 | 高性能,依賴應(yīng)用層高可用 | i系列 | 1:4 | 本地SSD存儲、高效云盤、SSD云盤 |
中小型數(shù)據(jù)庫 | g系列,或其他內(nèi)存占比為1:4的規(guī)格族 | 1:4 | 高效云盤、SSD云盤 | |
高性能數(shù)據(jù)庫 | i、r系列 | 1:8 | 高效云盤、SSD云盤 | |
分布式緩存 | 中內(nèi)存消耗場景 | g系列,或其他內(nèi)存占比為1:4的規(guī)格族 | 1:4 | 高效云盤、SSD云盤 |
高內(nèi)存消耗場景 | r系列、i系列 | 1:8 | 高效云盤、SSD云盤 | |
NoSQL數(shù)據(jù)庫 | 高性能,應(yīng)用層高可用 | i系列 | 1:4 | 本地SSD存儲、高效云盤、SSD云盤 |
中小型數(shù)據(jù)庫 | g系列,或其他內(nèi)存占比為1:4的規(guī)格族 | 1:4 | 高效云盤、SSD云盤 | |
高性能數(shù)據(jù)庫 | i4、i4r系列 | 1:8 | 高效云盤、SSD云盤、本地SSD存儲 | |
ElasticSearch | 小集群,靠云盤保證數(shù)據(jù)高可用 | g系列,或其他內(nèi)存占比為1:4的規(guī)格族 | 1:4 | 高效云盤、SSD云盤 |
大集群,高可用 | d系列 | 1:4 | 本地SSD存儲、高效云盤、SSD云盤 |
以數(shù)據(jù)庫為例,在傳統(tǒng)方式中,業(yè)務(wù)系統(tǒng)直接對接OLTP數(shù)據(jù)庫,數(shù)據(jù)冗余大多通過RAID磁盤陣列實(shí)現(xiàn)。選擇云服務(wù)器ECS,您的輕載、重載數(shù)據(jù)庫都能實(shí)現(xiàn)靈活部署。
輕載數(shù)據(jù)庫:采用i4r、i4g系列實(shí)例搭配云盤使用,性價(jià)比更高。
重載數(shù)據(jù)庫:需要高存儲IOPS和低讀寫延時(shí),推薦您使用本地SSD型i系列實(shí)例規(guī)格族(搭配了高I/O型本地NVMeSSD本地盤),滿足大型重載數(shù)據(jù)庫的要求。
深度學(xué)習(xí)、圖像處理場景推薦
在該類場景中,應(yīng)用需要高性能的GPU加速器,在GPU和CPU配比方面有如下建議。
深度學(xué)習(xí)訓(xùn)練:GPU與CPU比例推薦為1:8到1:12之間。
通用深度學(xué)習(xí):GPU與CPU比例推薦為1:4到1:48之間。
圖像識別推理:GPU與CPU比例推薦為1:4到1:12之間。
語音識別與合成推理:GPU與CPU比例推薦為1:16到1:48之間。
常見場景的GPU選型推薦如下圖所示。
驗(yàn)證與調(diào)整
當(dāng)您完成選型并開始使用云服務(wù)器ECS實(shí)例后,建議您根據(jù)一段時(shí)間的性能監(jiān)控信息,驗(yàn)證所選實(shí)例規(guī)格是否合適。
假設(shè)您選擇了ecs.g8i.xlarge,通過監(jiān)控發(fā)現(xiàn)實(shí)例CPU使用率一直較低,建議您登錄實(shí)例檢查內(nèi)存占用率是否較高,如果內(nèi)存占用較高,您可以調(diào)整為處理器與內(nèi)存資源配比更合適的規(guī)格族。更多信息,請參見以下文檔:
使用云服務(wù)器ECS的過程中,如果發(fā)生地域庫存不足、實(shí)例規(guī)格族停售、修改為更高性價(jià)比規(guī)格族、升級配置等情況,您可以根據(jù)實(shí)例規(guī)格族的特點(diǎn)進(jìn)行變配。更多信息,請參見升降配方式概述與支持變配的實(shí)例規(guī)格。