監(jiān)控
本文匯總了AnalyticDB for MySQL中監(jiān)控的常見問題及解決方法。
當(dāng)常見問題場(chǎng)景中未明確產(chǎn)品系列時(shí),表明該問題僅適用于AnalyticDB for MySQL數(shù)倉(cāng)版。
常見問題概覽
如何監(jiān)控?cái)?shù)倉(cāng)版預(yù)留集群的磁盤水位?
為防止磁盤使用率超過磁盤安全水位,需要配置監(jiān)控報(bào)警,提前發(fā)出報(bào)警通知,讓您及時(shí)知曉磁盤水位并管理磁盤空間,保證業(yè)務(wù)正常運(yùn)行。
企業(yè)版、基礎(chǔ)版及湖倉(cāng)版集群無需配置磁盤監(jiān)控告警。
登錄云原生數(shù)據(jù)倉(cāng)庫(kù)AnalyticDB MySQL控制臺(tái),在左上角選擇集群所在地域。在左側(cè)導(dǎo)航欄,單擊集群列表,在數(shù)倉(cāng)版頁(yè)簽,單擊目標(biāo)集群ID。
在左側(cè)導(dǎo)航欄單擊監(jiān)控信息。
在監(jiān)控信息頁(yè)面,單擊查詢和寫入頁(yè)簽,查看磁盤使用量。
預(yù)留模式下,磁盤使用量以百分比形式顯示;彈性模式下顯示讀寫節(jié)點(diǎn)磁盤的絕對(duì)使用量。
預(yù)留模式
說明最大磁盤使用率是指集群實(shí)例若干臺(tái)機(jī)器中,磁盤使用量最多的一臺(tái),如果該值大于或者等于90%,磁盤將會(huì)被鎖定。您需要重點(diǎn)關(guān)注最大磁盤使用率的值。
彈性模式
說明磁盤使用量是指單個(gè)讀寫節(jié)點(diǎn)的最大磁盤使用量,如果該值大于或等于8 TB,集群將無法寫入數(shù)據(jù)。您需要重點(diǎn)關(guān)注磁盤使用量的值。
在監(jiān)控信息頁(yè)面,單擊報(bào)警規(guī)則設(shè)置,系統(tǒng)自動(dòng)跳轉(zhuǎn)至云監(jiān)控控制臺(tái)。
在報(bào)警規(guī)則列表頁(yè)面,單擊創(chuàng)建報(bào)警規(guī)則。
在創(chuàng)建報(bào)警規(guī)則頁(yè)面,按照頁(yè)面提示進(jìn)行參數(shù)配置。
參數(shù)
說明
產(chǎn)品
云監(jiān)控可管理的產(chǎn)品名稱,選擇云原生數(shù)據(jù)倉(cāng)庫(kù)AnalyticDB MySQL版3.0-數(shù)倉(cāng)版。
資源范圍
報(bào)警規(guī)則的作用范圍,取值說明:
全部資源:表示該規(guī)則作用在用戶名下對(duì)應(yīng)產(chǎn)品的全部實(shí)例上。例如:您設(shè)置了全部資源粒度的云原生數(shù)據(jù)倉(cāng)庫(kù) AnalyticDB MySQL 版磁盤使用率大于或等于80%報(bào)警,則只要用戶名下有云原生數(shù)據(jù)倉(cāng)庫(kù) AnalyticDB MySQL 版資源范圍選擇全部資源時(shí),報(bào)警的資源最多1000個(gè),超過1000個(gè)可能會(huì)導(dǎo)致達(dá)到閾值不報(bào)警的問題,建議您使用應(yīng)用分組按業(yè)務(wù)劃分資源后再設(shè)置報(bào)警。
應(yīng)用分組:報(bào)警規(guī)則作用于指定云產(chǎn)品的指定應(yīng)用分組內(nèi)的全部資源上。
實(shí)例:表示該規(guī)則只作用于指定云產(chǎn)品的指定實(shí)例上。例如您如果設(shè)置了實(shí)例粒度的磁盤使用率大于或等于80%報(bào)警,則當(dāng)該實(shí)例磁盤使用率大于或者等于80%時(shí),會(huì)發(fā)送報(bào)警通知。
規(guī)則描述
報(bào)警規(guī)則的主體。當(dāng)監(jiān)控?cái)?shù)據(jù)滿足報(bào)警條件時(shí),觸發(fā)報(bào)警規(guī)則。 規(guī)則描述的設(shè)置方法如下:
單擊添加規(guī)則。
在添加規(guī)則描述面板,設(shè)置規(guī)則名稱、指標(biāo)類型、監(jiān)控指標(biāo)、閾值及報(bào)警級(jí)別和監(jiān)控圖表預(yù)覽等。
單擊確定。
通道沉默周期
報(bào)警發(fā)生后未恢復(fù)正常,間隔多久重復(fù)發(fā)送一次報(bào)警通知。取值:5分鐘、15分鐘、30分鐘、60分鐘、3小時(shí)、6小時(shí)、12小時(shí)和24小時(shí)。某監(jiān)控指標(biāo)達(dá)到報(bào)警閾值時(shí)發(fā)送報(bào)警,如果監(jiān)控指標(biāo)在通道沉默周期內(nèi)持續(xù)超過報(bào)警閾值,在通道沉默周期內(nèi)不會(huì)重復(fù)發(fā)送報(bào)警通知;如果監(jiān)控指標(biāo)在通道沉默周期后仍未恢復(fù)正常,則云監(jiān)控再次發(fā)送報(bào)警通知。
生效時(shí)間
報(bào)警規(guī)則的生效時(shí)間,報(bào)警規(guī)則只在生效時(shí)間內(nèi)才會(huì)檢查監(jiān)控?cái)?shù)據(jù)是否需要報(bào)警。
重要磁盤水位報(bào)警每個(gè)報(bào)警聯(lián)系人一天最多被通知4次,超過4次將被靜默。
報(bào)警聯(lián)系人組
發(fā)送報(bào)警的聯(lián)系人組。
應(yīng)用分組的報(bào)警通知會(huì)發(fā)送給該報(bào)警聯(lián)系人組中的報(bào)警聯(lián)系人。報(bào)警聯(lián)系人組是一組報(bào)警聯(lián)系人,可以包含一個(gè)或多個(gè)報(bào)警聯(lián)系人。關(guān)于如何創(chuàng)建報(bào)警聯(lián)系人和報(bào)警聯(lián)系人組,請(qǐng)參見創(chuàng)建報(bào)警聯(lián)系人或報(bào)警聯(lián)系人組。
報(bào)警回調(diào)
填寫公網(wǎng)可訪問的URL,云監(jiān)控會(huì)將報(bào)警信息通過POST請(qǐng)求推送到該地址,目前僅支持HTTP協(xié)議。關(guān)于如何設(shè)置報(bào)警回調(diào),請(qǐng)參見使用閾值報(bào)警回調(diào)。
說明單擊高級(jí)設(shè)置,可設(shè)置該參數(shù)。
彈性伸縮
如果您打開彈性伸縮開關(guān),當(dāng)報(bào)警發(fā)生時(shí),會(huì)觸發(fā)相應(yīng)的伸縮規(guī)則。您需要設(shè)置彈性伸縮的地域、彈性伸縮組和彈性伸縮規(guī)則。
關(guān)于如何創(chuàng)建彈性伸縮組,請(qǐng)參見配置伸縮組。
關(guān)于如何創(chuàng)建彈性伸縮規(guī)則,請(qǐng)參見配置伸縮規(guī)則。
說明單擊高級(jí)設(shè)置,可設(shè)置該參數(shù)。
日志服務(wù)
如果您打開日志服務(wù)開關(guān),當(dāng)報(bào)警發(fā)生時(shí),會(huì)將報(bào)警信息寫入日志服務(wù)。您需要設(shè)置日志服務(wù)的地域、Project和Logstore。
關(guān)于如何創(chuàng)建Project和Logstore,請(qǐng)參見快速入門。
說明單擊高級(jí)設(shè)置,可設(shè)置該參數(shù)。
消息服務(wù)MNS - topic
如果您打開消息服務(wù)MNS - topic開關(guān),當(dāng)報(bào)警發(fā)生時(shí),會(huì)將報(bào)警信息寫入消息服務(wù)的主題。您需要設(shè)置消息服務(wù)的地域和主題。關(guān)于如何創(chuàng)建主題,請(qǐng)參見創(chuàng)建主題。
無數(shù)據(jù)報(bào)警處理方法
無監(jiān)控?cái)?shù)據(jù)時(shí)報(bào)警的處理方式。取值:
不做任何處理(默認(rèn)值)
發(fā)送無數(shù)據(jù)報(bào)警
視為恢復(fù)
說明單擊高級(jí)設(shè)置,可設(shè)置該參數(shù)。
標(biāo)簽
報(bào)警標(biāo)簽會(huì)添加到報(bào)警內(nèi)容中。標(biāo)簽名稱和標(biāo)簽值是一一對(duì)應(yīng)的,可以設(shè)置多對(duì)標(biāo)簽。
完成上述參數(shù)配置后,單擊確認(rèn)即可。
如何查看熱數(shù)據(jù)和冷數(shù)據(jù)占用了多少存儲(chǔ)空間?
登錄云原生數(shù)據(jù)倉(cāng)庫(kù)AnalyticDB MySQL控制臺(tái),在監(jiān)控信息頁(yè)面查看熱數(shù)據(jù)使用量和冷數(shù)據(jù)使用量。
如何檢查表的大小等信息?
登錄云原生數(shù)據(jù)倉(cāng)庫(kù)AnalyticDB MySQL控制臺(tái),在集群監(jiān)控信息頁(yè)的表信息統(tǒng)計(jì)頁(yè)簽下查看表大小等信息。
監(jiān)控信息頁(yè)面看到熱數(shù)據(jù)使用量比總數(shù)據(jù)使用量還多,是什么原因?
AnalyticDB for MySQL集群中包含多個(gè)存儲(chǔ)節(jié)點(diǎn),磁盤數(shù)據(jù)使用量是指單個(gè)讀寫節(jié)點(diǎn)的最大磁盤使用量,熱數(shù)據(jù)使用量是指所有讀寫節(jié)點(diǎn)的磁盤數(shù)據(jù)使用量之和。
預(yù)留模式跨規(guī)格變配為彈性模式后,監(jiān)控界面看到CPU平均使用率增大,是什么原因?
預(yù)留模式C32規(guī)格變配為彈性模式,單個(gè)節(jié)點(diǎn)會(huì)降低到8核,Build任務(wù)默認(rèn)占用3核,此時(shí)會(huì)導(dǎo)致CPU平均使用率增大。CPU平均使用率增大但未影響業(yè)務(wù)時(shí),您無需關(guān)注;若已影響業(yè)務(wù)的正常運(yùn)行,請(qǐng)進(jìn)行升配操作或提交工單聯(lián)系技術(shù)支持。關(guān)于Build任務(wù)的詳細(xì)信息,請(qǐng)參見BUILD。
監(jiān)控信息頁(yè)面看到有較長(zhǎng)的查詢響應(yīng)耗時(shí),但在診斷與優(yōu)化頁(yè)面未找到相同耗時(shí)的SQL,是什么原因?
監(jiān)控信息頁(yè)面的查詢響應(yīng)時(shí)間和診斷與優(yōu)化頁(yè)面的總耗時(shí)的計(jì)算方式不同。與診斷與優(yōu)化頁(yè)面的總耗時(shí)相比,監(jiān)控信息頁(yè)面的查詢響應(yīng)時(shí)間還包括結(jié)果集緩存耗時(shí)。因此當(dāng)查詢返回的結(jié)果集較大,產(chǎn)生結(jié)果集緩存耗時(shí)后,監(jiān)控信息頁(yè)面顯示的查詢響應(yīng)耗時(shí)比診斷與優(yōu)化頁(yè)面的總耗時(shí)長(zhǎng)。您可以通過SQL審計(jì)頁(yè)面查詢響應(yīng)時(shí)間長(zhǎng)的SQL。
SQL耗時(shí)的具體說明如下:
SQL在提交至AnalyticDB for MySQL后,首先會(huì)在隊(duì)列中排隊(duì),查詢并發(fā)數(shù)較大時(shí),會(huì)產(chǎn)生較長(zhǎng)的排隊(duì)時(shí)間;查詢出隊(duì)列后,進(jìn)入執(zhí)行引擎,解析查詢語(yǔ)句,生成執(zhí)行計(jì)劃,產(chǎn)生較長(zhǎng)的執(zhí)行計(jì)劃耗時(shí);執(zhí)行計(jì)劃生成后,子任務(wù)會(huì)在存儲(chǔ)節(jié)點(diǎn)和計(jì)算節(jié)點(diǎn)執(zhí)行,會(huì)產(chǎn)生執(zhí)行耗時(shí);查詢結(jié)束后,如果返回結(jié)果數(shù)據(jù)量大,會(huì)在前端節(jié)點(diǎn)緩存返回結(jié)果,產(chǎn)生結(jié)果集緩存耗時(shí)。SQL耗時(shí)如下圖所示: